Текст
                    л -ч- --5"> .- -/•'^
;р,'Щ ДИЩДОЧА.М, ШИРЯЕВ
Л^тдаистикА
I САУЧАЙНШГ
Ук4*


ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Р. Ш. ЛИПЦЕР, А. Н. ШИРЯЕВ СТАТИСТИКА СЛУЧАЙНЫХ ПРОЦЕССОВ НЕЛИНЕЙНАЯ ФИЛЬТРАЦИЯ И СМЕЖНЫЕ ВОПРОСЫ щ ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ Москва 1974
517.8 Л 61 УДК 519.21 Статистика случайных процессов (нелинейная фильтрация и смежные вопросы), Л ипцер Р. Ш., Ширяев А. Н., Главная редакция физико-математической литературы изд-ва «Наука», 1974. В монографии дается систематическое изложение теории оптимальной нелинейной фильтрации как для случая дискретного, так и непрерывного времени. Значительное место уделено вопросам применений к задачам последовательного оценивания, к линейной фильтрации (фильтр Калмана — Бьюси), интерполяции и экстраполяции одних компонент случайных процессов по другим. Приводятся основные факты теории мартингалов, на которой существенно основано изложение. Книга рассчитана как на специалистов по теории вероятностей и математической статистике, так и на круг читателей, применяющих в своей деятэльности вероятностно-статистические методы к таким задачам, как выделение сигналов, скрытых в шумах, различение статистических гипотез, оптимальное управление стохастическими объектами по неполным данным. Издательство «Наука», 1974. Роберт Шевилевич^Липцер, Альберт Николаевич Ширяев СТАТИСТИКА СЛУЧАЙНЫХ ПРОЦЕССОВ нелинейная фильтрация и смежные вопросы (Серия: «Теория вероятностей и математическая статистика») М., 1974 , 696 стр. Редактор AI. Я. Ершов Техн. редактор Я. Ш. Аксельрод Корректоры Т. С. Плетнева, Я. Б. Румянцева Сдано в набор I0/IX 1973 г. Подписано к печати 8/П 1974 г. Бумага бОХЭО'Де, тип. №2. Физ. печ. л. 43,5. Условн. печ. л. 43,5. Уч.-изд. л. 41,13. Тираж 10500 экз. Т-02957. Цена книги 2 р. 65 к. Заказ № 785 Издательство «Наука» Главная редакция физико-математической литературы 117071, Москва, В-71, Ленинский проспект, 15 Ордена Трудового Красного Знамени Ленинградская типография № 2 имени Евгении Соколовой Союзполиграфпрома при Государственном комитете Совета Министров СССР по делам издательств, полиграфии и книжной торговли. 198052, Ленинград, Л-52. Измайловский проспект, 29 20203-030 Л 053(01)-74 7173
ОГЛАВЛЕНИЕ Введение . 7 Глава 1. Необходимые сведения из теории вероятностей и математической статистики 19 § 1. Основные понятия теории вероятностей 19 § 2. Случайные процессы. Основные понятия 29 § 3. Марковские моменты 34 § 4. Процесс броуновского движения 39 § 5. Некоторые понятия математической статистики 43 Глава 2. Мартингалы и полумартингалы. Дискретное время .... 46 § 1. Полумартингалы на конечном временном интервале 46 § 2. Полумартингалы на бесконечном временном интервале. Теорема сходимости . . . . 52 § 3. Регулярные мартингалы. Теорема Леви 53 § 4. Сохранение супермартингального свойства для марковских моментов. Разложения Рисса и Дуба 57 Глава 3. Мартингалы и полумартингалы. Непрерывное время ... 64 § 1. Непрерывные справа полумдрдингалы 64 § 2. Основньэе неравенства. Теорема сходимости. Сохранение су- пермартинга-льного свойства для марковских моментов .... 66 § 3. Разложение Дуба—Мейера для супермартингалов 70 § 4. Некоторые свойства натуральных возрастающих процессов . . 81 Глава 4. Винеровский процесс. Стохастический интеграл по винеров- скому процессу. Стохастические дифференциальные уравнения 91 § 1. Винеровский процесс как квадратично интегрируемый мартингал 91 § 2. Стохастические интегралы. Процессы Ито 98 § 3. Формула (замены переменных) Ито 135 § 4. Сильные и слабые решения стохастических дифференциальных уравнений 146 Глава 5. Квадратично интегрируемые мартингалы. Структура функционалов от винеровского процесса 172 § 1. Разложение Дуба—Мейера для квадратично интегрируемых мартингалов 172 § 2. Представление квадратично интегрируемых мартингалов .... 184 § 3. Структура функционалов от винеровского процесса 189 § 4. Стохастические интегралы по квадратично интегрируемым мартингалам 199 § 5. Интегральные представления мартингалов, являющихся условными математическими ожиданиями. Теорема Фубини для стохастических интегралов 211 § 6. Структура функционалов от процессов диффузионного типа . . 218
4 ОГЛАВЛЕНИЕ Глава 6. Неотрицательные супермартингалы и мартингалы. Теорема Гирсанова 239 § 1. Неотрицательные супермартингалы 239 § 2. Неотрицательные мартингалы 250 § 3. Теорема Гирсанова и ее обобщение 260 Глава 7. Абсолютная непрерывность мер, соответствующих процессам Ито и процессам диффузионного типа 271 § 1. Процессы Ито. Абсолютная непрерывность их мер относительно винеровской . . . 271 § 2. Процессы диффузионного типа. Абсолютная непрерывность их мер относительно винеровской 277 § 3. Структура процессов, мера которых абсолютно непрерывна относительно винеровской меры 294 § 4. Представление процессов Ито в виде процессов диффузионного типа. Обновляющие (innovation) процессы. Структура функционалов от процессов Ито 296 § 5. Случай гауссовских процессов 303 § 6. Абсолютная непрерывность мер процессов Ито относительно мер, соответствующих процессам диффузионного типа .... 310 § 7. Формула Камерона—Мартина 323 § 8. Неравенство Рао—Крамера—Волфовитца 325 § 9. Абстрактный вариант формулы Байеса 329 Глава 8. Общие уравнения оптимальной нелинейной фильтрации, интерполяции и экстраполяции частично наблюдаемых случайных процессов 342 § 1. Фильтрация. Основная теорема 342 § 2. Фильтрация. Доказательство основной теоремы 344 § 3. Фильтрация компонент диффузионных марковских процессов 353 § 4. Уравнения оптимальной нелинейной интерполяции 356 § 5. Уравнения оптимальной нелинейной экстраполяции 358 § 6. Стохастические дифференциальные уравнения с частными производными для условной плотности (случай диффузионных марковских процессов) 362 Глава 9. Оптимальная фильтрация, интерполяция и экстраполяция марковских процессов со счетным числом состояний . . . 378 § 1. Уравнения оптимальной нелинейной фильтрации 378 § 2. Прямые и обратные уравнения оптимальной нелинейной интерполяции 391 § 3. Уравнения оптимальной нелинейной экстраполяции 396 § 4. Примеры 399 Глава 10. Оптимальная линейная нестационарная фильтрация . . . 402 § 1. Метод Калмана — Бьюси 402 § 2. Мартингальный вывод уравнений линейной нестационарной фильтрации 418 § 3. Уравнения линейной нестационарной фильтрации. Многомерный случай 421 § 4. Уравнения для почти оптимального линейного фильтра в случае вырождения матриц ° , 430
ОГЛАВЛЕНИЕ 5 Глава 11. Условно-гауссовские случайные процессы 437 § 1. Предположения и формулировка теоремы об условной гауссо- вости 437 § 2. Вспомогательные предложения 439 § 3. Доказательство теоремы об условной гауссовости 446 Глава 12. Оптимальная нелинейная фильтрация, интерполяция и экстраполяция компонент условно-гауссовских процессов 455 § 1. Уравнения оптимальной фильтрации 455 § 2. Единственность решений уравнений фильтрации. Совпадение а-алгебр оТ) и сГ|0' w 464 § 3. Уравнения оптимальной фильтрации в многомерном случае . . 471 § 4. Интерполяция условно-гауссовских процессов 477 § 5. Уравнения оптимальной экстраполяции 488 Глава 13. Условно-гауссовские последовательности. Фильтрация и смежные вопросы . 492 § 1. Теорема о нормальной корреляции 492 § 2. Рекуррентные уравнения фильтрации для условно-гауссовских последовательностей 504 § 3. Прямые и обратные уравнения интерполяции 513 § 4. Рекуррентные уравнения оптимальной экстраполяции 525 § 5. Примеры 528 Глава 14. Применение уравнений фильтрации к задачам статистики случайных последовательностей 535 § 1. Оптимальная линейная фильтрация стационарных последовательностей с дробно-рациональным спектром 535 § 2. Оценки максимального правдоподобия коэффициентов линейной регрессии 543 § 3. Одна задача управления по неполным данным (линейная система с квадратичным функционалом потерь) 549 § 4. Асимптотические свойства оптимального линейного фильтра . . 557 § 5. Рекуррентное вычисление наилучших приближенных решений (псевдорешений) линейных алгебраических систем 568 Глава 15. Линейное оценивание случайных процессов 575 § 1. Винеровский процесс в широком смысле 575 § 2. Оптимальная линейная фильтрация некоторых классов нестационарных процессов 588 § 3. Линейное оценивание стационарных в широком смысле случайных процессов с дробно-рациональным спектром 593 § 4. Сравнение оптимальных линейных и нелинейных оценок .... 602 1 лава 16. Применение уравнений оптимальной нелинейной фильтрации к некоторым задачам управления и теории информации 608 § 1. Одна задача оптимального управления по неполным данным . . 608 § 2. Асимптотические свойства фильтра Калмана — Бьюси 616 § 3. Вычисление взаимной информации и пропускной способности гауссовского канала с обратной связью 623 § 4. Оптимальное кодирование и декодирование при передаче гауссовского сигнала цо каналу с бесшумной обратной связью , . 628
6 ОГЛАВЛЕНИЕ Глава 17. Оценка параметров и различение статистических гипотез для процессов диффузионного типа 639 § 1. Метод максимального правдоподобия для коэффициентов линейной регрессии 639 § 2. Оценка параметра коэффициента сноса для процессов диффузионного типа 645 § 3. Оценка параметра коэффициента сноса для одномерного гаус- совского марковского процесса 651 § 4. Двумерный гауссовский марковский процесс. Оценка параметров 658 § 5. Последовательные оценки максимального правдоподобия . . . 667 § 6. Последовательное различение двух простых гипотез для процессов Ито 672 § 7. Некоторые применения к стохастической аппроксимации . . . 680 Примечания 684 Литература 689
ВВЕДЕНИЕ 1. Значительный круг задач статистики случайных процессов формулируется в рамках следующей схемы. На некотором вероятностном пространстве (Q, #", Р) задан частично наблюдаемый случайный процесс (0, g) = (0,, lt), t^Q, у которого наблюдаться может лишь вторая компонента £=(£*), /^0. В каждый момент времени / требуется, основываясь на наблюдениях £o={£s> 0^5^}> давать оценку (ненаблюдаемых) значений 0/. Эта задача оценивания (иначе— задача фильтрации) Qt по Ц и будет изучаться в настоящей книге. Хорошо известно, что если М0^<оо, то оптимальной в среднеквадратическом смысле оценкой 0, по gj является апостериорное среднее mt = M(Qt\F}), где #"] = а {со: gs, s</} есть a-алгебра, порожденная величинами gj. Таким образом, решение задачи оптимальной (в среднеквадратическом смысле) фильтрации сводится к отысканию условных математических ожиданий mt = M(Qt\&~}). В принципе, условные математические ожидания М(0, |^Г|?) могут быть вычислены по формуле Байеса. Однако даже во многих сравнительно простых случаях выражения, полученные с помощью формулы Байеса, являются слишком громоздкими, что сильно затрудняет как практическое использование, так и исследование структуры и свойств найденных таким образом оценок. С вычислительной же точки зрения желательно, чтобы формулы, определяющие «фильтр» mt> t^O, носили рекуррентный характер. Грубо говоря, это означает, что значение т/+д> А > 0, должно восстанавливаться по значению mt и наблюдениям £*+л = {£в> /<s</-f-A}. В случае дискретного времени * = 0, 1, 2, ... простейшей формой таких рекуррентных соотношений может служить, например, уравнение Am, = a(/, mt) + b{t, m,)(g,+1 — &), - (1) где &mt = mt+\ — mt. В случае непрерывного времени t^O гакой формой обладают стохастические дифференциальные
8 ВВЕДЕНИЕ уравнения dmt = a(ty mt)dt + b(t, mt)dlt. (2) Ясно, что без специальных предположений о структуре процессов (9, |) трудно рассчитывать на то, что оптимальные оценки mt будут удовлетворять рекуррентным соотношениям типа (1) и (2). Поэтому, прежде чем описывать структуру рассматриваемых нами процессов (9, g), для которых в данной книге изучаются задачи фильтрации, начнем с некоторых примеров. Пусть 9 — гауссовская случайная величина с М9—m, D9=y> что для краткости будем записывать в виде 9 ~ N(m, у). Предположим, что наблюдению подлежит последовательность Ь = е + в„ /=1,2,..., (3) где ги е2, ... —независимые между собой (и от 9) гауссовские случайные величины с нулевыми средними и единичной дисперсией. Пользуясь теоремой о нормальной корреляции (теорема 13.1)*), легко найти, что оценка mt~ М(9 ||1э ..., lt) и ошибка «отслеживания» у*==М(9 — mtf определяются формулами t т<= i+vi - *вТнГ (4) Отсюда для mt и \t получаем следующие рекуррентные уравнения: ^mt = T^[ti+l-mt], (5) V? AYI--TTV (6) где bmt = mt+x — mh kyt = yt+\—Vf Усложним рассмотренный пример. Пусть 9 и еи е2, ... таковы же, что и в предыдущем примере, а наблюдаемый процесс 1и /=1, 2, ..., определяется соотношениями ь+1 = л>е. 6)+^iC. Б)в+е»+1э (7) где функции Л0(/, g) и Л] (/,1) предполагаются #^=а (со: £0, ..., £,}- измеримыми (т. е. A0(t, I) и Ax(t, |) при каждом / зависят лишь от значений £0, ..., £,). *) В книге принята двойная нумерация теорем, лемм и формул. ^Первая цифра указывает номер главы, вторая — порядковый номер в данной главе.
ВВЕДЕНИЕ 9 Отметим, что необходимость рассмотрения коэффициентов A0(t, l) и Ах (/, £), зависящих от всех «прошлых» значений (6о> •••> Si)» возникает, например, в задачах управления (§ 3, гл. 14), где эти коэффициенты играют роль «управляющих» воздействий, в задачах теории информации (§ 4, гл. 16), где пара функций (Л0(/, £), Л, (/, £)) трактуется как «кодирование», использующее бесшумную обратную связь. Оказалось, что для схемы (7) оптимальная оценка mt — = М (0, | #"|) и условная дисперсия yt = М [(0 — га,)21 #"|] также подчиняются рекуррентным уравнениям (см. § 5, гл. 13): Дт'= 1 Т^п 11 (Ь+i - До(*, 6) - Лд (/, 6) т,), mQ = m, (8) 1 + Л1(/, l)yt A](U l)y2t aY/=~t—-797—n—. Yo = Y- (9) В схемах (З) и (7), по существу, речь шла о традиционной задаче математической статистики — о байесовской оценке случайного параметра по наблюдениям Ц. Следующий шаг в усложнении схемы (7) состоит в том, чтобы вместо случайной величины 0 рассматривать случайный процесс 0^. Будем предполагать, что случайный процесс (0, £) = (0/э lt), f = 0, 1, ..., описывается рекуррентными уравнениями e,+, = M'. Е)+М*. l)b + b{t, E)M*+i), h+i = A0(t9l) + A{(ttl)Qt + B(tt Б)вя(/+ 1), (Ш) где е, (/), e2{t), /=1, 2, ...,—-последовательность независимых величин, имеющих нормальное распределение N(0, 1) и не зависящих также от (0О, g0). Коэффициенты а0(/, g), ..., B(t, I) предполагаются #"|-измеримыми при каждом t = 0, 1, ... Чтобы получить для оценки mt = M(Qt\yfj и условной дисперсии Y* = M {[0, — т,]2|#^} рекуррентные уравнения, предположим, что условное распределение Р(0о^*1£о) является (для почти всех g0) нормальным, N(m9 у)- Суть этого предположения состоит в том, что оно позволяет доказать (см. гл. 13), что тогда последовательность (0, £),. управляемая уравнениями (Ю), является условно-гауссовской. Это означает, в частности, что условное распределение Р(0, <*|#^) является (почти наверное) гауссовским. Но такое распределение характеризуется лишь своими двумя условными моментами mt, yt9 что дает возможность получить для них следующую замкнутую систему
10 ВВЕДЕНИЕ уравнении: m/+I = а0 + a{mt + р2* *,2 [lt+\ — Ао — A{mt\ m0 = т, (ii) (у коэффициентов а0, ..., В для простоты записи опущены аргументы t и |). Уравнения (11) выводятся (в несколько более общей ситуации) в тринадцатой главе. Для их вывода ничего, по существу, кроме теоремы о нормальной корреляции, не требуется. В этой же главе выводятся уравнения и для оптимальных оценок в задачах экстраполяции (оценивания 0Х по ^, когда т > /) и интерполяции (оценивания 0Х по ££ при т < /). Применениям этих уравнений к разнообразным задачам статистики случайных последовательностей, к задачам управления и к построению псевдорешений линейных алгебраических систем посвящена четырнадцатая глава. Эти две главы могут читаться независимо от остального материала книги, и именно с них следует начинать читателю, который интересуется проблематикой нелинейной фильтрации, но еще недостаточно знаком с общей теорией случайных процессов. 2. Основной материал книги представляет собой задачи оптимальной фильтрации (а также смежные задачи интерполяции, экстраполяции, последовательного оценивания, различения гипотез и т. п.) для случая непрерывного времени. Привлекательность этих задач в случае непрерывного времени объясняется (помимо их собственного интереса) тем, что для них удается получать прозрачные формулировки и компактные формулы. Следует также добавить, что зачастую легче сначала изучить непрерывный аналог задач, сформулированных для дискретного времени, а затем уже использовать полученные результаты в исследовании первоначальных задач. Отмеченная (для случая непрерывного времени) простота формулировок, естественно, даром не дается — приходится привлекать, и причем довольно сложный, аппарат теории случайных процессов. Конкретнее о методах и аппарате, используемом в этой книге, мы скажем несколько позднее, а сейчас в целях иллюстрации остановимся на некоторых случаях фильтрации, которые будут нами рассмотрены. Предположим, что частично наблюдаемый случайный процесс (0, l) = (Qt> h)> t^*Q> является гауссовским, управляемым
ВВЕДЕНИЕ П стохастическими дифференциальными уравнениями (ср. с системой (10)) dQt = a(t)Qtdt + b(t)dw{(t)9 d\t = A(t)Qtdt + B(t)dw2(t), (12) где w{(f) и w2(t)—независимые между собой и от (90, go) стандартные винеровские процессы, a B(t)^ С > 0. Будем считать компоненту 9 = (9Д /^0, ненаблюдаемой. Рассматриваемая задача фильтрации состоит в том, чтобы в каждый момент времени t^O оптимально (в среднеквадратическом смысле) оценивать 6, по Ц. Процесс (8, I) по предположению является гауссовским, поэтому оптимальная оценка fnt = M(Qt\^'\) линейным образом зависит от наблюдений ^ = |gs, s<!/}. Более точно, существует i (лемма 10.1) такая функция G(t, s) с j G2(t,s)ds < oo, t > 0, что о (почти наверное) mt = m0+ j G(tiS)dls. (13) о Если формально продифференцировать это выражение, то получим dmt = G(t, t)dtt+n dGfts)ds\dt. (14) Правую часть этого выражения можно преобразовать, если воспользоваться тем, что функция G(t, s) удовлетворяет уравнению Винера—Хопфа (см. (10.25)), которое в рассматриваемом случае сводится к уравнению dG(t,s) Г /А Л2 (/) dt [a(t)-yt^]G(t,s), t>s, (15) 0(*,8) = ^Щ~, Y* = M[95-m5]2. (16) Учитывая (15) и (14), получаем,что оптимальная оценка ти t > 0, удовлетворяет линейному стохастическому дифференциальному уравнению dmt = a(t)mtdt + ^ly[dlt-A(t)mtdt]. (17) В это уравнение входит величина ошибки «отслеживания» V/ = М [9, — tnt\2y которая в свою очередь является решением
12 ВВЕДЕНИЕ уравнения Риккати yt = 2a(t)yt--^f + b4t). (18) (Уравнение (18) легко получить, применяя формулу замены переменных Ито к квадрату процесса [0, — mt] с последующим усреднением.) Остановимся несколько подробнее на уравнении (17), считая для простоты £о = 0« Обозначим t ^-ldls~AB{SJ,msdS • (19) О Тогда уравнение (17) можно переписать в следующем виде: Y/А (О dmt — a {t) mt dt + в , > dwt. (20) Введенный процесс (wt)9 t^O, весьма примечателен и играет в задачах фильтрации фундаментальную роль. Дело в том, что этот процесс, во-первых, оказывается винеровским (относительно системы а-алгебр (#")), /^0), а во-вторых, он содержит в себе ту же самую «информацию», что и процесс £. Более точно, это означает, что для всех /^0 а-алгебры ^"^ = а {со: ws> s^.t} и #~| = а{со: l8y s</} совпадают: Г? = Г1 />0 (21) (см. теорему 7.16). Именно эти свойства процесса w послужили основанием называть его обновляющим процессом (innovation process). Совпадение а-алгебр {Г* и !Ff наталкивает на мысль, что для mt справедливо не только равенство (13), но и представление t tnt = т0+ J* F(t, s)dwS9 (22) где w=(wt), t^ 0, — обновляющий процесс, а функции F(t,s) таковы, что Г F2(t, s)ds < oo. В основном тексте (теорема 7.16) о показывается, что представление (22) в самом деле можно получить из общих результатов (о структуре функционалов от процессов диффузионного типа). Отправляясь же от представления (22), уравнение (20) можно вывести более простым путем,
ВВЕДЕНИЕ 13 нежели исходя из представления (13). Правда, следует заметить, что доказательство представления (22) требует в свою очередь большего труда, чем установление справедливости представления (13). В рассмотренном примере, восходящем к Калману и Бьюси, оптимальная фильтрация была линейной, что явилось следствием предположения гауссовости процесса (0, £). Приведем теперь пример, в котором оптимальная фильтрация является нелинейной. Пусть (б,), t^O — марковский процесс, выходящий из нуля, с двумя состояниями 0 и 1 и единственным переходом 0~> 1 в случайный момент а, который распределен (в силу предполагаемой марковости) экспоненциальным образом: Р(а>/) = = e~Ki, X > 0. Предположим, что наблюдаемый процесс £ = (£*), ^0, имеет дифференциал d$t = Qtdt + dwt, £o = 0, (23) где w = {wt), t^Q—винеровский процесс, не зависящий от процесса 9 = (9Д *>0. Будем трактовать переход процесса 0 из «нулевого» состояния в «единичное» как появление «разладки» (в момент а). Возникает следующая задача: в каждый момент времени t > 0 по наблюдениям gj определить, произошла ли до этого момента «разладка» или нет. Обозначим я, = Р(9, = 1\Т))= Р(а<^|^). Ясно, что nt = mt = М (0, | ^). Поэтому апостериорная вероятность лр t^O, является оптимальной (в среднеквадратическом смысле) оценкой состояния ненаблюдаемого процесса 0 = (0,), t^Q. Для апостериорной вероятности щ, t^O, можно вывести (используя, например, формулу Байеса и результаты относительно производной меры, отвечающей процессу g, по вине- ровской мере) следующее стохастическое дифференциальное уравнение: dnt = X (1 — щ) dt + щ (1 — щ) [dlt — щ dt], я0 = 0. (24) Важно подчеркнуть, что если в схеме Калмана — Бьюси оптимальный «фильтр» был линейным, то уравнение (24) является существенно нелинейным. Таким образом, уравнение (24) определяет оптимальную нелинейную фильтрацию. Как и в предшествующем примере (обновляющий) процесс t й/= j [dls — ntds], />0, 6
14 ВВЕДЕНИЕ оказывается винеровским и &*Y = &'], />0. Следовательно, уравнение (24) может быть записано также в следующем эквивалентном виде: dnt = Я (1 — щ) dt + щ (1 — щ) dwt> я0 = 0. (25) 3. Оказывается, что все эти примеры укладываются в рамки следующей общей схемы, принятой в данной книге. Пусть (Q, #", Р) — некоторое вероятностное пространство с выделенным на нем неубывающим семейством а-алгебр (#"*),. t^O (&~s^!Ft^@~, s^t). На этом вероятностном пространстве предполагаются заданными частично наблюдаемый процесс (9/> h)> t^®> и оцениваемый процесс (ht)> /^0, зависящий, вообще говоря, как от ненаблюдаемого процесса 0,, t ^ 0, так и наблюдаемой компоненты (£,), t^O. Относительно наблюдаемого процесса*) | = (^, STt) будет предполагаться, что он допускает стохастический дифференциал dZt = At(co)dt + dwu £0 = 0, (26) где w = (wt, &~t), /^0, — стандартный винеровский процесс (т. е. квадратично интегрируемый мартингал с непрерывными траекториями с М \(wt — wsf\ #%] = / — 5 при />s и ш0='0), а Л = (Л^((о), #",), t^O, — некоторый интегрируемый случайный процесс **). Структура ненаблюдаемого процесса 0 = (0,, #",), /^0, непосредственно не конкретизируется, зато предполагается, что оцениваемый процесс h = (ht, @~t), t^Q, допускает следующее представление: t ht = К + \ as (со) ds + xh t> 0, (27) о где a = (at((u), @~t), t^0, — некоторый интегрируемый процесс, x = (xtf ^t)t t^0,— квадратично интегрируемый мартингал. Для всякого интегрируемого процесса g = (gt, #"*), ^0, обозначим nt(g)= M[gt\^}]. Тогда, если М^<оо, то nt(g) будет оптимальной (в среднеквадратическом смысле) оценкой gt по'#=&,*<*}. *) Запись I = (lti Tt) подразумевает, что величины \t являются ^-измеримыми при каждом / ^ 0. **) На самом деле в книге рассматриваются процессы \ несколько более общего вида (см. гл. 8).
ВВЕДЕНИЕ 15 Один из основных результатов книги (теорема 8.1) утверждает, что для щ (h) справедливо следующее представление: t t ds + jns(D)dws + о о t + 'l[n8(hA)-n8(h)ns(A)]dw8. (28) о Здесь -w = {wv !Ff), t^O, — винеровский процесс (ср. с обновляющим процессом в предыдущих двух примерах), а процесс D = (Db @~t), t^O, характеризует «корреляцию» между ви,не- ровским процессом w = (wti S^t\ t^O, и мартингалом х = = (xti &~t), t^O. Точнее, процесс d (xt w). Dt^-^-sr1. t>0, (29) где (л:, w)t — случайный процесс, участвующий в разложении Дуба —Мейера произведения мартингалов х и w: М [xtwt - xsws | Ts] = M [<*, w)t - <*, w)s | &~s]. (30) Представление (28) мы называем основным уравнением (оптимальной нелинейной) фильтрации. Большинство известных результатов (в рамках предположений (26), (27)) может быть выведено из этого уравнения. Покажем, например, как из (28) выводятся уравнения фильтрации (17), (18) в схеме Калмана — Бьюси, считая для простоты b(t) = B{t)=l. Сравнивая (12) с (26) и (27), видим, что ЛДо) = Л(/)0/, wt = w2(t). Положим ht = Qt. Тогда в силу (12) t ht = h0+ $ a(s)Qsds + Wl(t). (31) о Процессы Wi=(wi(t)) и w2 = (w2(t)), t^O, являются независимыми квадратично интегрируемыми мартингалами, поэтому для них Dt^0 (Р-п. н.). Тогда в силу (28) я, (9) имеет дифференциал dnt (9) = а (0 я, (9) dt + A (t) [я, (92) - п\ (9)] dwt, (32) т. е. dmt = a (t) mtdt -f A (i) yt dwt, (33) где мы воспользовались тем, что в силу гауссовости процессу В, Ъ)9 Р-п. н. я, (в2) - я? (0) = М [(в, - ту | Р\] = М [0, - mtf = у$,
16 ВВЕДЕНИЕ Чтобы вывести из (28) уравнение для yt, возьмем ht = Q2r Тогда из первого уравнения системы (12) по формуле замены переменных Ито (теорема 4.4) получаем t 02 = 02+ Ja»<fc + */f (34) о где t as (со) = 2a {s) 02 + b2 (s) и xt = J* 2b (s) 0s dwx (s). о Поэтому согласно (28) йяде2) = [2а(0яде2)+&2(0]^+л(/)[яде3)-я/(е)яде2)]йш,. (35) Из (32) и (35) видно, что при использовании основного уравнения фильтрации (28) мы сталкиваемся с той трудностью, что для нахождения условных младших моментов требуется знание старших моментов. Так, при отыскании уравнений для я, (б2) требуется знание третьего апостериорного момента я^ (03) = М (0] | #"}). В рассматриваемом случае эта трудность легко преодолевается, поскольку в силу гауссовости процесса (0, I) моменты щ(0") = М(0?|#i) для всех я>3 выражаются через я, (0) и я, (02). В частности, щ (03) — я/ (0) щ (02) = = М[02(0, — tn^\&~\] = 2tn1yv и, значит, йщ (02) = [2а (/) я, (02) + Ь2 (/)] dt + 2 A (t) mtyt dwt. (36) По формуле замены переменных Ито из (33) находим, что dm2 = 2тt [а (/) mt dt + A (t) ytmt dwt] + A2(t) у2 (t) dt. Вместе с уравнением (36) это соотношение дает искомое уравнение (18) для yt = nt(Q2)— m2. Описанный вывод уравнений (17), (18) поучителен в том смысле, что из него видно, что для получения замкнутой системы уравнений, определяющих оптимальную фильтрацию, надо привлекать дополнительные сведения о соотношениях между старшими условными моментами. В настоящей книге существенное внимание уделяется так называемым условно-гауссовским процессам (0, I), для которых оказалось возможным получить замкнутую систему уравнений оптимальной нелинейной фильтрации. Тем самым выделен широкий класс случайных процессов (включающий в себя процессы, описываемые схемой Калмана — Бьюси), для которых удается эффективным образом решить задачу построения опти-
ВВЕДЕНИЕ 17 мального нелинейного фильтра. Этот класс процессов (0, g) описывается следующим образом. Предположим, что процесс (0, £) является процессом диффузионного типа с дифференциалом dOt = [ao{t9 6) + а,(/, 6)8,]Л + *,(/, t)dwl(t) +b2(t, l)dw2{t\ dli = \Mt> D+AAU l)%\dt+Bx(U l)dwl(t) + B2(t) l)dw2{t\ (37) где каждый из функционалов a0(t, £), ..., B2(t, l) является ^-измеримым для всякого t^O (ср. с системой (10)). Подчеркнем, что ненаблюдаемая компонента 0, входит в (37) линейно, тогда как наблюдаемый процесс g может входить в коэффициенты любым («^-измеримым») образом. Входящие в (37) винеровские процессы wx = {wx (t))9 w2 = (w2(t)\ /^0, и случайный вектор (0О, g0) предполагаются независимыми. Будет доказано (теорема 11.1), что если условное распределение Р(0о^*16о) (для почти всех £0) является гауссовским, N(m0, Yo)> где m0= M (0OI £0)> Yo= M [(Э0 — m2f\ У, то процесс (0, |), управляемый системой (37), будет условно-гауссов- ским в том смысле, что при каждом t^O условные распределения Р(0,о <х0, ..., Qtk <*л \F)y 0</0 < tx < ... </л<й, являются гауссовскими. Поэтому, в частности, распределение P(9/^*|#i) также (почти наверное) является гауссовским, N{mv yt), с параметрами /я, = М (0, | #"]), Y;= М[(0, — т,)2|#^]. Для условно-гауссовского случая (как и в схемах Кал- мана — Бьюси) старшие моменты М(0?|$~!) выражаются через mty yt. Это и позволяет (из основного уравнения фильтрации) получить для mt и yt замкнутую систему уравнений (теорема 12.1): dmt = [a0 (t, I) + av(t, I) mt] dt + 2 2М*,6)М'.Б) + уД('.Б) + — 2 [dtt-(A0(t, D + Mt, l)mt)dt], (38) 2 *?('.» i—\ Y, = 2a,(*, &)y, + 2*<(<' £)■ 2 2 b. (t, I) Bt (t, I) + ytA{ (/, |) i=i 2 я? С 6) (39) i=l Заметим, что, в отличие от (18), уравнение (39) для yt является уравнением со случайными коэффициентами, зависящими от наблюдаемых данных.
18 ВВЕДЕНИЕ Оптимальной линейной фильтрации (в схеме (12)) и оптимальной нелинейной фильтрации для условно-гауссовских процессов (в схеме (37)) посвящены главы 10, И и 12. Здесь же, помимо фильтрации, изложены соответствующие результаты для задач интерполяции и экстраполяции. 4. Приведенные примеры и результаты, вошедшие в главы 8—12, показывают, что в книге существенно используются такие понятия теории случайных процессов, как винеровский процесс, стохастические дифференциальные уравнения, мартингалы, квадратично интегрируемые мартингалы и т. п. Стремление авторов давать полные доказательства всех приводимых результатов теории нелинейной фильтрации привело к необходимости довольно подробно изложить теорию мартингалов и стохастических дифференциальных уравнений (главы 2—6). Мы надеемся, что материал этих глав может оказаться полезным и для тех читателей, которые просто пожелают ознакомиться с результатами теории мартингалов и стохастических дифференциальных уравнений. Вместе с тем мы хотим еще раз подчеркнуть, что без этого материала не представляется возможным дать сколько-нибудь удовлетворительное изложение теории оптимальной нелинейной фильтрации и смежных с ней вопросов. В седьмой главе излагаются существенно используемые в дальнейшем результаты об абсолютной непрерывности мер, отвечающих процессам Ито и процессам диффузионного типа. В главах 15—17 даются применения теории фильтрации к разнообразным задачам статистики случайных процессов. Здесь подробно рассмотрены задачи линейного оценивания (гл. 15), даются применения к некоторым задачам управления, теории информации (гл. 16). В гл. 17 даны применения к небайесовским задачам статистики (оценки максимального правдоподобия для коэффициентов линейной регрессии, последовательное оценивание и последовательное различение статистических гипотез). Дополнительное представление об излагаемом в книге материале читатель может почерпнуть из -приведенного выше оглавления и примечаний, помещенных в конце книги. В примечаниях указаны также источники излагаемых результатов. В заключение авторы хотели бы выразить благодарность и признательность коллегам и друзьям за помощь и советы. Особо нам хочется поблагодарить Р. 3. Хасьминского и М. П. Ершова. Ознакомившись с рукописью книги, они сделали ряд существенных замечаний, которые мы постарались учесть.
ГЛАВА t НЕОБХОДИМЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ § 1. Основные понятия теории вероятностей 1. Вероятностное пространство. Согласно аксиоматике Колмогорова первоначальным объектом теории вероятностей является вероятностное пространство (Q, @~, Р). Здесь (Q, #")—измеримое пространство, т. е. множество Q, состоящее из элементарных событий о, с выделенной на нем системой @~ его подмножеств (событий), образующих а-алгебру, а Р — вероятностная мера (вероятность), определенная на множествах из #". Напомним, что система #"__подмножеств пространства Q образует алгебру, если QGf, Л = Й\Ле^ и А[)В^&~ для любых А^@~, Bef. Алгебра ЗГ образует а-алгебру, если вместе с каждой последовательностью множеств Аь Аъ ..., 00 принадлежащих #~, сумма (J^e#". Функция Р(А), опреде- ленная на множествах А из а-алгебры &', называется вероятностной мерой, если она обладает следующими свойствами: Р(Л)^0, AeJ (неотрицательность); Р (Q) = 1 (нормированность); Р[\jAi]=^P(Ai) (счетная, или а-аддитивность), где At^T, Aif] Aj= 0, 1ф\, 0—пустое множество. Система множеств #~р называется пополнением а-алгебры 2? по мере Р, если #"р принадлежат все те множества А ^ Q, для которых найдутся такие множества А{, А2^5Г, что А{^ А^А2 и Р(А2\ А^ — О. Система множеств Ф"Р является а-алгеброй, и мера Р однозначно продолжается на множества из #"р. Вероятностное пространство (Q, 9", Р) называется полным, если @~р совпадает с #". Согласно общему
20 НЕОБХОДИМЫЕ СВЕДЕНИЯ [ГЛ. 1 духу теории вероятностей, пренебрегающей событиями нулевой вероятности, все рассматриваемые далее вероятностные пространства (Q, $ГК Р) будут предполагаться (часто без дополнительного на то указания) полными. 2. Случайные элементы и величины. Пусть (Q,^T) и (£, $) — два измеримых пространства. Функция ^ = ^((о), определенная на (Q, #") со значениями в Е, называется &'/$-измеримой, если множество {со: £(со)еВ}еУ для всякого В е J?. В теории вероятностей такие функции называют случайными элементами со значениями в Е. В том случае, когда E = R—действительная прямая, а $—•а-алгебра борелевских подмножеств /?, ^"/^-измеримые функции g = g(со) называют (действительными) случайными величинами. В этом специальном случае ^"/^-измеримые функции для краткости называют просто ^-измеримыми. Говорят, что две случайные величины £■ и ц совпадают с вероятностью 1, или почти наверное (п. н.), если Р(£ = 'п) = '• В этом случае пишут: 1 = ц (Р-п. н.). Аналогично, запись 1^ц (Р-п. н.) означает, что P(£>ri)=l. Запись 1 = ц (Л; Р-п. н.) применяется для обозначения того, что £ = 11 почти наверное на множестве А относительно меры Р, т. е. Р(Л П(6 Ф л)) = 0. Аналогичный смысл придается выражению «1^ц (Л; Р-п. н.)». Для краткости слова «Р-п. н.» в дальнейшем часто будут опускаться. 3. Математическое ожидание. Пусть (Q, !Г9 Р)—вероятностное пространство и g = g(co) — неотрицательная случайная величина. Ее математическое ожидание (обозначаемое М£) есть интеграл Лебега*) |(co)P(dco), по определению равный Игл /г->оо 2 I • 2"Р [I ■ 2~п < £<(* + 1)2""} + «Р{| > я} i=0 J где {/• 2~n < g^(/ + \)2~п) обозначает множество точек соей, для которых / • 2~п < g(oX(/-f 1) • 2~п. Аналогично определяется множество {I > п}. В силу предположения £(о)^0, co^Q, интеграл J g(o)P(do)) определен, хотя, быть может, Q и принимает значение + оо. В случае произвольной случайной величины £ —£(со) математическое ожидание (также обозначаемое М|) определяется только в том случае, когда одно из математических ожида- *) Для этого интеграла будут использоваться также обозначения J g (<0) £lPf \ ldPy J |((0)dP, jldP.
§ 1] ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ 21 ний М|+ или М£~~ конечно (здесь l+ = max (g, 0), Г* = — min (g, 0)) и полагается равным М£+ —Mg~~. Случайная величина £ = £(со) называется интегрируемой, если; М|£|=М£+ + МГ<°°. Пусть Q = Rl — действительная прямая, #" —система боре- левских множеств на ней. Предположим, что мера Р на 9~ порождается некоторой функцией распределения F(A,) (т. е. не- убывающей, непрерывной справа и такой, что F( — оо) = 0,. F(oo)=:l) по правилу Р{(а, b]} = F(b) — F(a). Тогда интеграл ь ъ | l(x)P(dx) обозначается Г l(x)dF(x) и называется интегралом а а Лебега — Стилтьеса. Этот интеграл можно свести к интегралу по мере Лебега P(dt) = dt. А именно, пусть £(х)^0 и с(/)=» = inf(x: F{x)>t). Тогда Ъ F(b) jt(x)dF(x)= J l(c(t))dt. a F(a) 4. Условные математические ожидания и вероятности. Пусть ^ — некоторая а-подалгебра *) &*, $ s & и g = g(со) — неотрицательная случайная величина. Условное математическое ожидание \ относительно % (обозначается M(g|^)) по определению есть любая ^-измеримая функция г| == г|(а>), для которой определено Мл, такая, что для любого Л е 9 J|(co)P(rfco)= J Л(со)Р(^со). Л Л Интеграл Лебега g(co)P(dco) по множеству AeJ есть по л определению ( | (со) %л (со) Р (dco), где %л(со)—характеристическая Q функция множества Л: Ха(») = {о, сое Л, со^Л. Интеграл f |(©)P(dco) (если только он определен, т. е. коне- А чен один из двух интегралов J g+(co)P(dco), J g~ (со)P(dcon будет л л / обозначаться М(£; Л). *) Правильнее было бы говорить под-ст-алгебра.
22 Необходимые сведения [ГЛ. 1 Пусть на измеримом пространстве (Q, ЯГ) заданы две вероятностные меры Р и Q. Говорят, что мера Р абсолютно непрерывна относительно меры Q (Р < Q), если Р(Л) = 0 для всякого ^Ef, для которого О(Л)=0. Теорема Радона — Никодима. Если P<Q, тогда существует такая неотрицательная случайная величина g=£(co), что для каждого А<^ЯГ PM)=||(co)Q(d(o). А ^-измеримая функция g = g (со) единственна с точностью до стохастической эквивалентности (т. е. если также Р(Л) = = /л(ю)0(Ж*>)> А<=ЯГ, то g = T|(Q-n. h.)V Случайная величина £(со) называется плотностью одной меры (Р) по другой (Q) или производной Радона — Никодима. В связи с этим определением используют обозначение £(со) = dP =--^q-(g)). По теореме Радона —Никодима, при условии P<Q, dP плотность -tq- всегда существует. Если | (со) = Ха (®)~характеристическая функция множества А<^ЯГ (иначе — индикатор множества Л), то М0сл(со)|^) обозначается Р( А \9) и называется услоеной вероятностью события А относительно $. Так же, как и М(£|?), условная вероятность Р(А\$) определяется однозначно с точностью до множеств Р-меры нуль (зависящих, быть может, от А). Функция Р(Л, со), Ле^", (oeQ, удовлетворяющая условиям: 1) при каждом фиксированном со она является вероятностной мерой на множествах А^ЯГ, 2) для каждого /lEf она является ^-измеримой, 3) с вероятностью 1 для каждого Ле^ Р(Л, со) = Р(Л|»), называется условным распределением вероятностей относительно $ или регулярной условной вероятностью. Существование такой функции означает, что условные вероятности могут быть так определены, чтобы для каждого со они задавали вероятностную меру на Ле^. В регулярном случае условные математические ожидания могут быть найдены как интегралы по условным вероятностям: ЩЪ\9)= \l(<b)P(du\9). Q Если g = g (со) — произвольная случайная величина для которой М| существует (т. е. М|+ < оо или М£~ < °°), то условное
§ 1] ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ 23 математическое ожидание определяется формулой М(6|У)=М(б+|зО-М(г|зО. Если ^ — некоторая система подмножеств пространства й, то через o(s&) обозначается а-алгебра, порожденная системой si>9 т. е. наименьшая а-алгебра, содержащая зФ. Если г| = т^(со) — некоторая ^"/Jf-измеримая функция со значениями в Е, то через о(ц) (или ^~л) обозначается наименьшая а-алгебра, относительно которой измерим случайный элемент т](о)). Иначе говоря, а(г))_ есть а-алгебра, состоящая из множеств вида {о: ц~1(В), В ^Щ. Для краткости условное математическое ожидание М(| ^^обозначается М(£|т))- Аналогично, для Р(Л [ёГ^) используется обозначение Р(Л|т]). В частности, если случайный элемент г|(со) является /г-мерным вектором случайных величин (т]|, ..., цп), то для М(£ |#"л) используется обозначение М(£|ть •••> Л/г). Отметим основные свойства условных математических ожиданий: 1. М(&|£)>0, если £>0 (Р-п. н.). 2. М(1 \9)=1 (Р-п. н.). 3. М(1 + ц\9)=М(1\9)+М(ц\9) (Р-п. н.), если только выражение М(£ \9) + М(л \9) определено. 4. М Цц \Ъ) = 1М (ц \9), если Щц существует и | ^-измерима. 5. Если 9Х^9Ъ то Р-п. н. М(Ъ\91) = ЩЩЪ\92)\91]. 6. Если а-алгебры 9 и ^ независимы (т. е. Р(А(]В) = =Р(Л)Р(В)для любых А (=9, ВеЯ), то Р-п. н. М(Ш)=М£. В частности, если 9 = {0, Q} —тривиальная а-алгебра, то М(1\9) = Щ (Р-п. н). 5. Сходимость случайных величин. Теоремы о предельном переходе под знаком математического ожидания. Говорят, что последовательность случайных величин £„, /2=1, 2, ..., сходится по вероятности к случайной величине £■ (используя при этом запись 1п— +1 или g = P-limga), если для каждого е>0 lim P{|g«-Sl>e} = 0. /г->оо Последовательность случайных величин gn, /2=1, 2, ..., называется сходящейся к случайной величине \ с вероятностью единица или почти наверное (и пишется: ^-^или g„->g(P-n. н.)), если множество {о: 1п (а)) У*-1(a))} имеет Р-меру нуль. Заметим, что {©:ь,-а=П U n{is»-si<7-}' r=l и=1 k=n l } откуда, в частности, вытекает, что сходимость с вероятностью } влечет за собой сходимость по вероятности.
24 НЕОБХОДИМЫЕ СВЕДЕНИЯ [ГЛ. 1 Будем писать 1п\1 или %п\1 (Р-п. н.), если |„->|(Р-п. н.) и £/г^£/г+1 (Р-п. н.) для всех п=1, 2, ... Аналогично определяется и сходимость In Ц- Говорят также, что £л->£ на множестве /lEf, если Р(АП(1П7*>1)) = 0. Последовательность случайных величин grt, n=l, 2, ..., называется сходящейся в среднем квадратическом к g (обозначается: g = l.i.m.g ), если MgJ < оо, М£2 < оо и М|6П — £|2->0, AZ-> ОО. Последовательность случайных величин £,г, лг == 1, 2, ..., с М | gn | < оо называется слабо сходящейся к случайной величине I с М | g | < оо, если для любой ограниченной случайной величины г| == г|(со) lim Mgttri= М£т)- /г->оо Приведем основные теоремы о предельном переходе под знаком условного математического ожидания, систематически используемые в дальнейшем. Теорема 1.1 (о монотонной сходимости). Пусть о-алгебра Если\п t £(Р-п. н.) и Mi; < оо, то М (Ея |2) f М(£ |£) (Р-п. н.). Если1п Ц(Р-п. и.) и М$<оо9 гоМ(£я|^М(£|30(Р-п. н.). Для формулировки других критериев необходимо ввести понятие равномерной интегрируемости. Семейство случайных величин {£а, а е %} называется равномерно интегрируемым, если lim sup I \laldP = 0. (1.1) x->oo a6= 91 , . t •* . {|*al>*} Условие (1.1) эквивалентно следующим двум условиям: supM|gal<oo и lim sup \\la\dP = 0, ^f. a Р(Л)->0 a д Теорема 1.2 (лемма Фату). Если последовательность случайных величин I*, /2=1, 2, ..., равномерно интегрируема и M(limsup£„) существует, то п М (lim sup |„ |^) > lim sup M (| |^) (Р-п. н.), (1.2) П П где *) lim sup ln = inf sup gm. n n m^n *) Для верхнего предела lim sup ln используется также обозначение n lim In- Соответственно нижний предел lim inf \n обозначается \\m_%n-
§ 1] ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ 25 В частности, если для последовательности gn> /2=1, 2, ...., существует интегрируемая случайная величина | такая, что in^i» T0 справедливо неравенство (1.2). Теорема 1.3. Пусть 0 <£„->£ (Р-п. н.) и Щп < оо, лг = 1, 2, ... Для того чтобы М(Ь,|»)->М(6|3)-<оо (Р-п. н.), (1.3) необходимо и достаточно, чтобы последовательность 1п, лг= 1, 2,..., была равномерно интегрируемой. Из теорем 1.2 и 1.3 вытекает следующее полезное Следствие. Если 1п->1 (Р-п. н.) и последовательность 1п, л=1, 2, ..., равномерно интегрируема, то M(|£„-g||S0-*0, n->oo (Р-п. н.) (1.4) Теорема 1.4 (теорема Лебега о мажорируемой сходимости). Пусть 1п->1 (Р-п. н.) и существует такая интегрируемая случайная величина \\, что |£/гК^Л- Тогда М(\Ъп~1\\9)-+09 п->оо (Р-п. н.). Замечание 1. Теорема 1.3, ее следствие и теорема 1.4 сохраняет свою силу, если сходимость £„->£ (Р-п. н.) заменить на сходимость по вероятности: g = P-limgn. п Замечание 2. Беря в теоремах 1.1 — 1.4 в качестве 9 тривиальную а-алгебру {0, О], получаем обычные теоремы о предельном переходе под знаком интеграла Лебега, поскольку в этом случае М(у\\$)=Мц. Пусть теперь ..., #"_2, #~-i, @~0, 3~х, &~2> ••• —неубывающая (..., ^_j ^ #"0 — ^\ ~ ^2 — • • •) последовательность а-под- алгебр #". Обозначим ^"оо = cr/(J #",Л минимальную а-алгебру, содержащую алгебру событий (J#"„, и положим ^"-00:=П^"/г- /г я Теорема 1.5 (Лёви). Пусть g — случайная величина с М111 < оо. Тогда с вероятностью 1 M(i|^„)^M(iirj, п-оо, M(i|5r„)^M(||^_J, /1--00. U,&J Следующее предложение содержит в себе утверждение как теоремы 1.4, так и теоремы 1.5. Теорема 1.6. Пусть lm->l (Р-п. н.) и существует такая интегрируемая случайная величина ц, что I £m |^т)- Пусть, далее, ..., #"_2 ^ #~_] ^ ^"о — У\ — ^2 ^ • • • — неубывающая последовательность о-подалгебр $Г, ?Г ^ = а /(J &~п\ , SF-<*> — П^- \ п I п
26 Необходимые сведения [гл. j Тогда с вероятностью 1 linr M(Ew|^„)=M(6I^Jf п, m->oo Urn М(|т|^_„)=М(||^-оо). (L6) n, m->oc Теорема 1.7 (критерий компактности Данфорда — Пет- тиса). Для того чтобы семейство случайных величин {ga, a e 51} с М | £a | < °° было слабо компактно, необходимо и достаточно, чтобы оно было равномерно интегрируемым. (Напомним, что слабая компактность семейства {£a, a e 51} означает, что каждая последовательность ga, a. sj, /=1, 2,..., содержит слабо сходящуюся подпоследовательность.) В заключение этого пункта приведем одно необходимое и достаточное условие равномерной интегрируемости. Теорема 1.8 (Валле-Пуссен). Для того чтобы последовательность £,, £2> • • • интегрируемых случайных величин была равномерно интегрируемой, необходимо и достаточно, чтобы существовала функция G(t), t^O, положительная, возрастающая и выпуклая книзу, такая, что lim -^=00, (1.7) supMG(H„|)<oo. (1.8) П 6. Основные неравенства для математических ожиданий. Неравенство Гёльдера. Если р>\, —|—=1, то М|^К(М|?П,//?(М|лГ),/<7. (1.9) В качестве частных случаев (1.9) получаем следующие два неравенства. Неравенство Коши — Буняковского: MIStiK/M^Mti2. (1.10) Неравенство Минковского. Если р^\, то (М\1 + ц\рУ1р<(М\1\рУ1р + (М\ц\р)^. (1.11) Неравенство Иенсена. Пусть f(x) — непрерывная выпуклая (книзу) функция одного переменного и | — интегрируемая случайная величина (М | £ |< оо) такая, что М | / (£) |< оо. Тогда f(M£)<M/(E). . (1.12) Замечание. Все указанные неравенства остаются справедливыми, если операцию математического ожидания М(-)
§ 1] ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ 27 заменить на условное математическое ожидание M(-|S?), где ^ — а-подалгебра ЯГ основного вероятностного пространства (Q, F, Р). Неравенство Чебышева. Если М|£|<оо, то для всякого а > О 7. Лемма Бореля — Кантелли служит основным средством при исследовании свойств, выполняющихся «с вероятностью 1». Пусть Аи Аъ ...—последовательность множеств из #". Множество А* называется верхним пределом последовательности множеств А{9 Аъ ... и обозначается А* = limn sup An, если А* состоит из всех тех точек о, каждая из которых принадлежит бесконечно многим Ап. Отправляясь от этого определения, нетрудно показать, что оо оо А'=П U 4». п=\ пг=п Часто также пишут А* = {Ап б. ч.}. Множество Ам называется нижним пределом последовательности множеств А{, А2, ... и обозначается Л, = limninf An, если Л+ состоит из точек о, каждая из которых принадлежит всем АП9 за исключением, самое большее, конечного их числа. В соответствии с этим определением 00 ОО А.= (J П Аш-' оо Лемма Бореля — Кантелли. Если ^jP{An) < оо, то оо Р(Л*) = 0. Если же 2 Р(Ап) = 00 и множества АЬ Аъ ..« не- зависимы (г. е. Р(Л/ , ..., Aik) = P(Ai^ ... Р(Л^) для любых различных iu ..., ik)9 то Р(Л*)=1. 8. Гауссовские системы. Случайная величина g = g(o), определенная на вероятностном пространстве (Q, #", Р), называется гауссовской (или нормальной), если ее характеристическая функция Ф(0=Ме"б = /т~"^'\ (1.13) где — оо < m < оо, а2 < оо. В невырожденном случае (а2 > 0) у функции распределения АМ = Р{со: Б(©)<*} (1.14)
28 НЕОБХОДИМЫЕ СВЕДЕНИЯ [ГЛ. I существует плотность fl(x) = —L-e-(x-«*7i2°\ -oo<*<oo. (1.15) у 2яа т В вырожденном случае (а2 = 0), очевидно, P{g = m}=l. Параметры т и а2 нормального распределения, задаваемого характеристической функцией (1.13), имеют простой смысл: m = M£, cr2 = D£, где D£ = M(£ — М£)2— дисперсия случайной величины \. Если т = 0, то Щп = {2п— \)\\о2п. В дальнейшем часто будет использоваться запись *) £~jV(m, а2), означающая, что | является гауссовской величиной с параметрами т и а2. Случайный вектор g = (£i, ..., |Д состоящий из случайных величин £,, ..., In, называется гауссовским (или нормальным), если его характеристическая функция ф(/)=ме'<'•«,' /=(/ь..., a ^я1 (/,i)=S/yg/f задается формулой <р(0 = е 2 , (1.16) где m = (m,, ..., mn), I m/1< оо, (#/, /)= %fktJtktf и Л = ||гй/ life, / неотрицательно определенная симметрическая матрица: 2 гк№ >0> tf<= R\ rk, = /> k, / В невырожденном случае (когда матрица R положительно определенная и, следовательно, j R \ = det R > 0) у функции распределения F$(xly ..., хп) = Р{<о: £i<*b ..., ^<^} вектора £■=(£■!, ..., ln) существует плотность 1Л|1/2 Г 1 V" 1 h{xu ..., хп)= ' )]п/2 exp --^jCiijiXi — mAiXj — mj) , (1.17) где Л =|| aj/1| — матрица, обратная к R (A = R~l), ] A\ = detA. Пользуясь введенными выше обозначениями, плотность fl(xlt ..., хп) можно (в невырожденном случае) переписать *) Заметим, что обычно пишут l~N(m, а). Нам удобно, однако, использовать запись %~N {т, о2).
§2] СЛУЧАЙНЫЕ ПРОЦЕССЫ. ОСНОВНЫЕ ПОНЯТИЯ 29 в таком виде *): 1Л1,/2 Г 1 1 где х = (хь ..., хп)9 т = (ти ..., /п„). Как и в одномерном случае (п= 1), вектор щ = {ти ..., mn) и матрица /? = ||г^|| допускают простую и наглядную интерпретацию: /И/ = М|/, ri/ = cov(£b Б/) = М (Б/ — ntiHlj — т}). (1.18) Иначе говоря, т есть вектор средних значений, а /? есть матрица ковариаций вектора | = (|i, ..., £л). Система случайных величин £ = {£а, аЕ21}, где 51— некоторое конечное или бесконечное множество, называется гауссовской, если любая линейная комбинация является гауссовской случайной величиной. Иногда удобно пользоваться иным, но эквивалентным данному, определением гауссовской системы. Согласно этому определению система случайных величин g = {ga, а^Щ называется гауссовской, если для любого п и любых аи ..., ап е 31 случайный вектор '(£а , ..., £а ) является гауссовским. § 2. Случайные процессы. Основные понятия 1. Определения. Свойства измеримости. Пусть (Q, #", Р)— вероятностное пространство и Г = [0, оо). Семейство X = (lt)9 t^T, случайных величин ^ = ^(со) называется (действительным) случайным процессом с непрерывным временем / е Г. В том случае, когда временной параметр t пробегает множество # = {0, 1, ...,}, семейство X = {lt), t^N> называют случайной последовательностью или случайным процессом с дискретным временем. При фиксированном ©gQ функция времени £*(©) (<еГ или / е JV) называется траекторией или реализацией, отвечающей элементарному исходу со. С каждым случайным процессом X = (lt), t^Z (где Z = T в случае непрерывного времени и Z = N в случае дискретного времени), естественным образом связываются a-алгебры £Гу = = а{£5, $<!/}, являющиеся наименьшими a-алгебрами, относительно которых измеримы случайные величины £s, s<i/. Для условных математических ожиданий М(г)|^"1) иногда будем *) Как и в (1,16), (•,•) обозначает скалярное произведение.
30 НЕОБХОДИМЫЕ СВЕДЕНИЯ [ГЛ. 1 использовать также следующие обозначения: M(ri|g, s*^t) и М(л1ф Для условных вероятностей P(A\&"i) применяются аналогичные обозначения: Р(Л|£5, s^f) и Р(ЛЩ). Случайный процесс X = (lt), <еГ, называется измеримым, если для любых борелевских множеств Bel числовой прямой R1 {(со, 0: b(?)efi}s^X«(n где #(Г) есть а-алгебра борелевских множеств на Г = [0, оо). Следующая теорема иллюстрирует важность понятия измеримости процесса, заданного на полном вероятностном пространстве (Q, У у Р). Теорема 1.9 (Фубини). Пусть X = (lt), tеГ, — измеримый случайный процесс. 1) Почти все траектории этого процесса являются измеримыми {по Борелю) функциями от /еГ. 2) Если lA&t существует при всех /еГ, то mt = Mlt является измеримой функцией от /еГ. 3) Если S — измеримое множество на Г = [0, оо) и \U\lt\dKoo, то Р-п. н. j\lt\dt <оо, s s т. е. почти все траектории ^ = ^(со) интегрируемы на множестве S и \mtdt=u\itdt S S Пусть F = (&*t\ t&T,— неубывающее семейство сг-алгебр, 9rs^3't^9r, s<^t. Говорят, что (измеримый) случайный процесс X = (lt), <бГ, согласован с семейством а-алгебр F = (!Ft)9 t^T, если при каждом t^T случайные величины lt являются ^-измеримыми. Для краткости такие случайные процессы будут обозначаться X = (lt,&~t), <gT, или просто X = {%uTt) и называться F-согласованными или неупреждающими *). Случайный процесс X = (lt,&"t), t^T, называется прогрессивно измеримым, если для каждого t^T {(со, s < 0: Is {w) е= В} <= Tt X Л ([0, /]), где В — борелевские множества на R1, а $( [0, f]) — а-алгебра борелевских множеств на [0, t]. *) Такие процессы называют также неантисипативными (non-anticipative processes).
§2] СЛУЧАЙНЫЕ ПРОЦЕССЫ. ОСНОВНЫЕ ПОНЯТИЯ 31 Очевидно, что всякий прогрессивно измеримый случайный процесс X = (lti @~t), /gT, является измеримым и согласованным с F = (Pt), /е=Г. Всякий непрерывный справа (или слева) случайный процесс X = (lt9&'t), t^Ty является прогрессивно измеримым [126]. Два случайных процесса Х = (^(о)), t<=T, и Xr = (gj (©')), /^Т, заданных, быть может, на разных вероятностных пространствах (Q, #", Р) и (Q', #"', Р'), будут называться слабо эквивалентными, если Р{со: ЦеЛ„ .... |<гееЛ„}=Р'{со': ЦеЛ,, .... ^Л„) для любых tu ..., tn^T и борелевских множеств Ль ..., Лп числовой прямой R1. Случайные процессы X = (lt(®)) и Х/ = (^(о)), /sf, заданные на одном и том же вероятностном пространстве (Q, #", Р), называются стохастически эквивалентными, если P(g, Ф1^=1 для всех /еГ. Процесс Я'= (gj (g>)), /sf, стохастически эквивалентный Я" = (£*(©)), ^еГ, называют модификацией процесса X. Известно, что если процесс Я = (^ (©)), /еГ, измерим и согласован (с F = (#",), /еГ), то у него существует прогрессивно измеримая модификация [126]. Пусть £ = £((й) и г| = г|(со) — две случайные величины, определенные на (Q, #"), причем ц является ^-измеримой, где &~Ъ = о(1). Тогда существует такая борелевская функция Y = = Y(x), x^R1, что r](o)) = F(g(o))), Р-п. н. В дальнейшем часто будет использоваться следующее обобщение этого факта (см. [46], стр. 543). Пусть I(о) = (lt (о)), 0</< Г, — случайный процесс, определенный на (Q, #"), &"l=o[(o: lt (о), /<Л и ^ — наименьшая а-алгебра в пространстве RT всех действительных функций x — (xt), 0^/^7\ содержащая множества вида [х: ^е g4 ..., ^еЛя}, где O^ti^T и Л/— борелевские множества на числовой прямой, /=1, ..., п, лг = 1, 2, ... Если случайная величина t) = t](g)) является ^-измеримой, то найдется такая ^-измеримая функция Y = Y(x)f x^RT, что т](о)) = У .(£(©)), Р-п. н. *). Более того, существуют не более чем счетное множество точек su s2, ..., принадлежащих интервалу [О, Г], и (измеримая) функция Y = Y(z), определенная для z = (zi9z2, . ..)е/?°°, такие, что Ti(co) = r(|s(a>), gs(co), ...) (Р-п. н). *) Для случайных величин ц, являющихся ^-измеримыми, часто будут также использоваться обозначения т) = т)г (£), г) = т)(7\ £).
32 НЕОБХОДИМЫЕ СВЕДЕНИЯ [ГЛ. 1 Следующее предложение будет неоднократно использоваться в книге. Пусть X = (lt)> /еГ, — измеримый случайный процесс на (Q, #", Р) с М | lt | < оо, t €= Г, и пусть F = (#",), * е= Г, — семейство неубывающих о-подалгебр ST. Тогда условные математические ожидания r\t = M (lt \@~t) могут быть выбраны таким образом, что процесс n = (%), t^T, будет измеримым [126], [52]. В соответствии с этим результатом в дальнейшем (даже если это не оговорено особо) всегда будет предполагаться, что условные математические ожидания M(lt\!Tt), /еГ, уже так определены, что процесс ifo = М (£* | #"*), ^еГ, является измеримым. 2. Непрерывность. Случайный процесс X = (lt), <еГ, называется стохастическим непрерывным в точке t0^T, если для любого е > О Р{|£.-£*.1>в}-*0, s->t0. (1.19) Если (1.19) выполнено для всех f0sS9r, то процесс X называют стохастически непрерывным (на множестве S). Случайный процесс X = (lt), t^T, называется непрерывным (непрерывным справа, слева) на S ^ Т, если почти все его траектории непрерывны (непрерывны справа, слева) для /е ESer, Иначе говоря, должно существовать такое множество N^ST с P(jV) = 0, что для всех a&N траектории lt(a>), t^S, суть непрерывные (непрерывные справа, слева) функции. Следующая теорема дает условия существования непрерывной модификации у процесса Х = (^(со)), t^[a, Ь]. Теорема 1.10 (критерий Колмогорова). Для того чтобы случайный процесс X = (lt), t e [а, Ь], допускал непрерывную модификацию X* = (£*), t^[a, b], достаточно, чтобы нашлись такие постоянные а > 0, е > 0 и С, ^го М|Ь+д-6/|а<С|Д||+в (1.20) для всех /, / + А е [а> 6]. Случайный процесс X = (lt), t^T, называется непрерывным в среднем квадратическом в точке t0 e Т, если M|le-IJ2-*0, s-W0. (1.21) Если (1.21) выполнено для всех точек /0eScr, то процесс X будет называться непрерывным в среднем квадратическом (на множестве S). 3. Некоторые классы процессов. Остановимся на основных классах случайных процессов. Стационарные процессы. Говорят, что случайный процесс X = (lt(a>))y /еГ = [0, оо), является стационарным (или стационарным в узком смысле), если для любого действитель-
§ 2] СЛУЧАЙНЫЕ ПРОЦЕССЫ. ОСНОВНЫЕ ПОНЯТИЯ 33 ного Л конечномерные распределения не меняются при сдвиге на Д: P%i^A{i...9ltn^An} = P{lti+A^A[t...>ltn+A^An}9 если только /,, ..., tn, tx + А, ..., /„ + АеГ Случайный процесс Х = (^(о)), /еГ = [0, оо), называется стационарным в широком смысле, если М1?<оо, t<=T и Mlt = Mlt+A, Ml,lt = Mls+bh+v т. е. если первые и вторые моменты не меняются при сдвиге. Марковские процессы. Действительный случайный процесс X = (lt, @~t), t^T, заданный на (Q, #~, Р), называется марковским относительно неубывающей системы о-алгебр F = {yt), te=Ty если Р-п. н. *) Р(АПВ1Ь)-Р(Л|Ь)Р(51Ь) (1.22) для любых /sT, 4s^, ^ff/oo) = a(^>(), Действительный случайный процесс X =(£*), ^еГ, называется (просто) марковским, если он является марковским относительно системы a-алгебр #"г = #i = a(£s, s^O- Нижеследующие утверждения можно положить в основу различных, но эквивалентных определений марковости процесса x = {%ug-t\ /ег. Теорема 1.11. Следующие условия эквивалентны: 1) X = (£j, #"Д /еГ,- марковский процесс относительно F = (<rt),t<=T; 2) (Эля каждого t^T и любой ограниченной &~% ^-измеримой случайной величины ц М(л1^)-М(т||Ь) (Р-п.н.); (1.23) 3) для t^s^O и любой (измеримой) функции f(x) с sup | / (х) |< оо M[f(h)\Ps) = M[f(tt)\ts). (1.24) Для проверки того, когда процесс X=(lt), t^T, является (просто) марковским, полезно следующее утверждение. Теорема 1.12. Для того чтобы случайный процесс X = (lt), t^T, был марковским, необходимо и достаточно, чтобы для каждой (измеримой) функции f(x) с sup| f(x) |< оо и любого набора 0</,</2< ... </„</ М[/(Ь)1Ь, bJ^Mt/yg. (1.25) ) В соответствии с предыдущими соглашениями Р ( -| £,) обозначает условную вероятность Р(-|а(|*)>
34 НЕОБХОДИМЫЕ СВЕДЕНИЯ [ГЛ. 1 Процессы с независимыми приращениями являются важным частным случаем марковских процессов. Говорят, что процесс X = (lt)y t^T, является процессом с независимыми приращениями, если для любых tn > tn-x > ... ... >^>0 приращения ££ — &,, "> &'л —&n-i образуют систему независимых случайных величин. Процесс с независимыми приращениями называется однородным (по времени), если распределение вероятностей приращений lt~h зависит лишь от разности t — s. Часто такие процессы еще называют процессами со стационарными независимыми приращениями. Мартингалы. Случайный процесс X = (£t9 !Ft), t£=T, называется мартингалом (относительно системы F = (^), /еГ), если М| It I < °°> t<=Ty и M(lt\Ps)=*h> *>s (Р-п. н.). (1.26) Мартингалам (а также близкому понятию — полумартингалам) будет посвящена значительная часть настоящей книги. § 3. Марковские моменты 1. Определения. Пусть (Q, #", Р) — вероятностное пространство, Г = [0, оо) и F = (STt\ t^T, — неубывающая последовательность а-подалгебр & (^"ss^ s#", s<!/). Как отмечалось в § 1, а-алгебра Т предполагается пополненной по мере Р (#" = <£"Р). Далее всюду будет также предполагаться, что и а-алгебры £Th t^T, пополнены множествами из #", имеющими Р-меру нуль. Случайная величина (т. е. ^"-измеримая функция) т = т((о), принимающая значения в Г = [0, оо], называется марковским моментом (относительно системы F = (#"/), /еГ), если для каждого /еГ {со: t(<d)<*}6=#V (1.27) Марковские моменты (м. м.) называют также случайными величинами, не зависящими от будущего. Если Р{т(о) < оо} = 1, то м. м. называется моментом остановки (м. о.). С каждым м. м. т = т(о) (относительно системы jp = (^), /еГ) связывается а-алгебра ЗГ^ — совокупность тех множеств А е {со: т < оо}, для которых А П {т < /} е Tt при всех t e Г. Если под &t понимать совокупность событий, наблюдаемых до момента времени t9 то $ГХ состоит из событий, наблюдаемых до случайного момента т. Техника оперирования марковскими моментами довольно существенно будет использована в настоящей книге.
§ 3] МАРКОВСКИЕ МОМЕНТЫ 35 1. Свойства марковских моментов. Для каждого /gT положим*) &-t+ = [)&~Si 0V = a/(J#"s). ^о-=^"о и ^ТО = s>t \s<t I -о/U *-.V \s>0 I Последовательность a-алгебр F = (Tt\ <еГ, называется непрерывной справа, если &"t = &~t+ для всех tfeF. Заметим, что семейство Jp+=(#"/+) всегда непрерывно справа. Лемма 1.1. Яг/сгб т = т (©) — ж. м. Тогда {т < /} е #", и, следовательно, {т = /} е #~,. Доказательство следует из того, что оо {т<*}=0{т<'-т} и {Т<'-1Н^_!_-Г<- Утверждение, обратное лемме 1.1, вообще говоря, неверно. Однако справедлива следующая Лемма 1.2. Если семейство F = (#",), t e Г, непрерывно справа и т = т((о) — случайная величина со значениями в [О, оо] такая, что {т < /}е#~, для вгел: /еГ, го т есгб марковский момент, т. е. {т</} е#"„ /еГ. * Доказательство. Поскольку {т < t}е#"„ то {т^/}е е^"/+е для любого е > 0. Следовательно, {т</} е #~/+ =Sr/. Лемма 1.3. Если ть т2— марковские моменты, то %{ Л ъ^ ss min (ть т2), Tj V t2 ^ max (Tt, т2) и х{ + т2 также являются марковскими моментами» Доказательство следует непосредственно из соотношений {т,Лт2</} = {т,</}и{т2</}, {*i VT2<fl = {T,<fln{T2</}, {т, + т2</} = {т1 = 0, t2 = /}U U{ti = /,t2 = 0}U/ (J [{^<^}П{т2<&}] ■lfl+6<f \a,b>0 где а, 6 — рациональные числа. Лемма 1.4. Пусть т,, т2, ...—последовательность марковских моментов. Тогда sup т„ также марковский момент. Если к тому же семейство F = (#",), t^T, непрерывно справа, to inf %n, lim sup тп и lim inf trt также являются марковкими мо- п п п ментами. Доказательство следует из того, что {supT„</}==n{T„</}E=#-,, {mfTn<t} = \J{xn<t}s=$-t *) Наименьшая а-алгебра oil &~Л иногда обозначается V ^ \s<t J *<t
36 НЕОБХОДИМЫЕ СВЕДЕНИЯ [ГЛ. I и для lim supT„ = inf suptm, liminf t„ = sup inftm {limsupt„<0 = U U П{Хт<*-т}' {liminfT„>0 = U П (){'Cm>i + T}' Лемма 1.5. Всякий марковский момент т = т(со) (относительно F = (#",), /gT) является &\-измери мой случайной величиной. Если х и о — два марковских момента и т((о)^а(о)) (Р-п. н;), то Fx<=&'0. Доказательство. Пусть A = {t^s}. Надо показать, что А П {т < *} €= #"„ /еГ. Имеем {T<s}fl{t<<} = {T<<As}s^Aec^i Следовательно, м. м. т является ^-измеримым. Пусть теперь A s {о: а < оо} и Де #"т. Тогда, поскольку Р{т^а}= 1 и а-алгебры £Tt пополнены, то с точностью до множеств нулевой вероятности* множество ЛП{сг^/} совпадает с множеством A {\{x^it}[\{a^t}> которое принадлежит #",. Следовательно, множество ЛП{сг^/}е^, и, значит, А^ЗГ0. Лемма 1.6. Пусть хи т2, ... — последовательность марковских моментов относительно неубывающей непрерывной справа системы о-алгебр F = (#",), (еГ, и пусть х = inf хп. Тогда /г Доказательство. Согласно лемме 1.4 т является м. м. Поэтому по лемме 1.5 Згх^^\ЗгХп. п С другой стороны, пусть A&f\!FXn. Тогда п лп{т</}=лп(и(т«<^=и(лп{т„</})е^. \ /г In Отсюда, в силу непрерывности справа (#", = #",+), вытекает, что А е Ут. Лемма 1.7. Пусть х и а — марковские моменты относительно F = [@~t)> t е Г. Гогда каждое из событий {х < а}, (т > а}, {т<а}, {т>а} и {т = а} принадлежит одновременно 9ГХ и &~а. Доказательство. Для каждого /еГ {*<o}f){o<:t} = \J({x<r}n{r<o^t})<=?'lt, r<t где г — рациональные числа. Поэтому {т<о)е#"0.
§ 31 МАРКОВСКИЕ МОМЕНТЫ 37 Далее, {т<а}П(т</) = и [({т<г}П{г<а})и({т<ОПР<а})]е^, r<t т. е. {а < т} s &~х. Аналогично устанавливается, что {а < %}^STX и {а < т}е#~а. Следовательно, {т<а}, {а<т} и {а = т} принадлежат как #"т, так и #"а. Польза введенного в § 2 понятия прогрессивно измеримого случайного процесса иллюстрируется следующим предложением. Лемма 1.8. Пусть Х = {£„ #"J, t sT,-действительный прогрессивно измеримый процесс и т = т (о) — марковский момент {относительно F = (tF()f t^T) такой, что Р(т<оо)=1. Тогда функция £т = £т ((й) (о) является £ГХ- из меримой. Доказательство. Пусть Jf — система борелевских множеств на числовой прямой R1 и t^T. Надо установить, что для всякого BeJ fc(ffi)WeB}fl{t</}Gf, Положим а = т Л t. Тогда gtEB}fl{T</} = {^EB}n[{t</}U{t = /}] = = [{EaeB}n{a<0]U[{eteB}n{T = 0]. Ясно, что {lx e B}f|{* = 0 ^#Y Если установить, что £0 —#V измеримая функция, то тогда событие {£а^В}П{<7<0 также будет принадлежать #",. Заметим теперь, что отображение со->(о), а(о)) является измеримым отображением (Q, #",) в (QX Х[0, t]9 fFtX${[0, /])), а отображение (о, s)->£s((i>) пространства (QX[0, /], ^Х^([0, *])) в (Z?1, #) также измеримо в силу прогрессивной измеримости процесса X = (lt, !Ft), <еГ. Следовательно, отображение (Q, ^) в (Z?1, Jf), задаваемое ^Оу((о), измеримо, как результат суперпозиции двух измеримых отображений. Следствие. Если X = (£„ &~t), t^T,— непрерывный справа (или слева) процесс, то 1Х &~х-измеримо. Лемма 1.9. Пусть § == § (со) — интегрируемая случайная величина (М151 < оо) и т — марковский момент относительно системы F = (АГД t е Г. Тогда на множестве (со: т = t) условное математическое ожидание M(J|#\) совпадает с M(jl^), r. е. M(J|0\)=M(J|^,) ({т = /}, Р-п. н.). Доказательство. Надо показать, что Р[{т = ЯП{М(з1^,)=*М(*|*Г,)}] = 0 или, что эквивалентно, xM(J|^t) = xM(J|^) (Р-п.н.),
38 НЕОБХОДИМЫЕ СВЕДЕНИЯ [ГЛ. Ь где % = % }— характеристическая функция множества {т = /}.. Поскольку случайная величина х является ЗГХ- и ^-измеримой (лемма 1.7), то хм (s I *\) - м их I гх) и хм (s I ^) = м (jx I rt). Покажем, что М (5x1 #\)= М (gxl ^) (Р-п. н.). Прежде всего заметим, что случайная величина M(Jxl^) является ^-измеримой. Действительно, пусть хеГиаЕЛ1. Тогда, если *<s, то, очевидно, {М ($xl ^"/Х я} П {t < s} ^ ^V Если же t>s, то множество {М(»х1^)<А}П{т<5} = (хМ(Л^)<а}П{т<5} = s{0,Q}n{T<s}s^e. Далее, согласно определению условного математического ожидания для всякого А е #"t J M(Sxl ^х)^Р = J SX^P = J S^P. 0.28) Л Л ЛП{т=0 Множество A(]{x = f}^@~t. Поэтому J ldP= J M(j|^)rfP = JxM(jl^)dP = Af\{x=t) ЛП{т=0 Л »/M(Jxl^)rfP. (1.29) л Поскольку M(Jxl^) ^-измеримо, то, в силу произвольности множества Ле#\, из (1.28), (1.29) вытекает, что M(jxl*"x)=M(jxl^)(P-n.H.). 3. Примеры. Следующая лемма дает примеры наиболее употребительных марковских моментов. Лемма 1.10. Пусть X = (£„ /еГ)-действительный процесс, непрерывный справа, F = (#",), /sf,- неубывающее семейство непрерывных справа о-алгебр, 3Tt = #~/+ и С — открытое множество в R1. Тогда моменты ac = inf{*>0: ^eC}, Tc = inf{*>0: ^eC} (первого и первого после +0) достижения множества С являются марковскими. Доказательство. Пусть D = Rl\C. Тогда в силу непрерывности справа траекторий процесса X и замкнутости множества D {со: ас>*} = {©: £,е= Д, s </}= f) & sD>'
§4] ПРОЦЕСС БРОУНОВСКОГО ДВИЖЕНИЙ 39 где г — рациональные числа. Следовательно, {oc<t}=\J{tr<=C}<=$~t. r<t В силу предположения @'t = @'t+ и леммы 1.2 отсюда вытекает, что ас — м. м. Аналогично доказывается марковость момента тс и следующая, в дальнейшем часто используемая Лемма 1.11. Пусть X = (lt), t^T — действительный непрерывный случайный процесс, &% = а{о): £s, s^t} и D — замкнутое множество в R1. Тогда момент aD = inf(^^0: ^gD) является марковским относительно системы F — (&~t)y t^T. § 4. Процесс броуновского движения 1. Определение. В классе процессов со стационарными независимыми приращениями центральную роль играет процесс броуновского движения. Дадим определение и приведем общеизвестные свойства этого процесса. Случайный процесс р = (Р*), 0^/<Г, заданный на вероятностном пространстве (Q, &", Р), называется процессом броуновского движения *), если 1) р0 = 0 (Р = п. н.); 2) р является процессом со стационарными независимыми приращениями; 3) приращения р,— ps имеют гауссовское (нормальное) распределение с М[Р,-М = 0, D[p,-p5] = a2U-5|; 4) для почти всех co^Q функции р/ = рДо) непрерывны (по t9 0<г<Г). В случае а2=1 процесс р часто называют стандартным процессом броуновского движения. Существование такого процесса на (достаточно «богатом») вероятностном пространстве устанавливается с помощью непосредственного построения. Так, пусть т^, г|2, ...—последовательность независимых гауссовских, N(0, 1), случайных величин й ф,(/), (р2(0> •••> 0<£<!7\ — произвольная полная орто- нормальная последовательность в L2[0, T]. Положим Фу(/) = — J <f>j(s)ds, y=l, 2, ... о *) Процесс броуновского движения называют также винеровеким. Мы резервируем термин «виперовскии» для процессов, определэнных несколько иначе (подробнее см. в § 2 гл. 4).
40 НЕОБХОДИМЫЕ СВЕДЕНИЯ [ГЛ. 1 Теорема 1.13. Для каждого t, 0^/<!Г, ряды сходятся Р-п. н. и определяют процесс броуновского движения на [0, Т]. Из определения легко выводятся следующие свойства (стандартного) процесса броуновского движения: Wt = 0, cov (ps, р<) = Mpsp, = min (s, t), — 00 Пусть ^ = a(ps, s^.ty Нетрудно проверить, что процесс броуновского движения является мартингалом (относительно (3~% 0<*<Г): М(М*?) = Р, (Р-п.н.), t>s, (1.30) причем Щ&-К)2\^] = *-8 (Р-п.н.), ^>s. (1.31) Как всякий процесс с независимыми приращениями, процесс броуновского движения является марковским: M[f(h+s)\vn=Ml№+s№] (р-п-н-). *>о, (1.32) для любой измеримой функции f(x) с sup| f(x) |< оо. В частности, для любого борелевского множества Bel на R1 P(P,eflUFg) = P(p,€=B|pe) (Р-п.н.), г>*. (1.33) Важное свойство процесса броуновского движения р = (р,), O^f^T, состоит в том, что он является строго марковским в следующем смысле: для всякого марковского момента т = т((о) (относительно (#"£), 0<^^Г) с Р(т(о)^Г)=1 выполнено следующее усиление соотношения (1.32): М [f (Ps+T) | ^?+] = М [/ (Ps+t) | р,] (Р-п. н.), (1.34) где 5 таково, что Р($ + т^Г)=1. Строго марковскому свойству процесса броуновского движения можно придать следующую форму: если исходный процесс р = (р/) определен для всех t^O, то для всякого марковского момента т = т(о)) (относительно (#"?)> t^O) с Р(т<оо)=1 процесс h = Р/+т — Pt
§4] ПРОЦЕСС БРОУНОВСКОГО ДВИЖЕНИЯ 41 будет также процессом броуновского движения, не зависящим от событий о-алгебры £Г\+. 2. Свойства траекторий процесса броуновского движения Р = (М> t^Q. Закон повторно го логарифма утверждает, что pflimsup-7JJkJ=r= l)=l. (1.35) I *->о/ j/2/inln/ J v ; Локальный закон повторного логарифма: pjlimsup—ДМ=- = ll = l. (1.36) | ]/2NnlnT j Гёльдеровское условие Леви: pf limsup |P1 Psl = 1 10<*-s=/i*0 f /2M"{ = 1. (1.37) Из (1.37) следует, что с вероятностью 1 траектории процесса броуновского движения удовлетворяют условию Гёльдера с любым показателем а < ]/2 (и не удовлетворяют условию Гёльдера с показателем а = ]/2; это следует из (1.36)). Из (1.35) —(1.37) выводятся следующие свойства процесса броуновского движения: с вероятностью 1 его траектории имеют сколь угодно «большие нули», недифференцируемы для всех t^O и имеют на любом сколь угодно малом интервале бесконечную вариацию. Множество 5(о))={/<1, Р*(со)=0} корней уравнения рДсо)=0 обладает следующими свойствами: Р (J не ограничено) =1; с вероятностью 1 %(($) замкнуто и не имеет изолированнных точек; P(mesj(o)) = ())= 1, где mesj(G)) — мера Лебега множества J (о). 3. Некоторые распределения, связанные с процессом броуновского движения Р = (Р,), t^O. Обозначим p(s,X,t,y)=dP"*«'y) плотность вероятности условного распределения PSt x(t, y) = == Р {р^ ^ г/1 р^ = л:}. В случае стандартного процесса (а2=1) броуновского движения плотность p(s, х, U У)=1/9 ' g-te-w-.) (L38) у 2л (t —- s)
42 НЕОБХОДИМЫЕ СВЕДЕНИЯ [ГЛ. 1 удовлетворяет уравнениям (проверяется непосредственно) dp (s, х, U у) _ 1 д2р (s, х, U у) , , Fs 2 дх2 ' ^ ' V-6*' dp (s, xt tt x) _ _1_ д2р (s, х, U У) , ^ (\ лс\\ dt ~2 ду2 ' ^ ' \1-™) Уравнения (1.39) и (1.40) называются соответственно обратным и прямым уравнениями Колмогорова. (Прямое уравнение (1.40) называют также уравнением Фоккера — Планка.) Из строго марковского свойства процесса р выводится соотношение (принцип отражения) оо Р( max h^x) = 2P(k>x) = -£=- \e~Wdy. (1.41) Обозначим t = inf{^0: $t = a} момент первого достижения процессом р уровня а^О. Этот момент является марковским моментом (лемма 1.11). Поскольку Р(т</) = Р( max ps>a), то в силу (1.41) ОО 00 Р <т <'> = -Ш \ ^ dy = Yli\ e"yV2 *У> (»-42) a a/VT отсюда находим, что плотность px(t) = ТЛ* существует и задается формулой Из (1.43) вытекает, что px(t)~ _ Г%1\ при *->оо и, следова- У 2я тельно, если а > 0, то Мт = оо. Пусть теперь T = inf{/>0: P, = a — bt}, a > 0, 0<6<оо, — момент первого достижения процессом броуновского движения прямой а — bt. Известно, что плотность px(t) = Чг^^ в этом случае определяется формулой
§51 ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 43 4. Преобразования процесса броуновского движения Р=(0,), t^O. Непосредственно проверяется, что О, / = 0, и 2До) = ^/с2(о)), с>0, являются также процессами броуновского движения. § 5. Некоторые понятия математической статистики 1. В математической статистике первичным является понятие выборочного пространства ($, s&\ состоящего из множества выборок Ж и а-алгебры его подмножеств s&. Обычно Ж— это пространство последовательностей х = (хи х2, ...), где ^ е ^, или же пространство функций x = (xt), t^O. В рассматриваемых далее задачах статистики процессов диффузионного типа выборочным пространством является пространство непрерывных функций. Пусть (U, Ж) — некоторое другое измеримое пространство. Всякое измеримое (точнее, J^/Jf-измеримое) отображение у = у(х) пространства Ж в U называют статистикой. Если выборку х = (хи хъ ...) представлять себе как результаты наблюдений (например, результаты независимых наблюдений над некоторой случайной величиной £ = £(w)), то У = у{х) — это функция от результатов наблюдений. Примеры статистик: mn(x) = - V ^ — выборочное среднее, п Sn(а:) = — \j(х( — mnf — выборочная дисперсия. i=\ 2. Одним из важнейших разделов математической статистики является теория оценивания. Приведем ряд ее понятий, используемых в этой книге. Будем предполагать, что на выборочном пространстве (Ж, s&) задано семейство ^ = {Ре, 0^в} вероятностных мер, зависящих от параметра 0, принадлежащего некоторому параметрическому множеству в. Статистика (оценка) у = у(х) называется несмещенной оценкой параметра 0^в, если Ме*/(л:) = 0 для всех 9еО (Ме обозначает усреднение по мере Ре).
44 НЕОБХОДИМЫЕ СВЕДЕНИЯ [ГЛ. 1 Статистика у = у(х) называется достаточной для 9 (или семейства &*), если для каждого Л е^ можно выбрать вариант условной вероятности PQ(A\y(x)\ не зависящий от 9. Следующая факторизационная теорема дает необходимые и достаточные условия для того, чтобы некоторая статистика у = у(х) была достаточной. Теорема 1.14. Пусть семейство ^ = {Ре> бев} домини- руется некоторой о-конечной мерой К (т. е. Р0 <С А,, 9 ев). Статистика у = у{х) будет достаточной в том и только том случае, если существует ^-измеримая (при каждом 8е6) функция g(y, 9) такая, что dP*(x)=g(y(x), Q)dk(x). Последовательность статистик уп(х), п=\, 2,..., называется состоятельной оценкой параметра Веб, если для каждого 6 ев yn(x)->Q, п->ооу по Ре-вероятности, т. е. Pe{l0«(*) —е|>в}-*0, я-* оо, е>0. Последовательность статистик уп(х), /г =1,2, ..., называется сильно состоятельной оценкой параметра 9 ев, если уп(х)->& с Р0-вероятностью единица для всех 9 ев. Пусть семейство & доминируется некоторой а-конечной мерой Я. Функция г /а\_ dPQ(x) рассматриваемая (при фиксированном л:) как функция от 9, называется функцией правдоподобия. Статистика у = у(х), обращающая функцию правдоподобия LX(Q) в максимум, называется оценкой максимального правдоподобия. Для сравнения различных оценок у = у(х) неизвестного параметра 9 ев вводят (неотрицательные) функции потерь W(Q, у) и средние потери R(Q,y) = MQW(Q,y(x)). (1.45) В тех случаях, когда Эе/?1, г/е/?1, наиболее употребительной функцией потерь является функция W(Q, у) = \Ъ-у\\ (1.46) При исследовании качества оценок параметра 9 = (01э..., 9&)е е Rk важную роль играет1 информационная матрица Фишера /(в) = ||/„(8)11, где У^е = Ме{ж1п^(^}{ж1п^/^}- 0-47>
§5] ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 45 В одномерном случае (9 е R1) величина /(e) = M9{-^ln-^w}2 (1.48) называется информационным количеством Фишера. Для несмещенных оценок у = у(х) параметра BeBc/j1 справедливо (при некоторых условиях регулярности; см. [128], [138]) неравенство Рао — Крамера Щ[В-у(х)Г>7щ9 8g9. (1.49) В многомерном случае (9^6^/?*, у <= Rk) неравенство (1.49) заменяется матричным неравенством Рао — Крамера *) М0[е - jK*)1 [в-у (*)]•>/"'(8), Оев. (1.50) (Подробнее см. [128], [138], а также § 8 гл. 7.) Несмещенная оценка y(x)^Rk параметра 8е^ называется эффективной, если для всех значений 9е0 MB[Q-y(x)][Q-y(x)Y = rl(Q), т. е. если в неравенстве Рао —Крамера на самом деле достигается равенство. 3. Предположим, что сам параметр 9 ев является случайной величиной с распределением я = я(^9). Тогда наряду со средними потерями /?(9, у) можно рассмотреть полные средние потери /? (я, #)-=]* Л (в, y)n(dQ). в Статистика у* = у*(х) называется байесовской относительно априорного распределения я, если /?(я, y*)^R(ny у) для любой другой статистики у = у{х). Статистика у = у{х) называется минимаксной, если max/? (9, #Xinf max/? (9, у). е у е *) Для симметрических неотрицательно определенных матриц А и В неравенство А^ В означает, что матрица А — В является неотрицательно определенной.
ГЛАВА 2 МАРТИНГАЛЫ И ПОЛУМАРТИНГАЛЫ, ДИСКРЕТНОЕ ВРЕМЯ § 1. Полумартингалы на конечном временном интервале 1. Пусть (Q, &~, Р) — вероятностное пространство, ^ s ЗГ2 ^ ... ^ SF'ы ^&~ — неубывающее семейство а-подалгебр #". Определение 1. Последовательность Х = (хпу &~п)у п = = 1, ..., N, называется соответственно супермартингалом или субмартингалом, если М| хп |< оо, п= 1, ..., Af, и M(jU^m)<xm (Р-п. н.), я>т, (2.1) или Щхп\Рт)>*т (Р-п. н.), л>т. (2.2) Супермартингалы и субмартингалы называют также ясш/- мартингалами. Если X = (a-„, Уя) — супермартингал, то Y = (—xni STn) является субмартингалом. Следовательно, для изучения свойств полумартингалов достаточно исследовать лишь супермартнн- галы (или субмартингалы — в зависимости от удобства). Очевидно, что последовательность Х = (хп, #"я), одновременно являющаяся супермартингалом и субмартингалом, образует мартингал: M{xn\&-m) = xm (Р-п. н.), я>т. (2.3) Для супермартингала математические ожидания Мхп не возрастают: Мхп ^Мхт, п^т. Для мартингала математическое ожидание есть константа: Mxrt = M;ri, n^N. 2. Пример 1. Пусть J = 5 (со)—случайная величина с М| J |< оо и хп = ЬА(Ъ\&яп). Последовательность (хп, &~п) образует мартингал. Пример 2. Пусть r\i9 ц2> • • • — последовательность интегри* руемых независимых случайных величин с Мл/ = 0, /= 1, 2, ..., Sn = Ц\ + • • • + *Ь> &~п = о {со: r)i> • • • > П/г)« Тогда S = (sn, Tn) образует мартингал.
§ 1] ПОЛУМАРТИНГАЛЫ (КОНЕЧНОЕ ВРЕМЯ) 47 Пример 3. Если Х = (хп, &~п) и Y = (yn, #"„) —два супермартингала, то последовательность г = (хпЛ уп, @~п) образует супермартингал. Пример 4. Если Х = (хп, @~п) — мартингал и f(x) — функция, выпуклая книзу, такая, что М|/(х)|<оо, то последовательность F = {f(xn), &~n) образует субмартингал. Это следует непосредственно из неравенства Иенсена. В частности, последовательности F = (\хп Г, &*п), а > 1, F = (| хп | log+1 хп |, 3~п), где log+a = max(0, log а), образуют субмартингалы. 3. Перейдем к формулировкам и доказательствам основных фактов о полумартингалах. Теорема 2.1 Пусть X = (хп, &~п), п= 1, ..., N, — супер- мартингал. Тогда для любых двух марковских (относительно F = (@~n), /2=1, ..., N) моментов % и о таких, что P(x^.N) = = Р(а<Л0=1, х0>М(хх\Г0) ({т>а}, Р-п. н.) (2.4) или, что эквивалентно, ххАо>М(хх\&'о) (Р-п. н.). (2.5) Доказательство. Прежде всего заметим, что М | хх |< оо. Действительно, N N N MUT| = 5] J l*xlrfP = S J 1*»1<*Р<]£М|х„|<оо. п=\ {т=/г} п=\ {х=п} п=\ Рассмотрим множество {а = п} и покажем, что на множестве {сг = п} П {т > а} = {а = п) П {т > /г} выполнено неравенство (2.4). На этом множестве ха = хп, и согласно лемме 1.9 М(хх\&~0) = М(хх\$~п) ({а = п}, Р = п.н.). Так что достаточно установить, что на {о = п}[){т^п} Р-п. н. *П>М(*Т|0-Я). Пусть А<^3~п. Тогда J (хЛ-хт)<*Р = J* (*«-*T)dP + Л П {а=/г} П {О /г} Af] {o=n} О {т=/г} + J (*„-jgdP= J (*я-*т)<*р> ЛП{а=/г}П{т>/г} А[][о=п}(]{х> п) > J* (^+1-xT)dP, (2.6) ЛП{а=А7.}П{т>/г+1} где последнее неравенство выполнено в силу того, что хп^ ^ М (хп+1 \Рп) (Р-п. н.) и множество А (] {а = п) П {т > п) <= #V
48 МАРТИНГАЛЫ [ГЛ. 2 Продолжая неравенства (2.6), находим А(]{о=п}(\{Х>п} А[){о=п}(){х>п+\} ...> J (%-*T)dP = 0. (2.7) ЛП{о=«}П{т-Л/} Л/ Поскольку Q\(J{a = tt} есть множество меры нуль, то n=i из (2.7) следует (2.4). Следствие 1. Пусть X = (*Л, #"Д /г = 1, ..., N,— супер- мартингал. Если Р(т^а)=1, то Mxi ^ Мл:а^ Мхх^ MxN. Следствие 2. Я*/сг& Х = (хп, Ф~п), лг = 1, ..., N,—субмартингал. Если Р(т^а)=1, то М*! ^ Мл:а<! М*т< MxN. Следствие 3. Пусть X = (хп, @~п)> п = 1, ..., N, — супермартингал. Тогда, если х —- марковский момент и P(t^jV)=1, то М I хх К Мл:. + 2Мх- < 3 sup M I хп I. В самом деле, |jtT| = хх + 2л:~ и, по следствию 1, М|хт| = = Мхх + 2М*7 < Мх{ + 2Млгг. Поскольку (хп Л О, #"„), лг = 1, ... ..., N,— супермартингал (пример 3), то последовательность (jc", f я), где х~ = — хпА0, образует субмартингал и, по следствию 2, Мл:~ <! Мл:~. Значит, М | *т | < M*j + 2М*7 < Мх{ + 2М*~ < Mjc, + 2М | % | < <3 sup M| хп\. Просматривая доказательство теоремы 2.1, замечаем, что если Х = (хп, &~п)< /2=1, ..., N, является мартингалом, то в (2.6), (2.7) неравенства превращаются в равенства. Следовательно, справедлива Теорема 2.2. Пусть X = (хп, @"п), п = 1, ..., N, — мартингал. Тогда для любых двух марковских моментов х и а таких, что Р(т<Л0 = Р(а<Л0=1, хо=М(хх\0-о) в({т>а}, Р-п. н.) (2.8) или, что эквивалентно, х0а т = ЬЛ(хх |#"0) (Р_п- н-)- Следствие 1. £сли Р(т<а)==1, го М*1=Мл:а=Мл:т=М%. 4. Теорема 2.3. Яг/сгб X == (хп, !Гп), п=\, ..., N, — субмартингал. Тогда для всякого X > О Р{тахх„>Я}<4- J *,«*Р<ХМ**« <2-9> n<iV f max х„>Ц [n^N n } P{minx„< — Я}< — М^+ f %dP. (2.10) n<N l .r.in *„<-М
§ 1] ПОЛУМАРТИНГАЛЫ (КОНЕЧНОЕ ВРЕМЯ) 49 Доказательство. Введем марковский момент т = ==min{Ai<jV: xn^zX}, полагая % = N> если max xn < Я. Тогда по следствию 2 теоремы 2.1 M%>Mxt= J Мр + j* *tdP> f max x„ > M f max * < Я1 U<tf * J U<iV n ) >X J* dP+ j* %rfP. f max x„ > Al f max x„ < Al U<JV n J U<iV n J Отсюда получаем ЯР {max *„>Я}< MxN— Г xNdP = f max x„ < M [n^N П ) = J VP< j *+dP<M*+, f max #„ > Я"! f max #„ > K\ [n^N n } [n^N n J что и доказывает (2.9). Аналогично доказывается и (2.10). Нужно лишь положить т = min{/i<! N: *„<!— Я} с x = N, если min л:Л > — Я. Следствие (неравенство Колмогорова). Пусть X = {xni STn\ лг == 1, ..., Ny — квадратично интегрируемый мартингал (т. е. мартингал с Мх2п < оо, п= 1, ..., N). Тогда последовательность х\у @~п) будет субмартингалом (пример 4) и в силу (2.9) вы- полнено неравенство P{max|jc„|>^}<-3^-. (2.11) n<N № Теорема 2.4. Пусть X = (хп, ёГп\ лг == 1, ..., N, — неотрицательный субмартингал. Пусть lAxpN < оо (1 < р < оо). Тогда M[maxxJp <oo и м< N Щ™УпГ <(j&r)P М*Ъ- (2-12) Доказательство. Обозначим у = шгххп и F{X) = = Р{*/>Я}. Тогда в силу (2.9) Я/?(Я)< J xNdP. (2.13) Для вывода неравенства (2.12) оценим сначала M(yAL)p, где L>0.
50 МАРТИНГАЛЫ [ГЛ. 2 Используя (2.13) находим, что L L M(y/\LY = -\xpF (dX) = ^F(X)d (Хр) - [XPF (Я)]* < 0 0 L L (* /* i / о о М = \xN Q ГУ AL f d(W) -0 dP = J^TM[xN(yALri]. Согласно неравенству Гёльдера lq= _^ j M [*„(*/ Л 1ГJ] <[M^]1/P M [(*/ Л I)*'"1**]1''» = [М^[М(уЛ1)р],/д. Итак, и, поскольку М (у Л L)p < Lp < оо, MQ/AL)P<^M*£. (2.14) По теореме 1.1 Мур = lim M(r/AL)P. Поэтому из (2.14) сле- дует требуемая оценка: Myp^qpMxpN< оо. Следствие. Пусть X = (хп) &~п), п=\, ..., N, —квадратично интегрируемый мартингал. Тогда Mfmax *;;]<! 4Мл:^. 5. При исследовании асимптотических свойств полумартингалов X = (хп> £Гп), лг = 1, 2, ..., важную роль играют неравенства Дуба о числе пересечений интервала (а, Ь) (см. далее — теорема 2.5). Для формулировки этих неравенств введем необходимые определения. Пусть Х = {хП9 @~п), п=1, ..., N, — субмартингал и (а, &) — непустой интервал. Введем понятие «числа пересечений снизу
§ 1] ПОЛУМАРТИНГАЛЫ (КОНЕЧНОЕ ВРЕМЯ) 51 вверх интервала (а, Ь) субмартингалом X». С этой целью обозначим: т0 = 0, х\ = min {0 < п < N: хп < а}, т2 = min {t! < п <! ДО: *„ ^ Ь), %2т-\ = min {t2m_2 < я < ДО: xn < а}, т2т = min{T2m-i <я< ДО: x„ >&}, При этом, если inf xn > а, то t! полагается равным ДО, а мо- менты т2, т3, ... не определяются. Соответствующие замечания относятся и к последующим моментам. Определение 2. Числом р==р(а, 6) пересечений снизу вверх интервала (а, 6) называется то максимальное т, для которого момент т2т определен. Теорема 2.5. £сли Я = (*п, #"„), я=1, ..., N, —субмартингал, mo МИа, Ь)< \»_а1 <—ьhr1- (2Л5) Доказательство. Поскольку число пересечений интервала (a, b) субмартингалом Х = (хП9 ff~n), n^.N, совпадает с числом пересечений интервала (0, b — а) неотрицательным субмартингалом Х+ =((хп — a)+, &"n\ n^N, то можно считать, что исходный субмартингал неотрицательный и а = 0. Итак, надо показать, что для b > О МР(0,6) = -^. (2.16) Положим x0 = 0, и пусть для /=1, ... если tw</^Tm+i Для некоторого нечетного ш9 *"1П если тт</<тт+1 для некоторого четного пг. Тогда Р-п. н. W(0, ft)< 2 х, [*,-*-,] Ь = 1} = U 1{тт < 0 \ {хт+, < /}]. т нечетно
52 МАРТИНГАЛЫ [ГЛ. 2 Поэтому N N 6MP(0,ft)<MSxi[^i-^-il-S J {xi-xi_{)dP = -2 J M(^-^-il^.,)rfP=S J [M(^|^-iH^-ilrfP< <2Лм<*'|^-*)-*'-^р=м**- Теорема доказана. Замечание. По аналогии с р(а, &) можно определить и число пересечений а (а, Ь) интервала (а, 6) сверху вниз. Для Ма(а, 6) тем же методом, что и при выводе (2.15), можно получить следующую оценку: М«(а. &)< 7-« < [;_а' 'J. (2.17) § 2. Полумартингалы на бесконечном временном интервале. Теорема сходимости В этом параграфе будет предполагаться, что полумартингалы Х = (хп, @"п) определены для м=1, 2, Теорема 2.6. Пусть X = (хП9 @~п), п < оо, — субмартингал такой, что supMx+< оо. (2.18) п Тогда с вероятностью 1 существует lim х (=*хЛ и Мх+ < оо. П /00 Доказательство. Пусть x* = limsupA:n, л:^ = lim inf л:л. п п Предположим, что Р {*•>*,}>(>. (2.19) Тогда, поскольку {х* > xj = (J {x* > & > а > *J (а, Ь — рацио- а<Ь нальные числа), то найдутся такие а и 6, что P{x*>&>a>xj>0. (2.20) Пусть р#(а, 6) — число пересечений интервала (а, 6) субмартингалом (хп% &"п), п<Л/г, и Роо(а, 6) = lim р^ (а, &). Тогда согласно (2.15)
§ 3] РЕГУЛЯРНЫЕ МАРТИНГАЛЫ. ТЕОРЕМА ЛЕВИ 53 и в силу (2.18) supMxJ + \a\ МРоо(а, Ь) = lim Мр„ (а, Ь) < N < оо . N о — а Это, однако, противоречит предположению (2.20), из которого вытекает, что с положительной вероятностью Р00(а, 6) = оо. Итак, Р (х* = *,) = 1, и, следовательно, lim xn существует п с вероятностью 1. Этот , предел будем в дальнейшем обозначать л:^. Заметим, что в силу леммы Фату Mx+^sup Мл:+. п Следствие 1. Если X = (xn,fFn)9 n^U —отрицательный субмартингал (или положительный супермартингал), то с вероятностью 1 существует lim xn. п Следствие 2. Пусть X = (хп> 3~п), п> 1, — отрицательный субмартингал (или_ положительный супер мартингал). Тогда последовательность Х = (хП) &~п\ лг = 1, 2, ..., оо, с x00 = \imxn п и &~oo = G[\J @~п) образует отрицательный субмартингал (по- ложительный супермартингал). Действительно, если Х = (хп,&~п), лг = 1, 2,..., — отрицательный субмартингал, то по лемме Фату М^оо = М lim хп > lim Мхп > Mx{ > — оо п п И Щх„\Рт)=М(Птхп\Рпд>1ТтМ(хп\Рт)>хт (Р-п. н.). п п Следствие 3. Если Х=(хПУ &~п)у я^1,—мартингал, то (2.18) эквивалентно условию sup Ml лсл|< оо. (2.21) п В самом деле, М I х„ |=Мл:++Мл:-==2Мл:+--Мл:„:=2Мл:+--Мл:1. | ТЬ | ТЬ П ТЬ ТЬ ТЬ 1 Поэтому sup М I хп I = 2 sup Мх+ — Мх{. п п § 3. Регулярные мартингалы. Теорема Леви 1. Обобщение теорем 2.1 и 2.2 на случай счетного времени требует некоторых дополнительных предложений о структуре мартингалов и полумартингалов. Важным для дальнейшего является Определение 3. Мартингал Х = (хп, STn\ n^\, называется регулярным, если существует такая интегрируемая случайная величина tj = t]((d), что хп=М(ц\$-п) (Р-п. н.), п>1.
54 МАРТИНГАЛЫ [ГЛ. 2 Заметим, что в случае конечного времени, 1 ^ #<!;¥, всякий мартингал является регулярным, поскольку хп = М (xN | !Гп)у Теорема 2.7. Следующие условия на мартингал Х=(хп> @~п)у n^U эквивалентны: (A) регулярность, т. е. возможность представления в виде хп = Щг\\9'п) (Р-п. н.) с М|л1<оо; (B) равномерная интегрируемость величин х{, х2, ...; (C) сходимость последовательности х{, х2, ... в О: lim Mix,, —*J = 0; п (D) sup М| *„ |< оо и величина х00 = \\тхп такова, что хп = п п — МС**, \&~п) (Р-п. н.)> г. е. последовательность Х = (ху 3~п), I^az^oo, образует мартингал. Доказательство. (А)=Ф(В). Надо показать, что величины *п = М(л |#~„), п^\у равномерно интегрируемы. Имеем U„|<M(|t|||0"«), М|*я|<М|т|1, supMUJ<M|ri|<oo. п Отсюда для с > О, Ъ > О получаем J l*JdP< J \r\\dP = {\*n\>c) {\xn\>c} = J 1л1^р+ J* h|dP< { I *„ I > с] П {| ЛI > b) {\xn\>c}f]{\y\\<b} <lP{\Xn\>c}+ J \4\dP^jM\xn\+ j |T||dP. {И1>&} {|t||>W Следовательно, sup J \xn\dP<jM\ri\+ J h|dP, " {K|>c> {\r\\>b} lim sup f |JC„|dP< J | лМР. c*°° * (Ы>'} <inl>« Ho & > 0 произвольно, поэтому lim sup Г 1 a:^ | rfP = 0, что и доказывает утверждение (В). (В)=Ф(С). Поскольку хп=М(ц \&~п) равномерно интегрируемы, то, во-первых, sup M | хп | < оо и, следовательно, lim хп(=^х00) п п существует (следствие 3 теоремы 2.6) и, во-вторых, согласно
§31 РЕГУЛЯРНЫЕ МАРТИНГАЛЫ. ТЕОРЕМА ЛЕВИ 55 следствию теоремы 1.3 М| хп — л:^ |->0, п->оо, т. е. последовательность хи хъ ... сходится (к л:^) в L1. (C)#(D). Если последовательность случайных величин хи хъ ... сходится в L1 (скажем, к случайной величине у), то sup М| *Л |< °о. Тогда на основании следствия 3 теоремы 2.6 п существует \in\xn(=x00)f и, значит, М| хп — у |->0, Хп-^х^ п (Р-п. н.), п->оо. Поэтому у=х00(Р-п. н.). Следовательно, Хп-^х^ т. е. ЪЛ\хп — xoo\-^0f п-+оо, и M(xJ5^)—>M(xJ#"w), если т^п-+оо. Но М(л:/г|^"т) = л:т(Р-п. н.), и, значит, xm = (xJ9*m) (Р-п. н.). (D)=#(A). Обозначая у\ = хоо9 сразу получаем утверждение (А). Из доказанной теоремы вытекает, что за определение регулярного мартингала можно принять также любое из свойств (В), (С), (D). 2. В качестве следствия теорем 2.6 и 2.7 выведем следующий полезный результат (П. Леви), упоминавшийся в § 1 гл. 1. Теорема 2.8. Пусть г\ = ц (о)—интегрируемая (М| ц\ < оо) случайная величина и &~х s #"2 ^ • • • — неубывающее семейство а-подалгебр Т. Тогда при п->оо Р-п. н. M(nl^n)^M(ri!^J, (2.22) Доказательство. Обозначим хп = М (л |#"п). Последовательность X = {xniSTn\ n^X, образует регулярный мартингал. Согласно теореме 2.6 существует lim *л(=«0> и по лемме Фату М| хж |< М| ц |. Далее, если А^Ф"п и т>я, то j xmdP= \ xndP= J* M(r]|^n)dP= JridP. A A A A По теореме 2.7 последовательность {xm,m^l} равномерно интегрируема. Поэтому М%А\ хт— х^ |->0, га->оо, и, значит, /*оо^Р= /л^Р- (2.23) А А Равенство (2.23) выполнено для любого А е #"п и, следова- 00 тельно, для любого множества А из алгебры (J #"„. Левая и правые части в (2.23) представляют ст-аддитивные меры (быть может, принимающие и отрицательные значения, но конечные),
56 МАРТИНГАЛЫ [ГЛ. 2 совпадающие на алгебре (J &~п. Поэтому в силу единствен- м = 1 ности продолжения а-аддитивной конечной меры с алгебры (J @~п на наименьшую а-алгебру ^"00 = а( (J #"п], ее содержа- щую, равенство (2.23) остается верным и для Ле^^ Итак, J ^оо ^Р = $4dP= jfA(r\\rjdP9 А<=о(()<Гп). Л /I Л \/1 = | / Но л:^ и M^l^"^) являются ^"^-измеримыми, следовательно, *o.= M(4|^J(P-n.H.). Замечание. Приведем пример мартингала, не являющегося регулярным. Пусть *Л = exp|Sn —-^/z], где Sn = y{ + ... + уП9 yt~N(0, 1) и независимы, а #"п = а{ю: {уь ..., #п}. Тогда -У = (jcn, #"я), n^lj —мартингал и в силу усиленного закона больших чисел х^ = lim *я = lim ехр | п [-^ — -1] } = 0 (Р-п. н.). Следовательно, хп ф Ы(хж \Уп) = 0 (Р-п. н.). 3. На регулярные мартингалы распространяется результат теоремы 2.2. Теорема 2.9. Пусть Х = (хп,@гп), п^\, —регулярный мартингал и т, а — марковские моменты с Р(т^а)=1. Тогда х0=М(хх\^0). (2.24) Доказательство. Отметим вначале, что поскольку мартингал X регулярный, то существует Нтхп и в (2.24) под х^ п понимается именно значение lim дгЛ. Далее, для того чтобы п М(хт |#"а) было определено, надо еще показать, что М| хх\< оо. Но хп=М(ц\@'п) и хх = М{ц\&гх) (поскольку на множествах {х = п} хх = хп по определению, а М(г)1 @'х)=== М (г|I !Рп) в силу леммы 1.9). Поэтому М| *т К М| г) I- Для доказательства (2.24) осталось лишь заметить, что поскольку #~тз#~а, то М(д:т|^а)=М(М(л1^)|^а)=М(л1*"а) = ^ (Р-П. H.). Следствие. Если X = (хп, ЗГп)у п^\, —регулярный мар^ тингал, то для любого марковского момента а Xo=M(xoo\$~Q).
§ 4] СОХРАНЕНИЕ СУПЕРМАРТИНГАЛЬНОГО СВОЙСТВА 57 Замечание. Для равномерно интегрируемого мартингала X = (хпу &~п)> п^\> свойство (2.24) остается выполненным и без предположения, что Р(т^а)=1. А именно, х0 = М {хх |£Г0) ({т^а}, Р-п. н.), т. е. х0АХ=М(хх\&~0) (Р-п. н.). (2.25) § 4. Сохранение супермартингального свойства для марковских моментов. Разложения Рисса и Дуба 1. Обратимся к аналогам теоремы 2.1 для полумартингалов. Теорема 2.10. Пусть Х = {хюЗгп), я>1, — супермартингал, мажорирующий некоторый регулярный мартингал, т. е. пусть для некоторой случайной величины ц с М | ц | < оо хп>М{ц\&-п), п>\ (Р-п. н.). (2.26) Тогда, если Р(а<т < оо}= 1, то ха>М(хх\&-0) (Р-п. н.). (2.27) Замечание. Отметим, что утверждение теоремы остается в силе и без предположения, что Р(т < оо)= 1. Соответствующее обобщение, опирающееся на приводимое далее разложение Рисса, будет дано в теореме 2.12. Доказательство теоремы 2.10. Поскольку хп = ^М(ц\^п) + [хп-М(ц\^п)] и ($„, <Г„), 1п = хп-М(ч\$~п), п^\, —неотрицательный супермартингал, то, принимая во внимание теорему 2.9, видим, что (2.27) достаточно доказать лишь для случая, когда хп^0 (Р-п. н.). Покажем, что Мхт<оо. Для этого положим %k = %/\k. Тогда Мхх ^Мл^ (следствие 1 теоремы 2.1), и поскольку Р(т < оо)= 1, то ^ = ^-Х{т<оо} = Нгп[^.Х{т<оо}]. Поэтому по лемме Фату Мхт<Ит М*т =Мл:1<оо. k k Рассмотрим теперь моменты тй-тЛ^, ek = o Л k. Для них согласно теореме 2.1 x0k ?> M [xXk | !Г0к) и, следовательно, если А е#"а, то J x0kdP> J xXkdP, поскольку ЛП{а<й}е @~0
58 мартингалы trji. 2 Событие {а<&}^{т <&}, a xn^0 (Р-п. н.). Значит, J xakdP> J x4dP. (2.28) Но x0k = xa на множестве {а<!&} и xXk = xx на {т^!&}. Отсюда и из (2.28) находим J* x0dP^ J xxdP. (2.29) Полагая в (2.29) &->оо, получаем J xadP> J* xTdP, ЛП(а<оо} ЛЛ{т<оо} поскольку Р(а < оо) = Р(т < оо)= 1. Теорема доказана. 2. Для доказательства аналога теоремы 2.10 без предложения конечности моментов т и а будет использовано так называемое разложение Рисса для супермартингалов. Определение 4. Неотрицательный супермартингал П = = (я/г, @~п), п^1, называется потенциалом, если Мяп->0, я->оо. Заметим, что поскольку для потенциала sup Мяп^ Мп{ < оо, п то существует Нтяп(=я00) и Мяоо<Пт Мяп = 0, откуда сле- п п дует, что яоо = 0 (Р-п. н.). Теорема 2.11 (разложение Рисса). Если супермартингал Х = (хп,&~п)> /2^1, мажорирует некоторый суб мартингал У = {Упу @"п)> п^\, то найдутся мартингал М = (тп, !Гп)9 п^\у и потенциал П = (я/г, £ГД n^l, такие, что для каждого п хп = тп + лп. (2.30) Разложение (2.30) единственно (с точностью до стохастической эквивалентности). Доказательство. Положим для каждого п^\ ^,Р = М(л:/г+р|5г/г), р = 0, 1,... Тогда хп% р+1 = М (*„+p+i \Гп)< М (хп+р\ 9~п) = хП9 р, т. е. для каждого п^\ последовательность {хп%р> р = 0, 1, . ♦.} является невозрастающей. Поскольку, кроме того» Хп.р=М{хп+р\9'п)^М(уп+р\9тп)>Уп>
§ 4] СОХРАНЕНИЕ СУПЕРМАРТИНГАЛЬНОГО СВОЙСТВА 59 то существует lim xntP(=mn) и хп^тп^уп (Р-п. н.). Значит, р->оо МI тп | < оо и M(mn+i|^/i)=M(lim xn+], p\Tn)= lim М(хп+\, р\Уп) — р->оо р-»оо = lim М{хп+\+р\&'п)= Пт М(хп> р+,|^п) = р-»оо р-»оо = М (lim хп, р+| | 0"„) = М (т„ | Ря) = /»„. Итак, М = (тп, !Гп), я>1, —мартингал. Положим теперь пп = хп — т„. Поскольку xrt ^ т„, то я„ ^ 0. Ясно также, что П = (я„, #"„), я>1, — супермартингал. Осталось, следовательно, показать, что ПтМягг = 0. п Согласно определению тп> я^1, Р-п. н. М (яя+р I 5^п) = М [хп+р — тп+р | 5^] = ==М[хп+р \Тп] — тп = хп,р — тп I 0, р->оо. Поэтому по теореме 1.3 lim Мяп+Р = lim Г я„+р dP = lim f M (яЛ+р |#~„) dP = 0. Установим теперь единственность разложения (2.30). Пусть #п = w„ + я„— другое разложение того же типа. Тогда М [хп+р\&~п] = М [тп+р\ Рп] + М [лп+р\ Тп] = тп + М[пп+Р\ Рп]. Но при р->оо Р-п. н. М [хп+р \Гп]^тПУ М [лп+р | Тп] -> 0. Поэтому тп = тПУ а лп = пп (Р-п. н.) для всех п^\. 3. Применим разложение Рисса для доказательства следующего предложения, обобщающего теорему 2.10. Теорема 2.12. Пусть Х = (хп, !Гп)у п^\у — супер мартингал, мажорирующий некоторый регулярный мартингал {хп^ ^М(г\\Уп) для некоторой случайной величины ц с М | г| | <С оо, м^1, Р-п. н.). Тогда, если Р(т^а)=1, то Р-п. н. х0>М(хх\<Г0). (2.31) Доказательство. Представим хпв виде хп= М(ц\ #"п) + 8п> где 1п = хп—М{г\\Тп). Супермартингал Z = (inf&mn), /i>l, согласно теореме Рисса допускает разложение %п = пгп + яп-. Заметим, что в качестве mrt можно взять M^l^), где joo = limj„, а я„ взять равным Jn — М (J J #"п). Поэтому хп =
60 МАРТИНГАЛЫ [ГЛ. 2 Мартингал (М On + ScJI ^n)* я>1, регулярен, и к нему применима теорема 2.9. Поэтому достаточно лишь установить, что яд>М(ят|#~а). Как показано в теореме 2.10, для всякого Ле^0 j* n0dP> j* 7txdP. i4f|{a<oo} ЛП{т<оо} Учитывая теперь, что ^ = 0 (Р-п. н.), получаем [jtadP> J jtTdP. А А Вместе с теоремой 2.9 это неравенство доказывает (2.31). 4. Определение 5. Случайный процесс Ап9 лг = 0, 1, ..., заданный на вероятностном пространстве (Q, #", Р) с выделенным на нем неубывающим семейством а-алгебр ^s^s ... ... ^ #Y называется возрастающим, если 1) 0 = Л0<Л,< ... (Р-п. н.), и натуральным у если 2) An+i ^„-измеримы, лг = 0, 1, ... Теорема 2.13 (разложение Дуба). Всякий супермартингал*) Х~(хп> &~п)> п^Оу допускает единственное (с точностью до стохастической эквивалентности) разложение хп = тп — АПу я>0, (2.32) где М = (тПу ИГп)у п ^ 0, — мартингал, а Ап, /г ^ 0, — натуральный возрастающий процесс. Доказательство. Одно из разложений типа (2.32) получается, если положить А0 = 0у Ап+[-Ап=хп-М(хп+1\!Гп). (2,33) Пусть теперь есть еще одно разложение: хп = т'п — А'п, п^0. Тогда К+1 -К=«+. - О + К - *„+,)• (2-34) Отсюда, учитывая, что Ап и Ап+\ ^-измеримы, находим (беря в (2.34) условное математическое ожидание М( •!#"„)) А'п+i — Ап = хп—М(xn+i \3~п) = An+i — Ап. Но Ло = Л0 = 0, поэтому А'п = Апу т/п = тпу я>0 (Р-п. н.). *) Здесь удобнее (имея в виду последующие применения к случаю непрерывного времени) рассматривать супермартингалы, определенные для /г^0 (а не для /г^1, как было ранее).
§ 4] СОХРАНЕНИЕ СУПЕРМАРТИНГАЛЬНОГО СВОЙСТВА 61 Следствие 1. Если И = (пПУ @~п), п^О, —потенциал, то существует натуральный возрастающий процесс Ап, лг = О, 1, ..., такой, что nn = M(AJ$-n)-An, где A00 = \imAn. Действительно, согласно теореме лп = шп — Апу где {тп, !Гп) — некоторый мартингал. Покажем, что m„ = M (Л^! #"„). Имеем 0^Ап = шп — ял<т„ и 0<Лп<Лоо, где MA00 = limMArl = п = lim[Mm0 — Мя„] = Мт0 < оо. Поэтому последовательность Л0, п А{, ... равномерно интегрируема. Величины я0, щ, ... также равномерно интегрируемы, поскольку яп>0и Мпп->0, п-+оо. Отсюда вытекает, что такова же и последовательность т0, т{, ... Из теоремы 2.7 получаем, что существует т00 = \\ттп, п причем тп = М(т00\&~п)- Обозначим яоо = Нтя/г. Тогда 71^ = = Нт [тп — Ап] = т00 — А^. Но я^ = О (Р-п. н.), поэтому т^ = А^ п (Р-п. н.). Значит, ^n = mn — An=U(mjrn) — An = mAJ9rn) — An. Следствие. 2. Если супермартингал X = (хп, (Fn), п^О, мажорирует некоторый субмартингал Y = (уп, !Гп), п^О, то существует натуральный возрастающий процесс Ап,' п^О, и мартингал (пгп, !Гп), п^О, такие, что xn = mn+M(AJ9~n)-An, n>0 (Р-п. н.). (2.35) Доказательство сразу следует из разложения Рисса (2.30) и предыдущего следствия. 5. Натуральный процесс Ап, п = 0, 1, ..., по определению является ^„..ризмеримым (а не только ^"„-измеримым) при каждом /2^1. Этому допущению можно придать несколько иную, но эквивалентную формулировку, оказывающуюся более удобной в случае непрерывного времени (см. § 3 в гл. 3). А именно, пусть 0 = Лэ< А{ <, ..., где случайные величины Ап ^-измеримы и МЛ^ < оо. Теорема 2.14. Для того чтобы Ап были &'п-[-измеримыми, п^\, необходимо и достаточно, чтобы для каждого ограниченного мартингала Y = (уп, 9~п), п = 0, 1, ..., М 2 Уп-i (Ап - Л„_.) = Му^, (2.36) гдв Уоо = 11ГП Уп- п
62 МАРТИНГАЛЫ [ГЛ. 2 Доказательство. Необходимость. Пусть Ап &~п-х-т- меримы, МЛ00<сх>. Тогда, поскольку МупАп^Муп-iAn, п>19 (2.37) то М 2 Уп-ЛАп— Ап-\)= lim M 2 Уп-\(Ап—Ап-х)=* n—l N-+oo я=*1 N = lim 2 [MynAn—Myn-iAn-i\*= Hm MjjHjv = М^Л^. Достаточность. Пусть выполнено (2.36). Тогда MS Ая[уя^-уп]-0 (2.38) для любого ограниченного мартингала Y = (уп, &~п), п^О. Воспользуемся теперь тем фактом, что если У = (уП9&~п), п^Оу —мартингал, то «остановленная» последовательность (^лт^)' я^О, также будет мартингалом для любого марковского момента т (см. далее теорему 2.15). Беря т=1 и применяя (2.38) к мартингалу (ynAV&~n)> получим, что МЛ,(0О-У1) = О. (2.39) Аналогичные рассуждения с т = 2, т==3, и т. д. приводят к тому, что если справедливо (2.38), то тогда имеют место равенства (2.37) для любого ограниченного мартингала К = = (Уп,$~п)> ">0. Из (2.37) следует, что МЬУп-Уп-гЦАп-МШРп-^О. (2.40) Положим уп+т = Уп> т>0, yn = sign[An-M(An\^n^)]y yk = M(yn\Pk), k<n. Тогда из (2.40) находим 0 = M{sign[An-M(An\rn^)]^yn^}{An-M(An\rn^)} = = M{sign[An-M(An\Fn-[)]}{An-M(An\Fn-l)} = = M\An-M(An\Fn_l)\, откуда An=M(An\&~n-i) (Р-п. н.), т. е. Ап ^„-^измеримы. в. Теорема 2Л5. Пусть Х = (хП) &~п\ /г>1, — мартингал (полумартингал) и т = т(со) — м. м. относительно системы {STn)t п^\. Тогда «остановленная» последовательность (^дт, ^"я), /г^1, также является мартингалом (полумартингалом).
§ 4] СОХРАНЕНИЕ СУПЕРМАРТИНГАЛЬНОГО СВОЙСТВА 63 Доказательство. Достаточно доказать теорему для случая, когда X является супермартингалом. Из равенства Хх Ап== 2j ХтХ{х==т) + -хпХ[Х > п) следует, что величины хх/\п ^-измеримы,- интегрируемы при любом п= 1,2,... ихтл(п+1Г^ = х{т>„}(4+г4 Поэтому М Кл(»+1) - Х^п | Рп] = *{т > п)М {*„+, - *п I *"п} < °> откуда очевидным образом получаем утверждение теоремы. Заметим также, что эту теорему можно было бы непосредственно вывести из (2.5) (для супермартингала). Действительно, беря в (2.5) о = т и вместо т беря тЛ^, находим (п^т), что Р-п. н. Х%Лт = Х{%Лп)Лт ^ ^ (Х%Лп | ^т)*
ГЛАВА 3 МАРТИНГАЛЫ И ПОЛУМАРТИНГАЛЫ. НЕПРЕРЫВНОЕ ВРЕМЯ § 1. Непрерывные справа полумартингалы 1. Пусть (Q, 9Г, Р) —вероятностное пространство и F = (@'t), 11> 0, — неубывающее семейство а-подалгебр У. Определение 1. Супермартингал X = (xt, STt), t^O (М|^|<оо, M(xt \@~s)^:xs> t^s) называется непрерывным справа, если 1) траектории xt непрерывны справа Р-п. н.; 2) семейство (#",), t^O, непрерывно справа, т. е. S> t Многие из результатов предыдущей главы переносятся на непрерывные справа супермартингалы и субмартингалы (т. е. на полумартингалы). Приведем прежде всего один полезный результат, дающий условия существования у супермартингала X = (xt, £rt), t^Q, непрерывной справа модификации. Теорема 3.1. Пусть семейство F = {&~t\ />0, непрерывно справа. Для того чтобы супермартингал X = (xt, £Tt), t^O, допускал непрерывную справа модификацию, необходимо и достаточно, чтобы функция mt = Mxt, t^O, была непрерывной справа. Для доказательства нам понадобится следующая. Лемма 3.1. Пусть X = (xty &~t), t^O, — супермартингал, для которого существует такая интегрируемая случайная величина у, что xs^M(y \9~s) Р-п. н.,-5^0. Пусть хх ^т2 J> .. . — невозрастающая последовательность марковских моментов. Тогда семейство случайных величин [хХп, п=\, 2, ...} равномерно интегрируемо. Доказательство. Положим *//i = *t/l» ^ = ^Trt- Тогда по теореме 2.10 xXfl ^ М(хт \^хп) или> в новых обозначениях, Уп>ЩУп-х \9п)- (ЗЛ)
§ 1] НЕПРЕРЫВНЫЕ СПРАВА ПОЛУМАРТИНГАЛЫ 65 Отметим для дальнейшего, что Мл:0 > Муп ^ Myn-i > My. Возьмем теперь е>0 и найдем такое k = k(e), что ПтМг/,, — M«/fe<e. Тогда для всех «>fe Myn— Mt/fe<e. Далее, в силу (3.1) для «^6 J" \yn\dP= f */„dP- J yndP = {|»n|>4 {»»>*> {»«<-M = My„- | г/ndP- | */„dP< <Myn- J г/fedP- f #*dP< <e+IVh/ft- J ykdP- J */fedP<e + f | y» |dP. (3.2) {»«<4 {»n<-4 {|»nl>M Ho on ,^,1^М1Уп1^МУ» + 2МУ» ^Мдг0 + 2М|у1 P{ljU>a)<—jr—< я < l >0 при Я->оо. Поэтому P f ly*|rfP->0, A^oo, su n>"*{|^l>M и, значит, согласно (3.2) lim sup f |yn|dP<e. (3.3) {K|>M Поскольку величины j/h ..., #& интегрируемы, то для данного е > 0 найдется такое L > О, что f |^|dP<e. max J ^ /<* {|^l>4 Вместе с (3.3) это влечет за собой равномерную интегрируемость последовательности yl9 уъ ... Лемма доказана. Замечание. Если P(t1^J/V)=l, N<oot то лемма сохраняет свою силу без предположения xs^M(y \&~s), s^>0, поскольку тогда достаточно рассматривать лишь 5 е [О, N]9 а для таких 5 xs^M(y \&°s) с y = xN> Ml xN |< oo. 2. Доказательство теоремы 3.1. Пусть /h tf2> • • • — числовая последовательность такая, что t{ ^ t2 ^ ... ^ /rt | tt
66 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 п->оо. По предшествующей лемме величины (л;^, п=\у 2, ...) равномерно интегрируемы, и поэтому из неравенства xt>M(xtn\Pt) (Р-п. н.) (3.4) получаем (теорема 1.3) xt>M(xt+\Ft) (Р-п. н.), (3.5) где *) xt+ = \\mxin. Согласно предположению &'t = &mt+9 a xt+i очевидно, iT,+- измеримо. Поэтому из (3.5) следует равенство P(xt^xt+)=l. Предположим теперь, что mt = mi+, т. е. lAxt = Mxt+. Тогда из равенства P{xt^xt+)=l сразу следует, что P(xt = xt+)=l. Тем самым, у супермартингала X = (xt9 !Ft), />0, существует модификация Х+=(xt+, !Pt), />0, траектории которой, очевидно, непрерывны справа с вероятностью 1. Пусть теперь у супермартингала X = {xt, fFt), /^0, существует непрерывная справа модификация Y = (yt, !Ft)9 t^O. Тогда, поскольку P(xt = yt)=l, />0, то Mxt = Myt, и по лемме 3.1 lim Mys = M lim ys = Myt+ = Uyt. Иначе говоря, математическое ожидание mt = Mxt(= Myt) непрерывно справа. Следствие. Всякий мартингал X = {xu9~t)y g~t = £Tt+y t^Oy допускает непрерывную справа модификацию. Замечание. В теореме 3.1 предположение о непрерывности справа семейства F = {!Ft)t t^*0, является существенным. Если оно не выполнено, то для существования непрерывной справа модификации у супермартингала X = (xtf @~t), t^O, достаточно, например, чтобы процесс хь t^0> был непрерывным справа по вероятности в каждой точке /, т. е. чтобы P-lim xs = Xf. 8 + t § 2. Основные неравенства. Теорема сходимости. Сохранение супермартингального свойства для марковских моментов 1. Теорема 3.2. Пусть X = (хи #"/), / < Г, — субмартингал с непрерывными справа траекториями. Имеют место следующие *) Существование Р-п. н. предела lim х* вытекает из теоремы 2.6, tn*t п поскольку последовательность (х. , ^\ ), /г = 1, 2, ..., образует субмартингал.
§2] ОСНОВНЫЕ НЕРАВЕНСТВА 67 неравенства: Р{sup *,>*}<-!- Г xTdP^±-Mx+ (3.6) f <1Т * "" I sup х±^ М Xt<,T * ' P{inf *,<-Я}<—Мх0 + f xTdP. (3.7) ^ ( inf *,<-М £сли X — неотрицательный субмартингал с Ыхрт < оо для \ <р <ооу то MIsup^F^f-^-^M^. (3.8) ££ли р7-(а> Ь) —число пересечений [снизу вверх) интервала (а, Ь) су б мартингалом X = (xtf &~t), t^.T, то М Глгт — al+ Mxi + \a\ МРг(в. Ь)< \т_а1 < тьУа]. (3.9) Доказательство. Поскольку траектории хь £>0, непрерывны справа, то события {inf xt < — Я} = {inf xr < — Я} и (sup xt>Я} = {sup xr >Я} /<г г<г *<г г<г принадлежат #" (г — рациональные числа). С учетом этого замечания неравенства (3.6) —(3.9) легко получаются из соответствующих неравенств для случая дискретного времени, рассмотренных в предыдущей главе. Следствие 1. Если X = (хи Tt), t^O, — субмартингал (или супермартингал) с непрерывными справа траекториями^ то для каждого />0 (Р-п. н.) существует xt- = limxs. Действительно, если бы с положительной вероятностью этот предел не существовал, то тогда (ср. с рассуждениями, использованными при доказательстве теоремы 2.6) для некоторых a<b MP;(a, b) = oo. Но это противоречит оценке (3.9). Следствие 2. Пусть Х = (хи @"t), /^0, — мартингал с xt = М (I |#",), М111< оо, а семейство (#",), />0, непрерывно справа. Тогда у процесса хи /^0, существует модификация xt, t^Q, с траекториями, Р-п. н. непрерывными справа и имеющими предел слева (в каждой точке t > 0). Действительно, из теоремы 1.5 следует, что для каждого t ^ 0 существует ^+-НтМ(6|^,)-М(Б1^+) = М(Е1^)-^. Поэтбму, если положить xt = xt+, то получим модификацию, непрерывную Р-п. н. справа. В силу предыдущего, следствия
68 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 процесс xt, t^0y имеет для каждого t>0 пределы слева xt_ = lim xs (Р-п. н.). 2. Теорема 3.3. Пусть X = (xt, ^t), *>0, — субмартингал с непрерывными справа траекториями хь t^O, такой, что supMx+<oo. (3.10) t Тогда с вероятностью 1 существует \imxt(=x ) и Мх+ < оо. Доказательство следует из неравенства (3.9) с помощью рассуждений, использованных при доказательстве теоремы 2.6. 3. Аналогично случаю дискретного времени вводится понятие потенциала П = (я,, £?"*),. t^O, — неотрицательного супермартингала с lim Мяг=0 — и доказывается следующий результат. t->oo Теорема 3.4 (разложение Рисса). Если супермартингал Х = {хь &"t), t^Oy с непрерывными справа траекториями xt, t^Oy мажорируется некоторым субмартингалом Y = (yu iFt)9 t^Oy то найдутся мартингал M = (mty ^), /^0, и потенциал U = (ntt yt)9 t^Oy такие, что для каждого t^O xt = mt + nt (Р-п. н.). (3.11) Разложение (3.11) единственно {с точностью до стохастической эквивалентности). 4. Теорема 3.5. Пусть X = (xty &~)y t^O, — супермартин- гаЛу с непрерывными справа траекториями, такойу что для некоторой случайной величины ц с М | ц |< оо Xt>M(j\\yt)9 *>0, Р-п. н. Тогда, если % и о — марковские моменты и Р(а ^ ?) = 1, то х0>М(хх\<Г0). (3.12) Доказательство. Для каждого п = 1, 2,... свяжем с моментом т м. м., т,г = т/г(о)), полагая т« (со) = -^тг на jo: —^— <т(со) < -^ j, k= 1, 2, ..., и t„(cd) = +oo на {со: т(со) = оо}. Аналогично определим и моменты аПу « = 1,2, — Будем предполагать, что Р((т„<тп)==1 для каждого /2=1, 2, ... (в противном случае вместо ап надо рассмотреть оп Л t„). Пр теореме 2.12 х0п > М (хч | Ра^ (Р-п. н.), /1=1,2;..,
§2] ОСНОВНЫЕ НЕРАВЕНСТВА 69 Возьмем множество А е !Fa. Тогда, поскольку Т0 s &~0 , то А ^ЗГ0 , и из предыдущего неравенства получаем J* x0ndP>j xXndP. (3.13) Заметим теперь, что случайные величины (х0п, /2=1, 2, ...) и {хХп> /2=1, 2, ...) равномерно интегрируемы (лемма 3.1) и хп (о) I х (о), ая (о) | а (о) для всех о. Поэтому, совершая в (3.13) предельный переход при п-+ооу найдем (теорема 1.3), что \ x0dP^ j xxdP. (3.14) А А Поэтому ха> М[хх \Уа] (Р-п. н.). Замечание 1. Из доказанной теоремы 3.5 видно, что неравенство (3.12) сохраняет свою силу для супермартингалов с непрерывными траекториями Х = (хи STt), O^t <! Г < оо, и м. м. т и а таких, что Р (а ^ т <! Т) = 1. Замечание 2. Если X = (xif @~t), t^0,—неотрицательный супермартингал и хт = 0, то xt = 0 ({/>х}, Р-п. н.). 5. Проведенное выше доказательство показывает, что если супермартингал X = (xtf $Ft)> t^O, есть равномерно интегрируемый мартингал, то неравенство (3.12) обращается в равенство. Чтобы это утверждение сделать по своей форме аналогичным соответствующему утверждению (теорема 2.9) для дискретного времени, введем такое определение. Определение 2. Мартингал X = (xt, @"t), t^O, называется регулярным, если существует интегрируемая случайная величина ц (М|т)1< °°) такая, что *, = М(т||^), *>0 (Р-п. н.). Как и в теореме 2.7, можно показать, что регулярность мартингала Х = {хь @~t), t^zO, эквивалентна требованию равномерной интегрируемости семейства случайных величин (хи /.^0). Теорема 3.6. Пусть X = (xtf @~t), t^O, — регулярный мартингал с непрерывными справа траекториями. Тогда, если х и а — марковские моменты и Р(а^т)=1, то *а=М(хт|<Га) (Р-п. н.). (3.15) Доказательство следует из проведенного выше доказательства теоремы 3.5, если учесть, что для регулярного мартингала семейства случайных величин [xGn, /2=1, 2,...} и {хп, /2=1, 2, ...) равномерно интегрируемы. Замечание 1. Поскольку для мартингала Х = {хь fFt)> t^O, mt = Mxt^ const, то для непрерывности справа его траекторий (в соответствии с теоремой 3.1) достаточно требовать лишь непрерывности справа семейства (#"*), t^O. Более
70 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 точно, в этом случае существует мартингал Y = (yu &~t)9 t^O, такой, что его траектории уь t^0y непрерывны справа и P(xt = yt)=U f>0. Замечание 2. Утверждение (3.15) теоремы 3.6 остается справедливым для мартингалов Х = (хь @"t) с непрерывными справа траекториями, заданных на конечном временном интервале 0<^<!Г<оо, и марковских моментов т и а таких, что Р(а<т<7,)=1. Замечание 3. Если в условиях теоремы 3.6 не требовать, чтобы Р(а<т)=1, то утверждение (3.15) заменится на следующее: х<,Ах = М(хх\&~0) (Р-п. н.) (3.16) (ср. с (2.25)). Отсюда, в частности, вытекает, что «остановленный» процесс X* = {xtAX) !Ft), t^Oy также будет мартингалом. Для доказательства (3.16) заметим, что согласно (2.25) *ял*„-М (*,!*-„„) (Р-п.н.) для всех k^n. Отсюда в силу равномерной интегрируемости величин [xxk, k = l9 2, ...} при &->оо получаем, что ХопЛх=М(хх\&~оп). Полагая теперь п->оо, приходим к требуемому равенству (3.16). § 3. Разложение Дуба — Мейера для супермартингалов 1. В настоящем параграфе рассматривается аналог теоремы 2.13 (разложение Дуба) в случае непрерывного времени. Введем предварительно необходимые понятия. Определение 3. Супермартингал X = (xif £Tt\ *>0, с непрерывными справа траекториями xt = xt(<o)9 t^Q, принадлежит классу D, если семейство случайных величин (xt,tgJ), где 2 — совокупность марковских моментов т с Р(т< оо)= 1, равномерно интегрируемо. Определение 4. Супермартингал X = (xti fFt)f *>0, с непрерывными справа траекториями xt = xt(<u), t^O, принадлежит классу DL, если для любого а, 0^а<оо, семейство случайных велич-ин (хх> % е JJ, где Za — совокупность марковских моментов т с Р(т<а)=1, равномерно интегрируемо. Ясно, что класс DL э D. Следующая теорема дает критерии принадлежности классам D и DL. Теорема 3.7. 1) Всякий мартингал Х = (хи ^t), *>0, с непрерывными справа траекториями принадлежит классу DL. 2) Всякий равномерно интегрируемый мартингал X = (Хи &~t), t^O, с непрерывными справа траекториями принадлежит классу D.
§ 3] РАЗЛОЖЕНИЕ ДУБА-МЕЙЕРА ДЛЯ СУПЕРМАРТИНГАЛОВ 71 3) Всякий отрицательный су пер мартингал X — (xt> STt), t^O, с непрерывными справа траекториями принадлежит классу DL. Доказательство. Пусть Р(т<!а)=1, а<оо. Тогда, согласно замечанию 2 к теореме 3.6, хх = М (ха \ 9~х) (Р-п. н.). Но семейство (хх> х е Za) таких случайных величин равномерно интегрируемо, что доказывается так же, как импликация (А)=Ф(В) в теореме 2.7. Аналогично доказывается и второе утверждение. Докажем последнее утверждение. Пусть Р(т<!а)=1. Тогда, согласно замечанию 1 к теореме 3.5, для Я > О J |*t|dP=- | *TdP<- J* xadP {|*xl>4 (l*tl>M <l*tl>4 и также M| *т К М| ха |. Поэтому по неравенству Чебышева ЛР{|*х|>Л}<М|*т|<М|*в|. Значит, Р{ \хх |> Я}->0, Я->оо, и, следовательно, j* xfldPl->0, Я->сх>. {IM>M J sup I xx | dP < sup '"«{|*tl>4 Теорема доказана. 2. Определение 5. Пусть (Q, $F, P) — вероятностное пространство и F = (ZTt), t^O, — неубывающее семейство непрерывных справа а-подалгебр ST. Непрерывный справа случайный процесс Л/, /^0, называется возрастающим, если величины At являются ^-измеримыми, Л0 = 0и Л^^Л^, s<!/, Р-п. н. Возрастающий процесс A = (At, $Ft), t^O, называется натуральным возрастающим процессом, если для всякого ограниченного положительного мартингала Y = (yt9 9"t), /1>0, имеющего пределы слева, Mj ys-dAs = My00Aoo. (ЗЛ7) Возрастающий процесс At, /^0, называется интегрируемым, если МЛ^ < оо. Лемма 3.2. Интегрируемый возрастающий процесс A = (At, STf), /^0, является натуральным тогда и только тогда, когда для всякого непрерывного справа и имеющего пределы слева ограниченного мартингала Y = (yt, @"t), t^O, т т М $ y8dAs = M \ys-dAs (3.18) о о для любого Т > 0.
72 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 Доказательство. Покажем сначала, что для всякого возрастающего процесса A = {Au&rt)> />0, с Л0 = 0, МА^ < оо и мартингала Y = {yu &~i), t^0y имеющегося непрерывные справа траектории, т М \ y8dAs = MyTAT. (3.19) б Положим ^ (со) = inf {s: As{(£>)>t} и воспользуемся тем, что (для почти всех о) интеграл Лебега — Стилтьеса можно свести к интегралу Лебега (гл. 1, § 1): Т ЛТ(ы) оо J y,dA8= J* Усы<и= \ Ус^)\и t<AT(»))dt> 0 0 0 где, согласно следствию леммы 1.8, #^ (©) является ^"^-измеримой величиной. Но Р-п. н. {t: /<ЛГ (©)} = {/: ct(®)<T}. Поэтому j ysdAs= $ yetM\t:etm<T)dt9 и по теореме Фубини Т оо М J ysdAs^= j М[уч(е>)%{,С({а))<Т)]Ш. О О Зафиксируем некоторое /^0 и заметим, что случайный момент т(сй) = ^(со) является марковским. Тогда, поскольку событие {о: т(о)< Г}е=#"т (лемма 1.7), a Y = (уь 3~t), *>(),— мартингал, то (замечание 2 к теореме 3.6) М [У% (со)Х{*: ct (со) < Т}] = М [Ух «А»: т (со) < Г}] = Следовательно, Г оо М \ysdAs=\u{t{Uc^)<T)yT)dt = Таким образом, (3.19) доказано. Ут J ^{*: ct((i>)<T}dt = Мг/гЛ7
§ 3] РАЗЛОЖЕНИЕ ДУБА - МЕЙЕРА ДЛЯ СУПЕРМАРТИНГАЛОВ 73 Поэтому, если (3.18) выполнено для любого Т > 0, то т М \ ys-dAs = MyTAT, откуда, переходя к пределу при Г->оо, о получаем, что процесс A = (AU @"t) удовлетворяет равенству (3.17). Обратно, пусть выполнено (3.19). Тогда, поскольку 00 ОО ОО М \ ys dAs = МА^у^ то М J ys dAs = М J y8_ dAs. о о о Пусть теперь y*s = ys_%{s<T} + Ут%{з>ту Процесс Г = (£, $~s)y s^O, как нетрудно проверить*), является мартингалом (непрерывным справа, ограниченным), и равенство ОО ОО о о превращается в равенство (3.18), что и требовалось доказать. Сформулируем теперь аналог теоремы 2.13 (разложение Дуба), ограничившись сначала лишь неотрицательными супермартингалами, являющимися потенциалами. Теорема 3.8 (разложение Дуба — Мейера). Пусть непрерывный справа потенциал П = (я*, #"*), 0^£<сх>, принадлежит классу D. Тогда существует интегрируемый возрастающий процесс A = (Atf @~t)> /^0, такой, что щ = ЩА„\9г1) — Аь *>0 (Р-п. н.). (3.20) В разложении (3.20) процесс Atf t^zO, может быть взят натуральным. Разложение (3.20) с натуральным возрастающим процессом единственно. Доказательство. Для каждого п = 0, 1, ... последовательность (я..2-л, &~i.2-n\ *' = 0, 1, ..., образует потенциал (с дискретным временем 0, 2""п, 2 • 2"", ...). Согласно следствию 1 теоремы 2.13 для каждого п ^2-« = M[^(/i)|^,2.»]-i4iir«(n), / = 0, 1, ..., (3.200 *) Более общий результат такого характера содержится в лемме 3.3.
74 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 где величины А.,2-п(п) являются ^(._|)>2-«-измеримыми образуют возрастающий процесс и Лвв(л) = НтЛ/.2.л(л). (3.21) *-»оо Предположим сейчас, что величины {^(я), лг = 0, 1, ...} равномерно интегрируемы (ниже будет показано, что для этого необходимо и достаточно, чтобы потенциал п принадлежал классу D). Тогда, согласно теореме 1.7, можно найти такую последовательность целых чисел п{, п2, ... -> оо и интегрируемую функцию А^у что для всякой ограниченной случайной величины | \imMA00(ni)l=MA00l (3.22) *-»О0 Обозначим mt непрерывную справа модификацию MiA^ \&~t), существующую в силу следствия 2 теоремы 3.2. Пусть r<s являются числами вида / • 2~пу / = 0, 1, ... Тогда Аг (п) <! As (ri), что вместе с (3.20) дает MI^HI^J-JV^M^^I^J-n,. (3.23) Отсюда при п = rii-> оо получаем, что тг — яг < ms — ns. (3.24) Положим At = tnt~ щ. Эта функция Р-п. н. непрерывна справа, и поскольку согласно (3.24) она не убывает на двоично- рациональной последовательности, то At является возрастающим процессом. Далее, я,->0 (Р-п. н.), *->оо, a mt = M{AQO\g~t)-> ->M(A00\fF00) = Aoo, t->oo. Поэтому Р-п. н. lim At совпадает t->oo с ранее введенной величиной Л^. Покажем теперь, что процесс Аь /^0, является натуральным. Пусть Y = (yt9 &~t), /^ 0,— ограниченный неотрицательный мартингал, имеющий Р-п. н. пределы слева yt- = limys в каждой точке t > 0. Поскольку процесс Аь /^0, непрерывен справа, то по теореме Лебега о мажорируемой сходимости (теорема 1.4) оо оо М f ys-dAs = \\m УМ[!((.г»(^+,)Г»-^,-4 (3.25)
§ 3] РАЗЛОЖЕНИЕ ДУБА - МЕЙЕРА ДЛЯ СУПЕРМАРТИНГАЛОВ 75 Но £/t.i9-/i #".#2-/!-измеримы, поэтому 00 2 М [у{.а-«(Аи+1).2-п - Ah2-n)] = 1=0 оо = 2 М [yt.2-«М {Аи+1).2-п - А..2.п|&t.2-n)\ = 00 = 2 M |^.2-«M ((ffl(i + 1).2-e - Я(/ + „.2-я) - - (mh2-n - я..2_«) 15г;.2-«)] = оо = 2 М [у1.2-пМ(я..2-п - Я(/ + |).2-я | ^",.2-и)] = оо = S М [^.2-»(Д(<+1).2-»(я) - Л,.2-»(л))]. (3.26) Заметим теперь, что Л(.+1).2-п^"(.,2-л-измеримы, а значит, М [у,.2-пА(1+1).2-п(п)] = М [г/(1+1).2-"А/+1)-2-п]- (З-27) Из (3.25) —(3.27) находим, что оо М ( ys- dAs = lim M [Л. (л) г/J. (3.28) о Согласно (3.22) lim M[Ax(ni)yJ = M[A00yJ. (3.29) /г^->оо Из сопоставления (3.28) и (3.29) заключаем, что оо М j ys-dAs = MAMy„, (3.30) О т. е. построенный процесс Аи t^O, натуральный. Предположим теперь, что есть еще одно разложение щ = = М(В00 \&~t)—mBt с натуральным возрастающим процессом (Ви *>0). Тогда ni.2-n = M(B„\g-i.2-n)-Bi.2-n и оо м Ivs-dB^m^, (3.31) О где Y = (yu 5Tt)> t ^ 0, — неотрицательный ограниченный мартингал с существующими пределами слева yt_ = l\m ys. S ^ t Возьмем, в частности, некоторый ограниченный мартинга
76 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 (у12-п, #"j.2-i)i / = 0,1, ..., и образуем мартингал (с непрерывным временем) Y = (yt, &*t), />0, полагая yt = yi.2-n, i • 2~"<^< < (/+ 1) • 2~n. Тогда из (3.31) вытекает, что 00 М 2 ?„..).»-» \Bi-2-n ~ В«-.).2-«] = МумВх. (3.32) В теореме 2.14 было показано, что из (3.32) вытекает ^".^-измеримость величин 5(Ж).2-я. Поэтому, сравнивая два разложения: п1.2-п = ЩВсо(п)\Р1а2-п]-В1т,-п(п), видим, что в силу единственности разложения Дуба Ah2-n(n) = Bh2-n(n), i = Q, 1, ... (Р-п. н.). Следовательно, А^ (п) = В^ (п) и Аоо = Воо (Р-п. н.). Но nt = M[Aoo\&~t]—At = M[B00\&'t] — Bty откуда получаем: At=Bt (Р-п. н.) для всех />0. Для полного завершения доказательства надо еще установить, что для равномерной интегрируемости последовательности {Лте(/1),'/z = 0, 1, ...} необходимо и достаточно, чтобы потенциал n = (nt, £Tt), t^O, принадлежал классу D. Если семейство {^(/i), лг = О, 1, ...} равномерно интегрируемо, то, как было установлено, ni^=M[A<xi\ff'i] — At. Следовательно, ят<М [АСЖ) \£ГХ]. Но семейство {M^^I^TJ, те 2} равномерно интегрируемо (теорема 3.7), поэтому таким же свойством обладает и семейство {ят, т е 2}, т. е. потенциал я принадлежит классу D. Обратно, пусть яеВ, Тогда согласно разложению Дуба для каждого п = 0, 1, ... Р-п. н. п1.2-п = ЩА„(п)\Р1.2-п] — Ah2-n(n). (3.33) Поскольку Л(/+1).2-п(я) ^"Ь2-/г-измеримы, то для каждого X > 0 момент Trt,, = infl/.2-": Л(/+1).2-я(я)>М (3.34) (rrtiX = oo, если множество {•} в (3.34) пусто) будет марковским относительно семейства {^/<2_л, / = 0, 1, ...]. Ясно, что {со: А^ (п) > X) = {о: т„,х <<*>}, и в силу (3.33) \п, л - МI Л~ W 1*4, J - ^ х (л) (Р-п- н.). (3.35)
§ 3] РАЗЛОЖЕНИЕ ДУБА-МЕЙЕРА ДЛЯ СУПЕРМАРТИНГАЛОВ 77 Отсюда находим М[Асо(п);{А00(п)>Х}] = = М [Ач к («); К, л < оо}] + М [я,л§ л; {т„, л < оо}] < < ЯР {Лте (/г) > Я} + М [ят„ ,; {хп, к < oo}j, (3.36) поскольку в силу (3.34) А%п х (я) ^ Я. Из (3.36) получаем МИ»(я)-Л; Мов(п)>2Л}]< < М [А„ (п) - Я; {Ам (п) > Я}] < М [ят„ х; {т„, я. < оо}]. (3.37) Значит, ЯР {А„ (п) > 2Я} < М [ят„ ,; {т„, * < оо}]. (3.38) Из (3.36) (с заменой Я на 2А) и (3.38) находим МИвв(«);Ив0(«)>2Я,}]<- < 2ЯР {Лтс (л) > 2Я} + М [я,п> 2,; {т„, 2Л < оо}] < < 2М \ПЧ. V Ы. * < °°}] + М [«*«, 2^; {Т«. 2Л < ОО}]. (3.39) Заметим теперь, что Р{Тп>х<оо} = ри<в(«)>л}<-5^|М = -^->о, я->оо. Из этого замечания и предположения яеО вытекает, что при А->оо правая часть в (3.39) равномерно по лг = О, 1, ... стремится к нулю. Поэтому равномерно по всем п = 0, 1, ... J A„(n)dP-+09 Л->оо, {Аоо(п)>2Ц что и доказывает равномерную интегрируемость величин {А^п), я = 0, 1, ...}. Теорема доказана. Следствие. Пусть X = (xt, @~t), t ^ 0,—непрерывный справа супермартингал, принадлежащий классу D. Тогда существуют непрерывный справа равномерно интегрируемый мартингал М = (ть @"t), t^O, и интегрируемый возрастающий натуральный процесс А = (At9 &~t) такие, что xt = mt — At (Р-п. н.), *>0. (3.40) Это разложение (с натуральным процессом At, t^O) единственно с точностью до стохастической эквивалентности. Докажем этот результат. Поскольку ZgD, to, в частности, sup М I хЛ < оо и sup М хт < оо. Следовательно, по тео- t ' ' t реме 3.3 существует л:^ == lim xt с М | х^ | < оо.
78 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 Пусть mt — непрерывная справа модификация мартингала M(*oJ^)» *^0. Тогда, если nt = xt — mh то процесс 11 = = {щ> ^t)y ^0) будет образовывать непрерывный справа потенциал, принадлежащий классу D, поскольку ^еЬ и мартингал М = (М (л:^| 3~t)y tFt), t ^ 0, также дринадлежит классу D (теорема 3.7). Применяя теперь разложение Дуба—-Мейера к потенциалу П = (щ, STt), t^0y находим, что ^ = Щх^\^) + ЩА^\Гг)-Аи (3.41) где Аь /^ 0, — некоторый интегрируемый натуральный возрастающий пррцесс. Замечание. Теорема 3.8 и следствие из нее остаются справедливыми и для непрерывных справа супермартингалов X = (xt, £Tt)y t^Oy принадлежащих классу DL, с тем лишь отличием, что натуральный возрастающий процесс Аи t^O, таков, что, вообще говоря, МЛ^^оо (см. [126]). 3. В теореме 3.8 и в замечании к ней предполагалось, что супермартингал П = (я/, 3~t\ 0</^Г^оо, принадлежит классу D ,или DL. Остановимся теперь на аналоге разложения Дуба —Мейера, отказавшись от предположения, что II е D или ll^DL. Определение 6. Случайный процесс М = {ть &~t), /^0, называется локальным мартингалом, если существует возрастающая последовательность марковских моментов trt, az=1, 2, ... (относительно F = (&~t)y /^0), такая, что 1) Р(тп<дг)= 1, P(limT„ = oo)=l; п 2) для каждого лг === 1, 2, ... последовательности [nit Лт , @~и ^^0) являются равномерно интегрируемыми мартингалами. В связи с данным определением отметим, что всякий мартингал с непрерывными справа траекториями является локальным мартингалом. Вытекает это из следующего предложения (ср. с теоремой 2.15). Лемма 3.3. Пусть X = (xt, &*t), t^O, — мартингал с непрерывными справа траекториями и т = т((о) — марковский момент относительно системы F = (^), /^0. Тогда процесс (xt/\%9&~t)y t^Oy также является мартингалом. Доказательство. Положим 4n = k/2n на |(о: ~j?r-< * < ipr}> считая t„ = oo на {о: т = оо}. Зафиксируем два числа s и t, s<*, и пусть tn = k/2ny если ^^-<г<^г, и sn = k/2n, Ь — 1 Ь если „п < s < -ут - При достаточно большом п, очевидно,
§ 3] РАЗЛОЖЕНИЕ ДУБА - МЕЙЕРА ДЛЯ СУПЕРМАРТИНГАЛОВ 79 Согласно теореме 2.15 для всякого /lGfs А А Поскольку величины хх л* и jct дв , л= 1, 2, ..., равномерно интегрируемы (лемма 3.1), то, переходя к пределу (п->оо) в предыдущем равенстве, получаем М(*хл t\ ^"s) = ^as (Р-п. н.). Замечание. Утверждение леммы остается справедливым и для супермартингалов, имеющих непрерывные справа траектории и мажорирующих некоторый регулярный мартингал (ср. с теоремой 3.5). Теорема 3.9. Пусть X = (хи !Ft), t^Q, — непрерывный справа неотрицательный супермартингал. Тогда существуют и единственны, непрерывный справа процесс M = (mt, @~t), t^O, являющийся локальным мартингалом, и натуральный интегрируемый возрастающий процесс A=(At, @~t), t^O, такие, что Xi==mt — At (р.п. н.), />0. (3.42) Доказательство. Из аналога неравенства (3.7) для неотрицательного супермартингала X = {xt> !Ft), t^O, находим, что Отсюда следует, что P{sup^< оо}=1. (3.43) t Положим хп = inf {t: xt^n} А п. Тогда Р{хп<п) = 1, Р(тп< ^rn+i}=l и в силу (3.43) P{lim xn = оо}= 1. Положим теперь п xn(t) = xtA% . Ясно, что xtAx < max \п, хх ), откуда следует, что для каждого п=1, 2, ... супермартингал Xn = (xn(t)y &~t), t^Oy принадлежит классу D. Поэтому согласно следствию теоремы 3.8 *n(t) = mn(t)-An(t)9 (3.44) где Mn = (mtl(t), &~t), t^О, —- равномерно интегрируемый мартингал, a An(t), /^0, — натуральный возрастающий процесс. Заметим, что хп+](хп Л t) = xn(t). Далее, поскольку {mn+[(t). /^0} равномерно интегрируемо, то таково же и семейство {mn+\(t Л т„), t^O}. Процесс Ап+{(хпА t)9 /^0, получающийся из натурального возрастающего процесса An+i(t)9 t^O, «остановкой» в момент тя, как нетрудно доказать, также будет натуральным и возрастающим.
80 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 В силу единственности разложений Дуба — Мейера тп+Л*пЛ t) = mn(t), *>0, An+i(xnAt)=An(t)9 t>0. Поэтому определены процессы (т„/^0) и (Atf t^O), где mt = mn(t) для f<tn, At = An(t) для *<тп. Ясно, что процесс M = (mt, frt), t^O, является локальным мартингалом, a At, t^Q, — возрастающим процессом. Поскольку для А? == At A N МА»= Игл ММ?; тя>*) = Iim М(Л^(0; *„>*)< <!im МЛ£(<)< Mm [M*n(0) —M*n(01<Hm М*л(0) = М*0< °°, rt-»oo tt-»oo /г-»оо то величины А?, ^^0, интегрируемы, и по лемме Фату MAt< оо и МЛ^ < оо. Пусть теперь Y = (yh &~t), t^O, — положительный ограниченный мартингал, имеющий пределы слева yt_ = lim ys (Р-п. н.). Тогда, используя лемму 3.2 применительно к процессам An(t)f t^Q, /2=1, 2, ..., получим М Г ys dAs = lim M [ ys dAs\ xn > t = lim M П->оо J* ysdAn(s)\ xn>t = lim M J r/s_ С?ЛЯ (5), Тя > / Lo = lim M ti->oo J" */5_ <MS; xn > N = M J r/s_ ЙЛ5. Из полученного равенства М J z/s rfi4s = M J */s_ d Л5 и леммы 3.2 следует, что процесс At9 />0, является натуральным. Единственность разложения (3.42) доказывается так же, как и в теореме 3.8.
§ 4] СВОЙСТВА НАТУРАЛЬНЫХ ПРОЦЕССОВ 81 § 4. Некоторые свойства натуральных возрастающих процессов 1. В случае дискретного времени лг = 0, 1, ... возрастающий процесс А = (Ап, @~п)> лг == 0, 1, ..., назывался натуральным, если величины Дг+1 были ^„-измеримы. Естественно было бы ожидать, что в случае непрерывного времени данное в предшествующем параграфе определение натурального возрастающего процесса A = (Ati @"t), /^0 (см. 3.17), приводит к тому, что при каждом t > 0 случайные величины At являются на самом деле ^.-измеримыми. Покажем, что это действительно так. Теорема 3.10. Пусть Л = (Л„ 2Tt), />0, — непрерывный справа интегрируемый возрастающий процесс, #", = #",+, /^0. Тогда для каждого t>0 величины At являются &"^-измеримыми. Доказательство. Образуем потенциал Щ = ЩАОЛ\Г,\-А0 (3.45) беря в качестве М[ЛГХ)|^] непрерывную справа модификацию. Пользуясь обозначениями, принятыми при доказательстве теоремы 3.8, имеем Я(Ж,.2-Л = М И~ (") I ^ + 1).2-"] - А/ + 1).2-я (*)• (3-46) Зафиксируем некоторое t>0 и положим tn = {i + 1) • 2~/г, если /-2"n</<(/+l)-2"n. Тогда из (3.46) в силу ^..^-измеримости величины Ау+1\.2-п(п) получаем М K+U-2-» | Ft] = М [Ах («) | <Г J - А{,+1,2_„(п). (3.47) Подставляя сюда значения эт(/+1)ш2_п из (3.45); находим ЩА„{п) \Ft] = MlAoo- Atn\<rt\- Atn{n\ tn = {i+\)-2-\ (3.48) Поскольку разложение (3.45) с натуральным процессом A = (Au.&'t), t^O, единственно, то, в соответствии с доказательством теоремы 3.8, существует подпоследовательность {nh у=1,2,...} такая, что A^rij) сходятся слабо к Л^. Тогда, очевидно, и М^^Я/)! 5TJ слабо сходятся к MfA^I #",]. Заметим также, что в силу непрерывности справа процесса At, М|М(Л,я \&~t\— i4J->0f nj->oo. Учитывая все это, из (3.48) получаем, что At (nj) сходятся слабо к At, nj -> oo.
82 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 Величины Atn (nj) являются У ш ^^-измеримыми, и по- -tlf скольку i-2 <t^tn., то они и #";_-измеримы. Покажем теперь, что и слабый предел At этих величин также будет #",_-измеримым. Вытекает это из следующего общего предложения. Лемма 3.4. Пусть на полном вероятностном пространстве (Q, #", Р) задана последовательность случайных величин lh i=\, 2, ..., с M|£f|<oo, слабо сходящаяся к случайной величине £, т. е. пусть для любой ограниченной ^-измеримой величины ц М&т|-»Мбл. '->«>• (3.49) Предположим, что случайные величины ^ являются ^измеримыми, где *§ — (полная) а-подалгебра @". Тогда случайная величина £ также ^-измерима. Доказательство. Согласно теореме 1.7 последовательность случайных величин 1{, £2> • • • равномерно интегрируема. Эта последовательность останется равномерно интегрируемой, если ее рассматривать на новом вероятностном пространстве (Q, $, Р). Следовательно, еще раз применив теорему 1.7, получаем, что найдется такая подпоследовательность £ , g , ... и ^-измеримая случайная величина |, что для любой ограниченной ^-измеримой величины fj M£„fj->Mifj, *->оо. (3.50) t Согласно (3.49) Щп г|—> М |г|, и, с другой стороны, в силу (3.50) МЦЛ= М {ЦМ (л \9)} -> М {1М (л \П = М1л- Следовательно, М£л=М|л, откуда | = | (Р-п. н.), а значит, g ^-измерима. Замечание. Если т — марковский момент, то случайная величина Ах = Лт (©) (о) является #"т_-измеримой. Напомним, что #~т_ есть а-алгебра, порожденная множествами вида {т>/)ПЛ„ где At^Pf, *>0. 2. В следующей теореме даются условия, при которых натуральный процесс At, соответствующий потенциалу nt, является непрерывным. Предварительно введем такое Определение 7. Потенциал щ, t^O, является регулярным, если для любой последовательности {хп, /2=1, 2, ...} марковских моментов таких, что %п \ т, Р(т<оо)=1, Мях ~> Мях,
§4] СВОЙСТВА НАТУРАЛЬНЫХ ПРОЦЕССОВ 83 Теорема 3.11. Пусть 11 = (я„ !Pt\ t^0, — непрерывный справа потенциал, принадлежащий классу D. Для того чтобы отвечающий этому потенциалу натуральный возрастающий процесс At, t^Oy был Р-п. н. непрерывным (более точно — имел непрерывную модификацию), необходимо и достаточно, чтобы потенциал был регулярным. Доказательство необходимости просто. Пусть At, t^O, является Р-п. н. непрерывным процессом. Тогда, если %п \ т, то по теореме Лебега 1.4 lim МЛТ =МЛТ. Поэтому /г-»оо п Ит Мят = lim M U — Ах\ = М [А„ - Ах] = Мят. (3.51) /г->оо п /г->оо Доказательство достаточности более сложно и будет разбито на ряд этапов. 3. Л е м м а 3.5. Пусть 11 = (щ, #",), t > 0, — непрерывный справа потенциал и Ъ = ЩА„\Рг]-А» (3.52) где Aty t ^ О, — натуральный интегрируемый возрастающий процесс. Тогда IVML=M j [nt + nt-]dAt9 (3.53) где предел nt- = \imns существует согласно следствию 1 тео- ремы 3.2. Доказательство, а) Предположим вначале, что МЛ^< oo, и при этом допущении установим справедливость равенства (3.53). Пусть mu t^ О, — непрерывная справа и имеющая пределы слева модификация M(A00\Tt) (см. следствие 2 к теореме 3.2). Тогда в силу равномерной интегрируемости семейства величин {mt, t>0} М J mt dAt = M [mt+dAt LO = lim M fc->oo Л-+1 — A i ) = Iim VM Гшг+1/Л,+1—Л г \] = lim V [Мт;+|Лн|- МшЛ Л *->соЙ L Т"\ ft ft/J ^""SJL * ft ft feJ = Mm ,4 =МЛ* (3.54) Воспользуемся теперь тем, что процесс Аи t^O, натуральный. Если mf = M(AooAN\Tt), *>0, то оо
84 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 Полагая Лг->оо, находим, что оо М J mt_ dAt = Мт^ = MA*„. (3.55) О Заметим еще, что м=о SM'+i + a±\(Aj±±-a± к /\ к к ■■ МА1. (3.56) Aj+i - А\ к к М f {At + A,-)dAt=limM = lim M V /г->оо Нл Из (3.54) —(3.56) получаем 00 ОО ОО М J {nt + nt_)dAt = M \ (mt + mt-)dAt — M J {At + At_)dAt = О 0 ) = 2МЛ1-МЛ1=М/£. б) Предположим теперь, что оо М J" [я/ + я,_] di4/ < оо. (3.57) о Тогда, если доказать, что в этом случае и МЛоо < оо, то равенство (3.53) будет вытекать из предыдущих рассмотрений. В свою очередь для доказательства неравенства МЛоо < оо достаточно установить, что для всех /г, больших некоторого #о<оо, МЛгоо(л)<С<оо. (3.58) Вытекает это из того, что А^ является слабым пределом некоторой последовательности {Л00(^), /=1, 2, ...} и следующего предложения. Лемма 3.6. Пусть lh i= 1, 2, ..., — последовательность случайных величин М| £/1 < оо, /= 1, 2, ..., слабо сходящаяся к некоторой величине £, г. е. пусть для любой ограниченной случайной величины ц М£л-*М£ть /-*оо. (3.59) Предположим, что sup М£?<^С < оо. Тогда М£2^С. Доказательство. Обозначим _ f |, если |g|</i, g(/l) ~ \ 0, если 111 > п.
§4] СВОЙСТВА НАТУРАЛЬНЫХ ПРОЦЕССОВ 85 Тогда, полагая в (3.59) r\ = lin) и учитывая, что Ц{п) = Цп) (Р-п. н.), получим M^-MU^-Um Мб,^ <fsup M6].M6fJ,/B-C,e(MU)),/2. (3.60) Но М£(2^<я < oo, поэтому (3.60) приводит к неравенству М^<С. Наконец, по лемме Фату М£2= М lim£(2n)^C < оо, что и доказывает лемму 3.6. Итак, возвращаясь к доказательству леммы 3.5, установим справедливость неравенства (3.58). Из (3.57) вытекает, что найдется такое N0<oo, что для всех n^NQ оо м2я,.,-»И,(+|).г»-л,.гя]<с<оо (3.61) или, что эквивалентно, оо ' М ^nit2-n[A(i+l)t2-n(n)— А..2-п{п)]^С <оо. Пусть aN = min(a,N) и я^.2-«= М (А^Ы) |t<F..2_„)—Л,у2_п(я). Поскольку /^2_rt(^X .V < оо, то применимы результаты пункта а), в соответствии с которыми оо М | А1 (Я)]2 = М S ("Л+,,.2-» + ЛГ-2-«) W+D-2-» («) — Ai-2~n (Я)). Заметим, что А1+п.2-»(я)- Лм-» (»)<И(/+1).2_п(я)- Л,.2_„ (n))tf и <2-»=М[Л^(«)-^2_«(я)1^.г-»]< < М [(AJn) - А,.а-п(п))» |ST,.2_rt]<%2_„. Поэтому согласно (3.61) М[^(л)]Чм|(Я((+|).г.+я,гЯ)(у1и+1)<гП(д)-Л,г..(я))<2С.
86 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 где мы воспользовались тем, что оо М S n(H.i,.2-»(i4u+1).2_n(«)— Л..2_„(/г)) = оо = М S М {я((+„.2-/. [ A. + D-2-" (") - Л/-2-« (»)] | ^-.2-"} = ОО = М S М (ян + 1).2-« | *",.2-«) (Л(( + 1).2-» (») — ^г-2-" (»)) < оо <М|о Я, .2_„ (Л(Н.1,.2-я (*) — Ai-2-n (Л)) < С. Итак, М [ Л£> (я)]2 < 2С < оо, и по лемме Фату М [Лм (я)]2<2С для всех я ^jV0- 4. Для формулировки еще двух вспомогательных предложений, используемых при доказательстве теоремы 3.11, введем некоторые обозначения. Рассмотрим процесс Аь t^0> и построим по нему субмартингал (An(t)9 &"t)9 t^O, полагая AnV)=M[\n{t)\frt]9 (3.62) где <рй(0 = (*+1)2"Л если k2~n^t < (k + 1)2"Л Согласно теореме 3.1 можно считать, что траектории An(t), t^0> непрерывны справа Р-п. н. и имеют пределы слева в каждой точке /^0. Пусть т — м. м. (относительно (#",), /^0). Тогда из леммы 1.9 и определения условного математического ожидания нетрудно вывести, что 4,(T) = M[^n(,>|*\]. (3.63) Для каждого е > 0 определим t„,e = inf{/: An(t)-At^e}, (3.64) полагая T„,e = + oo, если множество {•} в (3.64) пусто. Ясно, что тп,е<тп+1>е (Р-п. н.). Положим те = Нттп,е. П-+оо Лемма 3.7. Для всех п=\9 2, ... м W - л v .1 >еР (*• < °°) + м [К - А*п е.)] • (3-65) Доказательство. Имеем К - Ч, е = \А\ ~ К С)] + \А*п Ы ~ ЛЧ J >MMK(4j^J-Mi4»(T"..)-
§ 4] СВОЙСТВА НАТУРАЛЬНЫХ ПРОЦЕССОВ 87 Поэтому, учитывая, что An(t)^At (Р-п. н.), /^0, получаем >м[\- \ с.)1 + т /в К К. J - *.. J dP > >мк-\^е)]+ер(те<00)' где мы воспользовались тем, что в силу непрерывности справа процессов An(t) и At9 t^O, на множестве {т8 < оо} Лемма 3.8. Пусть Аи t^O, — натуральный процесс, отвечающий регулярному потенциалу П = (я,, #",), и МЛ^ < оо. Тогда для всех я= 1, 2, ... и любого е > 0 00 М | [Л-Л_]йЛ,<Ит{еМЛГ/г£ + М[Л00(Л0С-Лт„,е)]}. (3.66) Q П "> .ОО Доказательство. Положим Дя> л = {/: & • 2""" < / < < (k + 1) 2"""}. Поскольку для /еАяД процесс (Лл (/), #",) образует мартингал, а процесс (Л„ ^), t^O, натуральный, то из леммы 3.2 нетрудно вывести, что М J" An(t)dAt = M J* ЛЯ(/-)£М,. дп,Л д/г, fc Следовательно, оо оо MJ An(t-)dAt = tA\ An(t)dAt. (3.67) о о С другой стороны (ср. с (3.54)), М j* An(t)dAt = \imM{An((k+l).2-n-e)[A{k+l).2-n_B-A,.2-n}}. A«-ft (3.68) Но при е | О Ап ((k +1) • 2"» - е) = М (Vr» I *W«--1 - так как величина Л(Л+1).2_П является ^Г(Л+1)§2_я-измеримой согласно теореме 3.10. Поскольку потенциал П=(л,, Tt), />0, является регулярным, то ЫА1 = ЫАоо — \Ащ является непрерывной функцией и
88 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 следовательно, для каждого t>0 P(At = At_)=l. (Заметим, что At- = lim As существует для каждого t > О, поскольку As= M [A„ |0%]-я5, a я,_=Нт я5иМ [A» |^_]=lim М [Л^ \PS] существуют по следствию 1 теоремы 3.2 и по теореме 1.5 соответственно.) Далее, А{к+1).2-п_е->А({к+1)ш2-П)_, е->0, где, согласно сказанному, P(4((ft+i,.2-i)_ = Л(Л+1).2_Я)=1. Поэтому, если МЛ^< оо, то из (3.68) следует, что М J* ^я(0^ = М{Л^+1).2.я[Л(Л+1).2-я-ЛА.2.я]}, и, значит, 00 ОО М J ^ (О А4, = ^ М {Л(,+|).2_„ [^„.г. - Аь.2-п}}- (3.69) О fc=0 Отсюда с учетом (3.67) получаем оо оо М j AtdAt= lim 2МИ(*+1)-2-»И(*+i)-2-« — л*.2-»]} = оо оо = limM f An(t)dAt= lim М Г Д,(<—)<*Л. (3-70) п->оо «J /г->оо «J а следовательно, оо оо М f [At — At-]dAt=\imM f [Ля(* -)- Л,_]<М,. (3.71) о ^°° о Для получения неравенства (3.66) преобразуем в (3.71) правую часть. Имеем оо т/г, е M\[An{t-)-AtJidAt = U\ [An(t-)-At.]dAt + О О оо оо + М { [An(t-)-At.]dAt^BMA,ne + M j An(t-)dAt. (3.72) Tn, e т/г, е Положим Bt= MiA^ \!Ft). Тогда, очевидно, Bt- ^ An(t •—), и, значит (см. (3.19)), оо оо М \ An(t-)dAt^M j Bt..dAt=M[Ax(Ax — A4J\. (3.73)
§ 4] Свойства натуральных процессов 89 Из (3.72) и (3.73) вытекает оо М J [An (t -) - At.} dAt < eMA%n< & + M [Ax (A„-AXn J], (3.74) 0 что вместе с (3.71) очевидным образом приводит к неравенству (3.66). 5. Доказательство теоремы 3.11. Достаточность. Будем сначала предполагать, что МЛоо<°°. Поскольку потенциал n = (jt,, #"Д />0, регулярный, то м \К - К п]=м К, - ч] - °. " ^ °°- (3-75) В силу непрерывности справа процесса Ah t^Q, ц1\-\ы]-»0' п-°°> (3J6) так как Ф/г(т8)|те, п->оо. Из (3.75), (3.76) и неравенства (3.65) леммы 3.7 получаем, что Р(т8<оо) = 0 для любого е > 0. Но тогда (см. (3.66)) ^п{гМАХпе + М[А00(А00-АХпе)]} = еМА^ П->оо и, следовательно, оо М J [At — At-]dAt^eMA„. о В силу произвольности е > 0 оо М f [At-At-]dAt = Qt о и, значит, Р-п. н. траектории процесса непрерывны слева. Поскольку же траектории Л,, /^0, также непрерывны и справа, то процесс Аь /^0, непрерывен с вероятностью 1. Освободимся теперь от предположения МЛ^<°°. Пусть П = (я;, 3~t)j t^O, — непрерывный справа регулярный потенциал класса D и п^ЩА^^-А,, (3.77) где Аь t^ 0, — натуральный возрастающий процесс. Положим для п= 1, 2, ... A{tn) = AtAn, Bf] = А{Г1) - AT и nf=bh[B™\Pt\-Bf\ (3.78)
90 МАРТИНГАЛЫ (НЕПРЕРЫВНОЕ ВРЕМЯ) [ГЛ. 3 Ясно, что для каждого t^O оо я, = S я[п\ (3.79) где потенциалы п[п\ /^0, ограничены и непрерывны справа. Покажем, что каждый из них является регулярным, если регулярен потенциал П = (щ, &~t). Из (3.77) и (3.78) следует, что для каждого лг ===== 1, 2, ... где потенциал Zi = М [ Лео - № | *Г<] - (At - В\п)). Пусть последовательность марковских моментов хт \ т. Тогда по теореме 3.5 Мя{.п) ^Мл£п), М^ ^ Мгт, и, следовательно, lim Мл1п) > Мя(тя), Нт Мгх = Мгт. (3.80) На самом же деле оба эти неравенства являются равенствами, поскольку потенциал Я/, /^0, регулярен: lim MnXm = Мят. т->оо Итак, каждый из потенциалов п\п), п=1, 2, ..., является регулярным, ограниченным, и, согласно проведенному выше доказательству, отвечающие им натуральные возрастающие процессы В\п\ t^0y непрерывны с вероятностью 1. Для потенциала 2 п\п) соответствующим натуральным про- П=\ 00 цессом является процесс В, = 2 Щп\ где каждый из процессов В[п\ t^O, непрерывен. Этот процесс также является непрерывным. Действительно, 0^Bt- % в[п) ^В»- jj В{£ (Р-п. н.), (3.81) я=1 /г=1 N где с вероятностью 1 В^-Цб^О, N->oo, поскольку МВ0О=м|]ВЙ) = МЛ0О<оо. Из (3.81) следует, что процесс Bti /^0, непрерывен с вероятностью 1. Для завершения доказательства осталось лишь заметить, что из единственности разложения (3.77) с натуральным процессом At, />0, вытекает, что Р(Л/ = В/)=1> />0. Отсюда следует, что в разложении (3.77) натуральный процесс Ati t^O, можно выбрать непрерывным с вероятностью 1.
ГЛАВА 4 ВИНЕРОВСКИИ ПРОЦЕСС. СТОХАСТИЧЕСКИЙ ИНТЕГРАЛ ПО ВИНЕРОВСКОМУ ПРОЦЕССУ. СТОХАСТИЧЕСКИЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ § 1. Винеровский процесс как квадратично интегрируемый мартингал 1. Пусть (Q, #", Р) — некоторое вероятностное пространство и Р = (Р/)> f^Oi — процесс броуновского движения (в смысле определения § 4 гл. 1). Обозначим <Г$ = о{(о: ps, s</}. Тогда согласно (1.30) и (1.31) Р-п. н. M(M^S) = pe t^sf (4.1) M[(p,-ps)2|^] = /-5, г>5. (4.2) Отсюда следует, что процесс броуновского движения р является квадратично интегрируемым (Мр? < оо, t^6) мартингалом (относительно системы а-алгебр Fp = (#"?), t^O) с непрерывными (Р-п. н.) траекториями. В определенном смысле справедлив и обратный результат, для формулировки которого введем следующее Определение 1. Пусть (Q, !Г, Р) — вероятностное пространство и F = (&~t), />0,— неубывающее семейство а-под- алгебр Т. Случайный процесс W = {Wti @~t), *>0, называется винеровским (по отношению к семейству F = (#",), t ^ 0), если 1) траектории Wt> *>0, непрерывны по t Р-п. н.; 2) W = (Wtf @"t), t^Q, является квадратично интегрируемым мартингалом с W0 = 0 и M[(Wt-Wsf\&~s] = t-s, t>s. Теорема 4.1 (Леви). Всякий винеровский процесс W = = (И^/> &"t)> t^0> является процессом броуновского движения.
92 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Замечание 1. Эту теорему можно переформулировать следующим эквивалентным образом: всякий непрерывный квадратично интегрируемый мартингал W = (Wh@"t\ /^0, с U?0 = 0 иМ[(^ — Wsf\ SFS] = t — s является процессом со стационарными независимыми гауссовскими приращениями с М [Wt — WS] = Q, M[Wt-Ws]2 = t-s, t^s. Замечание 2. В силу теоремы Леви в дальнейшем мы не будем различать винеровские процессы и процессы броуновского движения р = (р,), t^O, поскольку последние являются винеровскими относительно системы cr-алгебр Fp = (#"?), /^0. Замечание 3. Полезное обобщение теоремы Леви, принадлежащее Дубу, будет дано далее в гл. 5 (теорема 5.12). Доказательству теоремы 4.1 предпошлем две леммы. Лемма 4.1. Пусть а — марковский момент (относительно i7 = (^L),/>0), Р(а<Г)=1, Т<оо и Wt = WtA<»$~t = $~tAo- Тогда W = {WtiTt\ t^zO, — мартингал, M(Wt-Ws\<Ts) = 0 (4.3) и М [(f, - Wsf\ §TS\ = М [(/ Л а) - (s А а)\ <FS], t > s. (4.4) Доказательство. Для доказательства достаточно применить теорему 3.6 к мартингалам W = {Wt9iFt) и (W) — t, &~t), Лемма 4.2. Пусть X = (xt, !Ft), 0</< Т < оо, — непрерывный ограниченный (P{sup | xt \^К < °°) = 1) мартингал и t <7 функция f(x) непрерывна и ограничена вместе со своими частными производными f [х)у f"(x). Если для любых 5, t, 0 <! 5 <! t < Т, t Ml(xt-xsy\<rs} = JM[gu\$~s}du (4.5) S с некоторой измеримой функцией gu^gui®)* при каждом и, т 0^и<Т, являющейся $Г и-из мери мой и такой, что М g2udu<oo, о то Р-п. н. t M[f{xt)\?;] = f{xs) + ^jbA[f»(xu)gu\Ta]du, s</<7\ (4.6) s Доказательство. Для заданных s, t (0^5</^Г) рассмотрим разбиение отрезка [s, t] на п частей, $ззйя)< <t\n)< ... <t%}^t, такое, что maxf^i — tf]-+09 п->оо. i
§ 1] ВИНЕРОВСКИЙ ПРОЦЕСС 93 Тогда, очевидно, и по теореме о среднем /(**<«> ) — f(xt(n)\ = f/^t(n))\xt(n)] — **<«)] + где А/Г = Г (*,<*> + в [*,<»> i - *,<„)]) - /" (*,(»>) , а 0—-случайная величина, 0^0^ 1. ЯСНО, ЧТО (П) Л*) Поэтому mf(xt)-f(xs)\^s]=^ J* M^[xt^gu\r^du + Ля) /=0 f(n) / rt-1 1 +tSm(aT[^i-*«H,I^I- (4,7) /=o Покажем теперь, что при п->оо Р-п. н. Лп) п-1 7+1 2 J М [Г (*,<»>) £„ | *-,] <*" - J M [/" К) *„ | *-.] rfa (4.8) /=0 ,(n) / n-1 ,S M ( Af" [*% ~ XTJI *"'}"* °" (4'9) С этой целью определим
94 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Тогда при п->оо t(n) /=о t(n) 1 = I М [Гя (и)8и\<Г Jdu-> j* М[Г К)£„1IT, ]<*« S S в силу теоремы 1.4 и того, что f£ (")->/"(*„) (Р-п. н.). Далее, м I § м ja/; Ytfi -xtf]2\г*)|< <S,M|A/;K(„, -xrfKMfmaxlA^lS1 [*,<») -*,<»)121 < /=o ' ' I /+i / J I L /.e ' ' '/=o L /+i / J J / Гя-l ]2\l/2 < (M ["»»■! Д/ГIГ •MIg [x^ - xtf)]2\) . Ho M[max| Д/"|]2->0 при п->оо в силу непрерывности с Ве- роятностью 1 процесса xt, 0<^<Г, и ограниченности функции f"(x), а (/г-1 12 //г-1 \2 S \xtm | — xtf)}2) = м ( S [4^ + **<«> — 2х№4*1 J ) = (/г-1 /г-1 \2 S H(n£i—^(/г)]—2 2 *<(/г) [л:^/г)1—*Н J ^ < 2М (л:2 — *2)2 + 8М ( J] *#о К(«> t — xt(n)] J = /г-1 = 2М (jcf - *2)2 + 8 ^ М [ Y (*,^ - *,(„))]2 = Лп) /г-1 '/+1 <8/C2 + 8/C2jMg2^<oo, что и доказывает (4.9).
§ 1] ВИНЕРОВСКИП ПРОЦЕСС 95 Лемма 4.2 доказана. 2. Доказательство теоремы 4.1. Пусть а^ = = inf it < Т: sup \WS\ = N}, oN = T на множестве {о: sup \WS\< <N}. Обозначим также WN(t)=WtAoN и 9ri = gri Да^ q0_ гласно лемме 4.1 {WN{t\ 3Tt\ 0^'^Л является мартингалом с t = / M[%N(u)\^s\du, s где f 1, <tw>m, Тогда по лемме 4.2 для любой функции f(x), ограниченной и непрерывной (вместе со своими производными f'(x) и /"(*)), М[/(ГИ0)1^.Лал] = = f(WN(s)) + j j M[r(WN(u))%N(u)\PsA<,N]du. (4.10) Заметим теперь, что с вероятностью 1 при N->oo WN(u)-+WU9 %N(u)^l9 °n->T, a ^saon\ @~s- Поэтому из (4.10), применяя теорему 1.6, предельным переходом по N->oo получаем, что t mf(Wt)\s;]=f(w,)+j$mr(w«)\*:]du. (4.n) S Положим f(x) = eax, где — оо<Л<оо. Тогда из соотношения (4.11) (примененного к действительной и мнимой частям этой функции) получаем М [е1Ш* | <FS] = eim* - -£ \ М \е1Ш» \ <FS] du. (4.12) Пусть yt = M[eawt\&-s], <>s, с ys = eav: Тогда в силу (4.12) для />s
96 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Единственное непрерывное решение yt этого уравнения с на- чальным условием ys = e s задается формулой yt = yse 2 , откуда получаем M[ea(w<-ws)\<rs\ = e-T«-\ (413) Из этой формулы видно, что приращения Wt— Ws не зависят от случайных величин, измеримых относительно а-алгебры #"5, /^s, и являются гауссовскими со средним M[Wt — Ws]==0 и дисперсией D[Wt — Ws] = t — s> Теорема Леви доказана. 3. Приведем также многомерный аналог этой теоремы. Теорема 4.2. Пусть W = {Wti^t), f>0, Wt = (W{(t)9 ... ..., Wn{t))> — n-мерный непрерывный мартингал с P(tt^£(0) = 0)= 1, 1<я, M[Wi(t)\Ps] = Wi(s), />5, Р-п. н. и m(W(-W8)(Wt-W8y\9-8] = E-(t-s), (4.14) где Е = Е(пХкп) — единичная матрица порядка пу^п. Тогда W = (Wf, 9~t\ t^O, является n-мерным процессом броуновского движения с независимыми компонентами. Доказательство мало чем отличается от доказательства в однохмерном случае. Полагая a,v = infW<r: sup JZ\W,(s)1=n) I s<t /«I J и aN = T на множестве { о: sup 2 I W7/ (s) | < N }, сначала ( s^t j=\ J тем же путем устанавливаем, что для любой функции / = = /(*!,..., хп\ ограниченной и непрерывной вместе со своими производными f и /"д lxt*f M[/(^(0,...,^(0)I^.AaJ=/(tfr(5)f...> W(nN\s)) + + tJ SM[f*A(^(^ ••- ^»(«))Xiv(tt)I^AaJ^ (4Л5) где У<0 = 1М/Ла„), X,(«) = {i; ^ Отсюда после предельного перехода при N-+oo получаем, что М[/(Г,(/) Wn(t))\^s] = f(Wl(s), ...,W„(s)) + + jj*2> [/;(*,(«),.... ^я(«))|^,]л. (4.16)
ВИНЕРОВСКИЙ ПРОЦЕСС 97 Беря затем f(xu ..., .*:„) = ехр L /=i 2il AjXj ]•» аходим M jexp \i £ %,(W, (0-^/(5)) I L /=1 J P. = = expj-i^^-S) , (4.17) что и доказывает требуемый результат. 4. В заключение этого параграфа, посвященного винеров- скому процессу W = (Wt, #",), t^O, приведем один результат о непрерывности семейства of-алгебр $Ft . Теорема 4.3. Пусть (Q, #~, Р) — полное вероятностное пространство, W = (Wt, &~t), t^O, — винеровский процесс на нем. Пусть #Т = а{(й: WSf s</}, причем предполагается, что 3~Y пополнены множествами из &', имеющими Р-меру нуль. Тогда семейство а-алгебр \@~Y), t^Q, непрерывно: для всех t > 0 ТТ. = 1ГГ = ГТ+, где <ГГ = <Г*. Доказательство. Непрерывность слева, ^Y^ = ^f9 легко следует из непрерывности траектории винеровского процесса. Действительно, тТ-=о I (J тТ\ и 3~Y=°(\J$~Yl} &~w{t)\ где Tw (t) = a {Wt}. Но Wt = lim Wn где г — рациональные числа. Поэтому g~w(t)c=o(\Jg-Y\, и, значит, TJ_ = TJ, Несколько сложнее доказывается непрерывность справа Пусть t> s. В силу (4.13) М (eizwt | Т7) = М [М («ter* \ Fs) | г7] = «"Г|~* ""*'. (4.18) Пусть е таково, что 0 > е < t — s. Тогда М (*"»* | <гГ+) = М [М (e"F« | <Г£.) I *Т+] = = M[exp{/zr,+e-4('-*-e)}|^r+]. (4.19) Переходя к пределу при е J, 0, находим, что М[e"*t|ТТ,] = М [ехр{Ш.--£(/- s)}|^f+] = = exp{telF,—£(*-s)}, (4.20)
98 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 поскольку Ws измеримо относительно !FY+. Следовательно, M[elzWt\rY\ = M[elzW'\rY+]. (4.21) Отсюда вытекает, что для любой измеримой ограниченной функции М [/ (Wt) |<ГГ] = М \f (Wt) I *T+]. (4.22) Пусть теперь s<tl<t2 и f{(x)t f2(x) — две ограниченные измеримые функции. Тогда согласно предыдущему равенству м [/, (П) h (w<) | ^7] - м [м (/„ (wh) | wt) и (wt) | rj] = = M [M (ft {Wt) | IT,) U {Wt) | fjr] = M [/ (W , j f (Wt) | *-*] (4.23) и аналогично м П ?,(*,,) | <Tf] = М [Й /,(Wtj)| <F&] , (4.24) где 5 < ^ < ... < /„, a f/ (л:) — измеримые ограниченные функции, /=1, ..., п. Отсюда следует, что для t>s и любой #Т-измеримой ограниченной случайной величины г| = г| (со) Mh|5rf]=Mhl^f4 (4.25) Беря, в частности, ^"^-измеримую случайную величину rj = Ti(o)), находим, что М(г\\@~Т) = ц (Р-п. н.). В силу полноты а-алгебр &'s, #"s+ отсюда вытекает, что х\ является £FS -измеримой. Следовательно, TY ^&~Y+- Обратное включение ff~Y ^&~Y+ очевидно. Поэтому #"7 = #"?+. Теорема доказана. § 2. Стохастические интегралы. Процессы Ито 1. Будем считать заданным вероятностное пространство (Q, (F, Р) с выделенным в нем неубывающим семейством а-под- алгебр F = (^), t^O. Далее всюду будет предполагаться, что каждая а-алгебра Ть t^O, пополнена*) множествами из #", имеющими нулевую Р-меру. Пусть W = (Wt, &~t), *>0, — винеровский процесс. В настоящем параграфе будет приведена конструкция и даны свойства стохастических интегралов It(f) вида \ f(s, co)dWs для о некоторого класса функций / = f(s, о). Прежде всего отметим, *) Такое предположение дает возможность выбрать у рассматриваемых на (Q, Т, Р) случайных процессов модификации с нужными свойствами измеримости (см., например, замечание к лемме 4.4).
§2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО 99 что интегралы такого типа нельзя определить как интегралы Лебега — Стилтьеса или Римана — Стилтьеса, поскольку реализации винеровского процесса имеют неограниченную вариацию на сколь угодно малом интервале времени (гл. 1, § 4). Однако винеровские траектории обладают все же некоторыми свойствами, которые в каком-то смысле аналогичны конечности вариации. Лемма 4.3. Пусть О = t(Qn) < t\n) < ... <№ = t-разбиение отрезка [О, /], причем max[//+i — №]->0, n->oo. Тогда i l.i.m. S \Wf{n) -W<n)f = t (4.26) и с вероятностью 1 lim2p> -Wt(n)f = t. (4.27) П t=0 L 4 + 1 fi J Доказательство. Поскольку при любом п м2[г,<»> -w{n)}2=t, t=o L ч+i U J то для доказательства (4.26) достаточно проверить, что D 2 W (*) — W(n)]2->0, /г->сх>. Но в силу независимости и /=о L 'ж ч J гауссовости приращений винеровского процесса D2 \*м - и>Г -2 S [<№. - Л2 < <2/max[#Ji — 4n,]->0, /*-►«>. i Доказательство равенства (4.27) проведем в предположении, что t{{l) = -!-t (в общем случае доказательство несколько сложнее). Для этого воспользуемся следующим общим фактом. Пусть {In, лг = 1, 2, ...} — последовательность случайных величин и для каждого г > 0 2Р{1!„|>г}<°°. (4.28) /г=1 Тогда 1п->0 с вероятностью 1 при п-+оо. Действительно, пусть Агп = {ы: \1п\> А и B8 = limsupi4^ = п оо оо 5=3 П U А*- Тогда {со: £n(co)7*0} = (jsl/*- Но в СИЛУ <4-28) n=l m=n k
100 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 по лемме Бореля — Кантелли (гл. 1, § 1) Р(Ве) = 0. Поэтому Р{со: £„>0} = 0. Возвратясь к доказательству (4.27), где t(il) = -^tf положим mil я п J > MUnl4 В силу неравенства Чебышева P{IEnl>e}<- Используя независимость приращений винеровского процесса на непересекающихся интервалах и формулы M[Wt-Wsfm = (2m-l)\\(t-s)tnf m = 1, 2, ..., нетрудно подсчитать, что mi; «с (if,, где С — константа. 00 Поэтому ряд 2 Р{1 In I > в} < оо, и согласно сделанному /г=1 выше замечанию £,г->0 (Р-п. н.), /г->оо, что и доказывает (4.27) в предположении //tt) = — t: Замечание. Утверждения (4.26) и (4.27) символически часто записывают в следующей форме: t t \{dwsr=\ds. О О 2. Определим класс случайных функций f = f(t, со), для которых будет построен стохастический интеграл f(s, (u)dWs. о Определение 2. Измеримая (по паре переменных (t, о)) функция f = f(ty о), t^Oy (oeQ, называется не упреждающей (по отношению к семейству F = {@~t\ t^O), если при каждом t она #",-измерима. Определение. 3. Неупреждающая функция f = f(ty со) называется функцией класса $?т, если Р J>(/, ю)Л<оо| = 1. (4.29)
§2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО 101 Определение 4. Неупреждающая функция / = /(/,©) называется функцией класса 3№г, если г М J/2(f, co)d/<oo. (4.30) о Замечание. Неупреждающие функции часто "называют также функциями, не зависящими от «будущего». В соответствии с определениями § 2 гл. 1 неупреждающие -функции f = f(t, о) — это измеримые случайные процессы, согласованные с семейством F = (@~t)> t^.T. Очевидно, что при любом Т>0 &Т=>ШТ. По аналогии с обычной теорией интегрирования естественно сначала определить стохастический интеграл /,(/) для некоторого множества «элементарных» функций. Это множество должно удовлетворять следующим двум свойствам: с одной стороны, оно должно быть достаточно «богатым», чтобы функциями из него можно было «аппроксимировать» любые функции из классов Шт и !?Ту и, с другой стороны, таким, чтобы можно было просто описать свойства стохастических интегралов от его представителей. Такой класс «элементарных» функций составляют вводимые в определении 5 простые функции. Определение 5. Функция e — e(t, о), О^^^Г, называется простой, если существует конечное разбиение 0 = t0< <t\< ... <tn = T отрезка [0, Г], случайные величины а, а0, ..., ая-!, где а ^0"измеРима> а at #"^-измеримы, / = = 0, 1, ..., п—1, такие, что е (*, со) = аХ{0} (t) + 2 a,xfti ,f+l] (0 (%{0}(t) — характеристическая функция «точки» {0}, а %(tt i — характеристическая функция полуинтервала (th ti+]\) и e^WlT). Замечание. Простые функции e = e{t, о) определены как функции, непрерывные слева. Этот выбор мотивируется аналогией с обычным интегралом Стилтьеса, определяемым так, что если a = a(t)—неубывающая непрерывная справа функция, то 00 j* Xiu. v] (0 da (t) = a(v) — a (и). о То обстоятельство, что при построении стохастического интеграла по винеровскому процессу мы отправляемся от «элементарных» функций, непрерывных слева, не является существенным. Можно было бы в качестве «элементарных» взять
102 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 ступенчатые функции, непрерывные справа. Однако это обстоятельство становится существенным при построении стохастических интегралов по квадратично интегрируемым мартингалам (см. § 4 гл. 5). 3. Для простых функций e = e(t, о), 0^/^7\ стохастический интеграл It(e) по определению полагается равным /,(.) = «*„ + S <л«|[^|+|-^] + *.+.1^-^ж+1] или, так как P(U70 = 0)=1, ш- ц <ft«i[^,+I-^a+e«+.[^-^+,]- (4-31) Для краткости вместо сумм в (4.31) будем использовать следующую (интегральную) запись: t Il(e)=je(s,<*)dWs. (4.32) о t Под интегралом [ е(и, <o)dWtt будет пониматься интеграл It{e), где ё{и,-в>) = е(и, <o)%(u>s). Отметим основные свойства стохастических интегралов от простых функций, непосредственно вытекающие из (4.31). U (ati + be2) = alt (е{) + Ы{ (е2), a, b = const. (4.33) t и t j e{s, (*)dWs= je(s9 (o)dWs+j e{s, «>)dWs (Р-п. н.). (4.34) 0 0 и It{e) — непрерывная функция по t, O^t^T. (4.35) MM e(u, v>)dWu\9-8)= j e{u9 a>)dWu (Р-п. н.). (4.36) Ml J e{{u, (u)dWu\ J e2(u, (u)dWu\ = M J e{{u, a>)e2(u, a>)du. (4.37) Если e(s, co) = 0 для всех s, 0<s<;7\ и (oG^f7, to J e(st ®)dWs = 0, f<7\ о Процесс lt (e), 0 < / ^ Г, прогрессивно измерим, и, в частности, It(e) STfизмеримы при каждом t, 0^/^Г.
§ 2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО ЮЗ Из свойства (4.36), в частности, следует, что t М J e{u9 (u)dWu = 0. (4.38) о 4. Отправляясь от интегралов It(e) от простых функций, определим теперь стохастические интегралы It(f), tk^.T, для функций f^WlT. Возможность такого определения основывается на следующей лемме. Лемма 4.4. Пусть функция /еЗ№г. Тогда найдется последовательность простых функций fni /г=1, 2, ..., таких, что т М /[/(*, ©) —М*, ю)]2Л->0, *-*«>. (4.39) о Доказательство, а) Прежде всего заметим, что без ограничения общности можно считать функцию /(/, со) ограниченной, | f(t, со) |<С < оо, 0<*<7\ ©ей. (В противном случае можно перейти от f(t, со) к функции f{N) (t, со) = *=/('. <u)%N(t, со), где х"('.®)-{0э lf{ttu)\>fft т и использовать то, что М ) | f(t, со) — f{N) (/, co)|2d/->0 при о N~+<x>.) Далее, если Г=оо, то сразу можно считать, что функция f(t, со) финитна, т. е. обращается в нуль вне некоторого конечного интервала. Итак, пусть \f(t, со)|<С< оо, Г<оо. б) Если функция f(t, со) непрерывна по t (Р-п. н.), то последовательность простых функций строится просто. Например, можно положить с и ч ,(kT \ kT ■, ,^ (k+ \)T fn(t>*) = f(—. ©). — <t<^~fl • Тогда (4.39) выполнено по теореме Лебега о мажорируемой сходимости. в) Если функция f(tf со), 0</<Г, coeQ, прогрессивно измерима, то построить последовательность аппроксимирующих Функций можно следующим образом. Пусть F(t, со) = J f(s, co)ds, о где интеграл понимается как интеграл Лебега. В силу прогрессивной измеримости функций /(5, со) процесс F{t, со),
104 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 О^^Г, измерим и при каждом / случайные величины F(t, со) ^"(-измеримы. Положим ^т ] f(s, a)rfs(=[FU, «)-F((/-^)vO, ©)]/-^). Случайный процесс fm{t, о), 0<^<7\ (ogQ, измерим, является неупреждающим и имеет Р-п. н. непрерывные траектории. Поэтому согласно пункту б) для каждого т существует последовательность неупреждающих ступенчатых функций fm,rt(/, ©), /1=1, 2, ..., такая, что г MJ[fm(U ©)-f«.»(/, а>)РЛ-*0, >г-*оо. о Заметим теперь, что Р-п. н. для почти всех t^T существует производная F'(t9 ©) и f,(/, ©) = /(£, о). Но в тех точках, где производная /"(/, о) существует^ F'(f, ©) = lim m|>(f, ©)-W(f--l) V0, со)] = lim f^f, со). Поэтому для почти всех (t, со) (по мере dtdP) lim fm(£, ©) = = f{t, со) и по теореме Лебега о мажорируемой сходимости т M\[Jm(t, ©) — /(*, ©)]2fltf-*0, т->оо. о Этим утверждение леммы доказано в случае, когда функции f(t, ©), 0</<!7\ (ogQ, прогрессивно измеримы. г) В общем случае доказательство проводится следующим образом. Доопределим функцию f(t, ©) для отрицательных t, полагая f(t, ©) = f(0, ©). Будем считать функцию f(t, ©) ограниченной и финитной. Положим +»(') = ^г. 4r<t<^, 7 = 0, ±1, ..., и заметим, что функция f„(/, ©) = £[i|)n(f— s) + s, ©] является при каждом фиксированном g простой. Лемма будет доказана, если показать, что можно так выбрать точку 5, что будет выполнено (4.39).
§ 2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО 105 Для доказательства воспользуемся следующим замечанием: если f = f{t, со), *>0, ©eQ, — измеримая ограниченная финитная функция, то оо lim M f [f (s + h, со) — / (s, со)]2 ds = 0. (4.40) Действительно, согласно пункту в) для всякого е > 0 найдется такая Р-п. н. непрерывная функция fe(t, со), что оо Mj[f.(S, Co)-f(s, Co)]2ds<82. о Но тогда в силу неравенства Минковского оо -, 1/2 М/[/(* +Л, co)-/(s, co)]2ds lim Л-»0 1/2 г оо -, i/z "m M f[fe(s + A, co)-fe(5, (o)]2ds\ +2e, ^°L o J откуда в силу произвольности е > 0 следует (4.40). Из (4.40) вытекает также, что для любого /^0 оо limM f [/(s + f + Л, со) — f(s + f, co)]2ds = 0 ft + 0 J и, в частности, 00 lim М f[/(s+ *„(*), «) —f(s + <, co)]2rfs = 0 и оо оо lim M f f [f{s + %(t)> a) — f{s + ty o)]2dsdt = 0. n + oo -J J Из последнего равенства следует, что существует такая последовательность чисел nh /=1, 2, ..., ^->оо, что для почти всех (5, /, о) (по мере dsdtdP) [f(s + *i,(0. ©)-/(* + *, со)]2-* О, az,->oo. Отсюда, переходя к новым переменным w = s, v = s + tf получаем, что для почти всех (uf v, со) (по мере du dv dP) [f (и + ЪП1{о — и)> ©) — /(»• о)]2-*0, ^->оо,
Юб СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 и, значит, найдется такая точка u = s, что оо lim M J [f (и + %t(v — й), со) — f(v, a>)fdv = оо = lim M f \f(s + %(t-s), ©)-/(/, a>)fdt = 0. ni-*°° о Лемма 4.4 доказана. Замечание. Если случайный процесс f(t, со), 0^/^Г<оо, является прогрессивно измеримым и PI | | f(t, со) \dt < оо 1 = 1, то процесс F(t, о)= | /(5, w)flfs, 0^/^7\ где интеграл пони- 0 мается как интеграл Лебега, является измеримым и F-согла- сованным и, более того, прогрессивно измеримым (как имеющий Р-п. н. непрерывные траектории). Если же измеримый случайный процесс f(/, со), 0^/^ ^ Т < оо, Р I J | f(ty о) \dt < оо I = 1, является ^-измеримым при каждом t, 0^.t^Tf то у него существует (§ 2 гл. 1, п. 1) прогрессивно измеримая модификация f (t, со), и тогда процесс F(t, co)= I f (s> ®)ds также прогрессивно измерим. Покажем, о что F(ty со) является (прогрессивно измеримой) модификацией процесса F(t, со). Действительно, пусть Xs (°>) = %{G): f(St ^f {St tt)). Тогда по тео- т т реме Фубини М [%s(co)ds = [ M%s (о) ds = 0, и, следовательно, о о т Р-п. н. jxa(^)ds = 09 а значит, и P(F(/, со) = F (*,-со)) = l, f<7\ о Как было отмечено в начале данного параграфа, предполагается, что а-алгебры yt пополнены множествами из !Г, имеющими Р-меру нуль. Поэтому из того, что F(t, со) являются при каждом t^.T ^-измеримыми, вытекает, что и F(t, со) также #"гизмеримы для каждого t^.T. Учитывая также то, что процесс F(t, со), t^T, непрерывен, t получаем, что интеграл F(t, o)= J /(s, co)ds, t^T> от не-
§ 2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ ПРОЦЕССЫ ИТО (Q? упреждающего процесса f(s, со), s<!/, является прогрессивно измеримым случайным процессом. Приведенные рассуждения можно использовать (в случае, когда а-алгебры STt пополнены множествами из &', имеющими Р-меру нуль) для доказательства п. г) леммы 4.4 сведением к случаю, рассмотренному в п. в). Однако доказательство, приведенное в п. г), имеет ту ценность, что оно указывает способ построения простых функций fn(t, со) непосредственно по значениям самой функции f(t, со). 5. Итак, пусть /е9№г. Согласно только что доказанной лемме существует последовательность простых функций fn(t, со), для которых выполнено (4.39). Но тогда, очевидно, и т lim M \[fn(t9 <o)-fm(t, со))2 dt = 0, m-x» u а следовательно (по свойству (4.37)), lim M tl->oo m->oo L0 0 T jfn{t,(o)dWt-jfm(t,<i>)dWt\ 0 J T = lim M f [fn(t, (o)-fm{t, a)]4t = 0. (4.41) rt->oo Таким образом, последовательность случайных величин IT(fn) фундаментальна в смысле сходимости в среднем квадратиче- ском и, значит, сходится к некоторому пределу, который будем т обозначать 1Т (/) или /r(f) = U.m./r(f„). (4.42) П Значение (с точностью до стохастической эквивалентности) этого предела, как нетрудно показать, не зависит от выбора аппроксимирующей последовательности {/„, п = 1, 2, ...}. Следовательно, данное определение стохастического интеграла IT(f) корректно. Замечание 1. Поскольку значение стохастического интеграла IT(f) определено с точностью до эквивалентности, условимся считать IT(f)=Q для всех тех со, для которых f(t, со) = О при всех 0</^Г (ср. со свойствами стохастических интегралов от простых функций, п. 3).
108 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Пусть снова f e Шт. Определим семейство стохастических интегралов It(f) при 0<г<7\ полагая /,(/) =/г (/%), т. е. It(f)=jf(s,«>)%t(s)dWs Для It(f) естественно пользоваться также записью It(f)=jf(s,<*)dWs (4.43) (4.44) Остановимся на основных свойствах стохастических интегралов It(f), 0<*<7\ от функций f, fi^WlT, /=1, 2. lt(afi + bf2) = ali{fl) + bli(f2)9 a, 6 = const. (4.45) t и t J f (5, CD) dWs = j f (S, CD) dWs + | / (S, CD) dWs, (4.46) 0 0m где t T и 0 a X[U, /)(5) — характеристическая функция множества и ^.s^.t% It(f) — непрерывная функция по t, О^^Г, (4.47) M [jV CD)drjSTs = //(и,а>)<ЯРв, s<*. (4.48) M J* f, (и, cd) dWu J f2 (и, cd) dH?„, = M J /, (и, cd) /2 (w, cd) du. 0 J Lo Jo (4.49) Если /(s, CD) = 0 для вСЯЛТ 5, O^S^ Г, И (DG^Gfr, TO j f{s9a>)dWs = 0, f<7\ CDS Л. (4.50) Процесс It(f), 0<*<7\ f^3RT) прогрессивно измерим, и, в частности, It (f) £Ггизмеримы при каждом t, 0 ^ t <! Г. Для доказательства (4.45) достаточно выбрать последовательности простых функций f[n) и f(2n) такие, что М J(/,—/^ds^O, n->oo, /=1, 2,
§ 2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО [Q9 и затем совершить предельный переход в равенстве It (afl»> + bff) = alt (/<»>) + blt (/<«>). Аналогично доказывается и свойство (4.46). Свойства (4.48) и (4.49) следуют из свойств (4.36) и (4.37), поскольку из сходимости случайных величин в среднем квадра- тическом вытекает сходимость их моментов первых двух порядков. Свойство (4.49) можно несколько обобщить: МП/, (и, со) dWa J f2(u, <u)dWa \гЛ — = M j/i(w, a>)f2(uy a>)du\ Fs S Проверка этого свойства проводится обычным порядком: сначала устанавливается его справедливость для простых функций, а затем совершается соответствующий предельный переход. Свойство (4.50) вытекает из сделанного выше замечания 1. Покажем теперь, что процесс It(f), 0<!^7\ прогрессивно измерим и, более того, имеет Р-п. н. непрерывные траектории (точнее, имеет модификацию с этими двумя свойствами). Для доказательства заметим, что для простых функций fn процесс {It(fn)> @~t)> Q^t^.T, образует непрерывный (Р-п. н.) мартингал (по свойствам (4.35) и (4.36)). Поэтому по теореме 3.2 t t Р \ sup >ч< \fn(sf.<tidW8-jfm(s,a>)dWa Г о <^ м\ \ [fn(s, <»)-fm(s, u)]dWs\ - т =-F M j Vn (s> ">) - L (s. ®)12 ds. (4.51) 0 Выберем последовательность простых функций fn> сходящуюся * к /еЗ№г, так, чтобы /0 = 0> т М J [f(s, ©) — fn{s, w)]2ds-»0, л-►оо, о и г М J [/„+I (s, со) - fn (s, со)]2 ds <^r. (4.52)
НО СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ Заметим теперь, что ряд [ГЛ. 4 J h (s, со) dWs + N (f2(s, со) - h (s, со)) dWs + + \j(fn+i(s,<*)-fn(s,<»))dWs + ... сходится в среднеквадратическом к | f (s, (u)dWs и члены этого о ряда Р-п. н. непрерывны по t, 0^<Т. Далее, согласно (4.51) и (4.52) t | Ч 00 ' /г=0 J P sup И (f„+1 (s, со) - fn (s, о)) ЙГ5 п=о '*<Г|о Поэтому в силу леммы Бореля — Кантелли с вероятностью, равной единице, найдется такой (случайный) номер N = N{(o), начиная с которого t sup J(fn+l(s,<»)-fn(s,<0))dWs <4 n>N. Следовательно, ряд из непрерывных функций t 00 Г t -1 j fx (5, (О) dWs + ]£ J (fn + i (5, CO) - /„ (*, ©)) ИГ, 0 n=I U J сходится равномерно с вероятностью 1 и определяет непрерывную функцию (Р-п. н.), которая при каждом t является ^-измеримой *). Из этих двух свойств вытекает, что случайный процесс, определяемый этим рядом, является прогрессивно измеримым (гл. 1, § 2, п. 1). Таким образом, мы видим, что можно так выбрать последовательность простых функций /я, удовлетворяющих свойству (4.52), что построенные с их помощью интегралы /*(/), 0<^^Г, будут непрерывны по t, 0<!/^7\ с вероятностью 1. Поскольку с точностью до стохастической эквивалентности значения It(f) не зависят от выбора аппроксимирующей последовательности, то отсюда следует, что у интегралов It(f) существует непрерывная модификация. В дальнейшем при рассмотрении интегралов /* (f), *) НапЪмним, что сг-алгебры ^Гt предполагаются пополненными множествами из & нулевой вероятности.
§2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО 111 /еЗЯг, будет предполагаться, что It(f) имеют непрерывные Р-п. н. траектории. Замечание 2. Отметим, что из построения аппроксимирующей последовательности {/„, лг = 1, 2, ...} со свойством (4.52) вытекает, в частности, что с вероятностью 1 I * г I sup И f{s, a)dW8 — f fn(s, a)dWsUo, n->oo. °<*<т\о о I Иначе говоря, равномерно по t, Q^t^T, с вероятностью 1 t t J* fn(s, со)dWs-> J* f(s, со) dW8t n-+oo. о о Отметим еще два полезных свойства стохастических интегралов It (f), f e TtTi непосредственно вытекающих из теоремы 3.2 и того замечания, что (/^(/), #"*)> О^/^СГ, является квадратично интегрируемым мартингалом с непрерывными траекториями: ' t I V Г J / (5, о) dlTs > Я <-р-1 М/2 (5, со) ds9 (4.53) Pi sup М sup о т J* /(s9 <s>)dW8\ <4 J M/2(5, со) ds. (4.54) Из последнего свойства, в частности, вытекает, что если f е9№г и последовательность функций {/„, /2=1,2, ...} такова, что fn^WlT и г м /[/(/,«>)-М',<«>)Рл-*о, о ТО t t U.m. $ fn(s,®)dW8= J f(s, ®)dW8. n о о Замечание З. Проведенная выше конструкция стохастических интегралов /*(/)> 0<!£^Г, и их основные свойства остаются в силе и в случае Г = оо. Нужно лишь потребовать, чтобы / е Ш^ где ЗИ^ — класс неупреждающих функций f = f{s, со) со свойством J Mf2(st(f>)ds<oo.
П2 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 6. Построим теперь стохастические интегралы It(f), t^.Tt для функций f из класса &т> удовлетворяющих условию Р J>(s, o)ds<oo 1 = 1. (4.55) С этой целью установим сначала справедливость следующей леммы. Лемма 4.5. Пусть f^<FT, Г^оо. Тогда найдется последовательность функций fn <= Шт такая, что по вероятности j[f(t,<»)-fn(t,<»)]2dt-+0y n-+oo. (4.56) Существует последовательность простых функций fn (t, со), для которых (4.56) выполнено как в смысле сходимости по вероятности, так и с вероятностью 1. Доказательство. Пусть /е^г. Положим *И°>) = { inf I t^T: j>(s, <o)ds^N \ l о . ' т Ty если I f2(s, (u)ds < Ny fiv(s,a>) = /(sla>)x{,<Tiv(e)}. (4.57) Поскольку предполагается, что a-алгебры &~ь О^^^Г, пополнены множествами из вГ нулевой вероятности, то, в соответствии с замечанием к лемме 4.4, процесс Г /2(s, (o)ds, /<J7\ о является прогрессивно измеримым. Отсюда вытекает, что моменты т¥((о) являются марковскими (по отношению к семейству (£",), О <*<Г). Поэтому функции fN{s,<u), N=1, 2, ..., являются неупре- ждающими и принадлежат классу Шт, поскольку т J Mf2N(s, <d)ds^N <oo. о Чтобы доказать заключительную часть леммы, воспользуемся леммой 4.4, согласно которой для каждого N=1, 2, ... суще-
§21 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО ИЗ ствует последовательность простых функций /<{*>, п=\, 2, ..., такая, что т М J [ff (t, со) - fN (t, со)]2 dt -+ 0 ft -> оо, о и что (в силу свойства (4.57)) Р \[f(t,<»)-fN(t,«>))2dt>0 <P jf*{t9u>)dt>N\. (4.58) Тогда Р |[/(/,co)-f<;)(/,co)]2rf/>e < I 0 ' <Р /[/(/, со)-Ы^о)]2^>0 + I о ' г Р( jW со) ^ > 7V } +}М | [/„(*, ©)-$>(/, со)]2 Л, о что и доказывает существование последовательности простых функций fn(t, со), аппроксимирующих функцию / в смысле (4.56) со сходимостью по вероятности. Без ограничения общности можно считать, что функции fn уже выбраны так, что Р J J [f V, ©) - fn (t, со)]2 dt > <Tn J < T\ (В противном случае этого можно добиться, рассматривая некоторую подпоследовательность последовательности {/„}, /1=1, 2, ...) Поэтому по лемме Бореля — Кантелли для почти всех со найдутся такие числа N (а), что для всех /z^Af(co) т /[/(/, со)-/„(', со)]2Л<2"п.
114 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 В частности, с вероятностью 1 т Hm f [f(t,(u)-fn(t,(o)Ydt = 0. Лемма доказана. Замечание 4. Если неупреждающая функция / = /(/, со) такова, что с вероятностью 1 т Jl/(*,a>)|rf*<oo, то найдется такая последовательность простых функций {fn(t>a>)y /z=l, 2, ...}, что с вероятностью 1 т Hm f|f(ff ©)-/„(*, ©)|rf* = 0. и. J Доказательство аналогично случаю, когда РМ f2(t, ©)Л<оо) = 1. В дальнейшем нам понадобится также следующее предложение. Лемма 4.6. Пусть f^WlT и событие А е &~т. Тогда для любых N>0, C> О t Р ЛП sup >С < и, б частности, t Р\ sup I 0<*<Г J f {s, ©)- о <^ + Р W//2(s,co)rfs>H (4.59) >С < <-£г+р f2(s,a>)ds>N . (4.60) Доказательство. Пусть функции fN(s,(a) определены формулами (4.57). Тогда по свойству (4.49) IT \2 Г М М fw(s, со)dUM =JM/2A,(s, cu)rfs<W<oo.
§2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО П5 В соответствии со свойствами стохастических интегралов о: sup Поэтому А П <°: SUP = 0 г j[f(s,a>)-fi4(s>(i>)}dWs о I Э со: J>(s, co)ds<# . j[f(s,<*)-fN(s,<*)]dWs\>o\c= = Л Л со: j f2{s,(o)ds>N , и, значит, в силу неравенства (4.53) Р ЛП sup j f(s, со)</ИМ>с) >С = = Р ЛП sup \0<<<Г \fN{s>a)dWs + + f[f(s,v)-fN{s,v)]dW, t J fn («. ®) >C < <P< Л Л sup \o^<<r dW„ >C + + P Л Л sup \o«<r {[/(«.«))-^(5,(0)]йГ, >0 < <P sup o«<r J /w («. <*>) <W, >C + + P ЛП({/2(5,С0)^>^ j}< «TtMM ^(s,©)dfl7j +P Лп(|/2(5,со)^>^|}<
116 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Лемма доказана. Следствие. Если /е9№г, то Ы*,о)^<ЛМП( sup f/(s, <*)dWs >C) )<-£-. oJ / \°<«г|<? I /J C Замечание 5. Утверждение леммы остается справедливым, если в ее формулировке заменить момент Т на марковский момент а, потребовав при этом, чтобы f e 9№a, A e #"0. Перейдем теперь непосредственно к конструкции интеграла М/) для /e=0V, Г<оо. Пусть fn = fn(t, о)), лг = 1, 2, ..., —последовательность функций из класса ШТ) аппроксимирующих функцию f(t, о) в смысле сходимости (4.56). Тогда, очевидно, для всякого е > О Hm P \[fn(t,«>)-fm(t><»)]2dt>e\=0 n,m-»oo [J J и согласно лемме 4.6 для любых г > 0, б > О Hm P л, т-»оо 1 i jfn(t,<*)dWt-jfm(t,v)dWt >6 < <-£■ + lim Р [/Л^,со)-^(/,со)]2Л>е =-^ б2 Отсюда в силу произвольности г > О получаем lim Р л, т-»оо //я(/,©)^-//«(/,©)^ >б =0. Таким образом, последовательность случайных величин т ' \ h(fn)= J fn(U a>)dWt сходится по вероятности к некоторой слу- о т чайной величине, которую мы обозначаем 1Т (f) или J f (t, <£>)dWt о и называем стохастическим интегралом (от функции / е <РТ по винеровскому процессу W = (Wt, &~t), t^.T). Значение Ir (f) (с точностью до эквивалентности) не зависит от выбора аппроксимирующих последовательностей (скажем, {fn} и {gn}> n=l, 2, ...). Действительно, объединяя последовательности {fn} и {gn} в одну, {hn}y устанавливаем существование предела по вероятности последовательности величин IT (hn),
§2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО 117 п_>оо. Следовательно, пределы по подпоследовательностям limIT(fn)> tin\IT(gn) будут совпадать. Конструкция стохастических интегралов IT(f) для t^T в случае функций f^&*T осуществляется так же, как и для f еЗ№г. А именно, мы определяем интегралы It(f)= J f{s, a>)dWs с по- о мощью равенств т It(f)=jf(s,<u)xt(s)dWs, 0</<7\ (4.61) О где %t(s) — характеристическая функция множества 0^5^/. Поскольку (с точностью до стохастической эквивалентности) значение стохастических интегралов /,(/) не зависит от выбора аппроксимирующей последовательности, то при исследовании свойств процесса /,(/), 0<^^7\ можно использовать частные случаи таких последовательностей. В частности, возьмем в качестве такой последовательности функции fN(s, о) из (4.57). Поскольку Р I ( /2(s, ®)ds < оо | = 1, то множество Q' = (J QN, где QN = \ (о: N — 1 < n=i I < | f2(sy ®)ds < N \, отличается от Q на подмножество Р-меры нуль. Заметим теперь, что на множестве QN fN(s> ©) = fiv+i(s, со)= ... =/(5, со) для всех s, 0 ^5^ Т. Следовательно, на множестве QN t t 0 0 Ho fN^WlT. Поэтому процесс It(fN) непрерывен по t, O^t^T, с вероятностью 1 (точнее, имеет непрерывную модификацию). Отсюда вытекает, что на множестве QN стохастические интегралы It(f), f^!PT) O^t^T, образуют непрерывный процесс. 00 Но, как уже отмечалось, Q'= (J QN отличается от Q лишь ЛЛ=1 на множестве Р-меры нуль, следовательно, Р-п. н. случайный процесс /,(/), 0<^<!Г, имеет непрерывные траектории. В силу прогрессивной измеримости процессов //(/#), О^^^Г, это же
118 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 рассуждение показывает, что процесс It(f), ()<*<; Г, также «является прогрессивно измеримым. Замечание 6. Согласно сделанному выше замечанию 2, если /^9№г, то существует такая последовательность {fn> п= 1» 2, ...} простых функций, что равномерно по /, 0</<7\ с вероятностью 1 J fndWs-+ J* /dWs. о о Аналогичный результат сохраняет свою силу и для функций f(=&T (см. [123]). Замечание 7. Полезно также отметить, что неравенства (4.59) и (4.60) сохраняются и для любой функции /е^г. Действительно, пусть {fn, /i=l, 2,...} — последовательность простых функций таких, что \fn(s, С0)|<|/(5, (0)|, 0<S<7\ (DSQ, \[fn(s, ©)-f(s, G>)]2d5->0 (по вероятности) при я->оо. Тогда для любых N > 0У С>0 '>С|}< РМП I sup //(5,со)ЙГ о <Р ЛП sup + Р Af] sup >c|j + jfn(s,<s>)dW, о j*[/(s,<o)-Ms, ©)]drs о <^ + PMn(/^(s,co)dS>^jJ+p|j[/(S)(o)-/„(s,«))]2^>o}. Отсюда, переходя к пределу при п-+оо, получаем требуемое неравенство t РИЛ I sup Jf(S)(0) dWs >С < <-^ + РМпМ f2(s,©)rfs>Jvjl.
§2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО Ц9 Завершая конструкцию стохастических интегралов It(f) для функций f^$PT) отметим их свойства. Свойства (4.45)—(4.47) остаются выполненными. Однако свойства (4.48), (4.49) могут нарушаться (см. ниже замечание 9 в п. 8). Если в случае f^3RT стохастические интегралы (Mf), #"*), 0</<Г, образовали мартингал (притом квадратично интегрируемый), то для функций f^&r это Уже> вообще говоря, не так. Впрочем, в случае f^fPT Ut(f)> @~t)> ^^^» образуют локальный мартингал (см. далее п. 10). 7. Пусть /е^ и т = т(со) — конечный (Р(т < оо) = 1) марковский момент относительно системы (#"Д / ^ 0. Наряду со стохастическими интегралами It(f)= \ f(s, ®)dWa введем о стохастический интеграл со случайным верхним пределом т. Положим по определению 1Х(П = Ш на {со: т(©) = *}• (4.62) Поскольку стохастический интеграл /,(/), /1>0, является прогрессивно измеримым процессом, то по лемме 1.8 /х(/) является ^-измеримой случайной величиной. t По аналогии с обозначением It{f)= \ f(s, со)dWs будем о т использовать также обозначение /t(/)= [ f (s, ®)dWs. о При оперировании со стохастическими интегралами Ix(f) со случайным верхним пределом т полезно следующее равенство: /t(/) = /«.(x-f) (Р-п-н.), (4.63) где % — %{t<X)— характеристическая функция множества {^т}. В иных обозначениях равенство (4.63) можно переписать следующим образом: Т оо J / (s, со) dWs = J %{s<x)f(s, со) dWs (Р-п. н.). (4.64) о о Докажем (4.63) (или (4.64)). Для простых функций f e Tt^ равенство X оо J f(s, <*)dWs= J %{s<x)f(s, *)<№, (4.65) 0 0 очевидно.
120 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Пусть f е ^ и fn е Ш^у п == 1, 2, ..., — последовательность простых функций, участвующих в построении интегралов It(f)> t^O. Поскольку (по вероятности) оо о оо <j[fn(s,<»)-f(s, e>)]2ds-+0, то P-lim f fn(s, *)%{s<x)dWs= J f(s, <»)%{s<x}dWs. (4.66) Заметим теперь, что на множестве {ю: т («>) = /} X f X * J Ms, (o)dlFs= j Ms, ©)dIF„ J /(s, a)dWs = J* f(s, <»)dWs P-lim \fn(s,(*)dWs= \f(s,a>)dWs Поэтому на множестве {ю: т(ю) = *} X * X P-lim f/„(s. <o)d№s = \f(s, <»)dWs (4.67) 0 0 Из (4.65) —(4.67) следует требуемое равенство (4.64). Следующий результат, часто используемый в дальнейшем, является обобщением леммы 4.6. Лемма 4.7. Пусть f = f (t, со), t ^ 0, — не упреждающий (относительно системы F = (&~t), t^O) процесс. Пусть {оп, п= = 1, 2, ...} — неубывающая последовательность марковских моментов, a = \imoni таких, что при каждом п=1, 2, ... РМ /2(s, co)rfs<oo 1 = 1. Тогда для любого события А е &~а и N > 0, С > 0 PUfl sup J* f(s,«>) dW, >C < <-^ + P ЛП J/2(s, co)rfs >yv .
2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО Доказательство. Пусть 121 Тл/=1 infU<a: J* f2(s, a)ds>N L о a, если J /2(s, (o) rfs < N, и fN{s, co) = f(s, co)Xrs<t j. Тогда, как и при доказательстве леммы 4.6, получаем, что PUfl sup lb J* f(s, a)dWs >C <P sup ft >C + + P Ufl sup >0 < <P{sup 1 f* >C +P \Af\ [j'f*(s, <*)ds>N Из теоремы 2.3 и свойств стохастических интегралов следует, что Р sup | fN(s, <u)dWs > С <-!■ М J /2„(s, ®)<*s < £, 0 1^0 что вместе с предшествующим неравенством и доказывает утверждение леммы. Следствие. Пусть Л=|(о: | f2(s, &)ds < оо J. Гогда Р МП 1>ир жестве А \f(s%®)dW{ = оо [ = 0. Иначе говоря, на мно- sup п < оо, Р-п. Н. 8. В качестве следствия равенства (4.64) выведем следующие формулы, известные как тождества Вальда.
122 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Лемма 4.8. Пусть W = (Wt, &~t\ t > 0, — винеровский процесс и t = t(g>) — марковский момент (относительно (STt), t^O) с Мт< оо. Тогда MWx = 0, (4.68) МГх = Мт. (4.69) Доказательство. Рассмотрим неупреждающую функцию /(5, (o) = x{s<t((D)}. Ясно, что Р{ j>(5, со) ds < оо J = Р J f X{S<TM)^} =P{T < oo}= 1, т. е. эта функция принадлежит классу 9^ Покажем, что для t О С этой целью введем для каждого /г = 1, 2, ... марковские моменты хп = -2п на |<о: -^-<т(со)<-2?г|, **п(®) = °° на {®- т((о) = оо} и рассмотрим интегралы * оо О О Если / принимает одно из значений вида 6/2", то тогда очевидно, что I **VdW'- Ih<^)dWs = W^r (4.71) О О В силу непрерывности стохастических интегралов и траекторий винеровского процесса по / равенство (4.71) остается справедливым и для всех t^O. Заметим теперь, что оо оо jM[x{s<Tn)-X{s<T)]2dS={[P(S<T„)-P(S<T)]rf - О О
§ 2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО 123 Поэтому t t Й- / ¥<*«> dw°= / «с<а dr*- <4J2> Сравнивая (4.72) с (4.71) и учитывая, что для всех (o€Q т„(со)|т, приходим к требуемому равенству (4.70). Из (4.70) и (4.64) находим, что Р-п. н. Т оо о о поскольку %2{s<x) = %{s<xy Воспользуемся теперь свойствами (4.47) и (4.48), применимость которых законна, поскольку в условиях леммы оо J M%2{s<x)ds= Мт < оо. Тогда о оо MrT=Mj\s<x}^s=0 0 и / оо \2 оо MW\ = М ( J %{s<%) «ЛГ, - J M^<T) ds = Мт. \o / о Лемма доказана. Замечание 8. Равенство MWx = 0 остается справедливым и при условии М V% < оо (см. [130], [132]). Замечание 9. Условие Мт<оо, обеспечивающее равенства MlFt=Mt, ослабить, вообще говоря, нельзя, что показывает такой пример. Пусть T = inf(^>0: Wt=l). Тогда Р(т< оо)=1, Мт = оо (см. гл. 1, § 4, п. 3) и l = MWx¥=Mt = oo. 9. Пусть f = f{t, со) —произвольная неупреждающая функция, т. е. такая, что, вообще говоря, Р J f2(s, &)ds = оо I > 0 Положим an = inf /<Г: j f2(s, «>)ds>n\
124 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Т считая оп = оо, если | f2(s, a)ds < п, и пусть o = limon. Ясно, о о что на множестве {а ^ Т} J /2(s, со) ds = оо. о Поскольку Р I J f2(s, <u)ds < оо I = 1, то определены стоха- V о / стические интегралы °пАТ Т 1оплт(!)= J f{s,a)dW8=lfn(s9n)dWa9 о о где fn(s, ©) = f (s, co)x{s<a }. Стохастический же интеграл /оЛ7.(/), о вообще говоря, не определен, поскольку | /2(s, (o)ds= оо на о множестве (со: о^Т) Р-п. н., а приведенные выше конструкции стохастических интегралов /0(/) предполагали, что Pff(S,(0)rfS<OO =1, При нарушении условия Р | J f2(s, co)ds < оо \ = 1 можно было бы пытаться определить интеграл Ia(f) как предел (в том или ином смысле) интегралов /<Г(/) ПРИ я->«>. Но нетрудно привести примеры, когда на множестве {а^Г} Р-п. н. Ит/ая(/) = оо, Ит/ая(/)=-оо. п п (Достаточно положить Т = оо, /= 1.) Поэтому lim/Q (/), вообще п говоря, не существует. Покажем, однако, что существует *) P-limx I0AT(fn), (4.73) \ J f2 (s, <o) ds < оо > который мы будем обозначать Г0дг(/). *) Этот факт будет существенно использован в гл. 6 и 7.
§2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО Для доказательства заметим, что 125 P-limWr •mx/r 11 { J f2(S,(0)dS<OO> J Обозначая %оАТ = %,аАТ { J f2 (5, (0) <*S < OO чание к ней) находим, что для любых е > 0, б > О [f(s, <>>)-fn(s,<*)]2ds=0. (4.74) , по лемме 4.6 (см. заме- Р Ц >а AT >б < { (f»(s,©)-fw(sfco))rfre о {GAl ч W J [/,(5,(o)-fm(5,0)]2d5>6j. Отсюда в силу (4.74) получаем ОЛТ *олт J Л<*. ®)^.-Х.АГ J Us, *)dWs lim P m, n-»oo ОЛГ >6} = 0. (4.75) Следовательно, последовательность случайных величин OAT %0АТ ) fn{s>®)dWs сходится по вероятности к некоторой слу- о чайной величине, которая обозначается Г0лг(/). Заметим, что согласно проведенным построениям | Гадг(/) К А если f °гГ 1 < оо Р-п. н. на множестве j со: f2(s, &)ds = oo j I о ' (OAT л Pj J P(S, (0)dS<OO =1, TO 1 0 J OAT ГаАт(П = 1оАт(П= J f(s,®)dWl Пусть теперь т — произвольный марковский момент \Не обязательно равный limart, где ап определены выше) и \in\s, о), п=1, 2, ..^ — последовательность неупреждающих
126 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 функций таких, что для каждого /г = 1, 2, ... Pi J №cD)dS<Oo[=l, и аппроксимирующих заданную функцию / в том смысле, что ТАГ Р-Пт^лг J [Д5,ш)-М5,<о)]2^=0. °° | J f2(s, (o)ds<oo> 0 Аргументы, приведенные выше при определении величин Голг(/), показывают, что и в рассматриваемом случае существует ХАТ P-lim % АТ °° } f(s, a)ds <oo> ° который будем также обозначать Гтлг(/)- Важно отметить, что для заданных т и / это значение (с точностью до стохастической эквивалентности) не зависит от специального вида аппроксимирующих последовательностей {fn{s, со}, /1=1, 2, ...}. 7х ) Отметим также, что на множестве |сэ: J f2(s, (o)ds < оо | у процесса ГД/), рассматриваемого для t^.TЛт, существует Р-п. н. непрерывная модификация. Только такие модификации далее и будут рассматриваться. 10. Как уже отмечалось выше, процесс (/Д/), 9^t)9 t^0> в случае fe^, вообще говоря, не является мартингалом. Однако этот процесс будет локальным мартингалом. Действительно, пусть хп = inf t: /2(s, со) ds^n I Л я. Тогда Р(тя<я)=1, P(t„<t„+1)=1 и Р{Нття = оо}=1. п Рассмотрим для данного /г = 1, 2, ... процесс tAxn t W/) = J f(s,*)dWs = \f(s^)%{s<Xn]dWs. о о Поскольку оо п J* м [f(s, <»h{s<T(t}]2<*s = J м [f(s, <*)x[s<Xn}]2ds <л,
§ 2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО 127 то процесс (ItAxn{f)y &~t), t^09 является квадратичноинтегри- руемым мартингалом. При этом itAxn{f)=M[IXn{f)\rf]t где M\I%n(f)\< °°. Из этого представления вытекает, что последовательность случайных величин {/*лтл(/)> ^0} является равномерно интегрируемой (см. доказательство теоремы 2.7). Согласно определению 6 (гл. 3, § 3) это доказывает, что процесс (/*(/)> @~t)> t^O, является локальным мартингалом. 11. В дальнейшем при рассмотрении задач нелинейной фильтрации нам придется сталкиваться со стохастическими интегралами, где интегрирование производится не по винеров- скому процессу, а по так называемым процессам Ито. Дадим необходимые определения. Пусть (Q, #", Р) — вероятностное пространство, (^), 0^ </<Г,—неубывающее семейство а-подалгебр ЗГ и W = = (Wt, (Ft) — винеровский процесс. Определение 6. Непрерывный случайный процесс £ = = (£*> @~t)> 0<!/^7\ называется процессом Ито по отношению к винеровскому процессу W = {WU STt\ /<Г, если существуют два неупреждающих процесса а = {аи &~t) и b = (bt, &~t), 0</<Г, такие, что p\\\at\dt<oo =1, (4.76) Р Цб?Л<оо =1 (4.77) и с вероятностью 1 для 0 ^ t ^ Т t t lt = lo+ J a{s, v)ds + J b{s, v)dW8. (4.78) о о (Для краткости говорят, что процесс lt имеет стохастический дифференциал dlt = a(s9<u)dt + b(stG>)dWu (4.79) понимая при этом (4.79) как сокращенную запись представления (4.78).) Пусть теперь f — (f(t, о), #"*) — некоторая неупреждающая t Функция. Стохастический интеграл /*(/) = f f (s, co)dg5 от функции / = д5) ф п0 Пр0цесСу с дифференциалом (4.79) будет
128 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ 1ГЛ. 4 пониматься как t t j f (s, (о) a (s, со) ds + j f (s, g>)b (s, со) dWs (4.80) о о при условии, что оба этих интеграла существуют, для чего достаточно, чтобы Р( jlf(s, co)a(5, ©)|ds<ooj = l, Р И /2(s, co)62(s, co)ds < 00 | = 1. t Данное определение интеграла J f(s, co)dgs как величины о (4.80) не совсем удобно, поскольку оно не дает эффективного способа вычисления It(f)непосредственно по процессу £=(£s> ^"s)> 0 < s < t. Можно, однако, получить так определенный интеграл как предел интегральных сумм вида + /.(<&.. •Jpr-Sijwj (4-81) (ср. с (4.21)), где fn(t, со) — простые функции, аппроксимирующие f(/, со) в том смысле, что т \(\a(t, ш)Н7(*. ©)-/»(<,©)! + о + 62(/, ©))|f(f, ©)-fe('. ©)р)Л-^>0, n->oo. (4.82) Для справедливости (4.82) достаточно, например, потребовать, чтобы [ Т Jp(f,©)(|a(ff a>)\ + b2{t, ©))Л<оо 1 = 1. (4.83) Если условие (4.83) не выполнено, то возьмем простые функции fM(t, <a) такие, что при каждом N=1, 2, ... т ][f{N)(t, ©)-/W(f, co)]2(|a(*, co)| + 62U, ©))Л-**0, л-*оо,
§2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО 129 где f (*,©)-| 0| ,f(/|fl>)|>^ Тогда из последовательности ^(/, со) (м, N=* 1, ...) можно выбрать подпоследовательность /„(/, со), аппроксимирующую f{t, со) таким образом, что т \\f(t, <*)~fn(t, ©)||а(/, ©)|Л + о т Доказательство существования аппроксимирующей последовательности (при условии (4.83)) и существования предела P-lim/r(frt) проводится так же, как и в случае построения п интегралов ло винеровскому процессу. Интегралы It(f)} О^/^Г, т определяемые как | f(s, ®)%{S^t)dls, образуют, как и в случае о интегрирования по винеровскому процессу, непрерывный случайный процесс (Р-п. н.). 12. Важным частным случаем процессов Ито являются процессы диффузионного типа. Определение 7. Процесс Ито | = (&, &*t), О<t<Г, называется процессом диффузионного типа (по отношению к винеровскому процессу W — (Wti 3Tt)9 0</<jT), если функционалы a(s9 со) и b{s, со), входящие в (4.78), являются ^-измеримыми для почти всех s, 0<^s<7\ Обозначим (Сг, 9кт) измеримое пространство непрерывных на [О, Т] функций x = (xt), 0</<7\ с a-алгеброй $т = s==:o{x: хи /<Г}. Пусть $t = o{x: xs, s</) и #[о.« — наименьшая a-алгебра множеств на [О, Г], содержащая все борелев- ские подмножества отрезка [0, t]. Приводимая далее лемма 4.9 показывает, что если g является процессом диффузионного типа с коэффициентами a(s, со) и b(s, со), то найдутся измеримые по паре переменных (s, x) функционалы A(s, x) и B(s, x), являющиеся $5+-изме- римыми при каждом s, такие, что Р-п. н. для почти всех А (s, I (хо)) = a (s, со), В {s, I (со)) = Ь (s, со).
130 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ.4 Отсюда следует, что для процессов диффузионного типа наряду с равенствами (Р-п. н. для каждого 0^/^Г) t t tt = lo+ j a(s, ®)ds+ j b(s, <u)dWs о о справедливы также (Р-п. н. для каждого 0<^^Г) равенства t t lt = Z0+j A(s, t)ds + j B(s, l)dWs, о о где (измеримые) функционалы A(s, x) и fi(s, л:) являются ^.-измеримыми для каждого 5, 0<s<7\ $T+ = $T. Лемма 4.9. Пусть I = (lt), 0 < t < Г, — непрерывный случайный процесс, определенный на полном вероятностном пространстве (Q, #~, Р). Пусть, далее, измеримый процесс £ = (£,), 0<^^Г, согласован с семейством а-алгебр F& = (#"?). Тогда существует измеримый функционал ф = ф(/, х), определенный на ([0, Г] X Сг, 3$[о, т\ X ^г), который $t+-u3MepuM при каждом 0^/^Г и такой, что ЯХР{(*, со): |,(0) ^Ф(/, £(о))} = 0, где Я— лебеговская мера на [0, Г], а ЯХР— прямое произведение мер X и Р. Доказательство. Поскольку процесс £ = (£,), 0 < / < Г, измерим и F^-согласован, то (см. гл. 1, § 2) у него существует прогрессивно измеримая модификация. Будем считать, что этим свойством обладает сам процесс £ = (£,), 0 ^ t ^ Т. Тогда для каждого О^м^Г функция £,л„(со), рассматриваемая как функция от (t, со), где 0^/^Г, ©eQ, является измеримой относительно Я X Р-пополнения а-алгебры $[о, и\ X &\> Поэтому для каждого 0<м<Г на ([0, Т]ХСт, $[о,и]Х$и) существует измеримый функционал фц(/, л:), такой, что ЯХР {(*, ©): ttAu (со) Ф Ф„ (t, \ (со))} = 0. Т Пусть и*,я = -2/Г' ky k—\, 2, ..., 2п, п = \, 2, ... Положим ф(л) (U х) = ф0 (о, х)%{0) (0 + 2 ф^ п {и х) X(Uk_u n% Чп] (t) и ф(/, л:) = lim ф(л) (/, л:). п Функционалы ф(л)(/, х) измеримы по (/, л:) при каждом п, и, следовательно, функционал ф(/, х) также измерим. Из кон-
§ 21 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ ПРОЦЕССЫ ИТО [31 струкции функционалов <f>{n)(t, x), п=\, 2 видно также, что ф(^, х) при каждом / ^+-измеримы. Далее, для всякого 6> 0 и п = 1, 2, ... {(/,»): |<р(*. 1(ш))-?Д(о)|>е} = s{(*. ш): 1ф(/, &(0))-ф<">('> |(<й))|>е/2}и U {(*, со): | Ф<«) (/, 1 (со)) - lt (0) | > е/2} = — {(*, со): |ф(*. |((о))-ф<"Ч^ |(ш)) |> е/2} U 2" U (J ««*-!.» < f < «*«, ®): I Ф(п) С, I (©)) - It (©) I > е/2} U U {(* = 0, 0): | Ф<«> (0, % (©)) - g0 (о) | > е/2} = = {(*, со): |Ф(/, |(«>))-ф""(/, g(о)) |> е/2}U U {(* = 0, 0): | ф0 (0, | (©)) - £0 (©) | > е/2} U 2» U U {("*-..„<'<"*,. ">)•" К„С i(«>)) — S,A„fert(<»)I > е/2}. Отсюда следует, что ЯХР{(^, со): |Ф(/, Б(со))-£,((о)|>е}< <ЯХР{(^, со): |Ф(/, £(©))_,*»>(/, g((o))|>e/2}. Так как ф(£, л:)==Птф(,г)(/, л:), то существует такая подпосле- п довательность (nf), /=1, 2, ..., что Нш X X Р {(*, со): | Ф (/, g (0)) - ф(л/) (f, Б (со)) | > е/2} = 0. Поэтому для всякого е > 0 *ХР{(<, со): |<р(*. Б(©))-Ь(ш)|>е}-0.. Лемма доказана. _ lS^nycTb A=(A(t, х\ Я,+), A=(A(U х), Я,+), Я=(в(*. *). $<+)> B = (B(t, x), $t+) — неупреждающие функционалы и £ = (£*, #~Д S = (|^, &~t\ 0</< Г,— процессы диффузионного типа с dlt = A(U l)dt + B(U l)dWu dlt = A{U%)dt + B{Ul)dWt. Функционалы Л, Л, В, В предполагаются такими, что Р-п. н. т \ [\А(t, I) | +1 A(t, |) | + &(t, g) + B2{t, I)] Л < oo. 0
132 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 (Заметим, что при каждом s величины В (s, I) и B(s, |) являются #%+-измеримыми и существование стохастических ин- t t тегралов f B(s, QdWs, \ B(s, \)dWs вытекает из предшествую- о о щего неравенства и того факта, что процесс Wt = (Wt, &'/+), как и W = {Wt, &~t), является также винеровским.) Пусть теперь g = (g(t> x), $t+), О < t < Т, — неупреждающий функционал с Р И I g(t, I) \dt < оо = Р ( J | g{U I) \dt < oo = 1. Рассмотрим интегралы (Лебега) т т jg(t,t)dt, J g(t,l)dt. О О Поскольку они являются #"|- и #"|-измеримыми соответственно, то найдутся ^-измеримые функционалы \|p(x) и ^>(х) такие, что Р-п. н. т т $(t)=jg(t,t)dt, ie(i) = j g(t,l)dt. О О Эти равенства могут задавать функциона-лы ty(x) и $(х) не единственным образом. Поэтому, вообще говоря, РЖ1)^(1)}>0, РЖ£)#йа»>0. Рассмотрим теперь стохастические интегралы jf(t,l)dh, \f{t,\)d\b для существования которых потребуем, чтобы jli^- и |И|-почти наверное *) т J [Ifft x)\(\A(t, x)\ + \A(t, x)\) + + f*{t, x)(B4t, x) + BHt, x))]dt <oo. *) u и Ц- — меры в пространстве (C-, $L), отречающие процессам | И | соответственно,
§ 2] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ. ПРОЦЕССЫ ИТО 133 Стохастические интегралы т т jf(t,l)dh, Jf(/, 1)4, О О являются &°\г и #~|-измеримыми соответственно. Поэтому найдутся $гизмеримые функционалы Ф(л:) и Ф(л:) такие, что Р-п. н. т т (D(i)=j*f(*,i)4/> 6(I) = Jf(/, 1)4,- о о Для функционалов Ф(х) и Ф(л:) также не обязательно справедливы Р-п. н. следующие равенства: Ф(|) = Ф(|), Ф(£) = Ф(£). В самом деле, пусть f(t, x) = xt, \t = Wt, \t = 2Wt. Тогда т т \wtdWt = ^£~. j(2Wt)d(2Wt) = ¥^ 2Г. о о Следовательно, Хт * ~ Хт и Р(Ф(1)>Ф(1))=1. Заметим, что в рассмотренном примере меры jug и \х% являются сингулярными. Поэтому естественно ожидать, что равенство (Р-п. н.) функционалов Ф(|) и Ф(|), Ф(£) и Ф(£), а также функционалов г|)(|) и ф(|), г|э(£) и ф(£) определяется свойствами абсолютной непрерывности мер \х^ и jii|. Лемма 4.10. 1) Если мера \х^ абсолютно непрерывна относительно меры |ig (^<^f), то ф(6) = *(6), Ф(£) = Ф(£) (Р-п. н.). 2) Если |i8<|ift> то ф (!)= + (!). Ф(1) = Ф(1) (Р-п. н.). Доказательство. Установим справедливость равенства *(9в*(6). Пусть gn = {gn(t,x),at+)9 0<*<7\ /г== 1, 2 — Последовательность (простых) функционалов таких, что Л. Л P-lim f gn{t,l)dt= f g{t,l)dL
134 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Тогда функционал г \t>(*) = Hr Hm \.gn(t, x)dt. П + ooJ В силу абсолютной непрерывности jli^ <С jxg т q>(x) = \i.-lim f gft(/, *)df. Поэтому отсюда получаем, что т $ (1) = Р- lim f g„ (/, 1) Л = ф (I) (Р-п. н.). и -A no J n*ooQ Для доказательства равенства Ф(£) = Ф(|) рассмотрим плот- ность (производную Радона — Никодима) J (х) = -т-1 (х) меры \х^ по мере |Х|. На исходном вероятностном пространстве (Q, &) введем новую вероятностную меру Р, положив P(d(o) = — J (!(©)) P(rf©). Тогда, если ГеЛг, то Р{1е=Г}= J J(|(co))P(dco)=Jj(x)d|ijW = |i6(r) = {©: f (ю)еГ) Г = РЙеП- Пусть теперь fn = (fn(t, х), Я,Д 0</< Г, л= 1, 2, ..., - последовательность (простых) функционалов таких, что Р-п. н. т lim f p'(ff I) + 52(/, I)][f(f, l)-fn(U I)]2 + л о + (M(/, 1)1 + 1 Л(*. I)|)(l/(/. !) — /«(/. 1)1)}Л —0. Тогда, поскольку Р <^ Р, то этот предел равен также нулю и Р-п. н., откуда в силу установленного равенства Р{|еГ} = = Р{£еГ} следует, что т P-Iim f {[B2(t, %) + B2(t, %)][f(t, l)-fn(t, |)]2 + " о + (\ A(t, l)\ + \ A(t, t)\)(\f(t, t)-fn(t, 9|})*=0.
§31 ФОРМУЛА (ЗАМЕНЫ ПЕРЕМЕННЫХ) НТО 135 Значит (см. п. 11 настоящего параграфа), т т P-lim J fn (t, |) d\t*=\f (t, |) d\t = Ф (I), n о о Г T P-lim J /я (*, I) d\t - J f (f, I) 4, = Ф(|). "о о В силу определения стохастических интегралов от простых функций и равенства Р{|е Г} = Р{£ е Г}, Ге^г, г НтР /г ф(6)-/М',6)<*1, >8 = = НтР п Тогда Р{|Ф(1)-Ф(1)1>в}<Р + Р 6(I)-j/„C 1)4, о г Ф(1)-|М', £№ О Г Ф(1) —J*f«(M)rf6» >е/2 >е =0. + >e/2l-»0, га-юо. Следовательно, Р-п. н. Ф(|) = Ф(|), что и доказывает первое утверждение леммы. Аналогичным образом устанавливается справедливость и второго утверждения. Лемма доказана. § 3. Формула (замены переменных) Ито 1. Пусть | = (|„ 3~,), 0</<Г, — случайный процесс, имеющий стохастический дифференциал d\t = a (t, a)dt + b (t, w) dW„ (4.84) где W = (Wt, &~t) — винеровский процесс, а неупреждающие Функции a{t, (о), b{t, <в) таковы, что P j\a(t, ш)|Л<оо =1, Pj J &2(/, <s>)dt< oo =1. (4.85) (4.86)
136 стохастические интегралы 1гл. а Пусть теперь f = f(t, х) — измеримая функция, определенная на [О, Т] X R1- Приводимая ниже теорема дает условия, при которых случайный процесс f(t9 lt) также допускает стохастический дифференциал. Теорема 4.4. Пусть функция f(t9 х) непрерывна и имеет непрерывные производные f't(t9 x\ fx(t9 л:) и f"x(t9 x). Предположим, что случайный процесс £ = (£„ $~t\ 0</<7\ имеет стохастический дифференциал (4.84). Тогда процесс f(t, lt) также имеет стохастический дифференциал и df(t9 tt) = [f't(t, %) + Гх(*> У*С. °) + t&('> h)b2(t, ©)]л + + rx(t9lt)b(t9v)dWt. (4.87) Формула (4.87), полученная К. Ито, далее будет называться формулой (замены переменных) Ито. Доказательство. Покажем прежде всего, что для доказательства формулы Ито достаточно ограничиться рассмотрением лишь простых функций a(Sy со) и b(s9 со). Действительно, пусть an(s, со), bn(s, со), /г = 1, 2, ..., — последовательности простых функций такие, что с вероятностью 1 т \ | a(s, ©)— an(s9 со) |rfs—>0, я-*оо, о т [[bis, (o)—bn(s, (o)]2ds->0, я-* 00 о (см. лемму 4.5 и замечание 3 к ней). Согласно замечанию 4 (§ 2) можно считать, что последовательность{bn(s, со), д=1, 2, ...} выбрана так, что равномерно по <^Г с вероятностью 1 t t j bn(s9a)dWs-»j b(s9 a)dWs. о о Тогда последовательность процессов t t |? = £о+ J" an(s, e>)ds+ j bn(s, (*)dWs 0 0 с вероятностью 1 равномерно по /, 0^/^7\ сходится к процессу £,.
§ 3] ФОРМУЛА (ЗАМЕНЫ ПЕРЕМЕННЫХ) ИТО 137 Предположим теперь, что формула (4.87) установлена для процессов Цп). Иначе говоря, пусть для 0<$<Г Р-п. н. s f(s, l[n)) = f(0, lo)+j [Ж'. бП + £(<. бГ*)а.('. «) + О + ТГХХ(*> &НВД ®)]Л + /£('' ЙЯ))М'. °>)^r (4-88) О Тогда, поскольку sup I l[n) — LI -> 0, п -> оо, с вероятностью 1. а функции f, /£, /^., f"x непрерывны, совершая в (4.88) предельный переход, .получим, что f(s, ts) = f(0, E0) + J [f't(t, %) + ГхЦ, lt)a(t, (o) + 0 5 + jf«('. &*)**('. <*)]dt + j f'x{t, %)b{t, *)dWr (4.89) s s Стохастические интегралы J £ (tf %{tn)) bn (f, (o) dWt-+ j f'x (/, lt) X ^ 0 0 X6(/, co)d^ при az->oo в силу замечания 4 из предшествующего параграфа.) Итак, достаточно доказать формулу (4.89), предполагая, что функции a(t, со) и b{t, со) являются простыми. При этом в силу аддитивности стохастических интегралов достаточно рассмотреть лишь такие t^O, для которых lt = lo + at + bWti (4.90) где а = а(со), Ь = Ь((о) — некоторые случайные величины (не зависящие от t). Пусть представление (4.90) выполнено для t^tQi и пусть для простоты £о = 0. Тогда, очевидно, найдется такая функция «(/, *) той же степени гладкости, что и f(t9 x), что u(t, Wt) = f(t, at + bWt)9 *<f0. Поэтому формулу Ито достаточно установить лишь для функции u = u(t,'Wt)9 *<*<>• Положим l = [2nt]9 MP = W n — W . A = -i. n*=l, 2> •♦.. Тогда по формуле Тейлора после ряда преобразований
[38 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 найдем, что u(t, Wt) — u(0, 0) = - S [u{k-2-n, Wk.2.n)-u{(k-l).2-n, Wk.2.a)] + + Yi [" ((* - 1) • 2-"> Wft.2-«) ~« ((* - 1) • 2-, ^_1).2-„)j + + [«(*, Wt)-u(l-2-\ W,.2-a)] = -S [«{((A-»)-2"". ^.^.)A+K(((*-D+e4). 2-",rfe.2_„)- -и;((А-1) • 2-", rft.2_„)} A]+2[<((ft-l) • 2-», r(ft_I).2_„) A1F+ +{<I((A-i).r)v.,.2-»)W+ + 4-W2К ft*-1)-2-", r(ft_lb2_n + e; аг)- -<;((^-l)-2-n)r(ft_I).2_„)}] + 6„(o>)) (4.91) где 0ft, 0£— случайные величины такие, что O^0ft^l, 0^ <е;< 1, а lim6n(a>) = 0 (Р-п. н.). П Заметим теперь, что случайные величины a„=sup|M;(((*-l)+0ft). 2~\ Wk.2.n)-u't{{k-\).2-n, Wk.2-n)\ и Р„=»ир IС((*-1)• 2"". wv„.2-« + е; aip) - к^ I ■—««((*—0-2—, г^,,^)! при п~>оо стремятся к нулю с вероятностью 1 в силу непрерывности винеровского процесса и непрерывности производных u'v u"x. Поэтому и (*, Wt) _ и (0, 0) = J и; ((ft - 1) • 2~rt, r%.2_rt) A + + S (a;((A—D-2—, Г(,_1,2_„)АГ + + J «« ((* ~ О • 2"", ^_„.2-») Л) + Л« + B» + C»+6»> (4-92)
§ 31 ФОРМУЛА (ЗАМЕНЫ ПЕРЕМЕННЫХ) НТО 139 где &</ С„ = т2 <х((*-1)-2-п, Г(,_„.2_„)((Л^-Л). fc</ Ясно, что с вероятностью 1 Ап->0. Точно так же и Вп—>0, поскольку с вероятностью 1 2 (&W)2^>t (лемма 4.3). Покали жем, что С„-*0 (по вероятности) при п->оо. Пусть XNk=X<maxlw l<Ny Тогда <4S M(i£((A - 1) • 2-", r(ft_,,2_„) Х:)2((АГ)^-А)2< < sup К' (/, х)\2 S М((АГ)2 —А)2 = = 2 sup |и"(*. л:) I2 S (Д)2-^, л-к». (4.93) Далее, Р{Д.*£((*-1)-2ЛЯ^^ < Р {sup | Г, | > /V} -* О, N -> оо. (4.94) *<*, Из (4.93) и (4.94) следует, что P-limCrt = 0. Переходя теперь п в (4.92) к пределу при az->co, получаем, что Р-п. н. при всех /, О < t < /0. * t и (/, 1^) - и (0, 0) = J u\ (s, И7в) ds + | < (s, Г5) ЙГ8 + о о + т J "«(*•*•)*• (4-95) 0 Чтобы перейти от функции «(*, №,) к функции /(/, £,), вспомним, что u(t, W,) = f(t, at + bW,). Поэтому <(*. ^) = №У + «№ У. «и*. *•)-»£(*. у.
140 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Подставляя эти значения в (4.95), получаем требуемый результат: t f (t, h) = / (0, 0) + { [П (s, у + < (s, у + 1 Ыхх (s. %)] ds + 0 t + jbfx(s,ls)dWs. (4.96) 0 Замечание. Формула Ито (4.87) сохраняет свою силу с заменой t на марковский момент т = т(со) (относительно (@~t), t^O), если только Р(т<оо)=1 и РМ \a{s9 ©)|ds<oo) = l, РМ b2{s9 ©)ds<oo) = l. 2. Приведем теперь многомерный вариант формулы Ито. Пусть l = (lt, STt), t^Ty — векторный случайный процесс £/ = (£i(0> •••> lm{t))> имеющий стохастический дифференциал dlt = a(t, v>)dt + b(t, ®)dWh (4.97) где W = (Wt9 &~t), t^zO,—(векторный) винеровский процесс*) Wt = (Wt(t\ ..., Wm(t)). Вектор a(t9 ©) = (fl1(/, со), ..., am(t9 &)) и матрица &(/, ©) = ||6//(/, ©)||, /, /=1, ..., т, состоят из не- упреждающих функций, удовлетворяющих условиям Р( ||а,(*, ©)|Л<оо1 = 1, /=1, ..., т, РМ b]f(t, ©)Л<оо) = 1, /, /=1, ..., т. В развернутом виде (4.97) записывается следующим образом: т dh(t) = ai{t9iu)dt+^bit(t9o)dWi(t)9 i=U ..., т. Теорема 4.5. Пусть функция f(t, хь ..., хт) непрерывна и имеет непрерывные производные f'v f'x, f" x . Тогда с вероят- *) То есть векторный процесс, компоненты которого — независимые ви- неровские процессы.
§ 3] ФОРМУЛА (ЗАМЕНЫ ПЕРЕМЕННЫХ) ИТО 141 ностью 1 процесс f(t, £,(/), ..., gm(/)) имеет стохастический дифференциал df(t, 6,(0, ..., Ы')) = - Я(*. мо, .... ио) + 2£,('> 6,(0,.... ионе 0)+ L /=i m ml ,/=1 k=l dt + + S £,('■ MO. ■•- 6«W)M'' ©)<И7,('). (4.98) Доказательство этой теоремы проводится так же, как и в случае пг=\. 3. Рассмотрим ряд примеров на применение формулы Ито (4.98). Пример 1. Пусть Xi=(xi{t)9 &~t), i=l, 2,— два случайных процесса с дифференциалами dxi (t) = at (t, ©) dt + bt (/, (d) dWt. Предполагается, что xl(t) = {xn(t), ..., x{n(t)\ x2{t) = = (a:21(0, ..., x2m(t)), — вектор-функции а,(*) = (ац (0. • • •> ala(t))f a2(/) = (a21(/), ..., a2m(0), матрицы &!(0 = ||&]7(^)||, М*) = |*?/(0| имеют соответственно порядок ft X &> m X&, а винеровский процесс U^ = (l^/, #"/) имеет /г независимых компонент. Рассмотрим матрицу Y(t) = xx(t)x\(t). Применяя формулу Ито к элементам матрицы Y(t), найдем, что dY(t) = [xl(t)al(t) + al(t)xl(t) + bl(t)b*2(t)\dt + + bx (t) dWtx2(t) + xx (t) dW]b*2(t). (4.99) В частности, если n = tn = k=l, d (x{ (t) x2 (t)) = [X{ (t) a2 (t) + a, (0 x2 (t) + b{ (t) b2 (/)] dt + + [bl(t)x2(t) + xl(t)b2(t)]dWt. (4.100) Пример 2. Пусть функция f(t, xu..., xm) = {x, B(t)x), где x = (xh ..., xm)y a B(t) — матрица (неслучайная) порядка ^X/nc дифференцируемыми элементами. Пусть X = (xti &~t)>— процесс с дифференциалом dxt = a(t)dt + b(t)dWti где xt = (Х{ (f), ...,xm (*)), Wt = (W{ (0, ...,Wm (0) - винеровский процесс.
142 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Найдем дифференциал процесса (xt, B(t)xt). Применяя формулу (4.98) к yt = B(t)xti находим dyt = [В (t) xt + B (0 а (01 dt + B (t) b {t) dWt. Для вычисления дифференциала d{xti B{t)xt) воспользуемся формулой (4.99), согласно которой d (xty\) = [a (t) у] + xtx]B* (t) + xta* (t) В* (t) + b (t) b* (t) В Щ dt + + xt dW]b* (t) B* (t) + b (t) dWtxtB* (t), откуда d(xv B(t)xt) = Spd(xty]) = = [Sp a (t) x]B* (t) + Sp xtx]B* (t) + Sp xta (t) B* (t) + + Sp.b{t)b^t)B{t)]dt + SpxtdWy(t)B*(t) + Spb{t)dWtx]B*(t)^ — [(*„ B*(t)a(t))+(*t> B{t)a (*))+(*„ В (t) xt)+ Spb(t) b* (t) В (t)] dt + + (b* (t) B* (t) xti dWt) + (b* (t) В (t) Xt9 dWt). Итак, d(xt,B(t)xt) = {(xt, B(t)xt) + (xty [B(t) + B*(t)a(t)]) + + Svb(t)b*(t)B{t)}dt + {b*(t)[B(t) + B*{t)]xty dWt). (4.101) В частности, если xt = Wt, a B(t) — симметрическая ма трица, то d(Wti B(t)Wt) = [(Wti B(t)Wt) + SpB(t)]dt + 2(B(t)Wt, dWt). (4.102) Пример 3. Пусть a(t) = a(t, &)^&т и $, = exp if a(s)dWs-^a2(s)ds\ t t Обозначая xt= a(s) dWs — -^ a2 {s)ds, находим (из (4.87)), о [)ференциал dh = ha(t)dWt. (4.103) d (±) = *Ж dt - *1± dWt. (4.104) I Заметим, что P{inf ^>0}=1,т. к. PJ \a2{t)dt< oo| = l.) о о что $, = ехрл:, имеет дифференциал Точно так же
§ 3] ФОРМУЛА (ЗАМЕНЫ ПЕРЕМЕННЫХ) ИТО 143 Пример 4. Пусть a{t), b(t), 0</<Г, — неслучайные т т функции с j\a(t)\dt<oo9 J b2(t)dt < oo. о о Используя формулу Ито, находим, что случайный процесс xt= exp I J* a {s) ds N £ + J exp — J* а (и) du \b {s) dWs \ имеет стохастический дифференциал dxt = a (0 *, Л + b (t) dWt§ x0 = g. 4. Применим формулу Ито для вывода полезных оценок /; \2т для математических ожиданий М J f(s, a))dWs\ четных степеней стохастических интегралов. Лемма 4.11. Пусть W = (Wti &~t)> O^t^Ty — винеровский процесс, f(t, со) — ограниченная неупреждающая функция, \f(t, со)|</С, 0<*<7\ Тогда t ч 2т М ( J f (s, (o)dW8\ <K2mtm(2m-l)\\. t Доказательство. Пусть xt = J f(s, (o)dWs. Положим о %N = \rA{t: sup| xs \^N), считая %N = T, если sup|xs|<Af. По формуле Ито *?л xN=2m J *f "lf {s, со) d№s+m (2m-1) f x2sm'2f (s, со) Л. о о Из определения xNi предположения |/(s, со)|^/(, O^s^r, и свойства (4.48) вытекает, что М J x2sm-lf(s, ®)dWs = Q.
144 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Поэтому *ЛТдг М4лт„ = т (2т - 1) М J xl^fls, со) ds< о </(2m(2m-l)M J ^-2ds</(2m(2m— 1) M jx2sm-2ds. о о Отсюда по лемме Фату получаем t Мх2"*< К2т (2т — 1) М J x%*-*ds. о Положим в этом неравенстве т = 1. Тогда из него следует, что Мх2</(2^ Аналогично при т = 2 получаем оценку Мх,4< <13/(4/2. Завершается доказательство требуемой оценки по индукции: предполагая, что Mxtm^K mtm(2m—1)!!, из приведенного выше неравенства легко получаем, что MxVm+l)<K2{m+l)tm+l(2m+l)U. Лемма доказана. Откажемся теперь от предположения ограниченности функ- т ции f(t, (о), заменив его условием j Mf2m(t, (o)d/<oo, m> 1. о Лемма 4.12. Пусть W = (Wti STt\ О < t < Г, — винеровский процесс, f (ty со) — неупреждающая функция с т |М/2я|(*,ю)Л<оо. 6 Тогда / T \2m t М[\ f(s,(o)dWs\ < [m (2m - 1 )Г Г"1 J" M/2m (s, со) ds. Доказательство. Пользуясь обозначениями предыдущей леммы, находим, что tAXN
§ 3] ФОРМУЛА (ЗАМЕНЫ ПЕРЕМЕННЫХ) НТО 145 Из этой формулы следует, что Мх2т —неубывающая функ- N ция от t. Применение неравенства Гёльдера с р = т, q = = ml{m — 1) дает оценку М J *f-2Hs,CD)ds< О m-1 I / tA%N \ m f tAXN \« <(m J x\mds\ Im J f2m(s, a)ds) = m-1 J__ / 'A%' \ ™ / tAXN \m ^ о N I \ 0 / m-1 _1_ / t \ m ( I \m <MJ*^td5 M J f2w(S,G>)ds < m— 1 m—1 / f Л я* </ « (M*?*t \ * M J p*(s, ©)rfs) . Поэтому m-1 m-1 / 1 \~m Щ\% <m(2m—l)f " (Mx2^T ) m M J f2m(s, «>)ds\ . Поскольку Mx2™T < оо, то это неравенство эквивалентно сле- дующему: _1 fLzi ( I \m (Мх}тАХ \т ^т{2т— l)t т М J f2m(s, ©)ds , или Mx2tmAX ^[m(2m-l))mtm-]M[f2m(st«>)ds. N J 0 Применяя теперь лемму Фату, получаем требуемое неравенство. Лемма доказана.
146 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 § 4. Сильные и слабые решения стохастических дифференциальных уравнений 1. Пусть (Q, #", Р) — некоторое вероятностное пространство, Т=\ (для простоты), (#",), t^U — неубывающее семейство а-подалгебр !F и W = (Wti STt), /^ 1, — винеровский процесс. Обозначим (Cj, $i) измеримое пространство непрерывных на [О, 1 ] функций х = (xt, 0 < t < 1) с а-алгеброй 9&х = о (х: xs, s < 1). Положим также ^l = a{x: xs, s^t). Пусть a{t, x) и b{t, x) — измеримые неупреждающие (т. е. ^-измеримые при каждом t, 0</<l) функционалы. Определение 8. Будем говорить, что (Р-п. н. непрерывный) случайный процесс g = (£,), 0^/<Л, есть сильное решение (или просто решение) стохастического дифференциального уравнения dlt = a{t,l)dt + b(t,l)(Wt (4.105) с ^-измеримым начальным условием g0 = т], если при каждом /, 0</<1, величины lt являются ^-измеримыми, Pi \\a(ty l)\dt< со ) = lf (4.106) Р I \&(Ul)dt< оо 1 = 1 (4.107) и с вероятностью 1 для каждого t, 0^/< 1, t t g, = t| + J a(s, %)ds+ J* b(s, l)dWt. (4.108) 0 0 Введем теперь понятие слабого решения стохастического дифференциального уравнения (4.105). Определение 9. Говорят, что стохастическое дифференциальное уравнение (4.105) с начальным условием т|, имеющим заданную функцию распределения F(x), обладает слабым решением (или решением в слабом смысле), если найдутся: вероятностное пространство (Q, !Р, Р), неубывающее семейство а-подалгебр (#",), /^1, непрерывный случайный процесс | = = (lt> &t) и винеровский процесс W = (Wt, &~t) такие, что выполнены условия (4.106), (4.107), (4.108) и Р{со: lb<zX} = F(x). Отметим, в чем основная разница между понятиями сильных и слабых решений, предполагая для простоты г| = 0. Когда говорится о решении в сильном смысле, то подразумевается, что уже заданы некоторое вероятностное пространство (й, 9Г, Р), система (#",), /< 1,■ 'й* винеровский процесс W = {Wii 9~t). Если при этом ^ = ЗгГ, то искомый процесс
§4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 147 £ = (&), £<1, таков, что при каждом t величины \t являются ^"Т-измеримыми (т. е. £, определяется по «прошлым» значениям винеровского процесса). Таким образом, для сильного решения Когда же речь идет о слабом решении уравнения (4.105) с заданными неупреждающими функционалами a(t, х) и b(t, х), то предполагается, что должны найтись вероятностное пространство (Q, 9Г9 Р), система (&~t), 0</< 1, процесс £ = (£„ !Ft) и винеровский процесс W = (Wt, &~\), для которых (4.108) выполнено Р-п. н. Во многих случаях, где слабое решение существует, ^ = ^"| и, следовательно, процесс W = (Wt, !F\) является винеровским по отношению к системе а-подалгебр (#i), /^1. Поэтому в случае слабых решений ^Ts^i, o</<i. Из определения 9 следует, что слабое решение — это, в сущности, совокупность объектов s£ = {Q, &~, &~ti P, Wt, £,), где для краткости процесс £ = (£,), 0</<1, также будет называться слабым решением. Определение 10. Будем говорить, что стохастическое дифференциальное уравнение (4.105) имеет единственное решение в слабом смысле, если для любых его двух решений s&= = (Q, 0", Tt9 Р, Wt9 lt) и ri = (Q9fr9grJ9P,Wt,lt) совпадают распределения процессов £ = (£,) и | = (!,), 0<^<1, т. е. |х6(Л) = Д8(Л), Де«, где ^(Л) = Р{со: 1<=А), Д|(Л) = Р{6: |е=Л}. Определение 11. Говорят, что стохастическое дифференциальное уравнение (4.105) имеет единственное сильное решение, если для любых его двух сильных решений £ = (£„ 9~t) и | = Р{ sup |Б,-1,|>0} = 0. (4.109) о < t < 1 В пп. 2—-6 настоящего параграфа будут приведены основные теоремы существования и единственности сильных решений стохастических дифференциальных уравнений (4.105). Вопросы, связанные со слабыми решениями, рассматриваются в п. 7. 2. Простейшие условия, гарантирующие существование и единственность сильных решений уравнения (4.105), содержатся в следующей теореме.
[48 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Теорема 4.6. Пусть неупреждающие функционалы a(t, x), b(t,x), /е[0, 1], xgC|, удовлетворяют условию Липшица \a(t, x)-a{t, у)? + \b(t9 x)-b(t, у)?< t <L{j\xs-ys?dK(s) + L2\xt-yt\* (4.110) о и t аЩ, x) + V{t, x)^L{ J {l+**)dK(s) + L2(l+**)9 (4.111) о где L{, L2 — константы, К(s) — неубывающая непрерывная справа функция, 0<i((s)<l, х, у^С{. Пусть ц = т] (®) — @~(f измеримая случайная величина, P(h((D)|<oo)=l. Тогда: 1) уравнение dxt = a{t,x)dt + b(t,x) dWt, х0 = ц, (4.112) имеет, и притом единственное, сильное решение I = (£„ #"Д 0</<1; 2) если Mif"1 < °°, tn ^ 1, то существует такая константа ст, что М|'т<(1 + Мцт)ест'- 1. (4.113) Доказательство. Начнем с доказательства единственности. Если I = (|„ yt) и | = (lt, STt) — два непрерывных (Р-п. н.) сильных решения с |0 = г1» 1о = Л» то t t Б/ - I/ = f [а (*. Б) - a (5, I)] rfs + J [b (s, I) - b (s, I)] dWs. о о Обозначим Xf = Х{5ир^2+|2ч<лг|. Тогда, поскольку х? = Х? ' %s для t !> s, то X?'[i/-I,]2<2x<A'[(jx,Af(fl(s,|)-a(s,I))dsJ + + ( J* Xs" [6 (s, %) - b (s, I)] dWA I. (4.114) Из определения у$ следует, что величины
§4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 149 ограничены, и, следовательно, существуют математические ожидания от левой и правой частей неравенства (4.114). Поэтому, используя условие (4.110), находим, что МхПБ*-Ь]2< t <2 JM%»([a(s,$)-~a(s,iW + [b(s,l)-b(s,i)Y)ds^ о < 2JL, { Мх? j{lu-lafdK(u)ds + L2j Mx»{l,-i,fds < loo' о ' < 2 !l, j мх* J x^-gw»)^^ J m^(is-is)2^}< 0 t s <2 L, J J Mx»a(ta-ia)4K(u)ds + L2 J M%^ls-lsfds . ^ о о о ' (4.115) Для последующих рассуждений нужна Лемма 4.13. Пусть с0, си с2 — неотрицательные константы, u(t) неотрицательная ограниченная, a v(t) — неотрицательная интегрируемая функции, 0^/^1, такие, что и (t) < с0 + с] | v (s) и (s) ds + с2 jv(s)\ju(sl)dK(sl) ds, (4.116) где K(s) — неубывающая непрерывная справа функция, 0^ Тогда t (4.117) и {t) < с0 ехр | (с, + ^2) J v (s) ds Доказательство. Подставим в правую часть (4.116) вместо функции u{s) ее мажоранту, определяемую правой же частью неравенства (4.116). После п таких итераций найдем Mt)<c0^^±^-^jvsdsj +ф„0), (4.118) где фп(/)_>о, п->оо, в силу ограниченности функции u{t). Переходя в (4.118) к пределу по п->оо, получаем требуемую оценку (4.117).
150 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Применим эту лемму к неравенству (4.115), полагая с0 = 0, cx = 2Ll9 c2 = 2L2i v (/)=1 и м(0 = Мх^[^ —|J2. Тогда найдем, что для всех /, 0^/^1, Мх?[&,-1,]2=о, и, значит, P{|6*-l,|>o}<P{o8upi(i; + ft>iV}. Но вероятность Р{ sup (Ц + |2) > М) -► 0, N->oo, в силу не- прерывности процессов \ и |. Поэтохму для любого /, 0^/^ 1, Р{1Б,-1,|>0} = 0, а значит, для любого счетного всюду плотного в [0, 1] множества S P{suplb-Ll>0} = 0. te=S Наконец, опять используя непрерывность процессов I и |, находим Р{ sup lb-Ll>0} = P{suplE,-I,|>0}f 0</<1 te=S что и доказывает единственность (непрерывного) сильного решения. Доказательство существования такого решения сначала проведем в предположении, что Mrj2<oo. Положим |}0) = т| (нулевое приближение) и t t lf = y\+ J a(s, £(»-«))ds+ J b(s, $in~l))dWs. (4.119) о о Покажем, что M(£jft,)2^d, где константа d не зависит ни от п, ни от /^ 1. Действительно, в силу условия (4.111) М (^+1))2 < 3 Мл2 + I M [a2 (s, £»>) + b2{s, £<«>)] ds < * s t <3Mrf+ 31, j lll + M^yjdKis^ds + SL.jll + M^^ds^ 0 0 0 t s t < 3 (Mrf+ I, + L2) + 31, J J M (g<*>)2 dK (sx) ds + 3L2 J M (|<*>)2 ds. о о" о
§ 4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 151 Отсюда, учитывая, что М(^0))2 = Мт|2 < оо, по индукции получаем оценку М (Qn+l)f < 3 (L + Мл2) еш < 3 (L + Mr]2) e3L (4.120) с L = L{ + L2. Иначе говоря, можно взять d = 3(L + Mif) e3Lf В силу (4.119) и условия Липшица (4.110) t М [1\п+{) -1?]\2 < 2 J M [{a{s9 g<»>) - a (s, g^-1*))2 + о + (ft(s,|<»>)-6(s,6<-l>)2)]ds< 0 0 Поскольку M sup fgj1) — £i0)]2 < с, где с — некоторая кон- 0<*<1L J станта, то {L = Lx-\- L2) М [lf] - $у\2 < 2Lct9 M [If) - £<2>]2 < <2Lc 2L, J J st dtffa)ds + 2L2 J s ds < loo о J < 2Lc 12L! J s/C (5) ds + 2L2 J s ds I < с -S^-. I о о J И вообще, M[gf">-g<*>]2< < I 2L, J J s»-1 d/C(s,) ^ + 2L2 J s*-1 ds < loo о ' (л—1)1 , 0 0 0 <: l 0 0 ' Далее, l sup |g(*+i)_g$»>|< f-| a(s, 6<»>) — a (s, g^-1)) | ds + o<*< + sup l[b{s9lM)-b{s,H*-")]dWs
152 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Воспользуемся теперь неравенством (4.54), которое вместе с условием Липшица (4.110) и (4.120') приводит к неравенствам М sup f^+1)-^f< 1 t I < 10L1 J j M [If - ^-'f dK(s) dt + 10L2 J M [£<*> - gy-if ds < о о , l t , ! < 10^ ^r J J s^dK(s)dt+lOL2c^ j s»-4S< 0 0 0 /or \r <5c «! Ряд oo oo Ур{ sup |goi+i)_^)|>^l<6C У ^«Чоо, Поэтому по лемме Бореля — Кантелли ряд g<0) + 2 I £(/*+I) — lin)! сходится Р-п. н. равномерно по /, O^f'^1. Значит, последовательность случайных процессов (gw), 0 < t < 1, п = 0, 1, 2, ..., Р-п. н. сходится равномерно к непрерывному процессу /г=0 Из оценки (4.120) и леммы Фату следует, что M|2<3(L + Mri2)^. Покажем, что построенный процесс £ = (£,)! t^l, является решением уравнения (4.112), т. е. что Р-п. н. для каждого t, 0<f<l, t t I/-Л- J a(s, l)ds-j b(s, l)dWs = 0. (4.121) о о В соответствии с (4.119) левая часть в (4.121) равна t t [It- 1Г°]+ J И* Vn))-a(st $)]ds+ j[b{s9 Цп))-Ь(8, l)]dWs. о о (4.122)
§ 4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ В силу условия Липшица (4.110) 153 / S l[a{s,lta))-a(s,l)]ds\ <L, J \\tu-\™fdK{u)ds + о I о о" t + к f| h - iif Г ds < L SUP 11. - if p- (4-123) 0<s<l Точно так же согласно (4.60) и (4.110) для любых б>0 и е>0 >е < < J[6(s,gw)-*(s,i)]dr( о <-^ + р{{[М5,1(П,)-6(5>|)]2^>б}< {t s t L{ $ j \tu-t«)\dK(u)ds + L2 j \ts-l(*\4s 0 0 0 >8< <£ + P{L sup |ls-|(»)|2>6}. (4.124) Ho P{ sup Ig, — gsrt)|2>6}->0, az-»oo; поэтому из (4.123) 0<s<l и (4.124) следует, что величина (4.122) стремится по вероятности к нулю при п->оо. Этим доказано, что £ = (£,), 0</^1, является решением уравнения (4.121). Из построения процесса | вытекает, что он является измеримым по (/, о) и неупреждающим, т. е. #"?' ^-измеримым при каждом t. Итак, при Мт]2 < оо существование сильного решения уравнения (4.112) доказано. Предположим теперь, что Мц2т < оо, т> 1, и установим оценку (4.113). Пусть Х*(0- 1, sup||5|<HI + ^, 0, 8ир16,1>1л1 + ^. _( 1. 1лК«. *в~\0, 1п1>".
< 154 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 По формуле Ито t t $т = П2т + 2т J trX a(s, I)ds + m (2m - 1) J fsm'2b2(s9 l)ds+ о о t + 2m\£m-xb{s, l)dWs. 0 Отсюда для t^s, учитывая равенство %N (t) tyn = %N(t)%N (s)ty2n, находим, что 6?"% (О +« = %ы (0 +я +яЛ2т + j +яХлг (5) &5w~Ifl (s> 6)ds + L о + m (2m - 1) j %Xn (s) l2sm~2b2 (s, |) ds + 0 t + 2mj%%N(s)l^b(s, l)dWs 0 t < Vl2"1 + 2m J г|)д„ (s) E|«-»a(sf g) ds + о t + m(2m-l)J^Xjv(s)if-262(S> g)ds + 0 t + 2« J" +вХдг(в)1?-1*(*. i)^5. (4-125) 0 Заметим, что в силу определения Xjv(0 И Ф/i 1 М /*1»ХЛг(*)Б?|-2*8(в. g)^<oo. О Поэтому (см. (4.125) и (4.48)) t MgMxjV(0*„<MT|a» + 2/ii J M^Xyv(s)|^-^(5, £)|tfs + 0 + m(2m- 1) J Mto(s)|2/"-2ft2(s, g)<fc. 0 Для оценки величин IS*"1""11| a{s, Q\ и ^m~262(s, g) воспользуемся неравенством fli/Pii/*<£+A (4.126)
§4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 155 справедливым (см. [16]) для любых а^О, 6>0, р>1, \/р+ \lq=\. Полагая в (4.126) р = 2т/(2т—1), q = 2m, имеем Лт\{1Р ( 2т, к.Лх^ \ts\2m-l\a(s,t)\ = (gT(a2m(s, l)Y <—^— Is +i>-a (5, |). 2т 2т Аналогично при р = т/(т — 1), q = m г2г2ьц8, |)<^i^ + ±^(5) Б)- Поэтому для каждого m существует такая константа ат, что ( м . + «*/м %*(*>*. if+ (i+^)+J(i + ^)d/c(Sl) ) Us, (4.127) где < [i + s; + J (i + g.) <**(*,) f с некоторой константой Ьт, Из (4.127) и (4.128) находим (ст — константа) Г ' О t S О О (4.129) Прежде чем идти дальше, установим следующее предложение. Лемма 4.14. Пусть с, d — положительные постоянные и w(0> t^O,— неотрицательная ограниченная функция такая, что- u(t)^d+c\t+ ju(s)ds + j $ uisJdKisJds , (4.130) L о oo J г$е К (s) —неубывающая непрерывная справа функция, 0^ ^tf(s)<l.
156 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Тогда а(*)<(1+<*)**' —1. (4.131) Доказательство. Из (4.130) следует, что 1 + и(/)< [t t S "I j(l+u(s))ds+ J j{l+u(sl))dK{sl)ds\. 0 0 0 J Применяя лемму 4.13 с c0 = (l + d\ c{ = c2 = c, u(0— 1 к функции l + w(f), получаем требуемое неравенство (4.131). Воспользуемся этой леммой, беря в (4.129) u(t) = = M[l2tm%N(t)tyn]. Тогда согласно (4.131) Щ12Г%^)^п]<(1 + Мц2гп)есгп'-\. (4.132) Отсюда, по лемме Фату, вытекает МЩ" < lim M [l2tmxN(t) фя] <(1 + Щ2т)ес"? - 1. N-*oo П-+оо Для завершения доказательства теоремы осталось проверить, что решение уравнения (4.112) существует и без предположения Mr)2 < оо. Пусть лл = Л*я, где +я = Х{|Ч|<я), и 6Я = (|Я(0> 0<*<1,- решения уравнения (4.112), отвечающие начальным условиям Ео = Чя, Mt]2<az2. Пусть m > п. Тогда так же, как и при доказательстве единственности решения уравнения (4.112) (в предположении Mr)2 < оо), устанавливается неравенство t s MKm(0-b,(0]8*»<2LI J" J M[|m («)-|„ (u)Y%dK(u)ds + 0 0 + 2L2JM[|m(«)-i„(«)]2^^, 0 из которого в силу леммы 4.13 следует M['E>m(t) — ln(t)]2'^n = 0. Значит, Р{1Ы0-Ы01>0}<Р{|ч|>п>. (4-133) Поскольку по предположению Р{ |т| | < оо}= 1, то из (4.133) следует, что Р{| lm{t) — ln{t) | > 0}-*0, т, я->оо, т. е. последовательность {in(t), n=U 2, ...} фундаментальна по вероятности. Следовательно, для каждого t, 0^/^ 1, существует P-HmU0*=g(0.
§ 4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 157 Аналогичные рассуждения показывают, что P-lim Г \[h-U(s)]2dK(s)dt+ \[ts-tn(s)]2ds\ = 0. Это равенство позволяет (ср. с доказательством соотношения (4.121)) в уравнении t t Ш = Ъ+ \a(s9 lm)ds + jb(s, tn)dWs о о перейти к пределу по я->оо, что и завершает доказательство теоремы. Следствие. Рассмотрим стохастическое дифференциальное уравнение dxt = a(t, xt)dt + b(t, xt)dWti (4.134) где функции a(t, у), b(t, у), 0<*<1, у е R\ удовлетворяют условию Липшица [a{U y)-a(tt y)]2 + [b(t, y)-b(t, 9)]2<L[y-y]* (4.135) и растут не быстрее, чем линейно: a2{U y) + P{t, y)<L(l+y2). (4.136) Тогда согласно теореме 4.6 уравнение (4.134) с начальным условием х0 = ц, Р(|т]|<оо)=1 имеет единственное сильное решение. Замечание. Теорема 4.6 легко обобщается на случай векторных стохастических дифференциальных уравнений dxt = a (t, x)dt + b{t, x) dWt, x0 = т), где т| = (т|ь ..., ть), xt = (x{ (/),..., xn(t))9 Wt = (W{(t)9 ... ..., Wn(t)) — винеровский процесс, a(t, x) = (al(t, *), ..., an(t, x)), b(t, x) = \\bu(t, x)\\, /, /= 1, ..., n, xe C,. Для существования и единственности непрерывного сильного решения у рассматриваемого уравнения достаточно потребовать, чтобы функционалы а*(/, x)f bij{t9 x) удовлетворяли п п условиям (4.110), (4.111), с xl=^ixi(s),\xs-ys\2='^l\xi(s)^ ~~yi(s)f, a p(J] I л,! <<*>)==!.
?~m Pcmt 158 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Неравенство (4.113) обобщается следующим образом: если п м 2 л?т < °°, то м 21 e?«(/x(i + м S л1т)в' 3. Из неравенства (4.113) видно, что конечность моментов Mrj2m влечет за собой и конечность М12т при любом /, 0^/^1 (и вообще при любом t^O, если уравнение (4.112) рассматривается на полупрямой 0^/<оо). Рассмотрим теперь аналогичный вопрос относительно экспоненциальных моментов. Теорема 4.7. Пусть | = (£,), О</<Г, — непрерывный случайный процесс, являющийся сильным решением стохастического дифференциального уравнения dxt = a{t, xt)dt + b{t, xt)dWt, х0 = ц, (4.137) где ц — У0-измеримая случайная величина с Меет>2<оо (4.138) для некоторого е>0 и функции a(t, у), b(t, у), y^R1, таковы, что a2(t, уХК2(1+у2), \b(t, у) |<* (4.139) (К — константа). Тогда найдется такое 6 = 6(Г)>0, что 6£2 sup Me <<oo. (4.140) Доказательство. Рассмотрим сначала частный случай уравнения (4.137): dxt = axtdt + bdWt, х0 = ц, (4.141) где о>0 и 6^0 —константы. Покажем, что тогда утверждение теоремы справедливо. Нетрудно проверить, что единственное (непрерывное) решение lt уравнения (4.141) задается формулой t Л + Ъ J e~as dWs t at Ясно, что yt = b J e~as dWs является гауссовской случайной о t т величиной с Му; = 0 и My2 = b2 J" e-^ds^b2 j e~2as ds (=/?),
§ 4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 159 Выберем Тогда в силу независимости величин ц и yt Ме*Б< < М exp [26e2at [rf + у2]} = — y2 = М exp {2be2aty\} M exp {26e2fl<у2} < MeeTi2Me5* < < 2 2 <Меет>2 sup Me5* Y'<oo. Перейдем теперь к рассмотрению общего случая. По формуле Ито t t If = Л2" + 2az J £*»-> a (s, у ds + az (2n - 1) | gf "262(s, ts) ds + о о t +2«je-1*(*. 6.)^.- о В силу предположения (4.138) Mr]2m < oo для любого m^l. Поэтому согласно (4.113) о Следовательно, t t М12п^Мц2п + 2п J" M|gf-'a^, g|ds + /(2Az(2n-l)|M^-2rf5< о о < Mrf» + 2лг/С J М (1 + 2lf) ds + К2п (2я — 1) J Mgf-2 ds < о о t t <Мт]2 + 2nKT + 4пК j Ml2sn + К2п (2л — 1) J Mgf "2 rfs. (4.142) о о Выберем г > 0 так, чтобы М(л2 + гГ>Мл2* + 2Аг/а\ Тогда из (4.142) получим t t Щп < М (г)2 + r)n + 4ntf J ME?1 + K2n (2/i - 1) J Mgf-2 ds. о о (4.143)
160 Стохастические интегралы [гл. 4 Рассмотрим линейное уравнение dyt = 2Kytdt + KdWti y0 = (rf + г)щ. (4.144) По формуле Ито Щ2п = М (л2 + г)п + АпК J* Ща ds + К2п (2п — 1) J Myf ~2 ds. о о (4.145) Полагая в (4.143) и (4.145) /г=1, находим, что t Щ\ < М (л2 + г) + 4К J Mg2 ds + К% (4.146) о М#2 = М (т)2 + г) + 4/С J Mi/2 ds + /С2<. (4.147) о Докажем теперь следующее предложение. Лемма 4.15. Пусть u(t), v(t), t^О,—интегрируемые функ- ции такие, что при некотором с > О t u(i)<v{t) + c j* и(s)ds. (4.148) о Тогда и (t) < о (0 + с J ec«-*>t; (s) ds. (4.149) о tf/ш эгол*, если в (4.148) при всех t^O имеет место равен- ствоу то и (4.149) выполнено также со знаком равенства. Доказательство. Обозначим z(t) — j u(s)ds и g(t) — о — u(t) — v(t)—cz(t)^0. Ясно, что *?£L = cz(t) + v(t) + g(t), z(0) = 0. Отсюда вытекает, что t t z{t)=jec«-s)[v(s) + g(s)]ds^jec«-s)v(s)dsy о о и, следовательно, t и (0 < »(0 + «(0 < о (0 + с J ес ('-*> о (s) ds,
§ 4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 161 что и доказывает (4.149). Заключительная часть леммы следует из того, что g(t) = 0. Применяя эту лемму к (4.146) и (4.147), находим t М£2< М (л2 + г) + КЧ + АК \ е* «~5> [М (ц2 + г) + K2s] ds = My2. о Отсюда, используя эту же самую лемму, из (4.142), (4.145) по индукции получаем неравенства М12п^Му2\ п>\, 0<f<7\ 2 2 Поэтому, если для некоторого 6>0 Me у* < оо, то и Me '< <Меб^<оо. Для завершения доказательства теоремы осталось лишь заметить, что если Мевг? < оо для некоторого е > 0, то для уравнения (4.144) Мегу2° = е*гМе^2<°оу а поэтому, как было показано выше, найдется такое 6=6(Г)>0, что sup Me y* < оо. Замечание. Ослабить условие | Ъ{t, у)\^К, заменив его требованием | b(t, у) |^/С(1 + | у |), вообще говоря, нельзя, что показывает следующий пример: dxt = xtdWt, *0—Ь В этом случае xt = e t 2 , Мех° = е<оо, a М^-Мехр(бв2^} = оо при любом б > 0. 4. В ряде последующих глав будут рассматриваться стохастические дифференциальные уравнения несколько иного типа, нежели уравнения (4.112). Теорема 4.8. Пусть a(t, х), b{t, x), /e[0, I], *eCi,— неупреждающие функционалы, удовлетворяющие условиям (4.110) и (4.111). Пусть W = (Wt, &t) — винеровский процесс, ^^(фг, 3^t) — некоторый (Р-п. н.) непрерывный случайный процесс и %{= (Ki (t), Srt), i =1,2, — случайные процессы 0 IM0K1.
162 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Тогда уравнение t t *, = Ф,+ f bx(s)a(s, x)ds+ j k2(s)b{s, x)dWs (4.150) о о имеет единственное сильное решение. Доказательство. Начнем с единственности. Пусть 6 = (6/) и | = (|Д 0^/^1, — два решения уравнения (4.160). Как и при доказательстве теоремы 4.6, находим, что M%?[h-l]2< t <2 J* Mx?[(a(s, t)-a(s, t)f + (b(s, Q-b(s, \)f]ds. о Отсюда в силу условия Липшица (4.110) и леммы 4.13 получаем M%^[|f — I,]2 = 0, что приводит к соотношению Р {sup | L — L | > 0} = 0 (ср. с соответствующим доказатель- ством в теореме 4.6). Этим единственность установлена. Для доказательства существования сильного решения предположим сначала, что М sup ф^<оо. Тогда, рассматривая 0<*<1 последовательность непрерывных процессов 1\п\ лг = 0, 1, 2, ... ..., 0^/=1, определяемых из соотношений t t Цп) = ъ + j я, (s) a (s, £<"-<>) ds + { %2 (s) b (s, £<"-'>) dWs, о о как и в теореме 4.6, убеждаемся, что М sup [&<"+>>-Iff < с, ^ t ^ 1 где сх и с2 — некоторые постоянные. Далее устанавливается, что последовательность непрерывных процессов 1{п) = (1\п)), 0</<1, /г = 0, 1, 2, ..., сходится Р-п. н. равномерно (по t) к некоторому (непрерывному) процессу g = (y, 0</<1, который является сильным решением уравнения (4.150) с supM£?<oo. В общем случае, когда условие Msup(p?<oo нарушает- ся, для доказательства существования решения рассмотрим
§4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 163 последовательность уравнений * t 6»(0-Ф«(0 + \bi(s)a(s, lndds+lb(s)b(s, tm)dWs, (4.151) о о где <рт(0 = Ф,Лт ит =inf(f<l: sup| ф5 |>m), считая хт = I если sup| ф51 < m, т = 1, 2, ... Поскольку | фт(0 |^ т, то уравнение (4.151) при каждом т=1, 2, ... имеет непрерывное сильное решение. Далее, как и в теореме 4.6, устанавливается, что при каждом t, 0^/^l, lm{t) сходится при т->оо по вероятности к некоторому процессу l{t), который удовлетворяет Р-п. н. уравнению (4.150). Замечание. Утверждение теоремы 4.8 обобщается на случай векторных уравнений (4.150) с xt = {xx{t), ...., xn{t)), Ф/ = (ф1(0» •••». Фя(0)» скалярными процессами Яг- = (Яг(/), #",), 1М0К* (/=1, 2) и a(t, x) = (a](t, х\ ..., an(t, *)). b(t, x) = = 11 bij(t, x)\\ (/, /=1, ..., п). Достаточно лишь потребовать, чтобы процессы ф^ = (фД/), grt) были непрерывными, а функционалы at(/, л:), bij{t> x) удовлетворяли условиям (4.110) и (4.111). 5. Рассмотрим еще один тип стохастических дифференциальных уравнений, для которых в гл. 12 будут подробно изучаться задачи фильтрации. Теорема 4.9. Пусть не упреждающие функционалы a0(t, x), а{у,х), b(t,х),0^1^ 1, удовлетворяют условиям (4.ПО)w(4.Ill), и пусть | a{(t, х)\^~с < оо. Тогда, если т) — &'0-измеримая случайная величина с Mrj2<oo, то 1) уравнение dxt = [a0(ty x) + a{(t, x)xt]dt + b{t, x)dWt, x0 = % (4.152) имеет единственное сильное решение; 2) если Мц2т < оо, m^l, то существует такая константа ст > 0, что Mgf~<(l + M42,V"'-l. (4.153) Доказательство. Если существование решения у уравнения (4.152) установлено, то справедливость оценки (4.153) будет следовать из доказательства соответствующего неравенства (4.113) в теореме 4.6, поскольку при его выводе использовалось лишь условие (4.111), очевидно выполненное для функционалов а0(/, *), a{(t, x)xu b(t, x). Условие Липшица (4.110) не выполняется для функционала ai ('» У) У г Поэтому для доказательства существования и единственности решения уравнения (4.152) непосредственное применение теоремы 4.6 невозможно. Поступим следующим образом.
164 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 Рассмотрим последовательность процессов £<я)=(£*я)) , 0</<1, /1=1, 2, ..., являющихся решениями уравнений dttn) = [a0(t, гП + axit, WSniff1)]*+ *('» t])dWt, |<«> = n, (4.154) *w-{ 1 z, |г|<п, I г | > п. Тогда при каждом /i=l, 2, ... функционал ^(f, y)gn{yt) Удовлетворяет, как нетрудно видеть, условию Липшица (4.110). Следовательно, для каждого я=1, 2, ... сильное решение l{f уравнения (4.154) существует и единственно. Анализ доказательства неравенства (4.113) показывает, что М(^)2<(1 + Мл2)^-1, где константа с{ не зависит от я. Значит, sup sup M(W<(l + Mr]2)^i— 1< oof п 0<*<1 ч у что с учетом (4.54) дает неравенство sup М sup (1[п))2< со. п 0<*<1Ч 1 } Следовательно, Р[ sup |ЙпМ>/1КЛ-зирМ sup (£W->0, n->oo. (4.155) Положим trt = inf(/<l: sup | £M | > n), считая Trt=l, если sup | l(sn) | < az, и пусть для заданных пг и п, п' > п, о = хпА t'n. Тогда tAo 1<»;>а-|<»>а= { [a0(s, |<«'))-а0(5, |W)]ds + О tAo + J [fl,(s, l",'))^(ir,)-«i(s> 1<П))£„&П))Н* + 0 + 'f[6(S(i('t',)-6Ui(n))]^s
§ 4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 165 Принимая во внимание условие Липшица, отсюда находим, что t s м №%, - tft of <с. J J* м [6<-;)e -1« ef rf* do <** + о о t 0 где Cj и c2 — некоторые постоянные. Из (4.156) согласно лемме 4.13 получаем МГЕ<п/> — 1{п) 12 = 0 т. е. при f<^ = tnAv решения g<ft/> и ^ совпадают Р-п. н. Поэтому для любого /, 0^/^1, Р{|^,)-^)|>0},<Р{а</} = Р{тяЛт/г,</}< <Р{тя</}+Р{тв,</}<Р{8М|6?)|>Л}+Р{8ир|бМ|>я^ что вместе с (4.155) приводит к соотношению lira Р{|^в>-6Р| = 0. П-+оо Значит, величины 1[п) стремятся по вероятности к некоторому пределу £,. Из совпадения величин 1[п) и Цп/) при t e [О, а] следует, что Т/г < %пг (Р-п. н.) для п' > п. Пусть п = п{ < п2 < ... Тогда P-lim \Ы = \ и при /<Trt l(nl) = l(n2)= ... =^ (Р-п. Н.). Поэтому < ^ p {ч <'}= p (sup I &ini) I > ni} -*°> ^i=^-> °°. Итак, существование сильного решения уравнения (4.152) доказано. Пусть теперь £ = (£/) и f = (§*), 0</<1,— два таких решения уравнения (4.152). Тогда, как и в теореме 4.6, устанавливается (с использованием леммы 4.13), что Мх^ (0 [6/ —1<]2 = О,
166 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 где Хлг(0 = ')С| suP(|2+|2)<yvj- Отсюда получаем Р {11, — 1,| > 0} ^R (sup(if -hIf) > Л^} -^0, JV-*oo, что в силу непрерывности процессов g и | приводит к равенству P{sup|£,-I,|>0} = 0. Теорема доказана. 6. Сформулируем еще одну теорему о существовании и виде сильного решения линейных! векторов стохастических дифференциальных уравнений. Теорема 4.10. Пусть элементы вектор-функции а0{t) = -KW. ■••.в0я(0) и матрщ ai(0 = |aJI/)(0|. b(t) = \\bu(t)\\9 it /=1, ,.., п, являются измеримыми (детерминированными) функциями t, O^t^U удовлетворяющими условиям 1 1 1 J" \a0J(t)\dt <oo, J | afj (t) | dt < oo, j b2if (t) dt < c. 0 0 0 Тогда векторное стохастическое дифференциальное уравнение dxt = [a0(t) + a{{t) xt]dt + b{t)dWi9 x0 = r\y (4.157) с винеровским (относительно системы (&*t), t^l) процессом Wt — (Wi(t), ..., Wn(t)) имеет, и притом единственное, сильное решение, определяемое формулой х, = Ф( L+ J <t>7\{s)ds + j <b7lb(s)dWs\9 (4.158) L о о J где Ф, — фундаментальная матрица (п X п), t Ф( = Е + j a{{s)Osds (4.159) о (Е— единичная матрица порядка (я X «)). Доказательство. Прежде всего покажем, что существует решение уравнения (4.159). Для этого рассмотрим последовательность {Ok(t), k = 0, l, ...} с t O0(t) = E, ..., Ok+l(t) = E+ j a{(s)Ok(s)ds. (4.160)
§ 4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 167 Имеем t O*+iW-O*(0-Jai(s)[G*(s)-«>*-i(s)]rfs (4.161) о и п t п п S |[ф*+.(*)-аду< J 2 нм| S i[®*w-v,(*)] j*. Поскольку в силу (4.160) п t п 2 |[ф,(о-ф0(С|</ S к/(*)и*<«>. o</<i, то из (4.161) получаем, что )•< J J] |a<'/(s)|ds . 0 /, /=1 / 1 1 Отсюда следует, что матричный ряд Фо(0+2[Ф»+1(0-Ф*(01 fc=0 сходится абсолютно и равномерно к матрице Ф, с непрерывными элементами. Поэтому после предельного перехода при &->ор в (4.160) убеждаемся в существовании решения уравнения (4.159). Матрица Ф, почти всюду, 0</<1, дифференцируема, и производная ее определителя | Ф^ | -^l = Spa1(0-|O/l, |Фо1=1, почти всюду, 0</<1. Отсюда находим |ф/| = ехрМ Spa^dsL 0<г<1, и матрица Ф, невырожденная. Покажем теперь, что решение уравнения (4.159) единственно. Поскольку матрица Ф, не вырождается, то из тождества Q>tQ)Tl — E находим, что почти всюду, 0^/^1, dOT I dO* i i Чг * ~ ф;' чг ФГ = - ФГ й1 W- <4-162>
168 стохастические интегралы tnn. 4 Пусть Ф*, Ф0 = Еу—еще orho решение уравнения (4.159). Тогда в силу (4.159) и (4.162) почти всюду, 0</<1, 1(фг'ф,)=о, что доказывает совпадение непрерывных матриц Ф, и Ф^ при всех 0<*<1. Теперь, для того чтобы убедиться в существовании сильного решения системы стохастических дифференциальных уравнений (4.157), достаточно применить формулу Ито к представлению (4.158) для xt. Для доказательства единственности решения системы уравнений (4.157) заметим, что разность ht = xt— xt двух любых ее решений xt, xt удовлетворяет уравнению t А, = Д0 + J a, (s) As о И iiM^ihoL+iihiy^iiiM i=\ i=l 0 i, /=1 /=1 Отсюда по лемме 4.13 имеем и следовательно, любые два решения xt, xt, O^/^l, с Р{х0 = х0 = г)}= 1 совпадают Р-п. н. при всех t. Замечание. Наряду с (4.157) рассмотрим уравнение dxt = [a0 (t) + а{ (0 xt + a2 (t) £,] dt + b (t) d$tf x0 = л, (4.163) где l = [(h(t), ..., ln(t))> 3~t\—процесс Ито с дифференциалом d\t = а, (со) dt + р, (со) dWi9 (4.164) W = ([Wi(t), ..., Wn(t)]> 9~t) — винеровский процесс, a вектор (а, (со), grt), 0</<Г, а, (со) = [а{ (t, (о), ..., an(t, со)], и матрицы (р,(со), Pt), 0<f<7\ р,(со) = ||р,у(^ со) ||, и ft(*) =|| М*)|| порядка (пХп) обладают следующими свойствами: т Р ' I J" IMOM*, <*)\dt< ос ==1, /, /«1, ..., пу (4.165)
§ 4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 169 Если вектор aQ (t) = [а01 (/), ..., а0п Щ и матрицы а{ (t) = || а{Ц (t) ||, а2(/) = ||^/)(0| порядка (пХп) удовлетворяют предположениям теоремы 4.10, то, аналогично доказательству теоремы 4.10, устанавливается, что t t ** = ф< ц+\ф;1 (а0(s) + а2(s) ls)ds + j Ф;]Ь(s)d% (4.166) где Ф, удовлетворяет (4.159), является единственным сильным решением уравнения (4.163). 7. Рассмотрим теперь вопрос о существовании и единственности слабого решения уравнения d\t = a (t, I) dt + dWir l0 = 0. (4.167) Пусть (Сь ^)—измеримое пространство непрерывных на [0, 1] функций x = {xt), 0^/^1, с лг0 = 0, 3Bt = o{x: xSi s^-t]. Обозначим v винеровскую меру на (С{, ${). Тогда процесс W=(Wt (*)), 0^/^1, на пространстве (Сь 38i9 v) будет винеровским процессом, если определить Wt{x) = xt. Теорема 4.11. Пусть не упреждающий функционал a = (a(t, х))у 0<?<1, х^Си таков, что v\x: ja2{t, x)dt <oo [ = 1, (4.168) Mvexp | a(t, x)dWt(x)—-j^a2{t, x)dt =1, (4.169) где Mv — усреднение по мере v. Тогда уравнение (4.167) имеет слабое решение. Доказательство. Для доказательства существования такого решения достаточно построить совокупность объектов *s^ = (Q, #", STU P, W, £), удовлетворяющих требованиям определения 8. Возьмем Q = Cb ST = gtu @~t=<]fit. в качестве меры Р рассмотрим меру с дифференциалом P(dco) = p(#(co)) v(dco), где р(Г((о)) = ехр Ja(/, W((u))dWt(a>)—z Ja2(/,■#(©))Л l о о Из условия (4.169) вытекает, что мера Р является вероятностной, поскольку P(Q) = Mvp(*)=l.
170 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ [ГЛ. 4 На вероятностном пространстве (Q,#~, P) рассмотрим теперь процесс Wt = tyt— $ a(s,W)dsf 0<*<1. (4.170) о Согласно теореме 6.3 этот процесс является винеровским (относительно системы а-алгебр 9^ и меры Р). Поэтому, если положить lt = Wtt то из (4.170) найдем, что t lt—ja(s9 t)ds + Wti 0<*<1. (4.171) о Итак, построенная совокупность объектов зФ = (Q, 9°% ?Tt, Pi W, I) образует слабое решение уравнения (4.167). Замечание 1. Пусть \iw и jug — меры, отвечающие процессам W и |. Тогда (А|(Л) = Р(|еЛ) = Р(ГеЛ)== J" p(t(G>))v(d(D) = - j p(W(<o))dixw(<*). {We A} Поэтому щ < \xw> и согласно лемме 6.8 \xw < щ. Таким образом, \xi ~ \xw и -^ (W (со)) - р (W (со)) (Р-п. н.). (4.172) Замечание 2. В силу (4.168) РМ а2(/, иГ)Л<оо) = 1, и согласно замечанию 1 jut^ ~ (%. Поэтому построенное выше слабое решение таково, что РМ a2(t, l)dt<oo\ = L (4.173) Теорема 4.12. Пусть выполнены условия теоремы 4.11. Тогда в классе решений, удовлетворяющих условию (4.173), слабое решение уравнения (4.167) является единственным. Доказательство. Пусть si = (й, ЯГ, 9Ги Р, W, I) — построенное выше решение и ^'^(Q', ЗГ', 9~и Р, W', %') — еще
§ 4] СИЛЬНЫЕ И СЛАБЫЕ РЕШЕНИЯ 171 одно слабое решение с Р'М a2(t, ?) dt< со) = 1. (4.174) Тогда по теореме 7.7 [д^, ~ \xw, и ^(Г(соО) = р(Г(соО), что вместе с (4.172) дает требуемое равенство jli^, (Л) = ^ (Л). Теорема доказана. Сформулируем, наконец, еще один результат, являющийся, по существу, следствием теорем 4.11 и 4.12. Теорема 4.13. Пусть функционал а = (а(/, *)), 0</<; 1, jceCi, таков, что для всякого х&С{ 1 j a2(t, x)dt< со. (4.175) о Тогда условие (4.169) является необходимым и достаточным для существования и единственности слабого решения уравнения (4.167). Доказательство. Достаточность следует из теорем 4.11 и 4.12. Для доказательства необходимости заметим, что если s& = (Q, &~, &~ь Р, W, I) — некоторое слабое решение, то в силу условия (4.175) из теоремы 7.7 вытекает, что |xg ~ \iw и -^(Г(со)) = р(Г((о)). Значит, ^(Q)=|p(r((D))d^((o)=l, что совпадает с равенством (4.169). Замечание. Достаточные условия выполнимости равенства (4.169) приведены в § 2 гл. 6.
ГЛАВА 5 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ. СТРУКТУРА ФУНКЦИОНАЛОВ ОТ ВИНЕРОВСКОГО ПРОЦЕССА § 1. Разложение Дуба — Мейера для квадратично интегрируемых мартингалов 1. Пусть (Q, #~, Р) — полное вероятностное пространство, F = (3Tt)9 t^O, —неубывающее непрерывное справа семейство а-подалгебр &~, каждая из которых пополнена множествами из #", имеющими нулевую Р-вероятность. Обозначим Жт совокупность квадратично интегрируемых мартингалов, т. е. непрерывных справа мартингалов X = {xti #",), О^ /^ Г, с sup Ых\ < оо. Через Жт будут обозначаться мартин- галы X = (xti &~t), 0^.t^.T, имеющие Р-п. н. непрерывные траектории и удовлетворяющие условию sup Мх2{ < оо. Очевидно, Жт £ Жт- В случае Т = оо классы Ж<*> и Ж°<х> будут обозначаться соответственно Ж и Жс. Случайный процесс Z = (j^,#",), 0 </^ Г, где мартингал X = (xt, &~t)^ Жт, является неотрицательным субмартингалом и согласно теореме 3.7 принадлежит классу DL, а в случае Т < оо — классу D. Применяя разложение Дуба — Мейера (теорема 3.8 и следствие из нее) к субмартингалу Z = [x2v #",), 0^/^Г<оо, получаем следующий результат. Теорема 5.1. Для каждого X е Жт найдется единствен- ный (с точностью до стохастической эквивалентности) натуральный возрастающий процесс At = (x)t, t^.T, такой, что для всех t, 0</<7\ x2t = mt+{x\ (Р-п. н.), (5.1) где (mt, @~t), t^.T, —мартингал. При этом для t^s М [(*, - xsf | ГЛ = М [(x\ - (x)s | Г,] (Р-п. н.). (5.2)
§ 1) РАЗЛОЖЕНИЕ ДУБА - МЕЙЕРА J73 Доказательство. Достаточно установить лишь (5.2). Но (mt, &~t) и (xt, £Tt)— мартингалы, поэтому М [mt - ms | <Га) = 0, M [х\ - х] \ <TS] = М [(*, - xsf \ <Ts] (Р-п. н.), и (5.2) вытекает из (5.1). Пример 1. Пусть X = {W(9 &*t) — винеровский процесс. Тогда (Wt) = t (Р-п. н.). Пример 2. Пусть a(t, со)^TiT и X = (xt, &~t), *< Г, — непрерывный мартингал xt= \ a(s, &)dWs. Тогда по формуле Ито о t t х] = 2 | a(s, ®)xsdWs+ J a2(s, a)ds. о о Непосредственно проверяется, что процесс t t yt = 2 J a (s, (o) xs dWs = x\ — J a2 (5, ©) ds о о является мартингалом, а процесс Г a2(s, &)ds натурален. По- о этому в рассматриваемом примере t (x)t = j a2 (s, о) ds. 0 2. В дальнейшем нам понадобится аналог разложения (5.1) для произведения xt • yt двух квадратично интегрируемых мартингалов X = {xti&~t) и Y = (yt,£Ft)t 0</<7\ Теорема 5.2. Пусть Ieir, Y^Mt- Тогда найдутся единственный (с точностью до стохастической эквивалентности) процесс (х, y)ti являющийся разностью двух натуральных возрастающих процессов, и мартингал (m„ £Tt) такие, что для всех t, 0</<Г, Xtlft = tnt + (x, y)t (Р-п. н.). (5.3) При этом Р-п. н. M[(^-^)(^-^)|^s] = M[(jc, y)t-(x, y)s\Fs]. (5.4) Доказательство. Покажем прежде всего, что существуют процессы mt и (х, y)t с указанными свойствами, для которых выполнено (5.3). Согласно (5.1) (** ~ ytf = шГу + (х- у\9 (xt + ytf = т*+У + (х + y)t, где приняты очевидные обозначения.
174 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Определим теперь (*. y)t = j [{x + y)t — {x — y)t\ и Щ = xtyt — (*, y)t. Ясно, что (х, y)t есть разность двух натуральных возрастающих процессов. Проверим, что (m„ @~t) есть мартингал. В силу формулы аЬ — -т-[(а + bf — (a — bf\ М [xtyt — xsys | Ts] = M [(*, — xs) (yt — ys) | 3*%] = = | M {[(*, + */,) - (x, + */s)]2 - [(*, - y,) - (xs - ys)f | <FJ = -^M{[(x + y)t-(x + y)s]-[(x--y)t-(x-y)s]\Fs}== -Тт{х+у),-(х-у)<]-[{х + у),-(х-у)а]\Га}*= = М[(х,у\-(х,у)5\Р8]. Отсюда следует, что процесс (mtl STt) есть мартингал. Пусть теперь имеется еще одно представление xtyt = т\ + A't, где (mrv 5^)— мартингал, а А\ — процесс, являющийся разностью двух натуральных возрастающих процессов. Если время t дискретно (/ = 0, 1, *.., N), то равенства m't = mt, A\ = (х, y)t (Р-п. н.) устанавливаются следующим образом. Поскольку A't+l -A\ = {xt+lyt+l - xtyt) - (т'ш - m't), то в силу ^-измеримости A't+\ и равенства (5.4) A't+i — А\ = М [*жуж — xtyt | *-J = (х, y)t+l — (х, y)t (Р-п. н.). Но А'0 = (х, у)0 =* 0. Поэтому Л^ = (*> #), и m\ = mt (Р-п. н.) для каждого / = 0, 1, ..., N. Если же время t непрерывно, то единственность разложения (5.3) устанавливается с помощью приема, использованного при доказательстве единственности в теореме 3.8. Замечание. Во избежание недоразумений отметим, что, вообще говоря, (х + y)t Ф (x)t + (y)t- Равенство (л: + y)t = = {x)t + (у\у t^T, будет выполнено Р-п. н. в том случае, когда мартингалы X = (xh &~t) и Y = (yti &~t) ортогональны (X _L Г), т. е. (х, y)t = 0> t^ Г. В силу единственности разложения (5.3) условие (л:, y)t = 0, как нетрудно показать, эквивалентно тому, что процесс (xtyty@~t), t^.T, также является мартингалом.
§ 1] РАЗЛОЖЕНИЕ ДУБА - МЕЙЕРА 175 Пример 3. Пусть W = (Wti &~<) — винеровский процесс и t t xt = j a(s, со)dWs, yt=jb(s, со)dWs, о о где т т М J a2(s, (o)ds< оо, M J b2(s, a>)ds< oo. о о Тогда X = (xt, 3~t)^ <^Ti F = (jf,f/)Glr и по формуле Ито 5 t XtUt = J [xsb (s, со) + ysa (s, со)] dWs + J a (s, со) 6 (s, (o) rfs. о о Как и в примере 2, показывается, что процесс Г [xsb (s, со) + о + #sa (5, со)] d№ является мартингалом, а t (х, y)t~ \ a (s, со) b (s, со) ds. (5.5) о В частности, если yt=sWt, т. е. b{s, со)=1, то t (х, №), = J a (s, со) ds (Р-п. н.), t < Г. (5.6) 0 3. Один из центральных результатов теории квадратично интегрируемых мартингалов состоит в том, что представление (5.6) справедливо для любого мартингала X = (xt, 5Tt)^JlT, t а не только в случае, когда xt= \ a(s, &)dWs. Точный резуль- о тат дается в следующей теореме. Теорема 5.3. Пусть мартингал Х = (хи &~t) & Жт и W = (Wt, @~t) —винеровский процесс. Предположим, что семейство о-алгебр F = (@~t), /<Г, непрерывно справа, т. е. &~t = @~t+ для всех t, 0^/^Г, где &~т+ = @~т. Тогда найдется случайный т процесс (a{t, со), !Ft) с М | a2(t, со) dt < 00 такой, что для всех t, о t {xt W)t = J a (5, со) ds (Р-п. н.). (5.7) t
176 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Предварительно докажем такую лемму. Лемма 5.1. Пусть семейство F = (dTt), t^.T, непрерывно справа, W = {Wti @~t) — винеровский процесс и X = (xt, STt) e MT- Пусть случайный процесс {g{t, со), &~t), t^.T, измерим относительно о-алгебры на [О, Т] X й, порожденной неупреждающими процессами, имеющими непрерывные слева траектории и т t М J g2(s, ©)(d |(jc, W)s | + ds)< oo. Тогда, если у t = J" g (s, со) dWs, то Р-п. н. (x,y)t= $ g(s,a)d(x, W)s, (5.8) где интеграл понимается как интеграл Лебега — Стилтьеса. Если для почти всех со функция (х, W)t абсолютно непрерывна, то равенство (5.8) выполняется для любого процесса (g{tj®)> @"t)> t^T, удовлетворяющего условию т М j>(s,cD)(d|<*, W)s\ + ds) <оо. о Доказательство. Пусть gin)(t,(u), /z=l, 2, ..., — по- следовительность простых функций, оо g{n) {U со) = 21 g (ЦК ©) х^ ,<*>,] (0, 0 = #> < ... < t(n) = Ty (5>9) таких, что т М l\g(t,o>)-gM(t,(a)f(d\{x,W)t\ + (U)-*0, «^oo. (Существование такой последовательности в более общей ситуации доказано ниже в лемме 5.3.) Тогда в силу (5.4) и (4.48) (Р-п. н.) М [<*, y)t - (х, у), I Г,] = М [(xt - х.) (у, - у,) | £",] = = М (x,-xs)jg{u, <t>)dWu\rt = М = l.i.m. M П-Х» х, Jg(u,©)diTe|^ • о t xtjgM(u,®)dW,A9:
§ 1] РАЗЛОЖЕНИЕ ДУБА —МЕЙЕРА 177 Согласно (5.9) t где / и т определяются из условий t\n) < s < t\n+u 4? < ^^m+r He ограничивая общности, можно считать, что /{*' = s, /S}+i = '. Тогда М Ljg<"'(",co)rfrB|rJ = L s -J = 2 м|^('Мр Г*», -Г,„Л1^-),= /</}</П (я) ]!■ -2 "{"(*.1^а,)«№'-•)[»*,-Г*>]Г'|- = S М{*№»)[*®Г*Р\Х®1\*''}- (5Л0) l^k^tn где М{^(^,со)[^1-Г«„)],П1|^) = = М {g {tf\ со) М [(*, W)tftt ~ <*. W)tp | ftw] | ^} = = M j g (tf\ со) [(>, W)t^x - (x, W)^ | Г81. (5.11) Из (5.10) и (5.11) следует, что М L 0 *, J ё{п) {и, со)rf^M I^UmM g<* {щ со)rf<*, W)u\ Г1 . (5.12) Переходя в (5.12) к пределу при az->oo, получаем, что Р-п. н. l.i.m. M ГС-»оо xt\g^{u,a>)dWu\&-l S = м Итак, M[(x,y)t-(x,y)s\^s] = M jg(u,«>)d(x,W)u\$~A. (5.13) lg{u,<a)d{x,W)u\rt\,
178 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 i где процесс ) g (и, со) d (x, W)u можно представить в виде раз- о ности двух натуральных возрастающих процессов. Поэтому согласно теореме 5.2 (х, y)t допускает представление (5.8). Заключительная часть леммы вытекает из доказываемой ниже леммы 5.5. Доказательство теоремы 5.3. Пусть (g(/, со), !Ft), t^Ty —функция, удовлетворяющая условиям леммы 5.1 и такая, что g2 (t, со) = g (/, со) и \ g (t, (о) dt = 0 (Р-п. н.). Покажем, о т что тогда и \ g(ty (o)d(x, W)t = 0 (Р-п. н.). о t С этой целью положим yt= \ g(s, &)dWs. Ясно, что процесс о Y = (y, @~t), t^Ty является квадратично интегрируемым мартингалом и по лемме 5.1 t (x,y)t=j g(s,<»)d(x,W)s. (5.14) О t Но My2 = М J g2 (s, со) ds = 0. Поэтому yt = 0 (Р-п. н.), / < 7\ и, о значит, (Ху y)t = 0 (Р-п. н.), /<7\ Из (5.14) теперь следует, что т I g(Sy(»)d(XyW)s = 0 (Р-п. н.). (5.15) о Определим в измеримом пространстве ([0, Г]ХЙ, Я®, т)У\@"т) меру Q( •), положив ее на множествах SX^Sg $iq, т), А<= 2Гт равной Q(SXA)= J Г \d(xyW)u]dP(<o). Тогда из (5.15) вытекает, что мера Q абсолютно непрерывна по мере Ry где R {S X А) = X (S) Р (Л), Я— мера Лебега, % {dt) = dt. Следовательно, найдется такая i?[0> т\ Х^"г-измеримая функция f(t, со) с f Г \f(ty оэ) \dtdP{(u) < 00, что " о Q(SXA)= J $f(t9<i>)dtdP{(i>). Q 0 A S
§ 1] РАЗЛОЖЕНИЕ ДУБА-МЕЙЕРА 179 Отсюда находим j (х, W)t dP (со) = J J / (s, со) ds dP (со), Л A U J и в силу произвольности множества 4efr <*, UT>,= J /(s, co)ds (Р-п. н.) (5.16) о для всех t, О ^ t ^ Г. Полученное представление (5.16) не есть еще требуемое представление (5.7), поскольку из проведенного доказательства вытекает лишь, что функция f(t, со) является Jf[o, п X ^-измеримой, и не вытекает, что при каждом фиксированном t она ^-измерима. Покажем, что на самом деле существует вариант функции f{t, со), ^-измеримый при каждом t, 0^.t^T. (Напомним, что производная Радона — Никодима f(t, со) определяется однозначно лишь Р-п. н.) Вытекает это непосредственно из следующего общего предложения. Лемма 5.2. Пусть (Q, Т, Р) — полное вероятностное про- странство и {@~t), t^O, — непрерывное справа семейство о-под- алгебр &', пополненных множествами из 5Г нулевой вероятности. Предположим, что $ X &'-измеримая функция F(t, со) является 9~гизмеримой при каждом £>0 и Р-п. н. абсолютно непрерывной, F (t, со) = \ f (s, со) ds, о где $У^£Г-измеримая функция f(s, со) такова, что Р J \f(s, ©)|ds<ooj = l, t>0. Тогда найдется такая @~гизмеримая при каждом t^O функция f (t, со), что t F (/, со) = J f (s, со) ds (Р-п. н.), t > О, о и Р И 1/(5, СО) |rfs < ool = 1, f>0.
180 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Доказательство. Если функция f(t, со) непрерывна Р-п. н. (по t^T), то можно взять f (t, (o) = f(t, со). Действительно, в этом случае /(,, ,),Цш^' + ^И(''') (5.17) и при каждом *<Г величины /(/, 0) будут #",-измеримы в силу непрерывности справа семейства F = (@~t). Если же функция /(/, со) не является непрерывной, то рассмотрим последовательность непрерывных функций \fn(t, co) = -„/,-...-..,„,„,*, „_1. 2....1. Известно,™ STa „о- о 1 следовательность обладает тем свойством, что с вероятностью 1 т lim \\f(t9a>) — fn{t,<u)\dt = 0. (5.18) *->оо0 Пусть f (t, со) — предел этой последовательности по мере АХР> где Я —мера Лебега на [0, Г], и {fnk(t, <о), Л = 1, 2, ...} — подпоследовательность последовательности {fn{ty со), /i=l, 2, ...}, сходящаяся п. н. по мере ЯХР к f (t, со). Покажем теперь, что при каждом t ^ Т величины fn (t, со), п=1, 2, ..., а следовательно, и fnk{t, со), k = l, 2, ..., и f (£, 0) ^-измеримы. Для этого рассмотрим последовательность дифференциальных уравнений xW=-nxW + nF(tt со), л=1, 2, ..., *<»> = 0. (5.19) Ясно, что величины t xf) = п J" e~n <'~S>F (s, со) ds при каждом /^Г ^-измеримы. Следовательно, таковыми же являются и величины xf\ Покажем теперь, что x{{i) = fn(ti со).
§ 1] РАЗЛОЖЕНИЕ ДУБА-МЕЙЕРА [%[ Действительно, из (5.19) и определения F(t, со) находим, что *(*) = „[/?(/, со)-*(*)] = г t = П г t l IS -l J* f (s, со) ds — n J* е-л <<-5> J / {и, со) rfu rfs = 0 0 0 J J/(s, (o)ds— jf(s9 g>)In I e-a«-tt>du\ds = = AZ J *-»«-*>/($, C0)ds, 0 что доказывает ^-измеримость (при каждом t*^T) величин fn{t, со), п= 1, 2, ... Наконец, из (5.18) следует, что * t j\f{s, со) | rfs = J|/(s, co)|ds<oo (Р-п. н.), />0. о о Лемма доказана. Применяя эту лемму к F(t, со) = (я, W)t, получаем требуемое представление (5.7). Остается лишь показать, что в этом т представлении М J a2(s, co)ds < оо. о Для с> 0 пусть b(t, <£) = е-с1а«>*Щ a(t, со) | и t yt = J* e~c Ia <5» ®> I sign a (s, со) drs. о Процесс 7 = {yti &~t), /<7\ является квадратично интегрируемым мартингалом, и по лемме 5.1 t <*. У>*= Je-cia(s»(°Hsigna(5, co)d(x, №>s = о * t = J e-c | a (s, со) | [sign а (5> 0)] a (S> a)ds= j b (S, CO) £&. (5.20) о о Ясно, что функция b = b{t, со), 0</<7\ является неупре- ждающей, ограниченной (| b{t, со) \^К < оо Р-п. н.) и, следовательно, принадлежащей классу Шт (см. определение 4 в § 2 гл. 4). По лемме 4.4 найдется последовательность простых
182 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. t функций bn(t, со), /1=1, 2, ... (соответствующих разбиениям 0 = t{0n)<t\n)< ... <tf = T, max l^i-^l-^O, >г->оо), таких, что | M| 6(/f G>) — ba(t, co)|2^->0, л- Из очевидного равенства Лп) V+1 Дл) J 6 (s, со) ds J [6Я (s, со) — 6 (s, со)] ds Лп) tfl-'T fti-ф и ST (^-измеримости функций bn{tf\ со) следует, что Лп) 4+1 *»We)' <*) = J JtHTfn) r/+i""(/ Ля) 'ж (s, co)-6(s, <*)]&* ,in)]ds tf */ ^i-4rt) Обозначим bn (t, со) = I Ля) J МГ6 (s, со) I ^(Л ds tin) o, Ля) ^ ± ^ Лп)
§ 1] РАЗЛОЖЕНИЕ ДУБА-МЕЙЕРА 183 Тогда т /i-1 /=о Лп) 4+1 ;2М J й(*, со)^ + 2М^ — о /=о J МГ6я(в,©)-6(в,©)|Г<(я)1Л (я) / Лп) Лл) ч+\ Ч 1 1 < 2М J bl(s, со) ds + 2M | [Ы$, со)- 6(s, (o)]2ds. (5.21) Оценим сверху величину М I b2n(tt co)d/. Из определения функции bn{t, (о) и соотношения (5.20) получаем т e_, /M Г М J b2n(U 0)^=2]М^—i о /=о я-1 /М [(*, у) ,ftv -<*,#> (rt) Г 'НГ 4t.-4n) (5.22) Но при 0^s<<^r в соответствии с (5.4), неравенством Коши — Буняковского и (4.49) М (М[(*,у)/-(х,у),|У«])« m < - s ~~ <-s м м т\2 (xt - xt) j e~° Iа <«• •> I sign а (и, со) dtPB | ^, <_J_M(M[(^-xs)2|^]X ХМ I J e-2tf 1 о (а, о» 11 sig.n а (ы> a>)|rf«|0",M< < М [xt — xsf = Мх? - Mx2s < Mxf. Из этого неравенства и (5.22) получаем Т п-1 М jbl (t, (о) dt < J] М [У<„> - /(J = М*г - М4 < М| < оо, /=о
184 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 что вместе с (5.21) дает следующую оценку: т т т М J b2{t, G>)d/<2M J" b2a(t9 ®)dt + 2M J [bn(t, ©) — &(*, co)]2rf/< 0 T < 4M4 + 6M J [6Я (f, со) — b (t, со)]2 dt. 0 Отсюда, переходя к пределу при az->oo, находим, что для любого с > О г г М J ^-2с | а <*. и) lfl2 (^ со) Л = М J Ь2 (t, (О) Л < 4М*2> О О а значит, по лемме Фату т М j a2{t, ©)Л<4М4<°°- о Теорема доказана. § 2. Представление квадратично интегрируемых мартингалов 1. Применим теорему 5.3 предшествующего параграфа для доказательства следующего важного результата о представлении квадратично интегрируемых мартингалов в виде суммы двух ортогональных мартингалов, один из которых есть стохастический интеграл по винеровскому процессу. Теорема 5.4. Пусть семейство F = (&~t), t ^ Г, непрерывно справа, мартингал X = (xt, g~t)<=MT и W = (Wti 8Г t) — винеров- ский процесс. Тогда существует такой F-согласованный процесс т (a(t, со), yt) с М | a2 (s, со) ds< оо и мартингал Z={zt, &~t)^J(Ti о что для всех t^T t xt= j a(s, со)dWs + z, (Р-п. н.). (5.23) о t Мартингалы Z = (zt, &~t) и Y = (yt, &~t), где yt = J a (s, со) dWs, о ортогональны (Z-LK), т. е. <*, */>, = 0, t^T. (5.24)
§ 2] Представление мартингалов 185 Доказательство. По теореме 5.3 можно найти процесс т (a(ty со), &~t) такой, что М j a2(t, a>)dt<oo и о t (jc, W)t= j a(s, e>)ds. (5.25) о t Положим yt = j a (s, со) dWs и zt = xt — yt. Очевидно, что о Z=(zt, ^)G/r, и по лемме 5.1 t t (x9 y)t = j* a(s9 ©)<*(*, W)s= | a2(s, co)ds. (5.26) о о Поэтому (z> y)t = (* — y> y)t = (x> y)t — (y)t = Q> т. e. Z1Y. t Замечание 1. Если M^=M [a2(s, co)ds, то zt = 0 о (Р-п. н.), f<7\ и */= J a(s> ®)dWs. о Действительно, Mx* = M [zt + */,)2 = Ш) + My?. t Ho Mx2t = My2t = M J a2(s, co)ds. Поэтому М^ = 0, и, следова* о тельно, 2, = 0 (Р-п. н.), /<7\ Замечание 2. Если в условиях теоремы 5.4 Wt=* = (tt^(/), ..., Wn(t)) — га-мерный винеровский процесс относи^ тельно (@~t)> t^Tf то аналогичным образом доказывается, что существуют ^-согласованные процессы (a,- (s, со), 3TS) с М Г а?(5, co)ds<oo, / = 1, ..., п, и мартингал Z = (zt,STt)^Mr п t */ = ]jjj J <*t ($> СО) dtt^ (5) + Z,, о такие, что t=l О
186 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 При этом п t М U J] J a, (s, ©) <ЛР« (S) j =0, f < Г. 2. Всякий случайный процесс X = (xt, &~t), tf<7\ вида * т xt= \ a(s, со)яШ?5, M j a2(s, со)ds < оо о о является квадратично интегрируемым мартингалом. Справедлив в определенном смысле и обратный результат. Теорема 5.5. Пусть W = (Wt, &~f) — винеровский процесс, t^T, и Жт — класс квадратично интегрируемых мартингалов X = (xt, ZTJ) с supM*2<oo и траекториями, непрерывными t ^ т справа. Тогда, если X е J[f9 то найдется процесс (/ (s, со), #~f), т s^T, с М ) /2 (5, со) ds < 00 и такой, что для всех t о t xt = x0+ J / (s, со) dWs (Р-п. н.). (5.27) о Доказательство. Прежде всего отметим, что (пополненная) система а-а\лгебр FW = (&~Y), t^T, непрерывна (теорема 4.3). По теореме 5.3 t {x9W)t=\f{s9a)ds> о где f(s, о) &Y-измерима, s<T. Положим xt = xt — x0. Ясно, что X = (xt, $~Т)^Лт и (х, W)t= J /(5, a>)ds. Тогда по тео* о реме 5.4 %t=jf(s>®)dW8 + zi9 о t где Mztjf(s)a>)dWs = 0, /<7\ о Покажем, что в рассматриваемом случае zt = 0 (Р-п. н.) для всех / ^ Г. Поскольку при каждом t величины zt $Ft -из-
§ 2] ПРЕДСТАВЛЕНИЕ МАРТИНГАЛОВ 187 меримы, то достаточно установить, что для любого п = 1, 2, ... MztUF,(Wtj) = 0, (5.28) где Fj(x) — ограниченные, измеримые по Борелю функции и 0<^< ... <<„<'. Возьмем /i=l, F{{x) = eikx, — оо < Я< оо и докажем, что при всех s^< Мье*ш' = 0. (5.29) Имеем М*в|ХГ' - М [М (zt | rj) eaw°] - Mzseaw°. По формуле Ито S S е™* = 1 + 1% \ eaw« dWu —Ц- \ eawu du. (5.30) о о Отсюда находим М&влг— Mzs + /Ш zs J ear« dr„ --j- M 2, J еаг« du . Ho Mzs = 0, M / eaw« du\ = MJ zseaw« <te - M Г J Af (* I *T) etw» du\ и по лемме 5.1 s m' Г "1 Г "1 Г П zs J e'x*« dWu\ = M *,- J f (u, <o)dWtt J eaw» dWA = Lo JLo JLo J = Mxs j eiKW» dWu-MJf (u, ©) dWa J eawu dWa = 0 0 0 s s = M j f {и, со) eaw» du — MJf(u9 ©) е'ш« du = 0. о о Поэтому Мг*ЛГ«---£/м(г||вЛ,г«)(*и, • 0 и, следовательно,
188 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 В силу произвольности Я, — оо < Я< оо, отсюда выводится, что и для всякой измеримой (по Борелю) ограниченной функции F{ (х) выполнено равенство (5.29). Докажем теперь (5.28) по индукции. Пусть для любых ограниченных функций Рх{х), ..., Fn^i(x) м*д/>,(*,,)=о. Надо показать, что тогда и Mzt П ^/ (^#) — 0- Положим сна- /cesl чала Fn(Wtn) = e Ч — оо < Х< оо. В силу (5.30) Поэтому *rt-l + ttMUjj[F/0r,/) + ^«dtt7H /=1 Я2 м 'П-1 п-1 *П>/(^,) *"*«** /=1 По предположению индукции я-1 (5.31) (5.32) Ясно также, что М п-1 ^IP/O^/) \ *******\Г7П_Х /=1 = 0. (5.33) Из (5.31) —(5.33) получаем /i-i /г-1 /=1 Л-1 *Я-1 /=*0
§ 3] СТРУКТУРА ПРОЦЕССОВ 189 Следовательно, Mzte tfl Ц F) (Wt/)=0. В силу произвольности Я, — оо<Я<оо, отсюда вытекает требуемое равенство (5.28). Теорема 5.5 доказана. Замечание 1. Если Wt = (W{ (t), ..., Wn(t)) — я-мерный винеровский процесс и X = [xt, 3~f), /< Г,—квадратично интегрируемый мартингал с #Т = а{(о: W\(s), ..., Wn{s), s<#, то п t *t = *о + 2J* ft (s, со) dWt (s), (5.34) 1=1 0 где величины ft(s, со) ^7-измеримы, i=l, ..., п, и п T 2 j*M/2(s, co)rfs<oo. (5.35) i=l О Доказательство проводится так же, как и в одномерном {п= 1) случае. Замечание 2. Из представления (5.27) следует, что всякий квадратично интегрируемый мартингал X = [xt, yf)^J[J имеет непрерывные (Р-п. н.) траектории (точнее, имеет непрерывную модификацию). § 3. Структура функционалов от винеровского процесса 1. Пусть (Q, У, Р) — полное вероятностное пространство и W = (Wt, У 7), /<Г, — винеровский процесс. Будем предполагать, что &~f, t^T, пополнены множествами из У, имеющими Р-меру нуль. Теорема 5.6. Пусть g = g (со) есть &~J-измеримая случайная величина с Mg2<oo. Тогда найдется Fw-согласованный процесс {f(t, со), УТ), /<7\ с т М j>(/, ©)Л<оо (5.36) такой, что Р-п. н. l = Ml+j f(t, ®)dWt. (5.37) Если к тому же случайная величина g и процесс W = (Wt), О^^^Г, образуют гауссовскую систему (§ 1 гл. 1), т. е. совместное распределение % uW является гауссовским, то найдется
190 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 детерминированная измеримая функция / = / (t), 0 < t < Г, т с Г f2(t)dt < оо такая, что о г 6-М6+Jf(0rf^. (5.38) о Доказательство. Пусть xt = M (Б \STf), где условные математические ожидания выбраны так, что процесс xt1 О^^Г, имеет непрерывные справа траектории (это можно сделать в силу теорему 3.1). Тогда мартингал X = (xv TJ) е Лт и по теореме 5.5 найдется функция /(/, со) с указанными свойствами и такая, что t xt = М (| | Г*) + J* f (s, со) dWs. (5.39) о Отсюда следует требуемое представление (5.37), поскольку М(Б 1^7)"МБ (Р-п. н.), а хг = Б. Предположим теперь, что совместное распределение Б и W является гауссовским. Положим А—|г. ^Ея = *{*>: Го> ^ ■•■. «4 = Поскольку &~xln^&~fn+] и ^ = a/U^T/i)' т0 п0 теореме Леви (теорема 1.5) Бя = М(Б \@~Yitl) -*Б ПРИ я "^°° с вероятностью 1. Последовательность случайных величин {(Бя— Б)2> а=1, 2, ...} равномерно интегрируема, и поэтому НтМ|Б«-Б12 = 0. Значит, lim М|Бя— Бт|? = 0- Но в силу следствия 3 теоремы п, т-»оо о нормальной корреляции (теорема 13.1) i„ = M(il^„)=Mg + • , у'м[(£-мЩ^+1)А-Пд)у w , + 24 д [W(k+i)&— Wk&\ = fc=0 г о
§3] СТРУКТУРА ПРОЦЕССОВ 191 где fn (S) = ~ М [(£ - Ml) (W{k+l) д - Wkb)]> *Д < 5 < (k + 1) Д, и, очевидно, ) /2 (5) ds < оо. Следовательно, по свойствам стохастических интегралов т lim M||„-|m|2= !im \{fn{s)-fm{s)?ds. n, m-*oo n, m-*oo Отсюда следует, что существует такая функция / (s), 0 ^ s ^ Г, т с J f2{s)ds < оо, что о т т lim f [Us)-f(s)fds = 0 и l.i.m. g„ = Mg + \f(s)dW,. С другой стороны, \A.m. ln = l. Поэтому П-*оо T t = Mt+jf(s)dWs. О Замечание 1. Отметим, что при доказательстве утверждения (5.38) не использовался результат (5.37). По существу, утверждение (5.38) есть всего лишь следствие теоремы о нормальной корреляции. Если же известно, что £=М£ + т + J f{sf to)dWs, то будет справедливо также и представление о т 1=Щ + | M/(s, (o)dWs. Чтобы в этом убедиться, достаточно о заметить, что в этом случае введенные выше функции /rt(5)==» №+1)Д te=X M/(5> (o)ds, и поскольку lim fn ($) = М/ (s, со) для почти А п->°° всех s (см. доказательство леммы 4.4), то в качестве функции /(s), участвующей в представлении (5.38), можно взять Функцию f(s) = Mf{s, со). Замечание 2. Утверждение (5.38) становится, вообще говоря, неверным, если предполагать, что случайная величина | нормально распределена, но не требовать, чтобы совместное распределение (|, W) было гауссовским.
192 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ.5 Действительно, случайный процесс t lt=jS(Ws)dWs, О где S<H-!, ,<0, является винеровским. Значит, случайная величина 1 = %т является гауссовской, но ее нельзя представить в виде стоха- т стического интеграла J f(s)dWs с детерминированной функ- о цией f(s). Замечание 3. Из представления (5.38) следует, что в качестве функции f(t) можно взять функцию f(t)=-^M[(l-Ml)Wt]. т Пример 1. Пусть |= J Wsds. Поскольку (|, W) является о гауссовской системой, то | может быть представлено в виде т \ f(t)dWt. Простой подсчет показывает, что f{t) = T — / и, о следовательно, т т jWtdt=j(T-t) dWt о о (это соотношение легко получить также из формулы Ито). Пример 2. Пусть | = W\. Тогда ! W* = 3+ j[\2(\ — t)Wt + 4W*]dWt. о Действительно, пусть xt = U[W\\rj\ = lA[W\\Wt\ Поскольку распределение P(Wx-^.x\W^ является нормальным, N (Wt, 1 — t), то xt = M W*\Wt] = М [(Wt — Wt + Wt)41 Wt] = = M Wi - W,Y I Wt] + 4M [(Wi - Wtf Wt I Wt] + + 6M [(Г, — Wtf W2t I W]\ + 4M [(№, - Wt) W] I Wt) + W*t=* = 3(i-o2 + 6(i-/)r2 + r*.
§ 3] СТРУКТУРА ПРОЦЕССОВ 193 Отсюда по формуле Ито находим dxt = [12(1— /) Wt + 4W3t\dWt, что с учетом равенства Мй^ = 3 приводит к требуемому представлению (5.37). 2. Согласно теореме 5.5 всякий квадратично интегрируемый мартингал X = (xt, STf)^J(Y допускает представление (5.27), т где функция f(t, со) такова, что М I f2(t, a)dt<oo. Рассмо- о трим теперь вопрос о возможности аналогичного представления мартингалов X = (xt, &~f), удовлетворяющих, вместо условия supMx?<oo, более слабому требованию sup M| xt |< со. Теорема 5.7. Пусть X = [xv @~J), t^T,— мартингал, имеющий непрерывные справа траектории и такой, что sup М|*, |< оо. (5.40) Тогда найдется Fw-согласованный процесс (f(t, со), 3~J), t^T, такой, что РМ /2(s, (o)ds<oo) = l (5.41) и для всех t^T xt = x0+ j f(s, <»)dWs. (5.42) Представление (5.42) единственно. Доказательство. Прежде всего покажем, что на самом деле рассматриваемый мартингал X = [xt, #"f) имеет непрерывные траектории. Пусть [x'f\ п=\, 2, ...} — последовательность ^^-измеримых функций с М (х^)2 < оо таких, что М\хт-хр\<±. . Обозначим x{tn) непрерывную справа модификацию М [xff> | &~f), существующую по теореме 3.1. Тогда по теореме 5.5 t xf^xw+jfn(s,®)dWs, (5.43)
194 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Т где М [ f2n(s, co)ds<oo. Из этого представления следует, что о у мартингала X{n) = [xf\ &~f)> t^T, есть непрерывная модификация. Процесс^ — xf\ ZTJ) имеет непрерывные справа траектории, и по неравенству (3.6) для любого е > О Р{ sup \xf — xf\> г\^г-{Ы\хт — xf\<,z-{n2. Поэтому по лемме Бореля — Кантелли lim sup I xt — x[n) I = 0 (Р-п. н.). Отсюда следует, что Р-п. н. функции xt> t^T, непрерывны, как равномерные пределы непрерывных функций х\п), t ^ Т. Перейдем теперь непосредственно к доказательству представления (5.42). Определим момент xn='mi{t^T: \xt\^n}, полагая %п = Ту если sup \ xt\<n. Ясно, что {Trt<^}e^"^ и процесс Хп = t ^.т = (*„(*)> yf) с xn{t) = xtAX образует мартингал (см. 3.16)). В силу непрерывности Р-п. н. процесса xti t^iT, SUpl^At п\<П. Тогда, применяя к мартингалам Xn = {xn(t), STJ) теорему 5.5 получаем, что для каждого п= 1, 2, ... t Xn{t) = Xa(0)+jfn(S, <*)dWs, о т где М J f2n(s, a>)ds< oo. о Заметим, что для т^п ' *т (t А %п) — *п (t) И tAxn xm(tAxn) = xn(0)+ j fm(s, (*)dWs = 0 t = *я(0)+ J fm(s9 a>)%{sup\xa\<n}{s)dWs.
§ 3] СТРУКТУРА ПРОЦЕССОВ \ J95 Отсюда по свойству (4.49) находим: т JM{fm(s, c0)X{suP|*a|<rt}(s)--Ms, co)}2ds = 0. Следовательно, на множестве тех (t, со), для которых sup| хи |<лг, fn(t, G>) = /n + i(/, CO) = ... /, (/, со), если sup|*fl|^l, Положим fit, со) = и<г f2(t, со), если 1 < supl хи |^2, Так построенная измеримая функция f = f(t, со) при каждом t является ^"^-измеримой. Далее, для любого лг = 1, 2, ... ( Т I ( Т I со: J>(s, ©)ds=oo si©: J[f(s, ©)-/„(s, ©)]2ds>ois I о J I о ) ^{co: sup| xs \^n}. Но в силу непрерывности процесса xt) t^Tt P{sup| xs |>az} ->0, az ~>oo. Поэтому P I f2(s, (o)ds < oo 1 = 1 и определен стохастический t интеграл j f(s, a)dWs, /<7\ Положим %t = *o + J f (5, со) йГ5. В силу неравенства J [/(5, со)-/,(5, (D)WS >e}< <P [/(5, ©)-/„(*. ©)P^>*|+-pr (см. замечание 7 q § 2 гл. 4) *, = P-lim *„(*)<
196 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 С другой стороны, Р-п. н. \\mxn{t) = \imxtAx =xt, /<7\ п п п Значит, Р-п. н. для всех t^.T xt = xt и t x, = x0+jf(s, *)dWs. О Осталось установить, что это представление единственно: t если также xt = x0+ Г f'(s, a>)dWs с неупреждающей функ- о цией /'(s, со), такой, что Р | (/'(s, со))2 ds < оо I = 1, то f(t, со) = /'(/, со) для почти всех (/, со). Пусть f{t, со) = /(/, со) —/'(/, ш). Тогда для процесса *'= I ^ ^' ^ dWs по формуле Ито о t t Щ = J f 2 (s, со) tf s + 2 J *J (s, со) dWs. о о г Ho xt = 0 (Р-п. н.), /<Г. Поэтому f f2(5, co)ds = 0, откуда 0 следует, что f(s, co) = /'(s, со) для почти всех (s, со). Теорема доказана. Замечание. Пусть Wt = (Wl (/),..., Г„ (/)) — ^-мерный винеровский процесс и #"^ = а{со: И^ (s), ..., №„ (s), $</}• Если Х = (х„ #"Л, /<7\ — мартингал и sup М| л:, | < оо, то найдутся /^-согласованные процессы (/\ (/, со), #~f), * = 1> • • • > я> такие, что Р V [ f2.(s, со) ds < оо = 1 и Р-п. н. для каждого 4=1 0 / /г ' Доказательство этого представления основано на формуле (5.34) и проводится так же, как и в одномерном случае.
СТРУКТУРА ПРОЦЕССОВ 197 3. Из теоремы 5.7 легко выводится следующий полезный результат (ср. с теоремой 5.6). Теорема 5.8. Пусть g = ^(co) — &"%-измеримая случайная величина с М111 < оо и М (| | #~f), t^T, — непрерывная справа модификация условных математических ожиданий. Тогда найдется процесс (/(/, со), Pf), 0</<7\ такой, что РМР(/, со) dt < оо = 1 и при всех t, О < t < 7\ t M(l\STf) = Ml+ jf (s, со) dWs (Р-п. н.). (5.44) В частности, i=m + jf(s, <»)dws (5.45) Доказательство вытекает из теоремы 5.7, если в ней положить xt = M(l\&~f) и учесть, что л:0=М£. 4. Теорема 5.9. Пусть | = g(co) — ^"f-измеримая случайная величина с Р(| > 0)= 1 и Ml < оо. Тогда найдется процесс ((f (t, со), g~J), 0</<Г, такой, чтоР{ JV(/, a))dt< oo =1 и для всех t^T Р-п. н. М(6|07)= ехр В частности, J cp(s, co)dR75 —yj ф2(5, ©)rfs M|. (5.46) г Т 1= ехр J ф (s, со) dr5 — у J ф2 (s, со) ds l-o о М|. (5.47) Доказательство. Пусть xt = M(l\@~Y), ^ ^> — непрерывная справа модификация условных математических ожиданий. Тогда по теореме 5.8 t xt = Ml+ jf(s, <*)dWs. (5.48) о Покажем, что P(infx,>0)=l. (5.49) t<;T
198 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Действительно, мартингал X = (xt, &~f), t ^ T, является равномерно интегрируемым. Поэтому, если т = т(со)— марковский момент с Р(т^Г)=1, то по теореме 3.6 *t = M(g|0-f). (5.50) Положим x = ini{t^.T: xt = 0}, считая т = оо, если infxf>0. На множестве {т ^ Т) = {inf xt = 0} величина хт = 0, поскольку согласно (5.48) процесс xt9 t < Г, непрерывен Р-п. н. Поэтому в силу (5.50) 0= J МР(со)= { ^Р(со). {т<Г} {т<Г} Но Р(|>0)=1. Поэтому Р(т<Г) =Р(Ы*, = 0) = 0. Введем функцию „(,, со) =Щ?-(- ^ \. (5-51) Щ + jf(s9 «>)dWs для которой в силу условия Р (inf xt > 0) = 1 РМф2(/, ©)Л<оо) = 1. ^0 Далее, согласно (5.48) и (5.51) dxt = f(t, a>)dWt = <p(t, ®)xtdWt. Единственное непрерывное (сильное) решение уравнения dxt = y(t9 <b)xtdWt9 *0 = Mg, (5.52) существует и задается формулой г t xt = exp J ф(5, G))dWs — у J ф2(5, ©)rfs U о Mg. (5.53) Действительно, то, что (5.53) дает решение уравнения (5.52), следует из формулы Ито и показывалось в примере 3 § 3 гл. 4. Пусть yt, t<^T, —-еще одно решение этого уравнения. Тогда нетрудно проверить, опять-таки используя формулу Ито, что d(yt/xt) =5 0, Отсюда находим Р {sup | х% — yt | > 0} = 0,
м § 4] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ 199 § 4. Стохастические интегралы по квадратично интегрируемым мартингалам 1. В четвертой главе был определен стохастический инте- t грал It(f) = [ f(s, <o)dWs по винеровскому процессу W={WU yt), о />0, для неупреждающих функций / = /(/, со), удовлетворяю- оо щих условию М J f2(t, ®)dt < оо. Среди нетривиальных свойств о этого интеграла наиболее важными являются следующие два свойства: t М J"/(s, a>)dWs = Ot (5.54) о - t -12 t J f (s, со) dWs = M J f2 (s, со) ds. (5.55) -o Jo Винеровский процесс является квадратично интегрируемым мартингалом, М (Wt — Ws |^"5) = 0, t^s, обладающим тем свойством, что для него M[(Wt-Wsf\&-s] = t-s. (5.55) Сопоставление (5.56) с (5.2) показывает, что для винеровского процесса натуральный возрастающий процесс At = (W)t = t. Анализ конструкции интеграла It(f) приводит к мысли, что можно определить аналогичный интеграл J f(s, a))dxs по ква- о дратично интегрируемым мартингалам X = (xt9 @~t)^J(. В самом деле, для них выполнено равенство М [(xt - xsf \Г8\ = 1А [(x)t - (x)s \Г81 (5.57) аналогичное равенству (5.56), играющему ключевую роль при определении стохастических интегралов It(f) по винеровскому процессу. Обозначим At = (x)t, t^O. Можно было бы ожидать, что тот естественный класс функций f = f(t, cd), для которых опре- t деляются стохастические интегралы I f(s, a>)dxSi /^0, есть о класс неупреждающих функций, удовлетворяющих условию оо Mj f2(t, ®)dAt<oo. (5.58)
200 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ 1ГЛ. 5 Что касается условия (5.58), то его выполнения приходится требовать, если желать, чтобы стохастический интеграл обладал аналогами свойств (5.54) и (5.55). Однако при рассмотрении произвольных мартингалов Х = = {xt, STt)^J( возникает дополнительная тонкость, состоящая в том, что запас функций, для которых удается определить t стохастический интеграл f(s> (o)dxSi существенно зависит от о свойств натуральных процессов At = {x)t, отвечающих мартингалу X = (xti &~,)<^J(. Введем следующие три класса функций: Ф{, Ф2, Ф3(Ф12Ф22Ф3), для которых в зависимости от свойств натуральных процессов At, t^O, будут определяться стохастические интегралы. Пусть (Q, #~, Р) — полное вероятностное пространство и (^), /;>0, — непрерывное справа неубывающее семейство а-под- алгебр #", пополненных множествами из SF нулевой вероятности. Определение 1. Измеримая функция f = f{t, со), /^0, cd<=Q, принадлежит классу Фь если она является неупреж- дающей, т. е. f{tf со) #>измерима (5.59) для каждого /^0. Определение 2. Измеримая функция f = f(t, (о) принадлежит классу Ф2, если она является сильно неупреждающей, т. е. /(т, со) #"т-измерима (5.60) для каждого ограниченного марковского момента т (относительно (#",), />0). Определение 3. Измеримая функция / = /(/, со) принадлежит классу Ф3, если она является неупреждающей и измеримой относительно наименьшей а-алгебры на /?+ X й, порожденной неупреждающими процессами, имеющими непрерывные слева траектории. Замечание 1. Всякая функция f e Ф3 является сильно неупреждающей (следствие леммы 1.8). Замечание 2. Непрерывные слева функции f = f(t, со) являются предсказуемыми в том смысле, что /(/, со)= lim /(s, со) s ^ t для каждого t^0. Поэтому функции класса Ф3 называют неупреждающими и предсказуемыми. Через La (Ф/) будем обозначать функции из класса Ф19 удовлетворяющие условию оо М j" /2(s, o>)dAs< 00. о
§ 41 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ 201 Определение 4. Функция f <= La(Ф\) называется простой, если существует такое конечное разбиение 0 = tQ < ... < tn < оо, что f«><») = %f(t,<»n(tk,tk+l](t). (5.61) Определение 5. Функция f^L2A(02) называется простой стохастической, если существует последовательность т0, хи ..., хп марковских моментов таких, что 0 = т0<т, < ... ... < %п < ОО (Р-П. Н.) И /(/,co)=2/K,co)x(Tft.tft+i](0. (5.62) Классы простых и простых стохастических функций будем обозначать соответственно & и (§fs. 2. Пусть Х = (хп &])<=: Л, лг0 = 0 (для простоты) и At = (x)t, t^O. Определим стохастический интеграл 1(f) (обозначаемый также J f(sya))dxs\ от простой стохастической функции f = — f(tf со), положив /(/) = /|/(тьсо)[^+1-^]. (5.63) В частности, если f = f(t, со) — простая функция, определенная в (5.61), то по определению !(f)=2f(tk,<*)\xtk+l-xlk]. (5.64) Если /<=<^s, то под стохастическим интегралом /T(f) = т = Г /(s, co)dxs будет пониматься интеграл 1(g) от функции о g(s} co) = f(s, co)x{s<T}(5). (5.65) t Аналогично, под интегралом /a, T (f) = J f(s9 to) dx5, где a Р(а^т)=1, понимается интеграл от функции g{s, co) = /(s, co)x{a<s<T}(s).
202 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Так определенные стохастические интегралы обладают следующими свойствами (/, f{ и /2 — простые стохастические функции). It(afi + bf2) = alt(f{) + blt{f2) (Р-п. н.); а, Ъ = const, t>0. (5.66) t и t \ f(s, cd)dxs=\f(s, cd) dxs + J /(s, cd)dxs (Р-п. н). (5.67) 0.0 и I'/(/) — функция, непрерывная справа no t^0 (Р-п. н.). (5.68) Г * "is J /(и, (D)rfjcB|^"s| = jf(u, (>>)dxu (Р-п. н.). (5.69) Lo Jo M M t t и t j* /j (и, cd) dxw J /2 (w, <d) dx„ = M J f{ {и, cd)/2(и, cd) dAu. (5.70) о о Jo В частности, из свойств (5.60) и (5.70) вытекает, что t MJf(u9 (o)dxu = 0t (5.71) о М И f(u, cd) dxA = М j f2(u, ®)dAa. (5.72) Lo Jo Как и в случае винеровского процесса, стохастический ин- оо теграл | f(s, a)dxs для измеримой функции / = /(5, cd), удо- о оо влетворяющей условию М /2(s, cd) dAs< оо, будет строиться о оо как предел интегралов J fn(s, (a)dxs от простых функций, ап- о проксимирующих (в определенном смысле) /(s, cd). В приводимых ниже леммах описываются классы функций, допускающих аппроксимацию простыми функциями в зависимости от свойств процессов At, t^0. 3. Лемма 5.3. Пусть X = (xti 3~t) е Л и At = (x)ti t > 0, — натуральный возрастающий процесс, отвечающий мартингалу X. Тогда пространство & простых функций плотно в La (Фз). Замечание 1. В общем случае, если на мартингал Х^Ж не накладывать дополнительных ограничений, то в замыкание 8 (в L2A (Фз)) могут не входить неупреждающие функции, имеющие траектории, непрерывные справа.
§4] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ 203 Замечание 2. Если А = (Ati 5Г t), t > 0, — модификация процесса А = (Л„ #",), то нетрудно показать, что l\ (Фз)=[^ (Ф3). Лемма 5.4. Пусть X = {xt> #"*)е Л, причем соответствующий натуральный процесс At = (x)t, t^O, является непрерывным с вероятностью 1. Тогда пространство & простых функций плотно в La{^2). Замечание 3. Если мартингал X = (xti @~t)<= JC квази- непрерывен слева (т. е. с вероятностью 1 х%п—>х%) если последовательность марковских моментов хп f т, Р(т<оо)=1), то процесс At = (x)ti />0, является непрерывным Р-п. н. (теорема 3.11 и ее следствие). Лемма 5.5. Пусть мартингал X = (xt, STt) e Ж, причем отвечающий ему натуральный процесс At = (x)t, t^0> является абсолютно непрерывным с вероятностью 1. Тогда пространство & простых функций плотно в La (Ф1). Перейдем к доказательствам этих лемм. Доказательство леммы 5.3. Заметим вначале, что а-алгебра 2 на R+ X й, порожденная неупреждающими процессами, имеющими непрерывные слева траектории, совпадает с а-алгеброй, порожденной множествами вида (а, Ь] X В, где Я е #"а. Действительно, если функция f = f(/, со) является не- упреждающей, имеет непрерывные слева траектории и ограничена, то она является пределом последовательности функций /г-1 где 0 = Йя) < ДО < ... <t[n) = T и max UM, — ftn)|-*0, и l kn o<k<kn-\' R+l * ' П-> оо. Из этого вытекает, что лемму достаточно доказать для функции % = %M(t> ю)> являющейся характеристической функцией множества М <= 2 такого, что М ^ [a, b] X Q- Обозначим v = v(-) меру на (7?+Хй, 2), определенную на множествах вида SXB равенством v (S X В) = М [JdiV, fil = | [Jd^(co)lP(rf(o). L5 J В LS J Согласно определению а-алгебры 2 для рассматриваемого множества MgS найдется такая последовательность множеств гс-1 {Ма, лг = 1, 2, ...} вида (J (^, ti+l\XBh где a = tQ<tl< ...
204 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 ...<tn = by множества Bt #",.-измеримы, что М^Мп и v(iM\Mrt)<-|-, т. е. Другими словами, оо о что и доказывает лемму. В доказательстве леммы 5.4 будут использованы лемма 5.5 и лемма 5.6 (см. ниже). Приведем сначала Доказательство леммы 5.5. В случае At = t утверждение леммы установлено в гл. 4 (лемма 4.4), где было показано, что существуют такие разбиения 0 = t{0n) < t[n) < ... ... < t{£] < оо, что для / е Ш^ оо М J \f{t, ©) — Lit, w)|2^->0, я->оо, (5.73) о /„(/. *)~!kf№ <*)\^<<<<[%^- <5-74> Значит, для некоторой подпоследовательности щ \ оо, /->оо, |/aco)-f„.(/,(o)|2->0, *->oo, (5.75) для почти всех (/, со) (по мере dtdP). Поэтому |/(/, со)— — fn^U ®)\2a(t, со)->0, /-*оо, также для почти всех (/, со). Без ограничения общности можно считать функцию / финитной и !/(*,©) |< К. Тогда \f(t9 (o)-fn(t, co)pa(/, ©)<4tf2a(ff со), оо где MJ а(/, (о)^ = МЛ^ < оо. Следовательно, о оо lim M f \f{t,®)-fn,(t, <*)\2dAt = оо = lim M f |/(f, (a) — fn.(t, co)|2a(/, ®)rff = 0, (5.76) что и доказывает лемму для ограниченных функций f = f(ty со), обращающихся в нуль вне некоторого конечного интервала.
§ 41 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ 205 Общий случай сводится к рассмотренному (ср. с доказательством леммы 4.4). Лемма 5.5 доказана. Лемма 5.6. Пусть 0<а<6<оо и a = a(t), /е[а, ft], — непрерывная неубывающая функция. Для каждого и^ R положим P(tt) = inf{а</<6: a(t)>u), если а(Ь)>и, и Р(а) = 6, если а(РХм. Тогда функция р = р (и), и <= 7?, обладает следующими свойствами: (1) не убывает и непрерывна справа; (2) если а(а)^м^а(&), то а($(и)) = и; (3) ес,ш а</<6, го Р(м)< /ффи < а(/); (4) если ф = ф (/), a^t^by — измеримая (по Борелю) ограниченная функция, то \%{a.b](t)v(t)da(t)= J q>(P("))£to. (5.77) а (а) Доказательство свойств (1) — (3) элементарно. Справедливость свойства (4) отмечалась еще в § 1 гл. 1. Доказательство леммы 5.4. Пусть функция f(t, со) <= е/,л(Фг) ограничена, обращается в нуль вне некоторого конечного интервала [a, b], a процесс At = At{®)9 />0, Р-п. н. непрерывен. Положим Pa(w) = inf {а</<6: Л,(со)> и}, если Л6(со)>и, и Р(0((/) = 6, если Ль(а>Х(/. Для каждого и^ [О, оо) случайная величина P(0(w) является марковским моментом со значениями в [а, &]. Действительно, согласно свойству (3) леммы 5.6 {со: рв(и)< *} = {©: а< Л/} для любого a^t^.b. Поэтому марковость момента ра(и) вытекает из леммы 1.2. Положим ^и = #"р(0(и) и f (и, со) = /(Рй)((/), со). Поскольку процесс p(D(w), u^Oy имеет Р-п. н. непрерывные слева траектории, то он измерим (даже прогрессивно измерим). Поэтому из измеримости процесса f = f(u, со) вытекает, что процесс ! = !(иу со) также будет измеримым. Согласно сделанному в условии леммы предположению функция / = /(/, о) является сильно неупреждающей, а значит,
206 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ - [ГЛ. 5 при каждом и^О случайные величины f (и, со) = /(Р^и), со) являются У'и = Уъ ^-измеримыми. В силу определения функции ро(и) и> Аь (со) =# рв (и) = Ь, и<Аа (о) =ф рв (а) = а. Поэтому, если c = sup|f(/, (о) | и f (t, оэ) = 0 для t&[a, b], то оо АЬ М J |f (а, со) р rfw = M J If (и, ю)|2^<с2МИь--Д,]<оо. 0 Аа Следовательно, к функции f = f (и, со), и^О, применима лемма 5.5, согласно которой для заданного е > 0 можно найти такое конечное разбиение 0 = uQ< и{ < ... < ип < оо, что оо М J I f (и, <о) — f я (и, со) |2 dw < e, о где f„<«, »)«2fКco)X(Wft,Uft+i)(«)= 2f(PaK).«>)x(Uft,.4+l,(«). Покажем, что функция является е-аппроксимацией рассматриваемой функции /е^(Ф2), т. е. 00 М/ |f(Л (о)-Фп(/, со)МЛ<е. О Для этого заметим, что согласно свойству (3) леммы 5.6 для всякого t, a < t ^.b, и & = О, 1, ..., п — 1 {со: и*< Л, <*/*+,} = {со: Ptt (uk)< t < P^ (uk+l)}. Поэтому, учитывая, что ^(uk)^[a, b] для всех wgQ и всех k = 0, 1, ..., n—lj заключаем, что функция cprt = qprt(/, ю), определенная в (5.78), может быть записана в следующем виде: - X* «(О Д / (Р. К), со) х{Рш (Uft) < , < M„fe+,» (О = -I'^W'^^cx^^c^))^ (5J9)
§ 4] СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ 207 По предположению процесс Л, = Л, (со), /^0, непрерывен Р-п.-н. Поэтому из свойства (2) леммы 5.6 следует, что если Ла(со)<(/< Л^(со), то А^(и) = и (5.80) и p(D(i/)e(a, b]. Следовательно, если ^(й)<«<А(й), то Ф» (Рсо М. ©) = V ь, (Рсо И fn (\ («). ©) = Гя ("> ®)- Тогда согласно пункту (4) леммы 5.6 00 М J* |/(*. ©)-фя(*, а)Р<М,= о = М J | / (ft, (и), со) - Ф„ (р. («), ш) р du = Аа АЬ = М J* !/(M"). »)-f„(«, ©) pd«< оо <MJ |/ф„(«), со)-f„(«, (о)|Чы = О оо = М J |f(ll, CD)-fe(M. ©)Р*«<в. О Итак, простая стохастическая функция ф.«.«)-2^т*,ш)¥»<'<^+.](<)' где %к = $Лик)> является е-аппроксимацией функции /(/, ю) в£л(Ф2). Поэтому, если установить, что простая стохастическая функция (Р(т^/С < оо)= 1), может быть сколь угодно точно аппроксимирована простыми функциями, то лемма 5.4 будет доказана. Пусть Хп(/, ©) — простая функция, определенная следующим образом: для k/2n <*<(£ + 1)/2я _| 1, если т(со)>&/2", Хи С.©) = | 0> если X(a)<kl2n.
208 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Тогда оо М | [% (t, со) - %п (t, 0)f dAt < М [ Лт+2_„ - Ах] -> 0, п -* оо. о Этим лемма 5.4 доказана для ограниченных функций / (t, со) е <= /Д (Ф2), обращающихся в нуль вне некоторого конечного интервала. Общий случай функций [(/,(о)е^(Ф2) легко сводится к рассмотренному. 4. Леммы 5.3 — 5.5 позволяют определить стохастические оо интегралы /(/)= | f(i, со) dxt по мартингалу I = fe^)el о для некоторых классов функций f = f(t, со), удовлетворяющих оо условию М ) f2{t, &)dAt < 00, как пределы в среднем квадра- о оо тическом интегралов I(fn)= \ fn (t, со) dxt от простых функций о fn^fnit, со), аппроксимирующих f = f(t,(i)) в том смысле, что оо М J" |/(f, со)--Мг, со)|2<*Л-*0, я->оо о (ср. с соответствующей конструкцией для винеровского процесса; § 2 гл. 4). Точный результат формулируется следуюшим образом. Теорема 5.10. Пусть Х = (х^@~{), t^O, —квадратично интегрируемый мартингал из Ж и At = (x)ti /^0, —соответствующий ему натуральный возрастающий процесс. Пусть выполнено одно из трех условий: I. Функция f e L2A (Фз). II. Функция /е£л(Ф2), и процесс Аи />0, Р-п. н. непрерывен. III. Функция ]^L\(®\), и процесс At, />0, абсолютно непрерывен (Р-п. н.). Тогда однозначно определена (с точностью до стохастической эквивалентности) случайная величина /(/), совпадающая в случае простых функций f с введенным выше стохастическим интегралом и такая, что M/(f) = 0, (5.81) 00 М[/(/)]2=М J f2(t, co)dAt. (5.82) о
§41 СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ 209 Значение случайной величины 1(f) не зависит (Р-п. н.) от выбора аппроксимирующей последовательности простых функций. оо Случайная величина /(/) обозначается также j f(t, <u)dxt о и называется стохастическим интегралом от функции f = f(t, со) по мартингалу Х = (х/(^)е1, Доказательство. Существование /(/) вытекает непосредственно из лемм 5.3—5.5. Свойства (5.81) и (5.82) следуют из соответствующих свойств для интегралов от простых функций fn = fn(t,(u) и того факта, что /(/) = l.i.m./(/я). 5. Под интегралом lx(f)=jf(s>®)dx. 0 будет пониматься интеграл оо /f(s.®)x,i<fl(s)rf*s. 0 Теорема 5.11. Если мартингал X — (xt,@~t)^J[c {имеет непрерывные траектории Р-п. н.), а /<=£л(Ф2)> то у интегралов It(f)= | f(s>®)dxs существует непрерывная модификация. о Доказательство. Если функция f e L\(<I>2) простая, то непрерывность /,(/) очевидна. В общем случае доказательство проводится так же, как и для винеровского процесса (см. § 2 гл. 4). 6. Если X = (xt, @~t)<=J(, а /е^(ФД то процесс (/,(/), &~t) будет квадратично интегрируемым мартингалом. Согласно теореме 3.1 /,(/) имеет непрерывную справа модификацию. 7. В случае, когда натуральный процесс At = (x)t, t^O, отвечающий мартингалу X = (xt, ZTt) s Л, является непрерывным, можно однозначно определить стохастический интеграл оо '(/)= I f(t, (>>)dxt для функций fsQ2, удовлетворяющих лишь о предположению Pnf2{t9v>)dAt<oo\ = l.
210 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 8. Используем теорему 5.10 для доказательства следующего результата, обобщающего теорему (Леви) 4.1. Теорема 5.12 (Дуб). Пусть мартингал X = (xt, &~г)^Мт {имеет непрерывные траектории) и t At == {x)t = J a2 (s, со) dSy 0 где неупреждающая функция a2(s, co)>0 почти всюду относительно меры dtdP на ([0, Г)Х&, ^[о, цУ\@~)- Тогда на пространстве (Q, #~, Р) существует винеровский процесс W = (Wt9 &~t), t ^ Г, такой, что с вероятностью 1 t xt = x0+ J a (s, о) dWs. (5.83) 0 Доказательство. Определим процесс t Wt= f-^-т, (5.84) ' J a (s, со) ' v ' 0 полагая a~l(s, co) = 0 при a(s, co) = 0. Интеграл (5.84) определен в силу теоремы 5.10 (пункт III), поскольку процесс А(, /^0, абсолютно непрерывен (Р-п. н.) и т М J a~2(s, a>)dA8 = T<oo. о Согласно теореме 5.11 процесс Wh t < Г, имеет непрерывную Р-п. н. модификацию. Далее, в силу (5.81), (5.82) M[Wt\<Fs] = WSi M[(Wt-Ws)2\&-s] = t-Si t>s (Р-п. н.). Поэтому по теореме 4.1 процесс W = {Wt, &~t), t^.T, является винеровским. Заметим теперь, что для любых неупреждающих функций т Ф = ф(/, со) с М | ф2(/, a>)ds < 00 о о о
§5] ИНТЕГРАЛЬНЫЕ ПРЕДСТАВЛЕНИЯ МАРТИНГАЛОВ 211 поскольку это равенство справедливо для простых функций. В частности, полагая ф(-5, со) = a (s, со), получаем равенство t Г a(s, (u)dWs = xt — х0 (Р-п. н.), t^T, о из которого следует (5.83). § 5. Интегральные представления мартингалов, являющихся условными математическими ожиданиями. Теорема Фубини для стохастических интегралов 1. Пусть (#",), 0^/^ Г,— неубывающее семейство непрерывных а-подалгебр fP, X = (xti 9~t)—мартингал с непрерывными справа траекториями и W = (Wti 5Tt) — винеровский процесс. В настоящем параграфе будут изучаться представления условных математических ожиданий yt = N[(xt\STf) в виде стохастических интегралов по винеровскому процессу. Лемма 5.7. Процесс Y = [yv 3~f), 0 < t < Г, является мартингалом. Доказательство. В силу неравенства Йенсена М|0,|=М|М(**|^П1<М|**|, *<7\ Далее, если s</, то Р-п. н. М (yt | Гf) = М fM (xt | Г J) | Г*\ = M (xt | rj) = = M [M (*, | Г,) | rj] - M (*. | Г*) = ys, что и доказывает лемму. Замечание. Если X = (xt1 @~t) — квадратично интегрируемый мартингал, то таковым же является и мартингал У--= Теорема 5.13. Если X = {xti STt) —квадратично-интегрируемый мартингал, то мартингал Y = (yt, 3~J), #* = М (х, | #"J^), допускает представление t yt = Mx0 + j M {as | FY) dWSt 0 < t < T. (5.85) о где процесс a = (aSi &~s), s^t, таков, что i {x,W)t=jasds (5.86) и T J Ma2sds< oo. (5.87) о
21^ КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Доказательство. Прежде всего отметим, что //0 = = М(*о| #Т) = Мх0(Р-п. н.), поскольку (т-алгебра &% тривиальна (#~<f={Q, 0})- Далее, в силу замечания к лемме 5.7 процесс Y = (yt, @~f) является квадратично интегрируемым мартингалом и по теореме 5.5 t у, = Шь+ J" fs(<*)dWs, (5.88) О где процесс / = (/5(со), &"Y) таков> что j M/25(co)ds < оо. По теореме 5.3 существует случайный процесс a = (as, @~s), s</, такой, что Р-ц. н. t (х, W)t = J asds, О < t < Г, о г и J* Maids <oo. Покажем, 4TOB(5.88)fs(«>)= M(a5| #Т) (Р-п. н.) о для почти каждого s, 0 ^ s ^ Т. Пусть g = (gt{®), @~J) — ограниченный случайный процесс, t удовлетворяющий условиям леммы 5.1, и zt = \ gs (со) dWs. о Тогда Mytzt = М (М (xt | F7) zt) = Mxtzt. (5.89) Из (5.88) и свойств стохастических интегралов получаем t 'MyA=jM[U«>)S,(«>)]<fe. (5-90) 0 А по теореме 5.2 и лемме 5.1 t t Ш,г, = М {х, z>, = M j gs (ш) as ds = J" M [M (a, | £Г J) ft (©)] ds. 0 ° (5.91) Из (5.89) —(5.91) находим, что t \ M {[f, (0) - M (a, | <Tf)] gs (©)} rfs = 0.
ИНТЕГРАЛЬНЫЕ ПРЕДСТАВЛЕНИЯ МАРТИНГАЛОВ 213 Отсюда в силу произвольности функции gs((x>) получаем, что Р-п. н. для почти всех s, O^s^ 71, f» = M(ae|*7) и, следовательно, для всех t, 0^/^Г, Р-п. н. t t jfs(v)dWs=lM(as\<rY)dWs. О О Теорема доказана. Следствие 1. Пусть X = (xt, 8Tt) — квадратично интегрируемый мартингал, xt = J as dWs (5.92) о т и М | a\ds < оо. Тогда Р-п. н. для всех t, O^it^T, М \ as dWs I Pf 1 = I M (a, I ^f) drs. (5.93) Действительно, из (5.92) и (5.6) получаем <*, Г>,= j asds. Поэтому (5.93) вытекает из (5.85). Следствие 2. Пусть W = (WhPt)9 W = {Wn Ft) — dea независимых винеровских процесса и X = (xti &~t) — мартингал, t т xt= f asdWSi f Masrfs< oo. о о Тогда Р-п. н. M \ asdWs\rf Lo :0. (5.94) Для доказательства (5.94) достаточно установить, что {х, W)t = Q (Р-п. н.) для всех U 0<*<7\ Имеем t t *t + Wt= j asdWs + Wt, xt-Wt= j a,dWs- Wt.
214 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ t [ГЛ. 5 Отсюда нетрудно найти, что (х + W)t = [ {a2s + l)ds, (x — W)t = о t = J (a2s+ l)ds и, следовательно, о <*. w)t = | К* + П - <* - П> = o. 2. В следующей теореме равенство (5.93) обобщается на более широкий класс мартингалов. Теорема 5.14. Пусть X = (xti @~t), 0</^Г, — мартингал, t i т Xf=ja8dWS9 PM alds< оо) = 1. (5.95) Если M|as|<oo, 0<5<Г и Р ( J [М (| а5\ I Г1 )]2 ds < оо") = 1, (5.96) го Р-п. н. для всех t, 0^/^Г, МП asdWs\ РТ\ = J M(as| rJ)dW8. (5.97) Доказательство. Утверждение (5.97) можно переформулировать, сказав, что мартингал Y = (yti @~f) с #,= = М (xt | ^"J17) допускает представление t yt = J* м КI *7) drs (р-п- н-)> о < / < г. о Для доказательства (5.98) введем марковские моменты inf *<Г: J a\ds^n , г Г, если f a] ds < п. о Тогда мартингал Х(п) = (xf\ ft) с ^=Jv.>ofl.^ (5.98)
§ 5] ИНТЕГРАЛЬНЫЕ ПРЕДСТАВЛЕНИЯ МАРТИНГАЛОВ 215 является квадратично интегрируемым, т lM\xn>s)a2sds<00 о и по следствию 1 теоремы 5.13 для мартингала У^п) = (у^\ STJ} с yf] = M (4rt) | &~J) имеет место представление t yr=JM{x(Xn>s)as\rf)dWs. (5.99) Покажем, что y{tn)->yt (по вероятности) при п ->оо для каждого t, 0^t^.T. Для этого заметим, что в силу (5.98) у процесса x{tn) существует непрерывная модификация, и поэтому для нее X{tn)=XtAXn--=M(xT\^tAxny Отсюда вытекает, что последовательность случайных величин [х\п), п==1у 2, ...} равномерно интегрируема (см. теорему 2.7). Но x^->xt (по вероятности), az->oo. Поэтому из этих двух фактов и замечания 1 к теореме 1.3 вытекает, что lim Ml*, — 4rt) I = 0. P Ho M | yt — y{tn) | < M | xt — x{tn) |. Следовательно, у[п) -> yt для каждого t, 0</<7\ Для завершения доказательства теоремы осталось показать, что при п ->оо J Mfy >f)a,|<rfl dW,l J M(as\rf)dWs. 0 0 Согласно неравенству (4.60) для этого достаточно установить, что т р \\М{^п<5)^\^1}]^з^0у п-»оо. (5.100) Прежде всего заметим, что М [%(х <s)as\ &~J) ->0, n- р рп поскольку M|as|<oo, v ->o, az->oo, и М |М UK<^|^}|<MX(trt<s)|as|->0, /i-oo. оо,
216 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ Положим [ГЛ. 5 inf /<Г: j {M(\as\\$~Yfds^N 1, т Г, если J {M(\as\\^Y)}2ds<N. о Тогда для е > О p{/[M(¥„<^l^)fds>e} = I [M{^n<sfs\^Y)\2ds>e; on = t\+P[on<T\< <p{/Va^)R^^^ (5.101) Здесь Р {(% < Г}->0, N->oo, в силу условия (5.96), Далее, р поскольку М (%,х <s\as\@~Y)^Qy то по теореме Лебега о мажорируемой сходимости 'lm.M/^>.)[M(¥.<.)e.l^F],rfse0- Поэтому, переходя в (5.101) к пределу (сначала по az-»oo, а затем по iV->oo), получаем требуемое соотношение (5.100). 3. Равенство (5.97), установленное в теореме 5.14, позволяет доказать для стохастических интегралов утверждение (теорема 5.15), аналогичное теореме Фубини. Пусть_(0, gr9 P), (Q, gr, P) —два вероятностных пространства, (Q,^,P) = (QXQ, FX&~, РХР) и (Pt)ji (3ft), 0<*<1,- неубывающие семейства а-подалгебр $Г и !F. Пусть W = (Wt (со), yt), 0 < / < 1, — винеровский процесс,
§ 5] ИНТЕГРАЛЬНЫЕ ПРЕДСТАВЛЕНИЯ МАРТИНГАЛОВ 2\7 Теорема 5.15. Рассмотрим случайный процесс (g*(co, б), &~YX&~t), /<1. Если МХМ J g?K ©)Л< (5.102) (М X М—усреднение по мере Р X Р)> го для каждого /, 0^ </< 1, Р-п. н. a l J J &(©. ©)dW^(©) dP(fi) = J J gs (со, о) dp (о) £2 <ЛР, (со). (5.103) Доказательство. Обозначим t xt (со, б) = j* gs (со, 5) dWs (со) о и положим Ws{w, ©) = HPS (<o). Тогда, используя конструкцию стохастического интеграла, изложенную в гл. 4, можно так t определить интеграл Г gs(co, 6)dU?5(co), чтобы он совпадал о t Р X Р-п. н. с интегралом л?, (со, б) = gs(co, 6)dtt?5(co, б), кото- о рый @~Y X ^-измерим. Нетрудно показать, что Р ХР-п. н. | xt{®, &)dP(&) является и одним из вариантов услсЛрго математического ожидания М X М [xt (со, б) \Г?], т. е. М X М [xt (со, б) | #~f ] = jxt (со, б) dP (б) (Р X Р-п. н.). Аналогично М X М [ft (ш, <5) I ^"f ] = J* ft (о), й) rfP (©) (Р X Р-п. н.).
218 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Поэтому, учитывая (5.97), находим (Р X Р-п. н.) J *,(<*>> S)dP(S) = MXM[*,(©, &)\ff\ = Г * = MXM J gs(*,S>)dWaWP't U Г t = M X ft If ft (©, &)dW8(&9 ©)| P? Lo t = J M X ft [ft К &)\P?]dW№ ©) = 0 = J J &(©, S)dP(S) dfrs(G>> ©) = J J ft(©f S)rfP(S) dlPe(©). о [.о J о [(7 J w Это и доказывает (5.103), если только заметить, что STt = -w = 07X(Q, 0). § 6. Структура функционалов от процессов диффузионного типа 1. Из теоремы 5.5 следует, что всякий квадратично интегрируемый мартингал Х = (хи У7), t^. Г, где &~Т — а-алгебра, порожденная значениями винеровского процесса WSi s^ty допускает представление t xt = x0+ jf8(*)dWa с процессом f = (Js((o), fTf) таким, что | Mf^(©)ds < оо. о В настоящем параграфе этот результат, а также теоремы 5.7, 5.8 будут распространены на мартингалы Х = {хи @~t), где £ = (£„#",), t^T, является процессом диффузионного типа с дифференциалом dlt = at(Qdt + bt(l)dWt. (5.104) Будет показано, в частности, что (в предположениях, сформулированных ниже) всякий квадратично интегрируемый
§ 6] СТРУКТУРА ФУНКЦИОНАЛОВ 219 мартингал X = (xt, !Р)) допускает представление t xt = x0+ J f8(a>)dW8 (Р-п. н.), 0<f<7\ (5.105) о с процессом / = (fs (со), <Г|), s<7\ таким, что t М Jf2((0)rf5< 00. О 2. Начнем с рассмотрения частного случая уравнения (5.104). Теорема 5.16. Пусть процесс | = (g„ @~t) является (сильным) решением уравнения tt = to+jbs($)dWSi (5.106) о где неупреждающий функционал*) b = {bt(x), <8t), t^.T, предполагается таким у что PI J b2t(l)ds < со I = 1 и b2t{x)>c>0. (5.107) Тогда всякий мартингал X = {xt, @~)), 0</<Г, имеет непрерывную модификацию, которая допускает Р-п. н. представление t xt = x0+ \fs(®)dWs, 0</<7\ (5.108) о где процесс f=(/s(co), i?"|) таков, что P[jf28(<»)ds<oo) = l. (5.109) \о ч / Если мартингал X = (xt, zTf) квадратично интегрируем, то т М JfJ(©)ds<oo. (5.110) о Доказательство. Покажем прежде всего, что семейство (пополненных) а-алгебр (#i), 0^/<Г, является непрерывным. Пусть ST}» w = g~l\; 0-f, где Р\ = о {со: lQ (0)}. *) &t=*o{x: xs> s</}, где х принадлежит пространству непрерывные (на [О, Т]) функций,
220 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Поскольку I — сильное решение уравнения (5.106), то &Y w^$~b (5.1П) С другой стороны, в силу условия (5.107) для каждого /, 0 < t < Г, t ^=|^|у (Р-п.н.) (5.112) о (см. теорему 5.12). Поэтому &~ftW^&~)y что вместе с (5.111) приводит к равенству *) gry w = pim (5.113) Согласно теореме 4.3 семейство (пополненных) а-алгебр (&~f) 0</<7\ является непрерывным. Этим свойством, как нетрудно показать, обладает и семейство (3~у w), 0^/^ Г, а значит, и (#"!). В силу теоремы 3.1 отсюда следует, что у всякого мартингала X = (xv STf) существует непрерывная справа модификация, которая и будет далее рассматриваться. Предположим теперь, что X = (xv &~\) является квадратично интегрируемым мартингалом. Если W = (Wti STt) — винеровский процесс, то, как нетрудно проверить, винеровским будет и процесс (Wv @~\). Поэтому согласно теореме 5.3 существует процесс /==(/Дсо), !Ff) такой, т что М J f\ (со) dt < оо и о t (x,W)l=jfs(<*)ds. (5.114) о Положим t о и покажем, что P(xt = xt)=l, 0</<7\ Зафиксируем / и рассмотрим разбиение 0 = t0<t{ < ... ... <tn = t отрезка [0,^]. Если показать, что М (xt - xt) exp {/ [z0l, + J] zkWtkjj = 0 (5.115) *) Если £о —0, то утверждение доказываемой теоремы легко вывести из теоремы 5,5 и того факта, что согласно (5.113) !FY = ^о Q^tK.T.
§6] СТРУКТУРА ФУНКЦИОНАЛОВ 221 для любых zt с | Zi | < оо, / = 0, 1, ..., я, то отсюда будет следовать требуемое равенство P(xt = xt)=l, поскольку случайными величинами expu(z0g0 + 2 zkWtk )\ можно аппроксимировать любую ограниченную #~|<" ^-измеримую (а значит, и ^-измеримую) случайную величину. Начнем со случая лг = 1. Положим yt = xt — xt. Ясно, что Y = (yt, &")) также является квадратично интегрируемым мартингалом и согласно (5.6) и (5.114) (г, W)8 = 0 (Р-п. н.), 0<s<7\ В силу леммы 5.1 отсюда вытекает, что t М yt\^{iz{Wu)dWu\^\ = м \zxv{iz{Wu)d(y,W)a\F\ = 0. (5.116) Далее, по формуле Ито exp {i (z0lo + *Wt)} = exp {fe0go} + + iz{ exp {/20У J exp (rz, Wu) dWu — -y- exp {izQl0} J exp (/z^ J dw. о о Поэтому, учитывая (5.116) и то, что у0 = 0, находим М yt exp {/ (z0l0 + z, Wt)) =Myt exp {/г0У + + tej M ^ exp (fe0lo) J exp (izxWu) dWu — -yM ^ exp (fe0go) J exp (te, Г J rfu [ = = М{М(г//|^ехр(/г0|0)} + + izxM jexp(te0io)M 9 * 6 J' —?- J M (M(y,| S^exp^ + z.Ug]} A» = 0 г2 ' = — -y } M{yu exp [г (г0|0 + г,Гы)]} du.
222 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Следовательно, щ = М^ехр[/(г060 + z\Wt)\ удовлетворяет линейному уравнению Щ = — -тг Щ> ио = 0. решение которого тождественно равно нулю. Итак, равенство (5.115) в случае п=1 установлено. Пусть теперь п > 1 и для ,п—1 равенство (5.115) также доказано. По формуле Ито exp U Ulo + 2г*^*)| =ехр I1 [*<&> + S ZkWtk ) + + izn | exp фо^ + Х^^Ч + ^ИЧ \dWu — --^J zxpUlz&o + ^ZbWtb + ZnWujldu. (5.117) Если теперь учесть, что согласно предположению индукции Мyt exp jt f z0io + 2 zkWtJJ = = M {m (yt | IT^) exp [/ (z0g0 + 2 *«ч)]} - = M^_, exp {i (z0lo + 2 ** И^)} = 0, то из (5.117), аналогично случаю п=\, легко выводится, что М г/,ехр|Л 20£0+]У]г;!.и^ = - -у- J М Le ехр Ь (z0|0 + J ^«Ч + z"^« du. Отсюда получаем My, exp {/ (2oio + 2 zftU^(ftj} = 0.
§ 61 СТРУКТУРА ФУНКЦИОНАЛОВ 223 Итак, соотношение (5.115) для случая квадратично интегрируемого мартингала X = [xt, &~f) доказано, что в свою очередь доказывает требуемое представление (5.108). В том случае, когда мартингал X = (xt,STt) не является квадратично интегрируемым, доказательство представления (5.108) почти дословно повторяет соответствующее доказательство теоремы 5.7. Следствие. Пусть функционал b = (bt(x), $t) удовлетворяет условиям (4.110), (4.111) и bt{x)^c > 0. Тогда согласно теореме 4.6 сильное решение уравнения (5.106) существует и всякий мартингал X = [xt, @~\) допускает представление (5.108). 3. Перейдем теперь к рассмотрению общего случая. Теорема 5.17. Пусть | = (|„ 0",), 0 < t < Т, — процесс диффузионного типа с дифференциалом dtt = at($)dt + bt($)dWti (5.148) где a = {at{x), $t) и b = (bt(x), $t) — неупреждающие функционалы. Будем предполагать, что коэффициент bt(x) удовлетворяет условиям (4.110), (4.111) и b2t(x)>c>0. (5.119) Пусть также Р I J a)(\)dt < оо ) =Р И а?(л)Л < оо ) = 1, (5.120) где ц — (сильное) решение уравнения dr)t = bt(4)dWti ц0 = 10. (5.121; Тогда у всякого мартингала X = (xt, @~\) существует непрерывная модификация, для которой имеет место представление t xt = xQ+ \fsHdWs (5.122) о с F^-согласованным процессом (/, (со), #"|) таким, что V т \ Р| J /*(©)ds<«>J=l. Если X = [xv @~)), O^t^Ty — квадратично интегрируемый мартингал, то к тому же т J М/?(ю)Л<оо. (5.123) о
224 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ {ГЛ. 5 Доказательство. Согласно сделанным предположениям и теореме 7.19 меры щ и jli^ эквивалентны. При этом плот- ность it(Q = -j—-(t, I) задается формулой (см. (7.124)) fA2ds) = t ! Г а*(£) ..... 1 = ехр| Рассмотрим нозое вероятностное пространство (Q, #~, Р) с мерой P(d©) = jr(g(©))P(rfco) (ясно, что Р<Р и в силу леммы 6.8 Р < Р; значит, Р~Р). Имеем Р {£ € Г} = \ iT(l (СО)) Р (£fo) = J jr (X) С1Щ (X) = Ц, (Г). {<d: I c= Г) Г Таким образом, случайный процесс £ = (|,), О^/^Г, рассматриваемый на новом вероятностном пространстве (Q, #", Р), имеет то же распределение, что и процесс x\ = (i\t), 0^/^Г, рассматриваемый на пространстве (Q, #\ Р). Далее, по теореме 6.2 процесс (Wt9 &~(), t Wt = Wt+j^ds, (5.125) О по мере Р является винеровским. Из (5.125) и (4.80) следует, что Р-п. н. t t t lo+ $ bs(t)dWs = l0+ J as(t)ds+ j bs($dWs = tt. 0 0 0 Значит, процесс g = (£,), 0 <! / ^ 7\ рассматриваемый на (Q, ST, P), является решением уравнения t l, = lo+j bAt)dWs (5.126) 0 (ср. с уравнением (5.121)).
§ б] СТРУКТУРА ФУНКЦИОНАЛОВ 225 Согласно сделанным в условиях теоремы предположениям о коэффициенте bs(x) (сильное) решение уравнения (5.126), так же как и уравнения (5.121), существует и единственно. Тогда по теореме 5.16 всякий мартингал Y=(yt, @~\), 0^/^Г, определенный на вероятностном пространстве (й, ЗГ> Р), имеет непрерывную модификацию, которая допускает Р-п. н. пред* ставление t У< = Уо + J gs(<o)dWs, 0<*<7\ (5.127) О где РМ g2s(ai)ds <оо\ = 1. Пусть X = (xv @~\) — мартингал. Покажем, что процесс Y = (yt, 3~)) cyt = xt/it (I), рассматриваемый на (Q, У, Р), также является мартингалом. В самом деле, M\yt\ = j\yt\dP = j\yt\b (I) dP = j i^j- h(l)dP = и при />s согласно лемме 6.6 Р-п. н. M(^|^5) = J.-,(i)M(ifA(6)I^J)-J,-I(6)M(^|rj)-1^r=.y,. Следовательно, к мартингалу Y = (yv &~f) с yt = xtkt (g) применим результат (5.127), согласно которому Р-п. н. и Р-п. н. для каждого t, 0<^<Г, t t t ТЩ)=хо+) ^(^)dWs^x0 + j ga(u>)W, + j* gs (^TWds, 1 0 0 0S или xt = h($*t> (5Л28) где t t *i =/o+| gs (o>) dWs + J gs (со) -gjjj- ds. (5.129)
226 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Применяя формулу Ито, из (5.128), (5.129) и (5.124) находим, что dxt = it (I) dzt + zt dlt - j, (£) ft (со) -L- dt = = h (I) §t (со) dWt + h (£) ft (*)^dt - i,j, (£) -^g- ^ - -b(SftH-^*=f/(©)d^f где Ш = ь(Ъ)еЛ®)-х,^. (5.130) Иначе говоря, Р-п. н. t о где Pi J f2s ((a)ds < оо 1= 1, что в свою очередь вытекает из (5.130) в силу эквивалентности мер Р и Р (лемма 6.8), непрерывности Р-п. н. процессов $,(£) и xt = lt(l) zt и условий р(^(.)л<«)_р(1(з®)'Л<.)_1. Для завершения доказательства теоремы осталось лишь проверить, что в случае квадратично интегрируемых мартингалов X = (xv У)) функционал /s(co), s^T, удовлетворяет условию (5.1 ГО). Вытекает это из следующего общего предложения. Лемма 5.8. Пусть F = (STt), 0^/^Г, —неубывающее семейство а-подалгебр У и / = (/,((0), &~t)—процесс с РМ /?(©)#< оо 1 = 1. Для того чтобы (непрерывный) мартигнал X = (xt, @~t)> t^.T9 с x<=jfs(«>)dWs О был квадратично интегрируемым, необходимо и достаточно, чтобы т J Mf2s(®)ds<°o. (5.131)
СТРУКТУРА ФУНКЦИОНАЛОВ 227 Доказательство. Достаточность условия (5.131) следует из свойства стохастических интегралов (по винеровскому процессу (см. (4.49)). Для доказательства необходимости положим для /г = 1, 2, ... т« = inf 1/<Г: J f2sds>nV т Т, если ) f2s ds < п. В силу непрерывности траекторий мартингала X = (xt, @~t) и теоремы 3.6 Р-п. н. tAxn | ff(o>)^f-^At|i = M[^|^ATJ. О Поскольку к тому же мартингал X = (xti@~t) является квадратично интегрируемым, то в силу неравенства Иенсена м4ЛТп = м[М(^|^дх„)]2<м4<оо. ГЛТ„ С другой стороны, поскольку М I f2s(a>)ds^.n < оо, то о М4Л,Я = М | fMdWs\ = М J* f»rfs. Следовательно, для любого п=\, 2, ... М J /«(o)ds<M4, и, значит, ГЛТ„ М Г f* (©) ds = lim M f /2(со)ds < Мх2т < оо, что и доказывает лемму. Замечание. Если X = {xtf &~t), 0</<Г, —квадратично интегрируемый мартингал с t ** = *о + J /^ И ^,
228 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 где РМ /2(cD)tfs<ool==l, то М j f2s (со) ds < М [*г - х0]2 = Мх2т - Mxl < Мх2т < оо. 4. В следующей теореме ослабляется условие (5.120), входящее в формулировку предшествующей теоремы. Теорема 5.18. Пусть выполнены предположения теоремы 5.17, за исключением условия (5.120), которое заменяется требованием, что РМ а?(ЙЛ<оо| = 1. (5.132) Тогда утверждения теоремы 5.17 также остаются справедливыми. Доказательство. Условие (5.120) обеспечивало эквивалентность fX| ~ ili^. При условии же (5.132) согласно теореме 7.20 ЛИШЬ |Ll| < \ХЦ. Пусть /г = 1, 2, ... и 1{п) = (t>\n), STt) — процесс, являющийся (сильным) решением уравнения J" %in) ds 0 (5.133) где %(sn) = % /№ «„ (S) \2 (I) ds <n В силу сделанных предположений коэффициент 65(х) удовлетворяет условиям (4.110) и (4.111). Поэтому из теоремы 4.8 следует, что сильное решение уравнения (5.133) действительно существует. Как показано при доказательстве теоремы 7.19, процесс 1{п) = (l{tn\ &~t) допускает дифференциал где dlf) = af (£<">) dt + bt №n)) dWv a\nHx) = at(x)xrt (5.134) as (x) \2 ds <n
СТРУКТУРА ФУНКЦИОНАЛОВ 229 Поскольку Л Mi(n))/ Л<я =1, то по теореме 7.18 ц (n) ~ ц^. Положим теперь 4ге)== М \хт I #"|(п)]. Тогда в силу теоремы 5.17 для мартингала Xм = {х\п), $Г\) справедливо представление t хм = Х(п) + | f («> (fflw) dWs, (5.135) о где процесс (fj.n)(<°)> #"|(п)) таков, что p[j{fin)(<*)]2ds<co) = l. Заметим, что х{0п) = х0 (Р-п. н.). Действительно, поскольку |<Г> = |0 (Р-п. н.), то ф = М \хт | rf >] = М [*r | If»] - М [х, | у = х0. Пусть Гп (X) ■ inf Г, если l ((азМУ J I &s (*) ) ds< п. Из построения процесса 1(п) следует, что |M = gf для /<Ttt(£). Поэтому тл (|) = %п (1(п)) (Р-п. н.). Отсюда нетрудно вывести, что для любого t, О <! t ^ 7\ (5.136) ^ATrt(i) = ^ATn(iH. Из (5.135) вы^кает, что мартингал Хы = (х[п\ &~fП)) имеет непрерывные траектории. Поэтому по теореме 3.6 и = *о + J /S»>(«»)rfWre = x0+ J /<">Н^> (5.137) о о поскольку т„ (1) = т„ (!<">) (Р-п. н.) и при s < хп ф 1^ = If (Р-п. н.),
230 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Заметим теперь, что *J№)= M (jrr|#"f(/l)). Тогда согласно теореме 3.6 и соотношению (5.136) *П х„(l*>) - М (*г | ^!лгп fcta») = М (ХГ | Г}А ч (В), что вместе с (5.137) дает при 0^/<Г равенство М(*г|^лт„(*)) = *о+ J F?4*)dW8 (Р-п. н.). (5.138) о Обозначим для краткости правую часть в (5.138) x\ni и положим ^я, = ^ЛТя(6). Процесс Х{п) = {xf\ grf) является мартингалом, поскольку M|j?Jft,| ^ М \хт\ < оо и при /<!s М(^|#-«)-М [М (*г|^л^в,|^л,.в,))- *ЛХ„<|> -^ЫПкч^ = Ч+ J /*■»(»)<**.-*?» (Р-п.н.). о Пусть т<я. Тогда тте(|)^тя(|) и по теореме 3.6 (Р-п.н.) tAxm(l) М(«Р,1^хтв))-^тв.-*о+ J ГИ^- (5-139) о С другой стороны, поскольку #"/л %m(t) = &~iA хп (&) л тт (|) = @~tA%m (I), то Р-п. н. * Л хт (g) -М(дгг|^л Л))-*0+ J f™(*)dW,. (5.140) о Сравнивая формулы (5.139) и (5.140), убеждаемся в том, что t Л тт (I) о
СТРУКТУРА ФУНКЦИОНАЛОВ 231 Из (5.141) с помощью формулы Ито находим, что О- J [/?>(<»)-f{sm)(<»)]dWs) « J [ff(<»)4{sm)(<»)]2ds + \ о ' о ГДтт(|) , t . + 2' f J [/<»> (со) - /<"> (со)] dWs {/<*> (со) - /(-) (со)} dWt - о l о J 7ATm(S) = J [/!гя,И-/?|)(©)]2^ поскольку на множестве {со: /<^тт(|)} \ [№(*)-f™(®)]dWa = 0. Итак, для п>ш на множестве {xm(Q = T} т llffW-fWWfds^O. (5.142) о Отсюда следует, что для почти всех /, 0^/^Г, /(«)(«,) = /(«)((й) ((ттф = Г}, Р-п.н.). Определим теперь функцию /*(со): f<!> (со), если j a2s(t)ds<l, о /<2>(со), если KJal(t)ds<2, ш=\ (5.143) /</*> (со), если п — 1 < J" a* (|) ds < п, Из определения ясно, что функция /*(со), 0^/^ Т, является ^[о, п X #~г-измеримой и ^-измеримой при каждом фиксированном t, 0</<7\
232 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Далее, J П И dt = 2 J /? (со) Л = 2 J [/Г ° N]2 dt = О м=0 хп(1) /г=0 тя(|) W т/г+1 <*) со тя+1 (6) = 2 J [/rnH]2^+ S J [/Г!)И]2л. я=0 тл (|) я=ЛЧ-1 тя (|) На множестве (со: т^+1(^) = Г} «=0 тя(|) Значит, для любого N т j(o: Jf»rff = oo|s{«>: т„+1(|)<Г}. О Но %N{Q\T (Р-п. н.) при N->oo. Поэтому Р //?(©)Л<оо =1. Аналогичным образом легко устанавливается также включение «>: J [f, М - /^ Н]2 Л > О I s {©: т„(£) < Т]. о J Поэтому при п —у оо г о и, следовательно, t t Р- lim f ff (со) d^5 = f /s (со) dWs. (5.144) ^°°o о Ясно также, что *Лтя($) t
§ 6] СТРУКТУРА ФУНКЦИОНАЛОВ 233 и для любого /, 0 ^ t < Г, / t P-,im j *№»•№ И^.= j /»^s> (5.145) rt о о поскольку р{П^И-^(со)¥л,)>5}]2>в} = - Р { J lfs <°> - ^ N Xp, (ft) > s}]2 <*s > e, тя (Q = T } + <p{ f [feH-/i,l)Nl2rfs>e 1+Р{тя(9<Г}-*0, az->oo. Пусть t < Т. Перейдем к пределу при я->оо в (5.138). Левая часть равенства в силу теоремы 1.5 стремится к \Л(хт\&~\) = xv а правая согласно (5.145) сходится по вероятности к jc0 + + \fs(®)dWs. Таким образом, при t<T о t xt = xQ+j fsHdWs (Р-п. н.). (5.146) о Если же / = 7\ то #"глт &) t У\- и, значит, т мЫП-)=*о + Р>)^- о Но процесс l = (lt), O^t^iT, имеет Р-п. н. непрерывные траектории, и поэтому #~L = У) (ср. с доказательством теоремы 4.3). Теорема 5.к\доказана. 5. В теореме 4.3 было показано, что (пополненные) а-ал- гебры &*t i порожденные значениями винеровского процесса WS) s</, непрерывны, т. е. yfL = тТ = &~Т+. Установим аналогичный результат и для процессов диффузионного типа. Теорема 5.19. Пусть выполнены условия теоремы 5.18. Тогда (пополненные) о-алгебры ЗГ) непрерывны:
234 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Доказательство. Как уже отмечалось выше, соотношение #"|_ = &~} доказывается аналогично случаю винеровского процесса (см. теорему 4.3). Установим непрерывность а-ал- гебр 9~) справа. Пусть г] — ограниченная случайная величина, | ц \^с. Тогда по теореме 5.18 у мартингала X = (xv STf) с х, = М (т) | #"|) существует непрерывная модификация. Покажем, что М(л|^|) = М(л|У!+) (Р-п. н.). (5.147) Для всякого е > О М (ц | *%) = М (М (г, | <T)+t) | <Г\+) = М (xt+t | Г\+). (5.148) Но случайные величины xt = M{r\\y)) ограничены, |^|^с, и в силу непрерывности процесса xt из (5.148), переходя к пределу при е I О, находим, что Р-п. н. М(т)|П0 = МЫПь) = *, = М(т11^). Этим соотношением (5.147) установлено. Возьмем теперь в нем в качестве ц #~|+-измеримую ограниченную случайную величину. Тогда М (rj | @~}+) = ц и, значит, ч=М(т||01). Следовательно, случайная величина ц ^-измерима, что доказывает включение (Г\+ s 9r\. Обратное включение 5Г)<=:5Г\+ очевидно. Теорема 5.19 доказана. 6. Заслуживает особого выделения частный случай теорем 5.17, 5.18, когда коэффициент bt{x)=l (или bt{x)sa,c Ф 0). Теорема 5.20. Пусть l = (lt> @~t)> 0^/^Г, —процесс диффузионного типа с дифференциалом db = at(Qdt + dWt, (5.149) где а = (at (x), $t) — неупреждающий функционал с РМ а?(6)Л<оо) = 1. Тогда у всякого мартингала X = {xt, @~\) существует непрерывная модификация, для которой имеет место представление t Xt = x0+ \fs{<*)dWsy о
§ 6] СТРУКТУРА ФУНКЦИОНАЛОВ 235 где процесс (fs(co), 9F\) таков, что РМ /2(co)ds<ooj = l. Если X = [xv #"|) — квадратично интегрируемый мартингал, т то к тому же М | f2s(a))ds< oo. о 7. Рассмотрим теперь структуру функционалов от процессов диффузионного типа в гауссовском случае. Будем предполагать, что случайный процесс | = (£,, #",), 0 </^ Т,, имеет дифференциал db = at(l)dt + b(t)dWt, £0 = 0, (5.150) где W={Wt, @~t)—винеровский процесс, ab(t), 0 </<Г,—детерминированная функция с b2(t)^c>0 J b2(t)dt<oo . Теорема 5.21. Пусть X = (xv &~f), O^.t^.Ty—гауссовский мартингал. Если процесс (W, I, X) = (Wtf lt, xt), 0<*<Г, образует гауссовскую систему и pUa*(l)dt<oo\ = \, (5.151) то у мартингала X = (xt, @~f) существует непрерывная модификация и xt = x0+ \ f(s)dWs, 0<f<7\ (5.152) о где измеримая детерминированная функция f = f(t) такова, что т J f2(t)dt< oo. (5.153) о Доказательство. Гауссовский мартингал X является квадратично ь*1^егрируемым. Поэтому согласно теореме 5.18 т найдется процесс gr = (^(со), #")), 0</<7\ с f Mg2(<u)dt< oo о такой, что t *t = *o + j gs(<»)dWs. (5.154)
236 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Из (5.150) следует, что при каждом / случайные величины Wt ^-измеримы. Следовательно, не только процесс (Wt, @"t), но и (W^iFf)также является мартингалом, и, значит, M(Wt\&~f) = Ws (Р-п. н.), t^s. Отсюда вытекает, что выражение м [(*,-*,) (*,-*.) |<П| = = Щ{х<-Щх,\Г§){*,-ЩГ,\Г\))\(Г]] (5.155) есть не что иное, как условная ковариация cov(x,, Wt (см. обозначения в § 1 гл. 13). Покажем, что в силу гауссовости процесса (W, £, X) cov.(xt, Wt\F§=M\(xt-xs)(Wt-Ws)\ = M[(xt- xs) (Wt - Ws)] (Р-п. н.). (5.156) Для доказательства этого заметим сначала, что М [(*, - *,) <Wt - Ws) | <F|] = M [xtWt | Г\] - xsWs. Пусть теперь 3~\ n = a(®: |0, |_s_, S2 s, ••-, 1Л Тогда 1 2" 2" /' 9~\ f #"|> и, следовательно, по теореме 1.5 (Р-п. н) " M f*,Wt | Г1 „] -» M [*,1T, | r|], M [*srs | ^ „J -> xsWs. Значит, м \{*t - xs) (Ft - *.) I <H]=lj„m м кг, | n „1 - *srs = -Ит{М[*^|^>(,|-М[^|ге..]М[1Г,|ПЛ + + Нт{М^|П„]М[^т„]}-^Г5. Поскольку f|an.- T0 МК|Пп] = М[М(^|5Г!)|Пп| = -M^l^f, в)^х,и, аналогично, MI^I^^J-MI^I^I.J-H.r,. Следовательно, м [(*,-*,) (ir,-it.) |^5]- Но по теореме о нормальной корреляции (теорема 13.1) М {[*, - М (xt | П „)] | Г, - М (Wt | Г1, „)j | Г |, „} = - М Цх, - М(*, | r\t n)\[Wt -M(Wt\ П.„)]} (Р-п. н.).
§6] СТРУКТУРА ФУНКЦИОНАЛОВ 237 Итак, M[(xt-xs)(Wt-Ws)\^} = - litn M {\xt -M(xt\ T\m „)] \Wt -M(Wt\ ry „)]}, что в силу равномерной интегрируемости величин {М(*ЛПп)> "=1. 2,-..} и {M(Wt\^ln), n=\, 2,...} приводит к требуемому равенству (5.156). Из этого равенства и (5.154) получаем, что t t jM[s>)|^5]d«~jMg>)rfU. (5.157) s s Рассмотрим теперь для фиксированного t, O^it^T, разбиение 0 = t(on)<t\n)< ... <C=t с max [f/+i — t(fn)]->0, az-~>oo, и положим / Тогда согласно (5.157) (n+\) An) n-1 7+1 An) л-1 Ч+\ JMgu{a))du — ^] J Mge(©)rfa —J] J gn(u)du= jgn(u)du. /-0 Ля) 7 /=0 ,(я) По теореме 5.19 а-алгебры ^"|, 0^/^Г, непрерывны. Поэтому для каждого и, O^u^it, с вероятностью 1 при az->oo g„(«)->M[guH|n] = g„H- (5-158) По неравенству Иенсена Mg2n(«)<! Mg2u(со), и, значит, t t J* Щ1 (и) rf« < j Mgl (со) d« < oo. о о Таким образом, на основании теоремы 1.8 семейство случайных функций {gn(u), /г=1, 2, ...} равномерно интегрируемо (по мере P(dco)Xdu) и в силу (5.158) М J [Mgu (со) - gB (со)] rf«<M } [MgB (со) - gn («)] dM + + м J leu И—gn (")] rf« < J M|g„(co)—g„(M)|d«-*0, я-*оо.
238 КВАДРАТИЧНО ИНТЕГРИРУЕМЫЕ МАРТИНГАЛЫ [ГЛ. 5 Отсюда для каждого t, O^t^T, получаем t t J" Mgu(<*)du= J" gu(a>) (Р-п. н.), (5.159) о о и, значит, для почти всех t, 0^/<Г, Р-п. н. ,&(©) = М&(ю)* Вместе с (5.154) это доказывает справедливость представления (5.152) с f(t) = Mgt(a>). Следствие 1. Функцию f(t), O^t^T, участвующую в представлении (5.152), можно определять из равенства Следствие 2. Пусть ц = у\ (в))—&~\-измеримая гауссовская случайная величина. Предположим, что (ц, W, £) образует гаус- совскую систему. Тогда найдется детерминированная функция f(s), 0^s<[7\ такая, что (Р-п. н.) т Ч(ш) = Мч(©)+ \f{s)dW„ (5.160) о т где \ f2(s)ds< oo. о По теореме о нормальной корреляции мартингал xt=M (r\ |^"|) будет гауссовским. Гауссовской будет и система (W, I, X) с X = {xv 0"|), 0<f<7\ Поэтому (5.160) следует из (5.152), если только учесть, что хт = ч\, a х^=Ых\ (Р-п. н.).
ГЛАВА 6 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ И МАРТИНГАЛЫ. ТЕОРЕМА ГИРСАНОВА § 1. Неотрицательные супермартингалы 1. Пусть (Q, #", Р) — полное вероятностное пространство, (^"*)> 0^/^Г, — неубывающее семейство а-подалгебр #", пополненных множествами из & нулевой вероятности. Пусть W = (Wt9 &"t) — винеровский процесс и y = (y*> ^)—случайный процесс с P\\y28ds<co) = l. (6.1) При исследовании вопросов об абсолютной непрерывности мер, отвечающих процессам Ито, относительно винеровской меры (см. следующую главу) существенную роль играют неотрицательные непрерывные Р-п. н. случайные процессы $ = (^> @~t), 0^/^Г, допускающие представление t h=l+jysdWs. (6.2) О В следующей лемме показывается, что процессы такого типа необходимо являются супермартингалами. Лемма 6.1. Пусть процесс y = (y*> #"*)> t^T, удовлетворяет условию (6.1) и 5*>0 (Р-п. н.), 0</<7\ Тогда случайный процесс 5 = (5*, #"*) является (неотрицательным) супермар- тингалом, \ MfalPsXls (Р-п. н.), t>s, (6.3) и, в частности, Ms,<b (6.4)
240 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ [ГЛ. 6 Доказательство. Положим *) для п^-1 T„=inf|<<r: Jv'rfs^n}. т считая %п = Т, если j y2sds<n. Тогда согласно (4.63) для / > s о *Лт„ 'Лт„ Поскольку 5ЛХ„ Г <Лт„ м J \ndWu\(rs sA%„ ■О (Р-п. н.), то М [*/лт„|*".]=а.лтп (р"п-н->- Но т„->-Г с вероятностью единица при п-><х>, поэтому в силу неотрицательности и непрерывности процесса ^, 0 ^ t ^ Г, по лемме Фату M(fo|0%)<&»- 2. Л е м м а 6.2. Неотрицательный супермартингал g = (gf, &~t), 0</<Г, с g, = 1 + J y, dlP,, РМ Y^s<ooj = l, <Золг/с, \(P)-tJ"p>). о / представление а **) g, = exp Г, Ps — 5s+Ys> С—lo, gs = 0, (6.5) (6.6) Г,(р) = Р-Итх/* n/PJW., Г = М/< Я M^^<oo)o [j*udtt<n *) В соответствии с замечанием к лемме 4.4 у процесса ysdst /<7\ о существует прогрессивно измеримая модификация, которая и будет рассматриваться как в этом, так и в других аналогичных случаях. Тогда момены'Тя будут марковскими относительно системы (^"/), 0^/^Г. **) Случайные величины Г* ф) подробно изучались в п. 9 § 2 гл. 4.
§ 1] НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ 241 Доказательство. Пусть o„ = inf{/<r: *, = !} (art = oo, если inf ^ > —). Пусть также a = inf{/<r: $, = 0} (a = 00, если inf $, > 0). Ясно, что Р-п. н. ап f a, я->оо. Со- гласно замечанию 2 к теореме 3.5 k = 0 ({T^t^o}; Р-п. н.). Поэтому для всех /, О^^^Г, h = hAo (Р-п. н.) (6.7) Ut-{ о, 1, /<а, Из (6.7) и (6.8) получаем, что Р-п. н. tAo t о о т. е. (6.8) h=l+jbstsdWs (6.9) Ясно, что Р (J* Wds < «>) =Р f J Yjrfs < «>) = 1. (6-Ю) Поэтому а„ЛГ опЛТ Ш2 / «*< J (Ш2^<°°- о о (\АТ \ Отсюда получаем Р $2sds < оо \ = 1 и, применяя формулу Ито к 1п$,Ла , из (6.9) находим, что /'Лоп tAon \ JMOj|-exp^ J М^"4 { PJrfsj. (6.11)
242 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ [ГЛ. б Заметим теперь, что для каждого / ^ Т на множестве {со: *<а<Г} | Р2^5<00 (Р-П. Н.) О и на множестве {со: T^t^a} J, = 0 (Р-п. н.). оо |, и, обозначая %t = Поэтому {со: lt > 0} ^ I со: | $2sds < I о =Х / * \ , получаем h = ItXt = hA оЪ = Р"И™ Ut лоп = "Ло„ = P-limX/exp J $sdWs-\ { ps2ds = n \ о о / -P-limx,exp(x/ { t9dW8-\ J Ps2ds Поскольку tAo PAimXt f Ps2d5 = 0, то согласно п. 9 § 2 гл. 4 существует tAan Г/ла(Р) = Р-Нтзь f $sdWs. n о Следовательно, Р-п. н. для каждого t, O^t^T, tAG (гла х
§ 1] НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ Поэтому на множестве {а^Г} Р-п. н. Xaexp(Y0(p)-i-{p^SUo. Выведем отсюда, что на множестве {а^Г} а j*p2ds=00 (р.п н#)ф О Действительно, предположим противное, т. е. что Р (а<Г)ПМ Pjrfs<oo) >0. Тогда на основании леммы 4.7 Р (а<Г)П( J ^ds<<x> П sup J KdWs 243 (6.14) о, и, следовательно, на множестве (а ^ Т) П f Р* ds < оо I положительной вероятности 4™expU ^dw*-i\ %ds)^0> *-*°°> что противоречит тому, что gCT/| —^ ga == 0 (Р-п. н.) на множестве {о ^ Г}. Итак, {со: а<Г}П со: J ps2ds = сх> ={со: а< Г}- (6.15) Покажем теперь, что для каждого t ^Г Р-п. н. правая часть в (6.13) равна ?sds . (6.16) (tAo \ / t Tt.A°W-ij РГ^) = ехр^(Р)-1|р; Зафиксируем /, 0<f<7\ Тогда, если со таково, что t<o, то (6.16) выполнена очевидным образом, поскольку в этом случае %t = 1, а t Ao = t. Пусть теперь Т > / > а. Тогда левая
244 Неотрицательные супермартингалы [гл. б часть в (6.16) равна нулю. Правая часть также равна нулю, поскольку на множестве {а^Г} а Jp|ds = oo, a гв(Р) = 0 (Р-п. н.) О (ср. с п. 9 § 2 гл. 4). 3. Важным частным случаем неотрицательных непрерывных Р-п. н. супермартингалов, допускающих представление (6.2), являются процессы ф = (q^, £Ft), t ^ Г, с Ф( = ехрМ M^-jJ<W. (6-17) где процесс Р = (РР ^Г,), / < Г, таков, что Р f $2s ds < оо = L То, что такие процессы допускают представление (6.2), следует непосредственно из формулы Ито, приводящей к уравнению <P/=1+j<P,MWV (6-18) О Тем самым получено представление (6.2) с Ys = <PsPsr причем p(Jy2^<~) = i. 4. Исследуем сейчас подробнее вопросы существования и единственности непрерывных решений уравнений типа (6.18), а также рассмотрим возможность представления этих решений в виде (6.17) или (6.5). Итак, пусть ищутся неотрицательные непрерывные Р-п. н. решения уравнения dxt = xtatdWtt аг0==1, *<Г, (6.19) удовлетворяющие предположению Pi Г x]a\dt < оо 1 = 1. Если случайный процесс а = (а/, &~t), t^T, таков, что Р j j a]dt < оо 1 = 1, то неотрицательное решение такого уравнения существует, единственно и задается формулой xt = ехр И asdWs-1 J* aids). (6.20) \Q 0 /
§ i) НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ 245 (Если уь t^T, — еще одно непрерывное решение, то по формуле Ито находим, что d( —) = 0, откуда вытекает, что yt = xb *<7\ Р-п. н.) Если известно, что процесс а = (а,, £Tt), t^T, таков, что уравнение (6.19) имеет непрерывное неотрицательное решение, то из доказательства леммы 6.2 следует, что такое решение может быть представлено в виде xt = ехр ( Г,(a) -\ j a2sds) (6.21) и это решение единственно. Естественно поставить теперь вопрос о том, при каких предположениях о процессе a = (at, @~t), /<7\ уравнение (6.19) имеет неотрицательное непрерывное решение. Ответ на этот вопрос содержится в приводимой ниже лемме, для формулировки которой введем следующие обозначения. Пусть т« =\ т \ a2$ds < п2, т если о (6.22) и т = Нттп. Ясно, что \a2sds = oo на множестве {со: т<Г}. о Лемма 6.3. Для того чтобы уравнение (6.19) имело неотрицательное непрерывное Р-п. н. решение, необходимо и достаточно, чтобы Р (х{ > 0) = 1 и на множестве *) {со: т ^ Т) lim f a2sds=oo. (6.23) п о Это решение единственно и задается формулой (6.21). *) Условие (6.23) означает, что на множестве {оэ: х^Т} «уход» интеграла I as (со) ds в бесконечность при t -> т (оэ) происходит непрерывным о образом.
246 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ [ГЛ. 6 Доказательство. Необходимость. Пусть уравнение t xt=\ + \xsa3dWs (6.24) о имеет решение %и 0<^7\ с p(\iysds<oo\ = \. (6.25) Согласно лемме 6.2 №(а) —i-jajdsj. (6.26) It = exp ^ б Поэтому, если для некоторого я =1,2, ... Р(тл = 0)>0, то t это означало бы, что \a2sds=oo с положительной вероят- о ностью для любого t > 0. Но тогда из (6.26) вытекало бы, что с положительной вероятностью §0 == 0. Это, однако, противоречит предположению Р (§0 = 1) = 1. т Далее, ) a2sds=oo на множестве {со: т^Г} и, следовательно, о 5Т = 0. Поэтому на множестве {т^Г} Р-п. н. / хп \ 0 = jT = P-lim5Trt = P-limexp(rTrt(a)^-i| a]ds Отсюда с помощью леммы 4.7 уже нетрудно вывести, что выполнено условие (6.23). Достаточность. Пусть процесс a = (a/? &~t), 0</<Г, удовлетворяет условиям леммы. Покажем, что тогда i^expfr^o)--i-jajdsj (6.27) является решением уравнения (6.19). Для этого надо проверить, во-первых, что $0= 1, во-вторых, что Р I J (lsas)2ds < оо = 1, в-третьих, что fo, t^.T, непрерывен Р-п. н. и, наконец, что dit = itatdWt.
§ 1] НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ 247 Условие J0 = 1 вытекает из того, что Р (т„ > 0) = 1, п = 1,2, ... Займемся проверкой непрерывности Р-п. н. fa, t^.T, и условия Р М (J,a,)2<fc<ooj=l. Из (6.27) и п. 9 § 2 гл. 4 следует, что на {со: т„^Г} ( %П Т" \ *t« = exp( J asdWs — у J a]ds J, (6.28) и, следовательно, по формуле Ито 0 Как и в лемме 6.1, отсюда нетрудно вывести, что последовательность Ат ЛГ, &~х ЛД /1=1,2,..., является (неотрицательным) супермартингалом с М$т ЛГ^1. Поэтому согласно тео- реме 2.6 Р-п. н. существует lim g (=$*), причем М}*<11. Отсюда вытекает, что Р(Г<оо)=1. Покажем, что процесс fo, 0</<Г, определенный в (6.27), является Р-п. н. непрерывным. Поскольку ft Л тп tAxn \ itA%n = exP[ J a,dlP,—^ J aJdA (6.29) \ о о / то it является Р-п. н. непрерывной функцией для t^%n. Для т^^Г ?^ = 0 (Р-п. н.), поскольку на множестве {со: т^/^Г} х Г a]ds=oo. Поэтому у *<Г, будет Р-п. н. непрерывной функ- о цией, если показать, что Р (§* = 0) = 1. Из (6.28) по формуле Ито хпАТ Т|1ЛГ е-нялг = г1_ J e-\asdW8+±] e-*l2ealds. (6.30)
248 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ [ГЛ. 6 т„ЛГ Здесь М | e~\asdWs = 0, так как о хпЛТ М Г e~2^2a:ds^ sup e~2zzti < оо. 0J S S 0<г<оо Поэтому из (6.30) следует, что М | е \2а^5 = 2м[е"3х«л7-Г,]<2. о Переходя в этом неравенстве к пределу при /г-*оо, находим тАТ М J е~ЧЧ2^^2- (6-31) о Из (6.31) вытекает, что Р-п. н. ТАГ Tn+iAT Т«+1АГ > inf [бГ\2] f ajds. (6.32) На множестве {со: т^Г} в силу (6.23) и (6.22) ТП+1АТ Xrt+1 J as2rfs= J as2ds = 2>z+ 1. Поэтому из (6.32) следует, что на {т<Г} т Г -3, 2 2 . J e s6sasds inf КЧ2]<° 2»+1 ->0, ,-,оо. Значит, на {т<Г} Р-п. н. e-8'(j')2 = 0. Н0 P(f< оо)=1, поэтому Р($* = 0)= 1. . Итак, непрерывность Р-п. н. траекторий процесса $,, 0</<1Г, доказана.
§ 1] НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ 249 Далее, как и в (6.32), находим, что т AT ХАТ > [ е **iWsds> inf е~*° f tfa'ds. (6.33) Поскольку js, s^7\ является непрерывным процессом, то Р( inf e~is>0)= 1, что вместе с (6.33) дает ТАГ Г " — 3 2 2 г х л г в %as ds Тйа2^ = f iXd5<- Ч-<°° (Р-п. н.), (6.34) 0<s<TAT т.е. Р Г iWsds < оо ]== 1. Из этого условия следует, что определены стохастические интегралы Г %sasdWs для всех t^.T. о Обозначим t &=1 +JkM^s, *<Г. (6.35) о В силу (6.28) tAxn kATn=l+ J ls**Ws> t<T. 0 Поэтому yt = lt (Р-п. н.) для всех t^xn^T9 и в силу непрерывности траекторий этих процессов t)t = h (Р-п. н.)для/^т^7\ Итак, если т^Г, то yt = h (Р-п. н.) для всех t^T. Если же t т<7\ то г/х = $т = 0 и для *>т yt = yx+ \h<*sdWs = yx = 0: х поскольку Js = 0 для s^t. Следовательно, yt = h (Р-п. н.) для всех /<^Г, и, значит, согласно (6.35) t О Покажем теперь, что решение (6.27) уравнения (6.19) с точностью до стохастической эквивалентности является единственным.
25о Неотрицательные супермартингалы [гл. 6 Пусть 1ti ^Г, —-еще одно неотрицательное непрерывное решение уравнения (6.19). Тогда d ($,/$,)== О при /<t = limtft п (ср. с п. 4 § 3 гл. 5). Поэтому lt = \t (Р-п. н.) при t<%f\T и по непрерывности JT = JT. Следовательно, на множестве {со: т > Т) Jf = gf, f^ Т. Рассмотрим теперь множество {со: т^Г}. Поскольку оба процесса ^ и^ являются (как решения уравнения (6.19)) супермартингалами, то $, =^ = 0 (Р-п. н.) на множестве {со: т<^^Г}. Итак, fa = lt (Р-п. н.) для каждого t, 0</<Г. Из непрерывности этих процессов вытекает, что их траектории совпадают Р-п. н., т. e."P{sup|j, —&|>0} = 0. § 2. Неотрицательные мартингалы 1. При некоторых простых предположениях супермартингал ф = ((р,, yt)9 t^O, введенный в (6.17), оказывается мартингалом. Настоящий параграф будет посвящен исследованию этого вопроса. Начнем с доказательства следующего общего результата. Лемма 6.4. Если £ = (£„^Г,), t^T, —супермартингал и М£о=М£г, (6.36) то он является мартингалом. Доказательство. В силу супермартингальности M£r<M£,<M£o. Поэтому согласно (6.36) М^ = const, t^T. Обозначим А = {со: М (£, | £%) < У, где 0 < s < t < Г, и предположим, что Р(Л)>0. Тогда МЕг = МЬ = ММ(Ь1*-,) = = М{хлМ(Ы rs)}+ M{(1 -%A)M(h\ Г3)} < M%Als + + M(l-%A)ts = Mts, что противоречит равенству MlT = M£s. Поэтому Р (А) = 0, а следовательно, процесс £ = (£*, &~t)> t^Ty является мартингалом. 2. Теорема 6.1. Пусть р = (р„#-,), t < Г, — случайный процесс с PI j $2sds < оо | = 1. Тогда, если Mexp(4jps2ds]<oo, (6.37)
2] НЕОТРИЦАТЕЛЬНЫЕ МАРТИНГАЛЫ 251 то супермартингал ф(Р) = (Фг(Р)> ^~*)> t<^T, с / t t Ф/ (р) = ехр| $sdWs-±j %ds является мартингалом и, в частности, Мф,(Р)=1, /<7\ Доказательство. Пусть а > 0 и inf Ь < Г: l$sdWs-\psds=-aV t t J fisdWs- j %ds T, если inf o<*<rL() 0 Положим КО и покажем вначале, что МФоа(Яр)=1. Для этого заметим, что >—а. (6.38) о Поэтому для доказательства равенства (6.38) достаточно показать, что • °а М j" ф2(Яр)р2^5<оо. (6.39) О В силу предположения (6.37) М J p2d5<2MexpU-J p^5J<2Mexp(yJp^5|<oo. (6.40) С другой стороны, при Я<0 и O^s^аа ФЛАР)-ехрЫрв^в-.^/р»л) = = exp j Я /pu^-Jp2„tfU exp (A--£)JV„tf« < < exp \ к Г S S Ц о <ехр{|Я|а).
252 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ [ГЛ. б Следовательно, ф*(Яр)<ехр{2а| К |} при 5<аа и (6.39) вытекает из (6.40). Докажем теперь, что равенство (6.38) остается справедливым и при Я< 1. С этой целью обозначим рад (Ар) = еи% (Щ. Если А,^0, то согласно (6.38) MPaaW») = ^a. (6.41) Обозначим Л (со) = J pjdf, B(©)=J hdWt — j $dt + a^0, 0 0 0 и пусть u(z)==pa (Лр), где Л=1— \Л—г. Ясно, что если 0^г^1, то и 0^Л^1. В силу определения функции ра {Щ а(г) = ехр{|Л((о) + (1-/Г^7)В(со)}. При г< 1 функция и (z) представима (Р-п. н.) в виде ряда 00 к где, как нетрудно проверить, pfe(co)>0 (Р-п. н.) для всех 6 = 0,1, ... Если г^ 1, то в силу леммы 6.1 и, в частности, для любого 0^г0< 1 Mu(z0) < оо. Поэтому для | z К z0 М 5)-р-р*(©)<М ]£]-§-/>*(«>) = Ми (z0) < оо. fc=0 ft=0 Отсюда' в силу теоремы Фубини следует, что для любого |г|<1 Ми (г) = М fj 4 Pft <ffl> = Ё ТГ Mpk (co)- (6,42) При г < 1 fc=Q где с^>0, 6 = 0,1, ..,
§ 2] НЕОТРИЦАТЕЛЬНЫЕ МАРТИНГАЛЫ 253 В силу этого равенства и формул (6.41), (6.42) для —1 < <z<0 °° к °° к 2frMpft(<o)=5;irc*- Поэтому Mpft(<o) = Cb k = 0,1, ..., а значит (см. (6.42)), для 0<z<l Ми (г) = 21^ = е-О-"-*), fe=0 что и доказывает справедливость равенства (6.41) для всех Х< 1. Поскольку В(со)>0, Л(со)>,0 (P-п. н.), то Раа(Лр) = ехр{яВ(со) + (я~^-)л(со)}|раа(Р) при Л| 1. Поэтому по теореме 1.1 (о монотонной сходимости) lim Мра (Яр) = Мра (В), и, следовательно, в силу (6.41) Hi u a Mpae(P) = limMpae(^p) = eef а значит, Мфаа(Р)=1. Отсюда 1 = мФоа (р) = м [Фоа (р) %{0а <Т)] + м [Ч (р) х(аа=Г)] = = м[Фаа(р)х(0а<Г)] + м[фг(р)¥о=Г)] и Мфг(Р)- 1 - М [Фвв(Р)Х(0в<Г)| + М [ФГ(Юх(вв<Г)1- (6.43) Но P-lim % <п==0 и М(Р (Р)^1- Поэтому lim MXfa <пФ,(Р) = °- (б-44) Далее, на множестве (оа < Т) cpaa(p) = exp -a + |J ps2^<exp -a+ ' Jpjdsl, и, значит, МХ(ав<Г)Фав(Р)<е"вМехр( tJpS^)-*0' a~>0°' (6'45)
254 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ [ГЛ. 6 Из (6.43) — (6.45) получаем требуемый результат: Мфг (Р) = 1, из которого согласно лемме 6.4 следует, что ф(Р) = (ф* (Р)> ^~*)> t^Ty является мартингалом. Замечание. Теорема 6.1 справедлива с заменой Т на любой марковский момент т (относительно (^"/), t^O). В частности, утверждение теоремы верно при Г = оо. Следствие. Пусть W = (Wty $Tt)y t^O, — винеровский процесс и т = т(©) — марковский момент (относительно (&~t)> />0) с Тогда Me2 > оо. MeWx *T«1. 3. Приведем ряд примеров, в которых супермартингал ф(Р) = (ф*(Р)>^)> /<Л с Ф* (P) = exp(jp,dr,-|Jp;ds является мартингалом и, в частности, Мф*(р)=1, t^.T. Пример 1. Если| р,|</С< оо (Р-п. н.), f<7\ то Мф,(р) = 1, / ^ Г, в силу того, что Mexp(||p2dA<exp(^/C2) < оо. ( Г I Пример 2. Пусть T„ = infu<r: J $2sds = n>, причем I о ) т хп = Т> если J p2ds</z. Тогда о MexplyJp2dsl<e"/2<oo и МфТ/1(Р)=1 согласно замечанию к теореме 6.1, Пример 3. Пусть для некоторого 6>0 sup М ехр(бр^) < оо. (6.46)
§ Ч\ НЕОТРИЦАТЕЛЬНЫЕ МАРТИНГАЛЫ 255 Тогда Мф* (Р) = 1, / < Т. Действительно, по неравенству Йенсена т / т п ч т ехр|т о / ч о Jp2^)=exp(y|^^)<|Jexp(^)^. Поэтому, если Т ^ 26, то т MexpU-|p/d4< SUP Mexp(6p2)<oo, и по теореме 6.1 Мфг (Р) = 1. Пусть теперь Т > 26. Представим фг (Р) в виде произведения Фг(Р) = П<Ж+,(Р). 1=0 1 где 0 = <о<^1< ••• <tn = T, ф|;+'(Р) = ехр( J hdWt-j j* Р?Л и max[f/+I — ^]<2б. Тогда Мф^+'(Р)=1 и М[ф'/+" (0)1^1 = 1 (Р-п. н.). Следовательно, Мфг(Р) = М[М(фг(Р)|^я-1)] = Мф/я-1(Р)= ... =МФ,1 = 1. Условие типа (6.46) легко проверяется в следующих двух случаях. а) Пусть p = (pf, &~t)> * < Г, — гауссовский процесс с supM 1Р*|< оо, sup Dp, < oo. Тогда, выбирая 6< 2 sup Dp^ ' находим, что sup МехрЩ) = sup 6XPb-26PpJ
2Й6 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ (ГЛ. 6 б) Пусть y = (yt, &~t)> /< Г,— случайный процесс, допускающий дифференциал dyt = a(t, yt)dt + b(t, yt)dWu y0 = r\9 где \a(t, у)КК(1+\у\)9 \b(t,y)\^K<oo и М ехр (erfK оо для некоторого е > 0. По теореме 4.7 найдется такое 6^0, что sup Мехр(61г/^)<оо, а значит, при некотором б > 0 sup Mexp(6a2(/, yt))<oo, и, следовательно, М<р*(ф)=1> гДе Р* = я(*» Уд- Пример 4. Пусть процессы р = (Р<, &д и W = {WU £",), t < Г, независимы и Р | J р2 dt < оо ) = 1. Тогда Мф, (р) = 1, Для доказательства, нар_яду с (£2, У, Р), рассмотрим идентичное ему пространство (Q, ST, Р) и на вероятностном пространстве (Q X й, У X У9 Р X Р) определим случайную величину /Г Т . ф7, (со, б) = ехр ( J р, (со) ЙГ, (со) -11 р2 (со) Л1. В силу независимости процессов р и W МфГ (Р) = J ФГ К (О)Й(РХ Р) (СО, б). По теореме Фубини | Фг (со, б) d (Р Х"Р) («>, со) = \ \ | фг (со, б) dP (6)1 dP (со). Но Р-п. н. т т J ехр f i- J р2 (со) dt\ dP (б) = ехр U J р2 (со) Л J < оо , и поэтому в силу теоремы 6.1 J ФГ (со, б) dP"(6) = 1 (Р-п. н.), а значит, и Мфг(Р) = 1.
§ 2] Неотрицательные мартингалы 257 Пример 5. Условие независимости процессов р и W, сформулированное в предыдущем примере, можно ослабить, заменив его независимостью а-алгебр ^£+в = °1<к P.. v^u + e] и rftt = a[co: Wv-Ws, *<*</} для 0 < и < s < t < Г, е > 0. Действительно, пусть 0 = /0</1< ... <tn = T и max[f/+1 — f,]<e. Тогда согласно примеру 4 M<pj/+1(p)=l и М (ф'/+1 (р) \Tt ) = 1 (Р-п. н.). Применяя теперь прием, использованный в примере 3, находим, что мФг (р)=м цФ;/+1 (р)=mVo> (р)=1. 4. Покажем теперь, что в теореме 6.1 условие т MexpUj fids) <оо9 вообще говоря, неулучшаемо в том смысле, что выполнение для любого е > 0 условия т (g-)j* Мехр i-e fids <oo 5 б не влечет за собой равенства Мфг(Р) = 1. Пример 6. Пусть Te = inf{f: Wt — (l — e)t = — а), где 0<е<у, а > 0. Покажем сначала, что М ехр ((■!■ - е) т.) = ехр ((1 - 2е) а), (6.47) а затем установим, что МфТс< 1, где фТе = ехр f 1^Те — -yj. Определим моменты T(n) = inf{/: л<1Р,<-а + (1—в)/} и установим, что Мехр[(4—в)т<»)]-Кя(0), (6.48) где -2еи —(1—2е) а-л р-(а+«) _ i V (гЛ g -g /;* I g — e(l-2e)*
258 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ (ГЛ. 6 является решением дифференциального уравнения VI(х)- 2(1 -в) V'n(x) + (l-2в) Vn(x) = О с Vn(-a)=Vn(n) = A. Для доказательства (6.48) рассмотрим функцию Vn(x)e^2 ' . По формуле Ито У„(^)ехр[(1-8)т<">] = Jn) = Vn (0) + J П (*.) exp [(1 - e) s] dWs, 0 где ;^=Ц^— (1—e)t. Ясно также, что для всякого N^0 ^(V,AJV)exp[(i-e)TfAiv] = т<">л W = V» (0) + J* П (ж.) ехр [(1 - в) s] «ЯР,. о Поэтому, поскольку для —а^х^п функция V'n(x) ограничена, то *{*> л n М j V'n(xs)exp[(±-e)s\dWs = 0 о и, следовательно, MVn (x^Л „) ехр [(± - е) т<«> Л n] = Кй (0). (6.49) Легко проверяется, что 0< inf Vn{x)< sup Vn(x)<°o> а значит, М ехр [(1 - е) т<»> Л>] < J"^ < - • —a<x<n Отсюда после предельного перехода (N-->oo) получаем Mexp[(-i-e)xl»)]< J"^.
§ 2] НЕОТРИЦАТЕЛЬНЫЕ МАРТИНГАЛЫ 259 Из этого неравенства и неравенства Vn [xp л „) exp [(■! - е) т<»> Л n] <_np<n Vn (х) ехр [(1 - г) т<»>] вытекает, что в (6.49) возможен предельный переход под знаком математического ожидания при W->oo, что с учетом равенства 1^(*т(п))==1 (Р-п. н.) приводит к соотношению (6.48). Делая в нем предельный переход (/г->оо), получаем требуемое соотношение (6.47). Наконец, заметим, что Фте = exp(w4 - ■£) -ехр(ГТе - (1 - 8) тв)ехр ((1 -е) т.) = = ехр[— я + (у — е)те]. Отсюда в силу (6.47) вытекает, что МфТе = е-2еа < 1. 5. Приведем еще два примера, в которых нарушается равенство Мфг(Р)=1, а значит, (6.37) не выполнено. В первом из этих примеров Г = оо, во втором Г=1. Пример 7. Пусть ф, = ехр(и^ — -~) и x = inf {t: Wt = — 1}. Тогда Р(т<оо)=1 (гл. 1, § 3) и <рт = ехр(—1 — yj <е"\ Следовательно, Мфт < е~[ < 1. Пример 8. Пусть 0 < / < 1, fl _ Wt v р'~~ (1 — t)2 Mx>ty где т —inf{/<l: Щ = 1—/}. Тогда, поскольку Р(0<т< 1)=1, то 1 ' 9 Т 9 J «Л-* J Tn=ljr*.>o*-4J TT=1F^<00 (P"n-H-)- 0 0 0 По формуле Ито для t < 1
260 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ [ГЛ. б откуда 1 ~" J (1 _/)2 Х(Т>0 dWt~ J J (1 -/)4 ^(X>t)dt=== о о *5 , Г 2И ,, , [_J!__ [_JH!j_Ht- (1 — Т)2 "*" J (l_<)3af-rj (l-/)2 J (\-tyal — О 0 0 = -Т^ + /{2^2[тГ^-(Т^7)г]+(г47г}^< о т о Поэтому Мф! (РХе""1 < 1. § 3. Теорема Гирсанова и ее обобщение 1. Рассмотрим на вероятностном пространстве (Q, #~, Р) винеровский процесс W = (Wti &~t)> t^T, и случайный процесс у = (yt9 STt\ < < Г, с Р И y\dt < оо 1—1. Пусть j—fo, Ft), t<^T, — неотрицательный непрерывный супермартингал с t U=l + jv.dW.. (6.50) 0 Если Mjr=l, то процесс $ = (&, Ft)* t^T> будет неотрицательным мартингалом (лемма 6.4) и на измеримом пространстве (Q, &"т) определена вероятностная мера Р с dP = %T((d)dP. Теорема 6.2. Если Mgr (<») = 1 > то на вероятностном про- странстве (Q, #", Р) случайный процесс W = (Wt9 £Г), *<Г с*) t Wt = Wt-$ tfy.ds (6.51) 0 является винеровским (относительно системы (^F,), O^t^T, и меры Р). 2. Доказательству этой теоремы предпошлем ряд вспомогательных предложений. *) bf = 6s \ если as>0, и s+=0 при а5 = 0. Из приводимой ниже леммы 6,5 вытекает, что з+в^Г1 (Р-п. н.).
§ 3] ТЕОРЕМА ГИРСАНОВА И ЕЕ ОБОБЩЕНИЕ 261 Лемма 6.5. Пусть Mjr = 1. Тогда Р( inf а, = 0) = 0. Доказательство. По определению меры Р Р( inf 3, = 0)= f SrdP(co). °<«Г {со: inf lr4 Пусть т = inf {^ =^ Г: fo = 0} и т = оо, если inf h > 0. Тогда {о: inf ^==0} = {(о: т^Г} и, следовательно, по теореме 3.6 Р( inf h = 0)= j hdP= J ?tdP = 0. °<*<T {©:Т<Г} {©:t<n Лемма 6.6. Пусть Mjr =1 и r\ = r\ (со) — &^измеримая случайная величина с *) М | г\ (со) |< оо, и 0 ^ t ^ Г. Пусть М (Л I ^"s) — один из вариантов условного математического ожидания, 0^5^ Г. Тогда, если s^.t, то M(r)|^s) = ^M(%|^s) (Р-п. н.). (6.52) Доказательство. Пусть Я = Я(со) — ограниченная ^-измеримая случайная величина и s<^.t. Тогда М (ЛЯ) = М [ЯМ (т) | <Г5)] = М [ЯМ (т) | Г8) %т\ = = М [Я М (г) | <FS) M fir | Г3)] = М [Я$5М (т) | <Г5)]. (6.53) С другой стороны, М (г\Х) = М (Щт) = М (Ят)М (?г | *%)) = М (Ят&) = = М[ЯМ(т)5/|^)]. (6.54) Из (6.53) и (6.54) следует, что Р- и Р-п. н. hM(r\\Fs)=M(y\]t\!rs). (6.55) HoP(k>0)=l. Поэтому Р^Г1 =if) = l и (6.52) в случае s^/ следует из (6.55). Замечание. Если ri=l, то из (6.52) следует, что Ы? = 1 (Р-п. н.), так что Mje8e" = l. В то же время Misif = P(h>0). *) № обозначает усреднение пр мере Р,
262 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ [ГЛ. 6 Лемма 6.7. Пусть {^>0, п=\, 2, ..^ — последовательность случайных величин таких, что 1п->1 {по вероятности), п->оо. Если М1п=Щ = С> то limM|£-bi| = 0. (6.56) Доказательство. Имеем М ||- In 1= М (| - U)%(l>ln) + М (|„ -1)%(1<1п) = = M(i-gx(,>Sn) + M(i„-i)-M(i„-i)x(l>l/t). Но М(|„ —1) = 0. Поэтому M||-i„| = 2M(i-gx(5>ln), (6.57) где 0^(£~"-£rt)fy|>£ \^£- Поэтому по теореме Лебега о мажорируемой сходимости lim М(£ —£ )%,£>5 ч = 0, что вместе с (6.57) доказывает (6.56). Лемма 6.8. Пусть на некотором измеримом пространстве {X, Ж) заданы две неотрицательные меры v и v, причем v<v и g{x) = -^{x)- Е°ли v(*: g(*) = 0} = 0> то v<v w Доказательство. Пусть А е $. Тогда л л Но 1, g(*)>0, Поэтому J g+ (х) rfv (x) = v [АП {*: g (*) > 0}] = v (Л) - v[А П {*: в (х) = 0}], л где по предположению леммы v[Af]{x: g(x) = 0)]<tv{x: g{x) = 0} = 0. Следовательно, v{A)=jg+{x)dv{x), А что и доказывает лемму, поскольку g+ (х) совпадает у- И у-д. н. с g~l {х),
§ 3] ТЕОРЕМА ГИРСАНОВА И ЕЕ ОБОБЩЕНИЕ 263 3. Доказательство теоремы 6.2. Поскольку $f = i~l (Р-п. н.), 0<5</ и Р( inf js = 0) = 0, то процесс j+=(js+), 0^5^ Т, имеет Р-п. н. непрерывные траектории и, значит, P(supfc+<oo)=l. Далее, мера Р абсолютно непрерывна относительно меры Р(Р<Р) и p[j*d*<~) = p(j y2sds< oo = 1. Заметим также, что т т о <г о Поэтому РП (#Vtydt <оо\ = 19 t и, значит, интеграл J i+y sds, входящий в (6.51), определен, о Для доказательства теоремы достаточно установить, что Р-п. н. М {exp [to (Wt - Ws) | Ts) = exp (- -f (t ~ s)) (6.58) для любых z, — oo < z < oo, и s, /, 0<s</<7\ Предположим сначала, что P {0 < cx < inf it < sup it < c2 < oo} = 1, (6.59) ....... т M,|y?^<°°> (6.60) 0 где Ci'K c2 — константы. . * Обозначим r\(t, s) = exp[iz(Wt — Ws)]. Тогда по лемме 6.6 P-n. н. Й(Ч(*. s)\rs)=.itM(ri(t9 s)it\rs). (6.61)
264 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ По формуле Ито [ГЛ. 6 r\(t, s)fe = «.+ J Ч(и, s)iuti4udWu + iz§r\(u, s)badWa — s s t — -j* J i\(u, s)$udu. s Предположения (6.59) и (6.60) гарантируют, что М J Л (И, ^WjYa^l*". г * М J Л (и, s)3„fiW„|Srs = 0 (Р-п. н.) = 0 (Р-п. н.). Поэтому Р- и Р-п. н. а+м(л(/, в)«<|^.)=а.Ч-т1»?м(ч(и. snu\rg)du. (6.62) S Обозначим /(/,s) = 5+M(Ti(/(5)^|Srs). Тогда в силу (6.62) Р-п. н. t f(t, s)=l— -J-J /(и, s)d«, откуда находим fit, s) = e-^-s) (6.63) Но согласно (6.61) M (t\ (t, s) |#%) = f(t, s) (Р-п. н.), что вместе с (6.63) и доказывает утверждение теоремы в предположениях (6.59) и (6.60). Пусть теперь эти предположения не выполнены. Введем марковские моменты т„, я=1, 2, ..., полагая infh<r: f^ds + supb + Onfj,)-1 >я|. f Yjrfe + supj,+ (infg"' <«. J s<t s<t J Tn = Г, если
§ 3] ТЕОРЕМА ГИРСАНОВА И ЕЕ ОБОБЩЕНИЕ 265 Поскольку Р( f Y!^ + sup|J<oo] = lf p(inf j,>0)=1 и P < P, то Р-п. н. xn f Г, n-> oo. Положим hn = J*av Y/1 = Y/X(T/i>*) и о Тогда p = 1 + J virt) ^s и #|») = ^ - J (8in,)+ Y<n) ds. о о Пусть мера Р(Л) определена равенством dP{n) = $} (со) dP. Процесс Ь{п) = $п), @~t), 0</<Г, является мартингалом с MjJ?) = 1, и для него выполнено предложение (6.59) с с2 = п, т С\ = ггх. Кроме того, М J (y\n))2 dt^n < оо, и, следовательно, о по доказанному Р-п. н. М{п) {ехр [iz Wn) - W(sn))] | Fs) = exp {- -£ (/ ±- s)}, (6.64) где М(/г) — усреднение по мере Р(Л). Для завершения доказательства осталось лишь показать, что по Р-вероятности при /г->оо Шп) {ехр [iz (W{tn) - W{sn))] | Fs} -> M {exp [to (t, - ts)] | 0%}. (6.65) Поскольку при /г->оо M {ехр [to ($f} - tirt))] I Рш) —> M {ехр [to (У, - #,)] | Ts}, то для доказательства (6.65) достаточно проверить лишь, что Шп М | M(n) {exp [to (Щп) - W(sn)) | &~s} - -M[exp[iz{w[n)- #irt))]l^s}| = 0. (6.66) В силу леммы 6.8 при каждом /г=1, 2, ... мера Р(/г) эквивалентна мере Р, а значит, Р < Р{п\ (6.67)
266 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ [ГЛ. 6 Согласно лемме 6.6 P(rt)-n. н. и (в силу (6.67)) Р-п. н. M(n>{exp[iz(W\n)-Win))}\Ps} = m{exp[iz(wf >-#<">)]|1} (6.68) M {exp [iz (Wf) - f £»>)] | rs) = M {exp [iz (Wf> - f <?>)] g+j, | <Fs). (6.69) Поэтому M |M(">{exp[/2(#<")-#<»))]|^-s} - M {exp [/г(У|»>-#<»>)] |0-J|=- = M|M exp[/Z(t<")-#<"))l[^-^]|^} < <ММГ is J< 0- M rf> (/г) " Ms h вМ|М.+лтЛлт -Wft/I- (6-70) Покажем теперь, что У+л Tft8, л Tft-► M+J* Р-п. н. при я-» со. Введем момент T = inf(/<T: S, = 0), полагая т=Г, если inf ls > 0. Тогда, поскольку s<r y28ds<oo] = l, P(supis < оо) = 1, У 5<Г то введенные ранее марковские моменты тп, п=1, 2, ..., обладают тем свойством, что Р-п. н. хп \ т, я-*оо. Согласно замечанию 2 к теореме 3'.5 %t = 0 ({t^x}\ Р-п. н.). Отсюда для всех 0^/^Г получаем %t = i (Р-п. н.). Поэтому достаточно показать, что „1^^ Ai3s AxJ/ ЛтЛ= ?5лАлЛлГ (6-71) В силу непрерывности J,, 0<^<Г, (6.71) будет иметь место, если Ut^-^satCat' n-+°° (Р-п. н.). Но jjaA+a-t=0 на множестве {s>t} и для всех п=1, 2, ... JsAtJ+AT =0, а на множестве {т > s} infjcAT > 0, и, следовательно, п А п Ъл^Лх^Ъл^Лх* " ~* °° (Р"П- Н.) Итак, Р-п. н.
§ 3] ТЕОРЕМА ГИРСАНОВА И ЕЕ ОБОБЩЕНИЕ 267 Далее, и Поэтому по лемме 6.7 lim M rt->oo Mi ii+u =o лп) Ms bt u> °s где откуда и следует требуемое соотношение (6.66). Теорема 6.2 доказана. 4. Пусть j = (fo, #~,), /< Г,—супермартингал специального вида с it = ехр Ц р, ЙГ, -1 J p2 dsj , (6.73) Pi J Pjds< oo 1 = 1. Тогда о с Y* = 8A- Из теоремы 6.2 для рассматриваемого случая получаем следующий результат. Теорема 6.3 (И. В. Гирсанов). Если Mg7=l, то случайный процесс t Wt = Wt-j fisds о является винеровским относительно системы (#"/), 0^/^Г, и вероятностной меры Р (dP = jr (со) dP). Замечание. Примером неотрицательного мартингала J, = l + j4^> 0<f<7\ с РМ Y^5<ooj = l, не пред- ставимого в виде (6.73). может служить мартингал it=l + WtAX, 0</<7\ где T==inf{/: й?,= -1}.
268 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ [ГЛ. 6 5. Приведем также многомерный вариант теоремы 6.2. Пусть у* = (\i (0» ^t)t 0 ^ t < Ту i = 1, ..., п, — случайные процессы с Pi J y\{t)dt < оо 1 = 1, i= 1, ..., /г, и W = = (Wx (t), ..., Wn (t), ST^y О < / < Ту — /г-мерный винеровский процесс. Введем в рассмотрение случайный процесс t п h=l + jVyi{s)dWi(s)y (6.74) о *=i который в дальнейшем будет играть ту же роль, что и процесс, определенный в (6.49). Лемма 6.9. Существует винеровский процесс W = (Wt, &~t), 0^/<7\ такой, что для каждого tt 0<*^7\ Р-п. н. t h=l + lbdW, (6.75) Доказательство. Если P{Ys>0, 0<5<П=1. (6.76) то положим Wt=jyT^yt(s)dWs. Тогда из теоремы 4.1 следует, что процесс (Wt, #"*), 0^/<Г, является винеровским. В общем случае определим t п t *t = / Y? S Y, (s) dW{ (S) + J (1 - Y+ (s) Y (*)) **„ 0 *=i 0 где (zu STt), 0</< Ту — винеровский процесс, не зависящий от процесса W. (Тем самым мы предполагаем, что исходное вероятностное пространство (Q, &" у Р) является достаточно «богатым»; в противном случае вместо (Q, У9 Р) за исходное следует взять, например, пространство (QXQ, #~Х#~> РХР).) Процесс W = (Wt9 @~t) является непрерывным квадратично интегрируемым мартингалом. Покажем, что М[(#,- Ws)2 \Fs] = t-s (Р-п. н.). (6.77)
§ 3] ТЕОРЕМА ГИРСАНОВА И ЕЕ ОБОБЩЕНИЕ 269 По формуле Ито Щ - К = 2 J* WJ y+ 2 Y, (и) ИГ, («) + (1 - y+y„) *J + + /[(Yu+YB)2 + (l-Y„+YB)2]rf". Ho Р-п. н. (Y+Y„)2 + (1 - W - Y„+Y„ + (1 " Y„+Y„) = 1. Следовательно, Р-п. н. Из теоремы 4.1 вытекает, что процесс W = (Wt, @~t) является винеровским. Осталось проверить справедливость Р-п. н. равенства (6.75). Имеем t t п t 1+ J %dWs= 1 + J WEviW**!(*>+ I W -yfys)dzs = 0 0 1=1 0 0 /=1 поскольку Р-п. н. для любого 5, 0^s^7\ Ys (1 — yfys) = У3 — ysytys = У$ — % = °- Значит, t t n 1 + J ys dWs = it - | (1 - yA+) S Y* (5) dW% (*)• (6.78) 0 0 f=l Ho М( J (1-YSYS+)Sv((s)^(s)] = = м J* (i - ШЧ^=м J (i - yA+)ys^ = o, 0 0 что вместе с (6.78) доказывает требуемое представление (6.75). Из доказанной леммы легко выводятся следующие свойства процесса g = (j„ #",), 0 < t < Г.
270 НЕОТРИЦАТЕЛЬНЫЕ СУПЕРМАРТИНГАЛЫ [ГЛ. 6 Свойство 1. Если 3/^0 (Р-п. н.), то процесс i = (it,!Ft) является супермартингалом, М(^|^Г5)<^ (Р-п. н.), *>s, и в частности, Mj/^1. Свойство 2. Если Р( inf ^>0) = 1, то h допускает представление *'= ехр ( I 2 &{s)dWi {s) ~ T I 2 $ (s) ds)9 где pjw—arV*)- Пусть теперь № = (№„ #",), 0 < ? < Г, —/г-мерный винеров- ский процесс, где (вектор-столбец) Wt = lWx(t)9 ..., Wn(t)]. Пусть y = (\t> &~t)> 0 < / < Г, — также я-мерный процесс с (вектор-столбцом) Y, = [YiW. .... YnWJ и P(S Jy?W^<«>) = 1. 4=1 0 / Положим 8,= 1 + Jv;^., (6-79) о где у] — вектор-строка, транспонированная к ys. Как ив одномерном; случае (п=1), доказывается следующий многомерный аналог теоремы 6.2. Теорема 6.4. Пусть Mgr == 1. Тогда n-мерный случайный процесс t &t = Wt- j fads является (относительно системы (@~t), t^T, и меры Р с dP=» ■= Ьт (со) dP) винеровским процессом.
ГЛАВА 7 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР, СООТВЕТСТВУЮЩИХ ПРОЦЕССАМ НТО И ПРОЦЕССАМ ДИФФУЗИОННОГО ТИПА § 1. Процессы Ито. Абсолютная непрерывность их мер относительно винеровской 1. Пусть (Q, #~, Р) — полное вероятностное пространство, F = (fFt), t^zO, — неубывающее семейство а-подалгебр &" и W = (Wt, &~t)y t^Oy — винеровский процесс. Рассмотрим случайный процесс Ито*) l = (lt> @~t)> 0<7<7\ с дифференциалом**) dlt = h(®)dt + dWt9 £о = 0, (7.1) где процесс Р = (М®)> ^~*)> 0</<7\ таков, что РМ |р/(©)|Л<оо1 = 1. Обозначим (Сг, $т) измеримое пространство непрерывных функций x = (xs), 5<Г, с *0 = 0, и пусть \iv \iw— меры в (Сг, $т), отвечающие процессам £ = (£s), s<7\ и W = (WS), |it (В) = Р{со: |^ В}, \iw (В) = Р {со: W е В}. (7.2) В настоящем параграфе будут изучаться вопросы абсолютной непрерывности и эквивалентности мер ц. и \iw для случая, когда I есть процесс Ито. Условимся о некоторых используемых далее обозначениях. Пусть \it г и \xtw — сужения мер м^ и М-^ на Sit = d\x+ d\im = о{х: xst s^t}. Через -щ*-Ц, х) и -gjptf, *) будут обозна- *) В случае Г = оо предполагается, что 0 ^ / < оо, **) См. определение 6 в § 2 гл. 4.
272 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 чаться измеримые по паре переменных плотности (производные Радона — Никодима) мер \it ^ по \itw и \it w по \it ^ В случае t = T индекс Т будет опускаться: ^ (х) = ^ (Г. х), ^-(х)=-^ (Г, х). й\хг dH d\i w dH dvw Через -з—*-(£), "трМ'» l) обозначаются соответственно &"\- и ,^-измеримые случайные величины, получаемые при подста- d\it d\i+ новке в -г-М*), -ЖГ-У, х) вместо х функции | = & (<*>))> s<7\ d\it d\x+ Аналогичным образом определяются -т-МЛ W, тг"М^)> •• 2. Теорема 7.1. Пусть £ = (£/> #"/)> *<7\ — процесс И то с дифференциалом (7.1). £сли P(JP!A<ooLl, {7 Г -/м^-т/р? и и dt 1, (7.3) (7.4) 70 №$ ~ Vw u 'Э"П* н> *) d[A ^£ Ж./й\ — (8=М л П (7.5) Доказательство. Обозначим \ и о / Поскольку по предположению (7.4) Mjr = l, то (лемма 6.4) 3 = (3„ <Г,), £<7\ является мартингалом. Пусть Р — мера на (Q, У) с dP = iT{<£>)dP. По теореме 6.3 процесс £ = (!„£",), *) По поводу определения стохастического интеграла ps d%s о см. гл. 4, § 2.
§ 1] ПРОЦЕССЫ ИТО 273 t^Ty является винеровским (по мере Р), а следовательно, ДЛЯ ^G^r |1|Г(Л) = Р(6еЛ)- J M<o)dP= J M(jr(©)|*|)dP. (7.6) {g>: £е=Л} {о>: £е=Л} Случайная величина М ($г (со) | ^Г|) является ^-измеримой, и, следовательно *), найдется такая ^-измеримая неотрицательная функция Ф(л:), что Р-п. н. М(М»)Щ) = ФШ4 (7-7) (Для наглядности эту функцию Ф(л:) будем обозначать также М (iT (со) | Т\) . Аналогичные обозначения используются и в других случаях.) Тогда формулу (7.6) можно переписать в следующем виде: \iw (А)= J Ф (6 (со)) dP (со) = j* Ф (х) <Ц (х). Отсюда получаем \iw <C м^ и ^Е(*) = ф(*) („,-п.н.). Поэтому в силу (7.7) •^(|) = М(агИ|^) (р-п.н.), что вместе с (7.1) доказывает представление (7.5). Осталось теперь показать, что \i^ <C \i^ Для доказательства заметим, что -jpr (©) = Jr (©). причем Р ($г (со) = 0) = 0, поскольку в силу условия (7.3) jhdWt <оо =1. Поэтому по лемме 6.8 Р < Р и -g-H = JF'(<0). *) См. гл. 1, § 3.
274 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Далее, Н (Л) = Р {со: g ge Л} = J if (со) dP (со) = = J M[SF4«>)|^]dP(c0)=j М[^(С0)Щ]^^(^ {©: I e Л} Л поскольку Р {со: | е Л} = [%, (Л). Следовательно, ц,$ <С м-w и Р-п. н. ^(l) = M[lf(<o)\^T\. (7.8) Замечание. Теорема 7.1 сохраняет свою силу, если вместо момента времени Т рассматривать марковский момент а (относительно системы (&~t)> t^O). Тогда, если РМ fl*<ooj=l, {а а ч -j$tdWt—j\$dt\ =1, и и ' то меры \i\ и [%, рассматриваемые на а-алгебре $а, эквивалентны. Следствие. Пусть при каждом t, 0^/^Г, случайные величины р, = р, (со) являются ^-измеримыми. Не вводя новых обозначений, будем сразу предполагать, что Р* = Р*(|(со)). Пусть также выполнены условия (7.3), (7.4). Тогда Р-п. н. ^ © = exp ^- J p, (Q ^ + 1 J p2 (g) dfj. (7.9) Поскольку M-t~Mw> T0 *w (X) Из (7.9) и леммы 4.10 нетрудно вывести, что производная И {W) может быть представлена в следующем виде: / Т T v ^-(1Г) = ехрМ $t{W)dWt-\\$\{W)dt) (Р-п. н.). (7.10) d|X
§ 1] ПРОЦЕССЫ ИТО 275 Пример 1. Пусть lt = B-t + Wt9 /<1, где в = в(©) — Соизмеримая нормально распределенная случайная величина, N(0, 1), не зависящая от винеровского процесса W. Согласно (02 \ — QW{ —1=1, и по теореме 7.1 Vl~V ^.(|,= м[еХр(-е||+^)|^]. Условное распределение Р (6 < у | *Г|) является нормальным, N(^-, у). Поэтому М [ехр (- 6|, + ^) | <Ff] = V2 ехр ( - |-). Следовательно, ^W_/2exp(-4). ^-W dp* \ 4 / d\iw —-m =—■p=-exD (7.11) Забегая вперед, отметим, что для этих производных можно дать иные выражения (§ 4). Так, согласно теореме 7.13 Р-п. н. i 1 -г ! d|v m= dng (|) = ехр 1 + s "St T 2 J \\+s) ds (7.12) 3. Теорема 7.2. Яг/сгб i = (!*,#"<), t^T, —процесс Ито '■ дифференциалом (7.1). £сли Pi J $\dt < оо J = 1, то ц^ < цг. Доказательство. Положим для л = 1, 2, ... inf Ь < Г: J'pf Тп = Krfs->« , Г, если \ ^ds < /г, Пусть , №=%Т%. l?)=l&»ds+Wt, 0<*<Г.
276 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Тогда, поскольку Р( ) (fi^yds^n I = 1, то по теореме 6.1 , т т ч Мехр \-\^dWe-\\^fYds' =L \ о о / Следовательно, согласно предыдущей теореме 7.1 М^м^М-^ для каждого я=1, 2, ... Заметим теперь, что на множестве {тл = Г} £(/;) = £,, 0^ <*<7\ Р-п. н. и поэтому для любого Гб^г ^(Г) = Р{со: |(со)е=Г} = = Р{^(со)еГ, тп = Г} + Р{Е(со)еГ,тп<Г} = -Р ©»>(©) е Г, хп = Т) + P{g(©) еГ,т„< Г}. Пусть ^(Г) = 0. Тогда, поскольку M^(n)~JV ^(п)(Г) = 0и Р {gW ЕГ,т„ = Г}<Р #"> £Г} = ^(tt) (Г) = 0. Следовательно, 1*6(Г) = Р{6еГ|тл<Г}<Р{тл<Г} = = Р| J" Р?Л> я[-*0, /г->оо. Отсюда вытекает, что ц^ (Г) = 0, а значит, ц^ < \iw. 4. Теоремы 7.1 и 7.2 допускают обобщение на многомерный случай. Приведем соответствующие результаты, ограничившись лишь формулировкой, поскольку их доказательства аналогичны одномерному случаю. Пусть W = (Wt, 9"t)> 0 < t < Г, — /г-мерный *) винеровский процесс, Wt = (Wl(t)t...9Wn(t))9 и p=.(fc,^)f 0</<Г, P* = (PiW, •••. МО). Теорема 7.3. Яг/с™ £ = (&, #"*), Ъ^К^Т. — п-мерный процесс Итоу lt = (l\(t), ..., ln(t))> с дифференциалом dh = hdt + dWt9 Eo = 0. (7.13) *) Здесь и далее векторы считаются вектор-столбцами.
§ 2) ПРОЦЕССЫ ДИФФУЗИОННОГО ТИПА Тогда если М рЦр;р,л<оо1 = 1, ( т т \ exp -JfcW,—i/pftA 1 = 1, \ о о / го ц?~цг ы Р-л. н. d|ie F-d)-M exp -Jpj^+ijp^^ П 277 (7.14) (7.15) (7.16) Теорема 7.4. Пусть I = Ци @~t), 0 < t < Г, — п-мерный процесс ИтОу lt = (£, (t), ..., £rt (t)), с дифференциалом PI $Ffitdt< oo 1 = 1. Гогда fx^ < jli^. § 2. Процессы диффузионного типа. Абсолютная непрерывность их мер относительно винеровскои 1. Пусть W — (Wu&~t), 0<£<7\ — винеровский процесс, заданный на вероятностном пространстве (Q, У, Р) с выделенным в нем семейством а-подалгебр (5Г*), 0 ^ t ^ Г. Рассмотрим случайный процесс £ = (|*, #"*), 0^/^Г, диффузионного типа *) с дифференциалом db = at(l)dt + dWu g0 = 0, (7.17) где неупреждающий процесс а = (а, (л:), ф+), заданный на (Сг, $г), таков, что РМ|а,(6)|Л<оо| = 1. (7.18) Согласно теореме 7.2 условие Р I J a2t(Q dt < оо \ = 1 обеспечивает абсолютную непрерывность меры \х^ по винеровскои *) См. определение 7 в § 2 гл. 4.
278 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 мере \iw. Оказывается, что для процесса диффузионного типа это условие не только достаточно, но и необходимо. Теорема 7.5. Пусть I = (lt9 Tt), О < t < Г, — процесс диффузионного .типа с дифференциалом (7.17). Тогда Р ( J af («Л < оо |= 1 & ^ < pw. (7.19) \о / Доказательство. Утверждение «=ф» следует из теоремы 7.2. Для доказательства обратного утверждения обозначь чим %t(x) = -r-5-(f, x), 0^t^.T. Покажем, что процесс J = = {Ь(Ю> &*7)> 0</<7\ является мартингалом. Пусть s<t и Я (IF) —ограниченная #Т -измеримая случайная величина. Тогда МЛ(W)it(W) = jl(x)-^(/, х)d»w(x) = = jx(x)d\xt 6 (*) = J\ (x)dfxs 6(*) = J Л (*)8S (x)d[is ^ (x), откуда получаем М(^ (W)\ &~f) = bs(W) (Р-п. н.), t>s. Применим к мартингалу it = (jfc (W), TJ), 0 < / < Г, теорему 5.7. Согласно этой теореме найдется процесс Y«(Y>).^D' °<'<Г' с р(/у?ИЛ<~)=1 такой, что для каждого /, 0 < / < Г, Р-п. н. t fcOP) = l + jY.(®)«*lP.. (7.20) о При этом процесс fo(№), 0</<7\ является непрерывным с вероятностью 1. Рассмотрим теперь на вероятностном пространстве (Q, ЗГ, Р) с dp (со) = sr (со) dP (со) случайный процесс Г = (^, У^ 0< </<7\ с t Wt=Wt-j Bs(<*)ds, (7.21)
§ 2] ПРОЦЕССЫ ДИФФУЗИОННОГО ТИПА 279 где Bs (со) = $+ (W) ys (со). По теореме 6.2 этот процесс является винеровским. При доказательстве этой теоремы было показано также, что РМB28(a)ds<oo 1 = 1. (7*22) Согласно лемме 4.9 найдется такой функционал р = (р5(д;), $5+), что для почти всех O^s^T (Р-п. н.) в.(®)=р.(^(«>)), а следовательно, t Wt = Wt- \h(W)ds, Р-п. н. О В силу (7.22) Р| $ &(W)ds< оо\ = 1. Из этого равенства и предположения ц^ <C \iw следует, что Р ИР!(0Л<оо =1. (7.23) Действительно, /г \ ( т \ РМ P|(e^<ooJ = |i6lx: |р»(х)Л<оо| = = МХгг ](W)1T(W) = P[[ fP9(W)ds<oo) = l. П tfmdt<оо\ \0 ) Определим теперь на вероятностном пространстве (Q, !F, P) процесс W = (Wt(l),F\), 0< /< Г, полагая t Wt (x) = xt — J p5 (*) ds, л; г Сг (7.24)
280 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Этот процесс при х = 1 является винеровским. В самом деле, пусть Х = Х(1) — ограниченная ^-измеримая случайная величина. Тогда МЛ(£)eiz[**(5)-^<*>] = J X(х) eiz&<(х)~^<*П <ц(x) = = J X(W)eiz^-%T(W)dP = MX(W)e,z^t-^] = z2 z2 = e~~ (t's) J X (W) lT (W) dP = <П ('""'W (|). С другой стороны, ммае'^г^м (мам [*'*<*<-*«> |*11Ь и, следовательно, М[еи&-*'Цг\] = е-Т«-^ Из (7.18) и (7.24) получаем t W, (|) - Wt = J [as (|) - ps (I)] rfs, (7.25) 0 где (Wt, @~\) и (Wt, @~\), 0</<7\ — два винеровских процесса. Значит, с одной стороны, процесс (Wt — Wv У\)9 0</<7\ является квадратично интегрируемым мартингалом, с другой стороны, он имеет специальный вид (7.25). Из приводимой ниже леммы вытекает, что в таком случае Wt — Wt = 0 (Р-п. н.) для всех ty O^t^T. Лемма 7.1. Пусть т| = (ть ^*)> 0</<Г, — квадратично интегрируемый мартингал, допускающий представление t r\t=\fsds, Р-п. н., (7.26) о где неупреждающий процесс f = (fsy &~s), 0<$^7\ таков, что Р f I fs \ds < оо = 1. Тогда с вероятностью I ft = 0 для почти всех U 0<*<Г.
§2] ПРОЦЕССЫ ДИФФУЗИОННОГО ТИПА 281 Доказательство. Пусть % = inf u < Г: f \fs\ds^N\ т и xN = ТУ если j | fs | ds < N. Обозначим %^ = % > и т)<^ = ds. = 13^/. 0 Процесс (т)<Д ЗГШ), 0 < / < Г, с рм = £•, будет квад. ратично интегрируемым мартингалом (теорема 3.6), и поэтому М(<))2=Нт 2Mh^ -Ц\М)\\ 4 * ' rt-»oor=0 I "/+1 "/ J где 0 = ^0 < ... <tn = t и mtfx|//+1 —/у |->0, /г->оо. Поскольку 'ж ^?+|-^=1 *^5' TO rt-1 /7+1 <limM Л-»оо = lim M rt->oo М (rf >)2 = Jirn J M ( j" xf»/s ds I < max j ij»>\fa\ds Un\f.\d8 V ° ( '/+1 max J %w\fs\ds < <W lim M Г/ + 1 Ho max J %^ |/e | ds ^ # и при я-*оо с вероятностью 1 стремится к нулю. Следовательно, М(т)(^))2 = 0 и по лемме Фату Mri2=M(lim riH2< liE M(TftW —0.
282 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЁР (ГЛ. t Лемма доказана. Вернемся теперь к доказательству теоремы 7.5. Поскольку Wt — Wt = 0 (Р-п. н.) для всех /, 0<^<Г, то из представления (7.25) и леммы 7.1 следует, что as(£) = ps(£) Р-п. н. для почти всех s9 О<s< Т. Но согласно (7.23) Р J* $\{Qds< oo =1. Поэтому и Р I J a2s(l)ds < oo I = 1, что и завершает доказательство теоремы 7.5. 2. Согласно теореме 7.5 в случае процессов диффузионного типа условие PI J a2t(Qdt < oo 1 = 1 является необходимым и достаточным для абсолютной непрерывности меры \х^ по мере \iw. Займемся теперь изучением процессов fctt)-Sj:(M) и b<W)=-^(t,w). Теорема 7.6. Пусть I = Ци !Ft), 0 < / < Г, — процесс диффузионного типа с dlt = at{l)dt + dWty g0 = 0. (7.27) Тогда, если Р( J o?t{Qdt < oo J = 1, то процесс %t{W\ 0</<7\ является единственным решением уравнения t k(W)=l + jls(W)<*s(W)dW5, (7.28) О ^(t,W) = exp(rt(a(W))-±jal(W)dsj Р-п. н., (7.29) ^(/,|) = ехрМ as(l)dts--jja*(l)ds\ Р-п. н., (7.30) П <fi,(W)ds < ooj = Mexpf- J as(l)dWs - j j a2s(t)ds J. p (7.31)
§ 2] ПРОЦЕССЫ ДИФФУЗИОННОГО ТИПА 283 Доказательство. Для доказательства первого утверждения прежде всего покажем, что процесс it(W), t^Tt таков, что Р J (h(W)as(W))2ds < оо == 1. С этой целью, используя обозначения, принятые при доказательстве теоремы 7.5, установим сначала, что Р-п. н. для почти каждого s, O^s^ Г, i.(W*sW)=is(W)bm (7.32) Заметим, во-первых, что, как показано в теореме 7.5, Р (а,(I)фps (£)Н=0.для почти всех s<7\ Во-вторых, Р (j, (g)=0)==0, s ^ Г, поскольку Р (8. (6) = °) = h (х- 8. М = 0) = Щ8 (W) %{h (WH9 = 0. Следовательно, 0 = h (j, (x) [о, (х) - p, (*)] Ф 0) = Щ$ (W) %{hm [as m_h (W)]^y что и доказывает (7.32). Далее, по определению $s(W) = %+(W) ys(W). Поэтому ls(W)as(W) = ts(W)tf(W)ys(W) (Р-п. н.) для почти всех *<Г и т plj(bs(W)as(W))2ds<°°) = \о i т т = Р (J (ls(W)lfW)ys(W)Yds <™)>p(1 y2s(W) ds <oo\ = 1. Итак, Р I J &s(W)as(W))2ds < оо =1 и, следовательно, опре- t делен стохастический интеграл | js (W) as (W) dWs. о Покажем, что Р-п. н. t t 1 + J 8. (Щ «ЛГ) dWs = 1 + J ys W) dWs. (7.33) о о t Согласно (7.20) 1 + f Ys W) ds = %t (W). Поскольку процесс о (h(W)> @~JX Q^t^T, является неотрицательным мартингалом,
284 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 то Р-п. и. $t(W) = 0 при Г>г>т, где inf (/ < Г: 5, = 0), X = оо, inf 5, > 0. По определению t t l + \h(Was(WdWs=\ + jts(W)tt(W)ys(W)dWsi б о и, следовательно, при T^x^t равенство (7.33) выполнено Р-п. н. и, в частности, при х ^ Т о При T^t^x обе части (7.33) равны нулю. Из (7.33) и (7.20) вытекает теперь справедливость уравнения (7.28). Для доказательства утверждений (7.29) и (7.30) воспользуемся леммой 6.2, согласно которой процесс lt{W), /<7\ рассматриваемый как решение уравнения (7.28), может быть представлен в виде (7.29). Формула (7.30) следует из (7.29) и леммы 4.10, если заметить, что Р( Г a2s(Qds < оо ) = 1. Чтобы теперь доказать (7.31), заметим, что в силу (7.27) М ехр ( - j as (g) dWs -jjal (I) ds) = \ о о / = M exp |- J as (£) d%s +1 J" a* (£) dsj = M$+ (£). (7.34) С другой стороны, M$t+ ш = J" it M h (*) d»w (*) = = liw{x: it (x) > 0} = P (bt (W) > 0). (7.35) Но согласно (7.29)
§21 ПРОЦЕССЫ ДИФФУЗИОННОГО ТИПА 285 что вместе с (7.34) и (7.35) приводит к доказательству требуемого равенства (7.31). Теорема доказана. 3. Теорема 7.7. Пусть £ = (£„ &~t)> 0<^<Г, — процесс диффузионного типа с дифференциалом Тогда т £^~tV При этом Р-п. н pha](l)dt<oo^ = lf Pna28(W)dt<oo\ = l п. н. Ot t tas(W)dWs-^jal(W)ds ( t t (7.36) (7.37) (7.38) о о Доказательство утверждения «=#». По теореме 7.5 из условия Р I J a?t(Q dt < оо J = 1 получаем, что fig < \iw. Из теоремы 7.6 следует представление (7.37), поскольку РП tf(W)dt<oo) = l и, значит, rt(a(W))= J as{W)dWs. В силу условия Р «5 (W) ds < оо J = 1 т \as{W)dWs <оо = 1 (см. замечание 7 в п. 3 § 2 гл. 4), поэтому из (7.37) вытекает, что \xw I x: -j-^- (л:) = 0 1 = 0. Тогда по лемме 6.8 \iw <C \i^ и производная <1\*>1 <*>-[IH~ ■ что вместе с (7.37) и леммой 4.10 дает представление (7.38),
286 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР (ГЛ. 7 Доказательство утверждения «Ф=». Если ^<ц,^, то по теореме 7.5 Р ( J a2t(Qdt< оо 1=1. Но поскольку ц,£~^, то тогда, очевидно, и Р I J o?t(W) dt < оо J = 1. Теорема доказана. 4. В настоящем пункте будут изучаться условия, обеспечивающие абсолютную непрерывность меры \iw по мере ц^. Предварительно введем следующее обозначение. Пусть a = (at(x), $t), 0 ^ / < Г, — неупреждающий процесс и для каждого /i=l, 2, ... т Хп (X) = { Ы«Г: JaJ(jc)ds>nlt т оо, если \a2s{x)<n9 т (х) = lim xn (х). Теорема 7.8. Пусть £ = (£„ #"/), t^T,—процесс диффузионного типа с дифференциалом dlt = at&)dt+dWt, %0 = 0, причем РМ1М&)1«Й<~) = 1. P(Tn(6)>0) = lf' /г = 1, 2 и яа множестве (т (£) < Г) lim f a2t(Qdt = oo. Тогда т р/'/о«(И7)Л<оо|5=1#^<ц1, (7.39) и если ^f = #Т, 0 < / < 7\ го Г РМ a»aP)#<ooj = i^.|ijr«(iv (7.40)
§ 21 ПРОЦЕССЫ ДИФФУЗИОННОГО ТИПА 2S7 Доказательство. В силу условия Р | J a2s(W)ds < оо 1=1 Р(т(Г)=оо)=1. Условие же Р I J a28(Qds < оо = 1, вообще говоря, не выполнено, а потому Р(т(£) = оо)< 1. Из условия Р(хп(£) > 0) = 1, п=1, 2, ..., следует лишь, что Р (т(|) > 0) = 1. Обозначим %t (я)== %г t \ {*'• j a2s(x)ds<n\ Положим также t о • Поскольку l[n) = lt (Р-п. н.) при 0<^<rn(g), то Р М <*f (6) ^5 = J а£»> (g<«>) ds, 0 < / < Л = 1, и, следовательно, сЦ(п) = aj»> &W) dt + dip,, £<*> = 0. , Ясно, что p(j(a^(W))2ds< «Л = 1, Р( \№4l{n))fds<oo\=\. Поэтому по теореме 7.7 M^(n)~!V и / t t . ^Е-(f, g<«>) = exp - J a<*> (£(*>)rfgw + j J (aW (^>))2 rfs . (7;4I) Обозначим *>w-^>fcх)-
288 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Тогда, если Aelr, то tiw (A) = lim \jlw {А П (т<"> (х) = оо)} = п = lim j pp(x)dnlW(x) = lim j p<»> (*) <Ц (*) = " ЛП(т„(х)=оо) " ЛП(т„«-оо) = lim {pW(x)%W(x)dn.(x). A Покажем, что условие P J o?(W)ds < oo = 1 обеспечивает равномерную интегрируемость семейства величин {pj?} (6) X?* (S)» п= 1, 2, ...}. Для всякого N > 1 имеем < I* * {*: P?> (*) X?> (а:)>Л^}<ц1Г [x: pj?> (*) > tf} = - J ow (^)rfrs + j j* (ew (W))2rfs > In # < <P i >J!L^J+pJj(aW(r))2^>ln^}< <inr + 2p{ja5(fl7)rfs>lnJv}. (7.42) где использована оценка т j a<"> (W)dWs\> -^} <-^ + P { J WHWfda > lniv} (см. лемму 4.6).
§ 23 ПРОЦЕССЫ ДИФФУЗИОННОГО ТИПА Т 289 Поскольку Р J* a2s(W)ds < ool = l, то из (7.42) вытекает, что последовательность величин {pJ0 (£) Х^ (£)» /1 = 1,2,...} равномерно интегрируема. Рассмотрим величины 9{тп)(1)%(тп)(1) = Т \ ( j a2s{l)ds<n\ exp { - | aw (|) dlT, —i J (aw (£))2 d£ J lo Из результатов п. 9 § 2 гл. 4 следует, что существует rr(a(g)) = P-Hmxf* , JaW(g)rflT,. Поэтому согласно замечанию 1 к теореме 1.3 lim \p(Tn)(x)xlp4x)dii (x) = А = lim j Р(;»(1)Х^(1)^Р((о)= J Pr(a(i))rfP((o), где рг < цг<ц? {w:5((a)e :ю=ехР = Л} —Гг(а и «fug к ) = exp {©: I (©) e Л} rr(a(S))-4-Ja;®^ Следовательно, -Гг(аШ)-у|а52(Ю^ (7.43) Докажем теперь утверждение «#=». Пусть [х^ <С ц^ и T\ = Tf, /<Г. Рассмотрим производную pt(l) = -pL-(t9 I), t^.T. Поскольку сг-алгебры @~J и &*\ совпадают, то существует fFf-измеримая функция pt(W) такая, что pt(W) = f>t(l) (Р-п. н.), Процесс (pt(Q, 2Г\), t^T, является неотрицательным мартингалом. Следовательно, таким же свойством обладает и
290 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 процесс (pt(W), &~f), t^T. По теореме 5.7 найдется процесс yB^t(W),TJ)9 f<7\ с Р[ J ft(W)dt <оо | = 1 такой, что Р-п. н. t Pt(W)=l + jysW)dWs. (7.44) о Согласно теореме 6.2 процесс W = (Wt, &~Y), t<Ty с t Wt = Wt-jbs (W) ds, ps (W) = p+ (W) ys (W), (7.45) 0 рассматриваемый на (Q, P), P (dco) = pr (W (со)) Р (dco), является винеровским. При этом Р'[/р5(Г)^<оо| = 1. (7.46) Положим p,(g) = p+(g)Ye(6). Ув(6) = У,(П Тогда Р-п. н. РЛ£) — h(W)y 5<Г. Поэтому из (7.45) и уравнения t,= j4(£)ds+r, (7.47) о следует, что t Wt-h = -j[as($) + ts(t)}ds. (7.48) .0 Процесс (lt, Pf), t < T, рассматриваемый на (Q, Р), также является винеровским, поскольку &t = &t и Р(^Г)= j" pr (I(со))dP(со) = J ^f (Г, х)rffx^(*) = *v (П. Следовательно, процесс (#, — £,, ^"f), /<7\ является квадратично интегрируемым мартингалом и в силу (7.48) и леммы 7.1 <М£) — "~ М£) Р-п. н.. при почти всех s<7\ Поэтому ?(\a){W)dt<oo\ = pU a){l)dt<oo\ = = Р Г/ Р?(6)Л < <*>] = Р ( J l\W)dt < oo^ = 1, что и доказывает утверждение «<#=».
§ 2] ПРОЦЕССЫ ДИФФУЗИОННОГО ТИПА 291 5. Теорема 7.9. Пусть I = (lt, &~t), t < Г, т- процесс диффузионного типа с dlt = at(Qdt + dWti g0 = 0, (7.49) где PH\at{i)\dt< oo ) = 1, pHa](W)dt< oo J = 1, и выполнены предлооюения теоремы 7.8. Тогда процесс рд£)==-^-(/, £), f^7\ является единственным решением уравнения t МЮ = 1-/рЛ&К(6)<ЛР. (Р-п. н.), (7.50) о ^JZ(f, U7) = expf-Ja5(r)drs + iJa^(r)dsJ (Р-п. н.), (7.51) (t, I) = ехр(- Г, (а (£)) -1 J a2 (|) ds J (Р-п. н.), (7.52) #5 Р М а2(|) ds< oo j = Mexp ( j* as (Г) dWs -~ j a](W)ds J. (7.53) Доказательство. Представление (7.52) было доказано в предшествующей теореме (см. (7.43)). Формула (7.51) следует из (7.52) и леммы 4.10, если только заметить, что P-lim х , ехр( - f <"> (|) dWs -1 f (af (£))2 rfs) = - P-lim % exp I - f af (|) d|, +1 f (C (S))2 ds) n Jf „;«>*< 4 \ о S J и что в предположении Р I J a| (W) ds < oo J = 1 r,{a(W)) = jat(W)dWt.
292 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Равенство (7.53) устанавливается точно так же, как и (7.30) в теореме 7.6. Справедливость уравнения (7.50) доказывается так же, как и в лемме 6.3. 6. В рассматриваемых в дальнейшем задачах последовательного оценивания (гл. 17, §§ 5, 6) возникает вопрос об абсолютной непрерывности мер, отвечающих процессам диффузионного типа в случае, когда длительность наблюдения (Т) является случайной величиной. Пусть (С, $) — пространство непрерывных на [0, оо) функций x = (xt), t^O, #0 = 0, $t = o{x: xSi s</} и а = ох — марковский момент относительно системы (&t), t^0. Будем предполагать, что процесс £ = (£,), /!>0, имеет дифференциал dtt = at(t)dt + dWt, £o = 0, (7.54) причем PI Г |а, (g)|d/< оо 1= 1. Через \ха^ и \igW обозначим сужения мер \i\ и \iw на а-алгебре ^fa. Теорема 7.10. 1) Если Р И a28(Q ds< оо\=1, то \i0t g <C РМ a*(W)dt<oo =Mexp -| at(l)dWt-±l a){l)dt где ow = aWM> oi = ofM- 2) Если (7.55) РМ a?(g)df<ooj = pl J a2t(W)dt<oo\ = l, J a,(r)dr,—ij aJ(lP)rfA (7.56) Доказательство. Обозначим &t(x) = at(x)%y<ejfy (7.57)
§ 2] ПРОЦЕССЫ ДИФФУЗИОННОГО ТИПА 293 и пусть. Ц + l^-^aJ* t>av (7-58) т. е. 1=1 as(l)ds+Wt. о Нетрудно заметить, что dit = at(i)dt + dWt. (7.59) Согласно сделанному предположению РМ a;(|)ds<ooj=lf и, следовательно, РМ al(i)ds<oo)=l. (7.60) Поэтому по теореме 7.5 (с Г = оо) ^xg < \iw и (ОО \ / ОО 00 \ J й?(Г)Л<оо| = Мехр(-| 5,(6)^—g-Js?(6)^J- (7.61) Но \1аЛ(А) = \i%(A) и fxg ^(Л)=[х^(Л) на множествах Ле^0 . Значит, ^дС^^ и (7.55) следует из (7.61) и (7.57). Аналогичным образом из теоремы 7.7 выводится утверждение об эквивалентности мер \ia . и \ia w, а также и формула (7.56). 7. Пусть № = (№*,#"*), 0</<Г, — я-мерный винеровский процесс, Wt = (W{(t), ..., Wn(t% и £, = (£,(0. •••> I»» W) -процесс с дифференциалом где а, (л:) = (а{ (t, л:), ..., ап (t, х)) — вектор из неупреждающих функционалов. Теоремы 7.5—7.10 допускают обобщение и на рассматриваемый многомерный случай. Все формулировки остаются прежними, с заменрй лишь ц)(х) на а*(х)а^(х). Так, например.
является 294 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 многомерный аналог утверждения (7.19) теоремы 7.5 формулируется следующим образом: Р («I (S) a, (g) Л < со J = 10|ift < \iw. (7.62) § 3. Структура процессов, мера которых абсолютно непрерывна относительно винеровскои меры Если £ = (£*, £Г*), 0</<Г, есть процесс диффузионного типа с дифференциалом db = M£)<ft + <W*. ^o = 0, (7.63) то согласно теореме 7.5 условие Р I f a] (Q dt < со = необходимым и достаточным для того, чтобы \i% < \iw. В настоящем параграфе будет установлено, что если некоторый случайный процесс g = (gf, ^t), О^^^Г, таков, что его мера щ абсолютно непрерывна относительно винеровскои меры \iw, то этот процесс есть процесс диффузионного типа. Более точно, имеет место следующее утверждение. Теорема 7.11. Пусть на полном вероятностном пространстве (Q, !F, P) заданы неубывающее семейство о-подалгебр [STt), О^^^Г, случайный процесс £ = (£*, @~t) и винеровский процесс W = (Wu3rt)y 0<f<7\ такие, что м <\iw. Тогда найдутся винеровский процесс W = {Wt, &")) и не упреждающий процесс а = (щ(х), 0ft+), O^t^T, такие, что t h=*S*sil)ds + Wt (Р-п. н.), (7.64) о Р( j*](l) ds<oo) = l. (7.65) Если, кроме того, щ ~ \iw, то и РМ v]{W)ds <оо\ = \. (7.66) Доказательство. По предположению fig <С \xw. Обозначь чим L (а:)==-г-^(/, л:). Процесс i = (it(W), fTf) является неотри- дательным мартингалом с Mj/W—I, n согласно теореме 5,7
§ 3] СТРУКТУРА ПРОЦЕССОВ 295 существует процесс у = (yt (со), FJ) с Р Г у^ (со) dt < оо = 1 такой, что Р-п. н. t it(W)=l + jys(«>)dWs, 0</<7\ (7.67) о Рассмотрим новое вероятностное пространство (й, <FT, P) с dP (со) = ът (W (со)) dP (со) и определим на нем случайный процесс W=(Wr, Г7) с Wt=Wt- ja8(W)ds9 о где функционал a = (as(x)9 3BS+) таков*), что Р-п. н. для почти всех 0<s<r as(W) = if{W)ys(a>). Согласно теореме 6.2 процесс W = (Wt,&'Y)9 0<£<7\ является винеровским, причем PI j a2s(W)ds<ooj: 1 (см. п. 3 § 3 гл. 6). Заметим теперь, что \ii(A) = P(W e Л), поскольку р (W е Л) = J jr (Г (со)) dP (со) —Jar (*) dji* (*) = |it (Л). {©: ГеЛ} Поэтому РМ a;(g)rfs<ooj = ^M aJWrfs<ooj- = pf JaJ(U7)ds<oo) = l, ' (7.68) что позволяет определить процесс о Процесс W = (Wt, У)), рассматриваемый на (Q, fF, P), является винеровским, что показывается так же, как и в теореме 7.5. Итак, утверждения (7.64), (7.65) теоремы доказаны. Утверждение (7.66) следует из эквивалентности мер \i$ и |1уИ равенства (7.65). *) Существование такого функционала следует из леммы 4.9.
296 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Замечание 1. Из доказанной теоремы вытекает, что если процесс l = (lt,&'t) таков, что его мера щ абсолютно непрерывна относительно винеровскои, то этот процесс необходимо является слабым решением уравнения типа (7.63). Замечание 2. Если щ ~ \iw, то из теорем 7.7 и 7.11 следует, что существует неупреждающий функционал а = = (o>t(x)> $t+)> 0</<Г, такой, что плотности могут быть найдены по формулам (7.37) и (7.38). § 4. Представление процессов Ито в виде процессов диффузионного типа. Обновляющие (innovation) процессы. Структура функционалов от процессов Ито 1. Как показано в § 1 (теорема 7.2), для процессов Ито l = {lt, &~t), 0</<7\ с дифференциалом dh = h{<»)dt + dWt,. £o = 0, (7.69) условие PI | р^(со) dt < оо =1 обеспечивает абсолютную непрерывность меры [х$ по винеровскои мере \iw. Однако явную формулу для плотности -г—5- получить, вообще говоря, не удается. С другой стороны, если процесс | является процессом диффузионного типа (Мсо) = а,(£(со))), то согласно теореме 7.6 для плотностей -т-^- можно дать простые выражения (см. (7.29) и a\xw (7.30)). Точно так же структура функционалов от процессов диффузионного типа исследована достаточно подробно (§ 6 гл. 5). Непосредственное же изучение функционалов от процессов Ито является весьма трудной задачей. В связи с этим возникает вопрос: а нельзя ли представить процесс Ито в виде процесса диффузионного типа (правда, быть может, по отношению к другому винеровскому процессу)? Положительный ответ на этот вопрос содержится в ниже* следующей теореме, в которой описывается также структура функционалов от процессов Ито. Теорема 7.12. Пусть I = (£„ 3~t), f < Г, — процесс Ито с дифференциалом (7.69), где т J М|М©)|Л<<х>- (7.70) о
§ 4] ПРЕДСТАВЛЕНИЕ ПРОЦЕССОВ НТО 297 Пусть а = (а, (л:), $,+), 0 < t ^ Т, — функционал такой *), что Р-п. н. для почти всех, t, O^t^T, а,(Й=М(Р,|<Н). (7.71) 1°. Случайный процесс W = (Wt, &%> 0<f<7\ с t Wt = lt-jas(l)ds (7.72) о является винеровским, а процесс | является процессом диффузионного типа по отношению к процессу W: d$t = ot(t)dt + dWt. (7.73) 2°. Если РМ р?(ю)Л<оо| = 1, то всякий мартингал X = (xt> fF)), O^t^T, допускает непреч рывную модификацию, для которой справедливо представление t xt = x0+ jf.MdW,, (7.74) О где процесс f = (Js(®), <F|), O^s^T, таков, что РМ f*8(<u)ds <оо)=1. Если к тому же мартингал X = [xt, @~\) является квадратично интегрируемым, то т | Mf2s((o)ds< оо. о Доказательство. В силу (7.69) и (7.72) t *) Существование такого функционала следует из леммы 4-9.
298 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР (ГЛ. 7 Отсюда по формуле Ито при 0<5</<Г находим t etz (wrws) _ ! + iz J eu (wu-ws) dWu + S t t + iz j eiz <*."*.> [fc, (со) - au (I)] du - ^ I eu (F.^.) d„. (7.75) Ho M г t M Jete<r--r*>(P>)-a.(6))AH<r$ M J егг (*«-*.> M (p„ (со) - a„ (|) | 0-*) du | 0" = 0. Поэтому, беря в (7.75) условное математическое ожидание М(• I #"!) от левой и правой частей, находим t М (в'« С,-*.) | «г!) = 1 _ -£ J М (егг (И7"-^) | frbdu. Отсюда получаем M(e"(^-^>|^S) = e-4(<-) (Р-п.н.) 0<5<7\ Следовательно, процесс ttP = (tt^, У)) является винеровским. Для завершения доказательства теоремы осталось лишь заметить, что представление (7.74) следует непосредственно из (7.73) и теорем 5.20, 7.2 и 7.5. Следствие. Пусть Л = Л (со) — ^-измеримая случайная величина с М | т] | < со и выполнено условие 2° теоремы 7.12. Тогда найдется такой процесс / = (/>)> *1)/0</<7\ с РМ ff(©)d/<ooJ = lf что т ч = т+ j utydw,. о т Вели к тому же Mrf < °°> то J Mf2t((u)dt < оо.
-S4] ПРЕДСТАВЛЕНИЕ ПРОЦЕССОВ НТО 299 Для доказательства достаточно лишь заметить, что xt=* = M(tiI^) является мартингалом и х0=Мк\, хт = г\ (Р-п. н.). 2. Возможность представления процессов Ито £ = (£„ ^Г,), O^t^T, с дифференциалом (7.69) в виде процессов диффузионного типа (см. (7.73)) с винеровским процессом W = {Wt, !Г}) играет существенную роль при выводе как общих уравнений оптимальной нелинейной фильтрации, интерполяции и экстраполяции (гл. 8), так и отдельных частных результатов (см., например, ?л. 10). Согласно определению процесса W = (Wt> 9~\\ для всех 0 < t < Г. Во многих случаях справедливо обратное включение и, следовательно, grj = gr\^ 0</<7\ Совпадение а-алгебр yf и !р}, 0<f<7\ говорит о том, что процесс W «несет в себе ту же самую информацию», что и процесс £. _ Это свойство процесса W оправдывает следующее Определение. Винеровский процесс W = (Wt, @~Ь называется обновляющим (innovation) процессом (по отношению к процессу I = (£„ yt)9 0 < t < Г), если для каждого 0 < t < Т ' Исследование вопроса о том, когда винеровский процесс, входящий в (7.73), является обновляющим, является важной и трудной задачей. Если уравнение (7.73) имеет единственное сильное решение, то, конечно, процесс W будет обновляющим. Однако, как правило, решение вопроса о том, когда это уравнение имеет сильное решение, довольно трудно. Один достаточно общий случай совпадения а-алгебр (Pf и у) будет рассмотрен в следующем параграфе (теорема 7.16). По поводу совпадения этих а-алгебр в других случаях см. теоремы 12.5 и 13.5. Пример 2. Пусть g = (g„ #",), 0<f<7\ имеет дифференциал db = Qdt + dWt9 £о=0, где 9 —^-измеримая нормальная случайная величина, N(m, у), не зависящая от винеровского процесса W = (Wti #",). Тогда
300 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЁР [ГЛ. 7 М (б [У|)= "\ , ^/ (см., например, гл. 12, теорема 12.2) и, следовательно, процесс | является процессом диффузионного типа с дифференциалом т + у, dlt-Jr^fdt + dWt. (7.76) Непосредственно можно убедиться, что в этом примере !Г} = 3. Итак, условия (7.70) гарантируют, что всякий процесс Ито является в то же время процессом диффузионного типа (по отношению к винеровскому процессу UP). Используем этот факт для вывода формул для плотностей dH dnw мер -т— и —1—. к dv>w dH Теорема 7.13. Пусть I = (£,, #",), t < T, — процесс Ито с дифференциалом dlt^bWdt + dW» (7.77) где т J M| p,(co) Jrf/ < оо, (7.78) о РМ р2(©)Л<оо) = 1. (7.79) £сли /с тешу же /Г Г \ Mexp(-Jp,d^--g-|pfdH = l, (7.80) то |i6~iv РМ a;(arf5<ooj = PM a2(W0ds<ooj=l a -^L(,, ^ = ехРу a,(U7)rf^-l JaJ(lT)^j. (7.81) -^ (f, g) = ехр М as (g) ^ - у J «J (I) dsj , (7.82) где функционал a = (at(x), #/+), f ^7\ таков, что Р-п. н. а,(£) = = М [р, (ю) | £~|] (9ля /юип/ всех f<7\ Доказательство. Из условий (7.79), (7.80) и теоремы 7.1 вытекает, что \xi ~ \iw. В силу (7.77), (7.78) и теоремы 7.12
§4] ПРЕДСТАВЛЕНИЕ ПРОЦЕССОВ ИТО 301 процесс I является в то же время процессом диффузионного типа с дифференциалом (7.74), где W — винеровский процесс. Но меры \iw и \i^ совпадают, поэтому jx^ — fx^r и по теореме 7.7 РМ al(l)ds<oo)=pnal(W)ds<oo)=pn al(W)ds<oo)=l, где функционал a = (at(x), ^/+)/<Г, таков, что Р-п. н. а,(£) = = М [р^ (со) | iF*], t^T, для почти всех /<7\ (Во избежание недоразумений, отметим, что, вообще говоря, Р-п. н. а, (№)=£ ф М (р^ (со) | STJ). Действительно, так как 3~у^3~\, то М (р, (со) | Pf)=M [М (р, (со) | Р\) \&-f] = M [at (I) \ Pf], что может быть не равно at(W).) Представления (7.81), (7.82) следуют из формул (7.37), (7.38) и того замечания, что -т—ЧЛ £) = -^гМ'> I) (p'n- H-)> t^T. Замечание 1. Сравнивая формулы (7.5)и (7.82), видим, что М V 0 0 9 т\ = ехр (7.83) Иначе говоря, в предположениях (7.76)—(7.80) условное математическое ожидание, входящее в левую часть формулы (7.83), может быть «перенесено» под знак экспоненты. Замечание 2. Если М ехр I ■=■ pjds < оо } < оо, то справедливы формулы (7.81), (7.82). Для доказательства достаточно сослаться на теорему 6.1 т и заметить, что из условия Г М| РДсо) \dt < оо вытекает, что о М| р^ (со) | < оо для почти всех *е[0, Г]. Однако без ограничения общности можно считать, что Mip^coj^oo для всех t е [0, Г], поскольку в противном случае можно было, не изменяя процесса £, перейти к новой функции Р,(сй), которая для почти всех /е[0, Т] совпадает с рДсо), а в остальных точках t равна, например, нулю.
302 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Замечание 3. Если процессы р = (р/ (со), 5Tt) и W = (Wt9 &~t), /<7\ независимы, Р If p*(©)d/< оо = 1 и М|Р/(©)|<оо, т [ М| РДсо) \dt < оо, то меры щ и \iw эквивалентны и справед- о ливы формулы (7.81), (7.82). Для доказательства достаточно заметить, что, в соответствии с примером 4 § 2 гл. 6, выполнено условие (7.80). Пример 3. Продолжим рассмотрение примера из предыдущего пункта. Условия (7.77) — (7.80) выполнены, и поэтому (ср. также с (7.12)) Р-п. н. &со-«р(/^*-т/(^Г4 4. Т е о р е м а 7.14. Пусть £=(£/, #",), ^7\ —процесс Ито с дифференциалом (7.76), и пусть выполнены условия (7.77) — (7.79). Тогда Р ( J *]&)dt < оо = 1, ^ < ^ и -^Ц/, Г) = ехр^Г,(Г)-4 j*]W)ds\ '(* ° 1 ' (7'84) <*ц Доказательство. Из условия (7.79) и теоремы 7.2 вытекает, что щ <С \iw. Согласно теореме (7.12) g является_процес- сом диффузионного типа с дифференциалом (7.74), где W—вине- ровский процесс. Но меры \iw и ^ совпадают, поэтому ^ <С м<^ и по теореме 7.5 (утверждение ф=) Р I J a] (|) df < оо = 1. Формулы (7.84) следуют из теоремы 7.6. . . . .
§ 5] СЛУЧАЙ ГАУССОВСКИХ ПРОЦЕССОВ 303 § 5. Случай гауссовских процессов 1. В этом параграфе будут рассмотрены процессы Ито l = (lt, <Г,), 0</<Г, с дифференциалом dlt = h(<*)dt + dWi9 £o = 0, (7.85) в предположении, что процесс р = (р,((о), &~t), 0</<;7\ является гауссовским. Теорема 7.15. Пусть р = (р,(со), У(), 0<f < Г, — непрерывный в среднем квадратическом гауссовский процесс. Тогда щ ~ \iw и Р ( J а*(£) dt < оо I =Р И <x){W) dt < оо I = 1, (7.86) / t t ч dpw d\x (t, W) = exp M a, (IP) dW, - j j <%(W)ds , (7.87) Vo о / ^(t,t) = exi>(-j as(Z)d%s + j j al(t)dsY (7.88) где функционал a — (at(x), Ш1Л) таков, что Р-п. н. а,(£) = = М[р,(со)|^] для почти всех 0<*<7\ Доказательство. По предположению процесс р, = $t(со), 0</^Т, непрерывен в среднем квадратическом, поэтому MP, и Мр, непрерывны по / и т |Мр^<оо. (7.89) Следовательно, Р I Г р^ dt < оо I = 1, и по теореме 7.2 m < v>w Далее, в § 2 гл. 6 показано (см. пример 3, а)), что , т т \ Мехр -Jp.dr.-^Jpjds =1. \ о о / Поэтому в силу теоремы 7.1 \ii ~ \iw. Поскольку т т т j Ma](g)d/ = J M[M(p.|^|)J2d/<| Мр?Л<оо,
304 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 то выполнено условие (7.86) и, следовательно, плотности 4^Ц*, W) и 4"Ж-(^ I) задаются формулами (7.87), (7.88) со- гласно теореме 7.7. Теорема 7.15 доказана. 2. Откажемся теперь от предположения непрерывности в среднем квадратическом гауссовского процесса р, (со), t ^ Г. Теорема 7.16. Пусть р = (р,(со), У,), 0 < / < Г, — гаус- совский процесс с РМ Р?(©)Л<оо) = 1. (7.90) 1°. Тогда \х\ < j% и (Р-п. н.) -^-(t, W) = exp( Г,(а, Щ- у J а* ^ А > <7'91) -^- (t, I) = ехр (| as © rfg, - { | a* (g) dsJ . (7.92) 2°. £сли /с тому же система (р, ИР) = (Р„ №,), 0 ^ / ^ Т, яв- ляется гауссовской, то для всех t, 0 ^ t ^ Г, где Ц7 = (ц^, 2Г\) — (обновляющий) процесс с t Wt = lt-jas (£) ds, as (|) = M (p, (со) | <F|). 0 При этом всякий мартингал X = (xt, #"|), 0</<Г, образующий вместе с (Р, №) гауссовскую систему, представляется в виде t xt = x0+ jf(s)dW„ (7.93) о где детерминированная функция f(s), O^s^T1, такова, что т J f2(s)ds< oo. о Доказательству этой теоремы предпошлем следующую лемму, имеющую и самостоятельный интерес.
§ 5] СЛУЧАЙ ГАУССОВСКИХ ПРОЦЕССОВ 305 Лемма 7.2. Пусть $t = $t (со), 0 <; / ^ Г, — измеримый гаус- совский процесс. Тогда (т \ т j р2 ds < оо = 1 & J Мр2 ds < оо. (7.94) о /о Доказательство. Импликация «<#=» очевидна. При доказательстве прямого утверждения «=Ф» можно считать, что МР/^О. Действительно, допустим, что уже установлено, что (т \ т jftds <оо =1=ф|мр^5<оо о /о для гауссовских процессов Р/ = р;(<о),. 0</<7\ с Мр^О. Тогда наряду с исходным процессом р/ рассмотрим не зависящий от него гауссовский процесс р„ имеющий те же распределения, что и процесс р,. Процесс р, = р, — р„ 0 ^ f ^ 7\ имеет нулевое среднее, и, следовательно, из условия Р Г $]dt < оо =Р J $]dt < оо = 1 вытекает, что г JM(p,-p,)2^<oo. о Но Г Г Г 0 0 О Следовательно, PN (Р,-Мр,)2Л<«>) = 1. Поскольку Мр, = р,— (р,— Мр,), то J (Mp,)2rf/ < 2 J р?Л + 2 J (р, - M$t)2dt. О 0 0 Первая часть этого неравенства конечна с вероятностью еди- т ница, а значит, | (Мр,)2^ < оо. Поэтому, если импликация «=Ф» о доказана для процессов с нулевым средним, то из условия
306 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 / т \ т Р ! Г р| df < оо I = 1 будет вытекать, что f (M$tfdt < оо и | Мр* ^ < оо, где Р, = Р, — МРГ Тогда о г г г J Mp*d/<2 J Mp^/ + 2J(Mp,)2d/<oo. 0 0 0 Итак, будем считать, что Мр, = 0, 0<^<7\ Предположим теперь, что процесс р„ 0</<7\ непрерывен в среднем квадратическом. Покажем, что М Jp2d/< Мехр - J- pf d/ (7.95) Действительно, согласно разложению Карунена ([34],гл. 5, § 2) Р-п. н. при 0<*<Г оо Р/=2-л*<М0. где{фг(0, /==1, 2, ...}—ортонормированные собственные функции ядра M|3,ps: т т J Щ$зЧ>1 (s) ds = Я;Ф, (/), | Ф< (О Ф/ (О Л = б (/ - /), 4/= J" Р/Ф/(0^^ — независимые гауссовские случайные величины с Мт), = 0 и Тогда Т Т / оо \ 2 оо оо М J* р? Л = М j J] т),Ф, (О Л = J Мл] = J Я.. (7.96) О О М=1 / Далее, легко подсчитать, что О < Мехр - Jp?dH = Mexp(- J(2W0) dt) = t=i /=i o ч=1 j^i -Mexp(-S^ -ПМехр("^) = П(1+2Л')" 1/2 (7.97) *=i «=i
§ 5] СЛУЧАЙ ГАУССОВСКИХ ПРОЦЕССОВ 307 Сравнивая правые части в (7.96) и (7.97), приходим к требуемому неравенству (7.95). Пусть теперь Р, = Р/(<о), 0^/^ Г,—произвольный гауссов- ский процесс (не обязательно непрерывный в среднем квадратическом) с Мр, = 0, 0</<7\ и РМ р?"Л< оо 1=1. Обозначим / = (/;(£), /=1, 2, ..., 0</^Г) некоторую полную ортонормированную (в L2[0, T]) систему непрерывных функций и положим для п=\, 2, ... п РГ=2а,/,(0, где *) i=l Т а,-/рЛ(/)Л. Легко проверить, что для каждого п = 1, 2, ... процессы $f\ 0^/^Г, непрерывны в среднем квадратическом и т т т lim f [р< —р;я>)2Л = 0, j $dt = lim ^ (fiffdt (P-п. h.). (7.98) n о о " о Тогда из доказанного неравенства, т -2 М J (РИ2^ < Мехр/ — J (p^)2 Л и леммы Фату получаем, что неравенство (7.95) справедливо и без предположения непрерывности в среднем квадратическом процесса р„ 0 ^ / ^ Г. Из этого неравенства следует, что (т \ т Jpjrfs<«> #/ Mp2ds<oo. о /о Лемма доказана. *) По поводу гауссовости величин а^ и ранее рассмотренных величин щ см. далее замечание к этой лемме.
308 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Замечание. При доказательстве леммы 7.2 использовался т тот факт, что случайные величины а ===== $ty(t)dt являются о гауссовскими *). Доказать гауссовость величины а можно следующим образом. Обозначим т ■ЛЮ-ЬФЮ. rle(/) = TTrJ^=r, e>0, а'=]Ч(^. Тогда Р-п. н. a — а° = о < т J lv l + el^Mri2(/ * l + efMy\2(t) поскольку при каждом t 1> 8^'(/) ->0. в|0, 1 + е /Мл2 (/) Г Г , Т Т ч 1/2 Jl4(<)l<tf = Jlfc<p(0l#<(jР?л- jVw^) <°° (Р-п.н.) 0 0 \0 0 / и можно применить теорему о мажорируемой сходимости (теорему 1.4). Чтобы доказать теперь гауссовость величины а, достаточно проверить, что распределение величин а8 для е > 0 является гауссовским. Легко подсчитать, что в силу гауссовости процесса цЁ (/), 0^/^Г, для каждого я =1,2, ... при е>0 т jM|T)e(0l"d/<oo. о Хорошо известно**), что при выполнении условия т JM\r)e(t)\kdt<oo *) Заметим, что это нетривиальный факт, поскольку интеграл рдо (/) dt о является интегралом Лебега (при фиксированном со), а не интегралом Римана. **) См. [103J, [164].
СЛУЧАЙ ГАУССОВСКИХ ПРОЦЕССОВ 309 k-й семиинвариант S{$ случайной величины ае= \ r\Q(t)dt вы- о ражается через семиинварианты S\ (tx tk) вектора Сп8(^),... •••> Лв('*)) формулой т т s%=j ... js%(tu ..., tk)dt, ...dtk. о о Но случайный вектор (лЛ^)» •••» Ле^*)) является гауссовским, и, следовательно, S^tfi, ..., /fe) = 0, 6^*3. Значит, только первые два семиинварианта SJJ, S^ величины а" могут быть отличны от нуля, и, следовательно, случайная величина а8 имеет гауссовское распределение. Доказательство теоремы 7.16. Из условия (7.90) и леммы 7.2 следует, что т j M$dt<oo. о Поэтому представления (7.91), (7.92) непосредственно вытекают из теоремы 7.14. Перейдем к доказательству утверждений 2°. Пусть функционал а = (а, (х), 3St+), 0<£<Г, хеСг, таков, что а,(£) = = М(р^ (со)| 5^|)(Р-п. н.). Тогда в силу (7.73) t h=\*s(l)ds + Wt. (7.99) о Ясно, что ^э^гГ. Покажем справедливость обратных включений &r\^TJ% для этого заметим, что для каждого ?, 0^ ^/^Г, случайная величина T) = a,(£) ^-измерима и по теореме о нормальной корреляции (теорема 13.1) система (т), W, I) является гауссовской. Тогда по следствию 2 теоремы 5.21 t о&) = Мщ(1)+ J G{t, s)dW„ о t где детерминированная функция G(t, s) такова, что J G2(/, s)ds <oo. __ о Следовательно *), функция а, (£) ^"Г-измерима. Отсюда вытекает, *) Все рассматриваемые a-алгебры считаются пополненными множествами из 8Г нулевой вероятности.
310 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 С w что интеграл as(Qds также ^/-измерим, и в силу (7.99) Итак, для всех t, 0 <1 / <! Г, а-алгебры $Г) и yf совпадают. Возможность представления (7.93) следует из теоремы 5.21. Следствие. Если r| = Tj((u)— ^т-измеримая гауссовская случайная величина и система (т|, p, W) является гауссовской, то т Л=Мч+ \fT(s)dW„ о T где функция fT(s)9 O^s^T, такова, что \ f2T(s)ds < оо. о 3. Замечание. Если совместное распределение процессов р и W является гауссовским, то из условия (7.90) следует, что меры щ и \iw эквивалентны (щ~М^)- Действительно, в этом случае процесс £ является гауссовским. А для гауссов- ских процессов их меры или эквивалентны, или сингулярны (см. [57]). Но \i% <C \iWy поэтому [Х£~[%. Этот результат можно было бы получить и непосредственно, поскольку в рассматри- т ваемом случае нетрудно проверить, что не только Г Ma2t(Qdt < оо, о т но и оо. Поэтому эквивалентность мер щ и \iw о следует из теоремы 7.7 и плотности мер -т—— (/, W) и -т^ (/, I) задаются формулами (7.87), (7.88). § 6. Абсолютная непрерывность мер процессов Ито относительно мер, соответствующих процессам диффузионного типа 1. Результаты предшествующих параграфов допускают обобщение на более широкие классы процессов Ито и процессов диффузионного типа. В соответствии с определением 6, данным в § 2 гл. 4, процесс £ = (§*, #"*), 0^/^Г, есть процесс Ито, если для любого 0</<Г Р-п. н. / t lt = l0 + j* As (со) ds + J" Bs (со) dWs, (7.100)
§6] АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР ПРОЦЕССОВ НТО 311 где процессы А = (As (со), Ts) и B = (BS (со), <FS) таковы что Р-п. н. т j\A8(G>)\ds<oo, (7.101) о т [fis(co)rfs <oo. (7.102) о В том же случае, когда для почти всех s^T величины Д9(со) и Bs(co) являются ^-измеримыми, процесс Ито называется процессом диффузионного типа (определение 7, § 2 гл. 4). Для случая В5((о)=1 в теореме 7.12 были даны условия, при которых процесс Ито являлся в то же самое время и процессом диффузионного типа (по отношению к винеровскому процессу W = (Wt, #"1)). Для процессов (7.100) этот результат можно обобщить следующим образом. Теорема 7.17. Пусть £ = (&, #%) является процессом Ито (7.100) и v = (Vf, yt)9 0 ^ t ^T, —некоторый винеровский процессу не зависящий от винеровского процесса W и процессов А и В. , Пусть выполнены следующие условия: т [М|Л,(ю)|#<оо, (7.103) о т + Jm(Vb?(©),) | Л»|Л<оо, (7.104) о где {VMhY\ я?И>о, 0, В?(ю) = 0. Тогда найдутся: 1) измеримые функционалы А = (At (х), $t+) и B = (Bt (х)> 4St+), 0 < / < Г, удовлетворяющие Р-п. н. при почти всех 0 ^ / ^ Т равенствам . At (g) = М (At (со) | Р% Bt (Q = /efM", (7.105) и 2) винеровский процесс W = (Wt, &)'v)> 0</<Г, такие, что процесс I допускает представление t t lt = i0 + J A. (t) ds + f Bs (D dWs. (7.106) о о С В гйг-
312 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Если к тому же В/(со)_>0 Р-п. н. при почти всех 0</^Г, то винеровский процесс W согласован с семейством F =(#"*), Доказательство. В силу (7.103) М| At(a>) | < оо при почти всех t (без потери общности можно считать, что М| At(a>)\< оо при всех t, заменив, если это необходимо, At(a>) соответствующей модификацией). Тогда существование требуемого функционала А следует из леммы 4.9. Чтобы доказать справедливость второго равенства (7.105), достаточно убедиться в том, что величины В/(со) при почти всех 0^/^Г являются ^-измеримыми. Для этого разобьем отрезок [0, t] на п. частей, 0 е= ton) < ... ... <t{nn) = t> таким образом, чтобы max[//+i — /(/rt)J->0, /г~>оо. Рассмотрим сумму , Лп) , 2 л-1 и-1 •Лп) /«о L /+1 ' J /=о \,(ft) / Лп) Ч+\ Лп) 'ж + 22 J B'№dW')[ I ^HdH + 2 J Be(*)dW8\. /=0 \f(n) \tf> /=0 \Лп) (7.107) Первые два слагаемых в правой части (7.107) стремятся к нулю при п->оо с вероятностью 1, поскольку п-\ Лп) 'ж Лп) 'Ж J J As(a>)ds <maxj | As{a>) \ds • J | As{a>) \ds->0, /=o \» / ; Лп) о ,(я) oo. и аналогично д-1 *Ж /=0 \,</t) У \t(n) An) 4+\ < J I Л5(со) |ds-*0, /i->(h
§ 6] АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР ПРОЦЕССОВ НТО 313 Последнее слагаемое в правой части (7.107) может быть переписано с помощью формулы Ито в следующем виде: , An) /1-1 / '/+1 Е | B.{»)dW.)- /=0 \(п) An) An) п-\ '/+1 и-1 '/+1 = 2 | Bl{^)ds + 2^ | J Bu(*)dWu \B3(<*)dWa = /=0 t(n) /=0 t(n) \t(n) J t t = J B2S (со) ds + 2 J fn (s) Bs (со) dUT„ о о где s fn(s)= J Ba(*)dWu, tP^sKtfli. An) 4 Так как т т f /«(5) Bs (©) ds < (max sup fn (s)) • f Bs (©) ds -► 0, то P-lim Г fn(s)Bs((o)dWs = 0 и последнее слагаемое в правой п о t части (7.107) стремится по вероятности к Г B2s(a>)ds при /г->оо. о Левая часть равенства (7.107) при каждом п= 1, 2, ... является ^-измеримой. Значит, J Bs(co)ds являются ^-измеримыми о при каждом 0^/^Г. Отсюда (см. доказательство леммы 5.2) следует существование процесса В2 = (b2s (со), #"|), 0 ^ s ^ £, такого, что при почти всех 0<ls^/ В\(со) = В\(со) (Р-п. н.). Тогда существование искомого функционала В вытекает из леммы 4.9. Условия (7.103), (7.104) и равенства (7.105) гарантируют существование интегралов ( Bf(Qdls и J Bf (Q As(Qds.
314 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. ? Рассмотрим теперь случайный процесс W = (Wt, &~\'v)> определенный равенствами t t Wt = J* Bt (£) d\s -JBf (I) As (£) ds + 0 0 t + j[\-Bf(l)Bs(t)\dvs, /<7\ (7.108) и покажем, что процесс W является винеровским. В силу (7.100) и (7.108) t t Wt = J* Bf (|) Bs (со) dU7s + j Bt (I) [A, («.) - As (I)] rfs + о о t + j[\-Bt®Bs(t)]dvs. 0 По формуле Ито для s<t и (Tt-w8) = i + to J ^ <*«-*.)д+ (g) Btl (со) drB + о t _ __ + /2 | e'z (r«-^) [ 1 - Bt (|) B„ (g)J dvu + S + /г J е'г (^-^)B+ (g) [Au(Ш) - Л~ (I)] du - S t _ilj>(V^W (7.109) Поскольку винеровский процесс v не зависит от процессов W, А и В, то Р-п. н. М {At (со) | г\ v) = М (Л, (со) | Г\) = I, (g). Как и при доказательстве теоремы 7.12, вычисляя условное математическое ожидание М( -| #~s'v) от левой и правой частей (7.109), получаем t М (^^(^/-^) 15^1'v) == 1 — -^ J М (в£^^-^) | ^1'v)rf«.
§ 6] АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР ПРОЦЕССОВ ИТО 315 Отсюда M{etz(Wt2Ws}j\@~l'v) = e 2 *, что доказывает винеро- вость процесса W. Для доказательства представления (7.106) заметим, что в силу (7.108) t t t j Bs (I) dWs = J Bs (£) Bt (I) dls -JBt (Q Bt (I) As (£) ds = о о о t = l,-to-JAs(l)ds + b, (7.110) 0 где t £, = J [ 1 - fi. (6) Bt (£)] [dls - As (|) rfs]. 0 Покажем теперь, что процесс £ = (£,, #"|), 0 ^ ^ Г, является мартингалом. Действительно, в силу (7.100) t b=j[l-Bs(l)Bt®]Bs(«>)dWs + 0 t + j [ 1 - Bs (£) 5+ (1)1 [Л, (со) - As (I)] ds = 0 / = J 11 - Bs(l) Bt (I)] [As (со) - As (I)] rfs, (7.111) 0 поскольку {f 1 - Bs (I) fi+ (I)] Bs (co)}22 = [ 1 - Bs (£) B,+ (£)j Bs (g) = 0 и М[ |[1-БЛ1)^+(|)]ВЛ«>)^^) =0. Значит, при s</ согласно (7.111) м(ы^5) = = £* + МИ f 1 -ви(6)5?(91МЛ®)- ЛЛЮ1 du\ Р\\ = £,. Пусть т^ = inf {/ < Г: | & | > W}, причем т^ = 7\ если sup 1С, | < # • Ясно, что процесс (£, Л т » ^1) является квадратично интегрируемым мартингалом с t & лт„ = J Х{,<^} И[ 1 - В, (I) Bt (l)\[As (со) - А, (g)]ds. р
316 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Поэтому по лемме 7.1 £, л т =0 (Р-п. н.). На множестве (т^ = Т} Zt = ZtAlN = 0' 3наЧИТ> Р{8ир|^| = 0}<Р{т^<П->0, N-+oot (7.112) в силу непрерывности процесса £. Из (7.112) и (7.110) следует требуемое представление (7.106) для процесса £. Если же В/(со)>0 Р-п._н. для почти всех 0<t^T, то из определения процесса W следует, что Wt ^"/-измеримы при каждом 0^/^Г. 2. Непосредственным обобщением теоремы 7.1 является следующее предложение. Теорема 7.18. Пусть I = (£„ ^Г,) — процесс Ито с дифференциалом dlt = At(«>)dt + bt(l)dWt, (7.113) т) = (tj^, @~() — процесс диффузионного типа с dx\t = at (т)) dt + bt (л) dWt, т)0 = |0, (7.114) а 10 — &\-измери мая случайная величина с Р(|£0|<оо)=1. Пусть выполнены следующие предположения*. (I) неупреждающие функционалы at(x) и bt(x) удовлетворяют условиям (4.110), (4.111), обеспечивающим существование и единственность сильного решения уравнения (7.114); (II) для любого t, 0^/^Г, уравнение MaMu)=4H-Mg) (7.П5) имеет (относительно а^(со)) Р-/г. н. ограниченное решение] (III) P (J a2t(co)dt < оо ) = 1; (7.116) / T T v (IV) Мехр I- j at(<u)dWt — ± j a](<u)dt\ = l. (7Л17* V о о / 7Ъгда М»^ — М"п w Р"п- н- (Б) = М 1 ехр ( — | а, (©) rf^ — -1 / af (©) cf> Р\\. (7.118) Доказательство. Заметим прежде всего, что решение уравнения (7.115) может быть представлено в виде *t(<*) = bt(l)[At((>>)-at(m, (7.119)
§ 6] АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР ПРОЦЕССОВ НТО 317 где L-1 tf(B4 о 1Т1 <7120) 1 0, bt (I) = 0. Обозначим it = ехр I — J as (со) dWs — у J а* (со) ds J, dP (со) = ът (со) dP (со). По теореме 6.3 процесс t о является винеровским (относительно системы (#"*), О^^^Г, и меры Р). Имеем Р-п. н. t t 4>+jas(i)ds+fbs(t)dWs = о t = Лэ+ { as(l)ds+ j" bs(t)as(®)ds+ J bs®dWs = 0 0 0 = % + j4 (g) ds + J bs (I) bt (I) [As (со) - as (I)] ds + о о t t t + \ bs&)dWs = r\0+ J As(<*)ds+ \ bs&)dWs = tt. 0 0 0 Иначе говоря, процесс £ = (£,, fFt) рассматриваемый на вероятностном пространстве (Q, У, Р), удовлетворяет тому же самому уравнению, что и процесс t) = (ti„ ^Г,) на (Q, Т, Р). Поэтому в силу предположения (I) P(| e Л) = Р{т1е Л}, и, значит, |1п(Л) = Р{ЧеЛ} = РЙеЛ}= | Зг (со) rfP (со) = = JM(iT\Ft)^xdH(x). (7.121) Л Отсюда вытекает, что M-^^M-i и формула (7.118). Абсолютная непрерывность меры ц$ по \х^ доказывается так же, как И э теореме 7.1,
318 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ.7 Следствие. Пусть % = (%и ^"*), 0^/^Г,—процесс диффузионного типа с d\t = At (I) dt + bt (I) dWi9 t0 = % (7.122) (т. е. пусть в (7.113) At (со) = At (% (со))). Тогда, если выполнены предположения (I), (II), (IV) теоремы 7.18 и Р J ltf(S) iM&)N* < оо =Р J J \bt(t) as(t)fds < oo = 1, lo ) (о ) (7.123) то (ср. со следствием теоремы 7.1) Р-п. н. г т J-(g) = exp^-j Г Г d^-w=exp (bt(t)flAs®-as(l№s + т -i + Y J (k+ (I))2 W (6) ~ al (I)] rfs .' (7.124) о J 0 - | J (*s+(Tl))2[^(T))- as2(r))]ds . (7.125) о J Заметим, что входящие в (7.124) и (7.125) стохастические интегралы определены в силу эквивалентности мер \i\ и цл, условия (7.123) и того, что Р-п. н. j (6S+ (S))4 (^s (|) - as (|))2 bl (I) ds < J a2 (|) ds <oo. Пример. Пусть ! = (!<) и л^Л/)— Два процесса диффузионного типа с дифференциалами db — ltdt + ltdWt, io = Ti0, d^t = ^dWt, где Р(т19 = 0)>0. С помощью формулы Ито убеждаемся, что решения этих уравнений задаются формулами |/ = %exp(r( + y), T], = i)0exp(r,--|-).
§61 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР ПРОЦЕССОВ НТО 319 Условия теоремы 7.18, как легко проверить, выполнены. Поэтому Щ~М-т1 и Р"п- н- г т т (1[1Ц (т)) = ехр = ехр о т т J ^t^s—jj Wfds о т J(n,n.+)^.-Tj(n.n.+)rf* = ехр Vb+ \^t-Jo (7. 126) Но Р-п. н. ехР [л0Ло+ (^т - т)] =(1~ 'ПоО + Vtf ехр [т10л0+ (WT = (1 — ytf) + Vfe+ ехр (Гг - т) = (1 — Vtf) + < V Итак, Р-п. н. dm 3^(ii) = (1-ti0ii+) + ti0+% и, аналогично, d|i6 Vb,_(l-i0io+) + Io+ir Ш = (7.127) (7.128) Из (7.127) видно, что на множестве {со: |0 = ть = 0} а на {ю: |0 = т)0=йО} &Ю-1- 3. Для рассматриваемых процессов диффузионного типа приведем аналоги некоторых утверждений теорем 7.5 — 7.7. Теорема 7.19. Пусть ! = (£,) и r\ = {r\t), O^t^T. — dea процесса диффузионного типа с d%t = At{l)dt + bt{QdWt, |о = % df\t-=at{r^dt-\-bt{x^dWt. (7.129) (7.130) Пусть выполнены предположения (I), (II) теоремы 7.18 (с Л,(©)-Л,(6Й)).
[ГЛ. 7 320 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР Тогда, если Р f {bt (l)f [A2S (I) + a2s (I)] ds < oo U f T = P f (bf (л))2 [Al (n) + a\ (n)] ds < о lo 70 \x\~\1Ц и плотности --;—, -j— задаются формулами (7.124), (7.125). ^ N Доказательство. Положим = 1, (7.131) *п(х) = inf < < Г: J {bf(x) [As (x) — as {x)])2 ds>n о T Г, если J (6S+ (л:) [As {x) — as (л:)])2 ds < n, %(tn) (x) = %{Xn ix)>ty Af (x) = at (x) + y}tn) (x) [At (x) - at (*)]. Рассмотрим процесс 1{п) = (^rt), #",), 0 ^ t ^ Г, определяемый равенствами t tf" - 6, л t. «, + J П - X?» Ю] fl, ft01») ds + 0 t + j[l-tin)(t)\bs(t{n))dWs. (7.132) 0 По теореме 4.8 уравнения (7.132) существует единственное сильное решение, причем ^я) = ^ при t^xn(Q. Учитывая это обстоятельство, с помощью формулы Ито находим, что d%{n) = А{п) (6(Я)) dt + й/ (&(я)) dr<| g(«) = ^ (у. 133) Поскольку Af(x)-at(x) = %f(x)[At(x)-at(x)], то Р-п. н. jibtieW^tn-aAtWdtKn,
§6} АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР ПРОЦЕССОВ НТО 321 и согласно теореме 6.1 г т М схр \-\bt few) [AT (tn)) - at (П\ dWt - I о т -jjibtiewin-a^Wdt О С учетом теоремы 7.18 отсюда заключаем, что и^л^И-п и d ( т -^ (л) = ехр П (&,+ (т,))2 [ АГ (т)) - at (т,)] А,, - V (о T ] -^(^(^[(^'(^-(аЛт,))2]^: о j (^+(л))2[Л(л)-^(л)]^- = 1. = ехр о -Т J (^(^WW-^dOlA |— *ГЛТЛ(Т1) (Л)- Пусть теперь Ге^г. Тогда в силу (7.131) II* (Г) = lim ц6(Л) (Г П (тЛ (л:) = Т)) = = Hm J *ГЛТП(*)М<*М*) = * ГП(тя(*)-Г) = lim J у (х) d^ (х) = J Jr (*) й|хч (x). ГП(та(*)=Г) ф| Значит, M'i<M'Ti и -д(х) — $т(х). Поскольку же \1^(х: Зг(л:) = «ь=0) = 0, то по лемме 6.8 и^См* и Теорема доказана. Теорема 7.20. Пусть выполнены предположения теоремы 7.19, за исключением условия (7.131), которое заменяется условием Р \ j(bt(Z)?[A2s(l)+aUl)Us < оо = 1. (7.134)
322 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [1"Л. 1 d[i% Тогда [i| < \хц, плотность }, (r\) = -g— (t, т)) является единственным (непрерывным) решением уравнения t It ft) = 1 + / is ft) № (Л))2 \А, ft) - as Ш dru, (7.135) О a it(l) определяется формулой It j(bf(l))2[As(t)-as(l)}dh- О t -^j(bt(l))2[Al(l)-a2s(l)]ds (7.136) Доказательство этой теоремы аналогично доказательствам теорем 7.19, 7.2 и 7.6. 4. Остановимся, наконец, на многомерных аналогах теорем 7.19 и 7.20, ограничившись лишь их формулировками. Пусть l = (lt) и т) = (т),), 0 < f < Г,—-векторные процессы, h = (h(t), •••> ln(t))> 4/ = (4i(0i •••. Л* (')). имеющие дифференциалы dr\t = at(vi)dt + bt(vi)dWti где Wt = (Wx (t), ..., Wk (/)) — /г-мерный винеровский процесс относительно системы (#~,), О^^^Г, ЛДлг) = (Л1(^, л:),... ..., An(t, *)), at(х) = (а{ (t, х), ..., ап(1, х))9 bt(x) = \\bif (t, x) ||— матрица порядка /гХ& и т)0 = (тц (0), ..., T)«(0))—вектор начальных значений с PlSlfyK00)—!• Будем предполагать, что система алгебраических уравнений bt(x) at{x) = [At(x) — at(x)] имеет (относительно at(x)) ограниченное решение при каждых t> 0<t<Ту xgC, Функционалы at(x) и bt(x) удовлетворяют (покомпонентно) условиям (4.110), (4.111). Тогда *), если Ц|-п. н. т J [А\ (х) (bt (х) Ы (х))+ Аг (х) + а\ (х) (bt (х) Ъ\ (х))+ at (x)] dt < оо, (7.137) *) Матрица R+ является псевдообратной по отношению к матрице R (см. гл. 13, § 1).
§71 ФОРМУЛА КАМЕРОНА - МАРТИНА 323 то \i\ <С м-тг Если к тому же (7.137) выполнено и \1ц-п. н., то It \ (Asft)-as(4)Y(Ь,ft) йft))+ dn,- —g- J (Л* (Л) - «* W)* (** (^ «ft))+ (As ft) + а, (n)) ds \, (7.138) о ) It - J (Л, (£) - as (I))* (6, (I) « (I))+ rf|s + 0 t | + у J" (As (I) - a, (1))* (b. (t) К (l))+ (As (£) + a, (I)) rfs . (7.139) § 7. Формула Камерона — Мартина 1. Пусть W = (Wt> yt) — /г-мерный винеровский процесс, А?, = (№,(*), ..., Wn(t))y и Q(0 —симметрическая неотрицательно определенная матрица, элементы которой цц (/), i% /==1, ..., /г, удовлетворяют условию Т п I 2 I ?!/(') 1Л <оо. (7.140) о t, /=i Используя результаты § 2 (п. 7), установим следующий результат, известный как «формула Камерона — Мартина». Теорема 7.21. Пусть выполнено условие (7.140). Тогда Мехр 1 -1 р л j(Wt, Q(t)Wt)dt\=exp\±jSvr(t)dt , (7.141) где (Wt, Q(t)Wt)~ скалярное произведение, равное W\Q{t)Wu а Г (t)—симметрическая неположительно определенная матрица, являющаяся единственным решением матричного уравнения Риккати ^p- = 2Q(t)-r4t), (7.142) Г (Г) = 0 — нулевая матрица. Доказательство. Рассмотрим уравнение Риккати ^f.^2Q(T-s)-f2(s) (7.143)
324 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 с нулевой матрицей Г (0). Единственность решения этого уравнения в классе неотрицательно определенных матриц доказана в теореме 10.2. Существование непрерывного решения f (/) = || у*/(011 можно вывести, например, из решения некоторой вспомогательной задачи фильтрации (см. § 3 гл. 10). Положим Г(/) = — Г (Г — f). Непосредственно проверяется, что Г(/) удовлетворяет уравнению (7.142), решение которого единственно в силу единственности решения уравнения (7.143). Пусть теперь h = (h(t)> •••> ln(t)) — случайный процесс с дифференциалом dlt = Г (t) lt dt + dWi9 Ь - 0. (7.144) Согласно теореме 4.10 сильное решение уравнения (7.144) существует, единственно, определяется формулой (4.158) и Р J &r*(t)ltdt < оо =р И WlT*(t)Wtdt < оо = 1. Используя многомерный аналог теоремы 7.7 (см. также п. 7 § 2), находим, что \it~\iw и dvw Поэтому ! j W*sT(s)dWs-± j W*sr2(s)Wsds\. (7.145) M exp J j WIT (s) dWs - -j [ WIT2 (s) Ws ds (o 6 По формуле Ито (см. гл. 4, пример 2, (4.102)) т 0=^[W*tT(T)Wt-W*oT(0)W0] = j j (Wt-^^W о т т . + j mr(t)dwt + ± j sVT(t) dt; Отсюда на'ходим т J* WW (t) dW, = у J w't ^sp-Wtdt - j J* Sp Г (t) dt.
§8] НЕРАВЕНСТВО РАО - КРАМЕРА - ВОЛФОВИТЦА 325 Подставляя это выражение в (7.145) и учитывая, что в силу (7.142) ^*ZM + r*(t)] = Q(t)9 получаем" l = expj-4JSPrW^ MexpUj W;[^+THt)]wtdt\^ = expl - j j Sp Г (t) dt\ M exp j | J Г& (f) Г, dM, (7.146) I о j ( о J что и доказывает формулу (7.141). Пример 1. Пусть л=1, Q(t) = -^. В этом случае уравнение -^Р-=1-Г2(0, Г(Г) = 0, имеет решение Отсюда получаем г(0 = #«-т) + { 1|г(/)Л = 1п(сЬГГ,/2> о и, следовательно, Мехр | т ч -iiwUtrykf- (7Л47) § 8. Неравенство Рао — Крамера — Волфовитца 1. В задачах оценивания параметров существенную роль играет неравенство Рао —Крамера и его обобщение, данное Волфовитцем для случая, когда длительность наблюдения является случайной величиной. В настоящем параграфе будет показано, как полученные выше формулы для плотностей мер процессов диффузионного типа могут быть применены при отыскании нижних границ среднеквадратических ошибок в некоторых задачах оценивания неизвестных параметров.
326 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 2. Будем предполагать, что 9 есть неизвестный параметр, — оо<6<оо, и f = f(Q) — функция, оцениваемая по результатам наблюдений за случайным процессом £ = (£*), t^O, имеющим дифференциал d\t = at (9, I) dt + dWu t0 = 0. (7.148) Измеримый функционал {a*(9, x), t^0f — oo < 9 < oo, jcgC) предполагается (при каждом фиксированном 9) неупрежда- ющим, т. е. ^-измеримым при каждом ^0, где $t = o{x: xSi s^t} — a-подалгебры в измеримом пространстве (С, $) непрерывных функций x = (xt)y t^O с л:0 = 0. Пусть х = х (х) — марковский момент относительно системы (i%t)> t^O, и 6 = (6(/, л:)) — прогрессивно измеримый (и, следовательно, неупреждающий) действительный процесс, определенный на (С, ЗВ). В дальнейшем величина 6(t, х) будет рассматриваться как оценка функции /(9) на основании наблюдений за траекторией х на интервале времени [0, t]. Если х = х(х)— марковский момент, то величина д(х(х)> х) будет задавать оценку функции /(9) по результатам наблюдений за траекторией х на временном интервале [0, х(х)]. Пара функций Д = (т, б) задает, как принято говорить, последовательный план оценивания. При ряде предположений регулярности, сформулированных ниже (теорема 7.22), для последовательных планов Д = (т, б) будет получено (при каждом 9, — оо < 9 < оо) неравенство, аналогичное неравенству Рао — Крамера — Волфовитца, которое дает оценку снизу для величины М[/(9)-б(т, I)]2. 3. Остановимся вначале на используемых далее обозначениях и предположениях. Пусть \iw и ц| обозначают меры в пространстве (С, 3$), отвечающие соответственно винеровскому процессу W и про* цессу I с дифференциалом (7.148) для данного — оо < 9 < оо. Пусть оо а) J" \at (9, х)\ dt < оо (ц^- и ц|-п. н.), — оо < 9 < оо; о б) [ а? (в, x)dt<oo ((iv- и jig-п. н.), - оо < 9 < оо. 6 Из условий а), б) и теоремы 7.10 вытекает, что при каждом 9 меры |и| и \xw эквивалентны и плотность ф(9, Ц7)=»
НЕРАВЕНСТВО РАО - КРАМЕРА - ВОЛФОВИТЦА 327 d*l = ^-L(^(W)i W) задается формулой {х(Щ x(W) . \ at(b,W)dWt-±\ а*(в,1Р)л1. (7.149) Это представление будет играть центральную роль при полу* чении нижней границы для М[/(8) —6(т, £)]2. Предположим также, что в) при каждых t^O и хеС функция а/(8, л:) дифференцируема по 8 и x(W) "J [4"a'(9> W)]~dt <oo (Р-п. н.), -оо<9<оо, о т(6) 0<М| [-^-^(8, g)]2Л < оо, -оо<8<со; о г) -jg- J at (9, IT) dlP, = j" -^- a, (9, IF) dWt (Р-п. н.), 0 — oo<e<oo, -|- J a? (8, Г) Л = 2 J4 (в, W) ^ a,(6, Г) Л (Р-п. н.), о ' о — со <8<оо; д) функции f(Q) и &(в) = Мб(т(Г), Г)ф(в, Г) -/(6) диф* ференцируемы по в и -Ж[Ь(9) + /(9)] = Мб(т(W), W) d(ffQW) . 4. Теорема 7.22. Пусть А = (т, б) — последовательный план оценивания с-Мб2(т, |) < оо для каждого 8, — оо < 8 < оо. Тогда, если выполнены условия регулярности а) — д), то для каждого в, — оо < 8 < оо faim + twif М [f (9) - б (т, £)]2 > -Члв - + & (9). (7.150) м1 [жв'И»Гл
328 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР (ГЛ. 7 Доказательство. Согласно предположениям г), д) и представлению (7.149) для каждого 8, — оо < 8 < оо, те[* (6) + f (6)] = Мб (т (П W) d<f(%w) = = Мб(т(W), W)\j -§6 [а<(6, Г)]dWt~ - J 0,(8, W)-^-[at(Q, W)]dt\ Ф(в, W) = о ' i T(I) = Мб(т(£), £) H -^-[a((e,I)]^- 0 t(6) ч T(6) 0 ^ 0 (7.151) Далее, в силу в) 41) Мб (т (|), |) • М J -|д- [a, (9, |)] <ЛР, = 0, (7.152) О что вместе с (7.151) приводит к соотношению t(6) ^.[6(е) + /(в)]=М[б(тШ, 6)_Me(T(g)f э] J -gg-Me, Э1^. о Отсюда согласно неравенству Коши — Буняковского, предположению в) и свойству стохастических интегралов получаем (^[fr(e) + f(e)])2< т(5) < М[б(т(|), |)-Мб(тШ, |)РМ J [4-а*(°. E)]2^e ' О = М J [^ а, (8, у]2 Л • {М [б (т (6), 6) - f (в)]2 - б2 (в)}, t(6) что в силу предположения М | "Ж М*Э> Щ dt >0 приводит о к требуемому неравенству (7.150).
§ 9] АБСТРАКТНЫЙ ВАРИАНТ ФОРМУЛЫ БАЙЕСА 329 Следствие. Если план Д = (т, б) является несмещенным, т.е. 6(9)=М6(т, %) — /(в) —0 для всех 9, — оо < 0 < оо, то [4ё /(e)]2 М [б (т, I) - f (9)]2 > —ТШ ; (7.153) м| [-§д-««(в. l)J dt о В частности, если /(0) = 9, то М[б(т,|)-е]2>-—Е ! _. (7.154) О Пример. Пусть наблюдается случайный процесс lt = Qt + Wh t>0, -оо<9<оо. Тогда для несмещенных последовательных планов оценивания М[6(тЛ)-е]2>-й^. (7.155) 8 частности, план А° = (т°, 6°) с i°(x)=T и 6°(Г, х) = -у- является несмещенным. Для него выполнены все условия теоремы 7.22, и поэтому для него М[б°(Г, £)-9]2>у. 1 г- ? На самом деле левая часть равна у, поскольку М -у 9 = = М \-уН = у- Это означает, что среди всех несмещенных последовательных планов А = (т, 6) с Мт(£)^Г (для всех — оо < 8 < оо) и удовлетворяющих условиям теоремы 7.22 план Д° является оптимальным: для всех 8, — оо<9<оо, М[6(т, £)-9]2>М[6°(7\ £)-9]2. Другие примеры использования неравенства (7.150) в задачах последовательного оценивания будут рассмотрены в гл. 17. § 9. Абстрактный вариант формулы Байеса 1. Пусть (Q, У, Р) — некоторое вероятностное пространство, 9 = 9 (со) и g = g (со) — случайные элементы со значениями в измеримых пространствах (в, $0), (X, 38х). Пусть Уь = а{со: 9 (со)}, ^-^==а{(о: |(со)} и Q — сужение меры Р на (Q, 9Г$. Обозначим Q (Л; со) = М [хл (©) I P'q] (©) условную вероятность события
330 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 А ^ У\. Ясно, что для данного A ge ЭГ\ Q(A)=JQ(A; co)P(dco). (7.156) Если 0 и g являются случайными величинами, принимающими лишь дискретные значения, и M|g(8)|<oo, то при отыскании условных математических ожиданий M[g(8)|g] основным орудием является формула Байеса ^g(ai)p(l\ai)P(ai) M[g(e)||]= ' , (7.157) 2j P (61 ai) P (ai) i где p(b\a)=*P{l = b\Q = a}, P(a) = P(Q = a). Для случая, когда 8 и | являются случайными величинами, у которых функции распределения имеют плотности, формула Байеса принимает следующий вид: 00 J *(a)p(||a)p(e)da M[g(9)U] = ^ , (7.158) J P (I I a) p (a) da — CO rzep(b\a)=dP{i<dbblQ = a) , p(a) = dP(9<a)/da. В дальнейшем нам неоднократно придется иметь дело с абстрактным вариантом формулы Байеса, обобщающим формулы (7.157), (7.158). Пусть 8 = 8 (со), g = g (со) — случайные элементы со значениями в (0, #е), (X, #д) и М | g(8) | < оо. Положим для А^.&"х G(A)=$ g(Q(&))Q(A; ffi)P(dffi). (7.159) Лемма 7.3. 1) Функция Q = Q(A), /1g^, определенная в (7.159), является обобщенной мерой (счетно-аддитивной функцией множеств А е $Г\, принимающей, быть может, значения разных знаков). 2) Обобщенная мера G абсолютно непрерывна по мере Q: G<Q. 3) Имеет место формула (Байеса) M[g(8)|^](co)=^(co). (7.160)
§ 9] АБСТРАКТНЫЙ ВАРИАНТ ФОРМУЛЫ БАЙЕСА 331 Доказательство. Первые два свойства непосредственно следуют из (7.159). Докажем формулу (7.160). Поскольку M[g(9)|#"|] является £Г|-измеримой функцией, то надо проверить лишь равенство MbW М [£(9)| ^]} = О(Л), А е= Гг. (7.161) Имеем М {%А (со) М [g (9) | Г$ = М {М [%А (со) g (9) \Р$ = = МХл(ш)£(9) = М{£(9)М[х^ Лемма 7.4. Предположим, что условная вероятность Q(Л; й) является регулярной*), о-алгебра ff'i сепарабельна**) и существует мера Х = Х(А) на (Q, ff'i) такая, что для почти всех SgQ Q(-, ©)<*(•)• (7.162) Тогда Q < Я, G < % и на пространстве (Q X Й, У г X #"е) существует неотрицательная измеримая функция ^(со, й) такая; что Р-п. н. Q (Л; й) = J q (со, й) ЙЯ (со), (7.163) А ^ (со) = J g (9 (©))■? (со, й) Р (rfffi). (7.164) *L(a)= $ д(ф, S)P(rfffi), (7.165) Q 0<-ж-(со)<00' (7Л66) j*ff (в (©))?(©, u)P(rfu) M[g(6)|^]((o) = ^-- . (7.167) <7 (со, ©) P (d©) Q Доказательство. Существование измеримой функции q(со, й), удовлетворяющей равенству (7.163), вытекает из регулярности условной вероятности Q{A\ й) и сепарабельности а-алгебры #"$***). Для доказательства (7.164), (7.165) достаточно применить теорему Фубини. •) См. п. 4 § 1 гл. 1. **) См. [46], стр. 555. **) Доказательство этого факта дано в [46] (пример 2.7, Дополнение),
332 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Далее, пусть Л0==|со: — ((о)==0>. Тогда, поскольку Л0е#"$, то Р (Л0) = Q (Л0) = Jig- (со) dX (со) = 0. А, Следовательно, -^-(ю) > 0 (Р-п. н.). Для доказательства (7.167) заметим, что поскольку G < Q, G < Я, Q < Я, то dl ~ dQ dX ' Ho -jT- > 0 (Р-п. н.), поэтому dG t \ d(* i \ / dQ , ч что вместе е (7.160), (7.164), (7.165) доказывает искомое представление (7.167). Замечание 1. Если функция g — g(£, 8) такова, что M|g(£, в) |< оо, то / 8 (I (»), в (5)) q («, 5) Р (rfu) М [g (I. 9) I S"el («>) = ? . (7.168) q (со, со) Р (dco) а Действительно, если функция g(£, 8) представима в виде g(h 6)= 2Ф*(6)й(в), то формула (7.168)ч следует непосредственно из (7.167). Очевидным предельным переходом (7.168) распространяется и на произвольные (измеримые) функции g(8, I) с M|g(£, 8) |< оо. Замечание 2. Обозначив / ~\ ? (О, ©) р (со, 0) = • ^-^—z <7 (©, ©) Р (^©) получаем для формулы Байеса (7.168) следующее удобное представление: М [g(t, 8)| ^](со)= J £(£(©), 8(0))р(со, fi)P(dfi). (7.169) 2. Рассмотрим подробнее структуру формулы Байеса (7.169) для того случая; когда | является процессом Ито.
§ 9] АБСТРАКТНЫЙ ВАРИАНТ ФОРМУЛЫ БАЙЕСА 333 Будем предполагать заданным вероятностное пространство (Q, #", Р) с выделенным на нем семейством а-подалгебр (#"*), t^T. Пусть W = (Wt((u)j STt) — винеровский процесс и а = = (^((0), &~t)— некоторый не зависящий от него процесс, траектории которого a = (at), 0^/^Г, принадлежат измеримому пространству (Аг, $\т). Рассмотрим непрерывный случайный процесс £ = (|j, &~t)> O^t^T, имеющий дифференциал dlt = A(t,a,l)dt + B(t9l)dWu %0 = 0. (7.170) Будем считать выполненными следующие условия: A. Случайный процесс | = (Ь, (©)), О^^^Г, является сильным (т. е. У? ^-измеримым) решением уравнения (7.170). B. Функционалы Л(/, а, л:), B(t,x) являются неупреждаю- щими, и для каждых asAr и ^gCf ((Сг, $т) — измеримое пространство непрерывных на [0, Т] функций x = (xt)9 0^t^.T) т т $\A(t, a, x) \dt < oof j B2(t, x)dt < oo. (7.171) о о C. Для любых х и х из Сг t \B(t,x)-B(t,x)\2^Llj\xs-xsUK(s) + L2\xt-xt\\ (7.172) о t B*(t, *)<L, J* (1 +x*)dK(s) + L2(1 +4), (7.173) о £2(/, *)>C>0, (7.174) где K(t) — неубывающая непрерывная справа функция, 0<! ^K(t)^l, а С, Lu L2 — константы. D. Р МЛ2(и,^Коо =Р J A2{t,a,r\)dt< оо|=1, (7.175) где i\ = (i)t, &~f) — сильное решение уравнения dr]t = B(t,r\)dWi, 110 = 0, (7.176) существующее в силу теоремы 4.6 и предположения С. г /г \ E. JM\A(t,a,l)\dt<oo, РП A2(t,%)dt<oo =1, о \о . / (7.177) где A(t,l) = M[A(t,a,l)\^].
334 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Обозначим \iv \1Ц и \ia меры, отвечающие введенным процессам g, г\ и а. Пусть также \ia ^ — распределение вероятностей в пространстве (Ат X Сг, $аг X $т), индуцированное парой процессов (а, £), и \ia Хм-*— декартово произведение мер \ха и \ir Теорема 7.23. Пусть gT (a, £) — £Г^> ^-измеримый функционал с М| gT(а, I) |< оо. Тогда, если процессы а и W независимы и выполнены условия А — Е, то Р-п. н. М [gT (а, g)| ^|] - J йгг (а, а РГ (*. Б) <fo« (*). (7-178) А где Рг (а**}=ж**з{а> х)^{х)> (7,179) «р« згол< (Р-п. н.) Рг (а. I) = 7 71 -гтгп! Г ^(^И-Л(и)# 1 f [A (t, а, I)-АУЛ)]2 Л -ехр J вал) dWt~^) ЩГТ) dty (7.180) где функционал A = (A(t, x), $t+), 0</<Г, такое, что Р-п. н. для почти всех 0 ^ / ^ Т АУЛ) = ЩА«,а,1)\&~)], (7.181) и W = (Wt, &~\) — винеровский процесс с t Wt=\dls~BA(^)ds . (7.182) О Для доказательства представления (7.178), которое, по существу, если не что иное, как другая форма записи формулы Байеса (7.169) (с заменой интегрирования по пространству элементарных исходов интегрированием в функциональном пространстве), понадобится ряд вспомогательных утверждений. 3. Согласно предположению А непрерывный случайный процесс l = (lt), 0</<7\ является сильным решением уравнения (7.170). Пусть t фиксировано. Поскольку при фиксированном t величина \t является !ГЧ' ^-измеримой, то найдется (при данном /) измеримый функционал Qt(a, x) такой, что Р-п. н. bH«Q,(a(a>), И7(а>)). (7.183)
§ 9] АБСТРАКТНЫЙ ВАРИАНТ ФОРМУЛЫ БАЙЕСА 335 Рассмотрим для asAr процессы ga = (g^(со)), 0<?<7\ определяемые уравнениями йЦ = А (/, a, la) dt + B (t, la) dWv Ц = 0. (7.184) Покажем теперь, что при фиксированном t \ia X Р-п. н. Ц (со) = Qt(a, W (со)). (7.185) Будем считать, что исходное вероятностное пространство (Q, &% Р) таково, что Q = Аг X Сг, 0" = $аг X Яг, Р = \ia X tV- (Это предположение не ограничивает общности, но упрощает рассмотрение.) Тогда, считая co = (a, W), a(co) = a, W(®) = W, видим, что равенство (7.185) справедливо jiaX[%-n. н. в силу (7.170). Введем наряду с исходным пространством идентичное ему пространство (Q, iT, P). Пусть £(©), W(&), a (5) —процессы, рассматриваемые на (Q, #\ Р) и имеющие те же самые (совместные) распределения, что и у процессов £(©), W (со), а (со). Рассмотрим на (Q X 2, ^ X #", Р X Р) процесс £a (G» (©) = = (£?(<D)(S)), 0</<Г, с rfga (а» (5) = л (/, а (со), £« И (5)) Л + Б (/, £<* <»> (5)) d Г, (©), go(«)(u) = 0. Тогда в силу (7.185) РХР-п. н. £«<">(©) = Q^a (©),№(©)). (7.186) Лемма 7.5. Пусть процессы а(а>) и W (со) независимы. Тогда для любого Л£|г (Р-п. н.) Р {£(©) €= Л \Ут} = Р{1аШ(&) s Л}. (7.187) Доказательство. Из теоремы Фубини следует, что вероятность Р {б« (©) < 6} = Р {Q, (a, W (©)) < 6} = \iw {x: Qt (а, *) < Ь}9 (7.188) рассматриваемая как функция аеАг, является ^Аг*измери- мой. Следовательно, Р(|"(б)^6} является ^-измеримой функцией от а. Покажем, что Р-п. н. Р (б, (со) < Ь\ Гат) = Р {I?™ (©) < b]. (7.189)
336 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 Пусть Я (а (со)) — #~г-измеримая ограниченная случайная величина. Тогда по теореме Фубини МЯ (а (со)) щ ((D) < ь) И — $ J* % (a) X{Q,<*, *) < щ (*) d\ia (a) d\iw (x) = ат ст = J А* (а) | J X{Q,(а, я»<&} (*) d\xw (*) 1 d\xa (a) = А7- LCf J = |Я(а)Р{|«(й)<6}^о(а) = М[А(а((0))Р{|«"в)(й)<&)]1 Ay где мы воспользовались равенством (7.183). Следовательно, М [Я (a(a>)) P {g?W (в) О}] - MMa(0))jCfo(e)<4 И» что и доказывает (7.189). Аналогично доказывается, что для любых — оо < Ь% < оо, /=1, ..., л, 0</,</2< ••• <tn<T Р-п. н. p(^W<»i Ья(»)<ья\г"т}- = P{^(<d)(S)<6p ..., £^(*><М' (7Л90) откуда следует требуемое равенство (7.187). В следующих двух леммах будет показано, что \iat i~\ia X M-n> M'S^M'ti» и найдены плотности этих мер. Лемма 7.6. Пусть процессы а и W независимы. Тогда в предположениях А — D Ha,l~l*aXl*n (7.191) и Р-п. н. } A{t, а, ц) А 1 Г£^*П).Л ■о о J (7.192) Доказательство. Рассмотрим введенные выше процессы %а (со) = [|а (со), 0 < t < Т] и покажем, что ца Хц ц-п. н- ,. а-1 , (а, х) = -г1- (ж). (7.193)
§ 9] АБСТРАКТНЫЙ ВАРИАНТ ФОРМУЛЫ БАЙЕСА 337 Пусть множество Г = П X Г2, Г\ <= $дг, Г2 е ^j. Тогда в силу предыдущей леммы И«.б(Г)«Р{©: a(®)esrlfg(o>)e=r2} = = J Р U (©) е ГЯ| 3~т) dP (со) = J Р {Г (5) г Г2) фа (а) = {©: а (©) s TJ Г» = |^(r2)djia(a). (7.194) г, Согласно (7.185), сделанным предположениям А — Ей теореме 7.18 для ца-почти всех а ц^а^ц^, причем (и^-п. н.) 11 \о о / Поэтому из (7.194) вытекает, что *V 1^ = ! На (Г2) dK W = J N -^Г W ^i W ^(a) = Г, Г| L Г2 *» J r,xr2 ^ Следовательно, jLia-g <C M-a X цч и имеет место (^Х^-п, н.) равенство (7.193). Наконец, согласно (7.195) ( d[kia \ l*oX(i4ia. *: -3£-(х) = 01 = °> поэтому по лемме 6.8 \ia X М-n ^ М-a, *• Лемма 7.7. Пусть процессы а и W независимы. Тогда в предположениях А — Е щ ~ \хц и ЪГ м = J rf[^xl](a' *)dMa)' ^п- н- (7Л96) Г $с»-«р{/^*»-т/тМ* • (7-197) где Л(/,*)=М[А(^а,|)|01]6_ж- Доказательство. Обозначая Ф (а, л:) = -л—^т—т (а> *)>
338 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 находим, что для Г е $т МГ)= \ ^ с1\1аЛ(а, х) = J* ф(а, x)d[\iaX^](a, х) = Aj- Г АГХГ = J I J ф(я> *)^[Ха(я)1 dp^x). Г |_АГ J .AT Поэтому ц,£ << jn^. Аналогично показывается, что \хц < ц^ причем ^W-M{-^(*Ol^}iV Из эквивалентности мер ц, и ц и предположения следует, что и РМ/2(М)Л<оо) = 1 Р( J A2(t,r\)dt< оо ) = 1. Применяя теорему 7.19, получаем формулу (7.197) и также представление ^-(i) = expj-J ^F_irdb + TJ -gr^-tfj. (7Л98) 4. Доказательство теоремы 7.23. Из непрерывности процесса g следует, что a-алгебра #"|. сепарабельна. Далее, поскольку процесс g является непрерывным, то у условной вероятности М [%А (со)| <Ге] (со) существует *) регулярный вариант (который обозначим Q (Л, со)). Пусть множества Л е #"| и BGly связаны соотношением Л = {й: £ (&) е В}. Тогда (Р-п. н.) Q (Л, 5) = Р {Л| &~ат] (5) = Р {fi: g(5) е= В| *-?} (5) = -Р {со: f <•> (со) е В} = J %^ (*) <Ц(*)« J %^- (S (со)) dP (со). в * л € *) См., например, [13], [37].
§ 9] АБСТРАКТНЫЙ ВАРИАНТ ФОРМУЛЫ БАЙЕСА 339 Обозначим <7(со, й) = —^—(К®))- Тогда согласно (7.168) J gT (а (со), 6 (со)) ^ (g (со)) dР (со) М[вгг(«-6)1^]-- Г^^ ' • (7Л99) dV>l Но Ц5 ~ Ц^ И (Р-П. Н.) Hjafu) ~ (*|. ПОЭТОМУ ~fcr(| И)=~^г(| (<й))" ^г(| И)' что после подстановки в (7.199) дает Г dP*a№ J £r (a (со), l (со)) -^ (6 (со)) dP (со) M[er(af0|^]—S -^ f d*V(a>) » -ч Учитывая равенство (7.193) и обозначение (7.179), отсюда находим, что J «г (-W. бС))^;^, С (•).«•))*•(•) e J St (a (5), | (©)) pr (a (ffi), g (©)) dP (ffi) = a = J ёт (a. I («>)) Pr («> I H) Фа («)• Ay Это и доказывает формулу Байеса (7.178). Формула (7.180), дающее представление для pr(a, х), вытекает из (7.192), (7.196) и (7.197). Отметим, что справедливость формулы Байеса (7.178) можно установить прямыми подсчетахми, не обращаясь к общей формуле (7.168). Действительно, во-первых, случайная величина J £г(я> £(й>))рг(а, | (со)) d\ia (а) является ^-измеримой. Далее, А
340 АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ МЕР [ГЛ. 7 пусть к(1) = М£(<о)) является ^Fj-измеримой ограниченной величиной. Тогда М [ft (a, g) Я (£)] = М [d[^BxNl («. Л) £г (а, Л) Я. ft)] = -м[мл)м{11^г(«,п)&(«.л)1^?}]. Но процессы а и т) независимы. Поэтому = . J ч[цаХЫ {а' ^8т{а' ^d^{а)' Ау и, следовательно, М [ft (a, a* (£)] = М Гя (т)) J Д[^УМ (а, т)) ft (а, т)) d|ie (а) 1 - -м [я ® А J ^Ь"(а> 1) ёт (а* °*• (а) tt ®] - eMh(8 | ft (а, 6) рг (а, 9 </ца (a) j> откуда и вытекает формула (7.178). Замечание 1. Из доказательства теоремы 7.23 видно, что можно отказаться от условий А и С в ее формулировке, если имеет место эквивалентность мер \iat% и \ia X М-п и справедлива формула (7.192) для плотности. Замечание 2. Пусть существует регулярная условная вероятность na|So, отвечающая процессу а при заданном |0. Если в (7.170) и (7.176) g0 = Ло = ?э где Р(|£|<оо)=1, то аналогично доказывается, что м [£Г (а, а I гц = J ft (a, а рг («. а <fo« i«. (*) (7-20°) АГ (ср. с (7.178)). Эти замечания используются далее в лемме 11.5. Замечание 3. Формула (7.178) с рт (а, I) из (7.180) остается справедливой, если вместо условия D потребовать лишь, чтобы Р | j Л2 (/, a, %)dt< оо | = 1.
§ 9] АБСТРАКТНЫЙ ВАРИАНТ ФОРМУЛЫ БАЙЕСА 341 5. Имея в виду обозначения (7.179), находим, что Р(аг<&|01)= Jx{„ 0}(*)Рг(а, 6)<*Ма). (7-201) АГ Заметим, что *) J Х{«.гО>Ма. 1)^а(а) = М[Х{0г(а)<ь)Рг(а(й))> g(©)] = А = ^ [V (*>)<*} М (Рг М®)' S (©)) I ат (©))]. Поэтому из (7.201) находим Р (аг < Ь | #"|) = j M [рг (а (5), | (со)) | аг (й) = a] dF ^ (а), (7.202) — 00 где Faj. (а) = Р (ат < а), aei?1. Если, в частности, Faj. (а) имеет плотность paj. (а), то Р(а,<&|#"!)= |М[рг(а(5), i(cu))|ar(u) = a]par(a)da. (7.203) — оо Следствие 1. Если случайная величина ат имеет плотность распределения вероятностей ра (а), то тогда и апостериорное распределение Р(аг<&|#~£) также имеет (Р-п. н.) плотность . dP (ат < ЬI ^1) ^ ^ ' ^ = Раг (6) М [рг (а (й), \ (а>)) | аг (й) = Ь\ (7.204) £сли же случайная величина ат принимает конечное или счетное множество значений bu b2, ..., то Р (ar = bk | F\) = p„r (bk) M [Pr (a (5), g (со)) | ar (5)) = bk], (7.205) Следствие 2. Если а = а (со) — случайная величина с функцией распределения Fa (а) = Р (а (со) ^ а), то ь Р (а < b | F\) = J рг (а, | (со)) dFa (a). (7.206) *) М — усреднение по мере Р, идентичной мере Р, но определенной, на (Q, #).
ГЛАВА 8 ОБЩИЕ УРАВНЕНИЯ ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ, ИНТЕРПОЛЯЦИИ И ЭКСТРАПОЛЯЦИИ ЧАСТИЧНО НАБЛЮДАЕМЫХ СЛУЧАЙНЫХ ПРОЦЕССОВ § 1. Фильтрация. Основная теорема 1. Пусть (Q, &> Р) — полное вероятностное пространство, (^t)> 0^t^Tf — неубывающее семейство непрерывных справа а-подалгебр #~, пополненных множествами из ЗГ нулевой вероятности. Пусть (8, I) — двумерный частично наблюдаемый случайный процесс, где Q = (QU iFt), 0<^<I7\ — ненаблюдаемая, а £ = = (£„ @~t)> 0^/^Г,— наблюдаемая компоненты. Задача оптимальной фильтрации для частично наблюдаемого процесса (8, I) состоит в построении для каждого момента t, О <1 / ^ 7\ оптимальной в среднеквадратическом смысле оценки некоторой ^-измеримой функции hu зависящей от (6, £), по результатам наблюдений \s, s^f. Если Mht < 00 7 то такой оценкой, очевидно, является апостериорное среднее nt (h) = M (ht | &~f). Без специальных предположений о структуре процессов (Л, £) отыскание nt(h) представляется весьма трудным. Ниже будет предполагаться, что компоненты процесса (А, £) являются процессами типа (8.1) и (8.2), что дает возможность вывести для nt(h) стохастическое дифференциальное уравнение (8.10), называемое уравнением оптимальной нелинейной фильтрации. Применению этих уравнений для эффективного построения оптимальных «фильтров» будут посвящены последующие главы. 2. Перейдем к формулировке основных предположений о структуре процесса (Л, £). Будем предполагать, что процесс h = (hu Ф^у t^.T, может быть представлен в следующем виде: t ht = h0+ J Hsds + xti (8.1) о
§ 1] ФИЛЬТРАЦИЯ. ОСНОВНАЯ ТЕОРЕМА 343 где Х = (хь У,), /< Г, — мартингал, а # = (#,, #",), *<7\ — т случайный процесс с Г \ Hs\ds < оо (Р-п. н). В силу непрерыв- о ности справа-а-алгебр Vt и теоремы 3.1 мартингал X = (xt, 3Tt)t t^Ty имеет непрерывную справа модификацию, которая далее и будет рассматриваться. Относительно наблюдаемого процесса £ = (£/, 3Tt) будет предполагаться, что он является процессом Ито, t t 6, = go + J As (со) ds + J Bs (g) d^s, (8.2) о о где №=(№„ #~,) —винеровский процесс. Процессы A=(At (со), #",) и B = (Bt(Q, STt) предполагаются такими, что Р {\At(«>)\dt <оо = 1, р (B2t(l)dt<oo = 1, (8.3) где измеримый функционал В,(#), О^^^Г, л:е Сг, является ^-измеримым при каждом / ^ Г. Далее будет предполагаться, что функционал Bt(x), хеСг, 0^/^Г, удовлетворяет следующим условиям: t | В, (х) - В;(у) |2 < U \ [х, ~ ysf dK (s) + L2 [xt - yt]\ (8.4) 0 t B){x) < L, J (1 + xl)dK(s) + L2(l + xf), (8.5) 0 где Lj, L2 — неотрицательные константы, K(t), 0^/C(f)^l, — неубывающая непрерывная справа функция, х, у^Ст. Если gt = gt(®)> 0^/^Г, — некоторый измеримый случайный процесс с M\gf\<°o, то у условного математического ожидания М (gt | 5Г|) существует измеримая модификация (см. [52], [126]), которая будет обозначаться nt(g). 3. Основной результат этой главы формулируется следующим образом. Теорема 8.1. Пусть частично наблюдаемый случайный процесс (Л, £) допускает представление (8.1) — (8.2). Пусть
sup МЛ/ < т | MH2tdt< т оо, оо, 344 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ |ГЛ. 8 выполнены условия (8.3) — (8.5) и (8.6) (8.7) | MAldt < оо, (8.8) о В*(х)>С>0. (8.9) Тогда для каждого t, 0 ^ t ^ Г, Р-п. н. я, (А) = я0 (А) + J яв (Я) ds + о + |{л,ф) + [яв(АЛ)-яв(А)явИ)]5Г1(Ю}^., (8.10) о где t тйт _ f dls — ns(A)ds Wt~) 5Л1) о — винеровский процесс (относительно системы {у))9 0^7^Г), a D = (£>„ *Г,) — процесс с *) Ц-'yk- (8Л1) Уравнение (8.10) будем называть основным уравнением (оптимальной нелинейной) фильтрации. § 2. Фильтрация. Доказательство основной теоремы 1. Доказательство теоремы 8.1 будет существенно опираться на результаты глав 5 и 7. Из условий (8.8) и (8.9) следует, что т |М|Л,|Л<оо, \Bt(x)\>VC>0, (8.12) о Следовательно, М| At |< оо для почти всех t, 0^.t^T. He ограничивая общности, можно предполагать, что_М|Л,|<оо для всех /, 0<*<Г. Тогда по теореме 7.17 W — {WU #"1) *) Определение процесса (х, W)t дано в гл. 5, § 1, п. 2.
§ 2] Фильтрация, доказательство основной теоремы 345 является винеровским процессом и процесс l = (lt> &~t)> определенный в (8.2), допускает дифференциал dtt = nt(A)dt + Bt(l)dWt, (8.13) где я, (Л) «М [Л» |У|]. В силу неравенства Иенсена и предположения (8.8) г 7 J Мя?(Л)Л< J МЛ? Л < оо, (8.14) о о что вместе с предположениями (8.4), (8.5) и (8.9) обеспечивает применимость теоремы 5.18. Согласно этой теореме и лемме 4.9 у всякого мартингала Y = (yv &~f), O^t^T, существует не* прерывная модификация, допускающая представление *) t y< = y0+jfAt)dWs, (8.15) О где Р I f2s (I) ds < оо I = 1 и в случае квадратично интегрируе- т мого мартингала J Mf2s{Q ds < оо (ср. с (5.122)). о Из (8.1) и предположений (8.6), (8.7) следует, что мартин* гал X = (xti &~t) квадратично интегрируем. Беря от обеих частей в (8.1) условное математическое ожидание М(« |#"1), находим, что nt(h) = M(h0\F))+M(jHsds\Sr{\ + M(xt\<T)). (8.16) 2. Сформулируем теперь в виде лемм ряд вспомогательных утверждений, дающих возможность преобразовать правую часть в (8.16) к выражению, стоящему в правой части (8.10). Лемма 8.1. Процесс (М(Ао|0"|), &*)), 0<г<7\ является квадратично интегрируемым мартингалом, допускающим пред* ставление t М (h01Г|) - я0 (h) + j g* (I) dWs, (8.17) 0 r где М \\ghs(l)fds<oo. о *) В (8.15) измеримый функционал fs (x) является $5+-измеримым при каждом 0 < s < 7\
346 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 Доказательство леммы очевидным образом следует из теоремы 5.18 и теоремы 1.6, согласно которой у мартингала М {ho \^f) существуют Р-п. н. пределы справа для каждого /, Лемма 8.2. Процесс (М (xt | У\), У)), О < t < Г, является квадратично интегрируемым мартингалом, допускающим представление t (8.18) Щх,\Г})= $ g*a(l)dW, cM$(g*(l))2ds< Доказательство. Тот факт, что этот процесс является мартингалом, проверяется так же, как и в лемме 5.7. Квадратичная интегрируемость следует из того, что таковым является мартингал X = (xv {Fty Существование lim M (#s | ^F|) вытекает Syt из теоремы 3.1. Поэтому заключение леммы — прямое следствие теоремы 5.18. Лемма 8.3. Пусть а = (а„ &~t), O^t^T, —некоторый т случайный процесс с | М| а, |d/ < оо, а ^ — некоторая о-подал* о гебра #". Тогда М J asds\$) = J M(a8\9)ds (Р-п. н.), О < ^ < Г. (8.19) \о / о Доказательство. Пусть Я = Я (со) — ограниченная ^-измеримая случайная величина. Тогда, используя теорему Фубини, находим, что М L о ds = | М [kas] ds = о «= J М{ЯМ(а, \$)}ds = M Я j" M(ae|9)ds. о L о J С другой стЪроны М j asds =M ш( jasds\9j\
§ 2] ФИЛЬТРАЦИЯ. ДОКАЗАТЕЛЬСТВО ОСНОВНОЙ ТЕОРЕМЫ Поэтому м 347 % \ M(as\$)ds \ = М \mna8ds\9 Отсюда в силу произвольности Х = Х(а>) получаем требуемое утверждение (8.19). Лемма 8.4. Случайный процесс (М И Hsds\r]) — jns(H)ds, p)Y 0</<7\ (8.20) является квадратично интегрируемым мартингалом, допускающим представление М М Hsds \7\ - { ns(H)ds = { g?(t)dWs (8.21) с J"M(g?(|))2ds<°o. Доказательство. Существование (Р-п. н.) lim MM Hudu\r\\ — jnu(H)du\ (8.22) следует из теоремы 1.6. Поэтому утверждение леммы будет вытекать непосредственно из теоремы 5.18, если только показать, что процесс (8.20) является мартингалом (квадратичная интегрируемость следует из предположения (8.7)). Пусть s^rf. Тогда в силу леммы 8.3 М М N Hudu\&-}\- jnu(H)du\$-ls = • t -| t j Hu du | Г\ — J M \nu (Я) I #1] du= = M = M I J Я„^н|^И + М M Hudu\$- U J U - J M [я„ (Я) | #1] du - j" M [я„ (Я) | 3*1] rfw. (8.23)
м 348 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 Здесь . J М [пи (Я) | 0ij du = j" nu (Я) du (Р-п. н.) (8.24) о о и для u^s М к (Я) | <И] = М {М (Нн \Г1)\Р\} = М [Ни \Р\). Поэтому по лемме 8.3 j Ни du | Г] = j" М [я„ (Я) | 01] da. (8.25) Из (8.23) — (8.25) вытекает, что процесс (8.20) является мартингалом. 3. Вернемся вновь к доказательству теоремы. Из (8.16), лемм 8.1, 8.2 и 8.4 находим, что t t Щ (h) = я0(h) + J ns (Я) ds + J gs (g) dWs, (8.26) о о где и©=в* (9 +в; (Q +в? о <8-27) с г {Mg2(|)ds<oo. (8.28) о Покажем теперь, что Р-п. н. для почти всех t, O^t^T, gs(i) = ns(D) + [ns(hA)-Ks(h)ns(A)]B7l(t). (8.29) t Поступим следующим образом. Пусть yt = j gs(£)dWs> и о t zt= I ks(QdWsi где Я = (Я5(£), Р®) — некоторый ограниченный о случайный процесс с I Я5 (£) |<Х < оо. По свойствам стохастических интегралов Mytzt = M \xs(l)Ss(t)ds. (8.30) о Подсчитаем теперь Mytzt другим способом, учитывая, что согласно (8.26) Vt = я, (h) — я0 (h) — J я, (Я) ds. (8.31)
I ФИЛЬТРАЦИЯ. ДОКАЗАТЕЛЬСТВО ОСНОВНОЙ ТЕОРЕМЫ Заметим, что МгЛ (А) = М {я0 (А) М (zt \ РЩ = О 349 И М ]z, / ns (H)ds\ = JM[ztns(H)]ds = Jo t t = J M [M (zt | <Г|) я, (Я)] rfs = I M [?л (Я)] ds. 0 0 Поэтому, учитывая, что случайные величины zt ^-измеримы, находим t Mytzt = Mztnt (h) — J Mzsns (H) ds = о t - M [zt M (A, | JTJ)] -JM\zsM (Hs | <F|)] rfs - = M Воспользуемся теперь тем, что zth, — j" zsHs ds (8.32) W, Получаем где : _ Г djs — ns (A) ds П7 j_ Г As (ю) — ns (A) . ,fi „q. ,-J Ml) ^'+J sTTf) d5, (8,<W) 0 t zt=JK(t)dWs. (8.34) (8.35) Из (8.32) и (8.34) находим tzt = M ztht — J zsHs ds\ = = M ztht - \ zsHs ds + M A, J Я, (|) AM^gildi ds_ L о J L о -\{[k® Au(Xm(A))H*d\ (8-36)
350 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ 1ГЛ. 8 Процесс z = (zt, STt) является квадратично интегрируемым мартингалом. Поэтому mth0 = М (А0М (201 &~о)) = Mh0z0 = 0 t М jzsHsds = M \[M(zt\$~s)Hs]ds = Mztj Hsds. о о Значит, в силу (8.1) и теоремы 5.2 М ztht — J zsHs ds \ = M \zA ht — h0 — J Hs ds По лемме 5.1 t {z,xt)=jXs($)Dsds (Р-п. н.), 0 и поэтому м Mztxt = M (z, *),. (8.37) ztht - J zs#s ds = M (z, x)t= M J Я,(У ^s^ = — M J\(gK(£)<fc. (8.38) Вычислим теперь второе слагаемое в правой части (8.36). Имеем М htJK(l)Asi*l-£{A)ds] = м о s о о + М J Я. (|) [А, - А.] Л*~У ds. (8.39)
§ й] фильтрация, доказательство основной теоремы з51 Заметим, что t ht — hs=JHudu + (xt — xs) s и M (xt — xs | £TS) = 0. Поэтому t M j К (I) [ht - A.] As~BX)A) ds== 0 t 0 + M J\(S) As^s%lA) (J fl„<**/U- М/ If Ml) i4"J,^) du \Hsds. 0 U " J Отсюда и из (8.39) следует, что mt\%A\)As(%;(S(A)ds== о = М j\jK(l)AaMB~^A)du\Hsds + о U а J + М/ЯЛ1)ЯЛМ)~";|()/')ЯИЛ)^- (8.40) о Из (8.36), (8.38) и (8.40) находим, что Mytzt-М J *s(g) Lф) + ^(М)-М^И)1 rfs. о L J Сравнивая это выражение с (8.30), убеждаемся в справедливости формулы (8.29) Р-п. н. для почти всех tt O^t^T. Поскольку же значение интеграла ) gs(l)dWSi входящего о в (8.26), не изменяется от изменения функции gt(Q на множестве лебеговой меры нуль, то равенство (8.29) можно считать выполненным Р-п. н. для всех t, Q^t^T. Теорема 8.1 доказана.
352 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 4. Замечание. Из доказательства теоремы следует, что J М { nt (D) + ММ)-М*)««И) }2 ^ < со. (8.41) О 5. Выделим один частный случай доказанной теоремы, когда Теорема 8.2. Пусть W=(Wt,#",), 0</<Г, — винеровский процесс и процесс А, = А0 + J Hsds + хь где X = (#„ &~()—мар- о тиягал. £сли (I) sup MA?<oo, т (II) |МЯ?Л<оо, о то t t < (h) = я0^ (A) + J nf (#) d5 + J nf ф) dWS9 (8.42) о о где n*(g)=M[gt\!rr], n _ d (x, W)t Ut— dt Доказательство. Представление (8.42) следует из (8.10), если только заметить, что в рассматриваемом случае lt=wt=wt. Следствие. Пусть X = (xt, @~t) — квадратично интегрируемый мартингал. Тогда t М (xt | Г J) = Мх0 + J М (о, | FJ) ds, (8.43) о t где (х, W)t— J asds. о Формула (8.43) была ранее получена в § 5 гл. 5 (формула (5.85)).
§ 3] ДИФФУЗИОННЫЕ МАРКОВСКИЕ ПРОЦЕССЫ 353 §. 3. Фильтрация компонент диффузионных марковских процессов В качестве иллюстрации основной теоремы 8.1 рассмотрим задачу оценивания ненаблюдаемой компоненты 8/ двумерного диффузионного марковского процесса (0„ £,), 0</^7\ по результатам наблюдений 65, s^/. Приведем точную постановку задачи. Пусть на вероятностном пространстве (Q, ЗГ9 Р) заданы независимые между собой винеровские процессы Wt = (Wt (t)), /=1,2, 0</^7\ и случайный вектор (60, |0), не зависящий от Wu W2. Обозначим Г, = а {со: 90, 10, Wx (s), W2 (s), s < t). Согласно теореме 4.3 (пополненные) а-алгебры STf являются непрерывными. Аналогичным образом доказывается, что (пополненные) а-алгебры fFt также непрерывны. Пусть (8, g) = (6^, gf), 0<f<7\ —случайный процесс с dQt = а (/, 9,, lt) dt + Ьх {U в„ W dW{ (t) + b2 {t, 9„ h) dW2 (/), dlt = A (/, 9„ lt) dt + B (U W dW2 (t), (8'44) % = 60, So = 1о. • P (I во К ~) = P (I lo К ~) = 1 • Если g(t,Qfx) обозначает любую из функций а(/, в, х), A(ty 9, л:), Ьх (t, 8, л:), b2(t, 8, л:), B(t, x)> то будет предполагаться, что I g(u в', xr)-g(u в", *") \2<K{\ в' -е* p + i *'-*" р), gHt,Qyx)^K(l+Q2 + x>), (ЬАЬ) Из этих предположений, теоремы 4.6 и замечания к ней следует, что система уравнений (8.44) имеет единственное (сильное) решение, являющееся марковским процессом. При этом, если М(ё95 + !о)<°°> (8.46) то supM(ej + g)<oof (8-47) и в силу (8.45) sup М [Л2 (t, 9„ У + В2 (t, lt)] < oo. (8.48) Пусть h = h(t, 0/, lt) — измеримая функция такая, что М| h(t, 8„ It) К °°. Используя теорему 8.1, найдем уравнение для nt(h) = M\h(t9 8„ 6,)|0"*].
354 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. S Наряду со сделанными уже предположениями (8.45), (8.46) будем предполагать, что В2(/, *)>С>0 (8.49) и что выполнены следующие условия: функция h - - A (t, 0, х) непрерывна вместе со своими частными производными h'u Ae, h'x, Аее, Ае*, h"x; (8.50) supMA2(f, 8„g,)<ob; (8.51) T jM[8A(f, e/>g/)]2d/<oo, (8.52) о где + j Aee (*, 9, x) [b] (f, 9, *) + bl (t, 9, *)] + ~ h"x (/, 9, x) B2 (t, x) + + hex (t, 9, *) b2 (t, 9, *) В {t, x). (8.53) Наконец, предположим, что т J М {[й'е(t, 8„ lt)Y\b\{t, 9„ lt) + bl(t, 9,, £,)]} Л < oo, (8.54) 0 T J* M [h'x{t, 9,, 6,)]2B2(*. lt)dt < oo. (8.55) о Теорема 8.З. Если выполнены предположения (8.45), (8.46), (8.49) —(8.52) и (8.54), (8.55), то Р-п. н. * я,(А) = я0(А) + Jns(2A)ds + о + J [я.С/ГЛ) + *в(М)в£$Яв1Н)]dWs, (8.56) где U7 _ Г ^s — я5 (A) ds о является винеровским процессом {относительно (#*), 0 ^ t ^ t) и jfh (/, 9, х) = Ag (f, 9, *) Ь2 (t, 0, х) + А* (/, 0, х) В (f, x). (8.57)
§ 3] ДИФФУЗИОННЫЕ МАРКОВСКИЕ ПРОЦЕССЫ 355 Доказательство. По формуле Ито (Р-п. н.) t А (/, 8„ lt) = h (О, в0, go) + \ 8А (5, 95, у ds + *„ о где 2 * + J4(s,es>yfi(s,y^2(S). О Согласно сделанным предположениям процесс X = (xi9y() является квадратично интегрируемым мартингалом. Установим теперь, что t (x,W2)t=j[h'e(s,Qs,ls)b2(s,QsAs) + + K(S'Q.>l,)B(s.l,)]ds. (8.58) С помощью формулы Ито легко находится, что t xtW2 (t) = J* W2 (s) h'b (s, в.,- у bt {s, 9,, gf) <W, (s) + 0 + J К + /^ (s, es> у &2 (s, е., у + л; (s, e,, у б (s, у ] dw2 (s) + 0 + J К (^. б„ У 62 (s, 8,, у + h'x (s, 9S, у В (s, у] ds. (8.59) 0 При этом непосредственно проверяется, что процесс Y = (yti &~t)c t yt=xtw2 (t) - J де (s, e,, 6.) 62 (s, е., у + a; (s, e„ у в (S) у] ds 0 является мартингалом. Отсюда, как и в примере 3 гл. 5, вытекает справедливость формулы (8.58). Чтобы получить теперь требуемое представление (8.56), осталось лишь воспользоваться теоремой 8.1.
356 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ |ГЛ. 8 § 4. Уравнения оптимальной нелинейной интерполяции 1. Как и в § 1, будем предполагать, что рассматривается двумерный процесс (A, £) = (А„ £,), 0 < / < 7\ S А/ = Ло+ | Hsds + xti (8.60) о t t lt = lo + J A8ds+ J Bs(l)dWs, (8.61) о о удовлетворяющий предположениям теоремы 8.1. Задача оптимальной интерполяции состоит в отыскании оптимальной в среднеквадратическом смысле оценки hs по результатам наблюдений Еи, н</, где t^s. Если МА*<оо, то такой оценкой является апостериорное среднее *,.ЛЛ)вМ[А,|^П]. (8.62) Для nStt(h) можно получать уравнения двух типов: прямые (по t при фиксированном s) и обратные (по s при фиксированном t). В настоящем параграфе будут выведены прямые уравнения, аналогичные уравнению (8.10) для nt(h) = nttt(h). Теорема 8.4. Пусть выполнены предположения теоремы 8.1. Тогда при 0<$<г<Г я.. * (А)=я, (Л) + J g дв1(6)' J ' W.- (8.63) Доказательство. Прежде всего заметим, что формулу (8.63) можно переписать в следующем виде: Я*. / (*) = Ks \h) + J l- ! ^-^ ЙГа или «/«s. t (A) = —ь !—щщ dWi9 где />s и jcSjs (A) = jts (A).
§ 4] УРАВНЕНИЯ ИНТЕРПОЛЯЦИИ 357 Рассмотрим теперь квадратично интегрируемый мартингал yt=M(ht\0-}), t>s. (8.64) Согласно теореме 5.18 yt для /> s допускает представление t yt=ns{h)+\ gs.u(l)dWu (8.65) с винеровским процессом W = (WU, У*) и процессом (gStU(Q, У*), u^s3 удовлетворяющим условию t м Js5.„(g)rf«<oo, s Как и при доказательстве теоремы 8.1, введем квадратично интегрируемый мартингал Z = (zt, £Г\) с t zt=\Ku{l)dWu, S где IW£)l<C<oo. Нетрудно найти, что t Mytzt = MJKu(l)8s.u(l)du. (8.66) S С другой стороны, принимая во внимание, что t wt = wl + j\2)A)du> о находим, что Mytzt = MM(hs\^))zt = Mhszt = t t МЛ -м JKa(t)dWu + Mhs J\,„(l) -a"""M) du = s s I'M (J я,., (|) <f г. | r.)\ + M / к. (I) M'a,'g'(,<l Л - -м/у,ШМ(М-|У»;^-1У»--^^. (8.67)
358 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 Сравнивая правые части в (8.66) и (8.67), находим, что Р-п. н. для почти всех и ^ s а М М(МЦИ)-М(/^К(Л) &.«(s) = 5^(|) • (8-Ь8) Как и в теореме 8.1, без ограничения общности можно считать, что функция gStU(l) определяется равенством (8.68) (Р-п. н.) для всех u^s. Замечание. Из доказательства теоремы следует, что T~M{h8Au\<rl)-M(h8\irl)7tJA)]2 М j ви(1) du < оо. 2. Применяя теорему 8.4 к процессу (0, £), рассмотренному в § 3, находим, что (в предположениях теоремы 8.3) для t^s М[*(».в.,у|У}]-- § 5. Уравнения оптимальной нелинейной экстраполяции 1. Снова будем предполагать, что процесс (/г, |) описывается соотношениями (8.60), (8.61) и что выполнены условия теоремы 8.1. ПуСТЬ (>5И *t9e(h) = Nl[ht\P\]. (8.70) Очевидно, что если М/г^<оо, то nt s(h) является оптимальной (вообще говоря, нелинейной) оценкой «экстраполируемого» значения ht по наблюдениям gB, H^s^rf. Идеи, примененные при выводе уравнений (8.10) для щ(Н), позволяют получить также уравнения и для nus(h) no s</ при фиксированном t. Эти уравнения естественно называть обратными уравнениями экстраполяции в отличие от прямых уравнений (по t^s при фиксированном s). Теорема 8.5. Пусть выполнены предположения теоремы 8.1. Тогда при фиксированных t и s, s^t, я,.,№)-.„1(.)+/{я,(0)+м|М(МУ^;17"-м>|У-1)^ (8.71)
§ 5] УРАВНЕНИЯ ЭКСТРАПОЛЯЦИИ 359 где Ds = —^—- и X^=(xSi^'s)> s</,—квадратично интегрируемый мартингал с xs=M(h(\@~s). Доказательство. Пусть t фиксировано и s^/. Положим #s = М (А, | #"!). Процесс Y = (ys% *Г|), s<^, является квадратично интегрируемым мартингалом, и по теореме 5.18 ys = M(ht\<rl) + jgUit(l)dWu (8.72) MJglt(l)du<oo. О Как и при доказательстве предшествующей теоремы, положим о где \К(1)\<С<оо. Тогда My*ts = MJK(l)8u.,(t)du. (8.73) О Вычисим теперь Myszs иным способом. Ясно, что М*А = ММ (Л, | Г\) zs = mtzs = М (А, | Fs)zs = М*А. Процесс X = (xS9 &~s)9 O^s^t, является квадратично интегрируемым мартингалом, и по теореме 5.3 S <*, W)s= \ Dttdu, о t где М J D2udu < оо. о Пусть Z = (z89 F's), s<f, —квадратично интегрируемый s мартингал с zs = \К(1)dWu. Тогда, поскольку о S W —IF 4- Ли ~~ Пи ^ du ws-ws+) au, о то s .2, = g,+ J\(£) А"ви"1)А) du- <8'74>
360 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 Следовательно, s Myszs = Mxszs = Mxszs + Mxs J К(|) AttBan{l)A) du = 0 s s - M J\ (I)"« Ф) ^" + Mxs J я,„ (|) Л" J "»<Л) rfM> (8.75) о о " где s s Mxszs = M J я„ (I) Z)e dw = M J Я„ (£) я, (D) da (8.76) о о по лемме 5.1. Аналогично находим, что s s Mxs j К (g) Aa~u *»fA) du = MJK (l) xs Aa ~ fyA) du = 0 0 s =:Mj\(i)M(xs|<T0) \*^A) du. (8.77) 0 Ho xs = M (ft, | #~s) и, значит, при w^5</ Mfe|^) = M(A/|Srj, что вместе с (8.77) дает соотношение S MXsJKd) AuBa1h{A) du== о -М/».Ю"1"№|Г^УЦМ))|,{|^ (8.78) О Из (8.76) — (8.78) получаем м м f\ /tJ /пч , М[М(^1^«)(^-^И))1^]Ь. Мул = М J Яц (I) { яа (£>) Н L в^ШГ~ ) 0 * (8.79) Сравнивая (8.79) с (8.73), находим, что Р-п. н. для почти всех tt^s М [М tht I $~и) (Аи - пи (Л)) I Т\\ ёи (6) = л. Ф).+ [ (" иви{1) ' J • (8-8°)
§ 5] УРАВНЕНИЯ ЭКСТРАПОЛЯЦИИ 361 Не ограничивая общности, можно считать, что функция gu(£) определяется равенством (8.80) для всех u^s. Вместе с (8.72) это доказывает требуемое представление (8.71). Замечание. Из доказательства теоремы вытекает, что м / {,, (Р) + "|м (>'' ^tm """"'У"' }'*■<-• о 2. Рассмотрим представление (8.71) в случае диффузионного процесса (9, |), рассмотренного в § 3. Пусть t фиксировано и для s^/ g (S, е, *) = м {h (t, e/f tt) i es = e , ^ = x). Предположим, что эта функция удовлетворяет условию (8.50) и) 8g(s, 9, *) = 0, (8.81) где оператор 8 определен в (8.53). Предположим также, что Т ( 2 м| (^(5,es(|s))2S6Ks'0s.y + 0 I t=l + (S'x(S'Qs^s))2B2(S'%)}ds<0°- (8-82> По формуле Ито для 5^/ s g (s, е„ у = «г (о, е0, io) + J й g (и, вв, у du + о 2 S + S Jg;(".e».iu)^(«,eu,g^(") + i=l 0 + /«;(". в., yfl(«.ydir,(«)'. * о Отсюда видно, что в силу предположения (8.81) процесс Y = = (ys> @~s)> 5^/, с ys=:g(s) Qsy |s) является квадратично интегрируемым мартингалом и s (у, w2\= J \^(и, е„, iu)b2(u, ец, у + g'x(u, e„, iu)B(u, Q]du. о Поэтому в силу (8.71) и того, что М (A (t, е„ lt) |0\) = М (h (/, 8„ У |9S, У = g(s, 95, У,
362 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 получаем M{h{t,et,lt)\fr\)=M[h(t,Qt,lt)\!ri} + + J { яц (Л>8) + Пи {еА)в(и:ы П"{А) }*** (8-83) U где § 6. Стохастические дифференциальные уравнения с частными производными для условной плотности (случай диффузионных марковских процессов) 1. Рассмотрим двумерный диффузионный марковский процесс (0, |)="(6/i It)9 0^/^Г, управляемый уравнениями (8.44) с B(tt |/)=1. Если функция h = h{x)y x^R1, финитна вместе со своими производными h! (х), h" (х) и выполнены предположения (8.45), (8.46), то согласно (8.56) процесс Мй)=М[А(е,)|#"1] допускает представление t щ (h) = 7i0(h) -f f jis (Щ ds + о t + I [я, (JTh) + л3 (Ah) - ns (А) л5 (h)} dWsy (8.84) о где W = (Wt, &~f) — винеровский процесс с dWt = dlt — nt(A)dU a 2 U (9,) = hf (9,) a (t, 9„ g,) + j A" (9,) ]g Й, (/, 9„ g,)f Л,А(в/) = А,(в/)б2(<,в/>Ы. Предположим теперь, что. условное распределение Р(9^ dP(Bt<x\^\) <х|У|), 0<f<7\ имеет плотность р^(/)= ^ ; , являющуюся измеримой функцией от (/, х9 со). Отправляясь от представлений (8.84), найдем уравнения, которым удовлетворяет эта плотность. Введем следующие обозначения: г 2 8'Р/ (*) = - ~k Ifl <'• *• 6/) Р* (01 + у -£г S *?('•*. 6») Р,(0 ИС*Рх(0=--^-[б2('. *, 6#) Р* (0J- 1=1
УРАВНЕНИЯ ДЛЯ УСЛОВНОЙ ПЛОТНОСТИ 363 Теорема 8.6. Пусть (I) с вероятностью единица для каждого ty 0^/^Г, существуют производные 4: [a [U х, h) Рх Ш, -£- [b2 (tt x, £,) 9x (/)], dx dx d2 dx2 1=1 (II) для любой непрерывной и финитной функции h = h(x) T оо J j\h(x)Vpx(t)\dxdt< (8.85) О —оо T оо М J | Л2 (*) [Л (*)+р, (0 (Л (f, х, |,)-я, (Л))]2 Лк Л < оо. (8.86) О —оо Тогда условная плотность рх (t), х е /?', О < < ^ Г, удовлетворяет стохастическому дифференциальному уравнению (с частными производными) dlPx(t) = Z'px(t)dt + X — оо <*&,-( J 4(/, у, &)ру(/)<ЫЛ X (8.87) Доказательство. Покажем сначала, что в предположении (8.86) (Р-п. н.) t оо О -оо J \h(x) {Ж'рх (s) + Рх (s) [A (s, х, У - ns (A)}} dx dWs = оо J" h (x) ( | {J?*p, (s)+Pje (s) [Л (s, x, Ь)-я, (Л)]} rffM dx. (8.88) -oo \0 / Положим для краткости a* (*, 6) = -О* (s) + p* (s) [A (s, x, ls) - ns (А)].
364 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 Тогда для доказательства (8.88) надо показать, что (Р-п. н.) О ■ оо dW,— &®= J I J h(x)as{x, l)dx оо - J h(x)\ jas(xt l)dWs Lo dx = 0. (8.89) Величина %t(l) является #~|-измеримой, и согласно'предположению (8.86) М%,(£) = 0, М%,(|)<оо. Поэтому для доказательства (8.89) достаточно лишь установить, что М [%t (|) Я, (|)] = О для любых ^-измеримых величин А,,(£) с |^(|)|^1. В силу теоремы 5.18 t О где процесс g = (g5(|), #"|), s</, таков, что J Mg2s(Qds<oo. о Поэтому по теореме Фубини M3b(6)^(S)=Mxi(6)J&(6)^=jM &(6) \h(x)a8M)dx\ds- О О I -оо ' Итак, хД|)=0 (Р-п. н.) для любого / (0</<Г), что и доказывает равенство (8.88). Перейдем непосредственно к выводу уравнения (8.87). Для этого заметим, что ns (Ah) - ns (A) ns (h) = M{h (9S) [A (s, Qst У - ^ (Ш Поэтому согласно (8.84) t щ (h) = щ (h) + J я, (3?h) ds + о t + / M [Jfh (6.) + Л (9,) [A (s, 9e, |s) - ns (A)] 1*"$} rflf„
§ 6) УРАВНЕНИЯ ДЛЯ УСЛОВНОЙ ПЛОТНОСТИ 365 и если существует плотность px(t), то J h(x)px(t)dx= J h (x) px (0) dx + — oo t oo p (s) dx ds + 0 -oo L j_l * oo + J J[A,W*4(s,*,le)+^WM(s,x,6s)-n.H))]p,(s);rfJcrfr,. (8.90) 0 —oo Интегрируя в (8.90) по частям и меняя порядок интегрирования (что возможно в силу (8.88), (8.85) и теоремы Фубини), получаем oo t \ h (x) {9x (t) - рх (0) - J* V9x (s) ds - —oo 0 t - J ЦГрх (s) + Px (s) (A (s, x, У - я, (A))] dWs) dx = 0. Отсюда в силу произвольности финитной функции h(x) приходим к искомому уравнению (8.87). 2. Предположения теоремы 8.6 обычно трудно проверяемы. Исключение составляет случай условно-гауссовских процессов (9, |), рассматриваемых далее в главах 10 и И. Поэтому ниже будет подробно разобран достаточно простой, но тем не менее нетривиальный случай процессов (9, |), для которых условная плотность px(t) существует и является единственным решением уравнения (8.87). Будем предполагать, что случайный процесс (9, |) = = [(9„ lt), £Tt], 0</<7\ удовлетворяет стохастическим дифференциальным уравнениям dQt = a(Qt)dt + dWl(t)t (8.91) dlt~A(Qt)dt + dW2(t), (8.92) где случайная величина 60 и винеровские процессы Н^ = =-(Wi{t), yt)y /=1, 2, независимы между собой, Р(1о = 0)=Ь М902<оо.
366 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 Теорема 8.7. Пусть (I) функции а(х), А(х) равномерно ограничены вместе со своими производными а! (х), а" (х), а'" {х), А' (х) и А" (*) {константой К)\ (\1)\Ап(х)-А^{у)\<,К\х^у\Ааш(х)^аш(у)\^К\х-у\\ (III) у функции распределения F (х) = Р (90 ^ х) существует дважды непрерывно дифференцируемая плотность f (х) = ^ . Тогда существует (Р-п. н. для каждого t, О ^ / ^ Т) плотность 9x(t) = dP(Qt<x\ вг}) dx которая является ^-измеримым (при каждом tt 0 ^ / ^ Т) решением уравнения dt9x(t) = **9x(t)dt + +P*(t) А(х)~ J A(y)py(t)dy UbH J A(y)Py(t)dy]dt (8.93) с px(Q) = f(x) и ГрЛЪ=-£[а(х)9Л*)] + ъ£[Рх№ В классе (t, x, (^-измеримых дважды непрерывно дифференцируемых по х функций Ux(t), являющихся ^-измеримыми при каждом t, 0^t^.Ty и удовлетворяющих условию Р | J I j A(x)Ux(t)dx\ dt < oo = 1, (8.94) решение уравнения (8.93) единственно в том смысле, что если Ux} (t) и Ux} (t) — два таких решения, то Р{ sup | C/S} (/) — С/^ (01 > 0} = О, оо<х<оо. (8.95) 3. Для доказательства теоремы 8.7 установим ряд вспомогательных предложений. Пусть (Q, #, Р) — вероятностное пространство, идентичное (Q, &~> Р), на котором заданы случайная величина 80 с Р (90<х) = = P(0o^*) и не зависящий от нее винеровский процесс W = (Wt), 0</<Г.
§ 6] УРАВНЕНИЯ ДЛЯ УСЛОВНОЙ ПЛОТНОСТИ 367 Введем также следующие величины: Wyt = y + Wu -oo<#<oo, As®=M\A(Qs)\Fll t X Wt = lt-I A8(l)ds, D{x)=\a{y)dy 0 0 и ifo (I) = exp |[ As (I) dWs - j J Л? (|) tfs , (8.96) Pt(y> W, g) = exp {л(у + Г5)^--4|[а2(У + Ю + l о о + а2 (У + Ws) -a'(y + W,) -2A(y+ Ws) As (£)] ds }, (8.97) где J A{y + Ws)dWs определяется для каждого йеО как о стохастический интеграл от детерминированной функции А (у+W,{&)). Лемма 8.5. В условиях теоремы 8.7 существует (Р-п. н.) плотность определяемая формулами Px(0) = f(x) и при 0 < t < Г с» — с» X М (р, (у, Wt l)\Wt = x-y)f (у) dy, (8.98) где М — усреднение по мере Р. Доказательство. Рассмотрим на (Q, ^, Р) процесс 9 = (9,), 0</<17\ с дифференциалом dQt = a(Bt)dt + dWt. (8.99) Условия теоремы 8.7 гарантируют существование и единственность сильного решения уравнения (8.99) с начальным значением 90. Поэтому меры \iQ и jx0, отвечающие процессам 0 и О, совпадают.
368 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 Рассмотрим теперь уравнение йЦ =a(Qyt)dt + dWt, в£ = */. (8.100) У этого уравнения также существует единственное сильное решение и Р-п.н. р (ё е= Г |80 = у) = Р Фу €= Г), Ге1 Следовательно, оо Р(веГ)= J P(8»er)f(if)rfy, — 00 что символически будем обозначать diiB = diidyf{y)dy, (8.101) где \хву — мера, отвечающая процессу 6". Обозначим \х^у меру процесса №у; согласно теореме 7.7 |xey ~ |х^у и -^(/, ^) = ехрПа(у+^^5~/а2(г/+#5)^ |. (8.102) Используя формулу Ито, находим, что t t D(y+Wt) = D(y)+ j a(y + Ws)dWs + ±j a'(y + Ws)ds. о о Поэтому представление (8.102) можно переписать в таком виде: *wy ~&xp\D(y + Wt)-D(y)-±j[a4y + Ws) + a'(y + Ws)]ds\. (8.103) Из (8.101) и (8.103) нетрудно вывести, что — f (у) ехр { £> (</ + №,)-£> (*/)-i- J [a2 (y+f,) + а' (y+Ws)] ds . (8.104)
§ 6] УРАВНЕНИЯ ДЛЯ УСЛОВНОЙ ПЛОТНОСТИ 369 Используя это представление и формулу Байеса (теорема 7.23), получаем P(Qt<x\sr)) = M\x{Qt<x)\r)l = = %,,, <х) ехр { J [А (8.) -J. ft)] rffr.-J- J [Л (§.)- Js (£)f ds\= U о i - JV*«)exp {/и (c-)-J- (l)ldt* - т J И t^)-1* (l)l2 *s}x cr ^ о о ' X^6(c)= Jx(e/<JC>exp{ J" [A(c,)-As(Q]dW,- Ct * 0 - т J Ис*) - ^(l)]2 ds} dt^xfr ('«c' y) ^f x dy = oo ™*Л1) \М\у^1<х)*МО(у+&<)-0{уШу,-№Л)1Шу. (8.105) — oo Ho МХ(!г+^<*) exp [D(y + Wt)-DЩ p,(y, W, £) = = M {*(„+*,<*) ^P fD (y + Wt)-D Щ M (p, (*/, Г, |) | f,]} = V^nt — 00 X = -±= \ exp[-^^+£> (z)-D (y)) M[p,(y, W, 1) | Wt—z~y]dz. -~ J (8.106) Из теоремы Фубини, (8.105), (8.106) для t>0 получаем Р(е,<*|^) = 1 J J ^p[-1^r1+D(z)-D(y)]x — 00 —00 К"2я/ ф, (I) X М [Р/ (у, W,l)\Wt = z-y]f (у) dy dz, (8.107) что и доказывает представление (8.98). Формула же р*(0) = /(л:) очевидна. Лемма доказана.
370 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 Чтобы сформулировать следующее утверждение, обозначим Bt, \ (х) = а* (х) + А2 (х) - а' (х) - 2А (х) А, (|), (8.108) f\s=Ws-jWt> s^t, (8.109) и t 9t(У, х — у, fj, U = ехр \ I А(у +-J1- + г\3 + тх) dW* — -jJBs,l(y-LT± + f[s + ^x)ds\. (8.1 0 * 10) Лемма 8.6. В предположениях теоремы 8.7 для любых х, у (—- оо < х < оо, — оо<#<оо) Р-п. н. М[р,(у, ^, Й11Р/ = *-у]=Мр(у, *-у, л, |). (8.111) Доказательство. Используя обозначение (8.108), функцию pt(y, W, |), определенную в (8.97), можно представить в следующем виде: Р/(У,^.бНехр{ J A(y+Wa)dW8-±j BsMy+Ws)ds\. (8.112) Основываясь на теореме о нормальной корреляции (теорема 13.1), нетрудно показать, что условное (при условии Wt) распределение процесса fj = (fis), s</ с r[s = Ws—jWt не зависит от Wt (Р-п. н.). Поэтому, если Ф5(т}, Wt) — §*'wr измеримый функционал (p^,Wt = o[(o: fjw, u^.s\ Wt}> s^i) с М|Ф5(л> Wt)\< оо, то М(Ф5(Л> Wt)\Wt = x) = №9% *)• (8.113) Подставляя Ws = x\s-\--^-Wt в pt(y, W, |) и применяя формулу (8.113), из (8.109) и (8.110) получаем требуемое равенство (8.111). Следствие. Из (8.98) и (8.111) следует, что оо — оо ХЩЛУ, x-y,r],l)f(y)dy. (8.114)
§ 6] УРАВНЕНИЯ ДЛЯ УСЛОВНОЙ ПЛОТНОСТИ 371 Лемма 8.7. В предположениях теоремы 8.7 sup MpUt) < оо, _оо<х<оо. (8.115) Доказательство. Положим г = (х — у)/ 1/7. Тогда в силу (8.114) оо p,(f) = -^JS- J g(x,z,t)Mpt[x-*VT, zVT,r\>l\dz, (8.116) g(x% zy t) = ^xp\-^ + D(x) — D{x — zVt))f{x — zVt). 1*1 Ho|D(*)|<| \a(y)\dy^K\x\. Поэтому для каждого x, о — оо < х < оо, I *(*,«. О 1<ехр{-£ + D(x) + K\x\ + K\z\Vt\ sup f(t/)= = d(;)exp{-y+ tf|z|/r}, где d(*) = exp{£>(*) + /(|*|} sup f(y). Далее, из (8.108) и (8.110) находим 0<рД* —zV*?; г/Г tj, |]< < где Ki — некоторая константа. Отсюда в силу неравенства Иенсена, леммы 6.1 и теоремы Фубини получаем М(МрД*-г VI г VI fj, |])2"< MMtf"\x-z VI гУТ, fj, g]< < С, (п) М М exp 2n J Л (л; — z VT— -у= + fj,) dWs — -Щг-j A^x-zYT+ff + ^ds^C^n), где Ci(^) — некоторая константа. Аналогичным образом показывается, что и М ФГ2й№)<С2(л)» "=1> 2> •••
372 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 Используя эти оценки и интегрируемость функции ехр<—|-+/( }/Г| г | >,с помощью неравенств Коши — Буня- ковского из (8.116) получаем требуемый результат (8.115). Лемма 8.8. Если выполнены предположения теоремы 8.7, то условная плотность рх (t)t О ^ t ^ Г, дважды дифференци- руема по х и ,-рмт!<~. ,«»»«[w<-- (8-п7) Доказательство. Обозначим для />0 Ф/.у.Ч. 6(*) = ехр{--^Ц=^ + D(x)-D(y)}pt(y, x — y,r\,Q. Тогда в силу (8.114) 9x(t)= ^ J <Dt.y.n.t(x)P(dS>)fQ/)dy9 (8.118) V2M$t (Б) ох я1 д1ох U) и для существования производных — . достаточно устано- дх1 вить, что дважды дифференцируемы по х величины V(x)= J Ot.y.fi.i(x)P(d&)fQf)dy. Предположим, что при фиксированных z, у, fj, £ функция Q>t.y,i\,l(x) Дважды дифференцируема по х. Тогда для любых Х\ X" (— оо < *' < *" < оо) г V(x")-V(x')= f Цф(|,,и(г)й ИХ/?1 P(d&)f(y)dy, (8.119) и если (Р-п. н.) .и -^ ф'- у> 1. 6 («) | Р (rf©) f(y)dy<oo, (8.120) то по теореме Фубини в (8.119) возможна смена порядков интегрирования и V(x) = V(0) + j\ [ ^Ot,yt^i(z)P(d&)f(y)dy _QXR* dz. Поэтому, если к тому же функция Rlx)= \ £<l>t.y.ii.i(x)P(d&)f{y)dy QXR1
§ б] УРАВНЕНИЯ ДЛЯ УСЛОВНОЙ ПЛОТНОСТИ 373 непрерывна по х (Р-п. н. при 0<^<Г)> то функция V (х) бу- дет дифференцируемой по л: и —-£— =/?(*). Установим сначала, что функция -г— Ф*, у% ^ g (x) непрерывна по х. Поскольку функция D(x) непрерывно дифференцируема, то нужно лишь убедиться в том, что непрерывно дифференцируемы (по х) функции t t j А (у ^ + Hs+T*)dWs, { BSil(y l=± + rla+±x)ds. О О Производные -^а(у^г- + ^ + тх)' жв^(у^ + ^+тх) существуют и равномерно ограничены по предположению теоремы 8.7. Повторяя проведенные выше рассуждения, убедимся в том, что t ^г/^Ф^ + ^+Т x)ds=' О t BSlji;B:i(yL:r- + i\*+Tx)ds' (8Л21> 6 t если только функция J — Bs>$ [у -=-5- + ris + -j x) ds (как о функция от х при фиксированных tt |, ц) непрерывна. Но функция -0-BStily—-. Ь*Ь~т~~7~*) равномерно ограничена и непрерывна, что и влечет за собой равенство (8.121) и непрерывность по х функции — BSt Л у ~" s + r\s + -г- х\ ds. о Установим теперь дифференцируемость по х функции t \*{'-, ~ + 4s + т х) dWs и равенство t t ^И^ + ч. + т*)^" о t = j-kA(yJjJ± + 4s + Tx)dWs. (8.122)
374 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 / г д ft s s\ — Заметим, что функция к(х)=] — А\у — \-r\s +-j x\dWs о (при фиксированных t, fj, I) непрерывна по х. Действительно, в силу предположений теоремы 8.7 t М -^а(у h± + 4s + T^)]dW'}2<KT^-^?- Поэтому непрерывность Х(х) следует из критерия непрерывности Колмогорова (теорема 1.10). Далее, по теореме Фубини для стохастических интегралов (теорема 5.15) при — оо < х' < х" < оо х' 10 t , X 1 ( * = J J Иг t s , . , s _\.,Jrfr А [у -Ц^ + ть + jz)dz\ t о о Отсюда в силу непрерывности функции К{х) следует, что производная 0 *х' t ■§г1а(уЧ± + ^+тх. dW, существует и выполнено равенство (8.122). Итак, функция — Ф^ у> ^, ъ (х) непрерывна по х. А значит, плотность px(t) дифференцируема по х (для почти всех со и /, O^t^T) и справедлива формула ■^- ' т [ ^Ф^.%1(х)Р№ГШу. (8.123) Аналогичным образом устанавливается существование при t > 0 производной —|! г и формула д29х (t) = 7Й J •£«*...«. • WW'<*>*• <8-12*) ««■ И2**,«) а1г ««■
§ 6] УРАВНЕНИЯ ДЛЯ УСЛОВНОЙ ПЛОТНОСТИ 375 Проверка неравенств (8.117) производится так же, как в лемме 8.7. 4. Доказательство теоремы 8.7. Справедливость уравнения (8.93) для р*^) следует из теоремы 8.6 и лемм 8.5—8.8, гарантирующих выполнение условий этой теоремы. Займемся доказательством единственности решения этого уравнения в классе функций, определенном в условиях теоремы. Пусть Ux(t), x^R1, 0<f<Г,—какое-нибудь решение уравнения (8.93) из указанного класса с Ux (0) = f (х) (Р-п. н.). Положим t 3/ = ехр j А (у) U у (s) dy) d$s - ±] I J А (у) U y (s) dy) ds\ (8.125) и Qx(t) = Ux(t)h- (8-126) По формуле Ито dtQx(t) = = { - ir W (х) Ux (01 + j -£г Wx (t) ]}h dt + Ux {t) J, A (x) d\t (8.127) или, что то же, dlQx(t)={-^[a(x)Qx(t)]-{-^^r[Qx(t)]}dt + Qx(t)A(x)dtt, (8.128) где Qx(0) = Ux(0) = f(x). (8.129) Таким образом, уравнение (8.128) с начальным условием (8.129) имеет сильное (т. е. ^-измеримое при каждом t, 0 < < t < Т) решение Qx (t) = Ux (t) $,. По формуле Ито J,= l + jJ / A(y)Uy(s)dy)d$s = 0 \-оо / = ! + /( J A(!/)Qy(s)dy)dls, (8-130)
376 ОБЩИЕ УРАВНЕНИЯ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ [ГЛ. 8 и, очевидно, Р{0<$, <оо, 0</<Г}=1. Поэтому из (8.126) и (8.130) следует, что Ux(t) = ,, оо QAt) г . (8.131) 1+ J I J A(y)Qy(s)dy)dts где Qx(t) удовлетворяет уравнению (8.128). Формулы (8.126) и (8.131) задают взаимно однозначное соответствие между решениями уравнений (8.93) и (8.128). Поэтому для доказательства единственности решения уравнения (8.93) достаточно установить единственность решения уравнения (8.128) в классе функций Qx(t)> удовлетворяющих условию Р ПМ A(x)Qx(t)dx\ dt< оо J= 1 (см. (8.131)). Положим ^x(t) = exp\A(x)lt-jAHx)t] (8.132) RAt) = W>' (8ЛЗЗ) По формуле Ито из (8.128), (8.132) и (8.133) находим, что dtRAt)={-^[a(x)Qx(t)]+^£T[QAt)]}^i(t)dt (8.134) Множитель при dt в (8.134) является непрерывной функцией по tt и поэтому dRx (О dt -{-irl-WQxWl + y-lrlQxWlJtj'w- - {- -h \a {x) **{t) +* {t)\ + т -w \R*w ** w]} **' w = -a'(x)Rx(t)-a(x)^j^-+^Rx(t)- -a(x)Rx(t)^^(t)+ У *»/r(0 Ч>7'Ю + + 4-/?Л0-^Ч#-*7'(0, (8.135) 2 v* w d**
§6] УРАВНЕНИЯ ДЛЯ УСЛОВНОЙ ПЛОТНОСТИ 377 где . °t^K4t) = A'(x)\A(x)t-lt]9 <^ Ъ* (t) = (А' (ЩА> (х) t - ltf + (8Л36) + A''(x)\A(x)t-lt\ + (A'(x)Y. Обозначая a(t,x)=-a(x)+A'(x)[A(x)t-$t], (8.137) c(t, x)=-a'(x)-a(x)A'(x)[A{x)t-l,] + + }(Л' (х))Ц1 +[A(x)t -Ы2)+ A" (x)[A(x)t -У. (8.138) из (8.134) —(8.138) получаем для Rx(t) уравнение i^_^i!!§^ (8Л39) с Rx(0) = f(x). Коэффициенты a(ty x), c(t, x) непрерывны (Р-п. н.) по совокупности переменных и равномерно ограничены. Поэтому из известных результатов теории дифференциальных уравнений с частными производными *) вытекает, что уравнение (8.139) имеет (Р-п. н.) единственное решение с Rx (0) = / (х) в классе функций Rx(t)t удовлетворяющих условию (при каждом со) Rx(tXc{(«>)exp{c2((x))x2)9 где ct (со), /=1, 2, таковы, что Р(0 <Ct((o)< оо) = 1, /=1, 2. Но Р (inf $x (t) > 0) = 1, — оо < х < оо. Поэтому решение урав- нения (8.128) также единственно в указанном классе. Отсюда вытекает и единственность решения уравнения (8.93) в классе случайных функций {Ux(t), — оо < х < оо, 0^/^Г}, удовлетворяющих условию Т , оо v2 j J 4 (*)£/* (/) rf* Л<оо (Р-п. н.). (8.140) Для завершения доказательства осталось лишь заметить, что функция px(t) удовлетворяет условию (8.140), поскольку Т j оо v2 Т Jм ( \A(x)Px(t)dx\ dt= jm[м(л(9,)|g-))f dt</(г. О \-'оо / О Теорема доказана. *) См. например, в [154] теорему 10 (стр. 63).
ГЛАВА 9 ОПТИМАЛЬНАЯ ФИЛЬТРАЦИЯ, ИНТЕРПОЛЯЦИЯ И ЭКСТРАПОЛЯЦИЯ МАРКОВСКИХ ПРОЦЕССОВ СО СЧЕТНЫМ ЧИСЛОМ СОСТОЯНИЙ § 1. Уравнения оптимальной нелинейной фильтрации 1. В настоящей главе будет рассматриваться пара случай* ных процессов (0, Q = {Qt) lt)> 0^/^Г, где ненаблюдаемая компонента 8 является марковским процессом с конечным или счетным множеством состояний, а наблюдаемый процесс | допускает стохастический дифференциал dlt = At{%l)dt + Bt{l)dWu (9.1) где W't — винеровский процесс. К такой схеме приводят многие задачи статистики случайных процессов, где ненаблюдаемый процесс принимает дискретные значения, а помеха носит характер «белого» гауссовского шума. В настоящем параграфе, существенно использующем результаты предшествующей главы, будут выведены и изучены урав* нения оптимальной нелинейной фильтрации. Интерполяция и экстраполяция рассматриваются в § 2 и 3. 2. Перейдем к точным формулировкам. Пусть (Q, #"", Р) — полное вероятностное пространство с неубывающим семейством непрерывных справа а-подалгебр &ь 0 < ^ < Г. Пусть 9 = (9„ #",), 0 < t < Г, — действительный марковский процесс со значениями в счетном множестве Е = {ау (3, у> •••}> непрерывный справа; W=s^7u 3Tt)y 0<£<Г,— стандартный винеровский процесс, не зависящий от 9, и £0-— ^-измеримая случайная величина, не зависящая от 9. Будем предполагать, что неупреждающие функционалы
§ 1] УРАВНЕНИЯ ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ 379 ЛДе, л:) и Bt(x)t входящие в (9.1), удовлетворяют следующим условиям: t i42(et,x)<Lj(l + 4)^(s) + L2(l+ef + ^, (9.2) О t О < С<Б?(х)<11 J (1+дф d*(s) + L2(l + **), (9.3) О I At (е„ х) - At (e„ у) |2 +1 Bt (x) - Bt (y) |2 < t < Lx j (*, - </s)2 dtf (5) + L2 (*t - yt)\ (9.4) 0 где С, Lb L2 ~ некоторые константы, К (s) — неубывающая непрерывная справа функция, 0^/((s)^l, x^CTt j/GCr, Наряду с условиями (9.2) — (9.4) будет предполагаться также, что Mgo < <*> (9.5) и t М J 8?Л<оо. (9.6) о В силу теоремы 4.6*) предположения (9.2) —(9.6) обеспечивают у уравнения (9.1) существование и единственность (сильного) решения \ = {\и ^,в,Т), 0<*<Г, с sup Uft < оо. Пусть к моменту времени 0^/^Г известна реализация |q = {|s, s^/} наблюдаемого процесса |. Рассматриваемая задача фильтрации ненаблюдаемого процесса 8 состоит в построении «оценок» величины 8, по go. Наиболее удобной характеристикой оценивания для 8, является апостериорная вероятность *Э(О-Р(е, = р|01). Р^£. Действительно, с помощью Jtp(0> P s £, могут быть получены самые разнообразные оценки величины 8^. В частности, условное математическое ожидание М(в/ р1)=2ряв(0 (9.7) *) Точнее, в силу очевидного обобщения этой теоремы на случай, когда функционалы a (t, х) в (4.112) заменяются функционалами At (e^, х).
380 ФИЛЬТРАЦИЯ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. 9 является оценкой, оптимальной в среднеквадратичном смысле. Оценка Р^(£), полученная из условия max Р (9, = р [ 5^|) = Jt(^ (|) (0, (9.8) является оценкой, обращающей в максимум апостериорную вероятность. 3. Сформулируем ряд вспомогательных утверждений относительно процессов 8 и £, которые будут использованы при доказательстве основного результата (теорема 9.1). Обозначим Рр(0 = Р(8/ = Р), РраС. s) = P(8/ = Pies = a), 0<s</<7\ р, as£. Лемма 9.1. Пусть существует функция Ka^(t), 0</^7\ а, р е Е, такая, что (равномерно по а, р) она непрерывна по t, | р^а(t + Д, /) - б(р, а) - Лар (/) • А |<о(Д), (9.9) где б (р, а) — символ Кронекера, а величина ^т >0(Д->0) равномерно по а, р, t. Тогда p$a(t> s) удовлетворяет прямому уравнению Колмогорова t /у (t, s) = б (р, а) + J «>ра (и, s) du, (9.10) S где 2*/V (И. S) = 2 Яур (И) /?ур (И, 5). (9.11) Вероятности p^(t) удовлетворяют уравнению t Р^) = Рь(0)+1*%(и)с1и, (9.12) 6 где 8>в(")= 2 A,yb(m)/>y(k). Y<=£ Доказательство. Пусть s = № < tT < ... <t(n=t и max|*/+i — ^/л)|->0, п->оо. В силу марковости процесса 8 PpaW+ь s) = P(e^=p|e, = a) = = M{P(e^i=p|e<(„, , e, = o)|e, = a[ = = M{P(9^i=P|e,(„, )|9s = a),
§ 1] УРАВНЕНИЯ ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ 381 ИЛИ РРа (tTlu S)= 2 Ppv {tflu tr)pya(t\n\ s). (9.13) Обозначим Тогда из (9.13) находим, что + 2^('ж>^Л'(Л s). (9.14) Из условий леммы и этого равенства вытекает, что функция Pfia(t, s) непрерывна по t (равномерно по a, р, s). Далее, в силу того же равенства (9.14) /=0 s ye=E .где фя(и) = 4л), когда *(/й,<и < *(#,. Согласно предположениям леммы а 2 1^в(фй(м))|руа(ф№(и), 5)</С<00. С учетом этого, а также непрерывности Яар(£), рра(/, s) по / (равномерно по а, р, 5) из (9.15) после предельного перехода (при п->оо) получаем требуемое уравнение (9.10). Уравнение (9.12) легко выводится из (9.10). Замечание. Величины Aap(/) называются плотностями вероятностей перехода из а в р в момент времени t.
382 ФИЛЬТРАЦИЯ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. 9 Лемма 9.2. Пусть выполнены условия леммы 9.1. Для каждого р е Е положим t *?=8(р, е,)-б(р, е0)- J us(,{s)ds. (9.16) О Случайный процесс Х^ = (х\, #~Д 0^£<Г, является квадратично интегрируемым мартингалом с непрерывными справа траекториями. Доказательство. Процесс дф, 0^/^7\ ограничен, |л||^2 + /(7\ и непрерывен справа в силу непрерывности справа траекторий процесса 8„ 0 ^ t < Т. Покажем, что Х^ = (х*}, &"Х 0</<7\ является мартингалом. Пусть t > s. Тогда *Н*2 + б(р, е,)-б(р, es)-JAeBe(«)d« и, следовательно, Гб (р, е,) - б (р, ев) - {ЯвиР (и) du\ pA, В силу марковости процесса 0 = (0/), 0<^<7\ и уравнения (9.10) М б (р, в,) - б (р, 8.) - J" Яецр (и) du | <Г = м б(р, е,)-б(р, es)-$\t(u)du\Qs S t = P&s & s> - б (P. e,) - J 2 \e (") />*>. (". s) = 0. Лемма доказана. 4. Теорема 9.1. Пусть выполнены условия леммы 9.1 и предположения (9.2) — (9.6). Тогда апостериорные вероятности Яр (/), р е £, удовлетворяют системе уравнений t t __ я»(0 = Р,,(0)+]>яр(цМ«+ J яр (и) ^j^/'*6* ^"' (9Л7)
§ Ц УРАВНЕНИЯ ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ 383 где Ъ\(и)= 2 Л^(и)яр(и), (9Л 8) Au(l)= S A,(y,6)jiv(m> (9.19) u W = (Wtt &~t) — винеровский процесс с t _ Wt=\dl"-B^)du. (9.20) о Доказательство. В силу леммы 9.2 t б (р, в,) = б (р, es) + | Чр МdM + х1 (9.21) о где X^ = (xt, £Ft) — квадратично интегрируемый мартингал. Поскольку процессы Х$ и W независимы, то (*Р, W)i^0 (Р-п. н.), Предположения (9.2) — (9.6) гарантируют возможность применения (к Л, = б(р, 8,)) теоремы 8.1, согласно которой 4®-4m + j*.W. + j *М>-У "» „»., (9.22, о о где яР(б) = М[в(р>в/)|^]-яр(/), я5 (Я) = М Ue,p (s) I *"!] = 2 Чр (s) яу (s) = S\ (s), ng (6Л) = М [б (р, в,) As (в„ |) | ^1] = As (p, |) яе (5), я5 (Л) = М [Л5 (в., £) | У|] = Аа (|) = " S 4 (v. I) *y (s). С учетом этих обозначений видим, что (9.22) совпадает с искомым представлением (9.17). Теорема доказана. Замечание. Если в (9.1) коэффициенты ЛД8„ |) не зависят от 8„ то Яр(0 = Рр(0 И Уравнения (9.17) превращаются в (прямые) уравнения Колмогорова (9.12). 5. Из (9.17) мы видим, что счетномерный процесс П = {яр(/)» Р^£), 0<^<Г, является решением следующей бесконечной
384 ФИЛЬТРАЦИЯ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. 9 системы стохастических дифференциальных уравнений: dzp (t, |) = Г И«(М)- 2 At (V. I) *Y С 6) = 'S4PWzv(M)-zp(M) ^t- X X 5] ^/(Y,6)2¥«. 6) rf/ + At (P, 6) - 2 ^ (v. i) *v (<. I) + *,('. Э *^ dU pe£, решаемой при условиях гр(0, g) = /^(0), ре£. Возникает важный вопрос о единственности решения этой (нелинейной) системы уравнений. Теорема 9.2. Пусть выполнены условия леммы 9.1 и предположения (9.2) — (9.6). Тогда в классе неотрицательных непрерывных процессов Z = {zp(tf,g), ре£}, 0</<7\ являющихся ^-измеримыми при каждом t и удовлетворяющих условиям Pisup 2 **(*,£)< С 1=1 <9*24) (с некоторой константой С), система уравнений (9.23) ижеег единственное решение {если Z и Z' — два решения, то Р{ sup | z$ (ty |) — z$(t, |) | > 0} = 0, ре£). Доказательство. Отметим прежде всего, что апостериорные вероятности II = {jtp(f), P е £}, 0<*<7\ принадлежат классу процессов, удовлетворяющих условиям (9.24), (9.25). Поэтому из утверждения теоремы следует, что в рассматриваемом классе процесс II является единственным решением системы (9.23). Заметим также, что предполагаемая непрерывность траекторий компонент процессов Z и условия (9.24), (9.25) обеспечивают существование соответствующих интегралов (по dt и d\t) в (9.23).
§ 1] УРАВНЕНИЯ ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ 385 Пусть Z = {z^(t, |), ре£), 0</<7\ есть некоторое решение системы (9.23) с 2р(0, |) = /?р(0), 2 рр (0) = 1. Обозначим ре=£ ЫМ) = ехр J^s. Bitt) "И <*|s 2 и, (y, i) zy (s, i) ds jp(f,g) = Zp(M)/*(*.£)• (9.26) (9.27) (В силу (9.25), (9.2) и (9.3) интегралы в (9.26) определены.) Из (9.26), (9.27), (9.23) с помощью формулы Ито находим, что h(M) = 1 + j h(s, S) Y"£ niM dts (9.28) 0 bHi) dii«, S) = У Чр (/) h (t, |) <tt + $p (*, 9-^Mrfl,. (9.29) Сравнивая (9.27) и (9.28), замечаем, что ' S ^. (v. i) 4v (*• Б) /*(',&)=!+ v"£ w„t, dL- (9.30) Поскольку P{0</z(/,£)< oo, 0</<Г}=1, то в силу (9.27) и (9.30) *„(*.£) = г ^^ • (9-31) 1 + IS о уе=Е ^ As (Y. Б) 5Y (5, Б) в2, (Б) <*Б* Если процесс 8 = ftp(/, Б), Ре£), 0<^<7\ является решением системы (9.29), то, применяя к правой части (9.31) формулу Ито, нетрудно убедиться, что процесс Z = {z^(tt £), реД 0</^7\ будет подчиняться системе уравнений (9.23). Таким образом, формулы (9.27) и (9.31) задают взаимно однозначное соответствие между процессами Z, являющимися решениями системы (9.23), и процессами $, являющимися решениями системы (9.29).
386 ФИЛЬТРАЦИЯ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. 9 Пусть ф(0 = ехр - j dh + 1 Г ^(9"{ 2 *;«> 6) ds (9.32) Тогда, если процесс Z удовлетворяет условию (9.24), то соответствующий ему процесс 5 подчиняется условию sup M( Ц М*,&)Ф (*))<«>. (9-33) Действительно, в силу (9.24) М 2 5р(М)Ф(0 = М/2(М)ф(^)-22р(М)< 0е=Е ' Э р < М/2 (/, |) Ф «) sup 2 z0 (/, |) < CMIZ (t, |) ф (0 < С < оо, где мы воспользовались тем, что МММ)ф(*) = ' 2 ^ (V. I) zY («. 6) - As (9S, g) = Мехр ys£ -Я Д*(6) 2 A*(V> Ъ)гу{8,1)-Аа{Ь8,Ъ) dWs- 12 ds < 1 (9.34) (см. лемму 6.1). В силу указанного выше взаимно однозначного соответствия между процессами Z и j для доказательства единственности решения (нелинейной) системы уравнений (9.23) в классе процессов, подчиненных условиям (9.24), (9.25), достаточно установить единственность решения (линейной) системы (9.29) в классе процессов, удовлетворяющих условию (9.33). Положим t t t , Vs4> И| J PPW -Г J B2Al) &i 2 J В2(Б) I и покажем, что система (9.29) эквивалентна системе уравнений t *р (*, I) = +J (Р) РР (0) + J +S (Р) J] Чр (s) 5y (s, I) ds. (9.35) о v^e Тот факт, что всякое решение системы (9.35) является в то же время решением системы (9.29), проверяется с помощью формулы Ито.
§ 1] УРАВНЕНИЯ ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ 387 С другой стороны, перепишем систему (9.29) в следующем виде: <ftPе. a-i^WM'- э+ <**('• б)]л+8э(*. i)^^,, (9.36) где ав (/, |) = 2 К* (t) JY (/, I). Уравнение (9.36) является (при заданном процессе аЛ/, |)) линейным относительно ^(Л|). Согласно замечанию к теореме 4.10 его решение можно представить в виде t k С Б) = *о (Р) Р* (°) + J +£ (Р) «з (*. У Л. (9.37) Таким образом, задача свелась к установлению единственности решения системы интегральных уравнений (9.35), особенность которой состоит в том, что в ней отсутствуют стохастические интегралы (по dls). Пусть Др (/, |) = Jp (t9 i) — gp (/, g) — разность двух решений системы (9.35), удовлетворяющих условию (9.33). Тогда t Ар (*, 1) = J *'. (Р) S Ч <s) Av <s' У ds (9-38) 0 Y Ф 3 И Ф (01 Ар (*. I) I < J +i (Р) Ф W S ЧР (*)I AY (s, g) | ds. 0 Y=*P Поэтому t Мф(/)|А„(/,6)К J Ц Яур (5) М (^ (Р) Ф (01 Av (s, |) |) rfs. о v*p Но М(г|><(Р)ф(/)|Ду(5,1)||^) = = | Ay(s, |) Ms) M [itf -J|g-1 ^ «] <|AY(s, |) |q>(s), поскольку M(+i(P>$g-|ni)<i. что устанавливается так же, как и неравенство (9.34), если учесть, что Я66(и)<^0.
388 ФИЛЬТРАЦИЯ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. 9 Следовательно, t М(ф(/)|Ар(/, 6)l)< J 2 V*)M(<P(s)|AY(sf6) \)ds О Y^P И ^ М(ф(/)|Аэ(/,1)1)< О fle=£ y =^3 </ 2 м(Ф(в)|\(5,|)|) 2ive)i*s< <2К J J M(f (s)| Ap(s, 6) |ds), (9.39) 0 fle=£ где мы воспользовались тем, что fte=£ I|J P^Y Из (9.39) следует, что t 2 М{ф(*)|Др(*,6).|}<2К/ ^ Mfo(s)|A„(s,6)|}rfs. 0е=£ 0 fte=£ Согласно лемме 4.13 отсюда вытекает, что 2 М {ф(ОI Aft(f,£) |}=0. ft ^ F Но Р{ф(/)>0}=1, значит, Р{|Др(М)|>0} = 0. Поэтому в силу непрерывности процессов $' и j" и счет- ности множества Е P[W*$-$(t.$\ = 0> 0<*<7\ ре£} = 1. Тем самым единственность решения (в классе процессов, удовлетворяющих условию (9.33)) системы уравнений (9.29) установлена. Из единственности решения (9.29), как показано выше, следует и единственность решения системы (9.23) (в классе процессов со свойствами (9.24), (9.25)). Замечание. Если At(Qh l) = At(Qt9 lt), Bt(Q = Bt(lt), то двумерный процесс (9„ lt), Q^.t^T, является марковским (относительно системы (3^), 0<^<Г): Р {9, г А9 h € В | *-,} = Р {9, е Л, |, е В | 8„ У. (9.40)
§ 1] УРАВНЕНИЯ ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ 389 Используя теорему 9.2 о единственности решения системы уравнений (9.23), можно показать, что в этом случае (бесконечномерный) процесс {lt, Яр(t), Р е £}, 0^/<Г, является марковским относительно системы (#~|), 0<^<Г: Р fees В, яр(*)е=Лэ> ре=£|<И} = = Р{£,е=В, яэ(ОеЛ0> pe£|£s, jtp(s), ре=£}. (9.41) 6. В ряде задач статистики (в частности, в рассматриваемых далее задачах интерполяции) возникает необходимость в знании уравнений, которым удовлетворяют условные вероятности «V С *) = Р (е* = РI Ри е* = <*)> (9.42) где 0<s<f<7\ Ясно, что если ра(0)=1, то юра(*, 0) = яр(0, причем яа(0) = ра(0)=1 и Яр(0) = 0 при всех $фа. Теорема 9.3. Пусть выполнены условия леммы 9.1 и предположения (9.2)—(9.6). Тогда условные вероятности {fi>pa(/, s), Р е £}, s ^ / ^ Г, удовлетворяют (при заданных as£ и s ^ 0) системе (Р е £) уравнений t {(t, s) = 6(p, а) + JVfi>po(a, s)dtf ©«- о < ' ^e (ft Б) — S^«(Y.6)cDYa(«, s) - «у(">*) V6ff2m J] Ai(Y* £)%»(«>*)** + ' Au (ft 6) - Ц ^a (Y. I) «V <M» s> + J ©Pa(«. *) ^§2^ <&• (9.43) В классе неотрицательных непрерывных функций {<0ра(/, s), Р е £, 5 ^ / ^ Г}, удовлетворяющих условиям Р/ sup 2 сора(/, s)<Cl=l (9.44) (с некоторой константой С), M«(Y,6)l<DYa(«. s)\2 Я*(Е) ^ rfM< oo [=1. (9.45) система (9.43) имеет единственное решение. Доказательство. Пусть (б2), s<w< Г, — марковский процесс с теми же самыми переходными вероятностями, что
390 ФИЛЬТРАЦИЯ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. 9 у исходного процесса 9, и удовлетворяющий условию 9? = а. Поэтому, в частности, P{9, = p|9s = a} = P{9? = p}, t>s. (9.46) Пусть, далее, (|(а> *°'], 0 ^ и ^ Г, — случайный процесс такой, что &'Ч) = 1и> и<*. (9.47) и при и> s &' Ч) - 5. + J 4 К 4" Ч)) dv + I Bv (б<- 5»)) dr0. (9.48) S S В силу предположений (9.2)— (9.4) уравнение (9.48) имеет единственное сильное решение (см. теорему 4.6 *)) и с вероятностью единица g(ee^o)==t u^Se Покажем, что Р-п. н. **) P{i,<^|es = a, Ц) = Р (i!a- *o) < у]. (9.49) Для этого заметим, что для каждого t^s найдется такой (измеримый) функционал Qt( • , • , •), определенный на С[о, S]X X E[S| *] X C[S| *ь гДе С[о, sj и C[s, t] — пространства непрерывных функций на [0, s] и [st t], а E[s,t} — пространство непрерывных справа функций, определенных на [st t], что ^Q^o-^) (Р-п-н.). (9.50) В силу отмеченной единственности сильного решения уравнения (9.48) для каждого t^s (Р-п. н.) &Л() = Я,($Н,К1). (9.51) Из (9.49), (9.50), независимости процессов 9 и IF, марко* вости процесса 9 и (9.46) следует, что Р %<х19S = а, Ц = **} = Р [Qt(& ej, W's)<х\9S = a, ?0=xs0}= - p {Q/ W U ^) < x | es = a) = p (q, « (e% r <) < x}. Вместе с (9.51) это и доказывает (9.49). *) См. также сноску на стр. 379. **) По поводу используемых здесь и далее обозначений для условных вероятностей см. § 2 гл. J.
§ 2] ПРЯМЫЕ И ОБРАТНЫЕ УРАВНЕНИЯ 391 Аналогично показывается, что для любых s ^ s{ ^ ... ^ sn^t и хи ..., хп^ R1 Р(0, = Р, l8l<xl9...t Ъап<хп\Ва = а, Щ = 8==р{ва=вр|БМ*)<Х|| _§ Б(Ц.Ч)<Х|1}. (9.52) Отсюда нетрудно вывести, что для s ^ t «у <'■■ 5) = р (е, = р | #1, е5 = а) = р (в? = р | ^И(а*ч)). Применяя к процессу (в", l)a' *°')f />s (с учетом очевидных изменений в обозначениях), теорему 9.1, получаем, что ®ра(*» 5) удовлетворяют (при фиксированных а и s) системе уравнений (9.43). Единственность непрерывного решения, удовлетворяющего условиям (9.44), (9.45), следует из теоремы 9.2. § 2. Прямые и обратные уравнения оптимальной нелинейной интерполяции 1. Пусть (9, |) = (9f, У, 0</< Г, — случайный процесс, введенный в предыдущем параграфе. Обозначим яр (*, t) = Р (в, = р | Р}\ s < f. (9.53) Зная апостериорные вероятности {яр (s, t), p e £}, можно решать разнообразные задачи интерполяции ненаблюдаемой компоненты по наблюдениям |о = {^«, u^f), s^/. В настоящем параграфе будут выведены прямые (по t при фиксированном s) и обратные (по s при фиксированном /) уравнения для Яр(з, /). Теорема 9.4. Пусть выполнены условия леммы 9.1 и предположения (9.2) — (9.6). Тогда для всех s, t (0^s<t^T) условные вероятности яр (s, t) удовлетворяют {прямым) уравнениям (np(s, s) = 7tp(s)) dtnz (s, t) = Щ (s, t) ВТ2 (|) Ъе At (y, I) Kp (*, s) - я, (t)] X Xfrfb- 2 i4,(Yi t)ny(t)at] (9.54) L ve£ J и могут быть представлены в следующем виде: Vs' 0 = яр($)ехр| J B52(|) J] Л«(У> 1)Кр(«» «) —«Y(M)]rfge- ( s y^£ ~ 7 J" B7* W ( [ 2 Л« (Y. i) «>Yp («. «)|2 - s I Lye=E J -[2 ^(Y^)"v(")]2U"j. (9-55)
392 ФИЛЬТРАЦИЯ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. 9 Доказательство. Поскольку jip(s, 0 = М[б(9„р)|<Г|], то по теореме 8.4 яэ (sf t) = М [6 (8„ р) | ^!] = М [б (8„ р) | Г\] + t + \ [Ви (I)]"1 {М [б (6„ р) Л„ (в„, 1)1 #1] - S - М [б (6„ р) | Pi] M [Au (Qu, I) I $~l\} dWu, (9.56) где W = {Wt, iFf) — винеровский процесс с _ г ^-M[^(e5,i)|y|]ds W<~) Ml) • О Здесь М[Л„(9„, 6)|^L] = Sile(Y, Б)яу(и), Y м[б(95, рмв(е„, g)l*i] = = М [б (9S, р) М (Лм (9S, I) | <Г*, 9S) | <Г|] = = ji3(s, и) 2 Au(y, |) со Ли, s). С учетом этого искомое уравнение (9.54) вытекает из (9.56). * Представление (9.55) следует из (9.54) и формулы Ито. Замечание. Из (9.54) и (9.55) видим, что в задачах интерполяции при вычислении условных вероятностей Jtp(s, t), ре£, требуется решать две вспомогательные задачи фильтрации (для нахождения пу(и) и а>уа{и9 s), u^s). 2. Для вывода обратных уравнений интерполяции нам потребуется ряд вспомогательных результатов, связанных с условной вероятностью Pap(5, O = P(e, = a|0l, 9, = р). Лемма 9.3. Пусть для заданного р е Е выполнено любое из двух условий: 1) РЭ(0)>0, 2) inf inf *„-(*)> е->0. Тогда для каждого t, О <! / <| Т, Р{я„(0>0}=1. (9.57)
ПРЯМЫЕ И ОБРАТНЫЕ УРАВНЕНИЯ 393 Доказательство. Из формулы Байеса (7.205) вытекает, что яр(/) обращается в нуль (Р-п. н.) одновременно с рр(/). Из (9.12) для р^У), Г>/>5>0, получаем представление рр (t) = exp I J Л^ (и) du j J рр (s) + + J exp - J Я,рр(1>)Л> J Kfl(M)Py(u)du |. (9 58) Поскольку 0<A,Y|} (0<^C при y =^= P> то из (9.58) вытекает, что для всех t^ s \ с I Pp(/)>exp(-/Ca-s))jPp(s) + epJ [l-Pp(tt)]<M. (9.59) Отсюда ясно, что если рд(0) > 0, то inf рМ) > 0. Если же рэ(0) = 0, а ер>0, то Pfi(t)>^j [l—Pfl(s)]ds. (9.60) Поэтому в силу непрерывности pp(s), s^O, из (9.60) следует, что Pfi(t)>0 по крайней мере для достаточно малых положительных /. Этот факт вместе с (9.59) доказывает, что рЛ/) > 0 для каждого t > 0. Лемма 9.4. Если Р{яр(г) > 0}= 1, го (Зля t^s , Л С0ра (/, S) ла (S, /) /л_ • Ра» (*»')= я|3(0 • (9-61) Доказательство. Если /^s, то М [б (8„ а) б (9,, р) 15^1] = М [б (6/, р) М (б (8„ а) | #1, 9,) \ #1] = = М [б (8„ р) Ра0, (s, t) | 3^) = Рар (s, /) яр (/). (9.62) С другой стороны, М [б (8„ а) б (8,, р) | Р\\ = М [б (8„ а) М (б (8/, р) | &\% Ва) \ &)] = = М [б (8S, а) (Dpes (Л 5) | ГЦ = яа (s, f) соРа (/, s). (9.63) Сравнивая (9.62) и (9.63) и учитывая, что P{n$(t)> 0}= I, получаем искомую формулу (9.61). Замечание. Формула (9.61) справедлива, если выполнено любое из условий леммы 9.3.
394 ФИЛЬТРАЦИЯ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. 9 Лемма 9.5. Пусть рр (0) > 0. Тогда процесс рар (s, t), где ае£, 0 ^ s < / ^ Г, допускает стохастический дифференциал dt94 (5, t) = -^y J *vp (t) ny (t) [PaY (s, t) - p4 (s, t)) dt (9.64) и pap(s, s) = 6(a, p). Доказательство. В силу условия р^ (0) > 0 и леммы 9.3 Р (яр (/) >0) = 1. Поэтому справедлива формула (9.61). Применяя к правой части (9.61) формулу Ито и учитывая, что Юра(*> 5)» яа($, t) и яр(0 допускают представления (9.43), (9.54) и (9.17) соответственно, после несложного подсчета приходим к искомой формуле (9.64). 3. Займемся теперь выводом обратных уравнений интерполяции, рассматривая при этом лишь случай конечного множества Е. Теорема 9.5. Пусть множество Е конечно и ра(0) > 0 для всех ае£. Тогда условные вероятности яа (s, t) = Р (б5 == а | *г|), $< t, ae£, удовлетворяют системе уравнений -^^--Ul'f^)-*$£«•«.<* (9.65) где 8(-s^rieS^(e)-^wr' (9>66) Доказательство. Прежде всего заметим, что яа (s, /) = М [б (в„ а) | Р\] = М [М (б (вв, а) | <И, Q,) \ Г)\ = = М [ра6. (s, t) | ЗГЦ = 2 PaY (*. 0 "v «). (9.68) Поэтому, если установить, что _ф^)= (в)8/«^\_.*^8. (в) (9>69) ds aV ; V Jta(s) / Jta(s) ov /» \ / то (9.65) будет следовать из (9.68). В силу леммы 9.5 у вероятностей pap(s, t) существует производная по t: д9а*Ы ° = ~^щ S Ы W "v (0 [Pay (*. t) - Pap (s, *)]. (9.70)
§ 2] ПРЯМЫЕ И ОБРАТНЫЕ УРАВНЕНИЯ 395 Пусть R (s, t) =|| pap (s, t) ||, а, pG£. Матрица R (s, /) является фундаментальной: R(st s) — единичная матрица, и ?^<±Jl = R{S)t)C(t,<*), (9.71) где С (t, со) — матрица с элементами Ka(t)na(t)- 2 VC^vW саа (t, со) = ^f , являющимися Р-п. н. непрерывными функциями, поскольку jty(7), Яуа(/) (у, ае£) непрерывны по /, а множество Е конечно. Если s < и <t, то в силу свойств фундаментальных матриц R(s, t) = R(s, u)R{uy t). Поскольку матрица R(s, и) (Р-п. н.) невырождена, R(u, t) = R-l(s, u)R(s, t). (9.72) Из (9.71) и очевидного тождества = _д следует, что ~R~l(s, u)=~-C(ut со)/?-1^, и). 0 = ^-(/?(s, u)R~l(s, и)) Поэтому -~-R(ut О^-^/Г1^, u)R(s9 /) = = С {иу со) R'1 (sy и) R (s, t) = C {и, со) R (и, /) и, следовательно (при s < t), --jiR(sit) = C(s,^)R(s)t). Покоординатно расписывая эту систему, приходим к системе уравнений (9.69), из которой, как уже отмечалось, вытекают уравнения (9.65). Замечание. Если в (9.1) коэффициенты At(Qt> £) не зависят от е„ то рар (s, t) = р (es = а | е* = р, &~})=р (es=a | е*=р)= = Рар(5> 0- При этом если множество Е конечно и рр(0)>0, ре=£, то
396 ФИЛЬТРАЦИЯ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. 9 § 3. Уравнения оптимальной нелинейной экстраполяции 1. Для s^/^Г обозначим jtp(f, s) = p(e, = p|<Ff), pe=£. Знание этих вероятностей позволяет решать разнообразные задачи, связанные с прогнозированием значений 8, по наблюдениям ^=(|и, w<s}. Так, если М8,<оо, то 2 Р^(^, s) является оптимальной (в среднеквадратическом смысле) оценкой 8, по |q. Для вероятностей n^(tt s) можно получать уравнения как по t (при фиксированном s), так и по s (при фиксированном /). Первые из этих уравнений (которые естественно назвать прямыми уравнениями) дают возможность понять, как ухудшается прогноз значений 8/ по £*, когда t растет. Из уравнений по s (t фиксировано) можно судить о степени улучшения прогноза значений 8, с ростом «числа наблюдений» (т. е. при s f t). 2. Теорема 9.6. Пусть выполнены условия леммы 9.1 и предположения (9.2) — (9.6). Тогда для каждого фиксированного s условные вероятности {n^(t, s), t^st р е Е) удовлетворяют {прямым) уравнениям t n$(t> s) = Яр(s) + ]S*Jtp(w, s)du, (9.74) s где 8*jifi(w, s) = 2 Ач,в(и)я„(м, s). Система уравнений (9.74) имеет единственное решение (в классе неотрицательных непрерывных решений) xAty s) с sup 2*ft(/, s) < oo (Р-п. н.). При фиксированном t условные вероятности {n${t, s), s^t, Pg£} допускают представление t np(f, s) = *i(t, 0)+ | Bu2(l){^ P^(U u)n,(u)[Au(v, $)- 0 ye=E - 2 au(Y, i)nY(«)11[rf^-И4(v. I)*Y(")<H• <9-75) Y^H JJL Y<=£ J Доказательство. Для вывода уравнений (9.74) воспользуемся тем, что при t^s *„('• *) = Р(в/ = Р1^) = М[Р(в, = Р|^)|Г|] = = М [Я(1 (/)|Гв] (9.76)
§ 31 УРАВНЕНИЯ ЭКСТРАПОЛЯЦИИ 397 и согласно (9.17) t t _ яр (t) = яр (s) + J 2*яр (и) du + J яр (и) Л(Р'^~}Лц(|) diFe, (9.77) S S Тогда, беря от обеих частей (9.77) условное математическое ожидание М [ • | *Г|], получим + М ( J яр (и) Ла(Р'|^|}1ц(1) rf Г» | У|). (9.78) Но / t М |8*яэ(и)й?и|^"5 = J J] Ау3 (и) М [%(«)! *"*]<*« = \5 J S У<Е=Е t t = f V \p(w)jiY(w, s)rfa ='Г 8*яр(и, s)dw. (9.79) s Ye£ 5 Далее, при выводе основной теоремы фильтрации (см. замечание к теореме 8.1) было установлено, что случайный процесс является квадратично интегрируемым мартингалом. Следовательно, М И яр (и) Аа (Р']> -f*(l) dWu [У! J = 0 (Р-п.н.), что вместе с (9.78), (9.79) доказывает справедливость уравнений (9.74). Пусть Xfi(tt s) и x$(tt s) — два решения системы уравнений (9.74). Тогда t x$(t, s)—Xfi(t, s)= j V AYp(w)[*Y(w, s) —xY(tf, s)]rfw 5 Y^£
398 ФИЛЬТРАЦИЯ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. 9 и, следовательно, 5J|*pC s)-xb(t, s)|< t s yg£ pe£ Заметим, что 2 \КЛи) | = 2 Кь(и)--Кч(и) = —2A,vv(w)< 2/(. 0e=£ ур p^=Y Поэтому t JJUpC» $) —*(*('» 5)|<2/C J 2 Up (и, s) —*р(и» ^)|dw, и по лемме 4.13 2 Upd s) —*£(<> 5)1 = 0 (Р-п. н.). Этим доказана единственность решений прямой системы уравнений (9.74). Установим теперь представления (9.75). Рассмотрим для этого случайный процесс Y = (ys, @~s), 0<s</, с ys=ppQs(t> s). В силу марковости процесса 9=(9S, @~s) М (у, \ЗГа) = М [p^s (t, s) \&~U] = M [p^s (t, s) 19J = = 2 P&(U s)pyQu(s, u) = ppu(t9 u) = yu (Р-п. н.), u^s. Поэтому процесс Y = (ySi !FS), 0<s</, является квадратично интегрируемым мартингалом. Поскольку при t^s s яр(/, s)=M[6(9,, р)|^|] = М[М(б(9„ р)|<Г5)|<г|] = = М [М (б (8„ р) | в.) 1&)] = M (ррв, С. 5) I Р\) = М [у, I #1], то по теореме 8.5 яр(/, «) = я„(*, 0)+ jau(l)dWu, о где ав(а = В«,(Э[М(ррввС. "М-(в,,, 6)1*1)- - М (р^и (/, и) | У$) М (Л, (9W, Q | <Г*)]. Теорема доказана.
§ 4] ПРИМЕРЫ 399 § 4. Примеры Пример 1. Пусть 9 = 9(со) — случайная величина, принимающая два значения р и а с вероятностями р и 1—р соответственно. Предположим, что наблюдению подлежит случайный процесс ltt />0, с dtt = Qdt + dWtt £0 = 0. Тогда апостериорная вероятность я(/) = Р {9 = р \@~)),удовлетворяет согласно (9.17) уравнению dn (t) = (|3 - <х) я (/) (1 - я (0) № - (а + я (f) (р - а)) Л], я(0) = р. (9.80)" В частности, если Р=1, а = 0, то dn (t) = я (t) (1 — я (/)) [dg, — я (/) dt] (9.81) с я(0) = р. Если <р(0=трМ'| 1)""плотность Радона—Никодима мерыщ, отвечающей процессу | с 9 = 1 по мере \х0, соответствующей процессу I при 9 = 0, то из формулы Байеса следует, что при я (0=т=7 ф (0/(1 + т=7 ф (0) * (9-82) В рассматриваемом случае «отношение правдоподобия» (см. теорему 7.7) ср(0 — ехр< £,— у } и, следовательно, Лр(*) = Ф (*)<*£/. (9.83) Представление (9.81) можно было бы также вывести из (9.82) и (9.83). И наоборот, (9.83) легко следует из (9.81) и (9.82). Отметим, что апостериорная вероятность я(/) (так же как и ф(/)) является достаточной статистикой в задаче различения двух простых гипотез*) Я0: 9 = 0 и Н{: 6=1. Пример 2. Пусть 9,, t^0t — марковский процесс, принимающий два значения 0 и 1 с Р(60=1) = р, Р(90 = 0)=1—р и единственным переходом из 0 в 1: Я00= — Я, ^oi==^> ^io==0> Яи = 0. Пусть наблюдается случайный процесс t lt=JQ8ds+Wt *) Подробнее см., например, [169], гл. 4.
400 ФИЛЬТРАЦИЯ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. 9 (к такой схеме приводится так называемая задача о «разладке», [169], состоящая в скорейшем обнаружении момента Э изменения коэффициента сноса у наблюдаемого процесса в предположении, что P{B>t\Q>Q} = e~M, Р(8 = 0) = р. В рассматриваемом случае апостериорная вероятность Я(*) = р(е, = ц<И) (=р{е</|#1}) удовлетворяет (согласно (9.17)) уравнению dn(t) = K(l—n (/)) dt + я (t) (1 — я (*)) (d\t — я (t) dt) (9.84) с я(0) = р. Заметим, что я (/) = М (91\ tFfj. Поэтому я(/) является оптимальной (в среднеквадратическом смысле) оценкой значений 9, по наблюдениям |J=(|S, s</}. Пример 3. Пусть 9„ t ^ 0, — марковский процесс с двумя состояниями 0 и 1. Предположим, что Р (90 = 0) = P(9d= 1)=-2-> плотности вероятностей перехода Xa^(t) не зависят от t и Я0о= — Я, Я0! = Я, Яю = Я, Хц = — Я. (Процесс 9„ ^0, называется «телеграфным сигналом».) Пусть наблюдаемый процесс £„ /^0, допускает дифференциал dlt = Btdt + dWt9 g0 = 0. (9.85) Апостериорная вероятность я (t) = Р (9, = 1 |#~|), являющаяся в данном случае оптимальной (в среднеквадратическом смысле) оценкой значений 9„ удовлетворяет стохастическому уравнению dn (t) = Я (1 — 2я (t)) Л + я (f) (1 — я (t)) (dlt — я (t) dt) (9.86) с я(0) = -±. Аналогично, ©n(f, s) = P(9, = 1 |9S= 1, ^"^удовлетворяет уравнению t (ои(/, S)= 1 + Я J [1 — 2<оп(и, s)]dw + 5 + Jo)u(w, S)[i—©„(m, s)][rf|a — соц (и, s) du]. (9.87)
§ 4] ПРИМЕРЫ 401 Обозначим для 5<t n{{sy t) = Р(9S = 1 |&~)). Тогда из (9.55) видно, что п\ (s, t) является оптимальной (в среднеквадратиче- ском смысле) оценкой 9S no gj, s^/: !t J Ki(w, s) — 7t(u)]dlu — ~~~2 J Ki(w> s) — n2(u)]du Пусть теперь для t^s n{(t9 s) = P(Qt = 1 |^|). Тогда согласно (9.74) fli (/, s) — я (5) + ^ J [ 1 — %Щ (и> 5)] rfw- s Отсюда находим я, (/, s) = я (s) e~2* <*-•> + j (1 — е"2Л ('"s))- (9.88) В силу (9.75) я, (?, $) = Я!(/, 0) + + j [Рп (*» и) — Рю (*» w)] я (и) (1 — я (и)) [d£tt — я (и) du ]. о Нетрудно найти из (9.12), что Pn(t, и) = ±{\+е-^-% pl0(t, и) = ±(1-е-*ч-*). Поэтому Щ V, s) = -i + у J я (и) (1 - я (и)) е~2* «-"> [rf£e - я (и) ^]. (9.89) о Величина щ (t, s) является экстраполяционной оценкой 9^ по |о, $</.
ГЛАВА 10 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ НЕСТАЦИОНАРНАЯ ФИЛЬТРАЦИЯ § 1. Метод Калмана—Бьюси 1. На вероятностном пространстве (Q, #~, Р) с выделенным на нем семейством а-подалгебр (tFt), t ^ 7\ рассмотрим двумерный гауссовскии случайный процесс (9„ |,), 0 ^ t ^ 7\ удовлетворяющий стохастическим дифференциальным уравнениям dQi = a(t)Btdt + b(t)dWl(t)9 (10.1) dh = A (t) Qtdt + B (t) dW2 (t), (10.2) где Wi=(W{(t), &~t) и W2={W2(t), Ft)—Два независимых вине- ровских процесса и 90, |0 #~0-измеримы. Будем предполагать, что измеримые функции a(t), b(t), A{t), B(t) таковы, что \\a{t)\dt <ooy о т J| A(t)\dt<oot J b2(t)dt <oo, j B2(t)dt < oo. (10.3) (10.4) Из теоремы 4.10 следует, что линейное уравнение (10.1) имеет, и притом единственное, непрерывное решение, задаваемое формулой t 1 г t ( s \ 9/ = ехр J a(u)du 90+J ехр I — J a(u)du }b(s)dW{(s)\ э J L о ( о j J .(10.5) Задача оптимальной линейной нестационарной фильтрации (Qt по £J), рассмотренная Калманом и Быоси, состоит в следующем. Пусть процесс 9,, 0</<7\ недоступен наблюдению,
§ 1] МЕТОД КАЛМАНА - БЬЮСИ 403 а наблюдать можно лишь значения |„ 0^/^Г, несущие в себе неполную (в силу наличия в (10.2) множителя A(t) и помехи J B(s)dW2(s)\ информацию о значениях 8,. Требуется в каждый момент времени t оценивать (фильтровать) «оптимальным» образом значения 8/ по реализации £o={£s> 0<S</}. Если под оптимальным понимать оценивание, наилучшее в среднеквадратическом смысле, то оптимальная (в момент времени /) оценка для 8, по |J=(£s, O^s^^J совпадает с условным математическим ожиданием *) mt = M(Qt\&~}) (10.6) (в обозначениях гл. 8 mt = nt(Q)). Ошибку оценивания (фильтрации) обозначим yt=M(Qt-mtY. (10.7) Метод, примененный Калманом и Бьюси для нахождения mt и yt1 позволил им получить для этих величин замкнутую систему рекуррентных уравнений (см. (10.10) — (10.11)), что оказалось весьма удобным при практической реализации оптимального «фильтра». Рассмотренный Калманом и Бьюси процесс (8,, |,), 0^/^Г, является гауссовским. Как следствие этого оптимальная оценка mt = М (81\ #~|) оказывается линейной (см. далее лемму 10.1). В следующей главе дается существенное обобщение схемы Калмана — Бьюси. Там будет показано, что в так называемом условно-гауссовском случае для mt = М (8, | @"f) и yt = = М[(8; — w,)2|#"£] также можно получить замкнутую систему уравнений (см. (12.29), (12.30)), хотя оценка mt будет уже, вообще говоря, нелинейной, В случае (10.1), (10.2) уравнения для mt и у, могут быть легко выведены из общих уравнений фильтрации, полученных в гл. 8. Это будет проделано далее в § 2 и 3. В п. 2—4 настоящего параграфа будет изложен (с некоторыми модификациями и уточнениями) тот вывод уравнений фильтрации для mt и yt, который был первоначально предложен Калманом и Бьюси. Как уже отмечалось во введении, в основе этого вывода лежит представление (10.24) (в случае т0 = 0). В п. 5 будет дан иной (более простой) вывод этих же *) Всюду далее будут рассматриваться только измеримые модификации условных математических ожиданий.
404 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 уравнений, использующий то обстоятельство, что mt можно представить в виде (10.52), где W — обновляющий процесс. 2. Теорема 10.1. Пусть (8„ £,), Q^t^T,-—двумерный гауссовский процессу управляемый системой уравнений (10.1), (10.2). Пусть выполнены условия (10.3), (10.4) и т [ Л2(/)^<оо, (10.8) б В2(0>С>0, 0<#<7\ (10.9) Тогда условное математическое ожидание mt = М(9, |#~|) и среднеквадратическая ошибка фильтрации Y/=M(9/ — mt)2 удовлетворяют системе уравнений v Л (t) dmt = a (t) mt dt. + *в, {t) (d$t — A (t) mt dt), (10.10) Л2 (t) v2 Y/ = 2a(/)Y/ W(iT + b2(t) (10.11) с m0 = M(e0Uo), Yo=M(e0—m0)2. Система уравнений (10Л0), (10.11) имеет единственное непрерывное решение (для yt—в классе неотрицательных функций). 3. Доказательству предпошлем ряд вспомогательных утверждений. Лемма 10.1. Пусть £ = (|,, !Ft), 0 < t < Г, — гауссовский случайный процесс с t t h = lo+ j*sds+ j B(s)dWSi S2(s)>C>0, 0<s<7\ (10.12) где винеровский процесс W = (Wti ^t) не зависит от гауссов- ского процесса a = (ati&~i), 0</<7\ с M(a,|g0) = 0 и Р И a2sds<oo j = l. (10.13) Тогда, если случайная величина ч) = ц((й) и процесс £ = (!/), 0 < t < 7\ образуют гауссовскую систему, то для каждого t> 0=О<7\ найдется функция G(t, s), 0<s<^, с t j G2(t, s)ds <oo (10.14)
§ 1] МЕТОД КАЛМАНА - БЬЮСИ 405 такая, что (Р-п. н) t М (л I Г)) = М (л 1|0) + J G (*, s) 4,- (Ю. 15) о Доказательство. Прежде всего заметим, что из усло- т вия (10.13) вытекает, что \ Mctfdt < оо (лемма 7.2). Пусть о 0 = t{Q] < t[n) < ... <t$ = t — двоично-рациональное разбиение . у отрезка [0, *], ft" =-^rt. Обозначим Тогда, поскольку 9Г\ \ £Г\, то иб теореме 1.5 с вероятностью 1 м(л10"|я)-*М(т||0"|). (10.16) Последовательность случайных величинам (л \ST\ nJfy я=1,2,...} равномерно интегрируема. Поэтому из (10.16) следует, что 1. 1.т.М(л|У||Я) = М(л10"!). (Ю.17) По теореме о нормальной корреляции (теорема 13.1) для каждого п=\у 2, ... (Р-п. н.) М (г, IП я) = М (т, | у + S Ой {U tf) ^ { - ty>] (10.18) с некоторой (неслучайной) функцией Gn(t, t{fn)), 0</<2rt l. Обозначим Gn(t,s) = Gn{t9tf)), t^^sKtflr Тогда равенство (10.18) может быть переписано в следующем виде: t М (Л IП ж) = М (Til lo) + / Gn (t, s) d%. (10.19)
406 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 Из (10.19) и независимости процессов а и W следует, что ЩМ(п\Пп)-Щч\Пт)]2=м^[оп(1,8)-от«,8)\*Ц = = М U[Gn(t, s)-Gm(t,s)]asds\ + + MU [Gn(t, s)-Gm(t, s)]B(s)dW5\ = = mU [Gn(t, s)-Gm(t, s))asds\ + t + J [Gn (t, s) - Gm (t, s)]2 S2 (S) ds. (10.20) Но в CHjfy (10.17) lim M\MM Г) п)—МЫ\Г) m)f = 0. По- этому согласно (10.20) и неравенству B2(s)^C>0, 0^s<7\ t lim f[G„(^s)-Gm(*, s)]2ds = 0. Иначе говоря, последовательность функций {Gn{ty s)t n=l, 2, ...} является фундаментальной в L2[0,t]. В силу полноты этого пространства существует (при данном t) измеримая по s, O^s^t, функция G{t, s) e L2[0, t) такая, что lim f [Q (t, s) — Gn (t, s)]2ds = 0, (10 lim \[Q(t,s) — Gn (tt s)]2 B2 (s) ds = 0 t Поскольку же M \ a]ds <°o, то из (10.21) вытекает, что и о lim M [[Gn{t,s) — G(t, s)]asds\ = 0.
§ 1] МЕТОД КАЛМАНА - БЫОСИ 407 Следовательно, t t lim | Gn(tts)d%s = J G(t,s)d%st n о о что вместе с (10.17), (10.19) доказывает представление (10.15). Следствие 1. Пусть W = (Wt> &~t)f 0 < * < Г, — ейяе/юв- ский процесс и л = т1(со) — (гауссовская) случайная величина такая, что (т), W) образует гауссовскую систему. Тогда Р-п. н. для любого tt O^t^Ty t M(ril Ff) = Mr\+ JG(t, s)dWst (10.22) о где G(t, s), 0 ^ s ^tt—детерминированная функция с f G2(tt s) ds < oo (ср. с (5.160)). В частности, если случайная о величина r\ STJ'-измерима, то т)-Мг] + \G(U s)dWs Следствие 2. Пусть выполнены условия теоремы 10.1, mQ = 0. Тогда для каждого t, 0 ^ t ^ Г, существует функция G(t,s), 0^s^/, такая, что t t J G2(tt s)ds<ooy j G2(t, s)B2(s)ds< oo, (10.23) j j G(tyU)G(t, v) A (u) A (v) M (0tt, Qv)dudv < о о и для mt = M (б* | У\) справедливо представление t mt= j G(ty s)dts: (10.24) о Из леммы 10.3 будет вытекать, что у функции G (t, s), участвующей в представлении (10.24.), существует модификация, измеримая по паре переменных. Лемма 10.2. Пусть выполнены предположения теоремы 10.1 и т0 = 0 (Р-п. н.). Тогда для каждого t, Q^t^T, функция G (tt s)t 0^s ^.ty удовлетворяет интегральному уравнении)
408 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 Винера — Хопфа: при почти всех и, 0 ^ и ^ /, K(t,u)A(u) = t = J G(tts)A (s) К (s, и) А (и) ds + G (f, и) fi2(w), (10.25) о где K{Uu) = №flu. Доказательство. Отметим прежде всего, что из предположения т0 = 0 (Р-п. н.) следует, что М60= Мт0 = 0, и в силу (Ю.5) М8, —0, 0<*<7\ Далее, интеграл J G{t, s)A{s)K(s, u)ds существует и коне- о t т чен, поскольку J G2{t, s)ds < оо, J* A2(s)ds < оо, a /((5, и)огра- o о ничена, как непрерывная (по паре переменных) функция, допускающая согласно (10.5) представление К (s ,и) = exp а. и- | a (z) dz -f a (z) dz M8o + S /\ U + J exp -2 Ja(#)dj/U2(z)tfz, (10.26) где s Au = min (5, и). Перейдем теперь к выводу уравнения (10.25). Пусть t^ [0, Г] и /(/, s), 0^s*0, — ограниченная измеримая (по s) функция. Рассмотрим интеграл I(t)= Г f(t, s)dls. Эта случайная вели- о чина ^-измерима, и, как нетрудно проверить, М < оо. Поэтому т. е. J fit, s)d& о t M(Qt-mt)jf(t,s)dls = 0, о t t MQtjf{t, s)dls = Mmtjf{t,s)dls (10.27)
§ 1] МЕТОД КАЛМАНА - БЬЮСИ 409 Поскольку случайные величины fy и j /(/, s)B(s)dW2(s)ne32i- висимы, то t ме, j f (t9 s) dis = ме J / (/, s) a (s) qs ds + о о t t + №tjf(t9 s)B(s)dW2(s)=MQtjf(t9 s)A(s)Q3ds = о о t t = j f(t, s)A(s)MQtQsds= J" f(t9s)A(s)K(t9s)ds. (10.28) о о С другой стороны, используя представление (10.24), находим, что t Mmtjf(t, s)d$s = M j G(t, s)d$s j" f(t, s)dls = = M X j G(t,s)A(s)Qsds + J G(t, s)B(s)dW2(s)\x j f{t, s)A(s)Qsds + jf(t, s)B(s)dW2(s) . (10.29) ) о J Воспользуемся снова независимостью Г G (t, s) A (s) Qs ds и о t t t jf{t,s)B(s)dW2(s), jf(t9s)A(s)Q8ds и j G(t,s)B{s)dW2(s). 0 0 0 Тогда из (10.29) получим t t Mmtjf(t,s)d$s=MJ J G(t9s)A(s)BfiuA{u)f(t9u)du + 0 0 0 t t + M J* G(t9 s)B(s)dW2(s) | f(t9 s)B(s)dW2{s) = о о * t J JG(/, s)4(s)/((s, и) A(u)f(t9 u)dsdu + t + j'G(t9 u)B2(u)f{t, u)du. (10.30) о о
410 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 Сравнивая (10.27), (10.28) и (10.30), а также учитывая произвольность функции f(t>u), получаем требуемое равенство (10.25). Лемма 10.3. Пусть t е [0, Т] фиксировано. Решение G {t, s), O^s^ty уравнения (10.25) единственно*) (в классе функций, удовлетворяющих условиям (10.12)) и задается формулой G(tts) = q>tsG(s,s)t (10.31) где a (p{s является решением дифференционального уравнения dt Л2(>)1 * с 1 Доказательство. Установим сначала единственность. Пусть Gi(t, s), /=1,2,— два решения уравнения (10.25) такие, что t t j G\ (t, s) ds < oo, J G\ (t, s) B2 (s) ds < oo. о о Тогда Д(/, s) = G\ {t, s) — G2(t> s) является решением уравнения t j Д (/, s) A (s) К (s, и) А (и) du + /± (t, и) В2 (и) = 0. (10.34) 0 Умножая обе части этого уравнения на Д (t, и) и интегрируя по и от 0 до t, получаем t t j J" A(f, s)A(s)K(s, u)A(u)H(t,u)dsdu + о о t + J Д2 (ty и) В2 (и) du = 0. (10.35) о В силу неотрицательной определенности корреляционной функции К (s, и) t t j j [A(f, s)A(s)]K{s, u)[A(u)b(U *)]>0. о о *) Два решения Gi(tys) и G2 (/, s) считаются совпадающими, если G\ (t> s) «= G2(t> s) для почти всех s, 0 ^s ^ L
§ 1] Поэтому МЕТОД КАЛМАНА - БЬЮСИ JA2(/, u)B2(u)du = 0, 411 и так как inf B2(u)>0, то /i(t,u) = 0 для почти всех и, 0<и<*. Заметим также, что уравнение (10.33), определяющее функцию qp', имеет, и притом единственное, непрерывное решение. Это следует из теоремы 4.10 и того факта, что т J I a (t) - у/ B*(t) Л< J MO I Л- sup ме? Г <>^ JA*(t)dt <oo; о константа С определена в (10.9) Установим теперь справедливость формулы (10.32). Из (10.25) находим t G(t, t)В2(t) = Kit, t)A(i)-JG(t, s) A(s)К(s, t)A(t)ds = о t = M9? A (t) - J G (t, s) A (s) М9Д A (t) ds = = M Qt- j G(t,s)A(s)Qs M(f). (10.36) Поскольку MBt\ G(t, s)B(s)dW2(s) = 0, то правая часть в (10.36) равна М 9, - J G(/, s) Л (s)e,ds - J G (t, s)B(s) dW2(s) M(/) = = M e, - J g (г, s) dg e,4(f) = M[e,-m,]M(f) = = M (Qt - mtf A (t) + M (6, - mt) mt. (10.37) Ho M (Qt — тг) mf Л (t) = 0, a M (0* — mtf = yt. Следовательно, в силу (10.36) и (10.37) G(t, t) B2(t)=yt A(t), что и доказывает (10.32) Решение уравнения (10.25) будем .искать в предположении, что функция G (/, s) почти всюду дифференцируема по t
412 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 (s^rf^r). Это предположение не ограничивает общности, так как если у уравнения (10.25) существует такое решение, удовлетворяющее условиям (10.23), то в силу доказанной единственности оно и будет искомым. Установим прежде всего, что функция /((/, и) почти всюду дифференцируема по t(t^u) и дК£и) =a(t)K(t,u). (10.38) Действительно, в силу (10.1) t t Qteu = е* + J a (v) еиеУ dv + qu j ь (v) dw{ (v). и и Беря от обеих частей этого равенства математическое ожида- t ние и учитывая, что М9* J b2(v)dv < оо, находим и t К (t, u) = K(u,u)+ J a (v) К (и, v) dv. (10.39) и Это и доказывает справедливость уравнения (10.38). В предположении указанной дифференцируемости функции G(t,u) продифференцируем по t левую и правую части уравнения (10.25). Принимая во внимание (10.38), получаем a{t)K{t, и)A{u) = G{U t) A{t)K{U и) А{и) + t + j -^p1 A (s) К (s, и) А (и) ds + Щ£- В2 (и). (10.40) о Но согласно (10.25) t K{t,u)A{u)= j G(t, s) A(s)K(s, и) A(u)ds+ G (t, и) ВЦи) G(t t)= ytA(t) и \i, i) — B2(t) * Поэтому (10.40) преобразуется к следующему виду: t I{[°")--w10(<'s)~ ""я "}*(')*('."ММ<*» +
§ 1] МЕТОД КАЛМАНА - БЬЮСИ 413 Отсюда ясно, что функция G (/, s), являющаяся решением уравнения 6G (/, s) dt A(s) [a(t)-^y']G(t> s), t>s9 с G(s> s) = ysjj2(pr удовлетворяет и уравнению (10.41). Лемма 10.3 доказана. 4. Доказательство теоремы 10.1. Предположим вначале, что т0 = 0 (Р-п. н.). Тогда в силу лемм 10.1 и 10.3 t t t mt = JG(t, s)d$s=$G(s, s)4t,dl, = ti /КГ'т^ГГ^. (10-42) \-l поскольку ф^=фЦф*) . Учитывая, что d\t=A (t) Qt dt+B (t)dW2(t), с помощью формулы Ито из (10.42) находим <*% dmt=-ir г. ВЦз) dl 1 а* л У(<) аь (10.43) Но a{t) Поэтому в2 (о JY° <*Фо г г Lo уИ(») ■I Ь B*{s) dt \ = [a(t) VtA2(t) в2 (0 J mt, что вместе с (10.43) приводит (в случае щ = 0) к уравнению Г ч vH2(01 v,A(t) dm, = \а(t) — lB2(t) Jm,Л + -gF^j-4/. совпадающему с искомым уравнением (10.10). Пусть Р{m0 9*= 0} > 0. Введем процесс (Qt, %t) 0<* <7\ с t $a(s)ds (10.44) Ь, = в,-т^ S * J а (и) du lt = h m. >JA(s)t ds. Тогда dot^aWotdt + bWdWiW, ё0==6 dit = A(t)Qtdt + B(t)dW2(t), |0 = |0. о — «о» (10.45) (10.46)
414 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 Обозначим /п* = М (б* | £"!) и yt = М (8, — mf. Поскольку |о = £о> т0 в СИЛУ (10.45) и, следовательно, t t J a(s)ds J a (s) ds fht=M (0* | f\) = M {Bt I #1) — т0е° =mt- tn0e° (10.47) Согласно доказанному dm Заметим, что (10.48) Y,= M(e,-m,)2=M /■ (s) rfs L \в/ — т0е° /а (s) ds — \mt— m0eu = M[9,-mJ2 = ^ Поэтому (10.48) с учетом (10.45) и (10.47) можно переписать следующим образом: J a (s) ds dmt—m0a {t) e° dt^ = [a(t)- A2(t)yt] B*(t) J _mt—m0e° | a(s) ds dt+ J a (s) ds m0A (t) e° dtm После простых преобразований отсюда получаем требуемое уравнение (10.10) для ntt = М(9;|&~}). Выведем теперь уравнение (10.11) для yt = M[Qt— mj2. Обозначим 6t = Qt — mt. Из (10.1), (10.10) и (10.2) получим у Л2 (/) у Л (О dbt = a (t) 6tdt + b (t) dWx (t) - ^y 6, dt + \щ- dW2 (t). Отсюда с помощью формулы Ито находим 6? = бо + 2 J о a(s) ysA*(s) B*(s) 6S ds +i то+4^гИ5+ + 2 J 6S6 (s) <W, (s) + 2 J 6S ^yi dlT2 (s), (10.49)
§ 1] МЕТОД КАЛМАНА - ВЬЮСИ 415 Замечая, что M6J = y^ и t t М J Ь8Ь (s) dW{ (s) = 0, M J 6S J^gl dW2 (s) = 0, о о из (10.49) получаем vUHs) Vt = Vo + 2 j[a(s)-^^\Vsds+ j[bHs) + B*{s) ds. После очевидных упрощений это уравнение приводится к искомому уравнению (10.11). Докажем теперь заключительную часть теоремы, касающуюся единственности решения системы (10.10), (10.11). Если решение уравнения Риккати (10.11) единственно, то единственность решения уравнения (10.10) следует из его линейности, что доказывается аналогично теореме 4.10. Установим единственность (в классе неотрицательных функций) решения уравнения (10.11). Всякое неотрицательное решение yt, 0 ^ t ^ Г, этого уравнения удовлетворяет, как нетрудно проверить, интегральному уравнению t w t \t = exp I 2 a (s) ds \ \ y0 + exp I — 2 a (u) du X Отсюда в силу (10.3) и предположения М85<°о получаем <ехр 2 J|a(s)|rfs! I у0 + ехр(2 11 а (и) \du ) j b2(u)du < <L<oo, (10.50) где L — некоторая постоянная. Пусть теперь Yi (/) и y2(t) — два решения уравнения (10.11). Положим b(t)=\y1(t) — y2{t)\. Тогда согласно (10.11), (10.50), (10.3), (10.8) и (10.9) t Д(*)<2 J{| a(s)\ + ± A2 (s)}\(s)ds. о Отсюда по лемме 4.11 вытекает, что Д(/)е=0. Теорема 10.1 доказана.
416 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 5. Метод Калмана — Бьюси существенно основывался на возможности представления условных математических ожиданий /п* = М(б*|#"|) в виде t mt=JG(t,s)dts (10.51) о (мы предполагаем здесь и далее, что т0 = 0, а значит, в силу (10.5) М(б*| #~о) = 0). Однако в рассматриваемом случае, когда процесс (8, |) является гауссовским, условные математические ожидания mt могут быть представлены также в виде t mt=JF(tfs)dWs, (10.52) о t где J Я(/, s)ds< со, а процесс W = (Wtt&~)), 0<f<7\ о является винеровским и определяется равенством w - Г *Ъ Г А (*> т do о о (см. теоремы 7.12, 7.16 и 7.17). Покажем, что вывод уравнения (10.10) для mt, 0<^<7\ становится значительно проще, если отправляться не от (10.51), а от представлений (10.52). Будем следовать схеме, принятой при доказательстве теоремы 10.1. Зафиксируем t, 0</<7\ и пусть f(t,s)t 0<s<£, — измеримая ограниченная функция. Тогда t M(Qt-mt)jf(t,s)dWs = 0, о т. е. (ср. с (10.27)) t t Мб, $f(t,s)dWs=\ F(t,s)f(t,s)ds. о о По определению обновляющего процесса W = (Wt, &~\) t Wt = W2 (t) + I -jgf (9S - m,) ds, 0
§11 МЕТОД КАЛмАНА - БЬЮСЙ 417 и, значит, t j F(t9 s)f(t, s)ds=M Qt j f(tts)dW2(s) о + M L о t + L 0 t где мы воспользовались тем, что в силу независимости процессов 8' и W2 t t М9, J f (t9 s) dW2 (s) = M9,M J / {t, s) dW2 (s) = 0. о о Далее, в силу (10.1) M (9, | &~s) = exp I j a (u) du 1 Qs (Р-п. н.). Поэтому M9, (6, - ms) = M {M (6, | Г3) (8, - ms)} = = exp| j a(u)du 1 M9S[9S — ws] = = exp | j a (u) du i M [9S — ms]2 = exp | J a (u) du 1 ys, и, значит, t t , t 4 J F(t, s)f(t, s)ds= j f(t9 $)-^Щ-ехр{ j a(u)du \ysds. 0 0 Is' Отсюда в силу произвольности функции f(tt s) получаем F(t, s)=*exp J a(u)du Ys"4{jf •
418 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 Таким образом, t t , t ч mt = JF(tts)dWs=jexp\ ja(u)du \A^-y5dWs = 0 0 I s > = exp| J a(u)du |J expj — J a(u)du \ £p^8 [d%s — ms ds]. Отсюда по формуле Ито для ть 0^/^Г, получаем уравнение (10.10). § 2. Мартингальный вывод уравнений линейной нестационарной фильтрации 1. Как уже отмечалось в § 1, уравнения (10.10) и (10.11) для mt и yt могут быть выведены из общих уравнений фильтрации, полученных в восьмой главе. Приведем этот вывод, что послужит также конкретным примером использования общих уравнений. Будем использовать понятия и обозначения, использованные при доказательстве теоремы 10.1. Положим также G, = <r {со: 80(©), Ь>(ю); Wx(s), W2(s), s^t}t 0<f<7\ и я|^ = exp I J а (и) du I. Тогда в силу (10.5) е, = ^ U + J GtfT'ft (s) dw л s)\ где процесс 8= (8„ Gt), 0<tf<7\ с t Qt = %+ l^lb(s)dWl(s) (10.53) является квадратично интегрируемым мартингалом. Выведем сейчас уравнения для fht = М (Э, | @~}) и yt = = М(ё,— mt)2, из которых легко затем будут найдены и уравнения для
§ 2] МАРТИНГАЛЬНЫП ВЫВОД 419 В силу (10.53) (в, W2)t = 0 (Р-п. н.), 0<*<Г. Поэтому согласно общему уравнению фильтрации (8.9) для щ (8) = = М(8* \ff~}) (=mt) получаем лЛЩ_^+1^т^1^м^±,к (10.55) 0 где пЛв2)=МШ#1) и W, -/ t dls — Л (s) ms ds В (s) о является винеровским процессом (относительно (@~)), 0^/^Г). Заметим, что *sffltiA(s)-(*Au))*tiA(s) = = ^А(8)[лМ-(л5ф))2]=^А(8)МШ (Ю.56) Покажем, что М [(в. - msf | JFg] = M [§. - msf (= v.). (10.57) Пусть fFl9n — а-алгебры, введенные при доказательстве леммы 10.1, Ч* =M(Qs\ П п)> Vi* = M (Qs - ЧТ Из теоремы о нормальной корреляции (гл. 13) следует, что Р-п. н. М [(в, - mff 19-)t „] = М [в, - mWf. (10.58) Воспользуемся этим фактом для доказательства равенства М [(8s — msf | #i] = M [Qs — msf (Р-п. н.), из которого очевидным образом будет следовать и (10.57). В силу теоремы 1.5 и (10.58) М [(в, - msf \STt] = M (в| | *"|) - т\ = = HmM(9||FI „) - lim«>)2 = lim M [(9,- m{*f | <Г«,„] = = lim М [в, — /nw]2 = lim Y<,n). (Ю.59) С другой стороны, Ys = М (6, - msf = М [(в, - raw) + (/»(»• - ms)f = = Yw + M (roj* - ms)2 + 2M (в, - /»w>) «">- ms),
420 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 и, следовательно, согласно доказательству леммы 10.1 I Ys - У{5п) | < М Кй) ~ msf + 2 VM (8S - mff M (mf — msf < <M(m^ — ms)2 + 2 ^M8fM(mM —me)2->0, n-*oo. Вместе с (10.59) это доказывает равенство М [(8, - msf | #1] = М [8, - ms]2, Р-п. н., а значит, и равенство (10.57). С учетом (10.57) и (10.54) правая часть в (10.56) переписывается так: ■&А (s) М [(в, - thsf \F\]=$A(s)y (s) =■- A (s) Ys 0*)~'. Поэтому согласно (10.55) dmt = -^dWt. (10.60) Применяя теперь формулу Ито к произведению mt = ylptQtntt получаем уравнение (10.10): yH (0 = а(0т,Л+^^-(^-Л(0т,Л). 2. Чтобы из (8.9) вывести уравнение (10.11), заметим, что согласно (10.53) t t б2 = 62 + 2 J 6s ад"1 ft (s) d\FI (s) + J ft2 (s) (^)"2 d*. о о Поэтому в силу (8.9) t щ (82) = щ (в2) + J й2 (s) (г|$~2 ds + о t + J-T^M[e»(6.-m,)iirS]irir.. о Поскольку процесс (8S, |s), 0<s<7\ гауссовский, то H№-™s)|^!] = 2msYs. Значит, я, (в2) = я0 (ё2) + JV (s) (^)-2 ds + 2 J -^?- /й,у. <*Г.. (10.61)
§ 3] УРАВНЕНИЯ ФИЛЬТРАЦИИ (МНОГОМЕРНЫЙ СЛУЧАЙ) 421 Из (10.60) и (10.61) получаем dyt = d[nt(Q2)-(mtf] = ||/л/,НА . 0Л('Но - - .™г о- AV)4t .as. (AWb\2.. -ft WW dt + 2-JWmtytdWt-2mtJU-rdWl-[JMJ Л- = б2 W (^)-2 л - та" М)-2 у2 л. Отсюда находим что совпадает с искомым уравнением (10.11). 3. Замечание. Уравнения (10.10) и (10.11) можно было вывести из уравнений для (0„ lt) и без введения процесса (6f> I,), 0<^^7\ Однако тогда, например, пришлось бы заме- т нить предположение | | a {t) \dt < оо более ограничительным о т условием Г a2 (t) dt < оо. § 3. Уравнения линейной нестационарной фильтрации. Многомерный случай 1. В настоящем параграфе будет дано обобщение теоремы 10.1 в двух направлениях: во-первых, в коэффициенты сноса, входящие в систему (10.1), (10.2), будут введены слагаемые, линейно зависящие от наблюдаемой компоненты £,; во-вто* рых, будут рассматриваться многомерные процессы 9, и £,. Итак, пусть рассматривается k + /-мерный гауссовскии случайный процесс (8„ Ь) = [(в,(*), ..., Bk(t))9 (Ei (0 Ei (/))!, 0<*<7\ с 2 d% = [a0 (t) + a, (t) 8, + a2 (t) £,] dt + 2 h (t) dWt (t), (10.62) dh = [Ao (0 + Al (t) 9, + A2(t) £,] dt + 2 BrtQ dWt (t). (10.63) t=l В (10.62) и (10.63) Wt=[Wu(t) Wlk(t)], W2=[W2l(t),.... W,M- два независимых винеровских процесса. Гауссовскии . вектор
422 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 начальных значений 60,10 предполагается не зависящим от процессов W\ и W2. Измеримые (детерминированные) вектор-функции а0 (t) = [floi (0> • • • > aok Ш А> (0 = [Ли W. • • • > Aoi (01 и матрицы *) 6.(o=«M,/(/)l(fexft), M')=KwU*> B>W=KwlU* B^=\\Bfl(t){txl) предполагаются обладающими следующими свойствами: т г к- i \dt < оо, < оо, JmooiWi+E^o/Wy о U=i /-I /[itKywi+iii^wil* о L £=i /=i *=i/=i J J12 2 wy wj2+s s до w)2+s s wy off+ (10.64) (10.65) (10.66) Tr k k о L^=i /=i i=i /=i / i + SS(M?w)2 *=i /=i d/<oo; (10.67) при всех *, 0</<7\ матрицы B{(t)B\(t) +B2(t)B*2(t) равномерно невырождены, т. е. наименьшие собственные значения матриц Вх{t)B\(t) + B2{t)B*2{t), 0</<7\ равномерно по t больше нуля**). Согласно теореме 4.10 система уравнений (10.62), (10.63) имеет единственное непрерывное решение. *) Индексы (pXq) указывают порядок матриц (первый индекс, р,— число строк, второй, <7, — число столбцов). **) Можно показать, что при этом элементы (B^{t) B\(t) +J32 (0 В*2 (О) О ^ t < Г, равномерно ограничены. -1
§ 31 УРАВНЕНИЯ ФИЛЬТРАЦИИ (МНОГОМЕРНЫЙ СЛУЧАЙ) 423 Пусть tnt = М (0, | @~)) — вектор условных математических ожиданий, [«,(*),.... mfc(0] = [M(8,(0l#1), .... M(9ft(0l#1)], ЬиЩкхк)=у*~ыатрпца коваРиа1*ии с Vil(t)=M[(Qt(t)-mi(t))(Q](t)-mi(t))]. Вектор mt = [tni(t), ..., mk(t)] является, очевидно, ^-измеримой оценкой вектора 6/==(91(^), ..., вл(/)), оптимальной в том смысле, что Sp у, - 2 Y„ W < Sp M [(9, - v,) (9, - v,)*] (10.68) для любого ^-измеримого вектора vi = [vl(t)9 ..., vk (t)] к С 2Mv2(/)<00. В силу гауссовости процесса (8„ £,), 0 ^ t ^ Г, компоненты вектора mt линейным образом зависят от наблюдаемых значений £o = {£s, 5</} (см. далее (10.73)). Поэтому оптимальная (в смысле (10.68)) фильтрация (значений 9, по £о) является линейной, но, вообще говоря, нестационарной. Как и для системы (10.1), (10.2), в рассматриваемом случае также можно получить замкнутую систему уравнений для mt и yt, определяющих, как принято говорить, оптимальный фильтр. 2. Начнем с одного частного случая системы (10.62), (10.63), являющегося многомерным аналогом системы (10.1), (10.2). Теорема 10.2. Пусть k +1-мерный гауссовский процесс (9/> lt)> 0 ^ t ^ 7\ допускает дифференциалы dQt = a(t)Qidt+b(t)dWl(t)9 (10.69) dtt = A{l)Qtdt + B(t)dW2(t) (10.70) (т. е. пусть в (10.62), (10.63) a0(t) = 0, A0(t) = 0t a{{t) = a{t)> Al(t) = A(t), Mf)-0, Л2(0 = 0, МО-0, 5i(0 = 0f b{{t) = b{t)> B2(t) = B(t)). Тогда mt и yt являются решениями системы уравнений dmt = a (t) mt dt + ytA* (t) (В (t) В' {t))~l (d%t — A (t) mt dt), (10.71) U-eCOvH-Y^'W-YH'ttKfiWB'Wr1 А «)у( + Ь«)Ь* (/)(10.72) с начальными условиями /n0 = М (901 lo), Yo=M[(eo-m0)(60-m0)*].
424 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ ttVI. Ю Система уравнений (10.71) и (10.72) имеет единственное решение (для Y/ в классе симметрических неотрицательно определенных матриц). Доказательство. При k = l=l (10.71), (10.72) совпадают с уравнениями (10.10), (10.11), справедливость которых установлена в теореме 10.1. Метод Калмана — Бьюси применим для вывода этих уравнений и в общем случае k^lt /^1. Как и при доказательстве теоремы 10.1, сначала показывается, что (в случае т0 = 0) для каждого t, 0</<7\ t mt=JG(t,s)dts (10.73) о с детерминированной матрицей G(t, s) (порядка (&Х0)> измеримой по s и такой, что t Sp j Q{U s)G*(t, s)ds< oo, (10.74) о t Sp j G(t, s)B{s)B*(s)G*{t, s)ds<oo. (10.75) о Далее устанавливается, что G(t,s) = <flG(s, s), (10.76) где G(s, s) = y5A*(s)(B(s)B*(s)rlt (10.77) а матрица qp£ является решением дифференциального уравнения ^ = [а«)-у,А'«)(вц)В'«)Г1 A(t)]q>i, ф: = £(4х*). (10-78> Поэтому mf допускает представление t Щ = Фо J (<$"' YH* (*) (В (s) В* («))*' 4t„ (10.79) о из которого (в случае т0 = 0) выводится уравнение (10.71). Случай т0Ф0 (Р-п. н.) разбирается так же, как и при Для получения уравнения (10.72) вводится вектор 6, = 9, — mt и затем для 6,6? с помощью формулы Ито находится интегральное представление, аналогичное (10.49). Беря затем математическое ожидание, получаем (интегральное) уравнение, эквивалентное уравнению (10.72)*
§ 3] УРАВНЕНИЯ ФИЛЬТРАЦИИ (МНОГОМЕРНЫЙ СЛУЧАЙ) 425 Единственность решения системы (10.71) и (10.72) доказывается, как и в скалярном случае. Заметим лишь, что вместо оценки (10.50) следует воспользоваться оценкой 0<Spv,< < Sp dd Yo + J (ФоТ1 b (s) b* (s) [(ФоТТ ds J (Off < L < oo, где L — некоторая постоянная, а Фо — фундаментальная матрица, являющаяся решением матричного уравнения -± = a(t)<U, Ф°о = Е{кхк). 3. Перейдем теперь к рассмотрению общего случая. Будем использовать следующие обозначения: (ь ой) (*)«M0«W + M')«W. (Ь о В) (t) = Ьх (t) B\ (t) + b2 (t) Bl {t\ (10.80) (BoB)(t) = B{(t)Bl(t) + B2(t)BUt). T e о рема 10.3. Пусть коэффициенты системы (10.62), (10.63) удовлетворяют условиям п. 1. Тогда вектор mt и матрица yt являются решениями системы уравнений dmt = [a0(t) + ax (t) mt + a2 (t) lt]dt + + [(boB)(t) + ytA](t)}((BoB)(t)rlX X [dli - (До (t) + A{ (t) mt + A2 (t) lt) dtl (10.81) Y/ = «i (0 Vt + Y/fli (t) — - [{b о В) (t) + ytA\ (/)] ((В о В) (t))~l [(b о В) (t) + ytA\ (t)Y + bob(t) с начальными условиями m0=M(90|£0) и Yo = II Yi/ (0) II, Y£/ (0) = M [(9, (0) - mt (0)) (9, (0) - m, (0))*]. Система (10.81), (10.82) имеет единственное решение {для yt в классе симметрических неотрицательно определенных матриц). Для доказательства понадобится следующая лемма. Лемма 10.4. Пусть W = ([W{ (t),..., WN (*)], Ft), 0 <f < 7\ - N-мерный винеровский процесс, B — (Bt> &~t) — матричный случайный процесс, где Bt = \\Bit(t)\\{nXN)t и Р-п. н. т Sp j BiBUt<ooP (10.83) о
426 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 Пусть матричный процесс D = (Du !Ft)t Dt — \\ Dif (t) \\{nXk), таков, что для почти всех t, 0<£^Г, Р-п. н. DtD*t = BtBl (10.84) Тогда *) найдется k-мерный.винеровский процесс W = ([W{ (t), ... > • • i Wb {t)]> Ft) такой, что для каждого t, 0 < t < Г, Р-п. н. t t j BsdWs=j DsdWs. (10.85) Доказательство. Пусть исходное вероятностное пространство столь «богато», что на нем существует ^-мерный винеровский процесс Z = (ztt @"t), 0</<Г, не зависящий от винеровского процесса W. Положим / t Wt = I DfBsdWs +j(E- D?Ds)dzs, (10.86) где E — единичная матрица порядка (&X&)> a D? — псевдообратная матрица к Ds (гл. 13, § 1). Процесс W = (WSi trt)t 0</<7\ является винеровским, поскольку в силу теоремы 4.2 он — (векторный) квадратично интегрируемый мартингал с непрерывными траекториями и M[(Wt-Ws)(Wt--Wsy\<rs]=M JD£BuBl(DiYdu\rA + ММ(£- DtDu) {Е - D+Dj du | &~s] + = E(t-s) (Р-п. н.), где последнее равенство справедливо потому, что DtBuB* (D+y=DtDuDu (D+)*= DtDu (ДГ Ai)* = {D+DU)2=DZDU, a (E - DtDu) (E - DtDu)* = {E- DtDuf = E- DtDu (см. гл. 13, § 1, п. З). *) Предполагается также, что исходное вероятностное пространство достаточно «богато».
§ 3) УРАВНЕНИЯ ФИЛЬТРАЦИИ (МНОГОМЕРНЫЙ СЛУЧАЙ? 427 Установим теперь справедливость равенства (10.85). Поскольку Ds (£ — DfDs) = Ds — DsDfDs = 0 (Р-п. н.), то в силу (10.86) t t | Ds dWs = J DsDfBsd\Vs (Р-п. н). о о Далее, t t t J DsDfBs dWs =\BsdWs-\(E- DsDf) Bs dWs. 0 0 0 t Положим xt = j [E — DfDs] Bs dWs. Тогда о t Mxtx*t = MJ(E- DsDf) BsBl (E - DsDf У ds =- о t — M { {E - DsDf) DSD*S (E - DsDf У ds = 0, о поскольку (E — DsDf) Ds = 0. Следовательно, х,=0 (Р-п. н.), и, значит, t t t j Ds dWs — | DsDfBs dWs == J Bs dWs. 0 0 0 Лемма доказана. Доказательство теоремы 10.3. Покажем, что найдется такая блочная матрица /<Ш d2(t)\ D*-{ 0 D2(0/* размеры блоков которой совпадают с размерами соответствующих блоков матрицы д /МО b2(t)\ "'-[вм B2(t)l и при этом DtD*t = BtBu (10.87) Ясно, что (10.87) эквивалентно системе матричных уравнений dl(t)d\(t) + d2(t)d'2(t) = (bob)(t), d2(t)D'2(t) = (boB)(t), (10.88) D2(t)m(t) = (BoB)(t).
428 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 Матрицы Dti 0</<7\ с требуемыми свойствами строятся следующим образом. Положим (опуская для простоты индекс t) D2 = Dl = {BoB)x,\ (10.89) Тогда, поскольку матрица Во В не вырождена, из второго равенства в (10.88) получаем с!2 = (ЬоВ)(ВоВГ1/2. (10.90) Далее, dxd\ = (bob) — (boB)(Bo ВГ1 (b о В)\ (10.91) По лемме 13.2 матрица (bob) — (b о В) (В о В)~х (Ьо В)* является неотрицательно определенной, и в качестве d{ можно взять матрицу dx = d\ = [(b о b) - (b о В) (В о ВГ1 (Ь о В)*]11\ (10.92) Итак, блочная матрица 4W d2(ty Dt ' 0 D2(t) обладающая свойством (10.87), построена. По лемме 10.4 для системы уравнений (10.62), (10.63) имеет место также представление ^в, = [ао(0+«1 (Ов^+02(06/]Л+^1 (0^^1 (0+^2(0^^2(0. (Ю.93) d\t = [Л (t) + А{ (t) 9, + А2 (t) Ы dt + D2 (t) dW2 (/), (i0.94) где Wx и W2 — новые винеровские процессы, независимые между собой. Определим теперь случайный процесс v —(v,, ^), 0^f ^7\ являющийся решением линейного стохастического дифференциального уравнения dvt = {[а0 (t)-d2 (t) D;1 (t) AQ (/)] + [a{ (t)-d2 (t) D~x (t) Ax (t)] v, + + [fl2W-d2(0^2"40i42W]U^+d2(0^2"40^, v0=0. (10.95) В силу сделанных в п. 1 предположений, формул (10.89), (10.90) и (10.92) и замечания к теореме 4.10 уравнение (10.95) имеет, и притом единственное, непрерывное решение v = (v,, @~\). Положим t 8, = в, - v„ lt = lt-\ [Ao (s) + A{ (s) vs + A2 (s) ls] ds. (10.96)
§ 3] УРАВНЕНИЙ ФИЛЬТРАЦИИ (МНОГОМЕРНЫЙ СЛУЧАЙ) 42<Э В силу (10.94) и невырожденности матриц D2(t) t W2 (t) = J D;x (s) [dts - (A0 (s) + Ax (s) Qs + A2 (s) ls) ds] (10.97) 0 (ср. с доказательством теоремы 5.12). Из (10.95) —(10.97) находим dQt = \ai (t) - d2 (t) DTl (t) Ai (t)] 9, dt + d{ (t) dWi (/), (10.98) d\t = At (t) 6, dt + D2 (t) dW2 (/). (10.99) Из построения процесса l = (lt)9 0<*<Г (см. (10.96)), следует, что $F\ з ^"|. Покажем, что в действительности а-алгебры 9Г\ и 9Г\ совпадают при всех t, 0<£<7\ Для доказательства рассмотрим линейную систему уравнений d$t = [A0(t) + A{(t)vt + A2(t)t<]dt + di, i0 = lo, (10.100) dvt = \a,{t) + ax{t)vt + a2{t)lt\dt + d2{t) D? получающуюся из (10.95), (10.96). У этой линейной системы уравнений существует, и притом единственное, сильное решение (см. теорему 4.10 и замечание к ней), что влечет за собой включение 9Г\ 3 У\9 O^t^T. Там самым, Р\ = д~\, 0</<7\ и Поэтому mt = М(9, |#"f) = М [Qt + v, \&~\] = mt + v, (10.102) и 6, — iht = (6, — v<) — (т( — v,) = Qt — mt. Отсюда Y, = v,- (10.103) Согласно теореме 10.3 dmt = [a, (t) — d2 (t) D~l (t) Ax (t)] tntdt + + %A\ (t) (D2 (t) D\ (/))"' (4, - Al (t) fht dt), (10.104) ^ = [a, (t)-d2 (t) D2~l (t) Al (tj\ % + v< [fl, it) - d2 (t) D;1 (t) A, (/)]* - -ytAlWfaMDld^AMvt + diWd]®. (10.105) Отсюда с учетом того, что mt = rht-\-vt и Y/ = Y<> после простых преобразований приходим к искомым уравнениям (10.81) и (10.82) для т, и yt.
430 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 Единственность решения уравнения (10.82) следует из справедливости аналогичного факта для уравнения (10.105) и теоремы 10.2. Единственность решения уравнения (10.81) вытекает из его линейности, теоремы 4.10 и замечания к ней. § 4. Уравнения для почти оптимального линейного фильтра в случае вырождения матриц Во В 1. Снова рассмотрим k + /-мерный гауссовский процесс (9/, It) = [(0i (0. • • •, в* (*)), (li (f), ..., h (/))], 0 < t < Г, описываемый уравнениями (10.62), (10.63). Предположим теперь, что матрицы (BoB)(t) = B\ (t) B\ (t) + + 5г(/) ДНО вырождаются *). В этом случае уравнения (10.81), (10.82), с помощью которых определялись условное математическое ожидание mt = M(Qt\&~\) и матрица yt = M\(Qt — mt)X Х(б, — mtY\ в случае положительно определенных матриц (В о В) (t), теряют смысл, поскольку входящая в правую часть этих уравнений матрица [(ВоB)(t)]~l не существует. Если коэффициенты уравнений (10.62), (10.63) разрывны, то т( и Y/ ПРИ вырожденных матрицах (В о В) (t) не обязательно непрерывные функции времени и, следовательно, они не определяются уравнениями типа (10.81), (10.82). В ряде частных случаев можно вывести уравнения для tnt и yt ПРИ вырожденных матрицах (BoB)(t) (например, когда коэффициенты уравнений (10.62), (10,63) являются постоянными или достаточно гладкими функциями времени). С прикладной точки зрения эти уравнения для mt и y* пРи вырождении (BoB)(t) не представляют ценности, потому что, как правило, содержат производные по времени от реализаций компонент наблюдаемого процесса ^ или же от их линейных комбинаций **), которые нельзя вычислить без больших погрешностей в реальной ситуации. Ниже для каждого е Ф 0 будут построены процессы т) и y?> 0^/^Г, которые в определенном смысле близки к mt и yt. Эти процессы определяются из уравнений типа (10.81) и (10.82) для неотрицательно определенных матриц (ВоВ)(1), 0^/^Г, и задают фильтр, который, следуя терминологии, принятой у специалистов по некорректным задачам, можно было бы назвать «регуляризованным» фильтром. 2. Пусть а2(0 = 0, A2(t) = 0. Наряду с процессами Qt> lt введем процесс £8 = (l£)f 0 < t ^ Г, с $* = Zt+eWti e^0, (10.106) *) Этот случай возникает, например, в задачах линейной фильтрации стационарных процессов дробно-рациональным спектром (§ 3 гл. 15). **) См. [43], [НО], [172].
§ 4] ПОЧТИ ОПТИМАЛЬНЫЙ ФИЛЬТР 431 где Wt = [IF, (t), ..., Wt (t)], t < T, — винеровский процесс, не зависящий от (90, |0) и процессов Wu W2. Поскольку а2(/)=зО, A2(t) = 0, то из (10.61), (10.62) и (10.106) следует, что процесс (б,, g^), 0^/^Г, удовлетворяет системе уравнений dbt = [a0 (t) + a, (t) Qt] dt + bx (t) dWx (t) + b2 (t) dW2 (t), (10.107) dft = [A0 (t) + A, \t) Ц + B{ (t) dW{ {t) + B2 (t) dW2 (t) + edWt, (10.108) решаемых при начальных условиях 80 и lo —io- Обозначим п\ = М (9, | S*"f), у? = М [(9, — га?) (9, — nf) *]. По лемме 10.4 и теореме 10.3 п\ и у\ определяются из уравнений dnst = [a0(t) + al(t)n*]dt + + [(boB (t)+ystA\ (/)] [(В о В) (t) + e2£]"' [d$-(A0(f)+Al (t) пг) dt], (10.109) Y? = a, (0V?+Y?«; (') + (& ° &)(')- - [(6 о В) (/) + ttA\ Щ [(В о В) (t) + е'ЯГ1 [(6 о B)(t) + Yf Л; (/)]* (10.110) с ^ = т0=М(е0|£0), Yeo=Yo = M[(eo-m0)(eo-m0)*], где E = E(ixi) — единичная матрица. Зададим процессы $ =%)(%), Aet = Aet(W), 0<*<7\ с Х* = = [x\(t), ..., X\(t)], A? = [Ai(0, ..-, A| (0j C помощью следующих дифференциальных уравнений: dlet = [ao(t) + cn(t)X'i]dt + +[ф о В) (t) + у)А\ (t)\ \(В о В) «)+е2ЕГ1 [dtt-(AQ(t)+A{ (t) if) dt], Кг0 = т0, (10.111) dAet = ai(t)Aetdt + + [(b о В) (t) + y)A\ (t)] [(В о В) (t) + г2Е]'1 [e dWt - Al (t) A* dt], До = 0. (10.112) Нетрудно проверить, в силу (10.108), (10.111) и (10.112), что для каждого 0 ^ / ^ Т "?=«К!8)=Я?(!) + Д?(Г). (Ю.113) Определим матрицу 6? = ||Ь), (t) \k x k) = М.[(9/ — Я<)(fit - A?)*J.
432 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 Лемма 10.5. Пусть выполнены условия (10.64) — (10.67). Тогда для любого t, 0</<7\ 1) Mti = MQt, 2)y«w<*«w<y;,w. *=i, .... *. 3) Y/ = Hm d! = Hm y!» 8-Ю 8-»0 4) lim M[пи(t) — X] (t)]2 = 0, /=1, ..., k. 8-»0 Доказательство. Имеем (см. 10.106): ^(s) = g. (s)+ + eW. (s). Для каждого s<!/ M [ll (s) |#"f] является оптимальной, в среднеквадратическом смысле, оценкой для ^ (s) по {& 0 <*/</}. Поэтому М [6, (5) - М (6, (s) | Г f )]2 < М [I, (s) - £ (s)]2 = = 62М (#, (S))2 = 82S -> 0, 8 -> 0. Отсюда нетрудно! вывести, что для всякой случайной величины еп, являющейся линейной функцией от L, L, ..., L , \imM[en-M(en\rf)f=0. Далее, если последовательность {em /1=1, 2, ...) случайных величин еп, определенных выше, имеет предел е в среднем квадратическом (£ = l.i.m. en), то п \imM\e-M(e\$-f)]2 = 0, (10.114) е-»о l \ » /J поскольку M[e-M(e|0f)]2< <з(м[в-в^ + м[в(|-м(в(||^Г)], + м[м(в-в|(|^П]')< < 6М [*-e„f + ЗМ [е„-М(еJ <Ff)]2, и, следовательно, ПтМ[^—M(e|^f)]2<6M[e~^]2->0, я->оо. Заметим теперь, что компоненты rrti (t), /=1, ..., k, случайного вектора mt = M(8J#~|) являются пределом в среднем квадратическом последовательности случайных величин типа еп, /г=1, 2, ... Действительно, если *Fj я = а |(о: |0, |2_„, ... •••»^.2-«» •••> £/}> т0 по теоРеме ° нормальной корреляции
§ 4] ПОЧТИ ОПТИМАЛЬНЫЙ ФИЛЬТР 433 (см. гл. 13) компоненты mf^i), /=1, ..., kt вектора т[п) = = М (9, | (F\t п) линейно выражаются через ^ £2_„, ... •••» Sjk.2-»» ■••» h- При этом согласно теореме 1.5 т[п)(t)-^mi (t) с вероятностью единица. Но M[m(n) WJ4^ MQ4t(t) равномерно по всем /г. Поэтому по теореме 1.8 lim M\m.(t)— mf] (/)|2 = 0. Итак, в силу (10.114) имеем lim М [т. (0 - М (т. (t) \ &~?)]2 = 0. (10.115) е-»0 l /J Из определения процесса £8 (см. (10.106)) следует, что для любого 0</<Г совпадают а-алгебры &"]*& и !F\v, откуда, используя независимость процессов (8^, £,) и (Wt), 0^/^Г, находим, что Р-п. н. откуда в силу свойства условного математического ожидания получаем М К | Pf) = М [М (в, | Р\> *е) | rf ] = п\. (10.116) Но тогда в силу (10.115) и (10.116) lim M [n] (t) — mi Щ2 = 0. (10.117) Из (10.117) легко выводится, что limY?=Y*. (10.118) е-»0 1 Установим теперь утверждение 1) леммы. Для этого рассмотрим процесс [в/ — Я8], определяемый, в соответствии с (10.107) и (10.111), уравнением t [Qt - я8] = [Во -т0]+ j (a, (s) - D (s) A, (s)) [Qs — Я8] ds + о 2 t + 2 j[bt(s) + D(s)B,(s)]dWt(s), i=l 0 где D(s) = [bob(s) + yesA\(s)](BoB(s) + e2Er\ согласно которому, очевидно, t M [в, - Я?] = J* (a, (s) - D (5) Л1 (s)) M [8, - Я8] dst (10.119) 0 и, следовательно, М [в* —- Я8] ^= 0,
434 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 Итак, утверждение 1) леммы доказано. Из несмещенности Я?(МЯ? = М8;) и (10.113) вытекает, что y]l(t) = M[Qi(t)-n)(t)]2 = = М[в|(/)-Я!(0]2+М[А?(0Р>М[в,(/)-Я?(0Г = в!,(0, что вместе с (10.118) доказывает утверждения 2) и 3) леммы. Наконец, У и (t) = М [9, (t) - mt (t)f = М [(9i (0 - Х\ (/)) + (Я! (0 - т* (/))]2 = = beu(t)-M[xei(t)-mi(t)]2, поскольку М[(в,(0-«(0)(Я?(0-т,(0)] = = М [М (в, (t) - Я* (t) | #1) (я! (t) - mi (t))] = - М [ti (t) - mi (t)]2, что доказывает утверждение 4), так как t>Bit(t)-+y{i(t)9 е->0. 3. Из леммы 10.5 вытекает, что при а2(0 = 0, Л2(/) = 0 в качестве почти оптимальной оценки 8, по gj можно выбрать Я,, где процесс Я^ вместе с у] определяется из уравнений (10.111) и (10.110). Если же а2(0#0, A2(t)^0, то по аналогии с уравнением (10.111) определим т) как решение уравнения dm) = [а0 (*) + a, (t) m\ + а2 (t) Ц dt + + [ф о В) (t) + у*А\ Щ [(В о В) (/) + е2£]"] X X [dlt - (Л0 (t) + Ах (t) т\ + А2 (t) у Л], (10.120) где т* = т0, а у* по-прежнему находится из уравнений (10.110). Теорема 10.4. Пусть выполнены условия (10.64) — (10.67). Тогда процесс {mfy 0 ^ t ^ Г, определяемый из уравнений (10.120) и (10.110), задает оценку вектора 8, по gj, обладающую следующими свойствами: Мт?=М8,, limMfmUO—m. (012 = 0, /=1, ..., k, (10.121) Y„ (0 < М [8, (t) - m\ Щ < у?, (0, / = 1, • •., *. Матрица среднеквадратичных ошибок Г? = М [(в* — ml) (8/ — т?)*] определяется из уравнения Ге = a* (t) Ц + Г? (а8 (0)* + S {b\ (t)) (b] (t))' (10.122)
§ 4] ПОЧТИ ОПТИМАЛЬНЫЙ ФИЛЬТР 435 с To = Yo и а* (0 = ах (t) - [ф о В) (t) + tA Щ [(В о В) (t) + е*Е]-1 Ах 0), Доказательство. Если а2 (t) гз О, А2 (t) = 0, то, очевидно, met = Ket, 0^/^7\ и в силу леммы 10.5 выполнены свойства (10.121) оценки т\. Чтобы в рассматриваемом случае вывести уравнение (10.122), положим V]= 8* — Я?. Тогда 2 dV\ = а8 (*) Ц df + 2 Ь\ (t) dWi (t) и в силу формулы Ито + / [а8 (в) V. W + V. (НУ (а8 (в))" + |>е (в) (й8 (в))'] <** + о L t==i J t ■ /. 2 у t 2 + / И S Й(s) rfr, (s) + J 2(6? (s) dWt (s))(Vtf. 0 4=1 /0 t=l Отсюда после усреднения получаем для Г?=МУ?(К?) уравнение (10.122). Пусть теперь а2(/)#0, A2(t)^Q. Введем в рассмотрение процессы v = (v,), I = (!/), 0</<7\ t vt=j[a{(s)vs + a2(s)ts]ds, (10.123) о t I = It ~ \ И, (s) v. + Д2 (s) Ы ds, (10.124) 0 и положим ё, = 9, — v,. Тогда из (10.62), (10.63) и (10.123), (10.124) найдем dbt = [flo (t) + a, (t) §,] Л + ft, (/) dWx (t) + b2 (t) dW2 (t), (10.125) 4t=[A0(t) + Al(t)Qi]dt + Bl(t)dWi(t) + B2(t)dW2(t) (10.126) с 90 = 60, lo = so*
436 ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ [ГЛ. 10 Если оценивать 0, по Ц9 то согласно (10.120) (при а2(£)==0, Л2(/) = 0) соответствующая оценка Щ задается уравнением dm* = [aQ(t) + al(t)met]dt + + [boB(t) + у]А\ Щ (В oB(t) + е*ЕГ{ [d\t - (А0 (t) + A{ (t) mj) dt\ meQ = mQ. (10.127) Из (10.123) и (10.124) нетрудно вывести (ср. с доказательством теоремы 10.3), что а-алгебры &~) и #"|, 0</<7\ совпадают. Поэтому, обозначая ^ = 1^(8,1^), находим, что m, = M(9,|Sr|) = M(e, + v^ Положим met = met + vt. Тогда tnt — m) = fht — m) и, следовательно, оценка mt обладает указанными свойствами (10.121). Искомое уравнение (10.120) следует из равенства met = met-\-vt и (10.127), (10.123) и (10.124). Уравнение (10.122) справедливо и для случая a2(t) Ф 0, А2 (t) Ф 0, поскольку Qt — met = = 9* — rtit = V\ и нетрудно проверить, что МК/(К?)* = МУ](у*)\ 0<*<Г.
ГЛАВА 11 УСЛОВНО-ГАУССОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ § 1. Предположения и формулировка теоремы об условной гауссовости 1. Пусть (8,|) = (9„ |,), 0^/^Г, —случайный процесс с ненаблюдаемой первой компонентой и наблюдаемой второй. При использовании уравнений оптимальной нелинейной фильтраций (8.9) для нахождения nt (9) == М (9^ | #~|) приходится сталкиваться с существенной трудностью, заключающейся в том, что для отыскания я, (8) требуется знать условные моменты старших порядков nt (в2) = М (92 | Г}), nt (93) = М (9? | &}), ... Возникающая таким образом «незамкнутость» уравнений (8.9) заставляет искать дополнительные соотношения между моментами старших порядков, которые позволили бы получить замкнутую систему уравнений. В случае, рассмотренном в предшествующей главе, случайный процесс (9, |) был гауссовским, что дало дополнительное соотношение я/(93) = ЗяД9)я/(92)-2[я/(0)]3, (11.1) позволившее для апостериорного среднего я, (9) = М (9, | #~&) и апостериорной дисперсии yt(9) = щ (92) — [щ (9)]2 получить из (8.9) замкнутую систему уравнений (10.10) — (10.11). В настоящей главе будет рассмотрен один класс случайных процессов (9, |) = (8„ |,), 0 < t < Г, которые хотя и не являются гауссовскими, обладают тем важным свойством (обеспечивающим, в частности, равенство (11.1)), что Р-п. н. условное распределение F^t(x) = P [Qt^x |#~j?} является гауссовским. Для таких процессов (мы их называем условно-гауссовскими) решение задач фильтрации, интерполяции и экстраполяции становится столь же эффективным, как и в случае гауссовского
438 УСЛОВНО-ГАУССОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ ttVI. 11 процесса (9, |), рассмотренного в гл. 10. Детальное исследование этих задач содержится в следующей главе. 2. Перейдем к описанию рассматриваемых процессов и формулировкам основных предположений. Будем считать заданными некоторое (полное) вероятностное пространство (Q, #~, Р) с неубывающим непрерывным справа семейством а-подалгебр (#",), 0 <*< 7\ и пусть Wx = (Wx (t), @"(), W2 = (W2(t)> ^t) — независимые между собой винеровские процессы. Случайные величины 80, |0 предполагаются не зависящими от винеровских процессов Wx и W2. Пусть (8, |) = (9„ lt), Q^t^T, является (непрерывным) процессом диффузионного типа с dBi = [a0(t9Q + al(ttQQi]dt + + bx (t, |) dWx (t) + b2 (t, I) dW2 (0, (11.2) dlt = [A0{t, I) + Ax (t, l)Qt]dt + B(t, t)dW2(t). (11.3) Каждый из (измеримых) функционалов ai{t, x)t Ai(t, x), bj(t, x), B(t,x), / = 0, 1, /=1, 2, предполагается неупреждающим (т. е. ^-измеримым, где 9it — а-алгебра в пространстве Сг непрерывных функций x = {xs, s^.T}, порожденная значениями xs, s<*). Предполагается, что для каждого jcgCj- т J7E {\dl{i,x)\ + \At(t,x)\} + О \/=0, 1 + J] b) (U х) + В2(f, x)\ dt < оо. (11.4) Наряду с условием (11.4), обеспечивающим существование интегралов в (11.2), (11.3), будут предполагаться выполненными следующие условия: для каждого х е Ст т j[Al(ttx) + A2l(t,x)]dt<oo] (11.5) о inf В2(г, х)>С>0, 0</<Г; (11.6) для любых х, ysCr t \B(t,x)-B(t,y)\2<lLx$\xs-ys\2dK(s) + L2\xi-yt\\ (11.7) о t В2 (f, *) < Lx J (1 + x]) dK (s) + L2(l+ x2)} (11.8) о
§ 2J ВСПОМОГАТЕЛЬНЫЕ ПРЕДЛОЖЕНИЯ 439 где K(s) — неубывающая непрерывная справа функция, 0</С(*)<1; г jM|i4,(*, £)8,|Л< оо; (И.9) о М]9,|<оо, 0«<Г; (11.10) Р \A\(Ul)m]dt<oo\ = \, (11.11) где mt = M(Qt\P)). Следующий результат является основным в данной главе. Теорема 11.1. Пусть выполнены условия (11.4) —(11.11) и с вероятностью 1 условное распределение F^(a) = P(Q0^a ЦЛ является гауссовскиМу N (m0, Yo)> c 0^ Yo< °°- Тогда случайный процесс (8, £) = (9„£,), О^О^Г, удовлетворяющий уравнениям (11.2), (11.3), является условно-гаус- совским, т. е. для любых t и 0^/0 < tx < ... <tn^t условные распределения Fq(x0, .... xn) = P(Qt^x0 Qtn^xn\0-t) являются (Р-п. н.) гауссовскими. Доказательство этой теоремы, данное ниже в § 3, опирается на ряд вспомогательных результатов, собранных в следующем параграфе. § 2. Вспомогательные предложения 1. Пусть ц = (л/э #~*)> 0<*<7\ обозначает любой из процессов S = (Sf, &~t) или I = (I/» @~t)> гДе i является наблюдаемой компонентой процесса (8, |) с дифференциалом dtt = [A0(t, g).+ Л, (/, g) в,]Л + В(/, 6)^(0. (И.12) а | есть решение уравнения 4, = Stf,I)^2W, lo = io- (11.13) В силу предположений*) (11.4) — (11.11) и теоремы 4.6 это уравнение имеет (и притом единственное) непрерывное решение. Обозначим а0 (/, х) = aQ (t, х) - Щ^- А0 (*, х), (11.14) a{{U x) = ax{U х)-Щ^ A{{U х) (11.15) *) На протяжении всего этого параграфа предполагаются выполненными условия (11.4)-(11.11).
440 УСЛОВНО-ГАУССОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ [ГЛ. 11 и рассмотрим уравнение (относительно Qt9 O^t^T) t §t = % + J [So (*> Л) + Si (s, л) §s] ds + о * t + $ bl(s,T\)dWl(s) + j Щ^$ dru. (11.16) о о Лемма 11.1. Уравнение (11.16) имеет (и притом единственное) непрерывное, #~?0' W{' ^-измеримое при каждом t решение Qt, 0 ^ t ^ Tt задаваемое формулой [t t 9о + \ ФГ1 (л) So (s, Л) ds + J Os"1 (л) bi (s9 r\) dWi (s) + о о + К'<*>ТгЙН4 <"•"> о J где Ф,(л) = ехр| Js,(5, rOrfsL (11.18) Доказательство. Нетрудно проверить, что в силу предположений (11.4) — (11.6) определены все интегралы, входящие в (11.17) и (11.18). Применяя теперь формулу Ито, убеждаемся, что задаваемый правой частью (11.17) процесс 9„ 0^/^Г, удовлетворяет уравнению (11.16). Так что для завершения доказательства леммы надо установить лишь единственность решения этого уравнения. Пусть Д* = 9* — 9; — разность двух непрерывных решений уравнения (11.16). Тогда t Д, = J* ax (st ц) Д5 ds о и, следовательно, t |Л,|</|а.(5.ч)1|Л,И.
§ 2] ВСПОМОГАТЕЛЬНЫЕ ПРЕДЛОЖЕНИЯ 441 Отсюда по лемме 4.13 получаем: |Д,| = 0 (Р-п.н.) для любого t, O^t^T. Значит, Р{ sup |Д,|>0} = 0. о < < < г Лемма доказана. Пусть ri = £. В этом случае Qt является ^?0t Wu * -измеримой случайной величиной. Согласно лемме 4.9 существует функционал Qt (а, х, у), определенный на ([О, Т] X R1 X Сг X Сг) и являющийся при каждых t и a $t+ X ^+-измеримым, такой, что для почти всех О^/^Г Qt = Qt(Q0tWul) Р-п.н. Пользуясь введенными выше обозначениями (11.14) и (11.15) уравнение (11.2) можно записать в следующем виде: dQt = [S0 (/, 1) + ах (tt I) Qt] dt + b{ (t, I) dW{ (t) + ^-| d%t. Сравнивая это уравнение с (11.16), замечаем, что в силу леммы 11.1 для почти каждого t, 0</<7\ е, = <Ш> Wul) (Р-п.н.). (11.19) Отсюда и из (11.3) вытекает, что процесс £ = (£„ #",), 0</<7\ допускает стохастический дифференциал dlt = [А0 (/,1) + Ах (/, |) Q, (в0, Wu $)] dt + B (t, Q dW2 (t). (11.20) 2. Рассмотрим теперь два случайных процесса (а, р, £) = == I (<*/, Р/, Ь), *"J и (а, р,|) = [ (<*;> Р*> !<)> 0"/1. 0 < < < Г, задаваемых уравнениями da, = 0, <х0 = в0, d& = dWl(t), р0 = 0, (11.21) dh = [Л0 (t, I) + Ах (tt I) Qt (<*> P> l)¥t + В (/, ©rflP, 0) и da, = 0, a0 = 60, rfft^dWiW. Po = 0, (П.22) dit = B(tti)dW2(t),io = Zo> соответственно. Пусть \ia, э. s( = N0, ^, б) и \xa> Pt i (= [iee> ^,i)—меры, отвечающие процессам (a, p, £) и (a, p, f).
442 УСЛОВНО-ГАУССОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ (ГЛ. 11 Лемма 11.2. Меры [ха, ы и ц,а, р, f эквивалентны, 14 Р. I ~ 1*о. Р. V (11.23) При этом <Р< («' Р« ^ = fetH а> & |} ы *' («• Р' 6) = ^xf «, а, р, |) задаются формулами Ф/(а.Р.1)-ехр| J В^Т) ls~ 1 Г Ир (s,i) + Л, (s, I) Q, (а, р, I)P d 1. (11.24) ,h /„ R rt-P*n! - f Л (^ S) + Л, (s, g) Qs (g, R, g) , , Ъ (а, p, i) — exp \ — J ЪцГТ) *s ^ ' о , 1 fMofc l) + AAs, £)Q,(a, P, I)]2 ,1. (П.25) о Доказательство. Отметим сначала, что (см. гл. 13, § 1) О 0 0\+ /О 0 0\ 0 1 0 ] = О 1 0 ]. 01-26) .0 0 B2(t,x)J \0 0 B-%x)J Поскольку 9, = Qt (0O, W, I) = Qt (а, р, |) при почти всех 0 < t < Т- Р-п.н. и выполнены условия (11.2) и (11.3), то t р I Г Ио(<, 1) + Л|«. l)Q«(g.P. D12 Л/ ^ оо = 1. Тогда в силу многомерного аналога теоремы 7.20 ра.р, ^Ца.рл- Согласно лемме 4.9 существует измеримый' функционал Qt(a, х, у)у определенный на ([О, Т] X R1 X Сг X Сг) и являющийся при каждых t и a Sit+ X .^-измеримым и таким, что при почти всех O^t^T Р-п.н. el = Q, (в0, witi), где ё|, 0</<7\—решение уравнения (11.16) при ri=i. По лемме 4.10 при почти всех 0<^^Г Р-п.н. Q/(a,p,g) = Q,(a,p,g).
§ 2] ВСПОМОГАТЕЛЬНЫЕ ПРЕДЛОЖЕНИЯ 443 Значит, процесс £ = (£„ #~,), 0<*<Г, имеет также дифференциал (ср. с (11.20)) dh = [Ао(*, I) + А{{U 1)Q,(в0, Wul)]dt + B(/, I)dW2(t). Поэтому и р( Г [А0 (t, J) + Л, (i, I) Qt (a, р, I) ]2 Л/ ^ nn 1 = 1." Отсюда в силу многомерного аналога теоремы 7.19 и леммы 4.10 получаем требуемое утверждение. 3. Пусть (8, |)—случайный процесс, подчиняющийся уравнениям (11.2), (11.3). Обозначим (mt(x),$lt+) такой функционал*), что при почти всех 0^/^Г mt($ = M(Bt\P)) Р-п.н., и пусть t t w — Г dls - Г 4,(s, El + ^fo S)/MS) ds (11 27) w'—) b(s,d J b{s,d : v ' ' о о Лемма 11.3. Случайный процесс W = (Wt, #i), 0</<7\ является винеровским. Доказательство. Из (11.27) и (11.3) получаем t Wt = W2(t)+ J 4rr{f^- ms®]ds. (11.28) 0 Отсюда с помощью формулы Ито находим, что t e*r, _ в««г. + iz | A^JQ_ ^ [Qu _ ^ {m da + S + iz J еШ" dW2 (u) - -f J ste*« rfM. (11.29) Как и при доказательстве теоремы 7.17, из (11.29) выводим, что Р-п.н. Лемма доказана. 22 *) См, лемму 4.9.
444 УСЛОВНО-ГАУССОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ [ГЛ. 11 4. Лемма 11.4. Пусть \х% и \х% —меры, отвечающие процессам g и §, определяемым из (11.21) и (11.22). Тогда щ~ щ и плотности задаются формулами *(В-«р|/^ь11±^Ь*1Й.4,- 2 2 J И0(5,1) + л,(!,1)^(1)Р^1 (Ili30) I о + 2lJ^^('.»y.(y)«.ft)l'd8}. (11.31) о ' > Доказательство. Из (11.27) находим dlt = [A,{t^) + Ax{t^)mt{l)\dt + B{Ul)dWt. (11.32) Пусть ! = (!*, #~Д 0 </< Г,—случайный процесс с дифференциалом 4/ = В(*,1)^ 1о = 6о- (П.ЗЗ) В силу предположений (11.7), (11.8) и теоремы 4.6 уравнение (11.33) имеет единственное сильное решение. Поэтому меры (if и jig совпадают (ср. (11.33) и (11.22)). Абсолютная непрерывность меры щ относительно меры щ (а значит, и относительно щ) следует из теоремы 7.20. Покажем, что верно и обратное, \х\ <С \х\. По лемме 11.2 1*8 (Г) = |*е (Г) = М \и е г}*, (а, р, |)] = = М[зй - г}М (ф, (а, р, g) | 3*1)] = J* M [г|>, (а, р, Q | г}\ъ- х <*« (*)• г Поэтому щ<Сщ. Формулы (11.30) и (11.31) следуют из теоремы 7.20 и леммы 6.8.
§ 2] ВСПОМОГАТЕЛЬНЫЕ ПРЕДЛОЖЕНИЯ 445 5. Обозначим Р/(а>Р,|) = ф/(а, Р, 1)/ф/(|), и пусть для каждого 0=0 < Г р,(а, й, х) обозначает такой (измеримый) функционал, что P/(a,P,E) = Matp,I)ft-6 (Р-п.н.). Тогда, учитывая совпадение мер щ и [Х|, из лемм 4.10, 11.2 и 11.4 выводим, что Р, (а, Р, g) = ехр { j ^§- [Q, (a, p, I) - ms ©] rf^s - - k j 4wIQ*(a* p> а "■ т°m dsy (1! -34) 0 Лемма 11.5. Пусть ft (00, W\, I) — #~?0' ^" l-измеримый функционал с М |М60> ^i»"i)l < °° • Тогда имеет место следующая формула (Байеса): м[Ме0, wui)\f\\ = 00 = { { U (а, с, £) р, (а, с, I) dnw (с) dFla (a), (11.35) — оо Cf где iiw(') — винеровская мера в измеримом пространстве (Сг, $т) непрерывных функций Ct = {cs, 0<$^Г}, a F$0(a) = =P{e0<au0}. Формула (11.35) есть не что иное, как формула Байеса (7.178), доказанная в теореме 7.23*). Следствие. Пусть ft (в0, Wu Q = ехр { i [20е0 + S ztWx (*/)] }, где 0 ^ /i ^ ... ^ /& ^ '• ^огйа условная характеристическая функция М (ехр| / [^ аг0в0 + S^^iC/)] J J ехр { /1 z0a + 2 ztct pt (a, c, g) d\iw (c) dFu (a), (11.36) — oo Cj de c{ в точках tj где ct — значения непрерывной функции с = (cs, 0 ^ s ^ Т) *) См. также замечания 1 и 2 к этой теореме.
446 УСЛОВНО-ГАУССОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ [ГЛ. 11 § 3. Доказательство теоремы об условной гауссовости 1. Докажем предварительно следующее предложение, являющееся ключевым при доказательстве теоремы 11.1. Теорема 11.2. Пусть выполнены условия (11.5) — (11.11) и с вероятностью 1 условное распределение /Ъ(я) = Р(е0<а1бо) является гауссовским, с параметрами m0=M(e0l!o), Yo=M[(e0-m0)2l!0], 0<Yo<°° (Р-п. н.). Тогда условное распределение ОЛа, си ..., *я) = Р{е0<а, Wx(tx)<cu ..., Wx{tn)<cn\ &\) является гауссовским для любых tt 0 ^ tx ^ ... < tn ^ t, и п=* = 1,2,... Доказательство этой теоремы существенно опирается на представление (11.36) для условной характеристической функции. Из (11.36) ясно, что для доказательства теоремы достаточно было бы показать, что для почти всех со мера р^ (а, с, £) d\iw(c)dFl (а) является гауссовской. Однако непосредственная проверка этого факта затруднительна. Применяемый далее метод доказательства основан на том, что pt(at ct |) аппроксимируются подходящим образом подобранными функционалами p\N) (а, с, |); для которых 00 Г 'Г П ' In j lim j exp j / \z0a + ^ zjct — oo Ct *> L y=l P{tN)(a,c, l)dixw(c)dFlQ(a) оказывается (Р-п. н.) квадратичной формой относительно г0,..., zn. 2. Осуществление намеченной программы начнем с преобразования 1пр,(а, р, |) к более удобному виду. Учитывая обозначения (11.14), (11.15), (11.18), положим в (/, i) JQ>71(t)a0(s,$)ds + о + /фгЧ6)-£^^]-«.(6)}. (П.37) й(*,.6) = ФГ'(9М'. 0- <И-39)
§ 31 Доказательство теоремы Тогда из (11.17) находим, что j$$lQt(%,Wut)-mt(m = 447 =*1 (t, t) + e0g2 (/, i) + g2 (t, i) / g3 (s, I) dw, (s). В силу (11.34) это позволяет 1прг(80, Wu |) записать в следующем виде: inft(e0,r,,D- Ui(s»S)+fo(s,D e0+Jft(«,S)^i(«) \\dws- -tJ{^s> D + g2(S,l) s e0+ Jft(«. £W(«) <fc. (11.40) По формуле (11.28) где винеровский процесс U^2 не зависит от винеровского. процесса Wx. Используя это обстоятельство, легко с помощью формулы Итр установить, что J g2 (*, 6) I J ft («. I) dWx («)) dtFs = J. g2 (s, I) dWs X 0 4) / 0 X J g3 (*, 1) <W, (s) - { Яз (s, £) j g2 (u, I) d#« ] dr, («). (11.41) о о \o / Аналогично, J £2 (s, g) M ft (". g) ^i (и) j ds = J g2 (s, |) ds X X J■&(*. 6W, (*)-/&(*. S)Mft(tt, S)dtfW(s). (11.42) о о \o /
448 УсЛОВНО-ГАУССОВСКИЁ СЛУЧАЙНЫЕ ПРОЦЕССЫ (Гл. 11 Пусть при каждом 0<^<Г Aj (tt x)t Д2(/, х) и Д3(Л х)— такие ^-измеримые функционалы, что t t A, (t, 6) = J g, (s, I) <W, -1 J* [g, (s, |)P ds, 0 0 t t A2 it, I) = J g2 (s, D drs - J gl (s, |) g2 (s, |) ds, о о As(M) = f J [ft(*. Б)]2^] • Пусть, далее, Д4(/, *) и Д5(/, #) —функционалы, измеримые по паре переменных, ^+-измеримые при каждом 0 ^ / <J T и такие, что при почти всех 0^/^Г t О t АбС 6)=/&(*. Q Л. О Обозначим, наконец, для каждого t Дб(/, л:, у) и Д7(/, х, у) функционалы, являющиеся 3tt Х^гизмеРимыми и такими, что t t Дб(*, Wu Q = A4(*. I) j &(s. £Wi (*)- J gz(s, |)Д4(5, 6)^,(5), о о t t A7(M^i,6) = A5(/f Q J ft(«. 6)^iW-J&(*,SAe(e,S^i(e). о о Из (11.40) —(11.42) и лемм 4.10, 11.2 с учетом этих обозначений находим, что для ае^1 In 9t (a, Wul) = Д1 (*, I) + аД2 (/, |) - £ д32 (/, |) + Дб (/, W и |) - ' Г 5 I2 -аА7(МГ„1)—i-J[&(s, DPM Ы"Д)<*«М") Л. (П.43) о Lo J Из определения величин Дб(£, fl^, |)> Д7(£, №i, |)» лемм 4.10 и 11.2 и независимости процессов Н^! и | вытекает, что условное распределение этих величин (при заданных |) является гауссовским.
§ 3) ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 449 Пусть 0 = toN) < t\N> < ... <tW = t — разбиение отрезка [0, *] такое, что тах| ^, — (\Ю\-+ 0, jV-> оо. Положим ^N(s) = t(Jm, если /</W<s<4+,i. Ясно, что tyN(s)->s, N-+00, и j* g3 (и, I) dWx (и) -> { g3 (и, I) dWt (и) (Р-п. н.). о Более того, lim sup N-*oo 0<s<T /♦дг") J g3 («, I) dIP, («))-/& (и, I) dWx (u) = 0 (см. (4.47) и гл. 4, § 2, п. 6), t 4NK Jjjn J [&(*. I)P( j ёг (", I) ^. («)) rfs= = J [ft (s, I)]2 J & (". I) dWi (и)) rfs. (11.44) Л \Л / 0 v*0 Образуем теперь последовательность функций p{tN)(at Wi91), положив • In р^ (а, Г„ I) = Л, (/, I) + аД2 (/, I) - -■J S J" ^' ^ I и (и, bdWx(u)ds. (11.45) *W Тогда в силу (11.44) для всех a^R1 lim lnp^(a, Wl9 §) = lnp,(a, Г„ f). (11.46) Правая часть в (11.45) является неположительно определенной квадратичной формой (с коэффициентами, зависящими от а, |, t, t{jN)) величин 1 М*. ^> I)» М'. ^i. I)» J ft("> I)^i (и),/«1,2,..., И,
450 УСЛОВНО-ГАУССОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ [ГЛ. И совместное распределение которых (при заданных £) является гауссовским. Точно так же Ы ехр / z0a+ tzkW{(tk)VjpW(ay U7„f)} является неположительно определенной квадратичной формой величин WtVk), k=\y .... л; Дер, Wl9 Б); Д7(*. Wl9 I); tf J й(и, |)^1(и), /=1, ...,iV с (условным) гауссовским совместным распределением. С учетом этого обстоятельства вычислим Ы'. ^ I)=fexp(t Ua+2 vJIp^^^I)^^)» (1L47) Cr ^ L fe=l J J используя следующее предложение, справедливость которого устанавливается прямым подсчетом. Лемма 11.6. Пусть £=(£i, ..., 1,т) — гауссовский вектор с М£ = а, М(£ —а)(£ —а)* = Г, det Г > 0. Пусть d = rf, + id2> d\=(dnt ..., dlOT), d2 = (d2u ..., d2m). di^R1 и D — неотрицательно определенная симметрическая матрица порядка шУ^т. Тогда de dttv ) Х X ехр{ 1 [- аТ"1 а + (d, + аТ"1)(2D + Г"1)-^ + аТ"1 )*] + + /[d2(2D + r-|)"1(rf1+aT-1)*-Y[^(2£>+r-1)~1 (К)]}. (П.48) Для дальнейшего анализа нам нужен не явный вид правой части (11.48), а лишь только то, что Mexp{d£ — £*£>£} можно представить в следующем виде: Мехр {<*£-№} = = е ехр^.6 + —dyyd\ + id2yd\ + Ш - j d2yd*2}, (11.49)
§3] ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 451 где е - (det(2Dd+rr"1r1)m/2exp{j[~aT^ a + + ar-l(2D + r~lVlr-la]}, 6 = (2D + r"1r,r"1a, Y = (2D + r-1)"1. Замечание. Если rangT = r<m, то тогда найдутся га- уссовский вектор 1 = Ц\, ..., £г) с М£ = 0, МЦ* = Е{гхг) и матрица С(тхг) такие, что (Р-п. н.) В этом случае М ехр № ~ CDQ = М exp {d (а + С& - (а + С£)* D (а + С£)}, что с учетом (11.49) можно переписать снова в виде М ехр {d£ — l*DQ = е ехр |di6 + у rfiv^i + Игу^Г + &£ — у d2Y^2 } с некоторыми ё, б, уу явный вид которых может быть легко найден. Применяя эту лемму к вычислению интеграла (11.47), находим, что h С а, |) = е<п (/, |)exp{[/z0 + Д2(/, |) + 6^(t, I) + п + / 2 z*yM?(*, I)] а - \ [Дз2 (/, I) - Yoo' (t, I)] + +'i2x)^i)-iii^Y^(U)}, где ЦуйРС» ^)||» N = 1,2, ...,—симметрические неотрицательно определенные матрицы. Заметим теперь, что величины p(tN)(af Wx% I) мажорируются интегрируемыми (по мере d\iw) величинами ехр{л1(/Л) + аД2(/,1)-4дз2^|) + Дб(/,Г1,1)-аЛ7(^^1,1)}. Поэтому в силу (11.46) и теоремы Лебега о мажорируемой сходимости (теорема 1.4) существует предел I (t, а, I) = lim IN (t, a,l) = N-*oo = J exp m0a+.J V/ pt{a, c9 l)dixw{c). (11.50)
452 УСЛОВНО-ГАЮСОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ [ГЛ. 11 В силу произвольности ау zu ..., zn величины еш> (/, |), 6^ ft |) и y{ff ft I) стремятся при N ->оо к некоторым пределам е (t, I), б/ (*, |), y*/ ft I). При этом матрица || у*/ ft I) II является неотрицательно определенной, как предел таких же матриц. Ясно также, что М ехр { / W+5>/ttM'/) /=i (ГЦ = = J /(*,a,I)d/b(a). (11.51) откуда в силу эквивалентности мер н^ и ^ и гауссовости условного распределения /^0 (а) следует справедливость теоремы 11.2. Замечание. То же самое доказательство показывает, что Р-п. н. М ехр { / ЗГН= «о+о ft б) в0+2 «/♦/ ft а J */ л i) dwx (s) /=1 0 = exp / J губ; (/, Б) -1 J г^уу*/ ft g) I. (И .62) /=o /, fc=o где || у*/ ft 1) II — неотрицательно определенная симметрическая матрица. 3. Доказательство теоремы 11.1. Пусть 0 = /0< < t\ < ... <tk = t^.T — некоторое разбиение отрезка [0, Г]. Тогда с учетом (11.19) имеем М (ехр{/ S 2,9^}!^)= м(ехр{/ J] z,QtJ(Q0, Wu g)} где согласно лемме 11.1 Q<y(e0, ur„g) = Ф,/(|) (П , + 60+/ Ф71&)a0(s,$)ds + о г' ' 1 J Ф."' (I) 6, (s, |) rfr, (s) + J ФГ1 (Ю^ет" rf|sJ ■
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ 453 Поэтому М exp\i1%ziQgi(B09Wl9l) /=о = ехр \ т\ 1=0 ■Ф/,(6) J ФГ'(1)Зо(5, 6)dS + '/ О X X М ехр п-1 2*/<va /=0 90+J Ф71 (t)bi(s, QdWi(s) Применяя к правой части (11.52) замечание к теореме 11.2, находим, что М ехр «J 2/8^ /-о &} = ехр i £2,6, (t, S-|S г**/?*/(*. В) Г. (И-53) /=0 fe,/=0 где || у*/ (*, I) II — некоторая неотрицательно определенная симметрическая матрица. В силу произвольности 20, zlf ..., zrt из (11.53) следует, что условное распределение P{QtQ<a0, ..., 9^<а„|#1) является для любых ^0<*i< ••• <tn^t и п=\,2, ... гауссовским. Теорема доказана. Замечание. Пусть 0^5^tQ < ... < tn^t. Тогда условное распределение Р(е,0<а0, ...,Qtn<an\<rets'l\ также является (Р-п. н.) гауссовским, что вытекает из гауссо- вости распределений Р(б5<а, 8*о<ао< ... <а/л <ал| #"*).
454 УСЛОВНО-ГАУССОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ [ГЛ. 11 4. Для нужд задач фильтрации, интерполяции и экстраполяции условно-гауссовских процессов особый интерес представляют параметры mt = M(e*l &*)) и yt = M[{Qt —mt)2\&~}\ условного распределения /у (а) = Р(0,<а| #~|). Их можно было бы найти, отыскав явный вид входящих в (11.53) элементов 6f(t, £) и. bi (t* £)• В следующей главе будет показано, однако, что для отыскания параметров ти yt (а также других характеристик условно-гауссовских процессов) проще поступить иначе, воспользовавшись общими уравнениями фильтрации, интерполяции и экстраполяции, выведенными в восьмой главе.
ГЛАВА 12 ОПТИМАЛЬНАЯ НЕЛИНЕЙНАЯ ФИЛЬТРАЦИЯ, ИНТЕРПОЛЯЦИЯ И ЭКСТРАПОЛЯЦИЯ КОМПОНЕНТ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ § 1. Уравнения оптимальной фильтрации 1. Пусть (8, |) = (8„ |,), 0</^Г, — непрерывный случайный процесс диффузионного типа с d% = К С I) + а{ С. 6) в J Л + ft, (<f « dWx (t) + 62 (f, Q dlF2 (О, (12.1) ^ = [Д> (f, Б) + Ах (/, I) 9J А + В ft Б) dW2 {t). (12.2) Будем предполагать выполненными условия (11.4) —(11.11), сформулированные в предыдущей главе. Тогда, если условное распределение /ч0(а) = Р(80^а| |0) является (Р-п. н.) гауссов- ским, N(m0,y0), то в соответствии с теоремой 11.1 условное распределение F^t(a) = Р(8,<а| IFf) также будет гауссовским, N{mt,4t)- Поэтому, если М8*<оо, 0</<7\ то один из параметров этого распределения — апостериорное среднее mt = = М(8*| #~f)— будет оптимальной (в среднеквадратическом смысле) оценкой 8* по £о = {!<?> s^/}. Знание второго^параметра этого распределения — yt= М([8, — mtf\ g~\) — дает возможность находить величину ошибки фильтрации Д, = М(8,-т,)2 (=Му,). (12.3) В приводимой ниже теореме 12.1 находятся уравнения, которым удовлетворяют mt и yt. В силу условной гауссовости процесса (6, |) эти уравнения оказываются замкнутыми. Важно подчеркнуть, что теорема 12.1 содержит как частный случай уравнения фильтрации, выведенные в случае схемы Калмана — Бьюси в десятой главе. При этом, если в схеме Калмана — Бьюси процесс (8, |) был гауссовским и, как следствие этого, оптимальная фильтрация оказалась линейной, то
456 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 в рассматриваемом нами условно-гауссовском случае оптимальный «фильтр», вообще говоря, является нелинейным. 2. Вывод уравнений для mt и yti основанный на использовании основной теоремы фильтрации (теоремы 8.1), проходит по следующей схеме. Согласно (12.1) t Ъ = % + j К (s, I) + a, (s, I) 9S] ds + xt, (12.4) о где t xt = j [6, (s, I) dWx (s) + b2 (s, 6) dW2 (s)]. (12.5) 0 Из (12.4), (12.5) с помощью формулы Ито находим, что t 8? = 9о + J (29s [ао (s, £) + Ъ (st I) 8,] + о + [b2i(s,l)+t*(s,l)])ds + Xu (12.6) где t xt = j 29s [bx (s, |) dWx (s) + h (s, I) dW2 (s)}. (12.7) 0 Обозначим ht = Qt, Я, = ао('.6) + М'.6)в, 02.8) и Я, = 9?, Ht = 20/ [ао (t, |) + fli (f, g) 9,] + [tf (f, g) + 62 (*, £)]. (12.9) Тогда уравнения (12.4) и (12.6) запишутся в следующем виде: t ht = K+ J Hsds + xtt (12.10) о t Я, = й0+ J Hsds + xt. (12.11) о Таким образом, ненаблюдаемые процессы Л, и й, имеют именно ту форму, которая предполагалась в теореме 8.1.
§ 1] УРАВНЕНИЯ ОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ 457 Для того чтобы воспользоваться результатом этой теоремы, надо найти условия, при которых выполнены предположения (8.6) — (8.8), входящие в ее формулировку (остальные предположения выполнены в силу (11.4)— (11.11)). В рассматриваемом нами случае эти условия (8.6) — (8.8) сводятся к следующим: sup Мб'<оо, (12.12) т J M [a0 (s, |) + a, (s9 |) 9S]2 ds < oo, (12.13) о т J M [2Qs[a0(st |) + ах (s, I) в,] + [tf (s, |) + bl(s9 I)]}2ds < oo, (12.14) т JM{AQ(sil) + Al(sil)Qs}2ds<oo. (12.15) Для выполнения этих условий, а также чтобы иметь возможность утверждать, что X = (xtt @~t) и X = (xt, !Ft), 0^.t^ 7\ являются квадратично интегрируемыми мартингалами, потребуем выполнения следующих условий: для всех х^Ст, 0</^Г, ax(U *)!<£, I A(U)l<i; (12.16) т J M [a0(t, I) + b\{U I) + bt(t, l)]dt < oo; (12.17) ^4 M9o<oo. (12.18) Для доказательства достаточности этих условий установим предварительно справедливость следующей леммы. Лемма 12.1. В предположениях (12.16) — (12.18) М[ sup 8j]<oo. (12.19) Доказательство. Положим
458 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 считая Тд, = Г, если sup 8S < N. Тогда в силу неравенства Гёльдера [t А Тдг t л ttf %+ J a0(s,t)ds+ J a{(s,t)Qsds + о о 2 'ЛТдг + £ J bds.DdWds) t=l О <125 /t t\iN 6o+J Oo(s, l)ds\ + ((Л% И 2 /'ЛТдг \ 4-. <125 * Л Tjy tf Л т N во + tf Л т^)3 J a40 (s, g) ds + (* Л т„)3 J a\ (s, I) 8* ds + о о 2 /*ЛТ# Hi + 21. J ^(s.Ddwas) i=i \ о (12.20) Согласно лемме 4.12 Ml J M*. S)dHM*)) <36rjM6l(s, |)ds, /=1,2. V о / о Поэтому, поскольку 8S = 8S л xN для s < / Л xN9 №t ArN< 125 MQt + 7* J Mao(s, |) rfs + 2 Г + Г3/,4 J M94л twds + 36Г ^ J MbUs, 6) ds i=l 0 т. e. MelATjv<c, + c2|Me4sAtJvds, (12.21) где С,, C2 — некоторые константы. Значит, по лемме 4.13 ме2ЛТл,<с1еСгЧс1еС2Г и по лемме Фату М94< lim Ме<Л,„<Си?с,г, #-»<»
§ 1] Итак, УРАВНЕНИЯ ОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ sup M9?<oo. 459 (12.22) Покажем теперь, что и М [ sup 8*]<оо. Из (12.20) с за- меной / Л xN на / получаем т т sup 8?<125' " во + f \ at (s9 |) ds + fL4 JQids + о о 2 If" + У sup \\bt(s,$dWt(s) Согласно неравенству (3.8) и лемме 4.12 М sup t It i J bt (s, |) dWt (s) < (y)4 -36 T-j Mb] (s, I) ds, /=1,2. Поэтому в силу (12.22) и предположений (12.16) — (12.18) М[ sup Gt] < 125 ме, o + fJM(s9l)ds + + 2 ' rV sup Ме' + ^У'ЗбгУ | M&J(s,£)ds *=1 0 < 00. Лемма доказана. Итак, из предположений (12.16) — (12.18) вытекают условия (12.12). Очевидным образом проверяется, что эти предположе1 ния гарантируют справедливость неравенств (12.13) — (12.15). Из явного вида процессов xt и xt и предположений (12.16) — (12.18) легко выводится, что X = (xt1 Tt) и X = (xt, &~t), 0</<7\ являются квадратично интегрируемыми мартингалами. Таким образом, условия теоремы 8.1 в рассматриваемом нами случае выполнены. t Учитывая, что {х, W2)= \ b2(s, Qds, из (8.9) находим о t mt = m0 + J [a0 (s, I) + a{ (s, g) ms] ds + + fiM.,8t<iM|,,sfH)», <i2-23»
460 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 где t ур _ Г dls-(Ao(s, l) + Ai (s, l)ms)_ds_ B(s.l) о Далее, M(Q2S\ У]) — m2s = ys. Поэтому из (12.23) следует, что dmt — [а0 (/, |) + а{ (t, |) тЦ dt + + b2{tA)BiBHtVAit'l)[dl'-{A^ t) + Mt,$)mt)dt]. (12.24) Обозначаем теперь 6t = M(&2t\&~f)t так что 6, — m2t = yt. t Тогда, учитывая равенство (xt W2)t= \ 2Qsb2(s, Qds, опять- о таки из (8.9) получаем t ** = бо + J [Ч («. 6) «. + 2ai (s> 6)б* + b\ (*> 6) + % (s, £)] ds + 0 t + J" {2mA (s, I) + B~l (s, |) [Л0 (s, |) б, + Л, (s, £) M (ej | r\) - -MA0(s,l) + Al(s,l)ms)])dWs, или bt = \ + J [4 (». I) "», + 2a, (s, £) 8S + b\ (s, I) + ftg (s, Щ ds + 0 t + Jfi-'(«, £){2mA(s, g) В (*,!) + o + Л, (s, |)[M (8j | ^1) - 6sms]} diP.. (12.25) Из формулы Ито и (12.24) находим m* = < + J (2™s [«о <s> I) + a> (*. 6) «J + 0 + J2m/2(s'l)B(^(ls; + ^l(s-l)rfrs, (12.26)
§ 1] УРАВНЕНИЯ ОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ 461 что вместе с (12.25) дает для yt = 6t — ni\ следующее представление: t Vt = Yo + / [2a, (s, 1) Ys + b] (s, g) + b\ (s, |) - о (b2(s,l)B(s,l) + yfAl{s,l)y\j -[ bKT) / \ds + t + \ 4'(W Iм (8' I ^ ~6°m° ~ 2m^l dW°- (12>27) 0 Поскольку условное распределение P (8S ^ a | ff~l) является гауссовским, то (см. (11.1)) М (в? | Г\) = Зт А ~ 2ml (= \ms + 2™SYS)- Поэтому в (12.27) стохастический интеграл равен нулю, а следовательно, t Vt= Yo + J [2a, (s, I)ys + b\(s, g) + b\(s, g) - -(*«(»■ » Д^» + ^('-»у]^ (12.28) Итак, доказана Теорема 12.1. Пусть (6, I) — случайный процесс с дифференциалами (12.1), (12.2). Тогда, если выполнены условия (11.4) — (11.8), (12.16) —(12.18) и условное распределение Р(90^аЦ0) является гауссовским, N (m0, у0), to mt и yt удовлетворяют системе уравнений dmt = [а0 (/, I) + a, (t, I) mt) dt + + Б2 (/t g) [dh — (AQ(t9 D + A^t, l)mt)dt], (12.29) _(^(^)Bft» + ^(U)yt (1230) решаемых при условиях m0=M (801go), yQ = M [(80 — m0)2 I lol* Замечание 1. Из (12.29) и (12.30) следует, что апосте" риорные моменты mt и yt непрерывны по t (Р-п. н.). Замечание 2. Пусть A{(s, х) = 0, т. е. пусть наблюдаемый процесс g = (|/), 0<^<7\ имеет дифференциал ^ = Л0(/, Е)Л + В(/, g)<W). (12.31)
462 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 а наблюдаемый процесс 9 = (6/), О^/^Г, по-прежнему удовлетворяет уравнению d% = to (t, 1) + a, (/, I) 8,] dt + bx (t, |) dWx (t) + b2 (i, I) dW2 (t). Из проведенного выше доказательства (см. (12.27)) видно, что и без предположения гауссовости условного распределения Р(0о^а||о) параметры mt и yt удовлетворяют системе уравнений dm, = to С. 6) + М*. Ъ)щ]Я+±^№,-Ш Qdt], (12.32) yt = 2ax(t9 t)yt + b*(t, |). ' (12.33) Замечание 3. Пусть me (tt s) = M [б, | Т^ Ц для s < t и Yes ('. s)=M [(9s - mQs (t, s))21 Г** *]. Тогда т^ (t, s) и y^t, s) удовлетворяют при t>s системе уравнений (12.29), (12.30), решаемой при условиях mQ (s, s) = Bst yQ (s, s) = 0. Доказательство аналогично выводу уравнений для mt и yt и использует тот факт, что условное распределение Р(в^а|^5'6) является гауссовским (см. замечание к теореме 11.1). Из уравнения (12.30) и условия y6 (5> s) = 0 вытекает, что на самом деле Ye С» s) не зависит от 6S. 3. Остановимся на одном частном случае системы (12.1), (12.2), для которой уравнения фильтрации (12.29) и (12.30) допускают явное решение. Теорема 12.2. Пусть 8 = 8 (со) — случайная величина с М84 < оо. Предположим, что наблюдаемый процесс g = (£,), 0^^< Tt допускает дифференциал dlt = [Л0 (*, I) + A{ {U I) Q]dt + B (t, |) dW2 (0, где коэффициенты А0, А{, В удовлетворяют условиям теоремы 12.1, а условное распределение Р(8^а|£0) является гауссовским. Тогда mt = М (8 | @~\) и yt = М [(8, — mtf | #~|] задаются формулами щ + Y°J 4^H)"[dls~" Л° (s' l)ds] mt= ^ r , (12.34) '+*!№$■)'*■ 0 V, = — • (12-35) ' + »/(«)'*
§ 11 УРАВНЕНИЯ ОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ 463 Доказательство. В силу (12.29) и (12.30) mt и yt удовлетворяют уравнениям dmt=yB'V,'l) [rfS'-(4>«» l) + Ax(tt l)mt)dt]y (12.36) Y/= — (*Ш- решения которых, как нетрудно проверить, задаются формулами (12.34), (12.35). В рассматриваемом случае формулы (12.34) и (12.35) можно было бы получить непосредственно из формулы Байеса (11.35), не обращаясь к общим уравнениям фильтрации для условно- гауссовских случайных процессов *). Действительно, если у0 > 0, то в силу (11.35) Р(9<а|Я) = М{х1е<а]|^} = а ( t Г 1 1 (а —/по)2 • Г Л{ (s, |) , ,«.Чч «= = Т7==ехр\- + ll >s; (a — m8(l))dWa — -НШН-«'.«»Гл da. Отсюда следует, что условное распределение Р (б < а \ &~\) обладает плотностью dP (0 < а | Вт}) _ 1 | (а - ш0); , -expf da J/ 2яу0 I 2yo \2 * +14w (a - «. (б» ^. - т J [4ierf(a - m* <*»]'ds о о (12.38) С другой стороны, условное распределение P(9*^a|#"i) является гауссовским: ,Р(е<аИ]_ ' -J («—" i (12.39) da У2яу, eXPl 2v, Г *) При этом выводе уравнений для т, и у. можно отказаться от предположений (12.15) и (12.16).
464 ' ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 Приравнивая в (12.38) и (12.39) члены при а и а2, получаем t -£-т/(4Шл—ч^-* <12-40) и о о f Из (12.40) непосредственно следует формула (12.35). Если же теперь учесть, что dWt bWT) • то из (12.41) получаем требуемое представление (12,34). Если P(y0 = 0)>0, to для вывода формул (12.34), (12.35) следует вместо распределения Р(8^а||0) рассмотреть гаус- совское распределение Р8(8<а|£0) с параметрами те0 = т0, Yq = Yo + 8r e > 0. Тогда соответствующие величины т\ и у? будут задаваться формулами (12.34), (12.35) с заменой Yo на Yo=Yo + e» в которых затем надо сделать предельный переход при е \ 0. § 2. Единственность решений уравнений фильтрации. Совпадение a-алгебр У) и У\^ 1. Для условно-гауссовского процесса (8, |) апостериорные моменты mt = M(Qt\@"}) и yt = M [(0, — mtf | (F\\ удовлетворяют, согласно теореме 12.1, уравнениям (12.29), (12.30). Следовательно, эта система уравнений имеет F^-согласованное решение (F6 = (#"!), 0<*<Г). В этом параграфе будет показано, что непрерывное решение этой системы единственно. Таким образом, решая эту систему уравнений, мы действительно будем получать моменты mt и yt условного распределения 8,. Теорема 12.3. Пусть выполнены условия теоремы 12.1. Тогда система уравнений dx (t) = [а0 (t, g) + a, (t, I) x (t)] dt + (12.42) */ (t) = 2a{ (t, l) у (t) + b\ (t, » + b\ (/, I) - ( b2(Ul)B(U l) + y(t)Al (/, 6) \2
§2] ЕДИНСТВЕННОСТЬ РЕШЕНИЙ 465 решаемых с начальными условиями х (0) = т0, у (0) = у0 (| т01 < оо, 0 < Yo < °°)> имеет единственное непрерывное, £Г)-измеримое при каждом t решение, 0 ^Y ^ Т. Доказательство. Пусть y{(t) и j/2(0, 0^/^7\—два неотрицательных непрерывных решения уравнения (12.43). Тогда \У1«)~У2«)\< < 2J(\al(s,l)\ + \^§Al(s,l)\)\yi(s)-y2(s)\ds + о + \^^[yx{s) + y2{s)]\yx{s)-y2{s)\ds. (12.44) Обозначим rAsA) = ^{\aAs^)\ + \bi^)A^s^)\) + ^Y)[yi(s)+y2(s)]. Тогда неравенство (12.44) перепишется в следующем виде: t I Ух (t) -J/2 (t) К J г, (s, I) \y{ (s) - y2(s)\ds. 0 Поэтому в силу леммы 4.13 P{</i(0 = </2(0}==1> 0<«Г. и в силу непрерывности решений y{(t), y2(t) Р{ sup \yi{t)-y2{t)\ = 0} = \, о <^<г что и доказывает единственность непрерывного решения уравнения (12.43). Пусть теперь x{(t) и x2(t) — два непрерывных решения уравнения (12.42). Тогда Xi(t) — x2(t) = b2(s,t) Л ,_ оЧ , ^/ (5) Л?(5, 6)" Л« = J |«.(s, D + 0 -4.(s, i) [xi(s) —x2(s)]ds и, следовательно, I *! (t) - x2 (t) К / '2 (s, |) I *, (s) - x2 (s) | ds, (12.45) 0 где h{s, l)=\ai(s, 1)1 + 1 B2('t'gj ^,(s, |) </(sMf(s,p S2(s>S)
466 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 Поэтому, снова применяя к (12.45) лемму 4.13, находим, что х{ (t) = х2 (t) (Р-п. н.) для каждого/, 0</<Г. Отсюда получаем: Р{ sup \xl(t) — x2(t)\ = 0}=L Замечание. Согласно доказанному yty O^t^T, является единственным непрерывным решением уравнения (12.43). Покажем, что если P(yo>°)=1> то и P{inf у* > 0}= 1. Действительно* в силу непрерывности yt > 0 для достаточно малых t > 0. Положим T = inf(/^r: yt = 0), считая т = оо, если inf y* > 0- Тогда при t<xAT определены величины б = YJ"1, удовлетворяющие уравнению 6, = - 23l (*, I) 6, + (^$$f ~ Щ (*, |), б0 = Yo"1, (12.46) где 5i(U) = ^U)-)|fA(U). На множестве {со: т<Г} Нт6*'=оо (Р-п. н.). Однако согласно t *Т (12.46) I* 1 ( t г s -j 2 -2 J ax(s9 l)ds\\uQ + J exp 2 j a, (и, g) du N д^тг- о J l о L о J 9 2 \ Г Г Г A (S> I) -6Wi(s, $))ds <exp 2J |a,(s,g)|ds 60 + J gr^fy^ J l о J L о Значит, Р{т<Г} = 0. Иначе говоря, inf y* = (sup 6t)"l > 0 (Р-п. н.). 2. При выводе уравнений фильтрации для процесса (8, |) предполагалось, что этот процесс является решением системы уравнений (12.1), (12.2) с некоторыми винеровскими процессами Wx и WV Однако не предполагалось, что процесс (8, £) = = (fy» S*)» 0^/^Г, являлся сильным решением (т. е. ув0. g0. Vi. ^-измеримым для каждого /) этой системы. Нетрудно привести условия, при которых эта система имеет, и притом единственное, непрерывное сильное решение. Теорема 12.4. Пусть g(tt x) обозначает любой из неупре- ждающих функционалов аь^у х), At(tt x), bj(t, x)t B(t9 x), j = 0, 1, /=1, 2, Q^t^T, х^Ст. Предположим, что
, 2] ЕДИНСТВЕННОСТЬ РЕШЕНИЙ 467 1) для любых х, ^еСг t \g(t,x)-g (t, у) I2 < L, J (x. - ysf dK (s) + L2 (xt - ytf; 0 t 2) g2 (t, x) < L, J (1 + *2) rftf (s) + L2 (1 + x2), d где К (s) — некоторая неубывающая непрерывная справа функция, 0^К(s)^l, Li, L2 — константы] 3) | а, (/, *)|<Llf I Л,(^ jc)|<Z.2; 4) М (9^ + So") < °° ^ля некоторого целого n^l. Тогда система уравнений(12Л), {\2.2)имеет непрерывное сильное решение. Это решете единственно, и sup M (9?rt + |?п) <оо. Доказательство. Утверждение теоремы доказывается так же, как и в одномерном случае (теорема 4.9). 3. Рассмотрим теперь вопрос о совпадении а-алгебр &\ и &~lt°'wt 0</<7\ где W = (Wt, Р\) — винеровский процесс с дифференциалом (см. 11.27)) dWt = B-](t, $)[d$t-(A0(t, l) + Ax(t9 l)mt)dt], W0 = 0. (12.47) Согласно (12.29), (12.30) и (12.47) процессы mt, lt, yit O^t^Ty образуют слабое решение системы уравнений dmt = [а0 (t, g) + а{ (t, |) mt] dt + [b2 (t, |) + У£1£®] dWt9 dtt = [A0(t, l) + A{(t9 l)mt]dt + B(t, l)dWg9 (12.48) а»(/ж ^ —57ПГ л«('; Б). решаемой при заданных пг0 = М (90110), £0 и y0 = М [(90 — т0)21У. Изучим вопрос о существовании сильного решения у этой системы уравнений. Положительное решение этого вопроса позволит нам установить факт совпадения а-алгебр *Fj и У|**^, 0^/^Г, что в свою очередь будет говорить о том, что (обновляющий) процесс W и |0 содержат в себе ту же самую «информацию», что и наблюдаемый процесс £. Теорема 12.5. Пусть функционалы at(t, x), At(t, x), bj(t, x)t B(tt х)у / = 0, 1; /=1, 2, удовлетворяют условиям 1)
468 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ (ГЛ. 12 и 2) теоремы 12.4. Пусть также у0 = у0(х), a^t, х)> At(U x), bj(t, x) и В"1 (t, x) (/ = 0, 1; /=1, 2) равномерно ограничены. Тогда система уравнений J 12.48) имеет, и притом единственное, сильное (т. е. @mlJ1*'Yot *0t w-измеримое при каждом t) решение. При этом gr) = g-)^y 0<*<7\ (12.49) Доказательство. Пусть хеСг. Рассмотрим уравнение, которому удовлетворяет Y* = Y/M: 4?(e, x) \t W = Yo (*) + J [2Й1 (*> x) Vs W + 6? (s> *) — Wjtxl Y* WJ ds. (12.50) Уравнение (12.50) является уравнением Риккати, причем его (неотрицательное непрерывное) решение существует и единственно для каждогох е Сг (ср. с доказательством теоремы 12.3). Из (12.50) нетрудно вывести, что Y, (х) < exp J 2й, (5, х) ds \ | у0 (х) + t Г 8 + J ехр — 2 J ах («, х)( о L о b\ (s, x)ds\. В силу сделанных предположений отсюда вытекает, что yt(x) равномерно ограничены по х. Покажем, что функция yt(x) удовлетворяет условию Липшица: t I Vt(x) — yt(y) \2<L j\xs — ys \2dR(s)t x0 = y0, о с некоторой неубывающей непрерывной справа функцией K(s), 0<tf(s)<l. Из (12.50) получаем t Y/ (х) — УЛУ) = J { 2 [ах (5, a:) ys (х) — ах ($, у) ys (у)] + о
§2] ЕДИНСТВЕННОСТЬ РЕШЕНИЙ 469 В силу условия 1) теоремы 12.4 | 5, (t, х) у, (х) — а, (/, у) yt (у) |2 < < 2Y2 (х) | а, (/, х) - а, (г, у) |2 + 21 а, (*, *) |21 Y, (*) - v, (у) f < t <d0j\xs-ys\2 dK (s) + d{\xt-yt? + d2\ yt (*)-Y/ GO l2> (12.52) о где d0, d{ и d2 — некоторые постоянные, существование которых гарантируется равномерной ограниченностью величин ах (t, x) и у((х)9 шСг, Аналогично, t | b\(t, х) - b!(/, у) \2Кd,\\xs-ys f dK(s) + d4\xt-yt f (12.53) 0 < B*(t,x) v«w BHUy) У*КУ> t < d5 J*I *,-y, pcf/C(s) + 4,1 *,-^ P + d1\ yt(x)—tt (y) P. (12.54) 0 Из (12.51) —(12.54) находим 'Гs 1 IУД*)-У/Ш<<*8 J / (*„ -ytfdKiu) \ds + 0 U J + d9 J (xs-ys)2ds + d10 J I ys (x) —ys(y) |2tfs< <</8Г J (x,-y,)2 diC (s)+d9 J (v-yf)2 Л+<*ю J I Ys (x) -y9 (У))2 ds. о о о Поэтому по лемме 4.13 I Y*(x)-Y/(У) I2< № J (**-J/s)2 rfiC(*)■+ dg J (^-i/s)2^ *V < L о о J <4./fe-^)2^(5), (12.55) «a /7.. —»— odiuT | ЛГ(Г) + Г где tf (s) = -££r£f. a d„ = e«.°r [rf8r + rf9] (К (Г) + Г)
470 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 Рассмотрим теперь первые два уравнения системы (12.48), в которые подставлено Yf = Y*(£)» являющееся, как показано выше, непрерывным равномерно ограниченным решением третьего уравнения этой системы: dmt = [a0(t9 $+ax(t, t)mt]dt+ \b{(t, 9+fflv/(9]^ L _(/' l) J (12.56) dlt = [ A> (t, I) + Ax (t9 I) mt] dt + B (/, |) dWt. Согласно предположениям теоремы и установленным свойствам функционала yt(x) система уравнений (12.56) обладает единственным сильным (т. е. FT0' ^' ^-измеримым при каждом t) решением (см. замечание к теореме 4.6). Но т0 = М(60|£0) ^-измеримо. Поэтому Я"?**»* = p-yw^ 0</<Г. Следовательно, |, при каждом / FY ^-измеримы. Итак, Ft ^ Ft W. Справедливость же обратного включения, FJ^Ft w, следует из конструкции обновляющего процесса W (см. (12.47)). Теорема доказана. Замечание 1. Отметим, что в схеме Калмана—Бьюси а0 (/, х) = а0 (t) + а2 (t) xt9 ах (t9 х) = ах {t)9 A0(t, x) = A0(t) + A2(t)xt, A{(t, x) = Ax(t)9 (12.57) В (/, x) = B(t)9 bt (t9 x) = bt (t)9 /=1,2. В этом случае коэффициенты в уравнении, определяющем yt, являются детерминированными функциями, а уравнения для mt и \t имеют следующий вид: dmt = [aQ (t) + ах (t) mx + a2 (t) |J dt + \bx (t) + ^гтЛ] dWt9 L J*W j (1258) dlt = [Ao (t) + Ax (t) mt + A2 (t) lt] dt + B (t) dWt. Эта система имеет единственное сильное решение в тех же самых предположениях, при которых были выведены уравнения фильтрации Калмана~-Бьюси (см. (10.10), (10.11)). Поэтому в этом случае F} = FYW, 0<f<7\ Замечание 2. Равенство F) = FY w остается справедливым и в случае многомерных процессов 9 и £ (с очевидными изменениями в условиях теоремы 12.5, вызванными многомерностью процессов 0 и £), рассматриваемых в следующем параграфе.
§ 3] УРАВНЕНИЯ ФИЛЬТРАЦИИ В МНОГОМЕРНОМ СЛУЧАЕ .471 § 3. Уравнения оптимальной фильтрации в многомерном случае Обобщим результаты предшествующих параграфов на тот случай, когда каждый из процессов 8 и | является векторным. 1. Снова предполагается, что задано некоторое (полное) вероятностное пространство (Q, #~, Р) с неубывающим непрерывным справа семейством а-подалгебр (fFt)t 0</<7\ Пусть Wl = (Wi(t)9 &~t) и W2 = (W2(t), 9~t) — два независимых между собой винеровских процесса, Wx (t) = [Wn (t), ..., Wlk(t)] и W2(t) = [W2l(t), .... W2l(t)]. Частично наблюдаемый случайный процесс (в, 6) = [(в,(*), ..., е*№ (Б1 (t), ...,h(t))9 rt], 0</<г, будет предполагаться процессом диффузионного типа с дифференциалом dBt = [а0 (t, I) + a, (/,. I) 8J Л + S ft, (f, Б) rfU7, (/), (12.59) • 2 <*6/ = [ A> (*, I) + Al (t, I) 9Л dt + Jj fl< (t, l) dWi (t). (12.60) Здесь элементы вектор-функций (столбцов) «о (t, х) = (aol (t, х), .... aok (t, х)), А0 {I, х) = (A0l (t, x), ..., Аы (t, x)) и матриц аЛих) = №1(*'*)[кхк>> W *)=№)«> *)^> fti (t. х) = I rf1/ (/, х) \kxky b2 (t, x) = | bfi (/, x)\\{kxl)9 Bx (t, x) = 1 В{Ц (U x) \\{lxky B2 (t, x) = | Bfj (t9 x) \m предполагаются измеримыми неупреждающими функционалами на {[O.TJXC}., a{0tTlX&T}, x = (xv ..., *,)еС'г. Следующие условия (I) — (VII) являются многомерными аналогами предположений (11.4) — (11.11), существенно использованных при доказательствах теорем 11.1 и 12.1 (^еС[, индексы / и / принимают все допустимые значения): т (I) j[\a0i(t,x)\ + \af})(t,x)\ + + Ibti (t, x)f + (b?! (t, x)f + (ВРУ (t, x)f + {B?s (/, *))2] dt < oo. т (II) J [{Aoi {t, x)f +'Ui'/ (t, xjf\dt < oo;
472 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 (III) матрица B<>B{t,x) = Вх (t, х) В\(t, х) + В2(t, х)В*2(t, x) равномерно не вырождена, т. е. элементы обратной к ней матрицы равномерно ограничены; (IV) если g{t, x) обозначает любой из элементов матриц В{ (tt х) и В2 (t, x), то для х, у^С1т t I g(t, x)-g(t, y)?<L{ j\xs-ys UK (s) + L2\ xt-yt |2, 0 t g2(t, x)<L, \ (1 +1 x, f)dK(s) + L2{l+\xt P), о еде I xt |2 = x\ (t) + ... + x\ (t), К (s)—неубывающая непрерывная справа функциЯу 0</C(s)<l; т (V) jM|i4(//(/f-E)e/(0|d/<oo; о (VI) MIB^OKoo, 0</<Г; (VII) Р f (Л!1/ (*, |) mj (t)f dt < oo J = 1, где mJ(t) = M[Qj(t}\&~}]. 2. Обобщением теоремы 11.1 на многомерный случай является Теорема 12.6. Пусть выполнены условия (I) — (VII) и с вероятностью единица условное распределение *) /^0 (а0) = = Р(0о^ао1!о) является (Р-п. н.) гауссовским, N (m0i у0), где вектор пг0 = М (б0 \&*1) и матрица у0 = М [(60 — пг0) (В0 — пг0)* \ &"1] такова, что SpY0<°° (Р-п. н.) Тогда случайный процесс (8, |) = [(0! (/), ..., Qk (t)), (lx (t), ... ..., li(t))]y удовлетворяющий системе уравнений (12.59), (12.60), является условно-гауссовскиМу т. е. для любых t}-, Q^t0< < t{ < ... <tn^t, условное распределение ^(«о ^п) = Р{\<% \<"п\П) является (Р-п. н.) гауссовским. Доказательство этой теоремы аналогично доказательству теоремы 11.1. Поэтому остановимся лишь на отдельных моментах в доказательстве, которые могут вызвать затруднение в связи с многомерностью рассматриваемых процессов. *) Для 60 = { 0i (0), . -., 9Л (0) }\и a0 = (a0i a0k) под{90<а0} понимается событие (0, (0) < а01 0£ (0) < a0k}.
§ 3] УРАВНЕНИЯ ФИЛЬТРАЦИИ В МНОГОМЕРНОМ СЛУЧАЕ 473 Прежде всего заметим, что в (12.60) можно считать B{(tt x)=0t B2{t, x) = fi(/, x), поскольку в силу леммы 10.4 найдутся такие независимые между собой винеровские процессы &i (t) = [f „ (t) Wlk (/)], W2 (t) --= [W2l (t), ..., f a № ЧТО t 2 t 2 о i-i о ,=i (1261) J 2 B, (s, I) dW{ (s) = JD (s, I) dW2 (s), 0 t=I 0 где D(t,x) = V(B<>B){t,x), d2 (t, x) = (bo B) (t, x) (В о В)-112 (t, x), (12.62) dx (t, x) = [(6 о b)(t, x)-{b о В) (t, x)(B о В)-1 V, x) (b о В)' (t, x)]1'2 с BoB = BiB*i + BtBl, b°B = biB\ + b2Bl, bob = bib*i + b2bl Далее, если ft(%, Wu £) — (скалярная) #"?"' й7"^-измеримая функция с M| f,(60, Wlt l) |< oo, то имеет место формула Байеса (ср. с (11.35)) M{ft(%, Wul)\P')) = «= j J ft К c, I) p, (a, c, |) dpw (c) dFu (a), (12.63) где a^Rk, c<= C£, ц^ — винеровская мера в (С£, #£) и р,(а, с, |) = ехрП H,(s, |)(Q,(a, с, |)-тЛШ*(^(5.6)Г'<ЛР,- t - Т J И. (s, I) (Q. («. с, ?) - ms (£))]• (B (s, Б) В* (s, I))"1 X XH.(s.S)(Q.(a,CS) + /n.(6))]rfs}- (12.64) Здесь m,(6) = M(e,|0"f), Г, = J В"1 (s, |) d%s - J В"' (s, |) [A0 (s, I) + Ax (s, |) ms (g)] rfs о о (12.65)
474 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 — винеровский процесс (относительно (#~>), 0^/^Г), Г f Qt (a, W{, |) = Ф, (g) \a + { ФГ1 (£) а0 (s, |) ds + + J" ФГ1 (|) 6, (s, £) dr, (s) + J ФГ1 (I) bi (s, |) S-' (s, I) d%s , 0 0 J И а0 (/, *) = а0 (г, х) — b2 (t> х) B'{ (t, х) A0 {t9 х)9 >-i а, (t, х) = а, (/, х) — 62 (tt х) В (t9 х) А{ (/, х). С помощью формулы (12.63), так же, как и в случае одномерных процессов 0 и |, сначала проверяется гауссовость условных распределений р(е0<а0> *,(*,)<*,..... ^(д<у„|^|), 0^*о^ • •'• ^*я^*> a затем устанавливают гауссовость распределений 3. Предположим также, что наряду с (I) — (VII) выдолнены условия: (VIII) \ay){t9x)\^L, |4'/(/,*)|<L; т (IX) J" M [a*ol (t, I) + Щ (t, |))< + (bf, (t, |))4] dt < oo; 0 k (X) м 2e](0)<oo. Следующий результат является многомерным аналогом теорем 12.1 и 12.3. Теорема 12.7. Пусть выполнены условия (I) — (IV), (VIII) — (X). Тогда вектор mt — M(St\@~}) и матрица yt = = М {(0, — т,) (0, — mty | 5^} являются единственными непрерывными, ^-измеримыми при каждом t решениями системы уравнений dml = [a0(t9l) + al(t9l)mt]dt + + [(b о В) (t, £) + ytA\ (t, Щ (В о В)"1 (*, |) X X [dlt - (AQ (t, g) + Ax (t, I) mt) dt], (12.66) Y* = *ift l)yt + yta\{t9 t) + (bob)(t, l)-[(boB)(t9 Q + ytA\(t9 |)]X X (b о ВГ1 (t9 I) [(b о В) (t9 I) + ytA\ (t9 Щ (12.67)
§ 3] УРАВНЕНИЯ ФИЛЬТРАЦИИ В МНОГОМЕРНОМ СЛУЧАЕ 475 с начальными условиями т0 = М (80110), у0 — М {(90 — т0)Х ХОо-^оПУ. Если при этом матрица у0 положительно определена, то таковыми же будут и матрицы yt, 0 < t ^ Г. Доказательство этой теоремы в части, касающейся вывода уравнений (12:66), (12.67), совпадает с соответствующим доказательством теоремы 12.1, проводимым для компонент т, (0 = М (9. (О | <Г|), уц (t) = М {[9. (t) - m, (t)] [в, {t)-mj Щ | <Г*}. Единственность решений системы (12.66), (12.67) доказывается, как и в теореме 12.3. Остановимся на доказательстве последнего утверждения теоремы. Покажем, что у матриц yt существуют, обратные матрицы б^ = уГ1» О^^У- Ясно, что при достаточно малых значениях t = t((u) такие матрицы существуют в силу невырожденности матрицы Yo и непрерывности (Р-п. н.) элементов матрицы Y/ по t. Пусть T = inf{/^r: det Y/ = 0}, причем т = оо, если inf det yt > 0. Тогда при t <x /\T определены матрицы 6t = y-{. Заметим теперь, что для t<xf\T °=-wE=w (У fit) = у fit + у fit = у fit + *Г!*г Поэтому 6/ = -6,yA. (12.68) Учитывая уравнение (12.67), отсюда получаем, что для t < х А Т б, = -а; {U |) б, - 6ta{ (/, I) + А\ (/, |) (В о В)"1 (*, |) Аг (/, Э - - б, [(Ь о Ь) (/, |) - (Ь о В) (t, Б) (В о В)-1 (t, |) (b о BY (/, |)] б„ (12.69) где а{ (U х) = ах (t, x) — {bo В) (t, х) (В о В)"1 (f, х) А{ (t9 x). На множестве {(о: х^Т} элементы матрицы 6, должны возрастать при t f т. Покажем, что на самом деле все элементы матриц б/ ограничены. Обозначим Gt(l) решение матричного дифференциального уравнения *°±P~ = a{{U l)Gt(lh GQ(l) = E{kxk). (12.70) Матрица Gt(Qt являясь фундаментальной матрицей, как хорошо известно, невырождена.
476 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 Пусть Vt = Gt(l)btGHl). Тогда из (12.69) и (12.70) для t <x AT находим Vt = a, (t, I) Vt + Vta\ (t, |) + Gt (£) {- a] (t, |) 6, - 6,5, (t, %) + + AUt,l)(B<>B)-l(t,l)Ai(t,l)- - bt [{b о b) (t, i)-(bo ву (t, d (в о в)-1 {t, £) (b о ву (t, g)] б,} g) (£). (12.71) Поскольку матрица Ь ° b—(b о В) (В о В)~ (b°BY симметрическая и неотрицательно определенная, то из (12.71) получаем Sp^< Т <SpF0+JSp{Gs(E)^(s. 1)(ВоВГ1(з, |) Л, (s, l)GS(l)}ds, 0 что вместе с невырожденностью матрицы Gt(Q и доказывает ограниченность (Р-п. н.) элементов матриц 6,. Значит, Р(т<Г) = 0. 4, Приведем, наконец, многомерный аналог теоремы 12.2. Теорема 12.8. Пусть 8 = (81, ..., 8^) — k-мерная случай- k пая величина с 2 Мб* < оо. Предположим, что наблюдаемый процесс lt = (£, (t), ..., li (t))} 0 < t < Г, имеет дифференциал dlt = [A0 (U g) + Л, (/, Б) 9] dt + В (t, |) dW2 (0, где коэффициенты А0, Аь В удовлетворяют условиям теоремы 12.6, а условное распределение Р(9^а||0) является гауссовскиМу N (m0, Yo)- Тогда tnt = M(Qt\@'\) и yt=> ~ М [(9 — mt) (9 — mt)* \ 9~\\ задаются формулами mt = \е + Yo J A\(5, I) (В(s, I) В*(s, l))'1 A, (s, g) ds\ X X U0 + Yo J A\ (s, I) (B (s, 1) B* (s, l))~l (d|. - A0 (s, £) ds)], Y/ = \e + Yo I A\ (s, I) (B (s, I) B* (s, I))'1 A{ (s, g) ds (12.72) -i Yo- (12.73) Доказательство аналогично соответствующему доказательству теоремы 12.2.
§ 4] ИНТЕРПОЛЯЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ 477 § 4. Интерполяция условно-гауссовских процессов 1. Будем рассматривать k + /-мерный случайный процесс (9,1) = [(0i (0. •••> МО), (!i(0, •-., h(t))l управляемый системой стохастических дифференциальных уравнений (12.59), (12.60) и удовлетворяющий условиям (I) —(IV), (VIII) — (X). Пусть условное распределение Р(0О^# Но) нормально, N (т0> у0). Тогда в силу теоремы 12.6 условное распределение P(8s<a \У})9 s^tt является (Р-п. н.) гауссовским с параметрами m(s9 0 = M(e,|S-|)f y(s9 t) = M\(Qs-m(s, t))(Qs-tn(s, t)y\P\]. Ясно, что компоненты т. (s, t) = M [Ql (s) \ @~\\ вектора m (s, t) = [m{(s, t), ..., mk(st t)] являются наилучшими (в сред- неквадратическомсмысле) оценками компонент 0,-(s), /=1, ..., k9 вектора 0s = [0i(5), ..., 0& (s)] по наблюдениям ?o = {£s» 5^^}- В этом параграфе будут выведены прямые (по t при фиксированном s) и обратные (по s при фиксированном t) уравнения (интерполяции) для т (s, 0 и у (s, t). Обозначим mQs(ty s) = M(Qt\&~Qts'l) и y(t, s)=M[(Qt-mQs(tt s))(Qt-mQs(t, s))*|S^]. Согласно многомерному аналогу замечания 3 к теореме 12.1 mQs(t, s) и y(^, s) удовлетворяют при />s системе уравнений (ср! с (12.66), (12.67)) dtmes(tt s) = [a0(t9 %) + (a(t, l)-y(ty s) c(t, |)) mQs(t9 s)]dt + + [(boB)(t,$ + y(t, s)AUt, 1)](ВоВГ1а, l)[dlt-A,{t, l)dtl (12.74) -^-^==а(/, t)y(t, s) + y(t9 s)a*(t9 $) + + b{U l)-y(U l)c(U l)y(t> g). 02.75) где a(ttx) = al(t9 x) — (boB)(t9 x)(BоB)"1 (tt x)Ay(t, x)9 b(f9x) = bob (t9 x) — (bo B) (t9 x) (В о В)"1 (f, x) (b о BY (t9 x)9 (12.76) c(ttx) = A\{t9 x)(BoB)-l(t, x)Ax(t9 x). Система уравнений (12.74), (12.75) решается при условиях mQs (s, s) = 9S, y (s> s) = 0 (нулевая матрица порядка (k X &)) и имеет, как и система (12.66), (12.67), единственное непрерывное решение. Отсюда, в частности, вытекает, что y {U s), как решение уравнения (12.75) с y(s9 s) = 09 не зависит от Qs[
478 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 2. При выводе уравнений для т (s, t), y(s,t) будут использованы следующие две леммы. Лемма 12.2. Пусть матрица ф£(£), t^zs, является решением дифференциального уравнения ^p- = [a(t, l)-y(t, s)c(t, |)]Ф«(9 (12.77) с <p*(£) = £(ftxft) и t 1*. (6) = J « (6))"' К (и, I) Ли + {(Ь о 5) (и, |) + Y (в, s) Л? (и, 1)} X X (5 - В)-1 (и, 1) {d%u - А0 (и, I) du}]. (12.78) Тогда Щ. (t. s) = Ф< (I) [в, + ^ (£)] (Р-п. н.). (12.79) Доказательство. В справедливости формулы (12.79) легко убедиться, применив формулу Ито. Лемма 12.3. Пусть 0<s<*<7\ Тогда Щ = q>J (|) [от («, t) + q{ Щ (Р-п. н.), (12.80) yt = \(t, s) + Ti(6)Y(s, 0(ф1(1))* (Р-п.н.). (12.81) Доказательство. Поскольку *-| <= *?.■ *, т0 m/ = M(ef|^ = M[M(ef|^l)|^|] = M(mes(/, s)|^|). (12.82) Заметим, что элементы вектора Хлгф£(£)б«» гДе интегрируемы. Поэтому XjvM [m9s (f, s) I <F|] = М [xX (6) (0S + tf (D) I <H1 = =-X^i(l)['»(s. 0 + ^(6)]. что вместе с (1,2.82) и доказывает представление (12.80). Далее, поскольку М [(в, - ot6s (t, s)) (ot9s (*, s) - от,)* I &]» l\ = 0 (Р-п. н.), TO yt = M[(Qt-mt)(Qt-mtr\^)] = = M{[(Qt-m6s(t, s)) + (m0s(t, s) - от,)] [6, - оте, (f, s)) + + {m9t{t, s)-mt)Y\&-\} = = м {M [(e,- ot6sit, s))(e,- /n6s (t, s)y\ r**l] \f\) + + M{(ot6s(/, s)-m,)(m9s(t, s)-tnt)'\&-)} = = V(U) + M {(mes(/, s)-m,)(m6s(t, s)-от,)* 10"j}. (12.83)
§ 41 ИНТЕРПОЛЯЦИЯ УСЛОВНО-ГЛУССОВСКИХ ПРОЦЕССОВ 479 Замечая, что m6s (t, s)-mt = q>< (|) [9, + q[ Щ - Ф< (£) [m (s, t) + ?< (|)| = = <tl(t)[es-m(s, t)], находим M{(me,(f, s)-mt)(mBa(t, s)-mty\^)} = = ф£(Б)М[(вв-т(в, t))(Qa-m(s9 t))* |<Г|](Ф< (£))* = = Ф+(£Ж*, 0 (ф< (!))*• Вместе с (12.83) это доказывает формулу (12.81). 3. Из (12.80), (12.81) для m(s, t) и y(s, t) легко получить представления, показывающие, как меняются эти характеристики интерполяции при изменении t. Теорема 12.9. Пусть выполнены предположения (I)—(IV), (VIII) — (X) и условное распределение Р(90^а||0) нормально. Тогда m (s, t) и у (st t) допускают представления t m (s, t) = ms +J* Y (s, u) (<pj (&))' A\ (u, g) (В о B)~l (u, g) X S Х№и-Ши, |) + Л(и, i)m„)dM], (12.84) Y(s, /)-■ = IE + ys j «(|))М; (u,1) (В о В)'1 (и, I) А, (и, |) <p? (I) duV' у,. (12.85) Доказательство. Из (12.80) находим m(s,t) = (rt®)-lmt-ql(Z). (12.86) Матрица qp£(|) является фундаментальной. Поэтому обратная матрица (ф^!))"1 существует, и согласно (12.77) для t^s ^Р— = - ф (I))"' [«(*, I) - Y (*. s) с (*, £)] (12.87) с(Ф|(|))-1 = ^хй). Из (12.86), (12.87) и (12.29) по формуле Ито находим t m (s, t) = ms + J (q>J (I))_1[y„ - Y (и, s)\ A\ (и, %)(В о В)~1 (и, |) X X[dlu-(A0(u, D + Mu. l)tnu)dul (12.88)
4£о Фильтрация условно-гауссовскйх процессов [гл. 12 Но в силу (12.81) №(Ъ))~1[Уи-у(и> s4 = y(s> и)(ф;(6))'. Подставляя это выражение в (12.88), приходим к искомому представлению (12.84). Докажем теперь формулу (12.85). Из (12.81) получаем Y (s, t) = (Ф< Щ-1 [yt - у (t, s)] [(Ф£ (Б))-]-1. (12.89) Дифференцируя правую часть в (12.89) и учитывая (12.30), (12.87), (12.75), после простых преобразований находим, что -teiLe_Y(Sf t)№H)yc{t, l)q№)y(s, t). (12.90) Уравнение (12.90) является частным случаем уравнения Риккати, решение которого существует и единственно. Чтобы его решить, зададим матрицы Ut, t^s, формулами t Ut = E + ysj (<ps" (£))* с (и, 1) <(» (I) du. S Эти матрицы не вырождены, и nSr = - uTlVs№ Щс«> i) ч* (6) "Г1. и;1=/?. Отсюда получаем где UJly8 = y8. Сравнивая (12.90) и (12.91), находим y(s,t) = (u;lys} что и доказывает требуемое представление (12.85). Замечание. Вместе с (12.90) уравнение для m(s, /), получаемое из (12.84), называют прямыми уравнениями оптимальной нелинейной интерполяции. 4, Выведем теперь для m(s, t) и y(s, t) представления, показывающие изменение этих величин при s\t. Теорема 12.10. Пусть выполнены условия (I) — (IV), (VIII) —(X) и условное распределение Р(60<а|Ео) является нормальным, N(m0f у0). Пусть, кроме того, Р{ inf det Y/ > 0}= 1.
§ 4] ИНТЕРПОЛЯЦИЯ УСЛ0ВН0-ГАУССОВСКИХ ПРОЦЕССОВ 481 Тогда t т (s, t) = m(t)— J" [а0 (и, g) + a{ (и, I) m (ut t) + о + b {и, I) YJ1 (т (и, t) — ти)] du — t - J (b о В) (и, I) (В о В)"1 (И| D [dlu - (А0 (и, I) + + Al(u,l)m(u,t))du], (12.92) t \(s,t) = yt-\{[a(u, %) + Ь(и, l)y-l\y(u, /) + + Y (и, t) [а (и, I) + b (ut I) y;1]* - b (и, Щ du, (12.93) где а (и, x), b(ut x) заданы формулами (12.76). Для доказательства этой теоремы установим предварительно следующие две леммы. Лемма 12.4. Пусть Р {inf det yt > 0} = 1 и матрица R4Q является решением системы дифференциальных уравнений ^JT = [a (t, I) + Ь (t, I) vr1] К (I). Rss (I) = E{kxk). (12.94) Тогда \(s, 0К(1))' = (^(£)ГЧ. (12.95) Доказательство. Обозначим б'^ == y(s» ^)(ф*(!))*• Тогда в силу (12.90) и (12.77) 4r=-Y(s, 0(q*(&))**& g)q>i(g)Y(s, *)(<№)* + + Y(s, ЩЩ'[аа, 6)-Y«. s)c(t, 1)Г = «C/'a*(f, &)-£/Jc(*. |)K(i)Y(s, 0(q>i(6))* + Yft «)]. Но согласно (12.81) 4>fs(l)\(s, t)(q>l(l)y + y(t, s) = yt. Поэтому -^- = [/<[a*tf, l)-c(t, l)b], (12.96) Пусть К£— фундаментальная матрица системы (12.96), т. е. пусть dvt ■-gf- = Vi [a* (t, I) - с (/, I) уJ, У* = £(ft xft). (12.97)
482 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 \-1 Поскольку у1=У*о(Уо) и матрица (Vo) является решением системы уравнений d(Vt) -1 ds ==-[a'(S,l)-c(s,t)yt](Vt)-1, (Vl)-l=E(kxk), то матрица V's дифференцируема по s и при s < t dV -^--[а'(*, »-«(*. 6)Y.]^. ^«*W (12.98) Но Ut==Usyt = y Ш S S S r5 5» где у п V^ дифференцируемы по s. Поэтому матрица Ufs также дифференцируема по s и dUi dVs dV\ —- = —— Vt 4- v ds ds s i *s ds • Из (12.30) с учетом обозначений (12,76) имеем ■^ = а (5, g) Vf + YX (5, Б) + Ь (s, 6) - Ys^ (5, Б) Y* (12.99) что вместе с (12.97) дает dU\ = [a(s, l)ys + ysa(sy l) + b(st Q-yac(s, l)ys]Vfs- ds -y.{a*(s, Q-c{s, l)ya)Vl = [a(s, l) + b(s, 6)угЧ*/£. (12.100) Из (12.94) и (12.100) вытекает, что t/{ ==/?*£/£. Но U\ = yp поэтому t/J = (/?J)"! Yp что и доказывает (12.95). Лемма 12.5. Пусть (#",), 0</^Г, — неубывающее семей- сгво с-алгебр, W=(Wt, $F\)—винеровский процесс и a = (at, 9"t), т т b = (bt, Ft) — случайные процессы с | at \dt < оо, Г b]dt < оо о о (Р-п. н.). Тогда при O^s^/^Г 5 t \ audu[ bu dWu = 0 5 S г- t -i S Г U = I av J bv dWv \du—\\\avdv о L« J о Lo Доказательство. Очевидно, что s t s t s budWu. (12.101) j audu\ bu dWu = J" audu$ bu dWu — J audu J budWa. (12.102)
§ 4] ИНТЕРПОЛЯЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ 483 По формуле Ито S S S Г U -| S Г U -| J audu j budWu = J j bvdWv\audu + j j avdv\budWa, oo о Lo J о Lo J поэтому правая часть в (12.102) равна \aadu\budWu-\ \bvdWv\audu—\ J avdv\budWu=* о о о Lo J о Lo J s r t -i s г и -i «| aA jbvdwAdu—j\ \avdv\ budWU9 0 \_u J 0 Lo J что и доказывает (12.101), 5. Доказательство теоремы 12.10. Согласно (12,84) и (12.95) t m(s, 0~«.+/[Я;(6)]"Чи;(и, $)(ВоВГ112(и, 1)^,(12.103) где dWu = (B*B)-lf2(u, l)\dtu-{AM D + AM l)mu)dul Матрица RUS{1) фундаментальная. Поэтому Ro(l) = Ro(l)R^(l)f и, значит, [Л? (Б)]*' = #« (6) [/Й О]"1. (12.104) Из (12.103) и (12.104) находим t т (s, /) = /».+ Ro (I) J [Ru0 (I)]"' vHl («. I) (B ° B)"1/2 («. S) ^«- (12.105) Далее, из (12.94) и леммы 12.5 получаем ds К (8 | «(1))Л«Л (". i) (5 о Я)"1/2 (". i) rf^.l = = \a(s,t) +b(s, l)У71]Х X Uo (I) J {< (g))''v„4 (". I) (5 ° B)~"2 (", I) dWJ ds - -ysA\(s,l)(BoB)-l/2(s,l)dWs = = [a (s, g) + ft (s, 1) y"1] [m (s, *) - m,] ds - -YHI(s.i)(5'>5)"1/2(s)|)^
484 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 Но (см. (12.29)) dms = [По is, |) + a, is, I) ms] ds + фо В) (s, |) (В о В)",/2 (s, g) dWs + + 4sA\{s,%){BoB)-ll2{s,\)dWs. Следовательно, ^/n (s, 0 = [а0 (s, |) + a, (s, £) ms] is + + (boB)(s,t)(BoB)-U2(s,t)dWs + + [а (s, |) + bis, |) Y71][tn is, t) — ms] ds = = [«o is, I) + a, («, i) m (s, 0] ds + + (b о B) (s, |) (В о В)"1 (s, I) [d£s - (Л0 (s, i) + Л, (s, &) m (s, t)) ds] + -i-[a(s,t) + bis,l)y-l][m(s,t) — ms\ds-alis,l)[m(s,t)-ms]ds-\- + (6 о B) is, l) (В о В)-1 (s, |) Л, (s, |) [m5 - m (s, t)] ds. Согласно обозначениям (12.76) [a(stl) + b(s^)y^]-al(sil)^(boB)(s^)(BoBrl(s9l)A{(sil)== = b(s,t)y7{. Значит, dsm (s, t) = [a0 (s, g) + a{ (s,1) m (s, /)] ds + + b(syl)y;l[ms~m(syt)]ds + + (boB) (sy l) (В о B)~l (st I) [dts - (A0 (sy I) + Л, (s, I) m (s, t)) ds], что и доказывает (12.92). Выведем теперь уравнение (12.93) для y(syt). Из (12.95) и (12,90) получаем t У is, 0 - Y. - К it) J [< (I)]"1 Y/ (и, I) YH [« (Ю)Т' <«« W (6))*. (12.106) Дифференцируя (12.106) по s, находим с учетом (12.99) и (12.94), что ^£ = а (S) |) ys + Y^« (S) |) + b (s, |) - - Ysc (s, |) Ys - [a is, I) + b is, \) y~l] [Y, - Y (s, 0] ~ - [Ys - Y is, t)} [a (s, |) + b is, I) y-']' + Y,c (s, |) Ys = «=[a(s,|) + 6(s,6)Yr']Y(s.O + + Y (s, 0 [a is, |) + & (s, |) у,"1]' - b is, |). Теорема 12.10 доказана.
§ 4] ИНТЕРПОЛЯЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ 486 Замечание 1. Уравнения (12.92) и (12.93) линейны относительно m(s, t) и y(s, t). Поэтому единственность их непрерывных решений устанавливается стандартным образом. Замечание 2. Если (b°B)(t> х)^=0, то уравнения (12.92) и (12.93) становятся существенно проще; t m(s, t) = mt — |{а0(и, £) + + al(u,l)m(u,t)-~(bob)(u,l)yu]['n(u,t) — mu]}du, (12.107) t y(s, <) = v,- $ [[ax(u,l) + (bob)(u,l)y?]y(u9f) + + у(и^)[а8{(иУ1) + (ЬоЬ)(и,1)у^у-(ЬоЬ)(и,Щс1и. (12.108) Замечание З. Рассмотренная в гл. 10 схема Калмана — Бьюси является частным случаем задач оценивания для условно-гауссовских процессов. Поэтому и в этой схеме также справедливы уравнения для т (s, /) и у (s, /). Отметим, что, учитывая специфику схемы Калмана — Бьюси, эти уравнения можно вывести в тех же допущениях, что и уравнения для tnt и yt (см. теорему 10.3), требуя при выводе обратных уравнений дополнительно невырожденности матриц Y/> 0^/^7\ 6. Остановимся еще на одном виде интерполяционных оценок для условно-гауссовских процессов. Поскольку условные распределения Р (95 ^ а, 9/ ^ b \ £"|) при 5^/ являются (Р-п. н.) гауссовскими, то гауссовским будет и условное распределение Р(95<а| #"|, 9*). Пусть mp(s,0 = M(9s|^9* = P)> %(s, t)=M {(95 - m3(s9 0)(в, - mp {s, t))* | Г). Qt = p}. Теорема 12.11. Если выполнены условия (I) —(IV), (VI11) — (X) и условное распределение Р (90 ^ а |10) является (Р-п. н.) гауссовским, то m&(sJ) = m(s9t) + y(sJ)[yl(^y+(£-mt), (12.109) % (s, t) = у (s, t) - у (s, t) [VJ Щ* y+vl (1) у (s, t), (12.110) где yf — псевдообратная матрица к матрице yt, а ф£(|) определено в (12.77). Доказательство. Поскольку M(Qt\&-t) = mt, M(Qs\F)) = m(s,t), cov(Qt,Qt\&-t) = yt,cov(Qs,Qs\&-t) = y(s,t), cov(Qs,Qt\^) = M[(Qs-m(s,t))(Qt-mty\^t],
486 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 то по теореме о нормальной корреляции (теорема 13.1) mi(stt) = m(s,t) + cov(B89Bt\P})y+$-mt)9 (12.111) %(s, 0 = V(* О-cov (в., 9,|^)Y,+ [cov(9s, 9,|<H)j\ (12.112) Покажем, что Р-п. н. cov(QsiQt\<r\) = y(s,t)(q>l($))\ (12.113) Действительно, поскольку cov (ев, О, | <Г*) = М [(в, - т (s, 0) М {(в, - mtf | ?** «} | Г)] и согласно (12.79), (12.81) М{(е,-т,)*|^} = = {M[(Qt-mt)\ST»^])' = {т%«, s)-mt}' = = № (I) [в, + <7< (I)] - Ф^ (I) [m (s, t) + q\ (£)]}* = = [e,-/n(s,0]'(q>'(g))\ TO cov (в., в, | Г)) = М [(9, - т (s, 0) (9, - m (s, /))* | ^|] (<pj (g))\ что и доказывает равенство (12.113). Из (12.111) — (12.113) получаем искомые представления (12.109) и (12.110). Замечание 1. Если в дополнение к условиям теоремы 12.11 потребовать, чтобы Р( inf det yt > 0) = 1, то дифференцирова- нием (12.109) и (12.110) по s найдем, что *йр(М) = р — t — J К("» £) + М"» 6)^(1/, *) + 6(и. ^Y^OV"» t) — mu)]du — s t -\(boB)(«, l) (В о ВГ1 (u, l)[dtu-(A0(u, Q+Ai («, |)mp(«, t))du], (12.114) % (s> 0 - - J {[«(«, D 4- 6 («, g) y;1] yb (и, О + s + %(uit)[a(u>l) + b(u>l)y^-b(uil)}du. (12.115) Замечание 2. Из (12.110) следует, что y^(sf t) на самом деле не зависит от 0.
§ 4] ИНТЕРПОЛЯЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ 487 Замечание 3. Рассмотрим гауссовский марковский процесс (9,), 0<^Г, с дифференциалом dQt = [a0(t) + а{ (t)Qt]dt + b(t) dW(t) (12.116) и заданной гауссовской случайной величиной 90. Будем предполагать, что детерминированные функции a0(t)> a{(t) и b(t) таковы, что т т |К(/)1Л<оо, / = 0, 1; J b2(t)dt <oo. о о Положим при 0^5^/^ Т г(/) = ме„ гр(5,о = М(е,|в/ = р)1 R (t) = М [9, - г (/)]2, Я, (s, t) = М [(9S - rp (s, О)216, = р]. Если положить в (12.60) Л, (f, л;)ее=0, В2(^^)^0 и считать, что £0 не зависит от 90, то нетрудно видеть, что r(t) = mty R(t) = \t и r3 (s, /) = mp (s, 0, Rfi (5, 0 = Yp (5, О- Значит, согласно*) (12.29) и (12.30) t r(t) = r(0) + J [aQ(s) + ax (s)r(s)]ds (12.117) о и t R(t) = R(0) + 2J a{ (s) R (s) ds. (12.118) о Для rp(s, 0 и /?p(s, t) из (12.114) и (12.115) в предположений, что inf R(t) > 0, находим t ; (5, t) = Р ~ J [во W + fli (И) Гр (И, 0 + -^ (Гр (Ut t) - Г (и))] dtl, (12.119) S t /?p(s>0 = -2j{[aI(«)4-||f]/?p(",/)-^2(")}rf"- (12л2°) *) См. также замечание 3 в п. 6.
488 ФИЛЬТРАЦИЯ УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 Аналогом (12.109) и (12.110) являются формулы гэ (s, t) = r(s) + A (s) exp ( J* ax (и) da) R+ (t) (p - r (/)), /?p (5, 0 = R (s) - R2 (s) exp (2 J ax (u) du ) R+ (t). § 5. Уравнения оптимальной экстраполяции 1. В этом параграфе выводятся уравнения экстраполяции для условно-гауссовских процессов, позволяющие эффективно вычислять оптимальные (в среднеквадратическом смысле) оценки значений 9, по наблюдениям £o~{£Bi w^5}» s^/^Г. Однако, в отличие от рассмотренных выше задач фильтрации и интерполяции, эти уравнения будут выведены не для общего процесса (9,£), заданного уравнениями (12.1), (12.2), а только для двух частных случаев, приводимых ниже. Это сужение класса рассматриваемых процессов (9, £) связано с тем, что условные распределения Р(9^а|^"|) для t>s уже не являются, вообще говоря, гауссовскими. 2. Обозначим для t^s п{ (и s) = M (9, |#"|), n2(t, s)*= M(6,| Р\). (12.123) Как и в случае интерполяции, для этих характеристик можно выводить уравнения двух типов: прямые уравнения (по / при фиксированном s) и обратные (по s ] t при фиксированном /). Из прямых уравнений можно понять, как ухудшается прогноз значений 9, при возрастании /. Обратные уравнения позволяют установить степень улучшения качества прогноза значений 9, с «увеличением данных», т. е. с ростом 5. Отметим, что обратные уравнения экстраполяции можно было бы вывести из общих уравнений экстраполяции, полученных в восьмой главе. Здесь, однако, мы приводим другой и, пожалуй, более естественный для данного случая вывод. Будем предполагать, что (9, £) = (9„ lt), 0<^<Г, является k + /-мерным процессом диффузионного типа с 2 ddt = К (t) + fli W в,] dt + S bt (t, 1) dW( (t), (12.124) dlt = [A0 (t, |) + Al (t, l) 9Л dt + 2 Bt (t, I) dW2 (t), (12.125) где коэффициенты удовлетворяют условиям (I)—(IV), (VIII)—(X), причем элементы вектора a0(t) и матрицы ах (t) являются (12.121) (12.122)
§ 5] УРАВНЕНИЯ ОПТИМАЛЬНОЙ ЭКСТРАПОЛЯЦИИ 489 детерминированными функциями времени, а условное распределение Р(0о^#1Ео) является гауссовским. Пусть, далее, ф£— фундаментальная матрица уравнения Sr = "x(tW9> t>*> (12.126) с Ф2 = £(£х*)' ^Ри этих Допущениях справедлива следующая Теорема 12.12. Пусть процесс (9, I) управляется системой уравнений (12.124), (12.125). Тогда для каждого фиксированного st О <] s <; t ^ Т, щ (t> s) удовлетворяет уравнению -JJr£l = «oW + al(/)n1(/>s) (12.127) с щ (s, s) = ms> где ms определяется из уравнений (12.66), (12.67). При фиксированном t s пх (t, s) = ft, (/, 0) + J* ft \(b oB)(u,l) + VUA\(и, Щ (БоВГ1 (и, g) X о X Щи - (A0 (u, 1) + Д, (u, I) /nj du], (12.128) где tnu и \и находятся из уравнений (12.66), (12.67), a я,(/, 0) = <p<L0 + J" («pg)-1 a0(s)ds\. (12.129) Доказательство. Воспользуемся тем, что «, <*, s) = M (8, | <F|) = M [M (8, | П) | П\ = M (m, \ F% где mt согласно (12.66) представляется в следующем виде: Щ = ms + J* [«о (и) + aj (и) mj du + S + \ [{boВ){и, |) + yHI (". Щ(ВоЬГ112(и, \)dWu. (12.130) S Но м м \{ь о в) (и, |) + vHl (". й] (fi °вг"2 («. I) <^« I *l) = °; поэтому, беря от обеих частей (12.130) условное математическое ожидание М(- |#"|), приходим к уравнению (12.127),
490 ФИЛЬТРАЦИЯ, УСЛОВНО-ГАУССОВСКИХ ПРОЦЕССОВ [ГЛ. 12 Для вывода представления (12.128) положим в (12.130) s = 0. С помощью формулы Ито нетрудно убедиться в том, что (единственное) непрерывное решение mt уравнения (12.130) с s = 0 может быть записано в следующем виде: Щ = ЩЩ+ \ К)"1 «о(")du + L о + J (Ф«)-' [(Ь о В) (и, I) + уиА\ (и, Щ (В о В)-"2 (и, I) dWa 0 Отсюда находим s /», = »,(*, 0)+ l<pl[(boB)(u,t)+yuA](u,l)\(B°B)-,i2(u,$)dWu+ 0 + J < [(6 о В) (и, t) + yuA\(u,l)](BoB)-l'2(u,$)dWu. (12.131) Вычисляя условное математическое ожидание М(- \&~1) от обеих частей (12.131), получаем требуемое представление (12.128). 3. Пусть наряду с прогнозом значений 9, требуется по £о={£и, tf<^s}, s<t> экстраполировать и величины £,. Снова будем предполагать, что условное распределение Р (90^ а \10) является гауссовским и выполнены предположения (I)—(IV), (VIII)—(X), причем А0 (t, х) = А0 (t) + А2 (t) хи аг (U х) = а{ (t), Л,- (t, x) = Ax (t), где элементы векторов и матриц а*(0> Ai(t), /=0, 1, 2, являются детерминированными функциями. Иначе говоря, пусть 2 dQt = [оо (*) + a, (t) в, + а2 (t) U dt + 2 bt {t, I) dWt (t), (12.132) d\t = [До Ш + Ax (t) Qt + A2 (t) У dt + S Bt (t, |) dWt (t). (12.133) Пусть, далее, Ф5 — фундаментальная матрица системы (/ > s) dt ^Ui(rt A2(t)r» ГДе Ф? = £((*+/) X (*+/))'
§ 5] УРАВНЕНИЯ ОПТИМАЛЬНОЙ ЭКСТРАПОЛЯЦИИ 491 Теорема 12.13. При сделанных допущениях пх(t> s) и n2(tys)npu заданном s являются решениями системы уравнений dnx (t, s) \ ——\fa0(t)\ lax(t) <hV)\(ndt,s)\ ,,.,„,. dn.it,s) -\АЛ)Г[А,и) A2(t))[n2(t,s)l (UA6*> dt J с n,(s, s) = ms, n2(s, s) = ls. При фиксированном t + tnx(t, s)\(nx(U 0)\ [n2(t, s)j [tiiit, 0)J i V (B°B)m(u,l) J где Доказательство. Принимая во внимание предположения о коэффициентах системы, из (12.66) и (12.133) находим, что (ГМГКЛХЯМ [(Ь о В) (и, I) + уиА\ (и, Щ (В о В)"1'2 (и, I) \ Ах(и) А2{и))\ъа ]dU + dWx (ВоВУ"(и,$ J 1/2 - -* /~" "в Отсюда (как и при доказательстве предыдущей теоремы) легко выводятся уравнения (12.134) и представление (12.135). Замечание. Для частного случая уравнений (12.132), (12.133), отвечающих схеме Калмана—Бьюси (см. гл. 10), прямые и обратные уравнения экстраполяции справедливы лишь в предположениях теоремы 10.3.
ГЛАВА 13 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ. ФИЛЬТРАЦИЯ И СМЕЖНЫЕ ВОПРОСЫ § 1. Теорема о нормальной корреляции 1. В предыдущих двух главах рассматривались задачи фильтрации, интерполяции и экстраполяции для условно-гаус- совских случайных процессов (9, £) с непрерывным временем /^0. В настоящей главе эти задачи будут изучаться для случайных последовательностей с дискретным временем / = 0, А, 2Д, ..., обладающих также свойством «условной гауссо- вости». Важно подчеркнуть, что материал данной главы не использует тот сложный аппарат теории мартингалов, который применяется для случая непрерывного времени. По существу, все результаты этой главы выводятся из теоремы о нормальной корреляции (теорема 13.1). Поэтому читатель, желающий ознакомиться с теорией фильтрации и смежными вопросами для случая лишь дискретного времени, может приступить к чтению этой главы без предварительного изучения материала предшествующих глав. Сравнение результатов для дискретного и непрерывного времени показывает, что, по крайней мере внешне, между ними имеется большое сходство. Более того, формальный предельный переход (при Д->0) позволяет из результатов этой главы получить соответствующие результаты для случая непрерывного времени. Однако строгое обоснование этого предельного перехода вовсе не просто и потребовало бы, по существу, привлечения всего того аппарата, который был использован в предыдущих главах. 2. Формулировка и доказательство основного результата данного параграфа — теоремы о нормальной корреляции — требуют введения и исследования свойств псевдообратных матриц. Рассмотрим матричное уравнение АХА = А. (13.1)
§ 1] ТЕОРЕМА О НОРМАЛЬНОЙ КОРРЕЛЯЦИИ 493 Если Л — квадратная невырожденная матрица, то это уравнение имеет единственное решение X = Л"1. Если же матрица А вырожденная или даже прямоугольная, то решение уравнения (13.1), если оно существует, нельзя определить однозначно. Тем не менее существует (это будет доказано ниже), и притом (в определенном классе матриц) единственная, матрица, удовлетворяющая уравнению (13.1). Эта матрица далее будет обозначаться Л+ и называться псевдообратной матрицей. Определение. Матрица А+ (порядка пУ^т) называется псевдообратной к матрице А = Л(тХм), если выполнены следующие два условия: АА+А = А, (13.2) A+ = UA* = A*V, (13.3) где U и V — некоторые матрицы. Из условия (13.3) следует, что строки и столбцы матрицы Л+ являются линейными комбинациями соответственно строк и столбцов матрицы Л*. Лемма 13.1. Матрица А , удовлетворяющая условиям (13.2) и (13.3), существует и единственна. Доказательство. Начнем с доказательства единственности. Пусть At и At — две различные псевдообратные матрицы. Тогда AAU = A, At = UlA* = A*Vi и A At А = Л, At = U2A* = ЛТ2 с некоторыми матрицами Uu Vu U2 и V2. Положим D = At — At', и = их-иъ v = v{-v2. Тогда *) ADA = 0, D = UA* = A*V. Ho D* = V*A, поэтому (DA)* (DA) = A*D*DA = A*V*ADA = 0, и, значит, DA = 0. Отсюда, используя формулу D*=AU*, находим, что DD* = DAU* = 0. Следовательно, At —- At = D = 0. Для доказательства существования матрицы Л+ предположим сначала, что ранг матрицы Л (порядка пгУ^п с m^ri) равен п. *) 0 — нулевая матрица.
494 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 Покажем, что в этом случае матрица А+ = (А*А)-1А* (13.4) удовлетворяет условиям (13.2), (13.3). Свойство (13.2), очевидно, выполнено, поскольку АА+А = А (А*А)"1 (А*А) = Л, где А*А — невырожденная матрица порядка пУ(п. Равенство A+ = UA* выполнено с £/ = (Л*Л)-1. Равенство же Л+ = A*V выполняется, как легко проверить, если положить V = =А(А'АГ2А\ Аналогичным образом показывается, что если ранг матрицы Л (порядка тХя с т^.п) равен т, то псевдообратной к матрице Л является матрица А+ = А*(АА*Г]> (13.5) Для доказательства существования псевдообратной матрицы в общем случае используем тот факт, что всякую матрицу Л порядка rriYji ранга г можно представить в виде произведения А = В-С (13.6) с матрицами В(тХг) и С(Гхп) ранга г<тДга. Действительно, возьмем в качестве матрицы В матрицу, составленную из г независимых столбцов матрицы Л. Тогда все столбцы матрицы Л можно выразить через столбцы матрицы В, о чем и свидетельствует формула (13.6), задающая «скелетное» разложение матрицы Л. Положим теперь д+ = С+В+, (13.7) где согласно (13.4) и (13.5) С+ = С*(ССТ\ (13.8) В+ ={В*ВГ1В*. (13.9) Тогда АА^А = ВСС (ССТ1 (В*ВГ1В*ВС = ВС=А. Далее, если положить U = С* {СС*)~~{ {В*В)~1 (СС'Г1 С, то легко проверить, что UA* = Л+. Аналогичным образом проверяется, что Л+ = ЛТ с V = В (В*В)"1 {ССТ' (В*В)'1 В. Лемма доказана.
§ 1] ТЕОРЕМА О НОРМАЛЬНОЙ КОРРЕЛЯЦИИ 495 3. Укажем ряд используемых далее свойств псевдообратных матриц: Г. АА+А = А, А+АА+ = А+. 2°. (Л*)+= (Л+)\ 3°. (А+)+ = А. 4°. (А+А)2 = А+ А, (А+А)* =-- А+А, (АА+)2 = АА+, (АА+У = АА+. 5°. (ЛМ)+==Л+(Л*)+==Л+(Л+)*. 6°. А+ = (А*А)+А* = А*(АА*)+. 7°. А+АА* = А*АА+ = А*. 8°. Если 5 — ортогональная матрица, то (5Л5*)+ = SA+S*. 9°. Если А — симметрическая неотрицательно определенная матрица порядка п X п ранга г < п, то Л+ = Г(ГГГ27\ (13.10) где матрица Т(пХг) ранга г определяется из разложения А = ГТ. (13.11). 10°. Если матрица Л невырожденная, то А+ = А~\ Указанные свойства проверяются непосредственным подсчетом. Так, свойства 1° и 2° вытекают из (13.2), (13.6) — (13.9). Равенства Л+ = С+В+ = С (ССТ1 (В* В)'1 В* = ВС, где в = с (ест1, с = (в*вг{ в\ задают скелетное разложение матрицы Л+, из которого следует 3°. Свойство 4° вытекает из 1°, 2° и (13.7) — (13.9). Чтобы доказать 5°, надо рассмотреть скелетное разложение А = ВС и представить матрицу А*А в виде произведения ВС, где В = С* к С = В*ВС. Свойства 6° и 7° вытекают из 1° —5°. Для доказательства 8° достаточно заметить, что в силу ортогональности (SS* = E) матрицы 5 (SAS*) (SA+S*) (5 AS*) = SAA+AS* = SAS. (13.12) Далее, если Л+ = UA* = A*V, то SA+S* = S (UA*) S=SU (S*S) A*S=U (SA*S*) = U (SAS*)* (13.13) c u^sUS*,
496 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 Аналогично устанавливается, что SA+S* = (SASJV (13.14) с V = SVS\ Из (13.12)—(13.14) вытекает, что (SAS*)+ = SA+S*. Наконец, свойство 9° следует из скелетного разложения А = ГТ и формул (13.7)—(13.9). Замечание. Согласно свойству 9° в случае симметрических неотрицательно определенных матриц А псевдообратная матрица Л+ может быть определена формулой (13.10), где матрица Т определяется из разложения А = Т*Т. Это разложение, вообще говоря, не единственно. Однако псевдообратная матрица Л+ = Т* (ТТ*У~ Топределяется однозначно независимо от способа разложения А = Т*Т. Таким образом, в случае симметрических неотрицательно определенных матриц А псевдообратная матрица + ( А~~\ если матрица А не вырождена, [ Т*(ТТ) Г, если матрица А вырождена. 4. Напомним, что случайный вектор | = (£i, ..., |л) называется гауссовским (нормальным), если его характеристическая функция *) п щ (г) = М exp [iz*t], z = (г„ ..., zn), z*l = 2 г&и задается формулой щ (z) = exp [iz*m -{г^г], (13.16) где m = {mit ..., mn), a R = ЦТ?,-/!! — неотрицательно определённая симметрическая матрица порядка (п X п). Параметры m и R имеют простой смысл. Вектор m есть вектор средних значений, ш = М1у а матрица R есть матрица ковариаций, R=cov&, у = М ft - го) ft - m)\ Сформулируем ряд простых свойств гауссовских векторов. 1. Если 1 = (1и •••> In) — гауссовский вектор, А{тХп) — матрица и а = (а{> ..., ат) —вектор, то случайный вектор х\ = = А\ + а является гауссовским с фт1 (г) = ехр {iz* (а + Am) - ~ z* (ARA*) z } (13.17) и Мт) = а + Лт,соу(г), r)) = ,4covft, £)Л*. (13.18) *) При алгебраических операциях векторы а считаются столбцами, а векторы а* — строками.
§ 1] ТЕОРЕМА О НОРМАЛЬНОЙ КОРРЕЛЯЦИИ 497 2. Пусть (9, I) = [(0!, ..., 9fc) (g„ ..., It)] — гауссовский вектор с me = М9, mi — М£, De9 = cov (9, 9) = M (9 —■ me) (9 — me)*, Dn = cov (I, 1) = M (I - mi) (I - m6)* и DQl = cov (9, g) = = M(e-mG)(g-me). Если D8|==0, то (гауссовские) векторы В и g независимы и Ф(э, D (zi> z2) = Фе (*i) Ф| (22)t где 2i = (zn, ..., г^), 22 = (г21, ..., z2t) и Фе(^1) = ехР [te>e - j г;0ее21], Ф6 (*2) = ехр [и\тг - у г^г2]. 3. Пусть g = (£i, ..., In) — гауссовский вектор с т = Mg, /^ = cov(£, £). Тогда найдется гауссовский вектор г = (ги ..., е„) с независимыми компонентами, Ме = 0 и cov(e, е) = Е(Пхп), такой, что l = Rl/2e+m. (13.19) Для доказательства введем гауссовский вектор*) v = = (v,, ..., vn)y не зависящий от £, с Mv — 0, cov(v,v) = /?. Положим Г = /?1/2, 8==(r+)*(g~m) + (£-rr+)v. (13.20) Поскольку векторы ^ и v независимы, то вектор е также является гауссовским. Ясно, что Me = 0. Подсчитаем теперь ковариацию cov (e, е). Имеем cov (е, е) = Мее* = (Т+У RT+ + (Е - ТТ*) {Е - ТТ+). Но по свойству 4° псевдообратных матриц (Е—ГГ+)* = = Е—ТТ+, (Е—ТТ+У = Е—ТТ+9 а (Т+)* RT+= {Т+)* Т*ТТ+ = = [{Т+У f] [ТТ+] = 7Т+. Поэтому cov (в, в) = £, что доказывает независимость компонент вектора 8. Далее, из (13.20) получаем Ге = Г (Г+У ft - /л) + (Г* - Г*7У+) v = = (Б - m) - (£ - Г* (Г+)*) (g - т) + (Г* - Г*7Т+) v. Но f = T*TT+ (свойство 7°), Т*(Т+У = {Т+Т)* = Т+Т (свойство 4°), a (£-r+r)cov(|, Б)(£-Г+Г)* = (Я-Г+Г)(Г*Г)Х Х(£ — Т*Т) = 0, что и доказывает равенство /?1/2е = | — т. *) Здесь мы считаем, что исходное вероятностное пространство является достаточно «богатым».
498 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 4. Пусть gn, п= 1, 2, ..., — последовательность гауссовских векторов, сходящаяся по вероятности к вектору g. Тогда £ также гауссовский вектор. Действительно, пусть тп = Щп, /?„ = cov (gtt, g„). Тогда, поскольку Р- lim 6а = Е и I ехр [/г*^]! < 1, то по теореме Лебега П-+оо о мажорируемой сходимости lim exp \iz*mn —-~г*Яп2 = lim М exp [iz*ln] = М exp [fe*g]. Отсюда, в силу произвольности г, существуют вектор т и неотрицательно определенная матрица R такие, что m = limmrt, R = \\mRn. я /г Значит, М exp [fe*g] = exp [/z*m — ~ г*/?г], что доказывает гауссовость вектора g. 5. Теорема 13.1 (теорема о нормальной корреляции). Пусть (9, 6) ==([9,, ..., 9*], [gb ..., \ь\) — гауссовский вектор с me = M9, ms=Mg, Dee = cov (9, 9), DQl = cov (9, g), D66 = cov (g, g). Гогда условное математическое ожидание M(6|g) и условная ковариация cov(9, e id = М{[е - м (в IQ] [е - м (е \i)Y № задаются формулами MOlD-me + DegD+^-mj), (13.21) cov (9, 9 II) = Две - DeiDti (А*)*. (13.22) Доказательство. Положим rj = (0-me) + C(6-mO, (13.23) где матрицу C(ft х /> подберем таким образом, чтобы MTi(S-mi)* = 0. Если такая матрица существует, то она является решением линейной системы Ddi + CDl% = 0. (13.24) Если Dn — положительно определенная матрица, то C = -D6lD^. (13.25) В противном случае можно положить C = -D4D&. (13.26)
§ 1) ТЕОРЕМА О НОРМАЛЬНОЙ КОРРЕЛЯЦИИ 499 Согласно свойству 3 из п. 4 найдется гауссовский вектор е с Ме = 0, Мее* = £ такой, что Тогда, обозначая r = D$f, получаем А* = М [(9 - т0) (g - miY] = М (в - тв) гТ = rf^r, где rfee = М (8 — тв) е*. Следовательно, De* = rfGer, DeiDtiDu = dQeT(TT)+ 7T = dee7\ где мы воспользовались свойствами 1°, 4°, 5° псевдообратных матриц, согласно которым Dti = (7Т)+ = Т+Т+, Г (7Т)+ 7Т = ТТ+Т+ТТ = = гг+(г+г)*г = (гг+)2г = гг+г=г, т. е. что и доказывает равенство (13.24) с С ~ — DeiD^. Итак, вектор Л = (в - т0) - ДА (g - mi) (13.27) обладает тем свойством, что Mr](g— т^)* = 0. Поскольку (9,|) — гауссовский вектор, то таковым же является и вектор т). Более того, гауссовским будет и вектор (т|, g), поскольку характеристическая функция <P(n, l) (zv z2) = М ехР [tefa + tejg] = = М ехр [1г\ [(9 - те) + С (g - т6)] + fe£} может быть записана в силу гауссовости вектора (9, g) в виде (13.16). Далее, Мт] = 0 и Mr| (g — m^)* = 0. Поэтому согласно свойству 2 из п. 4 гауссовские векторы г\ и g независимы. Следовательно, M(ri|g) = Mri = 0 (Р-п. н.), что вместе с (13.27) приводит к формуле (13.21). Для доказательства представления (13.22) заметим, что в — М (в 11) = г|, а в силу независимости g и г\ cov (9, 9 1g) = М (T|Tf 1g) = Мцц (Р-п. н.). (13.28) Но согласно (13.27) Мщ = DQQ + DbiDttDuDttDn - 2De^D^Z^ = = Ди - DnDtiDuDttDlt = Dee - A*D&dS6, (13.29)
500 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 где мы воспользовались тем, что согласно свойству 1° DtiDVaDti = D&. Из (13.28) и (13.29) получаем искомое представление (13.22) для cov(0, 9 15). 6. Следствие 1. Если k = l=\ и D£ > 0, то М (в |Б)= Мв + -£22^6) (Б _ Mg)f (1зв3(» D(9|^ = D9-i^p, (13.3l) где D (в 16) == М {[9 - MJ0 11)}2 £}. _ Полагая сг0 = + l/D0, o$ = + VOl и вводя коэффициент корреляции ^ _ coy (9,1) формулы (13.30) и (13.31) можно переписать в следующем виде: М(в|Б) = Мв + Р-^(Б-М6), (13.32) D(9|£) = ^(l-p2). (13.33) Следствие 2. Если 9 = Ьхгх + b2e2i I = В1г] + В2е2, где еи е2 — независимые гауссовские величины с Ме* = 0, De,= l, /=1,2, а В] + В22 >0, то М(9 1Б)— 6,5 + Уа6, (13.34) вх + в2 D(e|E) = lM|ZL№l (13.35) Bj + В2 Следствие 5. Пусть случайные величины (9,^, ..., £/) образуют гауссовский вектор, причем £ь ..., £/ независимы и Dli > 0. 7огда М(в|Б„ ..., Ь)-мв + 2^^(Ь-МЬ). В частности^ если М9 = М£*=0, то М(в|б„...,Ь)-2-^|^Ь.
§ 1] ТЕОРЕМА О НОРМАЛЬНОЙ КОРРЕЛЯЦИИ 501 Замечание. Пусть [9, ^]=[(в,, ..., 9Д (£„ ..., £,)] — случайный вектор, заданный на вероятностном пространстве (Q, #", Р). Пусть ^ — некоторая а-подалгебра #", ^^#~. Предположим, что (Р-п. н.) условное (при условии *§) распределение вектора (9, g) является гауссовским со средними М(9|^), M(g|£) и ковариациями dn = cov(9, 9 \9)9 rf12 = cov(9, g |^), rf22 = cov (g, g |^). Тогда вектор условных математических ожиданий М(9|£, 9) и условная матрица ковариаций cov (9, 8|g, 9) задаются (Р-п. н.) формулами М (9 |б, 9) = М (9 \9) + di2d&[Б — М (g \9)], (13.36) cov(9, 9 |g, 9) = dn - dud&dn. (13.37) Этот результат, доказываемый так же, как и в случае 9 = {0, Q}, будет в дальнейшем неоднократно использоваться. 7. Теорема 13.2. В предположениях теоремы 13.1 условное распределение *) Р (Q^x |6) является гауссовским с параметрами M(8|g), cov(9, 9|6), задаваемыми формулами (13.21), (13.22). Доказательство. Достаточно показать, что условная характеристическая функция M(exp[/z*9] |g) = exp(te'M(9 |g)- |z*cov(9, 9 |g)z). (13.38) Согласно (13.27), (13.21) 6 = mQ + DlBD&(l - Мб) + т|= М(9 |g) + т|, где гауссовские векторы I к ц независимы. Поэтому М (exp [/z*9] 1g) = exp [*VM (9 | g)] M (exp [fe4|] 11) = = exp [/z*M (9 1g)] M exp [iz\] = - exp [te'M (9 11) - 4 г* cov (9, 9 | g) г]. Замечание. Пусть матрица cov(9, 8 | g) = Dee — DqiD^dIi положительно определенная. Тогда у функции распределения Р (9 <* 1g) = Р (6, < *,, ..., Qk < xk 1g) существует (Р-п. н.) плотность _ [det(Dee-%^%]"1/2 X exp { -1 (х - М (9 |g))* [Dee - D^DtM'1 (х — М (в ] В))}. (13.39) pfa,---,^|E)-^^#<^"^ X *) Под {6<jc} подразумевается событие {6,<л;ь ..., 9^<л:^}.
502 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 8. Теорема о нормальной корреляции позволяет легко установить следующие вспомогательные предложения. Л е м ма 13.2. Пусть Ьи Ъъ Ви В2 — матрицы порядков & X &> & X '> IX k> IX l соответственно и bob = b\b[ -f- 62^2» boB = biB\ + b2Bl (13.40) В о В = B\B[ -f- В2В2* Тогда симметрическая матрица bob-(boB)(BoB)+(bo В)* (13.41) является неотрицательно определенной. Доказательство. Пусть е1 = [еп, ..., е^], e2 = [e2i, ... • ••> е2/] — независимые гауссовские векторы с независимыми компонентами, Met/ = 0, De/y = 1. Положим 9 = 6,8, + Ь2гъ 1 = В]е1 + В2е2. Тогда согласно (13.22) bob-(boB)(BoB)+(boВ)* = cov(9, 9 |g), что и доказывает лемму, поскольку матрица ковариации cov (9, 6|g) является неотрицательно определенной. Лемма 13.3. Пусть R(nxnh P(mxm) — неотрицательно определенные симметрические матрицы и Q(mxn)—произвольная мат- рица. Тогда система линейных алгебраических уравнений (R + Q*PQ)x = Q*Py (13.42) разрешима (относительно х) для любого вектора у = (У\9 • • •» Уш) и вектор x=(R+Q*PQ)+Q*Py (13.43) является одним из ее решений. Доказательство. Пусть 8 = (8lf ..., 8m), г = (ги ... ..., гп) — независимые гауссовские векторы с Мб = 0, cov (8, 8)=Р, cov (е, е) = £. Положим g = Q*8 + Rl/2e. Тогда D6i = cov (8,g) = PQ, D66 = cov (g, g) = /? + Q*PQ, причем, как доказывалось в теореме 13.1, система DQi + Сйц = 0 разрешима относительно С и С= — DbiD^. Применительно к рассматриваемому случаю это означает, что система PQ + C(R + Q*PQ) = 0 (13.44) разрешима относительно С и С= — PQ[/? + Q*PQ]+.
§ 1] ТЕОРЕМА О НОРМАЛЬНОЙ КОРРЕЛЯЦИИ 503 Из разрешимости системы (13.44) следует и разрешимость (относительно С*) сопряженной системы Q*P + [R + Q*PQ]C* = 0. (13.45) Пусть теперь у — произвольный вектор. Положим х = —- С*у. Тогда, умножая (13.45) на ( — у), получим(R + Q*PQ)x = Q*Py, что и доказывает лемму. Лемма 13.4. Пусть Qt = (Ql(t)i ..., 9„(/)), /=0,1, ...,— гауссовскии марковский процесс с вектором математических ожиданий г(/) = М0/ и корреляционной матрицей /?(/, s) = M[(Qt-r(t))(Qs-r(s)n /, 5 = 0, 1, ... Тогда найдется последовательность независимых гауссовских векторов e(t) = (zl(t), ..., e„(/)), />1, с Ме,==0 и Me/eJs£(nXn) таких, что Qi+l~[r(t+l)-R(t+l,t)R+(tyt)r(t)]+R(t+l,l)R+(tit)Qt + + [R(t+ 1, / + 1)- R(t+ 1, t)R+(t, /)/?*(/+ 1, /)],/2 e(/ + 1). Доказательство. Положим Vt+i = 0/+i — M(8/+i 19,). По теореме о нормальной корреляции M[Qt+i\Qt] = r(t+l) + R(t+l,t)R+(t,t)(Qt-r(t)). Отсюда следует, что векторы Vt9 /^ 1, являются независимыми гауссовскими. Действительно, при / > s в силу марковости процесса (9Д / = 0,1, ..., м [0,-м (9,| 9,-i) |9„ ee-i] = M[e/ie,]-M[e/iej = of и, следовательно, MVtVl = M[(Qt-M (9, |9<-i))(e,- М(в, |9,-1)П = = М{М[в/-м(енв/-1)|вв>ев-1][в,-м(в,|е,^)П = о. * Аналогично проверяется равенство MF^l/s = 0 при / < s. Далее, из (13.22) находим, что Wt+iVt+i = R(t+l,t+l)-R(t+l, t)R+(t, t)R*(t+l, /). Значит, в силу свойства 3 для гауссовских векторов найдется гауссовскии вектор et+\ такой, что (см. (13.19)) Vt+i = [R(t+l,t+l)-R(t+l,t)R+(t,t)R\t+l,t)\l,2e{t+l), Mem = 0, cov(e/+i, et+\) = E. Независимость гауссовских векторов е^, /=1,2, ..., следует
504 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 из независимости векторов К,,/ = 1,2, ..., и способа построения векторов et в соответствии с формулой (13.20). Требуемое рекуррентное уравнение для 9/ вытекает теперь из формул для Vt+\ и представления для условного математического ожидания M(8/+i|8/). § 2. Рекуррентные уравнения фильтрации для условно-гауссовских последовательностей 1. Пусть на вероятностном пространстве (Q, У, Р) задана частично наблюдаемая случайная последовательность (9, £) = = (9„ It), /==0,1 ,..., 9, = (9,(0, ..., 9,(0), h = (hit), ..., 6,(0), определяемая рекуррентными уравнениями 9/+1 = *о (U I) + fli (U I) 9/ + Ь{ (f, l)e{(t+l) + b2 (t, I) г2 (t + 1), (13.46) g,+1 = Л00, I) + A{ (/, 6) 9, + Bx (/, g) e, (< + 1) + fl2 (t, I) e2 (f + 1). (13.47) Здесь e{ (t) = (e„ (0, ..., е1Л (0), e2 (0 = (e2I (/), ..., e2l (t)) — независимые гауссовские векторы с независимыми компонентами, каждая из которых нормально распределена, N (0, 1), «о (*»£) = (в<и (*»£)» •••» <*<>*(*. £))> А>(*.6) = (Аи('.6). •••> А>/(Ш — вектор-функции и ьх {и г)=IIМУ«, Б) II, fc (л 6)=! $ (/, 6) I, вх (/, 6)=|| МУ (/, DII, Б2 0, 6) = 3 В?/ (/, 6) |, a, (f, 6) = I a{!j (t, I) ||, Ax (/, g) -1 Л# (/, g) | — матричные функции, имеющие порядок &Х&» & X', 'Х&> / X ', & X &> I X & соответственно. Любой из элементов этих вектор-функций и матриц предполагается неупреждающим, т. е. ^ = (x{g0, ..., ^-измеримым для каждого / = 0, 1, ... Система (13.46), (13.47) решается при начальных условиях (90, £o)i гДе случайный вектор (90, g0) предполагается независящим от последовательностей (eb е2) = [е1 (0, е2(01, f= 1, 2, .. . Относительно коэффициентов системы (13.46), (13,47) и на-
§ 2] РЕКУРРЕНТНЫЕ УРАВНЕНИЯ ФИЛЬТРАЦИЙ 505 чальных условий (60, |0) на протяжении всей главы будут приняты следующие допущения: (I) Если g{t,Q —любая из функций*) а0/, Л0/, М/, Ь?}, Мь В?1, то M|g(M)f <оо, / = 0, 1, ...; (13.48) (II) с вероятностью единица Wl}(t,l)\<c, \A{l,\t,l)\<c; (III) M(||e0|f + ll6olP)<«>» где для х = (хь ..., хп) (IV) условное распределение Р(80^а|£0) является (Р-п. н.) гауссовским. Из предположений (I) —(III) вытекает, что при любом / < оо Mdiejp + llblPXoo, (13.49) 2. Последовательность (9, £) предполагается частично наблюдаемой, и задача фильтрации для нее состоит в построении оценок для ненаблюдаемых значений 6/ по наблюдениям Ц= (go, ..., lt). Пусть Рц(а) = Р(в, <а| Т\), mt = М (9, | Г)), yt = М [(9, - mt) (9, - mt)* \ Г}\. Очевидно, что в силу предположения (13.49) апостериорное среднее mt={ml(t)i ..., mk(t)) является оптимальной оценкой (в среднеквадратическом смысле) вектора 9/ по значениям £о = {£о> • • •» h}> a SpMYz-SMlMO-zMOP дает величину ошибки оценивания. В случае произвольной частично наблюдаемой последовательности (9,|) отыскание вида распределения F.t{a) и его so параметров mh yt представляется весьма трудной задачей. Однако для последовательностей (9, £), управляемых системой (13.46), (13.47), при дополнительном предположении гауссовости условного распределения Р(90^а|£0), решение задачи фильтрации (т. е. отыскания mt и Y/) становится эффективным. В основе этого лежит следующий результат, аналогичный теореме 11.1 для случая непрерывного времени. *) Для простоты записи иногда мы опускаем аргументы у рассматриваемых функций.
506 Условно-гАуссовские последовательности [гл. 13 Теорема 13.3. Пусть выполнены предположения (I) — (IV). Тогда последовательность (9, £), управляемая системой (13.46), (13.47), является условно-гауссовской, т. е. условные распределения Р(90<а0, .... e,<a,|<Ff) являются (Р-п. н.) гауссовскими для каждого / = 0, 1, ... Доказательство. Установим сейчас лишь гауссовость условного распределения P(9,<a|#"f). Для целей фильтрации, рассматриваемой в этом параграфе, этого достаточно. Доказательство для общего случая будет дано ниже, в п. 6 § 3. Доказательство будем вести по индукции. Предположим, что распределение F^t (а) = Р (9/ < а | &]) нормально, N (mt, yty В силу системы (13.46), (13.47) условное распределение P(fy+i ^a> £*+i^*l ^Ь^ = *) является гауссовским с вектором математических ожиданий ( а0 + a{b \ ^ + А'6=(л0+л1б] (13-5°) и матрицей ковариаций bob boB в = [(ь.ву Вов)' <13-51> где ЬоЬ=Ь\Ь\ + Ь2Ь2, boB = biB*i + b2Bly В о В = В\В\ + В2В*2. Пусть v/ = (6/, |,), 2 = (г„ ..., zk+i). Тогда условная характеристическая функция вектора v/+1 задается формулой M(exp[fe\+1]|ne,) = = exp[iz*(A0(t,l) + A1(t, t)Qt)-jz'B(t,l)z]. (13.52) По предположению индукции М(ехр[/2*(Л,(М)е()]|^|) = = exp [iz' (Л, (t, |) mt -\z"(Л, (t, I)ytA\ (t, £))z)]. (13.53) Из (13.52) и (13.53) получаем M(exp[fe\+1]|*7)- = exp [iz' (A0 (t, |) + Al (t, I) mt) -1 z'B (t, |) z - -i «ЧАСТИЦ/, &))«].
§ 2] РЕКУРРЕНТНЫЕ УРАВНЕНИЯ ФИЛЬТРАЦИИ 507 Таким образом, условные распределения Р(0/+1<а,|,+1<*|^) (13.54) являются гауссовскими. Рассмотрим теперь вектор ч - [еж - м (е,+11 г\)\ - с [it+l - м (|/+| | rf)]. В силу теоремы о нормальной корреляции (и замечания к ней) найдется матрица С такая, что Mh(I<+1-M(i(+1|^))*|^] = 0 (Р-п.н.). Отсюда следует, что условно-гауссовские векторы ц и g/+1 (при условии #"|) независимы. Поэтому (z = (zv ..., z^ M[exp(iVe,+I)|^f^+1] = = M{exp(fe-[M(e^^ -exp(te-[M(e,+J^|) + C(g<+1-M(6(+1|^))])X XM{exp(fe4|)|^,g,+l} = -ехр(й'[М(в(+^|) + С(Бж-М(6(+||^))])Х Х'М{ехр(/г'т01*"|}. (13.55) В силу (13.54) условное распределение P(ri<*/ |У|) является гауссовским. Вместе с (13.55) это и доказывает гауссовость условного распределения P(9*+i ^a |#"j+i). Итак, для всех f = О, 1, ... условные распределения P(9*^#l#"i) являются- гауссовскими. Замечание. Аналогично показывается, что если при некотором 5 распределение Р (9S< а |У|) является гауссовским, то таковыми же будут и условные распределения Р(0*<а|#^) при t^s. 3. Условная гауссовость последовательности (9, £) позволяет вывести для параметров ть yt замкнутую систему (ср. с § 1 гл. 11) рекуррентных уравнений. Теорема 13.4. В предположениях (I) — (IV) параметры mt и yt определяются из рекуррентных уравнений*) тж = [а0 + fl^mj + + [boB + a{ytA\][BoB+ A{ytA\}+ [g,+1 -A0-A{mt], (13.56) Y*+i =[(*№] +bob] — - [b о В + axytA\\ [BoB + A{ytA\]+ [b<>B + axytA\]\ (13.57) *) У коэффициентов а0, Л0, ..., b°b, ... опущены аргументы (t, £).
508 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 Доказательство. Найдем сначала параметры условного гауссовского распределения P(e,+I<a,6,+1<*l<H)==M[P(et+I<a, lt+1<x\Qt,ir})\!r\]. В силу (13.50) М (в,+11 ^-|) = Оо (/, 6) + а, (Л 6) т,, М (%t+l | Г\) = Л0 (/, I) + Л, (*, I) mt. (13,58) Для нахождения матрицы ковариации воспользуемся тем, что в соответствии с (13.56) — (13.58) 6<+1 - М (е,+, 19-}) = a, (t, |) [Qt -т,] + + bt(t, &)e,(f+l) + M*, 6)e2(/+ 1), b+i-Mfo+il^D^e. &)[e,-mf] + +B,M)e1(f+l)+Д2(^ S)M'+1). ■ Отсюда получим ^i = c°v(et+„ et+I |0-?) = a,(f, i)vA(^ &) + (&•«(*, I). rfi2 = c°v(e<+1. S,+1 10"?) = <*,('• i)W> 1) + (&°ВД I), d22 = cov(i,+1> |,+1 ЦГ|) = Л,(/, $ytA\(t, D + (BoB)(t, I). Поскольку условное (при условии &"f) распределение вектора (8<+1, lt+i) нормально, то в силу теоремы о нормальной корреляции (и замечания к ней) М(е(+11ПУ= = М(е,+, |#1) + dndtikt^ - М (lt+l |#1)) (13.60) и cov(e<+b Qt+i |#1, lt+x) = dn — dui&da. (13.61) Подставляя сюда выражения для М(9<+1|#"|), М(|<+1|*Г|), й?п, d,, и d22, из (13.58), (13.59) получаем рекуррентные уравнения (13.56), (13.57). Следствие 1. Пусть а0 (t, I) = а0 (0 + а2 (t) h, А0 (t, I) = А0 (t) + А2 (t) lt, a, (t, |) = a, (0, Ax (t, |) = Л, (/), bi (t, I) = h (t), B, (t, |) = Bt (t), 1=1,2, где все функции a/(t), A/(t), bt{t), B{(t), / = 0, 1, 2 и l=\, 2, являются лишь функциями времени t. Если вектор (0О, go) является гауссовским, то процесс (Qt, |t), / = 0, 1, 2, ..., также
§ 2] РЕКУРРЕНТНЫЕ УРАВНЕНИЯ ФИЛЬТРАЦИИ 509 будет гауссовским. При этом ковариация yt не зависит от «случая» и, следовательно, Spy* определяет среднеквадра- тическую ошибку оценивания вектора Qt no наблюдениям ъо == (До» ' • ' f bf)- Следствие 2. Пусть частично наблюдаемая последовательность (9, Q — (Qt> h)> ^ = 0> 1 удовлетворяет при t^l системе уравнений еж = а0 (t, I) + ах (/, I) Qt + Ъх (/, I) гх (t + 1) + b2 (t, g) г2 (t+l), (13.62) lt = A0(t-U l) + Ax(t-l, l)% + Bx(t-ly Б) e, (0 + + B2(t-l, 6)82(0 (13.63) с P(ei<a|6,)~-V(mIf vi)- Хотя формально рассматриваемая система уравнений для fy+i> I/ и не укладывается в схему (13.46), (13.47), тем не менее при отыскании уравнений для mt=M (9, | STfj и y,=cov (9,, 9, | &*f) можно воспользоваться результатами теоремы 13.4. В самом деле, из (13.62), (13.63) находим + Bl(t,Q*l(t+l) + B2(t, 6)e2(f+l). Обозначая AQ = AQ+Axa0, Л, =Л,а„ (13 64) Bx = Axbl + Bx, B2 = ^>2 + B2, получаем, что последовательность (9, l) подчиняется уравнениям (13.46), (13.47), a tnt и yt удовлетворяют уравнениям (13.56), (13.57). Следствие 3 (фильтр Калмана — Бьюси). Пусть гаус- совская последовательность (9, I) удовлетворяет уравнениям e*+i =*o W + fli (0 Qt + bx (fle, (t+l) + b2(t)e2(t + 1), (13.65) It = A0 (t) + Ax (t) Qt + Bx (t) ex (t) + B2 (t) 82 (t). (13.66) Тогда в силу (13.56), (13.57) и предыдущего следствия mt и у* удовлетворяют системе уравнений тш = К (t) + Щ (t) mt] Py (t) QY+ (t) X X[lM-A,{t+\)-Ax{t+\)a,{t)-Ax{t+\)ax{t)tntl (13.67) yti.{ = [^(Uyta\(t) + ^b(t)]-Py(t)QUt)Py(t), (13.68)
510 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 где Ру (t) = bt (t) [Л, (/ + 1) bx (t) + B2(t+ 1)]* + + b2iO[Ai(t+.l)b2® + B3(t+l)Y + al{t)vta\(f)A](t+l), (13.69) QY (t) = [AAt+ 1)6,(0 + 5i(*+l)] И, (/+D6,(0 + В,«+1)Г + + [Л,tf +i)M0 + в2(/+ 1)][Л, tf + i)M0 + b2«+ 1)]* + + Л, (/+ 1) a, (OvAW^; (/+1). (13-70) С помощью теоремы о нормальной корреляции для пг0 = — М(90 ||о) и Yo = cov(0o, 90 Но) получаем следующие выражения: т0 = МЭ0 + cov(0О, во) А\(0)[Л, (0)cov(0О, 0О) А\(0) + ВоВ(0)]+Х Х[1о-Л(0)-Л,(0)М90], (13.71) Yo = cov (0О, во) - cov (0О) 90) Л* (0) X X [Л, (0) cov (0О) в») ЛГ (9) + Б о В (0)]+ Л, (0) cov (в0, 0О). (13.72) Замечание. В предположениях теоремы условное распределение Р (9, < b | #"), 9S = a), f^s s, также гауссовское и его параметры та(t, s) = М (0< \9~\, 9s = a) и ya(t,s) = cov(Qt, 0t \T\, 9« = а) удовлетворяют при t^s системе уравнений ma(t+l, s) = [a0(t, g) + a,(f, %) ma(t, s)] + + [(boB (t, g) + a, (t, |) ya (t, s) A\ (t, I)] X X [В о В (t,l) + A, (t,l) ytA] (t,t)}+ X X[h+i-A0(t, l)-Mt, l)ma(t, s)], (13.73) Ya(/+1, s) = [«,(U)Ya(/, s)ai(', !) + &»&(*, I)]~ - [6 о В (t, |) + a, (/, |) Ya (t, s) A] (t, £)] X X [В о В (t, i) + Л, (t, |) Ya (t, s) A\ (t, g)]+ X X [bo В (t, I) + a, (f, |) Ya Л s) Л1 (f, I)] (13.74) с ma (s, s) = a, Ya (s, s) = 0. Из (13.74) следует, что Ya(^> s) ПРИ t^s не зависит от а. 4. Отметим ряд полезных свойств процессов mt и yt, t = 0, l, ..., предполагая выполненными условия теоремы 13.4. Свойство 1. При любом t = 0, 1, ... величины tnt и (0,—/и,) некоррелированы, т. е. М [т] (в, - «,)} = М {(в, — mty mt) = 0, и, следовательно, Met*0, = Mm;mt + М (8, — mt)*(Qt — mt). (13.75)
§2] РЕКУРРЕНТНЫЕ УРАВНЕНИЯ ФИЛЬТРАЦИЙ gj | Свойство 2. Условная ковариация yt не зависит явно от коэффициентов a0(t, |) и A0(t, |). Свойство 3. Пусть Yo и все коэффициенты системы (13.46), (13.47), за исключением, быть может, коэффициентов a0(t, i) и A0(t, £), не зависят от «случая». Тогда условная ковариация yt является функцией лишь времени / и yt = М {(9, — mt) (9/ — mt)}. В этом случае распределение величины kt — Qt — tnt нормально, N (0, yt). Свойство 4. Оценка mt является несмещенной: Мт/=М9/, * = 0, 1, ... (13.76) 5. В следующей теореме для последовательности £,, t — =^0, 1,..., дается специальное представление (ср. с теоремой 7.12), которое в дальнейшем будет не раз использовано. Теорема 13.5. Пусть выполнены предположения (I) — (IV). Тогда найдутся гауссовские векторы I (t) = (&{ (t), ..., ё/ (t)) с независимыми координатами и с Мё(/) = 0, Me(0e*(s) = 6(/-s)E(/x/) (13.77) такие, что (Р-п. н.) &<+i = A>(<> t) + A\(t, t)mt + + [(BoB)(t9 Q + Ax(t, l)ytA](t, £)]I/2e(/+l). (13.78) Если, кроме того, матрицы (В о В) (t, g) + А{ (t, I) ytA\{t, |) не вырождены (Р-п. н.), / = 0, 1, ..., то*) gr\^grf>-*\ t=i9 2, ... (13.79) Доказательство. Предположим сначала, что при всех / = 0, 1, ... матрицы (BoB)(t, l) положительно определены. Тогда, поскольку матрицы Л, (t, £)y^*(/, £) по крайней мере неотрицательно определены, то матрицы [(В о В) (t, I) + Ах (t, g)X XyHii (U l)]l/2 положительно определены и, следовательно, имеет смысл случайный вектор е (t + 1) = [(В о В) (t, I) + А{ (t, I) ytA\ (t, I)]"112 X ХИ,(/, l){bt-mt) + Bx{t, Б)е, (/ + 1) + B2(^f Б)в2(/ + 1)]. (13.80) Условное (при условии У|) распределение вектора 9, согласно теореме 13.3 является гауссовским, а случайные векторы е,(*+1) и е2(/+1) не зависят от Ц = (£0, ..., £,). Поэтому *) Все рассматриваемые а-алгебры предполагаются пополненными множествами из &~ меры нуль.
512 УСЛОВНО-ГАУССОВСКЙЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 из (13.80) следует, что условное распределение Р(ё(/+1)^ ^x\!Ft) является гауссовским и, как нетрудно подсчитать, М[ё(*+1)|#1] = 0, (13.81) cov(e (/ + 1), ё (t + 1) \р\) = £(/х/). (13.82) Отсюда видно, что параметры условного распределения вектора ё(/+ 1) не зависят от условия, а значит, и (безусловное) распределение вектора ё(/+1) также гауссовское. При этом Мё(*+1) = 0, cov(e(/+l), e(t+l)) = E{lxl). Аналогичным образом, используя теорему 13.3, можно показать, что при любом t совместное распределение векторов (ё(1), ..., ё(0) также гауссовское с cov(e(tf), e(v)) = 6(u—v)E. Отсюда следует независимость векторов ё(1), ..., ё(/). Из (13.80) и (13.47) очевидным образом вытекает требуемое представление (13.78). Для доказательства (13.79) заметим прежде всего, что согласно (13.78) fjcf'p» (13.83) Если матрица (BoB)(t, l) + A{(t, l)ytA](t, I) не вырождена, то опять-таки в силу (13.78) e(t) = [(BoB)(t-l^) + Al(t-l,t)yiA](t-Ut)]^X Х&-А>(<-1, Б)-Л,(*-1, g)ro,.,]. Поэтому ЗГ\ з &~f°'8), что вместе с (13.83) доказывает сов* падение а-алгебр р) и 3~{hl\ f=l, 2, ... Предположим теперь, что при некотором t матрица (BoB)(t, l) + Ax(t, 1)у(А](1у 6) вырождается (с положительной вероятностью). Построим (в крайнем случае за счет расширения основного вероятностного пространства) последовательность независимых гауссовских случайных векторов z(t)=(zx(t),..., zt(t% Мг(/)=0, Mz(t)z*(t) = E{ixi), независимых также от процессов е^), е2(/), t^Oy и векторов (90, £0). Положим *(t+\) = D+(t9l)[Ax(t, t)(Qt-tnt) + B{(t,t)ei(t+l) + + B2(t9l)^(t+l)] + {E-D+(t9l)D{t9l))z(t+l)9. (13.84) где D{t,l) = [(BoB)(t,l) + Al(ttl)ytA\(t,ty\ Нетрудно непосредственно убедиться в том, что последовательность ё(1), ё(2), ... так определенных векторов обладает свойствами, указанными в формулировке теоремы.
§ 31 ПРЯМЫЕ И ОБРАТНЫЕ УРАВНЕНИЯ ИНТЕРПОЛЯЦИИ 513 Для доказательства представления (13.78) достаточно, очевидно, показать, что D(U 6)§(/+l) = =MU l)[Qt-mt\ + Bx(U £)М'+1) + Я2(*. E)e2(f+1). (13.85) Умножая левую и правую части в (13.84) на D(t, |), получаем D(t, l)i(t+l) = = [Ax{t,l)^t-tnt) + Bx{U l)el(t+l) + B2(tyl)s2(t+l)]- -[E-D (/, g)D+ (t, I)] [A{ (t, I) (9, - mt) + B{ (tt l)e, (t + 1) + + B2(t9l)e2(t+l)] + D(t9l)[E-D*(t9l)D(t9l)]Z(t+l). (13.86) По первому свойству псевдообратных матриц D[E— D+D]=* = D — DD+D = Ot и, следовательно, (Р-п. н.) D (/, 6) [Е - D+ (t, I) D (t, I)] z (t + 1) = 0. (13.87) Обозначим С (t + 1) = [E - D (t, I) D+ (*, l)] [A{ (t, I) (9, - mt) + + B{(t, $)el(t+ l) + B2(t, t)e2(t+ I)]. Тогда MC(<+DC*(<+1) = М{М (С(<+1)Г('+1)1^1)}- = M {(£-DD+)DD*(^-^Z)+)}=M {(DD*-/)Z)+/)D*)(£-i)D+)} = = M [(DD* — DD*) (E — DD+] = 0. Следовательно, £(* + 1) = 0 (Р-п. н.), что вместе с (13.86), (13.87) доказывает (13.85). Замечание. В случае невырожденных матриц В о В (t, £) + 4-Л^, l)ytAl{t,l), *>0, поэтому последовательность ё = (ё(1), ё(2), ...) естественно (по аналогии с определением, данным в п. 2 § 4 гл. 7) назвать обновляющей последовательностью. § 3. Прямые и обратные уравнения интерполяции 1. Для случайной последовательности (9, £) = (9„ £/), £=0, 1,..., управляемой уравнениями (13.46), (13*47), под интерполяцией понимается задача построения оптимальных (в среднеквадра- тическом смысле) оценок вектора Qs по наблюдениям ££ =
514 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 Обозначим для t^s т (s, 0 = М (в, | Т)\ у (5, /) = cov (б„ 9, | Г\) вектор средних значений и матрицу ковариации условного распределения IIa (s, /) = Р (9S < а |&)). Ясно, что т (s, /) является оптимальной оценкой 9s no gj. Для этой оценки можно выводить как прямые уравнения (по t при фиксированном s), так и обратные (по s при фиксированном t). Прямые уравнения показывают, насколько улучшается интерполяция с накоплением данных, т. е. при увеличении /. Обратные уравнения представляют интерес в тех статистических задачах, где известен вектор ££ = {£0, ..., ^} и по нему надо оценивать ненаблюдаемую компоненту 9S для всех s = 0, ..., U Обратные уравнения дают удобный рекуррентный способ подсчета оценок: m(/-l,/)nom{t, t) = mt и g/f m(t — 2, /) по т(t — 1, /), т(/, t), 2. Будем предполагать выполненными предположения (1)-(Ш) из § 2. Для вывода прямых уравнений интерполяции полезна следующая Теорема 13.6. Если условное распределение Па (s, s) = нормально (Р-п. н.), то таковы же и распределения \\а (s, /) = Р (б5 < а | {Г\) при t^s. Для доказательства нам понадобится Лемма 13.5. Если условное распределение I1a(sf s) = *=P(6s^a |#~s) нормально, то условное математическое ожидание ша (/, S) = М (в* | &~l 9S = a), f > s, допускает представление roefcs)-cpia + itff (13.88) еде матрицы *) ySs = E(kxk)> t-i Vt = П {«i (и. 6) - [b о В (и, I) + а, (и, g) Y (и, 5) Д? (и, g)] X X [(*•*) (и, g) + i4i(M, 6)v(". s)Al(utl)]+Al(u9 I)} (13.89) /-1 *) Под JJ Ли понимается произведение матриц Л/-! ... As. u—s /
§ 3] ПРЯМЫЕ И ОБРАТНЫЕ УРАВНЕНИЯ ИНТЕРПОЛЯЦИИ 515 и векторы t = 2 Ч>1~1 К (". I) + [(& ° В) (и, I) + а, (и, I) y (и, s) А\ (и, Щ X Х[(° (и, I) + А{ (и, I) у (и, s) А] (и, 1)]+ &+, - А0 (и, £))} (13.90) не зависят от а. Матрицы у {и, s), u^st определяются из уравнений y(ut s) = [ax(u-l, 1)у(и-1, s)aUu-U I) + (bob)(u, £)]- -[(boB)(u-l, Q + ax(u-l, l)y(u-l, s)AUu-lt l)]X mXl(B*B)(u-l, l) + Ax(u-l9 l)y(u-l, s)A\(u-l, l)]+X X[(b*B){u-l9l) + al(u-Ll)y(u-l9s)Ami(u-l,l)Y (13.91) с начальным условием у (s, s) = 0. Доказательство. Прежде всего отметим, что соответствующий аналог представления (13.88) был дан в лемме 12.2 (ср. (13.88) с (12.79)). Согласно замечанию к теореме 13.4 ma(t, s) и ya(t> s) = = cov(0,, 9, |#"|, 0 = a) удовлетворяют уравнениям (13.73), (13.74) с начальными условиями ma(s, s) = a, ya(s, s) = 0. Поскольку Ya(*> s) не зависит от а, то будем писать y(t, s) = Представление (13.88) выводится из (13.73) по индукции. Доказательство теоремы 13.6. Покажем сначала, что гауссовским является условное распределение P(0s^a, lt^.x\@~}__\ Для этого вычислим условную характеристическую функцию М (ехр/[г;ев + г&] IS-f..,) = = М(ех?»[г;в,]М{ехр/[г^]|^|_,. в,}|^|_,). (13.92) Очевидно, что М(ехр/[г&]|П-Р е,_„ 0S) = = ехр{ 1г\(А0(t - 1, g) + Л, (* - 1, |) 0,_,) - _1г;(ВоВ)(/-1, |)z2}. (13.93) Далее, P(0t_,<6|^|-ь 8.} ~N(mB,(t-l, s),y(t-l, s))
516 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 и в силу (13.93) М{М[ехр/(2&)|*1_„ 6,_„ e,]|*j_p es} = хм {expiry-i, De^Ji^t,, es} = = exp\iz*2Ao(t-l,l)-:jZ*2(BoB)(t-l,l)z2\x X exp{ / [zWi (t - 1, I) mes (/ - 1, s)] - -■jziMt-l,Qy{t-l,s)A\(t-l,l)z3}. По лемме 13.5 те$(^-1)5) = Ф^е1 + ^-1 (Р-п. н.) Поэтому М{ехр/[2&]|П-1.0.}- = ехр [1г\ (А0 (t - 1, |) + Л, (* - 1, i) i|><-') - --^z*2((BoB)(t-l,t) + Al(t-l,l)\(t-h s)AUt-l, £))Z2 + + tzlAl(t-l,Q<ft-4,), что вместе с (13.92) приводит к равенству M(exp/fte, + 2&]|n.i)~ = ехр{^(Л0(/- 1, |) + Al(t-l, |)Ч><-')- -1^ро5)(<-1,|) + Л,(/-1(|)у(^-1,5)Л:(<-1,1))22}Х ХМ{ехр/[2;ев + г;(Л1(/-1,|)ф^'в,)]|^.1}. (13.94) Пусть / = 5+1. Поскольку распределение Па (5, 5) = — Р (0s ^ a I @"l) ~ N (mSi ys), то из (13.94) вытекает, что распределение P(9S<1 a, gs+1 ^х |#"|) также гауссовское. Отсюда уже нетрудно вывести, что гауссовским будет распределение Пд(5, 5+1). Из (13.94) по индукции доказывается, что и при любом t> s условные распределения Пд(5, t) тоже гауссовские. Замечание. Тем же методом доказывается гауссовость условных распределений Р (9S < a |#"f, 9W = b) при u<s<^t. 3. Итак, согласно теореме 13.6 распределение llfl(5, t) = = Р (9s ^ cl | У)) ~N (m (5, t), у (s, /)), если гауссовским является распределение lla(s, 5). Найдем прямые уравнения (интерполяции) для m($, t) и y(s, t).
§ 3] ПРЯМЫЕ И ОБРАТНЫЕ УРАВНЕНИЯ ИНТЕРПОЛЯЦИИ 517 Теорема 13,7. Если Ua(s, s)~N(ms, ys), то m(s, t) и у(s, t) при t> s удовлетворяют уравнениям tn(s,t+\) = m (s, t) + y (s, t) (q>J)' A\ (/, I) X X [(В о B) (t, |) + Al (t, 9 ytA\ (t, |)]+ [|/+I - A0 (t, |) - Ax (t, I) mt], (13.95) Y (s,t + 1) = Y (s, t)-y (s, t) (<p<)* A\ If, I) X X \{B о В) (t, I) + Л, (t, |) ytA] (t, 6)]+ A{ (t, |) ф (s, t), (13.96) где m (t, t) = mt, у (t, t) = y,, а матрицы <р£ определяются из (13.89). Доказательство. Как следует из теоремы 13.6, условное распределение P(Os<a, Ь^х \Т\~\) нормально. Параметры этого распределения можно было бы получить из (13.94), однако их проще найти, используя теорему о нормальной корреляции. Согласно замечанию к этой теореме м(е5ц,, ^-.) = M(esl^"|_1) + rf12d2+2fe-M(iH^f-i)], (13.97) где rf12 = cov(e,,gt| $-*_,), (13.98) da = cov(gt, 6,| *-£_,) = = Al(t-\,l)yt-XA\{t-\,l) + {BoB){t-\,l)- (13.99) Чтобы найти е?12, заметим, что в силу леммы 13.4 mt-i = м (е,_, |rU) = м [м (е«_, irU, е.) | Л,] = = м[Ф^е5 + ^,|П-.]=ф^'»М-1) + ^-1. 03.100) Далее, M[et_i — mt-i\&~}-u е,] = = Ф*"Ч + t"1 - К"'т (s, *- 1) + Vs~l] = = Ф^~' [e*-i — "г (s, < — 1)], (13.101) М[6,|^_1] = Л0(*-1,6) + Л1('-1.6)«*-1 (13Л02) и по лемме 13.5 М{[6,-М(|<|У|_1)П^-,.в.}-М{[Л1а-1,|)(в(_1-т|_1)+ = М {[ Д, (/-1,6) (9«_, - т,_,)Г |#1_,, 9,} = = [95-т(5,/-1)]*(Ф^1)*Л;(/-1,6). (13.103)
518 УСЛОВНОГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 Поэтому из (13.100) —(13.103) находим: dI2 = cov (в., &,| *-?_,) = -M{[e.-m(s,f-l)][6<-M(|t|^_l)nrf_1}- = M{[Qs-m(s,t-l)}[Qs-m(s,t-l)]*(<t{-iyA](t-l,l)\&-U} = = у(М-1)№-*у A\(t-l,l). (13.104) Из (13.97), (13.98), (13.102) и (13.104) получаем уравнение (13.95). Чтобы вывести уравнение (13.96), заметим, что согласно замечанию к теореме о нормальной корреляции y(s, 0 = cov(es, Wfti, b) = dn — dl2d?2d?2, (13.105) где d11 = cov(es, Bs\P)-i) = v(s,t—l). (13.106) Из (13.105), (13.106), (13.104) и (13.99) получаем требуемое уравнение (13.96) для y(s, t). 4. Теорема 13.8. Если матрицы (B°B)(u,Q, и = 0, 1 невырождены, то решения m(s,t) и y(s,t) уравнений (13.95) и (13.96) задаются формулами m (s, t) = ГЕ + у, 23 (ФЛ)' А\ (и, g) ((В о В) (и, |) + + Л, (и, I) у (и, s) А\ (и, I))'1 А1 (и, I) <psj X Г ' '■' Xk + Y,S (Ф?)' ^ (и, |) ((В о В) (и, |) + А1 (и, I) у (и, s) X X Л;(и, |))_1(|ц+1 - А0(и, D- Л, (и, 6)чф] . (13.107) Y (s, 0 = [я + Ys j! (ф?)* 4 (и, 1) ((^ ° 5) (и, I) + + А1(и,1)у(и, в)Л;(и,6))"'Л1(и,|)ф?] Y,, (13.108) где ф£, яр£ ы y(«, «) определены формулами (13.89), (13.90) к (13.91). Доказательство. Покажем сначала, что для всех t>s yt^=y(t~l,s) + <p*-lv(s,t-l){<firiy- (13-109)
§ 3] ПРЯМЫЕ И ОБРАТНЫЕ УРАВНЕНИЯ ИНТЕРПОЛЯЦИИ 519 В самом деле, y,_,=cov (е,_„ е(_, | FU) = м [[% - ««-.] [в* - "»,_,]• I П-i) = = М{[9(_| — mes(t— 1, s) + mes(/ —1, s) — m*-i] X X[6,-1 — mes(/- 1, s) + mes(t—l,s)- mt-\\| iFf-i) = =M (M [(Qt-t-m^t-l, S))(9,_,-mes (/-1, s)Y |^f_„ в.] | FU}+ + M {(mes (t — l,s)-mt-i)(mes (f - 1, s) - m,_,)* | У|_,} = = M{y(/-1,s)|^-i} + + M {ф*-1 (в,-m(s, t-l))(Qs-m(s,t- 1))*(<pj-')'| <Ff_,} = = Y«- 1, *) + Ф*-'У(*. < — 1)(Ф^')"' где использовано равенство (13.100): Щ-\ = Ф*~1/п (s, / — 1) + *i"'. Из (13.96) и (13.109) получаем: Y(5, 0 = Y(5, /— 1) — y(s, /— 1) (ф|-] (|))* л;(/— 1, |) X X[(BoB)(t-l,l) + A1(t-l,t)v(t-Ls)AUt-Ul) + + Al(t-l,l)^y(s,t-l)(^yA](t-l,l)r1X XAt(t- l,l)<p*Tly(s,t-l). (13.110) Положим здесь для t> s A1(t-l,t) = Al(t-l,l)¥s-1, (B7B)(t-l,t) = (BoB)(t-l,l)+ (13.111) + Al{t-l,l)y(t-l,s)AUt-l,Q. Тогда v (s, t) будет удовлетворять (по t > s) уравнению y(s,t) = y(s,t-l)-y(s,t-l)Ant-l,l)([B^B)(t-l>t) + + Al(t-l,l)y(s,t-l)A\(t-l,l)r[Ai(t-Lt)y(s,t-i). Наряду с (13.111) введем обозначение А0 (t— 1, l)—A0 (t—1, |)+ + A{(t— 1, l)^-1. Тогда уравнение (13.95) можно переписать в следующем виде: m(s,t) = m(s,t-l) + y(s,t-l)A,i(t-hl)[(B^B)(t-l,t) + + Mt~ 1, i)Y(s, *- 1) Л*(*-1, |)Г' X Х[&,-Д>(*-1, l)~Mt- l,l)m(s,t-l)}.
520 условно-гАуссовские последовательности [гл. 1з Решения же этого уравнения (см. далее теорему 13.15) определяются формулами (13.107), (13.108). 5. Рассмотрим еще один класс задач интерполяции, состоящих в построении наилучших (в среднеквадратическом смысле) оценок вектора Qs по наблюдениям Ц = {£0, ..., £,} и известному значению 9, = Р (ср. с п. 6 § 4 гл. 12). Обозначим Пар (5, /) = Р (9, < а | Р1и В* = Р), t > s, и m3 (s, t) = М (в, | Р\, 9, = Р), % (s, <) = cov (в,, 9S | Р), e, = р). Теорема 13.9. Если условное распределение Па (s) = *= Р (9S ^ а | #"|) нормально, то апостериорное распределение IIap(s, t) при всех t^s также нормально. Доказательство. Вычислим условную характеристическую функцию М {ехр / [z%+z%] I #1}=М {exp / [z*Qs] M (exp / [2*9,] 1#1, 9,) | #1}, где z = (z{, ..., г*), 2 — (2j, ..., 2&). Согласно замечанию к теореме 13.4 распределение P(9*<P|9S, ЗГ\) является гаус- совским, N(mes(t, s), yes(t, s)). По лемме 13.5 me5(f, s)=» ■=Ф^9в + ^1 а ковариация ve (*, s) не зависит от 9S: Ye (*• s)= = Y (Л 5)- Поэтому M {exp [/2*9,] | <И, 95} = exp [/2* (cpft + ttf) - у 2*Y (*. *) 2] и М(ехр/[г*95 + 2*9*]|#1)== = exp [/ (2ЧЦ) -12*Y (/, 5) 2] M (exp / [z*9s + 2ЭД | <F*). (1.3.112) Но условное распределение P(9s^cc|#"f) является гауссов- ским (теорема 13.6). Поэтому из (13.112) следует, что таковым будет и распределение Р(95<сс, 9*<Р l#"f), что вместе с гаус- совостью распределения Р (9/^ р |^"|) (см. замечание к теореме 13.3) доказывает нормальность апостериорного распределения Па3 («» t) = Р (б; < а | Тхи 9* = Р). 6. Метод, примененный для доказательства теоремы 13.9, позволяет завершить доказательство теоремы 13.3.
§ 3] ПРЯМЫЕ И ОБРАТНЫЕ УРАВНЕНИЯ ИНТЕРПОЛЯЦИИ 521 Доказательство теоремы 13.3. Имеем M(exp/[J^;eJ|^|) = = М {(ехр / [^ <©.]) М (exp[/2r;e,J | ^|, 90, ..., 9^)1^} = = М {(ехр/ [Д#,]) М (expffa-ej| П в,.,)! Г)} = = М { ехр / [|*;е, + *;_ А-1 + А Ы-A-i + +l-i)] | *1} X Хехр{~1г;у(^/~1)г^ = ехр{/[г;^„^-1^(^,/-1)^}х X М {(ехр/ [ S <вJ) M [exp/(z^+^J *,)• в,,, | П 9,_2] |Г)]. (13.113) Распределение Р(0^-i <p \Р$, Qt-2) нормально (см. замечание к теореме 13.6), причем его апостериорное среднее линейно зависит от 9^2» а ковариация от 9,_2 не зависит вовсе, поскольку для них справедливы уравнения, аналогичные уравнениям (13.95), (13.96). Поэтому М {ехр / [*,_, + (ср^)* zt] Вм | Г), 9,_2} - = ехр[/(г^1 + (Ф^1)*^)(а(^1, /-2)9,_2 +&('-U-2))- —4- (г*-1+Ы-О* «о*с с—х •'—2> (г*-1+(ф*"1/ «#)]• <13л14> где а(')> Ь(-) и с(•) — некоторые матричные функции (конкретный вид которых сейчас не важен), зависящие только от времени и Ц. Отсюда следует, что в показатель экспоненты правой части (13.114) 9,_2 входит линейно, а переменные zt9 zt~\ — квадратичным образом. Таким образом, м[ехр(/Дгх)|^|] = = ехр {/[гЩ_х + (zt_{ + (Ф|_,)-zt)'b(t-l,t-2)]~ — •2$y(t,t—l)zt — -\(г,_, + (ф;_,)'*#c(t-\,t~2)(Vl-(Ф|_,Хzt)) X X м (ехр / [ J[ *;e, + (zt_2 + (г,_, + (Ф<_,)* zt) х Xa(t-l,t-2)Qt_2}]\ST\). (13.115)
522 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 Продолжая указанный выше способ «отщепления» переменных, мы видим, что характеристическая функция м[ехР(/2*;еж) &\ имеет вид экспоненты от неотрицательно определенной квадратичной формы переменных z0, ..., ztf что и доказывает условную гауссовость последовательности (9, £), управляемой уравнениями (13.46), (13.47). 7. Продолжим изучение интерполяционной задачи, рассмотренной в п. 5. Теорема 13.10. Если условное распределение Па(з) = = P(9s^a|#"|) нормально, то параметры mp(s, t) и y^(s, t) распределения IIfl,р(s, t) = P(9S^a |£"f, 9* = p) при всех t> s определяются из соотношений (ср. с (12.109), (12.110)) mi(s,t) = m(s,t) + y(s,t)(<pyy+(t-m^ (13.116) % (s, t) = y(s,t)-y (s, t) Щ y^Jy (*. t) (13.117) с m3(s, s) = p, Yp(s> s) = 0. Доказательство. Условное распределение P(9s^cc, в^^Р!^"!) нормально. Поэтому согласно замечанию к теореме о нормальной корреляции щ (5, t) = м (ев | рхи 9/ = р) = м (е, 1#1) + л2<й (р - м (е* i #1)) (13.118) и %{s>t) = dn-dX2d+/n, (13.119) где rfn = cov(9„ Q8 {&-)) = у (s, t), d{2 = cov(Qs, 9, |#1)> (13.120) rf22 = cov(e^ 9,|#1). Согласно (13.100) и лемме 13.5 M[(Qt-mty\FlQs] = = К ЫУ + (+.У - К ^ *> Ш+Ш) = (в. - m (5, 0)* (ф5)*. Поэтому di2 = cov (Э„ Qt \ #1) = М f(вв — m (s, 0 (9, — m,)* I #1] = = M {(9S - m (s; t)) M [(9, - mt)' 1*1, 9в] | И} = ^du(<?tf = y(s,t)W. (13,121)
§ 3] ПРЯМЫЕ И ОБРАТНЫЕ УРАВНЕНИЯ ИНТЕРПОЛЯЦИИ §23 Из (13.118) —(13.121) получаем требуемые представления (13.116), (13.117). Замечание. Из (13.117) следует, что ковариация y^(st f) не зависит от р. 8. Займемся теперь выводом обратных уравнений интерполяции (по s при фиксированном /) для m(st /), y($, /) и mp(s, t), Yp(s»^ Теорема 13.11. Пусть выполнены предположения (I) — (IV). Тогда моменты th^(st t) и y^(sy t) удовлетворяют уравнениям {по s<t) (13.122) %(s, t) = %(s, s+ 1) + y(s, s+ 1)(фГTYf++,Vs+ *> OX XYS>SS+1Y(U+1) (13.123) с щ{и 0 = Р. Ypft 0 = 0- Доказательство. Из (13.116), (13.117) получаем mp(5, s+l) = m(sf s+l) + Y(«. e+l)(0'V.++i(P-me+r)f (13.124) YP(5, s + l)^y(st s + l)-y(sy s + l)(^yy^{^y(sy s + I). (13.125) Покажем, что для процесса (9, I), управляемого уравнениями (13.46), (13.47), для всех s<w</ p(es<a|#1, e„,..., e,) = P(e5<a|#1, е«). (13.126) Для этого рассмотрим произвольные измеримые ограниченные функции f(85), х£+1(8, 5)t ffo(5)i Ч9«) соответственно от 85, <9и+ь •••> е*> lu+i> •••> 6/)t (£о> •••! У» ек и заметим, что при s<u м №+1 о, |) |^|, е.,:... ец] -м {х£+1 (е, i)i ri еи} м{л(еи)^(|)М[/(95)Хи,(ел)Щ 0„]} = = М{Я(еы)^(|)/(95)^+1(9, |)} = = М{Я(9ц)^(|)/(95)М^+1(9, 6)| «Г8, в„ .... 9„]} = -М{Я(9^ву(6)/(в#)М[й+1(в, |)Щ 9Ц]} = = м{я(еы)4(1)М[/(е5)|5г1,9„]М[4+1(9,1)Щ ejj.
524 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 Следовательно, в силу произвольности функций A,(8s) и g"(Q M[/(e.)|r|,e.]M[x*+I(e,6)mej=Mf/(ef)xi+1(e,ai^,ej- -м{х*+1(в, ЭМ[/(в,)|П вв..... е,]|*г«, е.). Из-за произвольности %*и+1(®, I) отсюда следует требуемое равенство (13.126). Принимая во внимание (13.126), находим Пар(5> 0 = М[ПаЛ+1(5, *+1)Щ 0, = р]. (13.127) Из этой формулы вытекает тр (s, t) = M [те$+1 (s, 5+1) \Г\, Bt =■■ p], что вместе с (13.114) приводит к уравнению (13.122). Воспользуемся следующей известной формулой для подсчета условных ковариации: если |, | — случайные векторы, М|*| < оо и *& — некоторая a-алгебра, то covd, ||») = M[cov (1,1 \9,Ь\9] + + cov[M (| \9, I), M (| \9, I) \П (13.128) Согласно этой формуле и равенству (13.127) Y„(s, 0 = cov(8,f 95|Г|, 9, = р) = = M[cov(es, e,|n e,. Qs+l)\n e,~p] + + cov[M(e,m e„ es+1), M(e,|n e„ e,+I)|n e, = pj- = M[cov(9s, 9s|^|+p в,+1)|П 0,-p] + + cov [M (9S | <F|+I> 9S+1), M (9S | !Tl+v 9S+1) | Г), Qt = p] = = M[y6s+i(s, 5+1)Щ9, = р] + + cov[me (s, s + 1), me (s, 5+1) |#"|, 9, = pi = L 5+1 St1 J = Yp (s, s + 1) + M [('"es+i (s, s + 1) — mp (s, 0) X X(m6s+i(s, 5+i)-mp(S) /))'|#-f, 9( = pj. (13.129) Но из (13.122) и (13.124) вытекает "Ч+i (s» s + 1) — /йр (s, t) = =v(s, *+i)(<P*+I)*Y?+,[e,+,~^(s + i, 0]. (13.130) что вместе с (13.129) приводит к искомому уравнению (1-3.123). Теорема 13.12. Пусть выполнены предположения (I) — (IV). Тогда моменты m (s, t) и у (s, t) условного распределения
§ 4] РЕКУРРЕНТНЫЕ УРАВНЕНИЯ ЭКСТРАПОЛЯЦИИ 525 Па (5> t) = Р (9S ^ а I ^1) удовлетворяют по s <t (обратным) уравнениям m(5,0 = m(5, s+l) + Y(5, s+l)(9f+1)45++1[m(s+l,0-ms+1], (13.131) Y(s, *) = y(s» s+ •) + + Y(sf s+ l)(4l+Tv;+iY(s+ 1, 0Y++,q>;+lY(s, *+ 1) (13.132) с m (/, 0 = m„ y (t, t) = yt, y(s, s+l) = y3 (s, s + 1). Доказательство. Уравнение (13.131) непосредственно выводится из (13.122). Для вывода (13.132) воспользуемся представлениями (13.127), (13.128). Получим Y(Sf o = cov(ef, es|^|) = + cov[M(efin ef+I)f M(ef|n ef+1)|^J]- = M[cov(e5,e5|sr|+i,es+1)|n + + cov[M(es|^+1, es+1), M(es|sr|+1, es+I)|n = = Y(5,5+l) + M{[m65+i(5, s+l)-m(s,Q\X X[m6s+i(5, s+l)-m(stt)y\F\}. (13.133) Но согласно (13.122) и (13.131) mBe+i(s9s+l)-m(s9i) = y(s,s+l)(^ что вместе с (13.133) дает уравнение (13.132). § 4. Рекуррентные уравнения оптимальной экстраполяции 1. Под экстраполяцией понимается оценивание векторов 9„ lt по наблюдениям |g = {£0, ..., £s), где t > s. Как и в случае непрерывного времени (§ 5 гл. 12), уравнения экстраполяции будут выведены только в двух частных случаях, что вызвано тем, что условные распределения Р(9,<а, Е,<&|#"|) уже не являются, вообще говоря, гауссовскими. Прежде чем переходить к формулировкам теорем, поясним, каким образом можно выделить те случаи, в которых удается построить экстраполяционные оценки.
526 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 В силу (13.56) и (13.78) х р о в) (/, а + а {(t л) у А {и ej+ х X [(В о В) (t9 I) + Ах (t, I) ytA\ (t, Щ1/2 s(t+l)9 (13.134) *t+l = [A0(t,l) + Al{t,l)mt] + + [(B*B)(t,l) + Al(tt &ytA](tt t)fe(t+l). (13.135) Обозначим nx (t9 s) = M (6, | £-6), n2 (t, s) = M % | <F|) оптимальные (в среднеквадратическом смысле) оценки 9, и tt по Ц = %, ..., Ъ8]. Поскольку nx(t9 s) = M[M(Bt\9'\)\9-\] = = M(m,|0"|) и M(e(f + l)|5r|) = 0 для всех /+l>s, то уравнения для nx(t9 s) и n2(t, s) можно попытаться отыскать, беря М(-|0"!) от обеих частей в (13.134), (13.135). Нетрудно заметить, что на этом пути совместное отыскание az, (/, s) и n2(t> s) становится возможным, если предположить, что aAU t) = a0(t) + a2(t)tti a{(t9 l) = a{(t). (13.136) A0(t9Q = A0® + A2№tt " Л, (/, Б) = Л, (0, (13.137) где матричные функции ai(t)9 At{t)9 /=1, 2, и векторы a0(t), A0(t) зависят лишь от времени. Если же нас интересует лишь оценка значений 9„ то отыскание щ {U s) становится возможным, если потребовать выполнения (13.136) с а2(0 = 1. 2. Теорема 13.13. Пусть выполнены предположения (I) —(IV) и (13.136), (13.137). Тогда моменты n{(t9 s) и n2(t9 s) удовлетворяют уравнениям nx(t+l9 s) = a0(t) + al(t)nl(t9 s) + a2(t)n2(t, s)9 (13.138) n2(t+l9 s) = A0(t)+Al(t)nl(t9 s)+A2(t)n2(t9 s) (13.139) с nx(s9 s) = ms, n2(s9 s) = ls. Если выполнено (13.136) и к тому же a2(t)z==09 то nx(t+l9 s) = a0(t) + a{(t)n{(t9 s)9 n{(s9 s) = ms. (13.140) Доказательство получается непосредственно усреднением обеих частей (13.134), (13.135). Рассмотрим теперь обратные уравнения для пх (t9 s) и n2(tf s). Теорема 13.14. Пусть выполнены условия (I) — (IV) и предположения (13.136), (13.137).
$ 41 РЕКУРРЕНТНЫЕ УРАВНЕНИЯ ЭКСТРАПОЛЯЦИИ 527 Тогда справедливы уравнения /«,(*, «+1)\/л,(', s)\, [n2(t, 5+0/ \th(t, s)j + (13.141) где £>, (s, |) = (b о В) (s, I) + a, (s, |) уЛ («. 6). D2(S> |)=(fl.fi)(s, |) + л,(5> 6)yHK*» 5). E = E{ixi), матрица Ф$ определяется из рекуррентных уравнении , /а,0—1) а20—1)\ , . ^-UJf-l) Л2(,-1)К« Фг-^С^х^. 03.142) а LftwrMJ+l* UwJ: (,3-143) Ясли выполнено (13.136) и к тому же а2(0 = 0> то пх (t, s + 1) = ft, 0, 5) + *<;{ [(6 о В) (s, 1) + a, (s) у,Л1 (*. 6)] X X [(В о В) (s, |) + Л, (5, I) у,Л; (в, Щ+ X, Хи,+1-Л(5, &)-Л,(в, »«,], (13.144) где матрица а|)£ определяется из уравнений ^ = а,0-1)^-', *5 = £(»хй), (13.145) а и, (<, 0) = ifjm0 + S ^-'а0 (и). (13.146) м=0 Доказательство. По индукции из (13.134), (13.135) получаем ;m:)+!H:S)+ и=0 <-1 t-i(Di(u,$D}{u,l)DF(u, |) + S Ф«"' .2 ёМё(" + 1). (13Л47) S V Df(u,l)
528 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 Возьмем от обеих частей в (13.147) условное математическое ожидание М (• | ^"|+1). Тогда, учитывая, что М[ё(ы+1) l^"f+i]=0. u>s, из (13.147) легко находим «,(*, s+l)^! ("Ли s)\ t (DUs, t)Dt(s, l)Dll2(s, |) \ что вместе с (13.135) приводит к системе уравнений (13.141). Уравнения (13.144) выводятся аналогичным образом. § 5. Примеры 1. Приведем ряд примеров, иллюстрирующих возможности использования выведенных выше уравнений фильтрации, интерполяции и экстраполяции. Пример 1 (оценка параметров). Пусть 9 = (8,, ..., 9^) —■ гауссовский вектор с М9 = т и cov(9, 9) = y- Требуется оценить 9 по наблюдению за /-мерным процессом £„ t = 0, 1, ..., удовлетворяющим рекуррентным уравнениям Ь+1 = ^о (U I) + Л, {U I) 9 + В, {U I) e, (t + 1) (13.148) с g0 = 0. В предположениях *) (I) — (IV) для mt = М (9 | £"|) и ^ = = cov(9, 9 \!Г)) из (13.56), (13.57) получаем рекуррентные уравнения mt+l = mt + ytA\ (t, |) [(fi.BJ) (t, |) + Л, (t, £) ytA\ (t, |)]+ X Xllt+i-Ao(t, D-AAt, Dm,], (13.149) yt+i = vt-vAV> l)[{BiB№> £) + л,С> DyA(t, i)J"4«> i)yt (13.150) с m0 = m, Yo = Y- Теорема 13.15. Если матрицы (ВtBj)*(t, |) невырождены (Р-п. н.), / = 0, 1, ..., то решения уравнений (13.14.9), (13.150) *) Предположение (II) можно заменить в данном случае условием М8рЛ,(М)Л;(*,и<со,
§ 5] ПРИМЕРЫ 529 задаются формулами *) ml+l = [е + У io A\ (s, |) (B.fif)"' (s, I) A\ (s, I)] X x[m + YjU(s> i)M)"'(s, !)(!*+.-A)(*. I))]. (13-151) Y<+. = [^ + yS/Hs, IXB.BO-Vs, i) Л, (s, I)] v. (13Л52) Доказательство. По теореме 13.3 условное распределение Р{9^а|#"|} является гауссовским (Р-п. н.) с параметрами (mt, yt). Предположим, что матрица Y/ является положительно определенной. Тогда у условного распределения Р (0^а \&")} существует плотность hKa^o) da Условное распределение Р {£,+1 < 6 |#"f, 9} также (Р-п. н.) является гауссовским с параметрами {(Л0(/, g) + Ai(t> £)9), (B\B\)(ty £)}. Поскольку матрицы (B\B*i)(t, g), /=0,1, ..., невырождены (Р-п. н.), то у распределения Р {g,+1 < Ь \ £"|, 9} существует плотность Но тогда согласно формуле Байеса существует плотность bW)-""^'1. задаваемая формулой 'е(а1*о)/б«.,&+||& «) fe(«ieo—> , *' ' (Р-п-н-)- (13-i53) J^+Ife+,|Sj.*)fe(*liS)d* л» Обозначим &(*+!. i) = (2jr)ft/2fdit^7, (13.154) = (2л)"^" ]/detYrdet(B,B;)(/,g) j f 5/+i (l,+l | & *) /e (* I $ <**• ** (13.155) *) Ср. с теоремами 12.2 и 12.8,
530 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 По теореме 13.3 плотность /е(а l^+I) является (Р-п. н.) гаус- совский с параметрами (m/+1, Y/+i)> гДе Y/+i— положительно определенная матрица. Учитывая это и обозначения (13.154), (13.155), находим из (13.153), что (Р-п. н.) [ft^+l.Br'expj-^a-m^Yrii^-»^)}- -jih+i-Mt, D-AAU l)aY(BiB\)-l(t, l)X Xilt+i-AobQ-AMQa)}. (13.156) Приравнивая теперь соответственно квадратичные и линейные формы по а в левой и правой частях равенства (13.156), получаем, в силу произвольности векторов а, рекуррентные уравнения Y^i = УГ1 + 4(/. l)(B{B$-1 {U I) Ах (*, I), (13.157) Yr+i^+i = vr4 + ^C. 1)(В{В])-1а, Z)[lt+{-AQ(t, Щ. (13.158) Если матрица Yo = Y положительно определенная, то по индукции убеждаемся, что рекуррентные уравнения (13.157) и (13.158) справедливы при всех /. Поэтому из (13.157), (13.158) в случае невырожденной матрицы y следуют представления (13.151), (13.152) для т/+1, Y/+I..O0. Если же матрица у вырождена, то, положив Y|j = Yo + 8j^» е>0, найдем yet+p mf+1 по формулам (13.151), (13.152) с заменой у на y + ef. В частности, Y?+l = [е + (у + гЕ) S A\(s9 I)(В^])"1 (s, I) A, (s, l)} [у + гЕ]. I 5=0 ) После предельного перехода е j 0 получаем требуемые представления для mt+u yt+l для любой симметрической неотрицательно определенной матрицы у. Замечание. Пусть т\п) и у|»> —параметры апостериорных распределений Р(9^а|#"|), отвечающих априорным распределениям Р(9<а) ~ N{m{n\ y{n)). Пусть 0 < у(п\ Sp v(tt) < °°. Тогда, если lim (yin)) ! = 0, а ма- П->оо t трицы 2 A*(s, l)(B[B*\)~l (s, £Mi(s, g) не вырождены (Р-п. н.), s—0
§5) ПРИМЕРЫ 531 то нетрудно доказать, что существуют mt = lim tnf\ yt = lim у[л) и Yi+i = [ 2 A> (s> 6) (BiB\)'1 (s> I) Ai (*> 6)1 > r t (13Л59) m/+i = Y/+i S^i(s,6)(B|Bir1(s.6)(s,6)(6.+i-^o(e.6))|. Ls=o J Отметим, что оценка (13.159) совпадает с оценкой максимального правдоподобия для вектора 9 по наблюдениям 1*0+{ = = {£о> • • •» 6*+ij- 2. Пример 2 (интерполяция гауссовской марковской цепи). Пусть 8/ = (81(0, ..., 8Л(/)), f = 0, 1, ..., —марковская цепь, определяемая рекуррентными уравнениями в/+1 = а0 W + *i W 9/ + 6(0«i (*+ 1), (13.160) где я0(/), fli(0i ^(0 зависят лишь от /. Случайный вектор 80 ~ N(m, у). Рассмотрим задачу оценивания величин 8S в предположении, что Qt = p, s < U Пусть .mp(sf 0 = М(9,|9/ = р)> Y (5> ') ™ Y3 (5, 0 = М [(95 - m3 (s, 0 (9, - т0 (s, 0)* 18, = р], т( = М8„ Y/ = c°v (в,, 8,). Тогда согласно теоремам 13.4 и 13.10 mt+{ = aQ(t) + a{(t)mti yt+{ = аг (t) yta\ (t) + b{f)b* (t) (13.161) и щ (s, i) = mt + yt (q><)' Y,+ (P - mt), у (s, t) = ys - ys (q>J)* Y+q>jY,i' (13.162) гдеф^=а,(/—1) ... a{(s). В частности, если 8<+1==8i + e1(f+l), то m3(s, f) = m +2±2(p-m)f у (*. ') = (* + Y) [l -7JJ]. (13.163) Пример З (интерполяция с фиксированным запаздыванием). Рассмотрим задачу оценивания величин 8S по наблюдениям !о+Л=:={£о> •••» is+Ji гДе Л — фиксированная величина. Обозначим mh(s) = m(s, s + К), yh(s) = y(st s + h) и предположим, что при всех s = 0, 1, ... матрицы y {s, s + 1)(ф*+1)*YJ~+i невырождены.
532 УСЛОВНО-1АУСС0ВСКИЁ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 Тогда из прямого уравнения (13.95) .получим mft(s+l) = m(s + 1, S + A) + Y(s+1, s + A)(q>J+*),/4;(s+A,6)X X \(В о В) (s + A, I) + A1(s + A, I) yl+hA\ (s + A, |)j+ X Xlh+H+i-Ms + h, D-A^s + h, t)ms+h]. (13.164) Из обратного уравнения (13.131) в предположении невырожденности матриц y(s, s+ 0(<Pg+ft)*Y7+i находим т (s + 1, s + А) = = «.+i + [Y(s. s+D^H'vr+.r'K^-m^, 5+l)], (13.165) что вместе с (13.164) дает уравнение для tnh(s); mh(s+l) = m$+l + [y{s,s+l)(^+yy-ll]-l{mh(s)-m(s,s+l)]-\- + Y (S + 1, s + Л) (ф*+*)' д; (S + Л) |) [(fi о В) (S + h, I) + + A(s + A, б)у,+И;(в + Л, i)]+X X[|s+A+I-4(s + A, |)-Л,(в + А, 6) «.+»]• (13.166) Аналогично из прямого уравнения (13.96) для yh(s-\-l) = = Y(s+l, s + А + 1) находим, что Y*(s+1) = Y(*+1, * + A)-Y(s+l,s + A)(<pJ+*)Vi4;(s+A,|)X X [(BoB)(s + A, I) + Ax (s + A, I) Ys+ft A\ (s + A, |)]+ X XA^s, h, 6)<p»+*Y(s+l, s + A). (13.167) Из обратного уравнения (13.132) получаем Y(s+1, s + A) = [y(s, s+l)(q>;+,),Yr+Ii]",[Yfc(s)-Y(s, s+l)JX X[Ys^^+lY(s. s+1)]"1. Подставляя это выражение для y(s+1,s + A) в (13.166) и (13.167), получаем уравнения, описывающие эволюцию mh{s) и yh(s). При этом mA(0) = m(0, А) и Ya(°) = Y(0> А) определяются из прямых уравнений (13.95), (13.96). В частном случае А = 1 «i(s+0 = '»,+, + y.+h;(s+i, i) [(в о в) (S 4-1, D + + A (s+1,1) ys+lA] (s+1, |)j+ [ls+2-A0 (s+1, g)-A (s+1, g) me+1]. (13.168)
§5] Примеры 533 3. Пример 4 (линейный прогноз стационарных последовательностей). Пусть |„ / — О, ±1, ±2,—стационарный в широком смысле процесс с М|,^0 и спектральной плотностью \еа+\\2 f (*,)=■ (13.169) Пусть требуется построить оптимальную (в среднеквадрати- ческом смысле) линейную оценку величины %t по |о={|0, ..., |jt Построим гауссовский процесс g/f /==0, ±1, ..., с Mg, = 0 и спектральной плотностью /(Л) = /(Л). Такой процесс может быть получен как решение уравнения !<+2 + T&+i + &/) = e(' + 2) + e(*+l), где е (t), t = 0, ± 1, ..., — последовательность гауссовских случайных величин с Ме(0 = 0, Me(0e(S) = 6(/,s) = {J| |~* Положим 8, = |ж— е(/+1). Тогда для (9,, lt), t = 0, ±1,..., получаем систему уравнений еж—4е,-4ы4-*+». (13Л70) 6<+i = e< + e(/+i). Согласно теореме 13.13 л, (*, s) = М (9, | #"|) и «2 (/, s) = М (|, | #"|) определяются из уравнений (13.138), (13.139): «i(*+l, s) = -4-rti(^> S)-T"2('» s), n2(/+l, s) = «,(/, s), с щ (s, s) = ms, n2 (s, s) = |s. Входящее в (13.171) начальное условие ms = M(9s|#"|) и Ys определяются из уравнений (см. (13.56), (13.57)) ms+l = - J ms - 4- h + 2 \~+*g) (h+i ~ т.), (13.172) Y,+I = TT^- (13Л73>
534 УСЛОВНО-ГАУССОВСКИЕ ПОСЛЕДОВАТЕЛЬНОСТИ [ГЛ. 13 Покажем, что здесь m0 = 0, Yo = 1 • Действительно, в силу стационарности процесса (9„ £,), / = 0, ±1, ..., параметры dn = MB2t, dl2 = MQtlt> й22 = Щ] легко находятся из следующей системы, получаемой из (13.170): rf12 = — _ rfn — — d12 + у, d22 = dn + 1. А именно dn = l, rf12 = 0, d22 = 2, и по теореме о нормальной корреляции m0 = 0, Yo = 1 • Возвращаясь к исходному процессу |„ / = 0, ±1, ..., находим, что оптимальный линейный прогноз определяется из (13.171)—-(13.173), где в (13.172) вместо lt надо подставить \t (см. лемму 14.1).
ГЛАВА 14 ПРИМЕНЕНИЕ УРАВНЕНИЙ ФИЛЬТРАЦИИ К ЗАДАЧАМ СТАТИСТИКИ СЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ § 1. Оптимальная линейная фильтрация стационарных последовательностей с дробно-рациональным спектром 1. Цель настоящей главы — показать, как уравнения опти мальной нелинейной фильтрации, полученные для условно-га- уссовских случайных последовательностей, могут быть применены к решению разнообразных задач математической статистики. В частности, в настоящем параграфе рассматривается задача линейного оценивания ненаблюдаемых компонент многомерного стационарного в широком смысле процесса (время дискретное) с дробно-рациональной спектральной плотностью по компонентам, доступным наблюдению. Возможность использования полученных выше уравнений фильтрации в этой задаче основана на том факте (теорема 14.1), что всякая стационарная последовательность с дробно-рациональным спектром является компонентой многомерного процесса, удовлетворяющего системе рекуррентных уравнений типа (13.46), (13.47). Более точно, пусть r\(t), / = 0, ± 1, ± 2, ..., — (действительный или комплексный) стационарный в широком смысле случайный процесс, допускающий спектральное представление п ц{{)= [ешРп-Ле*)ф{аК)> (14.1.) Л Qn (elk) где Ф(йЯ) —ортогональная (случайная) мера с МФ(<а) = 0, М|Ф(йЯ)|2 = -^-, п— 1 п Pn-i(z)= 25Аг*. Qn(z)=1iakzk, an=\, ak,bk<=R\ *==0 ft-0
536 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Будем предполагать, что все корни уравнения Qn(z) = 0 лежат внутри единичного круга. Из представления (14.1) следует, что процесс r\{t) имеет дробно-рациональную спектральную плотность M*)-|/,— (e'*) Qn(eiX) Построим по мере Ф(йЛ) процесс (14.2) z{t)= \ еа«-Щ{й%). (14.3) Ясно, что Ме(/) = 0, М|е(*)|2 = Я 2л e(0S(s)= J^«-)^-6(ff s), (14.4) М где б(/, s) — символ Кронекера. Из (14.4) следует, что последовательность величин е(/), / = 0, ± 1, ..., является последовательностью с некоррелированными значениями. Наряду с процессом ri(/), допускающим спектральное представление (14.1), определим новые процессы т^/), ..., r\n(t) по формулам я П/(0= J е*Ф,(е*)Ф((1Х), j=l,...,n, (14.5) —Я где частотные характеристики 1^,(г), /= 1, ..., п, выбраны следующим специальным образом: Wi(z) = z-*-WAz) + nifoz-{k-j+l), /=1, ..., n-lt (14.6) 1Гя(г) = -г"1 2 а*^+| (г) + ar'fc, (14.7) fc=0 с /-1 Pi=6rt-i, Р/ = »я-/-2М»-ж, / = 2, ..., я. (14.8) t==i
№„(*) = г"1 § 1] ФИЛЬТРАЦИЯ СТАЦИОНАРНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 537 Из (14.6), (14.7) следует, что Wf(z) = z^[Wi+{(z) + ^] (14.9) и -Sfl^+iW + fti]. (14.10) Отсюда уже нетрудно вывести, что Wn(z) = z-l\a% ak(z-*-x-Wn(z)+ nSP/2-W-»)+pn], (14.11) и, следовательно, Я(/г) (2) где P^Ai(z) —полином степени не выше м—1. Далее, в силу (14.9) —(14.12) р(/) /2\ *'<*>=-таг- (14ЛЗ) где полиномы P{£Li(z) имеют степень также не выше п—1, причем в силу (14.8) Pjfii(z)-P«.,(«). (14.14) Таким образом, т^ (/) = т| (f). Теорема 14.1. Стационарный (в широком смысле) процесс y\(t)9 / = 0, ± 1, ..., допускающий спектральное представление (14.1), является компонентой п-мерного стационарного (в широ* ком смысле) процесса {ч\х (t), ..., т\п(t)), r\{(t) = r\(t)y подчиняющегося системе рекуррентных уравнений Л/Р + 1) = л/+1(9 + Р/в('+ *)• HI • ••> п—и ^14Л5^ Л» С + 1) - - 2 А/Л/+1 (0 + М (* + 1). Процесс e(t), t — 0, ± 1, ..., допускает представление (14.3), 1^^(5)8(0 = 0, 5</, /= 1, ..., П9 (14.16) а коэффициенты plf ..., prt задаются формулами (14.8). Доказательство. Заметим прежде всего, что из пред* ставлений (14.12), (14.13) следует, что все полюсы у функций Wj(z) лежат внутри единичного круга. Используя представления (14.6), (14.7) и (14.5), легко находим, что процесс (r\{ (t), ..., ru(0) удовлетворяет системе ре* куррентных уравнений. (14.15).
538 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Установим теперь справедливость формулы (14.16). Пусть *) А = 0 0 0 —а0 1 0 0 —а, 0 ... 1 ... 0 ... —а2 ... 0 | 0 1 1 —«га-1 > в = р. р2 (14.17) Тогда в матричной записи система уравнений (14.15) допускает представление Yt = AYt^ + Bet. (14.18) Пусть t>s. Тогда в силу (14.18) и (14.4) МГ5ё (0 = ЛМГ,-,ё (/) = Л2МГ^2ё (t) = ... = Л"М75-„ё (О, причем для каждого /=1, ..., /г / п Мл/ (5- tf)S (t) |<(М| л, (s-tf) |2)Va = И I pJfliH) Qn(ea) 2 ^ V/* I 2я / Значит, для доказательства равенств (14.16) достаточно показать, что ПтЛ^ = 0 (14.19) (О — нулевая матрица). Собственные числа матрицы А совпадают с корнями уравнения Qn(z) = 0 и поэтому лежат внутри единичного круга. Приведем матрицу А к жордановой форме: A = CJC~\ где на главной диагонали матрицы / стоят собственные числа матрицы Л. Пусть Я — максимальное собственное число матрицы Л. Тогда, поскольку |Л|< 1, любой элемент матрицы JN не превосходит по модулю величины N\ X\N~"{* Но AN = CJNC~l и N\k\N~l->0, N->ooy что и доказывает (14.19). Замечание 1. Если r\ (t), t — 0, ±1,...,—действительный процесс, то каждый из процессов е(/), т)2(0> •••> Ля(') также является действительным. При этом ковариационная матрица T = MYtY* удовлетворяет уравнению Т = АТА* + ВВ\ (14.20) *) При алгебраических операциях Yf рассматривается как вектор-столбец.
§ 1] ФИЛЬТРАЦИЯ СТАЦИОНАРНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 539 Если / > 5, то cov(YtiYs) = MYtY*s = А*-*Г, (14.21) что следует из равенств Yt = AYt^ + Be(t) = A2Yt-2 + ABe(t—l) + Be(t)= ... t-i .. • = Af-8Y8 + 2 А*-1~!Вги + 1). (14.22) /=* Аналогично, при / < s соу(У„У5) = Г(Л*Г'- Замечание 2. Если r\(t)y / = 0, ±1, ..., — гауссовский процесс, то е(/), / = 0, ± 1, ..., является гауссовской последовательностью независимых случайных величин. 2. Используем представления (14.15) для вывода уравнений фильтрации компонент стационарных последовательностей с дробно-рациональным спектром. Пусть v, = [9„ Ы = [(9, (0, ..., 9, (0), (6, (0, • • •. 6* Ш. * = 0, ± 1, ..., — действительный стационарный (в широком смысле) k + /-мерный процесс, допускающий представление п vt = J eatW (ea) Ф(dk), (14.23) где W(z) = \\Wn^(2)|| — матрица порядка AfXm» N — k + l, с дробно-рациональными элементами р(г, Я) Wr^) = J^> (I4-24) а Ф (dA,) = [Oj (dX), ..., Фт (dX)] — случайная векторная мера с некоррелированными компонентами, МФу (dX)=0, М | Ф/ (dX) j2 = -g-. Будем предполагать также, что корни уравнений Q%,q)(z)=0 лежат внутри единичного круга. Применяя теорему 14.1 к каждому из процессов п vp.r.,(0= \e™WT,q{e*)Q>p{d%), (14.25) —Я после простых преобразований для вектора lt = (li(t), ..., £/(/)) и вектора 8, (составленного из вектора Q( = (Ql(t)9 •••> 9*(0) и всех тех дополнительных компонент типа т^), ..., r\n(t), которые возникают по теореме 14.1 в системе (14.15)) получаем систему рекуррентных уравнений в/+1 = аД + (hit + be(t + 1), (и 26) h+i = AA + A2tt + Be(t+l),
540 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 где е(/) = (е,(/),..., em(t))—последовательность некоррелированных векторов с некоррелированными компонентами, Ме/(/)=0, MeJ(f)=l, л 8,(0= \ е^-Щ^йХ). (14.27) — Л Матрицы аь Аь Ъ и В, /=1, 2, входящие в (14.26), находятся непосредственным подсчетом. Предположим теперь, что у вектора vt = (Qt, £,) первая компонента является ненаблюдаемой. Рассмотрим задачу построения для каждого t = 0, 1, ... линейной оптимальной в среднеквад- ратическом смысле оценки для 9, по наблюдениям (£0> •••> £/)• Если v„ t — Oy l, ..., является гауссовским процессом, то по теореме 13.4 и следствию 1 из нее mt = M(Qt\@"}) и Y/=M([9/ — mt][Qt — mt]*) определяются из системы уравнений tht+l = altnt + a2lt + + (ЬВ* + а,%ЩВВ* + AfaAtf (6Ж - Ajht - А&), (14.28) Vt+\ = aiVta\ + bb* — - (ЬВ* + а&АЩВВГ + М4)+ (ЬВ* + afaAtf, (14.29) решаемых при начальных условиях Щ = М (б01 Бо)э Yo = М ([90 - гп0] [90 - т0Г). Согласно теореме о нормальной корреляции (теорема 13.1) m0 = cov(90, £o)cov+ao, g0)50. (14.30) Yo = cov(90, 90)-cov(90, £0)cov+(Eo> £o)cov(90, g0). (14.31) Поскольку ifit = M(Qt\&r}) линейным образом зависит от £о> • • • i 1*> то в случае гауссовского процесса v, = [9„ lt] решение задачи построения оптимальной линейной оценки 8/ по £о> •••> It дается уравнениями (14.28), (14.29). Покажем теперь, что и в общем случае линейная оптимальная (в среднеквадратическом смысле) оценка также определяется из этих же уравнений. Справедливость этого утверждения вытекает из следующего предложения. Лемма 14.1. Пусть (а, $) —случайный вектор с М(сс2+р2)< оо и (а, р) — гауссовский вектор с теми же двумя первыми моментами, что и у (а, р), т. е. Ма' = Ма', Мр' = Мр', /=1,2, МаР = Мар. Пусть 1(b) линейная функция от b^R1 такая, что Р-п. н. /(Р) = М(а|р). (14.32)
§ 1] ФИЛЬТРАЦИЯ СТАЦИОНАРНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 541 Тогда /(Р) является оптимальной (в среднеквадратическом смысле) линейной оценкой величины а по р, причем М/(Р) = Ма. Доказательство. Прежде всего заметим, что существование линейной функции 1(b) со свойством (14.32) вытекает из теоремы о нормальной корреляции. Несмещенность (М/(Р) = М<х) линейной оценки вытекает из следующей очевидной цепочки равенств: М/(Р) = М/(Р)=М[М(а|р)] = Ма = Ма. Далее, если I (Р)— какая-то другая линейная оценка, то М[а-/(Р)]2>М[а-/(Р)]2. Поэтому в силу линейности оценок /(р) и I (P) М[а~Г(Р)]2=М[а~Г(Р)]2>М[а-/(Р)]2 = М[а-/(Р)^ что и доказывает оптимальность (в среднеквадратическом смысле) /(Р) в классе линейных оценок. Замечание. Утверждение леммы остается справедливым, если а и р — векторы, а = (а19 ..., с^), р==(р1? ..., р^. Чтобы применить лемму 14.1 к доказательству того, что оптимальная оценка 9, по £0, ..., lt определяется из системы уравнений (14.28), (14.29), осталось лишь заметить, что процесс (9„ lt)t удовлетворяющий системе (14.26), и гауссовский процесс, определяемый той же системой, имеют одни и те же первые два момента. 3. Для иллюстрации предложенного выше подхода к задачам оценивания компонент стационарных процессов рассмотрим следующий Пример 1. Пусть 9, и £„ t = 0, ±1,..., —некоррелированные между собой стационарные (в широком смысле) последовательности с М9/ = М£, = 0 и спектральными плотностями где \с{\< 1, /=1, 2. Будем предполагать, что 0, является «полезным сигналом», £, — «помеха» и что наблюдается процесс 6, = e, + £,. (14.33) Согласно теореме 14.1 найдутся некоррелированные последовательности е, (t) и е2 (t)t t = 0, ± 1, ..., с Me/ (t) = 0, Met(t)Bi(s) = 6(t, s), /=1, 2, такие, что Qt+l = cQt + e{(t+l), b+i = *& + Mf+l). (14.34)
542 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Принимая во внимание (14.33) и (14.34), получаем, что 6ж = вж+Сж==(^-С2)в/ + с26/ + е,(/+1) + в2(/+1)." Поэтому «ненаблюдаемый» процесс 9, и «наблюдаемый» процесс lt удовлетворяют системе уравнений ен.1 = *,е,+ 8,0+1), h+i = (Ci-c2)Qt + c2lt + e{(t+l) + e2(t+l). (И'35) В силу (14.28) и (14.29) оптимальная линейная оценка т„ t = 0, 1, ..., величин 9, и среднеквадратическая ошибка фильтрации yt = M(Qt— mt)2 удовлетворяют рекуррентным уравнениям 1 ~f~ С (с "-"- С \ V тш = C{mt + 2 + у l_ cJ ' [ёж — fa — с2) т, — с2У, (14.36) Найдем начальные условия m0, Yo Для эт°й системы уравнений. Процесс (Qt, lt)> t = 0, ±1,..., является стационарным (в широком смысле) процессом с М9, — М£, = 0 и ковариациями dn = M9f, d{2 = М9,^, d22 = М^, удовлетворяющими в силу (14.35) и (14.20) системе уравнений dll = c2ldu + li dl2 = сг fa — с2) dn + cxc2d^ + 1, ^22 = {Cl ~ C2f dil + Ctd22 + 2C2 (Cl - C2) d\2 + 2' Отсюда находим н l и l и - 2~c*-c2 #11 " ~» "12 — " 2"» a22 i-c?' ~u О—00-4)' что вместе с (14.30), (14.31) дает j 1 2 Uj2 1 — C2 m0 = — Eo = 2 2 So» "22 2 "" c\ "* c2 rf12 1 1~^2 * Yo = rfn —-—= *22 1-е? (l — cf) (2 — cf — c|) 2-е]-4 , Итак, оптимальная (в среднеквадратическом смысле) линейная оценка tnt «полезного сигнала» 9, по |0, ..., g, и среднеквадратическая ошибка yt определяются из системы уравнений (14.36), (14.37), решаемой при начальных условиях 1 — с| 1 т0 = ~ 2_ 2 ^0» YO = 0 _ 2 Л1 " 2 — cf — с| 2 — с
§ 2) ОЦЕНКИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 543 Мало что изменится, если рассматривать задачу оценивания параметра 9, по наблюдениям (L.^, ..., £0, ..., lt). В этом случае также остается справедливой система (14.36), (14.37), причем m-"~ 2-c?-c| 6-^f Y-"~~~ 2-c}-c\ ' 4. В заключение заметим, что оптимальные линейные оценки интерполяции и экстраполяции для стационарных последовательностей с дробно-рациональным спектром можно получить (как и в случае фильтрации) из результатов предыдущей главы, рассматривая лишь гауссовские последовательности с теми же самыми первыми двумя моментами. § 2. Оценки максимального правдоподобия коэффициентов линейной регрессии 1. Пусть в моменты времени / = 0, 1, ... наблюдается случайный процесс n БЮ-ЗММ + лЮ. (14.38) где 9 = (9Ь ..., 9дг) — вектор (столбец) неизвестных параметров, — оо<8/<оо, 1=1,..., п, a(t) = (a{ (t), ..., aN(t)) — известная вектор-функция (строка), a v\(t), t = 0, ±1,...,—гаус- совский стационарный случайный процесс с Mtj(/) и дробно- рациональной спектральной плотностью Рп-Леа) Ш = В (14.39) Qn(eil) (14.39) п-1 Pn-i(z)=%b,zf, Ьл-гФО, п причем предполагается, что корни уравнения Qn(z) = 0 лежат внутри единичного круга. Для получения оценок максимального правдоподобия вектора 0 == (0!, ..., 8^) надо найти производную Радона —Ни- J..6 кодима —jr меры ц?, отвечающей процессу g = (g (/)), t = 0> dH 1, ..*, определяемому в (14.38), по мере \х^ для такого же процесса с 9 = 0 (0 — нулевой вектор).
544 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Согласно теореме 14.1 процесс т] (О, ^ = 0, ±1,..., является компонентой процесса (i\i(t), ..., v)n{t)) с i\i (t) = i\(t), определяемого уравнениями 4/C + i)=wo+p/e(*+i), /=i,..., п-и (1440) r\n(t + 1) = - flo Л| (0 - 2 А/Л/+, (0 + ряв(/ + 1), где е(0, t — 0> ±1, ..., — некоторая последовательность независимых гауссовских случайных величин с Me (0 = 0, Мв2(0 = 1, а числа р,, ..., рл задаются с помощью формул (14.8). Поскольку i{t+'l) = a(t+l)B + i\i(t+l), то для процесса (Ш, ..., Ы0) с 6,(0 = 6(0. 6/(0 = Л/(0, / = 2 л, справедлива система рекуррентных уравнений Б|(<+1) = о(/+1)в + Б2(0 + р1в(/+1), 6*«+l)-6*+iW + P*e(/+l)f 1<£<>г, (14.41) S» (* + 1) = - «о (ii (0 - a (t) 9) - 2 fl/|/+i (0 + М (t + 1). Для фиксированного значения 9 обозначим ^(0 = М [lk(t)|<Г|], *>1, y?/(0 = M[(^(0--<(0)^(0-^(0)], /, /> 1. Система (14.41) является частным случаем системы (13.46), (13.47), и, следовательно, m\(t) и у?/(0 удовлетворяют уравнениям (13.56), (13.57). Важно отметить, что в коэффициенты уравнений, из которых определяются y?/(0» не входит 9. Начальные условия Y?/(0) также от 9 не зависят. Следовательно, элементы матрицы Ye(0 = ||Y?/(0|| не зависят от 9. Будем поэтому ее обозначать просто y(0 = II Y//(0ll> U /^2. При фиксированном 9 уравнения для т\($), 6 = 2, ..., п, имеют в соответствии с (13.56) следующий вид: <if +1)-«2+iW + *$+£w в+i - « « + D е - mfщ (14.42) m««+l) = -a0(|,(/)-a(Oe)-2a/w/+.W + /-i PA^2e/Yi,M-|W +—p;+vffl(o—ll/+! ~a (/ +1} e ~ m°(0]' (14,43)
§ 2] ОЦЕНКИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 545 Решая линейную систему (14.42), (14.43), устанавливаем, что **§(/) = v0(/, D + VOG, (14.44) где v0(^, £) — ^-измеримая функция, линейно зависящая от £0, ..., lti a vl(t) = {vn{t), ..., v1JV(0) — неслучайная вектор- функция (строка). Применим к l\(t) = l(t) теорему 13.5. Тогда (при фиксированном 9) найдется последовательность независимых гауссов- ских случайных величин ё(0, t = 0, 1,..., с Мё(0 = 0, Мё2(/) = 1, ^"| = а{(о: £(0), ..., £(0}-измеримых при каждом t (поскольку Р! = bn-i ф 0), таких, что Р-п. н. 6(<+1) = а(<+1)в + т|(/)+/р? + Уи(Об«+1). (И.45) Используя (14.44), отсюда получаем, что 6 (t + 1) - [а (/ + 1) + v, (<)] 0 + v0 (t, I) + P (t) e (/ + 1), (14.46) где PW=/P? + Y22W. Ho e(/), ^ = 0, 1, ..., являются независимыми гауссовскими случайными величинами с Мё(0 = 0, Мё2(*) = 1. Поэтому из (14.46) легко находим, что ^(Ш,...,Ш)==ехр| jr ^- + , vnsw-voC^bSHIaW + vi^-iMe _ 1 [(a(s) + vi(g-i))e]»\I ^ 2а\ Р2(5 — 1) 2 Р2(5 — 1) )у (14.47) где 62=Mri2(0). Предположим, что при некотором t^N—1 матрица D = a*(0)a(0) + у [a(s) + vi(s-l)r[a(g) + vi(g-l)] (14Л8) 5=1 не вырождена. Тогда из (14.47) получаем оценку максимального правдоподобия 9, (по определению она обращает в максимум правую часть (14.47)), задаваемую формулой a n-i(q*(0)6(0) . V [q(g) + vi(*-i)ns(*)-vo(g-i, 1)1 I V 5=1 ' (14.49)
546 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Из (14.48), (14.49) нетрудно вывести, что оценка 9, является несмещенной (Ме9, = 9) и Me [(8* — 9) (б, — 9)*] = DT1. (14.50) С помощью простых преобразований из (14.47), (14.49) следует, что о (Б(0), .... B(0) = exp{e*DA—ie'D.e}. (14.51) Отсюда, в частности, видно, что в рассматриваемой задаче 9* является достаточной статистикой (§ 5 гл. 1). Покажем, что в классе несмещенных оценок 8, = (9j (/), .. • N ..., 9^(/)) с М 2б*(/)<оо оценка 8/ эффективна, т. е. Мв(8< —8) (8« —8)* > Ме (S« —8) (8/ —8)* = Dr1. (14.52) Действительно, согласно матричному неравенству Рао — Крамера (1.50) М (8, - 8) (8, - 8)* > Г1 (8), (14.53) где 8, — несмещенная оценка вектора 8 (МД = 8), а /(8) = = 111ц(6)|| — информационная матрица Фишера с элементами '«(0) = M,j-^-ln^|-(|(0) Ш)}х х{ч",1И<0) Н- Но в нашем случае I(B) = Dt. (14.54) Чтобы доказать (14.54), заметим, вводя обозначения Dtj(t) и Dtj(t) для элементов матриц Dt и DT1 соответственно, что 1пу£(|(0),..., !(/))= У Z)w(/)e*kw-78'l. dn A L 2 J
§21 ОЦЕНКИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 547 и, следовательно, д . rfpg — \n-ft(l (0), ...,l (/)) = У Dn (t) [6, (t) - 6,], i=\ ^/(e) = Ml^-,n-7T«(0),...,6W)}{^in^|(|(0) |(0) |= dQi (Щ M, dpi N = J] Dlt(t)Dik(t)M[Ql(t)~Qt][Qk(t)-Qk} = W N / N \ Z, fe=l /—] Ve=i / N = ^о/г(0б(/, i) = D4{t). /=l Из (14.53) и (14.54) получаем требуемое неравенство (14.52), что и доказывает эффективность оценки 9,. Замечание. Метод, использованный выше для вывода представлений (14.49), (14.51), применим и в том случае, когда bn-l = bn-2= ••• =6n-m = 0, 6я-т-1 ¥=0, tt— т— 1>0. 2. Пример 2. Пусть g (/) == в -+- г| (/), где 9 — неизвестный параметр, — оо < 9 < оо, a r\ (t), / = 0, ± 1, ... — стационарный гауссовский процесс с Мг](/) = 0 и спектральной плотностью /(>) = ■+l е2(Ш + еа+ * Оценка максимального правдоподобия неизвестного параметра 9 может также интерпретироваться как оценка математического ожидания Ml(t) = Q процесса £(f), / = 0, ±1, ... По теореме 14.1 процесс i)(t) является компонентой двумерного процесса (rji (0» Л2 (0) с Tli(0 = Tl(0> определяемого рекуррентными уравнениями Л10+1) = Л2(') + в(<+1), ть(/+1) -i-^iW —Л2(0 + 4-в('+0 и последовательностью независимых гауссовских случайных величин е (t), t = 0, ± 1,..., Me (t) = 0, Me2 (0 = 1. Отсюда находим 6(*+1) = е + ть(*) + в(/+1), Т)2(/+1)=--^|^--тк(0 + |е(/+1).
548 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 В соответствии с этим те (/) = М {r\2 (t) I ^"!) является решением рекуррентного уравнения т е . е -1 (о 4+1 где (см. 13.57)) «H-rx^-^+i-e-^W). Y<+! = Y/4-t- 1+Y, (W 1+Y, В силу уравнения (14.20) Mr}f (*) = -j, МтЦ(*) = |, Мтц (*)%(*)= = - -1. Поэтому М [| (*) - 9]2 = Mtf (*) = ~ , M [g (0 - 9] ri2 (0= 9 = Mrii (0 Л2(0 = —is*» и> следовательно, по теореме о нормальной корреляции (теорема 13.1) т*(0) = 1(6-6(0)), Yo = t- Решая теперь уравнение для mQ(t) с начальным условием те(0) = 1(9--6(())), получаем t-\ ту '»-тП s=0 *-1 t- 1+Ys '[0-6(0)] + s=0 /=s + l f + 2v/ 1+Y/ . ■(!(s)-e) + t + ys •+YS = %,«, 6) + v,(/)0, ls+\ где f-1 / П + 2у5 io+ +sn s=0 /=s+l 4 + 2v/ l+Y, 1 T + Y, t-\ v, (0=4- n- 4 s=o 1+YS t-\ t-\ Sill- 5-0 /=5 + 1 f + 2V/ 1+YS ].
§ 3] ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ 549 Теперь в силу (14.48) и (14.49) имеем (t^l) D,= 4+S (I+Vl(S_|))2 1+Y(s-1) S=l Q< = D7l 5 fmuV (1+v' <s ~ ')) (i (a) - vo (s - 1. D) 1 iji (0) + 2u ГПф"-го • 5=1 J § 3. Одна задача управления по неполным данным (линейная система с квадратичным функционалом потерь) 1. В этом параграфе будет показано, как уравнения оптимальной нелинейной фильтрации, выведенные в предыдущей главе, могут быть применены для отыскания оптимальных управлений. Будем предполагать, что состояние некоторой «управляемой» системы описывается процессом (9, Q = [(Ql(t), ..., 9^(0), (li (t), ..., li{t))]y t = 0> 1, ..., Г<оо, который подчиняется уравнениям Qt+i = c{t)ut + a{t)Qt + b{t)z{{t+\l (14.55) 1ш= A(t)Qt + B(t)e2(t+l). Здесь c(t), a\t)y b (t), A(t) и В (t) — матрицы размерностей (k X r), (k X k), (k X k), (I X k), (I X /) соответственно с элементами, являющимися детерминированными ограниченными функциями / = 0, 1, ..., Г—1. Входящие в (14.55) независимые между собой случайные последовательности е, (/) = (ви (/), ... • > е1Л (0), е2 (t) = (e21 (t), ..., г21 (t))9 t = 1, ..., 7\ являются гауссовскими с независимыми компонентами, Мег/(/) = 0, М^(/)=1. Система (14.55) решается при начальном условии 90, где 90 — гауссовский случайный вектор, М90 = m, M [(90 — т0) X Х(90 — An0)*]==Y> не зависящий от последовательностей е*(/), i = 1, 2, /= 1, ..., Г. В систему (14.55) входит также вектор- столбец ut = (их (/, I), ..., ur(tt £)), где при каждом t = 0, 1,..., Г—1 функции Ui(t, i), играющие роль управляющих воздействий, являются ^~/=(т{(о: |0> ..., |,}-измеримыми (£о = 0)- Все рассматриваемые далее управления и = (и0, ..., ит„Л) будут предполагаться такими, что 2Ми'(*. |)< оо, / = 0, 1, ..., ЗГ-1, (14.56)
550 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Предположим, что качество управления и = (и0, ..., ит^{) измеряется квадратичным функционалом потерь [т-\ 1 2 Ш (t) е, + utR (0 щ) + q*th (T) ег /*о J , (14.57) где H(t), R(t) — детерминированные, ограниченные, симметрические, неотрицательно определенные матрицы порядков (k X&), (г X г) соответственно. Требуется найти (оптимальное) управление й = (й0, ..., 5r_j), для которого V(u) = infV(u), (14.58) где inf берется по всем управлениям, удовлетворяющим условиям (14.56). Рассматриваемая задача является примером так называемых задач управления по неполным данным, когда значения управляющих воздействий предполагаются зависящими лишь от наблюдаемой части координат (|0, £ii...)> описывающих состояние управляемой системы. 2. При отыскании оптимальных управлений (в рассматриваемой задаче таковые существуют, что станет ясно из дальнейшего), помимо результатов оптимальной нелинейной фильтрации, будут использованы также идеи динамического программирования. Введем ряд необходимых для дальнейшего обозначений. Пусть P(t) и yt, t = 0, 1, ..., Г, — матричные функции порядка (k X k)t определяемые как решения рекуррентных уравнений P{t) = H{t)^a*{t)P{t+\)a{t)- -~a(t)P(t+l)c(t)[R(t) + c*(t)P(t+l)c(t)]+c*(t)P(t+l)a(t) (14.59) с Р(Т) = Н(Т) и yM = a(t)yta(t) + b(t)b*(t)- - а (0 у tA* (t) [В (t) В* (t) + A (t) ytA* (t)V A (t) yta (t) (14.60) с Yo^Y- Пусть также D(t) = a (t) ytA* (t) [[B (t) B*(t) + A (t) ytA*(/)]v'} + (14.61) и p(t),t = 'Q, 1, ..., 7\— последовательность неотрицательных чисел, определяемых рекуррентным образом: p(/) = p(/+l) + SpP,/2(/+l)D(/)D*(/)P,/2(/+l), р(Т) = 0. (14.62)
§ 3) ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ 551 Из (14.62) следует, что т-\ Р (t) = 2 Sp Pll2(s +l)D(s)D* (s) Я1/2 (s + 1). (14.63) s=t Введенные матрицы P(t), yt и числа р (t) находятся по коэффициентам системы (14.55) и заданным матрицам H{t) и /?(/). Поэтому они не зависят от «случая» и, являясь лишь функциями времени ty могут быть найдены a priori. Заметим, что матрицы Р(/), / = 0, 1, ..., Г, найденные из рекуррентных уравнений (14.59), являются симметрическими и неотрицательно определенными. Для того чтобы в этом убедиться, рассмотрим задачу фильтрации (см. § 1 гл. 13) для процессов Qs+{ = a*(T-s)Qs+Hll2(T-s)el(s+l), i+l = c*(T-s)~Qs + Rl(2(T-s)~e2(s+l), где ei (s), e2(s) — независимые гауссовские случайные векторы с независимыми компонентами, средние которых равны нулю, а дисперсии —единице. Будем предполагать, что 0О является гауссовским вектором, Мб0 = 0, М906о==# (Г), не зависящим от e,(s), e2(s), 5 = 0, ...t T— 1. Сравнивая уравнения (13.57) для yt = M[(Qt — mt)(bt — rhtY]f где mt = M(Qt\lu ..., £,), с уравнением (14.59) для Р (t), видим, что P(/) = Yr-/- Следовательно, матрицы P(t) являются симметрическими и неотрицательно определенными. 3. Теорема 14.2. В классе управлений, удовлетворяющих условию (14.56), оптимальное управление й = (й0, ..., йт-х) существует и задается формулами u(t^) = -[R(t) + c4t)P(t+l)c(t)]+c^t)P(t+l)a(t)mtAUM) где матрицы Р (t) определяются из (14.59), a mt находятся из рекуррентных уравнений оптимальной фильтрации fnt+{==c(t)ut + a(t)mt + + a (t) ytA* (t) [В (t) В* (t) + A (t) ytA* (t)}+ [g,+I - A (t) mt\ (14.65) с m0 = m и матрицами yt, определенными в (14.60). При этом входящий в (14.65) наблюдаемый процесс |/э/=1, ..., Г, определяется из системы Qt+{ = c{t)ut + a{t)Qt + b{t)zx{t+\), (Ыж, 1ш= A(t)Qt + B(t)e2(t+D, ( Ь) а т V(u) = p(0) + m*P(0)m+ 2 Sptf,/2(t)ytHl/2(t). (14.67)
552 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Доказательство. Пусть и = (и0у ..., ит-х) — какое-то управление, удовлетворяющее условию (14.56). Тогда г М 2 9*9, < оо и Т Г-1 К(и) = м2м(е;#(ое,|#1) + м 2 u\R(t)ut. (14.68) Для рассматриваемого управления и = (и0, ..., ит-{) обозначим т» = М (в? | И"). Y? - М [(в? - ш?)(в? - т^)*], где соответствующие управляемые процессы 9у и Щ определены в (14.55). Важно отметить, что для любого управления и = (и0, ..., иТ-{), подчиняющегося условию (14.56), матрицы y" удовлетворяют системе рекуррентных уравнений (14.60) (см. теорему 13.4 и свойство 3 в п. 4 § 2 гл. 13, стр. 511). Поскольку ни коэффициенты этих уравнений, ни начальные условия не зависят от управления, то матрицы у1* одни и те же для разных и. Поэтому Y" —Y* (см. (14.60)). Покажем теперь, что в (14.68) М (QfH (t) 9? | Р?) = (mff H(0 mll + Sp tfI/2 (/) ytHl/2 (t). (14.69) Имеем М(9{ГЯ(09?|^*^ = М[(9?-го?+т^ = (mff H(t)mf + 2M [(9* — m?)H(t)m^Ff ] + + M [(9« - mff H (t) (9y - mfj \ &f\ = = (mfy H (t) mf + Sp M [#I/2 (0 (в? - mf) (9« - mff Я,/2(/) |<T*"] = - (/я-)* Я (0 my + Sp #1/2 (0 M [(в? - m?) (9jf - my)* | <?f] Я1/2tf). (14.70) Но согласно свойству 3 п. 4 § 2 гл. 13 М [(в? - ту) (в- - ту)* | Pf\ = М [(в? - т«) (9у - ту)*] = yt, что вместе с (14.70) и доказывает (14.69). Итак, в силу (14.68) и (14.69) г т V (и) = 2 Sp Я1/2 (0 y*#,/2 W + М Ц (ту)* Я(0 ту + Г-1 + М ^ utR{t)ut. (14.71) *=о
§ 3] ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ 553 Поскольку функции Sp H]/2(t)ytHll2(t) зависят лишь от времени t и не зависят ни от управления, ни от процессов, описывающих состояние рассматриваемой системы, то ясно, что оптимальное управление и в исходной задаче (если оно только, конечно, существует) совпадает с оптимальным управлением в задаче минимизации функционала __ / г т-\ \ У (и) = М 2 (mfY Н (/) т? + 2 u)R (t) ut . (14.72) При этом «управляемый» процесс 1Щ определяется из уравнения m»+l = c(t)ut + a(t)m» + + а (/) ytA* (t) [В (t) В* (t) + А (0 ytA* (/)]+ [Б?+1 - A (t) m«\ (14.73) Согласно теореме 13.5 найдется последовательность независимых гауссовских векторов ё" (t) = (Ц (t)> ..., Щ (t))t t = 1, ..., Г, с независимыми компонентами, Мё^(0 = 0, М(ё£(/))2=1, /= 1,..., /, такая, что mUi = c®ut + a W < + ^WS"(/ + 1). (14.74) Важно при этом отметить, что для всех допустимых и величины Iй(t) совпадают (§"(0 = §(/)/, /=1, ..., Г). Вытекает это из (13.84) и того замечания, что 9^ — т^ не зависят от и (см. (14.73) и (14.55)). Таким образом, исходная задача отыскания оптимального управления для системы (14.55) и функционала (14.57) редуцируется к задаче нахождения оптимального управления для отфильтрованной системы (14.74) с функционалом (14.72) («принцип разделения» [26]). 4. При отыскании оптимальных управлений в этой редуцированной задаче будут полезны следующие две леммы. Лемма 14.2. Если и = (и0, ..., ит-{)— управление, подчиняющееся условию (14.56), то для всякой неотрицательно определенной симметрической матрицы S(t+l) ИК+О* s(* + 0 mUi№] = M[(mhiY S(t+l)m-+l\m-tut] = = (m»)*a (t)S(t + l)a(t)m» + u*tc*(t) S(t + l)c(t)ut + + 2и]с*(t) S(t + I)a(t)m» + Sp Sl/2(t + I) D(t) D* (t) Sm.{t+I). (14.75)
554 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Доказательство. В силу (14.74) M[K+I)'S(/+l)m?+l|jr;"]- = M[\c(t)ut + a(f)m« + D№(t+l)yX XS(t+l)[c(t)ut + a(t)m? + D(t)l(t+l)\\<r?} = = (т«у a'(t)S(t+l)a (t) mut + u)c* (t) S(t+l)c (t) ut + + 2u'tc*(t)S(t+l)a(t)m<t + + 2M (e* (t + 1) | ST)") D' (t) S (t + 1) (c (t) ut + a (t) m?) + + M[s'(t+l)D*(t)S(t+l)D(t)e(t+l)\&-}U\ = = (mff a{t)S{t+\)a (t) m» + u\c* (t)S(t+l)c (t) ut + + 2u]c (t) S (t + 1) a (t) m» + Sp S1'2 (t + 1) D (t) D* (0 Sp1/2 (t + 1), где мы воспользовались тем, что М (ё(/+ 1) \&"\ ) = 0 и М[ё*(/+1)£>*(05(/+1)/)(0ё(/+1)|^П = = M[r(/+l)D'(0S(/+l)D(0e(/+l)] = = Sp S,/2 (/ + 1) D(t)Me(t + l)e* (/+ 1) D' (t) Sm (t + 1) = = SpSil2(t+\)D(t)D(t)SU2(t). (14.76) Лемма доказана. * Замечание. Пусть 6(1), ..., б (Г) — последовательность независимых гауссовских векторов (o(/) = (6] (0 bt(t))) с независимыми компонентами, имеющими нулевые средние и единичные дисперсии. Рассмотрим процесс т, t = 0 Т, определяемый из рекуррентных соотношений mt+x = c(t)ut + a{f)m, + D{t)b{t+ 1), m0 = m, (14.77) где «, = «,(©) не зависит от б (/+!)• Как и при доказательстве соотношений (14.75), показывается, что М [mt+iS (t -f 1) tni+l | ut, mt\ = = m\cC (t)S(t+l)a (t) mt + и}с* (/) S (t + 1) с (t) щ + + 2u'tc*(t)S{t+\)a(t)mt+SvS{i2{t+\)D{t)D'{t)Sili{t+\). (14.78) Свяжем теперь с введенными выше матрицами P(t) и функциями p(t), t = 0 Т, скалярные функции Qt(x) = p(t) + x*P(t)x, (14.79) где хе=#\ Поскольку р(Г) = 0, а Р(Т) = Н(Т), то QT(x) = x'H(T)x, (14.80)
§ 3] ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ 555 Лемма 14.3. Функции Qt{x), / = 0, 1, ..., Г, удовлетворяют рекуррентным уравнениям Q,(*) = inf [x*H(t)x+V'R(t)V + M \Qt+l (xf-+\)]}, (14.81) где V e= /?', x e= Rk, tf+v, = с (t) V + a (t) x + D (t) 6 (/ + 1)- (14.82) При этом inf в (14.81) достигается на г-мерном, векторе V=-{R(t) + c'(t)P(t+l)c(t)]+c'(t)P(t+l)a(t)x. (14.83) Доказательство. Проверим, что функции Q,(x) = = р (/) + х*Р (t) х удовлетворяют уравнению (14.81), т. е. что p(t) + x'P(t)x = = inf [х'Н (t)x+VR (t)V + p(t+ l)+M[(x*$yP(t+l) xf-+\]}. V (14.84) Положим HV,x)=V[R(t) + c*WP(t+l)c№V + + 2Vc*(t)P(t+l)a(t)x. (14.85) Тогда с учетом замечания к лемме 14.2 находим, что (14.84) эквивалентно уравнению p(t) + x*P(t)x = = p(t+l) + SpPl/2(t+l)D(t)D*(t)Pil2(t+\) + mn(V,x). v Но в силу (14.62) р (t) = p (t + 1) + Sp P,/2 (t+l)D (t) D* (t) P1'2 (t + 1). Поэтому надо лишь проверить, что x*P(t)x = lnU(V,x) (14.86) v для любого х е Rk. Если матрица R(t), входящая в /(V, л:), была бы положительно определена, то тогда J(V, х)> —оо и inf/(V, x) дости- v гался бы на векторе Р= - [Я (/) + с*(f) Р(* + 1) с (t)]+ c*(t) P(t+l)a (t)x (14.87) и непосредственно легко было бы проверить, что / (V, х) = = x*P(t)x. Для доказательства равенства (14.86) в общем случае рассмотрим систему алгебраических уравнений (относительно V~(Vlt ..., V,)) ±VJ(V,x) = 0, (14.88)
556 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 т. е. систему [R{t) + c*(t)P{t+l)c{t)]V = -c'(t)P(t+l)a(t)x. (14.89) Согласно лемме 13.3 эта система совместна и вектор V, определяемый формулой (14.83), есть одно из ее решений. Поэтому минимум квадратичной формы J(V, x) достигается на векторе V, и для проверки равенства (14.86) осталось лишь установить, что x*P(t)x = J {V, х), т. е. что x*P(t)x = x*[H(t) + a*(t)P(t+l)a(t+l)- -a*(t)P(t+l)c(t)(R(t) + c*(t)P(t)c(t))+c*(t)P(t+l)a(t)]x. (14.90) Справедливость этого равенства вытекает из определения матриц P(t) (см. уравнение (14.59)). 5. Возвратимся к доказательству теоремы 14.2. Рассмотрим управление й = (й0, ..., йт^{), определенное в (14.64). Тогда в силу леммы 14.3 -M[Q,+I(m,+1)-Q^m^ (14.91) Суммируя равенство (14.91) по t от 0 до Г—1 и учитывая, что m0 = m, находим Q0 (щ) = MQT (mT) + S M [m]H (t) mt + u]R (t) ut] = T T-l = 2 \Am\H(t) mt + 2 MutR(t) uv (14.92) t=o t=o С другой стороны, пусть и = (и0, ..., wr-i) — любое из управлений, удовлетворяющее условию (14.56). Тогда в силу лемм 14.2 и 14.3 - М [Q,+I (m«+I) - Qt (m-)\ < M [{mff H (t) m» + utR (t) ut\ откуда вытекает, что т т-\ QQ(>n)< 2МКГЯ(/)т"+2 MutR(t)ut. (14.93) и t=Q Ч ' t=0 Сравнение (14.92) с (14.93) доказывает оптимальность управления й=(й0>..., йт-{). Формула (14.67) следует из (14.71), (14.79) и того, что V (S) = Q0 (m) + 2 Sp Я,/2(0 ytH112 (/).
§ 4] АСИМПТОТИЧЕСКИЕ СВОЙСТВА ФИЛЬТРА 557 Замечание. Пусть 90 = т — детерминированный вектор, ft(/)==0. Рассмотрим задачу управления (по полным данным) детерминированным процессом 9„ / = 0, ..., Г, с Qt+{ = c(t)ut + a(t)Qti 80^m, (14.94) и функционалом Г-1 v (и) = 2 е;я (t) е, + 2 <н (t) ut. (и.95) В этом частном случае оптимальное управление ut=-[R(t) + cm(t)P(t+l)c(t)]+cm(f)P(t+l)a(t)Ot, (14.96) где Qt+\ = c(t)ut + a(t)Bt, 80 = m, V(u) = m*P(0)m. (14.97) § 4. Асимптотические свойства оптимального линейного фильтра 1. Рассмотрим задачу фильтрации*) для гауссовского процесса (9,1) = [(9,(0, ..., МО), (1,(0, ..., I*(<))], < = 0, 1, ..., удовлетворяющего рекуррентным уравнениям ё*+1 = aflt + a2\t + 6,e, (/ + 1) + b2e2(t + 1), (14.98) Ь+1 = Л{ 8, + Л2£, + 5,е, 0 + 1) + В2г2 (t+l) с постоянными матрицами а,, а2, 6j, 62, Л> ^2, #1 и #2 порядков (ft X ft), (ft X0, (ft X ft), (ft X 0, (/ X ft), (/ X 0, (/ X ft), (/ X 0 соответственно. Обозначим tnt = M (9, | T\) и у* = M [(8, — mt) (8, — mt)m]. Тогда согласно теореме 13.4 матрица ошибок у* удовлетворяет рекуррентному уравнению 4t+\ = a\4ta\ + b°b — - \Ь о В + а^ЛП [В ° Я + AvHI]+ [6 °в + "iVHlf > (14'") где &о& = &,^ + &2&2, 6oB==6iBl + 62B2, Bofi = fi,fi, + fi2B2. В этом параграфе будет исследоваться асимптотическое поведение матриц yt при ^->оо. В предположениях, сформулированных далее в теореме 14.3, будет показано, что lim y* —Y° t->oo существует и 0<SpY°<°°. *) По поводу принятых далее обозначений см. § 2 гл. 13.
558 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Факт существования такого предела имеет важное значение для приложений, поскольку в этом случае оптимальная в средне- квадратическом смысле оценка т„ t^O, «отслеживает» величины 6„ /^0, с конечной ошибкой даже и тогда, когда k 2 М8?(/)-юо, t-+oo. /=1 ' Прежде чем переходить к выяснению условий, гарантирующих существование предела у0 = lim yh заметим, что вместо системы (14.98) достаточно рассматривать систему уравнений ь+1-де| + *м/+1) (14Л00) с 90 = 60, |0 = |0, а = щ — (Ь°В)(ВоВ)+ Аи Л = Л„ (14.101) b = \(bob) — (b°B)(BoB)+(boB)*]1/2, В = (ВоВ)щ, (14.102) поскольку уравнения для у, как в случае (14.98), так и в случае (14.100) будут совпадать. Действительно, если т6 (/ + 1, 0 = М(6(+1 |#"f+1, 0,), то Y,+, = М [(8<+, — «,+,)(§,+, — rnt+i)'] = 5=3 м [(^+1 - тб, V + 1 >') + m6t (t+Ut)- m<+1) X X (§,+, -m6t(t+l,Q + mif (/+1,/)- m,+l)*] = = М[(в<+1-тв1(/+1,/))(9<+1-тв/(/+1, /))*] + + M |(m8<(/ + 1, *)-т,+1)(тв/(/+ 1, fl-m,.,)']. В силу (13.91) М[(в<+1-тв<(/+1,/))(ё<+1-тв/(/+1,0)] = У('+1,0 = = bob — (boB)(BoB)+(boB)" = bb', а из определения тб (/ + 1,0 в силу замечания к теореме 13.4 следует, что m6i(/+1,0 = 0,8, + <4t + (bo В) (В о В)+ (lt+l - Afit - A2%). Поскольку mt+] = М [ms (/+1,0 l^l+i|> т0 из рекуррентного уравнения для т6 (/+ 1, 0 получаем т1+1 = щт (t, t + 1) + a2f, + + (boВ) (ВоВУ (g,+1 - Л,т (/, / + 1) - А2Ь),
§ 4] АСИМПТОТИЧЕСКИЕ СВОЙСТВА ФИЛЬТРА 559 где т (t, t + 1) = М [0, | #"!+|]. Следовательно, тв/(/ + 1)-mt+l = [ai-(boB)(BoB)+ Л,](б, — m(t, t + 1)) = = а (Qt-m (U+1)), и M[(mg<«+l>0-m<+I)(me<(/+l,0-'nf+1)*] = aY(^/+l)a*> где у(^/+1) = М[(ё/-т(/^+1))(ё,-т(/,/+1)П. Но согласно (13.110) Y (U + 1) = Y, - УН! [fi °В + АМАТ *№• Значит для y<> t > б, также справедливо рекуррентное уравнение Y/+i = k -(boВ)(ВоВ)+ А{] yt[a, -(Ь<>В)(ВоВ)+ Л,]* + + [ь о ь — (ь о в) (в о в)+ {ь о в)*] — X [в о в + 4iYh;]+ 4y, h -(bo в) (в о в)+ (ь о в)*]*. Поэтому в дальнейшем будет рассматриваться лишь система (14.100) и соответственно изучаться асимптотическое поведение матриц уь удовлетворяющих рекуррентному уравнению Y<+1 = ayta* + bb* - aytA* [BB* + AytA*]+Ayta. (ИЛ03) Теорема 14.3. Пусть выполнены следующие условия: (I) Ранг блочной матрицы М Аа размерности (kl X k) равен k\ (II) ранг блочной матрицы G2 = (b ab..Mk~lb) размерности (k X Ik) равен k; (III) матрица ВВ* не вырождена. Тогда существует и не зависит от у0 Нту* = У°- При этом Sp y° < °° и матрица у0 является единственным решением (в классе симметрических положительно определенных матриц) матричного уравнения y = aya* + bb*-ayA*(BB* + AyAYl Ауа\ (14.104) 2. Доказательству этой теоремы предпошлем ряд вспомогательных утверждений.
560 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ (ГЛ. 14 Лемма 14.4. Пусть D и d —матрицы размерностей (l\k) и (k X k) соответственно, и пусть — блочные матрицы размерностей (nl X &)• Тогда матрицы D\Dk и D*nDn, n > k> одновременно либо вырождены, либо не вырождены. Доказательство. Из правила перемножения блочных матриц вытекает, что DnDn = DlDk + %{dy D*Ddl. (14.105) Отсюда видно, что вырожденность матрицы D*nDn влечет за собой вырожденность матрицы DID^. Пусть теперь вырождена матрица DlDk. Покажем, что тогда вырождены и матрицы D*nDn, n> k. Обозначим х — (х{9шш.9 xk) некоторый вектор-столбец, не равный тождественно нулю и такой, что x*D*kDkx = 0. (14.106) Установим, что в этом случае Dd!x = 0 для всех / ^ &. Поскольку DID* =2(0' D'Dd1, /=о то в силу (14.106) Dx = 0, Ddx = 0, ..., Dd*-*x = 0. (14.107) Положим Уо = х, yl = dx = dyQi yI+{ = dyh /<6—1. Тогда Dy0 = Oy /)*/, = О, ..., Dyk-x = 0. (14.108) Но система векторов (у0, уи ..., yk), каждый из которых имеет размерность kt линейно зависима. Поэтому найдутся числа с0> ..., cki не все равные нулю, такие, что 2сл/, = 0. (14.109) /=о
§ 4] АСИМПТОТИЧЕСКИЕ СВОЙСТВА ФИЛЬТРА 561 Пусть / = тах[/<&: С; Ф 0]. Тогда из (14.109) получаем *-i / с Vi= ?лс)У}> с)= —- /—О ^ и, следовательно, У и = d'-tyi = 2 V*-* у/ = 2 '/у*-,+/. Поэтому в силу (14.108) *-i Ddkx = Dtfi = yZc'iDyh_i =0. и Отсюда по индукции устанавливаем, что Dd!x = 0, j^k, что вместе с формулой (14.105) доказывает утверждение леммы. Следствие. Пусть D = D{kxi),d = d{kxk)—некоторые матрицы и Dn = {DdD, ... d"~]D) —блочная матрица порядка (kXnl), n^k. Тогда матрицы DnDn и DkDl одновременно либо вырождены, либо не вырождены. Лемма 14.5. Пусть 9 = [0! (/),..., Bk(t)], / = 0,1, ..., —гауссовская последовательность, удовлетворяющая рекуррентному уравнению вж=ае,+ &в(/+1), 90 = 0, (14.110) где а и Ь—матрицы размерностей (k X k) и (k X k) и e(/) — последовательность независимых гауссовских векторов. е(/) = = (ei(0» •••» е&(0) с независимыми компонентами, Ме/(/) = 0, Ме*(0=1, У=1, ...,*, / = 0,1, ... Если блочная матрица G2 = (b ab ... ak~xb) размерности {k X Ik) имеет ранг k, то матрица Г, = Ш$ при t > А» является положительно определенной. Доказательство. Из (14.110) находим Г,+1 = Me^+iBj+i = M [aQt + be(t+ l)][aQt + be(t+ l)f = = aMQtBla + bMe (t + 1) г (t + 1) b\ Поэтому Г,+ 1 = aYta* + bb\ Г0 = 0. (14.111) Следовательно, Г{ = ЬЬ\ Г2 = ЬЬ* + аЬЬша\ ..., Г, = ЬЬ* + аЬЬша + ... + a*-xW(a*)f~\
562 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ ' [ГЛ. 14 Пусть t = k. Тогда, очевидно, n = G2G2 и при t > k t-\ Tt = G2G*2+2>aJbb*(ay. (14.112) Поскольку ранг матрицы G2 по предположению равен k, то ранг матрицы G2Gl также равен k. Тогда из (14.112) следует, что при t^k матрица Tt не вырождена. Лемма 14.6. Пусть (9, |) = ( [§„ ..., 9„], [|lf ..., |iV]) - гауссовский вектор с положительно определенными матрицами *) cov (9, 9) = М [(в - Мб) (9 — М9)*], (14.113) cov(|, 119)= M [(I- M (I |9)) (I- M (| |в)П. (14.114) Тогда матрица cov(9, в |I) = М [(в — М (в |I)) (§ — М (в ||)П (14.115) также положительно определенная. Доказательство. В силу невырожденности матриц (14.113) и (14.114) у гауссовских распределений**) Р(9<а) и Р (| ^ b 19 = а) существуют плотности f. (а) и /. (b | а). Отсюда 6 | | 8 легко выводится, что существует и плотность f~ (b). Поэтому из формулы Байеса вытекает, что у распределения Р(9^а||) также существует плотность f ~(#l&)> причем fi,e(*l*)Ma) Из факта существования этой (гауссовской) плотности следует, что отвечающая ей матрица ковариаций cov (6, 6 ||) не вырождена, а следовательно, является положительно определенной. Лемма 14.7. Пусть y°t> / = 0, 1, ..., — решение уравнения yt+l = ayta* + bb* — aytA* (BB* + AytA*)+ Ayta (14.116) с начальным условием у% = 0 (0 — нулевая матрица порядка (&Х&))- Бели матрица ВВ* положительно определенная, а ранг матрицы G2 равен k, то матрица y°k положительно определена. Доказательство. Пусть 9°, t = 0, 1, ..., является решением уравнения еж = ав, + *М'+1) (14.117) *) По теореме о нормальной корреляции (теорема 13.1) матрицы cov (|, I | 8), cov(0, 8||) не зависят от 0 и | соответственно. **) Запись {8 < а) обозначает событие {8j < aj, ..., Qn < ап].
§ 4] АСИМПТОТИЧЕСКИЕ СВОЙСТВА ФИЛЬТРА 563 (см. (14.100)) с 90 = 0. Тогда Y? = М [(0? ^ m°) (9J — т°)'], mo=M(ej|0-f), где h+i = AQ* + Be2(t+l). (14.118) Обозначим е = е°*> 1 = (£р •••■ £*)' в = (©8» в? вл-1)э е = = (е2(1), ..., е2(А>)). И пусть В = diag (В ... В), a — diag (a ... а) — блочно-диагональные матрицы, у которых отличны от нуля лишь блоки, стоящие на диагоналях, равные соответственно матрицам В и а. Тогда систему уравнений (14.118) для / = 0, 1, ..., k— I можно представить в виде | = аб + Вё. Векторы (9, 9) и е независимы, поскольку независимы последовательности е, (/) и е2(/), /=1, 2, ... Поэтому М(||9) = йМ(9|9) и I — М (118) = а [9 — М (9 19)] + Вё. Отсюда в силу независимости векторов 9 и ё получаем cov (1, 11в) = a cov (9, 9 19) а* + ВВ\ Поскольку матрица ВВ* не вырождена, то не вырождена и матрица ВВ* — diag (ВВ* ... ВВ*). Далее, матрица cov (9, 9) = = M9fe(o£f является невырожденной по лемме 14.5. Поэтому по лемме 14.6 будет не вырождена и матрица cov (б, ё If) = М № - М(001 <Г|)) (О» - М (001 «Г$))'] = yl, что и доказывает лемму. Лемма 14.8. Если ранг матрицы G{ равен k, то для любого вектора х = (хи ..., xk), \ xt |< оо, /=1, ..., k, supa:*y/a:< оо. (14.119) Доказательство. Пусть xt = {хх (/), ..., xk (t))t t = 0, 1, ..., T>k, —управляемый процесс, удовлетворяющий рекуррентному уравнению xt+{ = a*xt + А*иь х0 = х, где управление ut = (и, (ty xQi ..., xt), ..., щ (/, х0, ..., xt)) выбирается так, чтобы минимизировать функционал VT(x; и) = х*ту0хт + 2 [x]bb*xt + utBB*ut\ (14.120) Согласно замечанию к теореме 14.2 оптимальное управление ut7 t = 0t 1, ..., Т—1, существует и задается формулой ut = -[BB* + AP(t + 1)Л*]+ AP(t+ \)axty
564 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 где xt+i = a*xt+ A*ut и P(t)= bb* + aP(t + l)a - aP(t + I) A*[BB* + AP(t + I) AT X XAP(t+l)a\ P(T) = y0. (14.121) Сравнивая это уравнение с уравнением (14.103), убеждаемся в том, что Р® = Ут-* (14.122) Поскольку (см. (14.94)) для оптимального управления й=(й0, •••> «r-i) VT (х, и) = х*Р (0) х = х*утх, то для доказательства леммы достаточно показать, что VT(x\u)<c<oo, (14.123) где постоянная с не зависит от Г. По условиям леммы матрица Gx имеет ранг k. Поэтому матрица G\G\ не вырождена. Рассмотрим управление ut = (ut(t, х0)у ..., ui(t, x0))> определенное следующим образом: -Aa^^(G]G{yl(afxQi *<*, 0, t>k. Соответствующий управляемый процесс ки t = 0, 1, ..., xt+] = = a*Jct + А*щ, ровно за k шагов попадает в начало координат, поскольку je*=(fl,)**0+S(a*)*"<"l^u/ = = (af { £ - J 2 (а*)"""'"1 ЛМа*-'-1! (OJOi)"1} x0 = = (a*)k {E - (OIGi) (GIG,)"1} x0= 0. Рассмотрим функционал Kr(jt, й). Так как й, = 0, ^ = 0, tf>&, то sup VT (х, й) < оо. Но в силу оптимальности управле- T>k НИЯ й = (й0, .. ., Йг«!) sup 1/г (jc, 2) < sup VT (xy й). Поэтому sup A:*Yr^ = sup VT (x, и) ^ sup VT (x, й) = max VT (x, u) < oo. Лемма доказана.
§ 4] АСИМПТОТИЧЕСКИЕ СВОЙСТВА ФИЛЬТРА 565 Лемма 14.9. Пусть y°t, t = 0, l, ..., —решение уравнения (14.116) с начальным условием Yo = 0- Если ранг матрицы Gx равен ky то существует lim Y? = Y°, (14.124) t->oo где y° — неотрицательно определенная симметрическая матрица с SpY°<°°. Если к тому же и ранг матрицы G2 равен k, а матрица ВВ* не вырождена, то матрица у0 положительно определенная. Доказательство. Согласно лемме 14.8 величины х*утх ограничены для любого Г^О (|*tl<°°» /=1, •••, k). Покажем, что эти величины являются монотонно неубывающими функциями Т. Пусть Т2>ТЬ й°(Т{) и й°(Т2) — оптимальные управления, отвечающие длительностям наблюдения Тх и Т2 соответственно. Тогда, если x°t(T{) и x°t(T2) — траектории управляемых процессов для управлений u°(Ti) и й°(Т2) соответственно*), то ='§'[(*? ОТ ЬЬ< (*? (Г2)) + (й? (Т2)у ВВ' (а» {Та))] > > jj'[(*? ОТ w (*? га + W (Т2)У bit (й? (r2))j > >V°Ti(x; «°(7'1)) = *V. Поэтому, если й°(Тп) — оптимальное управление на интервале Тп, а Тп+{ = Тп+1, то и в силу равномерной (по Тп) ограниченности величин 1/о (*, й°(Тп)) существует lim К?, (х\ й°(Тп)) = хту°х. Отсюда в силу произвольности вектора х ясно, что предельная матрица y° является симметрической, неотрицательно определенной и Sp y° < °°. Если, наконец, rangG2 = k, а матрица ВВ* не вырождена, то по лемме 14.7 для любого ненулевого вектора х x*ykx > 0. Но величины х*утх являются монотонно неубывающими. Поэтому для любого ненулевого вектора х х*утх > 0, Т > k, что и доказывает положительную определенность матрицы у0. *) Индекс 0 у Vj (х, •), и (Т)> x°t (T) указывает на то, что yQ — 0.
566 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 3. Доказательство теоремы 14.3. Возьмем управление щ = - [ВВ* + Ay°ATl Ay°a*xt, (14.125) где xt+l = axf + A*ut (14.126) и матрица y° определяется из (14.124). Покажем, что lim JcJy% = 0. (14.127) £->оо В силу (14.125) и (14.126) xi+iV°xi+i = {xia + utA) у0 [a* St, + А'щ} = = x\ {ay°a' — 2afA' (BB' + ^yM*)-1 Ay°a' + + ay°A (BB' + Ay°A')~l [BB* + Ay°A — BB'] (BB' + АуЧ')'1 X X Ay°a*} Xi — u'tBB'ut = = %{ау0а' — а\0А'(ВВ'+ Ау°А')~1 Ау°а'} Xt — ЩВВ'щ. (14.128) Поскольку y° есть предел последовательности матриц у?» удовлетворяющих уравнениям (14.116), а матрица ВВ" невырожденная, то y° является решением уравнения Y°= ау°а* + ЪЬ* — ау°А' (ВВ' + ^М*)"1 Ау°а\ Отсюда и из (14.128) находим #+iY°&+i — xty°xt — — [x'tbb'xt + u'tBB'ut]. Следовательно, согласно лемме 14.9 r-i О < JtrY°*r = х'у°х — 2 [x'tbb'xt + u'tBB'ut] < (=0 < х'у°х — V°T (х; й° (Г)) -* 0, Т -» оо. Теперь ясно, что поскольку матрица y° не вырождена (лемма 14.9), то limxr = 0 (14.129) Т->оо и т-\ lim V°T(x; й0(Т)) = х*у°х=1\т 2 \x\bb*xt + n*tBB*ut]. (14.130) Пусть теперь Yo—(не обязательно нулевая) неотрицательно определенная симметрическая матрица. Тогда в силу (14.120) V°T(x; Й°(Г))<^(*; Й(Г))< <хгуцхт + S [xlbb'xt + utBB*at\. (14.131) *=0
§ 4] АСИМПТОТИЧЕСКИЕ СВОЙСТВА ФИЛЬТРА 567 Переходя в этих неравенствах к пределу (Г-*оо), находим с учетом (14.129) и (14.130), что Umx*yTx = \\mVT(x; u(T)) = limV°(x; й°(Т)) = х*у°х- (14.132) Г->оо Г->оо Г->оо Следовательно, в силу произвольности вектора х limYr = Y0 Г-»оо существует. При этом у0 не зависит от начальной матрицы у0. Выше уже отмечалось, что y° является положительно определенным решением матричного уравнения (14.104). Покажем, что в классе положительно определенных симметрических матриц это решение является единственным. Действительно, пусть y(I) и Y(2)—два таких решения. Обозначим y(A t^O, решения уравнений (14.103) с y|)1) = Y(1) и Yq2) = Y(2) соответственно. Тогда согласно доказанному lim уФ = Y° = Y<0> /=1, 2. Г-»оо Теорема доказана. Замечание 1. Если sup Sp MQ$t < °°> то в формулировке t>o теоремы 14.3 можно отказаться от предположения (I), поскольку SpY/<SpM9^. Замечание 2. Пусть процесс (9„ £<) = ([8|(0, ..., Э*(Л], [li(t)y ..., h(t)]) удовлетворяет рекуррентным уравнениям (задача Калмана — Бьюси) ср. с (14.100)). Чтобы в терминах матриц аь Ьь А{ и В, сформулировать условия, обеспечивающие существование предела lim Y/, достаточно заметить следующее. Поскольку 6Ж = Axafig + Albfil (t + 1) + В,е2(* + 1), то, полагая а = ах — bibiAi [Axbib\A\ + BiB]]'1 Axau А = Ахаи Ь = [ЬхЬл - ЬхЬ\А\ {АХЬХЬ\А\ + В{В\)"Х Л,6,М]1/2, В = {А{ЬхЬ\А\ + ВхВ\)11\ сводим задачу исследования существования HmY/ к уже изу- f->oo ченной задаче для системы (14.100). 4. Пример 3. Пусть 9, и \t — одномерные процессы с 9Ж - а% + бе, (* + 1), |ж = 49, + Вг2 (t + i).
568 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. М Тогда, если А ф О, Ъ ф О, В Ф О, то выполнены условия теоремы 14.3 и предельная ошибка фильтрации y°=l\tr\yt t-* оо (Y* = М(8, — mtft mt—M (9, |g0, ..., £,)) определяется как положительный корень квадратного уравнения : + р1^!>_ф_-^_0. § 5. Рекуррентное вычисление наилучших приближенных решений (псевдорешений) линейных алгебраических систем 1. Пусть заданы вектор у = (уи ..., yk) и матрица Л = ||а^|| порядка (kXn) и rang Л<гшп(6, п). Тогда система линейных алгебраических уравнений Ах = у, (14.134) вообще говоря, может не иметь решений, а если и имеет, то решение может быть не единственным. Говорят, что вектор х° есть наилучшее приближенное решение (псевдорешение) системы (14.134), если \y — Ax°f = ini\y — Ax |2 (14.135) X и, если также \у — Ах' \=\nl\y — Ах\, то X U°|2<l*' I2, (14.136) к где | у — Ах |2 = S ; = i п п yi — Sfa«y*/|. ui2= SU/P. Иначе говоря, псевдорешение есть приближенное решение, имеющее наименьшую «длину». Хорошо известно *), что такое решение х° задается формулой х° = А+у, (14.137) где А —матрица, псевдообратная к матрице А (см. § 1 гл. 13). Из (14.137) видно, что для отыскания псевдорешений требуется находить псевдообратную матрицу А . Однако,1 как будет показано в этом параграфе, используя уравнения оптимальной фильтрации (13.56), (13.57), можно предложить рекуррентную процедуру нахождения псевдорешений, не требующую «псевдообращения» матрицы Л. 2. Начнем с того случая, когда система алгебраических уравнений Ах = у совместна (k^ri). В этом случае псевдоре- *) См., например, § 5 гл. 1 в [30].
§ 5] ПРИБЛИЖЕННЫЕ РЕШЕНИЯ 559 шение л:0 = А+у выделяется среди всех решений х тем, что его длина является наименьшей, т. е. |*°|^|л:|. Введем некоторые обозначения. Пусть /=1, 2, ..., k — номера строк матрицы Л, at — строки матрицы Л, ч:-> yt— элементы вектора у, t=l, ..., k, У\ \ У< = yt Рассмотрим для каждого / (совместные) системы линейных алгебраических уравнений *) Atx = yK (14.138). Положим также xt = Aty\ yt = E-AtAt. (14.139) Теорема 14.4. Векторы xt и матрицы yt, t=\ k, удовлетворяют системе рекуррентных уравнений ^+. = ^ + YA*+,K + 1Y^; + ,)+(^ + ,-a( + 1^)' *о = °> (14.140) Y, + 1 = Y<-YA+1(a, + 1YA + 1)'4 + IY,, \0 = Е> (14.141) где («, + ,V,<.;+,)* = { К + 'Г: + Г' * + **»>* 04.142, и вектор Хк совпадает с псевдорешением х°. Если rang A ==k, то (at + lyta*t +,)+ = {at + {у(а] +,)~ «р« всех / = 0 £—1. Доказательство. Пусть 0 = (0,, ..., Вк)—гауссовский вектор с М0 = О, М00* = £, и пусть 1' = Л,0. (14.143) Тогда по теореме о нормальной корреляции (теорема 13.1) и в силу того, что Ml' = 0, M0 (|')* = Ль М &') &')'= AtA], mt = M(Q\lt) = A*t{AtA'l)+lt. *) Размерность вектора х равна п при любом t.
570 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Но по свойству 6° псевдообратных матриц (см. § 1 гл. 13) A*t(AtA*t)+= At. Поэтому mt = Atlf. (14.144) Далее, опять-таки по теореме о нормальной корреляции yt = E-AtAt = E-A*t(AtA))+At= ■ = мее* - ме (& (м feOfeOV (ме (бОТ = м [(в - mt) (в - mty]. (14.145) С другой стороны, систему уравнений (14.143) можно представить в следующем эквивалентном виде, принятом в рассмотренной выше схеме фильтрации: e*+i = e„ е0 = е; ь+, = а,+1е, i0 = o (н.14б) (ср. с системой (13.46), (13.47)). Из уравнений фильтрации (13.56) и (13.57) применительно к схеме (14.146) находим, что Щ +1 = mt + Ъа\ +1 (at + iY^; +1)+ (h +1 - */ +i™/)> m0 = 0, (14.147) Vf + rYr Y A + , (at + ,Y^; +,)4 + iY„ Y0 = Б. (14.148) Итак, требуемое рекуррентное уравнение (14.141) для yt установлено. Чтобы теперь из (14.147) вывести уравнение (14.140), поступим следующим образом. Пусть г = 9**. Тогда Щ*г = М Л,88** = Atx = у\ Mltz = Matee*x = atx = yt, (14.149) Mm,z = MAtl'z = AtWgz = At у* = xt. Умножая левую и правую части (14.147) на г и беря затем математическое ожидание от полученных выражений, находим Mm^12 = Mm^ + YA + 1K + 1Y^ + i)+[M^ + i^-^ + iMM' что вместе с (14.149) приводит к искомому уравнению (14.140). Из (14.139) и (14.137) вытекает также, что xk = x°. Для доказательства заключительной части теоремы положим для данного t t b = at + i-^csasy (14.150) где числа си ..., ct выбраны так, чтобы величина bb* была минимальной. Обозначая с вектор-строку (c{J ..., ct), запишем (14.150) в векторной форме: b = at + i — cAt. (14.151)
§ 5] ПРИБЛИЖЕННЫЕ РЕШЕНИЯ 571 Тогда bb* = at + la*t + l-2at + {Ay + cAtA;c. Отсюда в силу минимальности величины bb* вытекает, что вектор с = {с{. ..., ct) удовлетворяет системе линейных алгебраических уравнений с (Л, A]) = at+lA*ti и, следовательно, c = at+[A*t(AtA*)+=at+{A+. (14.152) Из (14.151) и (14.152) следует, что . b = at+l(E-AfAt) И - аш (Е - A+At) at+l = at+]ytat+u где мы воспользовались свойством 4° псевдообратных матриц (§ 1 гл. 13). Если ранг матрицы А равен k, то ранги матриц Аь t = 1, ..., ky равны /. Поэтому при любом t — 1, ..., к строка at+l не является линейной комбинацией строк аи ..., at, и, следовательно, bb* > 0. Но bb* = ^+iYA+i> поэтому at+lyta*t+l > 0. Теорема доказана. 3. Обратимся теперь к тому случаю, когда система алгебраических уравнений Ах = у несовместна. Оказывается, что и в этом случае для отыскания псевдорешения х° = А у можно построить рекуррентную процедуру, не требующую «псевдообращения» матрицы Л. Будем предполагать, что матрица Л=||а^|| имеет порядок (&Х#). При описании рекуррентных процедур существенно различать случаи k^.n и k>n. Рассмотрим здесь лишь случай k^n. Теорема 14.5. Пусть k^n и rang,4 = fe. Тогда псевдорешение х°= А у совпадает с вектором хьл найденным из системы рекуррентных уравнений (14.140), (14.141). Для доказательства нам потребуется Лемма 14.10. Пусть В — матрица порядка (т X я) иЕ — единичная матрица порядка (пУ^п). Тогда \im(aE + B*B)-lB* = B+, (14.153) Um(aE + B*B)-la = E — B*B. (14.154) а+0
572 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Доказательство. Имеем А(а) = В+—(аЕ + В*В)~1 В* = (аЕ + В*ВГ1\(аЕ+ В*В) В+ — В*]= = (аЕ + В*В)~1 [<хВ+ + аВ*ВВ+ — аВ*]. Но В*ВВ+=В* (свойство 7°, § 1 гл. 13). Поэтому Д(а) = а(а£ + В*В)",В+ и Д (а) (Д (а))* = а2(а£ + В*В)~1 (В*В)+ {аЕ + В*В)~{, (14.155) поскольку^4" {В+)* = (В*В)+ (свойство 5°, § 1 гл. 13). 'Если В*В — диагональная матрица, то справедливость (14.153) следует из (14.155), поскольку нули на диагоналях матриц В*В и (В*В)+ совпадают. В противном случае с помощью ортогонального преобразования S(S* = S~l) получаем 5* (ВтВ) S = diag (ВтВ), S* (B*B)+S = diag (B*B)+ и S*A (а) (Д (a))*S = = a [aE + diag (B*B)]~l diag (B*B)+ [aE + diag (B'B)]"1 -> 0,a j 0. Отсюда в силу невырожденности матрицы S получаем Д(а)(Д(а)Г->0, а|0. Итак, (14.153) установлено. Для доказательства (14.154) надо теперь лишь заметить, что в силу (14.153) Е — В+В = Е — lim (aE + B*B)~lB*B = = Е — lim (aE + В'В)-1 (В'В + аЕ — аЕ) = lim (a E + В*В)~1 а. Лемма доказана. Доказательство теоремы 14.5. Если система Ах==у совместна, то требуемое утверждение вытекает из теоремы 14.4. Перейдем к рассмотрению общего случая. Покажем прежде всего, что вектор xt = At yf можно получить следующим образом: *, = limjrt (14.156) где xf, a>0, есть решение совместной системы линейных уравнений (aE + AlAt)xi = Avf. (ИЛ 67)
§5] ПРИБЛИЖЕННЫЕ РЕШЕНИЯ 573 Действительно, пусть вектор x?(f) = U?(0i •••> x%(t)) минимизирует функционал t m 5=1 /=1 где ха = (xf, ..., JtJJ). Тогда нетрудно видеть, что х« = (сс£ + A)Aty{ А\у*. (14.158) Отсюда непосредственно следует, что х^ является решением совместной системы уравнений (14.157). Но по лемме 14.10 lim (a£ + A*tAt)~ A*t = At> a ^ 0 что вместе с (14.158) и доказывает равенство Xf — limx*}. Выведем теперь рекуррентные уравнения для векторов jcJ, t^k. Для этого воспользуемся приемом, примененным при доказательстве предыдущей теоремы. Пусть 9 = (01, ..., 9tt) —гауссовский вектор с М9 —0, М99* = £, и пусть е„ /=1,..., &, — гауссовская последовательность независимых случайных величин с Me, = 0, Ме^=1, не зависящих от вектора 9. Положим g,+I = a,+,&, + a'/Vi» « > 0, (14.159) где 9, s 9. Тогда m? = М (9, | gIf ..., lt) = М (9 | gp ..., g,), Y^ = М [(9 — m?)(9 — т?)*] согласно теореме 13.4 удовлетворяют следующей системе уравнений: a * "*?+■ = <+ a ■ Yt+1- (h+i~ at+imf), m« = 0, (14.160) ^-^-а11+^ ' Г°=Е- (14Л61) Согласно теореме 13.15 решения mf и y? этих уравнений задаются формулами т«= (оЕ + Л;^)-' S a;+1le+1 =(a£+ Л^)"1 Л^, (14Л62) П = «(«£+2<+|а5+|) =а(а£ + Л;Л,Г'. (14.163)
574 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14 Пусть b?t = yt— atxav Да = (Д", ..., Д£), е = (ер ..., еА) и Etka = у —Atxa> где Et — матрица, образованная первыми/ строками единичной матрицы Е размерности (k X k). Положим г = еУ+а"1/2е*Да. Тогда М^г = М [afi + а\\ [бV + сГ1/2е*Да] = a^a + Д? = у,, Мб'г = М [AtQ + <х,/2£,Да] [вV + сГ1;Уда] = (14.164) = А1Ха + ЕДа=у\ Мтр=(аЕ+ AmtAtyl А]Щ*г = (аЕ + A\At)"x A]yf = х*. (14.165) Умножая (справа) на z левую и правую части (14.160), вычисляя затем математическое ожидание и принимая во внимание соотношения (14.164) и (14.165), находим, что *?+| = *? + a , f "'+' . (УШ - at+tf), *« = 0. (14.166) a Tflf+iY*fl/+i В силу леммы (14.10) существует . llmt-E-AfA, (-у,). Поскольку rang A = 6, то at+ly*a*t+{ > 0 при всех <х>0, что вытекает из (14.163) и теоремы 14.4. Поэтому в (14.161) возможен предельный переход при а | 0, что дает для yt = lim y^ а ^ 0 уравнение Y*+i = Y,- YA*+,K+,Y^;+,r1 ^+iY„ Y0 = f. Наконец, совершая в (14.166) предельный переход по а 10, получаем в силу (14.156) требуемое уравнение (14.140). Теорема доказана. Замечание. Система рекуррентных соотношений (14.166), (14.161) при а > 0 справедлива и для случая k > п, rang А <! м. Таким образом, с помощью этой системы отыскиваются векторы х% = (сс£ + А*А) А*у->А+у для матрицы А^хп) ранга r^m\n(k, n) (см. лемму 14.10),
ГЛАВА 15 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ § 1. Винеровский процесс в широком смысле 1. В предыдущей главе при отыскании оптимальных линейных оценок для стационарных последовательностей с дробно- рациональным спектром был использован часто применяемый в теории вероятностей принцип взаимосвязи между свойствами «в широком» и «в узком» смысле. Применительно к исследованному случаю этот принцип состоял в том, что для построения оптимальной (в среднеквадратическом смысле) линейной оценки достаточно было рассмотреть лишь случай гауссовских последовательностей (лемма 14.1). Этот принцип будет применен ниже и в задачах линейного оценивания процессов с непрерывным временем. Полезным при этом оказывается введение в рассмотрение понятия винеровского процесса в широком смысле. 2. Определение 1. Измеримый случайный процесс W = (Wt), t^Oy заданный на вероятностном пространстве (Q, &~, Р), называется винеровским процессом в широком смысле, если Г0 = 0 (Р-п. н.), М№, = 0, />0, (15.1) MWtWs = tAs. Ясно, что всякий винеровский процесс является в то же время винеровским и в широком смысле. Другим примером винеровского процесса в широком смысле является процесс Wt = nt — ty (15.2) где П = (щ), t^Oy — пуассоновский процесс с Р (я0 = 0) = 1 и Р (я, = *) = *-'■£. Пусть yt, t^Oy — неубывающее семейство а-подалгебр ЗГ', z = (zt)2Tt)y t^0, — винеровский процесс и а = (аДсо), !Ft)t
576 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 1$ /^0, — некоторый процесс с Ma2t(a>)> О, 0</<7\ Тогда процесс t Wt = Г l/g^L dzsy 0 < / < 7\ (15.3) является еще одним примером винеровского процесса в широком смысле. Заметим, что этот процесс имеет Р-п. н. непрерывную модификацию. Из определения ясно, что винеровский процесс в широком смысле есть процесс с ортогональными приращениями, т. е. mwu-wu][wS2-ws] = b, если s{ < s2 < tx < f2- Пусть (D(dX)y — oo < Я< оо, — ортогональная спектральная мера с МФ(^Я) = 0, М| Ф (dX) ^ = —. Из спектральной теории стационарных процессов известно, что для каждой измеримой функции ф(Я) такой, что оо ]*1Ф(Л)р<а<оо, — оо можно определить стохастический интеграл *) оо /(Ф, Ф)= |<р(А,)Ф(<И,), — оо обладающий следующими двумя важными свойствами: М |ф(Л)Ф(^) = 0, (15.4) М |ф,(Я,)Ф(^) \щ(Х)Ф{й%) = ^- J Ф1 (А.)ф2(Я.) ^Я.. (15.5) *) Этот интеграл есть предел (в среднем квадратическом) очевидным образом определяемых интегралов /(фя, Ф) от простых функций - фя (Я), оо п = 1, 2, ..., таких, что Г | qp (Я) — ф„ (Я) |2 d\ -> 0, л -» оо (ср. с конструк- — оо цией интеграла Ито в § 2 гл. 4).
§ 1] ВИНЕРОВСКИЙ ПРОЦЕСС В ШИРОКОМ СМЫСЛЕ 577 Лемма 15.1. Случайный процесс оо — оо является винеровским процессом в широком смысле. Доказательство. Не очевидным является лишь свойство MWsWt = s At. Для его проверки обозначим ti = (tu t2), д' = (s,, s2) два непересекающихся интервала. Тогда М [Wu-Wt][WSl-Ws] = M [Wtt-Wt][Wai- WSl] = оо — оо Но если \ 1, /еЛ, *а(')={ О, /<£Д, то в силу равенства Парсеваля оо оо — ОО —00 Поэтому М [Wu- Г*,] [WS2- WSl] = 0. (15.7) Аналогично доказывается, что ОО M[Wt2-Wuf= j(%A(t)fdt=t2-tv (15.8) — 00 Из (15.7), (15.8) следует, что рассматриваемый процесс является процессом с некоррелированными приращениями и с MW2t = t> Поэтому, если t > s, то МWtWs = М [Wt — Ws + Ws] Ws = MW\ = s = / Л s. Точно так же и при К $ MWtWs = tAs. Лемма доказана. Для дальнейшего полезно заметить, что если винеровский процесс в широком смысле Wt, i^O, является гауссовским, то у него существует непрерывная модификация, являющаяся процессом броуновского движения. Действительно, в силу гаус- совости М [Wt - Wsf = 3 (М [Wt - Ws]2)2 = 3\t — s\2. Поэтому по
578 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ 15 критерию Колмогорова (теорема 1.10) рассматриваемый процесс имеет непрерывную модификацию, являющуюся по определению (см. § 4 гл. 1) процессом броуновского движения. 3. Пусть детерминированная (измеримая) функция f(t)^ ei2[0, Г], По винеровскому процессу в широком смысле W = (Wt), /^0, можно определить стохастический интеграл Ито (в широком смысле) IrW=jf(s)dW99 (15.9) о положив по определению /r(f) = l.i.m.S/n(4n>)f^(n) -Wm], (15.10) ft к L&4*' я J где fn(t)-простые функции (М0 = Щя)) Для ^<*<^1и 0 = ton) < t\n) < ... <t{n] = Г), обладающие тем свойством, что т Нш f [/Ю-М*)РЛ = 0. (15.11) п о Так определенный интеграл обладает следующими свойствами (ср. с п. 5 § 2 гл. 4): IT{af{ + bf2) = aIT{fx)+bIT{h)\ a, 6 = const, f,e=L2[0, Г], (15.12) * и t $f(s)dWs~\f(s)dWs+jf(s)dWs, (15.13) 0 0 и где t т $f(s)dWs=jf(s)%{Utt}(s)dWs, (15.14) и 0 а %[ut](s) — характеристическая функция множества w<s</. непрерывен по t в среднем квадра- о тическом, t М \f(s)dWs = 09 (15.15) о t t t М J h(s)dWsj f2(s)dWs= J h(s)f2(s)ds, UeL2[0tT]. (15.16)
§ 1) ВИНЕРОВСКИй ПРОЦЕСС В ШИРОКОМ СМЫСЛЕ т т 579 Если*) \\g{s)\ds<ooi jf2(s)ds< oo, то о о t t t / s \ jg(s)dsjf(s)dWs=l[jg(u)du\f(s)dWs + + jnf(u)dWu)g(s)ds. (15.17) Существование интеграла (15.9) и сформулированные свойства проверяются так же, как и в случае стохастического интеграла Ито по винеровскому процессу (§ 2 гл. 4). 4. Пусть a (t)> b(t), f(t)> *< Г,— измеримые (детерминированные) функции такие, что Положим j\a(t)\dt<oo, J b2(t)dt < oo, о о т l(\f(t)a(t)\ + \f(t)b(t)f)dt<<x>. 3 t t lt= J a(s)ds+ j b(s)dWs, (15.18) (15.19) (15.20) где WSi s^O, — винеровский процесс в широком смысле. По этому процессу можно определить интеграл J f(s)dls положив jf(s)dts = U.m.%fn(W)\lt{m -Ы, (15.21) *) Последний интеграл в (15.17) существует в силу теоремы Фубини и неравенства М Т\ s I Т / Г s ~|2\ 1/2 J/ f(u)dWu\\g(s)\ds^ j |М J/OOdlpJ \g(s)\ds = о I о I о \ U J / Т / s \1/2 -J f /*(«)<*«) |ff(s)| о \6 / ds< oo.
580 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 где fn{t) — последовательность простых функций таких, что т Пш ([\a(t)\\f(t)-fn(t)\ + b2(t)\f(t)-fn(t)\2]dt = 0. п о t Так определенные интегралы \f(s)dls являются #"|-измери- о мыми и обладают тем свойством, что Р-п. н. t t t J /(s) dls = j f (s)a(s)ds + J f (s)b(s)dWs, 0<* < T. (15.22) 60 о (Ср. с п. 11 § 2 гл. 4.) • 5. Пусть v = (v,), t^0y — процесс с ортогональными приращениями, с M(v, — vs) = 0 и t M(vt-vs)2= j a2(u)du9 (15.23) T где J a2(u)du < oo. Для детерминированных (измеримых) функ- о ций f(t), удовлетворяющих условию т J a2(u)f2(u)du<oof (15.24) о также может быть определен стохастический интеграл т J f(s)dvs (15.25) о как предел (в среднем квадратическом) соответствующих интегральных сумм Sfn(^rt))[vs(n) — v5(n)1 при я->оо, где последовательность простых функций fn(s) такова, что т j\fn(s)-f(s)?a2(s)ds->0y л-*оо. о Корректность такого определения устанавливается так же, как и в случае стохастических интегралов, по квадратично интегрируемому мартингалу *), для которого соответствующий *) Полезно заметить, что всякий квадратично интегрируемый мартингал является процессом с ортогональными приращениями.
§ 1] ВИНЕРОВСКИЙ ПРОЦЕСС В ШИРОКОМ СМЫСЛЕ 581 натуральный и возрастающий процесс является абсолютно непрерывным с вероятностью 1 (см. теорему 5.10). Отметим два полезных свойства интеграла (15.25): т М $ f(s)dvs = 0, (15.26) о т т т М J f, (s) dvs J U (s) dvs ^jh (s) f2 (s) a2 (s) ds (15.27) 0 0 0 предполагается, что f2.(s)a2(s)ds < oo, /=1, 2 1. В том случае, когда рассматриваемый процесс v = (v,), /^0, является к тому же мартингалом, а а2(и)>0, О^и^Т, как показано в теореме 5.12, процесс t 0 является процессом броуновского движения. Отказ от предположения мартингальности приводит к следующему результату. Лемма 15.2. Пусть v = (vt), t^0> — процесс с ортогональными приращениями, М (v, — vs) = 0, t ■ M(vt-vs)2 = | a2(u)du. s T Тогда, если inf а2 (и) > 0, | a2(u)du < oo, то процесс *) 0<и<Г Q Wl <~J a t dvs (s) 0 является винеровским процессом в широком смысле, t т *) Как обычно, —7-r== Ms<t)—гт- ' J a (s) J x ^ ' a{s) о о
582 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 Доказательство. Ясно, что МWt = 0, MWt = t. Наконец, в силу (15.27) 0 0 0 0 tVs I что и доказывает лемму. 6. Пусть детерминированные (измеримые) функции a0(t), а{ (0, b (t) таковы, что т т JlM0l<ft<«>, jb2(t)dt<oo. (15.29) о о Рассмотрим линейное уравнение t e t xt = x0+ l[a0(s) + a[(s)xs]ds+ \ b(s)dWSi (15.30) где W = (WS), s^O, — винеровский процесс в широком смысле, а х0 — некоррелированная с ним случайная величина с Mxj* < оо. (Как и в случае винеровского процесса, уравнение (15.30) будем символически записывать в виде dxt = [a0 (t) + аг (t) xt] dt + + b(t)dWt.) Если W = (WS), s^0, является винеровским процессом, то согласно теореме 4.10 у уравнения (15.30/ существует единственное непрерывное (Р-п. н.) решение, задаваемое формулой xt = ехр I Г ах (и) dui<x0+ f exp — J а{ (и) du I о J ( о L о + ] ехр — | а{ (и) du а0 (s) ds + I b(s)dW8\. (15.31) Стохастический интеграл, входящий в правую часть (15.31), определен и для винеровского процесса в широком смысле. Равенство (15.31) в случае винеровского процесса Ws справедливо также в среднеквадратичном смысле. Поэтому оно справедливо в среднеквадратичном смысле и тогда, когда Ws является винеровским процессом в широком смысле, что доказывает существование решения уравнения (15.30) с винеровским процессом в широком смысле, задаваемого представле-
§ 1] ВИНЕРОВСКИЙ ПРОЦЕСС В ШИРОКОМ СМЫСЛЕ 583 нием (15.31). При этом нетрудно убедиться, используя свойство (15.17), что процесс хи 0</<Г, непрерывен в среднем ква- дратическом. Пусть уь 0 < t < 7\ — другое такое же решение уравнения (15.30). Тогда b.t — xt — \ju 0</<7\ удовлетворяет уравнению Л/ = j* ах (s) Л5 ds и, следовательно, является непрерывным Р-п. н. процессом, откуда |А*К j\a{(s)\\bs\ds и по лемме 4.13 As = 0 (Р-п. н.), 0</<7\ Поэтому Р{ sup \xt-yt\>0} = 0. Пусть теперь W = (WU ..., Wn) — я-мерный винеровский процесс в широком смысле (каждый из процессов Wi = {Wi(t))> t^Oy l=l9 ..., fly является винеровским в широком смысле, и компоненты Wiy Wj при / Ф j некоррелированы). Пусть заданы случайный вектор х0 = {х{ (0), ..., хп (0)), некоррелированный п с W, 2Мл;2(0)<оо, вектор-функция a0(t) = (a0(t)y ..., aon(t)) и матрицы al(t) = \\a\i(t)\\y b(t)=\\bif(t)\\ размерности (пХп). Будем предполагать также, что для элементов aQ.(t)y a|7(/), btj{t) выполнены соответствующие условия (15.29). Тогда, как и в случае л=?1, уравнение t t xt = x0+\ [a0(s) + al(s)xs] + J b(s)dWs (15.32) о о имеет единственное непрерывное в среднем квадратическом решение xt = (xi(t), ..., xn(t))> задаваемое формулой xt = OS Uo + J (Фо) ' ao (s) ds+ J (Ф50) ' b (s) dWs , (15.33) ( о о J где Фо — фундаментальная матрица, dot * л -j=»iiW< Ф°о = Ет. (15.34) Для рассматриваемого процесса xt обозначим «,= M% Г(/, s) = = М (х, - щ) (xs - nt)\ Г, = Г (t, t).
584 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 Теорема 15.1. Вектор п, и матрица Tt являются решениями дифференциальных уравнений ^- = a0(t) + ai(t)nt, (15.35) £f- = a, (t) Tt + I>;(0 + b{t) b'(t). (15.36) Матрица T(t, s) задается формулой f Ф*Г5) t>s, T{t, s = , (15.37) где ф1 = фЦф1)~\ t>s. Доказательство. Уравнение (15.35) получается усреднением обеих частей в (15.32). При этом из (15.33) вытекает, что решение уравнения (15.35) определяется формулой щ =Ф0 I no + f (Фо)"' «о (s) ds . (15.38) I о J Далее, пусть V, — x, — nt. Тогда из (15.33) и (15.38) вытекает, что Vt = Фо \v0 + f (ФоТ' Ь (s) dWs!, (15.39) I о ) откуда в силу некоррелированности х0 и W получаем Tt = MVtV*t = = Фо МV0Vl + М J (<Dg)~' Ь (s) dWs I J" (Фо8)"' Ь (s) dwA \ (Фо)*. Поскольку компоненты процесса W некоррелированы, то по свойствам (15.15) и (15.16) М J (ФоТ' Ь (s) dWs I j (<D5)~' Ь (s) dWs) = t = /(Ф§)"Ч(5)&'(5)[(ФоГТ^. о Следовательно, Tt = ФЪ Го + f Ы)~] Ь (s) Ь* (s) [(Фо5) ']* <М Ю*. I 6 J
§ J] ВИНЕРОВСКИЙ ПРОЦЕСС В ШИРОКОМ СМЫСЛЕ 585 Дифференцируя правую часть этого соотношения и учитывая (15.34), приходим к требуемому уравнению (15.36). Установим теперь формулу (15.37). Пусть t^s. Тогда Г0, s) = MVtV) = ol{MVoVl + + м [ J (ФоГ' ь (и) dwa] [/ %{s>u) К)~' ь (и) dw^ (aff = = Ф*Фо Го + f (ФоТ' Ь (и) Ь* (и) (Фо"Г du \ (<ttif = Ф<Г5. ( о J Аналогично проверяется справедливость и второй части формулы (15.37) для /^s. Теорема доказана. 7. Для процесса xt9 0<f<7\ удовлетворяющего уравнению (15.30), обозначим для t>s R(t9 s) = T(t, 5)Г5+. Пусть s < и <t. Покажем, что тогда #(/, s) = R(t9 u)R(u, s). (15.40) Для доказательства этого соотношения достаточно считать, что л;0 = 0, a0(s) = 0, a WS есть винеровский процесс. Тогда из теоремы о нормальной корреляции (теорема 13.1) вытекает, что M(xt\xu) = R(t9 и)хи. Из формулы (15.33) следует, что процесс xt является марковским и, в частности, М (xt \.xS9 xu) = М (xt | хи) (Р-п. н.). Следовательно, M(xt — R (t, и) хи | х3, хи) = 0, и, значит, М (xtxlrt - R (/, и) хих)гТ) = 0, что и доказывает соотношение (15.40). Итак, для процесса хь O^t^T, удовлетворяющего уравнению (15.32), функция R(t, s) удовлетворяет соотношению (15.40). Справедлив в определенном смысле и обратный результат. Теорема 15.2. Пусть x = {xl (t), ..., xn(t))9 0<f<7\ — случайный процесс с заданными первыми двумя моментами nt = Mxt, Г (/, s) = М [(х( — nt) (xs — ns)]. Предположим, что
586 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 матрица R(t, s) = T(tt s)Tf удовлетворяет соотношению (15.40) и выполнены следующие предположения: 1) существуют вектор aQ(t) и матрицы a{(t) и B(f) такие, что их элементы принадлежат LJ0, Т]\ 2) элементы матриц R (t, s) непрерывны по t(t > s), и t R (t9 s) = R (s, s) + J fli (u) R (и, s) du; s 3) элементы матриц Ft = Г (t, t) непрерывны и t t Г/ = Го+ \[ai(u)Tu + ruai(u)]du+ J B(u)du\ о о 4) элементы вектора щ непрерывны по t9 и Щ = Щ + J [а0 (и) + а{ (и) пи] du. Тогда найдется винеровский в широком смысле процесс Wt = {Wl (0, ..., Wn(t)) такой, что Р-п.н. для всех t, 0</<7\ t t xt = x0+ j [a0(s) + ax (s)xs]ds+ j Bm(s)dWs. (15.41) о о Доказательство. Пусть Wti 0 </< T9 — некоторый /i-мерный винеровский процесс в широком смысле и х0 — м-мер- ный вектор, имеющий те же два первых момента, что и х0> и не зависящий от Wu O^t^T. Предположим, что для почти всех 0 ^ s ^ T матрицы В (s) неотрицательно определены. Пусть процесс хи 0^/^Г, есть решение уравнения (п. 6) t t %t = *о + J [a, (s) + ax (s)xs] ds + j B[/2.(e) dWs. о о Тогда в силу теоремы 15.1 и сделанных предположений 1)—4) первые два момента у процессов xt и xt совпадают. Следовательно, совпадают первые два момента и у процессов t vt = xt — x0— J [a0(s) + а{ (s)xs]ds, (15.42) v, = xt — x0 — J* [a0 (s) + ax (s) xs) ds,
§ 1] ВИНЕРОВСКИЙ ПРОЦЕСС В ШИРОКОМ СМЫСЛЕ 587 t Но vf= Blf2(s)dWs является процессом с ортогональными при- о ращениями, а значит, таковым же является и процесс vh 0 ^ Если матрицы B(t) положительно определены для почти всех 0 ^ t ^ Г, то процесс t Wt=JB-ll2(s)dvs О по многомерному варианту леммы 15.2 является винеровским в широком смысле. Поэтому v* = \Bx,2(s)dWs, что вместе о с (15.42) доказывает в этом случае представление (15.41). Если матрицы B(t) для почти всех 0^/ ^Г неотрицательно определенные, то надо положить Wt - / [В1/2 (s)]+ dvs +j[E- (В1'2 (s))+ (в"2 (5))] dzs, о о где гь 0 < / ^ Г, — некоторый м-мерный винеровский процесс в широком смысле, некоррелированный с исходным процессом хи 0 ^ t <! Г. (Такой процесс существует, если исходное вероятностное пространство достаточно «богатое»). Тогда, как и в лемме 10.4, показывается, что так определенный процесс Wti O^t^Г, является винеровским в широком смысле. Покажем теперь, что сделанное предположение о неотрицательной определенности матриц В (t) (для почти всех 0 ^ t ^ Т) есть следствие условий 2), 3), входящих в формулировку теоремы. Поскольку свойства матриц B(t) зависят лишь от свойств первых двух моментов процесса хь О^^Г, то без ограничения общности можно считать этот процесс гауссовским. Тогда по теореме о нормальной корреляции матрица Г (t + Д, / + Д) - Г (t + Д, t) Г+(Л t) ГЦ + Д, 0, 0 < t < t + Д < Г, является симметрической и неотрицательно определенной. По свойствам псевдообратных матриц (§ 1 гл. 14) Г+ (U t) = Г+ (t, t) Г (/, t) Г+ (tt /), (Г+ (/, t)Y = (Г (*, t)f = Г+ (*, t). Поэтому матрица Г(/ + А, < + А)-Г(/ + Д, t)r+(t,t)T(t, t)(T+(t, t)YX ХГ*(/+Д, *) = Г(* + Д, t + b)-R(t + H, t)T(t, /)/Г(/ + А. t) (15.43)
588 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 также симметрическая и неотрицательно определенная. Из (12.43), 2), 3) и формулы Г (ц, /) Г+ (t, t)T(t, t) = T(u, t), u^ t (см. доказательство теоремы 13.1), после простых преобразований находим, что B(t) = \\mUT(t + ^ / + Д)-/?(*+Д, t)T(t, t)R*(t + b, t)} (для почти всех t, 0 <! t ^ Г). Следовательно, матрицы В (t) для почти всех / являются неотрицательно определенными. Теорема доказана. Пример. Пусть W = (Wt)9 О < t < 1, — винеровский процесс в широком смысле и lt = wx-t + wf (т.е. dlt = Wxdt + dWu Бо = 0). Используя доказанную теорему, покажем, что найдется такой винеровский процесс в широком смысле Wu 0^/<!l, что (Р-п. н.) о (ср. с теоремой 7.12). Действительно, в рассматриваемом случае М^^О, Г (/, s) = — Mlth = 3fc + t A s. Отсюда для t^s >0 получаем Pit ~\— sts + s — 3t + ! * V* S) ~ Ss2 + s ~ 3s + 1 ' Эта функция удовлетворяет условию (15.40), и легко найти, что Oo(0-0f а1(/) = т-5—, 5(0-1. Заметим, что в рассматриваемом случае величины Wt являются ^-измеримыми для всех /, 0</<1. § 2. Оптимальная линейная фильтрация некоторых классов нестационарных процессов 1. Пусть Wx = (Wn, ..., Wlk)nW2 = (W2U ..., Г2/)-некор- релированные между собой винеравские процессы в широком смысле. Будем рассматривать случайный процесс (9, £) = = [fy> It], t > 0, компоненты которого 8/ = [0! (t), ..., Qk (/)] и £f = [£i(/),..., li(t)]t t^0y подчиняются системе стохастических уравнений dQt = [а0 (t) + fli (0 9, + a2 (t) h] dt + b{ (t) dWx (t) + b2 (t) dW2 (t), 1 dlt = [A0(t)+ A{(t)et + az(t)tt]dt + Bl(t)dWl(t) + B2(t)dW2(t) J (15.44)
§ 2] ФИЛЬТРАЦИЯ НЕСТАЦИОНАРНЫХ ПРОЦЕССОВ 589 с коэффициентами, удовлетворяющими условиям из п. 1 § 3 гл. 10. Предположим также, что вектор начальных значений (90, £о) некоррелирован с процессами Wh W2i причем М (бобо + Используя результаты десятой главы, построим оптимальные (в среднеквадратическом смысле) линейные оценки ненаблюдаемой компоненты 9, по наблюдениям |o = {L> s^/}. Определение. Будем говорить, что вектор Xt=[X{ (t, £), ... ..., Xk (t> Q] является линейной оценкой вектора 9^ по go, если величины Яу(/, I) принадлежат*) замкнутому линейному многообразию, порожденному величинами |5, s^f; /=1, ..., k. Линейная оценка ht = [X{ (ty £), ..., Xk (/, £)] будет называться оптимальной, если для любой другой линейной оценки %t = = [ldU E), .... U(U I)] М [в, (t) - кj {U I)? < М [ву (t) - lf {t, Е)]2, У = 1, ..., k. Заметим, что величина Xj(ty l) часто обозначается также М (Qj(t)\@'T) и называется условным математическим ожиданием в широком смысле случайной величины Qj(t) относительно а-алгебры &). 2. Теорема 15.3. Оптимальная линейная оценка Xt вектора 9/ по наблюдениям go определяется из системы уравнений dU = [ао (t) + ax (t) U + Я2 (t) h] dt + [(b о В) (t) + ytA\ (/)] X X (В о ВГ1 (t)[dlt- (А0(0 + Ax(t) h + A2(t) lt) dt\ (15.45) yt = ax (t) yt + Y/fli (0 + (b ob) (t) — - [(b о В) (t) + ytA\ (t)} (В о В)""1 (t) [(bo В) (t) + ytA\ (*)]* (15.46) с Яо=М90 + соу(90, £o)cov+(£, y(Eo-Mgo). (15.47) Yo = cov(90, 90)-cov(90, £o)cov+(£o> У cov*(90, £0). (15.48) При этом yt = M [(9, — Я*) (9, — Xt)*b Доказательство. Пусть (fy, У, t>0, — гауссовский процесс, удовлетворяющий системе (15.44), где вместо процессов (Wu W2) рассматриваются независимые между собой вине- ровские процессы (Wx W2). Предположим, что первые два момента у (ё0> 1о) те же> что и У вектора (90, £0), и (ё0, 1о) не зависит от процессов (Wi9 W2). Обозначим и = м (s, I #1), yt = м [(б, - h) (е, - иП *) В смысле сходимости в среднем квадратическом.
590 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 Тогда согласно теореме 10.3 lt и yt удовлетворяют системе уравнений (15.45), (15.46) с заменой \t на %и lt на %ь причем yt = yft Из (15.45) следует, что оценка Xf является линейной (ср. с представлением (15.33)). Покажем теперь, что оценка Xt является оптимальной. Пусть qj{t, g) — некоторая линейная оценка Qj(t) no ^ и q{jn)(t, g)— последовательность линейных оценок от g (tt), ... 'о t ГПл т{п) — \Ап) №)\ т{п + \)_[М+\) ,(/2 + 1)1 • • •> \хпь гДе 1 —1*0 *«)ь/ — [to , ..., tn + \ J, */t <Г «■ 0, &п) =■ f, такая, что ^(M)=l.i.m.^»>(M). Положим If {t, g) = М (в/ (0 | #1, я), где &\п = а {о: g (я)> ... I Jo . .., |(ft)l, и обозначим A,(/n)(f, g) оценку, полученную из A/n)(f, g) ^ ) заменой величин | (П), ..., | (П> на g до, ..., g (л). По лемме 14.1 линейная оценка Л/Л,(*, g) является оптимальной линейной оценкой 9, по величинам g», ..., g/n), т. е. М [9; (0 - Л<"> (*, Щ < М [0, (0 - qf (t, |)]2. Но м [я/ (*, |) - %Т а, |)]2=м [l, (t, I) - ЭД4(t, i)]2. Так же, как и при доказательстве леммы 10.1, устанавливается, что НтМ[М', I) — Я/га) (^, I)]2 = 0. П Поэтому М [9; (0 - А,, (/, g)]2 = lira М [в, (0 - Xf (t, g)]2 < п < lim М [0, (0 - <7f > (*, i)]2 = М [в, (t) - q, (t, D]«, что и доказывает оптимальность оценки Xj(ty g), /=1,..., k. Замечание. Аналогичным образом проверяется, что оптимальные (в среднеквадратическом смысле) линейные оценки интерполяции и экстраполяции для процесса (9/, g,), удовлетворяющего системе (15.44), могут быть получены из соответствующих оценок для случая гауссовского процесса (9„ %t). 3. Приведем два примера, иллюстрирующих возможности применения теоремы 15.3. Эти примеры поучительны в том отношении, что рассматриваемые в них процессы задаются
§ 2] ФИЛЬТРАЦИЯ НЕСТАЦИОНАРНЫХ ПРОЦЕССОВ 591 в виде системы уравнений, не совпадающей с рассмотренной выше системой (15.44). Пример 1. Пусть yt и 2, —независимые между собой винеровские процессы. Рассмотрим процесс (0„ £,), /^0, удовлетворяющий системе стохастических уравнений dOt=-Btdt + (l+Qt)dyt dit = etdt + dzt, (15,49) где g0 = 0, а 90 —случайная величина, не зависящая от вине- ровских процессов yt9 zu />0, с M90 = m, M (90 — mf = у > 0. Положим t Wx (t) = f / l + Qs dys, W2 {t) = zt. i VM(i+e,)2 *» 2W t * Эти два процесса являются некоррелированными между собой винеровскими процессами в широком смысле, и dQt = -в, dt + V М (1 + Qt)2dW1 (0, db = Qtdt + dWa(1). (15,50) В отличие от (15.49), эта система является уже частным случаем исследованной системы (15.44). Поэтому по теореме 15.3 оптимальная линейная оценка Xt значений 0, по £j=(£s, s^/) и ошибка фильтрации yt—MlQt — hf определяются из уравнений dlt = —Xt dt + yt (dlt — Xt dt), Я0 = m, _ V--2Y, + M(l+e,)2-Y?, Yo = Y- Для полного решения задачи необходимо вычислить М(1+е,)2=1+2^ + Д, + ^, где nt=MQt, At = M(Qt — nt)2. Из (15.50) находим t nt = n0 — \ ns ds
592 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 и в силу формулы Ито Д, = М (8, - ntf = М (90 - по)2 — 2 J" (вв — nsfds + + J* (1 + %fds + 2 | (9S - ns) (1 + 9S) dys = 0 0 ' t t = A0-2JAsdS+ $(l+bs + 2ns + nl)ds. 0 0 Таким образом, оптимальная линейная оценка Xt и ошибка Y^ определяются из системы уравнений dXt = -kidt + yi(dli — btdt), V* 2Y# — Yf + 1 + А* + 2/f, +/if, (15>51) ht = — nu * А, = - А, + 1 + 2/i, + л?, где 10 = п0 = т, Yo = Ao = Y- Пример 2. Пусть снова yt и z, — независимые между собой винеровские процессы, а процесс (6,, У, t^O, определяется из уравнений dQt = — Qtdt + dyu dlt = -Q*dt + dzit (15'52) где ^0 = 0» a 90 —гауссовская случайная величина, М90 = 0, М0о = у, не зависящая от процессов yt и zt. Рассмотрим задачу линейного оценивания величин 9, и 9^ по gg=[£s, s<^}. Обозначим 9i(0 = 9/, 62 (/) = 9?. С помощью формулы Ито убеждаемся в том, что rf02 (t) = - 392 (/) dt + 39 j (0 dt + 39? (0 dyt. Итак, 9j (t) и 92(0 удовлетворяют системе стохастических уравнений dBl® = -Qi(f)dt + dyt9 d% (t) = l- 392 (0 + 39, (0] dt + 392 (t) dyt. ( } Обозначим t W1(t) = yt, W2(t) = V2 \ Ql(s)dys—^r, W3{t) = zt>
§ 3] ОЦЕНИВАНИЕ СТАЦИОНАРНЫХ ПРОЦЕССОВ 593 Нетрудно проверить, что Wx (t)9 W2(t) и W3(t) — некоррелированные между собой винеровские процессы в широком смысле. Следовательно, процессы 6{ (/), 92 (/) и |, удовлетворяют системе уравнений dBl(f) = -Bl(t)dt + d\V](t)9 dQ2 (t) = [- 392 (t) dt + 39, (t)] dt + jdW{ + y=- dW2 (0, (15.54) dh = Q2(t)dt + dWz(t), где g0 = 0, а вектор (9] (0), 92(0)) имеет следующие моменты: M9, (0) = М92 (0) = 0, М9? (О) = 1/2, M9i (О) 92 (0) = М904 = 3/4, ме22(0) = ме^=15/8. Система (15.54) является системой типа (15.44), и, следовательно, оптимальные линейные оценки для Q{(t) = Qt и 02(0 = 9? могут быть найдены из системы уравнений (15.45), (15.46). § 3. Линейное оценивание стационарных в широком смысле случайных процессов с дробно-рациональным спектром 1. Цель этого параграфа — показать, как теорема 15.3 может быть применена к построению оптимальных линейных оценок для процессов, указанных в заголовке. Соответствующие результаты для случайных последовательностей были рассмотрены в § 1 предыдущей главы. Пусть г\ = (%), — оо < t < оо, —действительный стационарный (в широком смысле) процесс, допускающий спектральное представление % где Ф(dk) — ортогональная спектральная мера, МФ(^Я) = 0, М | Ф (dX) J2 = -g-, Pn_, (z) = 2 bkzk, ' Q„ (z) = zn + 2 a*z*. а действительные части корней уравнения Qn(z) = 0 являются отрицательными. Рассмотрим процессы оо Т)/(/)= | e^tWl(iX)0(dX), /=1, .... п, (15.56) — оо где частотные характеристики Wj(z), /=1, ..., п> подобраны следующим специальным образом: WI(z) = z-{n-I)Wn(z) + n^^kz-ik-'i+]\ / = 1, ..., лг — 1, (15,57) k=i
"94 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 Wn (z) = - г""1 S akWk+x (z) + z'^n (15.58) k=0 p1=6n_1, Р/ = *я-/—SP/fl/i-ж» / = 2, ..., /г. (15.59) /*i Из (15.57), (15.58) следует, что Wf(z) = z->[Wi+l(z)+M /=1, .... я-1 Wn(z) = z-* [-З^аьФы (z) + p„] . Отсюда получаем Wt и, значит, (15.60) •я(г) = г-*\-% ak(z-<n-*-»Wn(z)+ 2J &*-<'"»)+pj . Wn(z)= P%Li(z)JQn(z)9 (15.61) где PjT2i(2) — полином степени не выше п. Тогда из (15.60), (15.61) получаем, что Wf(z)= P{tx{z)IQn{z), /=1. ..., д-1, (15.62) где полиномы Pj/Li(z) имеют степень не выше /г—1, причем в силу (15.59) Wx(*) = Pn-A№n(z). (15.63) Таким образом, процесс y\\(f) = x\ti t^O. Теорема 15.4. Стационарный в широком смысле процесс T)i(0 = fb допускающий спектральное представление (15.55), является компонентой n-мерного стационарного (в широком смысле) процесса f\t = (r]i(0> •••> Ля(0)» удовлетворяющего системе линейных стохастических уравнений dr)j(t) = 4!+i(t)dt + hdWti /=1, ..., д-1, /г-1 Ль (0 - - S ая/+1 (0 dt + prt dV, /-о с винеровским процессом в широком смысле (15.64) оо ,= J V^OW (15.65) W, и коэффициентами (31( ..., p„, задаваемыми формулами (15.59). При этом Mfy(0) У, = 0, />0, /=1, .,., /».
§ 3] ОЦЕНИВАНИЕ СТАЦИОНАРНЫХ ПРОЦЕССОВ 595 Для доказательства этой теоремы потребуется Лемма 15.3. Пусть W{z) — некоторая частотная ХараКТе- ристика с Г | W(iX)\2dX< оо и — оо 00 lt= \ elMW(iX)<S(dX), (15.66) — оо где 0(dX)— ортогональная спектральная мера с МФ(^Я) = 0, Ml Ф (ЙЯ) |2=~2—. Тогда с вероятностью 1 t \\ls\ds <oot /<oo, (15.67) о J Ъ ds = J вШ~ Х W (Ik) Ф (dk). (15.68) О —оо Доказательство. Интегрируемость | £s | вытекает из теоремы Фубини и оценки о t t * / ' \ 1/2 jMIC|ds<J(MC»)"2rfs<(/jMc;dsj = А-Ш J.r^WPdM <oo. t Итак, интеграл \ £,sds существует и в силу (15.66) о t t оо j^ds=j J eiXsW(iX)<D(dX)ds. (15.69) 0 0 -oo Покажем, что в правой части (15.69) возможна смена порядков интегрирования: t оо оо / t . J J e^sW(iX)0(dK)ds = J* (J eiXsds j W(iX)Q>(dK). (15.70) 0 —oo —oo \0 oo Пусть функция ф(Я) такова, что [ | ф(Я) \2dX < оо. Тогда
596 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 в силу (15.5) и теоремы Фубини t оо оо М Г J" eiXsW (iX) Ф (dX) ds J ф (X) Ф (dX) = О —оо —оо t оо оо / t \ = 2^-J Je'**Wr(/X)f(A,)^ds = -gr | П eil°ds]W(ik)ql(X)dX= О —оо —оо \() • оо / t \ оо = м j| J в'*» c?s I w (а) ф (<a) • J ф (я,) ф (йя,), — оо *0 / —оо что в силу произвольности ф(Я) и доказывает (15.70). Для завершения доказательства осталось лишь заметить, t еш — 1 Г что :т—= eilsds. о 2. Доказательство теоремы 15.4. Ясно, что оо Л/(')-Ч/(0)= J И'-ЦГ/ДОФ^), /=1, .... «-1, — оо и согласно (15.60) оо оо (0 — Л/ (0) = j ~^LWl+l(^)<^(dX)-h^l J-£^=±ф(</я,). Л/ — 00 (15.71) По лемме 15.3 ( 00 J *'" ~ ' Г/+1 W Ф (dA) = / J e'^z+i (iX) Ф (Л) rfs = — оо 0 -оо t -J лж (*)<**. <15-72) о а по лемме 15.1 процесс оо Wt = j* *'" ~ ' Ф (<*Л) (15.73) — оо является винеровским в широком смысле. Поэтому из (15.71) — (15.73) для t>s получаем t Чу (0 - Л/ («) = j Лж Ж" + $t\Wt ~ wsi /= ! « - 1»
§ 3] ОЦЕНИВАНИЕ СТАЦИОНАРНЫХ ПРОЦЕССОВ 597 что символически было условлено записывать в таком виде: d4J(t) = r]l+ldt + $jdWt. Аналогичным образом устанавливается и последнее уравнение в системе (15.64). Проверим теперь некоррелированность величин т]/ (0) и Wt для t^O и /=1, ..., п. Для этого запишем систему (15.64) в матричной форме dr\t = Ar\tdt + BdWt (15.74) с матрицами /0 1 0 ... 0 \ *- .?..°.:•.■:.°. • »-(•*•)• \—а0 -а, ... — ая_,/ Р/г Заметим, что система уравнений (15.74) остается справедливой и для t^T (7\< 0), если вместо Wt рассматривать вине- ровский процесс в широком смысле wt(T)= J а ф№ (15-75) — оо т. е. о fj0 = fjr+ J Ai\udu + BW0(T). т Но MWtW0(T) — 0 (см. в лемме 15.1 равенство Парсеваля). о Значит, Mf\0Wt = Mr\TWt+ \ AMr\uWtdu. Решая это уравнение т (относительно Mr\TWt, Г^О), находим что Mr\0Wt = e~ATM4TWt. (15.76) Собственные числа матрицы А лежат в левой полуплоскости, а элементы вектора Mr\TWt ограничены величинами, не зависящими от Г. Поэтому lim Mr\0Wt = 0. Для завершения доказательства осталось лишь показать, что процесс fj, является стационарным в широком смысле (для моментов t^O). Из (15.56) вытекает, что Mfj,==0. Далее, в соответствии с теоремой 15.1 матрица r/ = MfjffjJe является решением дифференциального уравнения f, = A?t + ГУТ + ВВ\ (15.77)
598 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 Опять же из представления (15.56) видно, что матрицы Г, не зависят от t. Обозначим Г = Г,. Тогда матрица Г удовлетворяет системе алгебраических уравнений АТ + ТА* + ВВ* = 0. (15.78) Используя уравнение (15.77) и тот факт, что собственные числа матрицы А лежат в левой полуплоскости, нетрудно показать, что решение системы (15.78) единственно и задается формулой о Г= J e-AuBB*e~A*udu. (15.79) — оо Наконец, из (15.74) следует, что матрица Г(/, s) = Mf),fj* задается формулой (eA(t-s)Y t>S ГС*) = |Ге№; SJ,' (15-80) Этим показано, что процесс fj„ t^0> является стационарным в широком смысле. 3. Рассмотрим частично наблюдаемый стационарный в широком смысле процесс v, = (9„ &) = [(9, (0, ..., 9* (0)> (1\ (0, • • • • • •> Е/(0)]> ~~ °° < * < °°> допускающий спектральное представление оо v,= J* eatW(iX)0(dX), (15.81) — оо где W(z)— матрица размерности (k + I) X п с элементами Wrq (z) = P™-i (z)/Q™ (z), (15.82) где Pnq)-\ (z) и Qnf (z) — многочлены степени nrq — 1 и nrq соответственно, причем коэффициент при гПгя у QnQ) (z) равен единице, а корни уравнения Qnq)(z) = 0 лежат в левой полуплоскости. Мера Ф (dX) = (Ф{ (dX), ..., Ф„ (dX)) является векторной мерой с некоррелированными компонентами, МФ/ (dX)=0y М|ФУ(^)|2 = ^. Предполагается, что 9, является ненаблюдаемой компонентой, оцениваемой по наблюдениям gs, O^s^ Т. В случае t=T имеем задачу фильтрации, T^t — интерполяции,/^ Т — экстраполяции.
§ 3] ОЦЕНИВАНИЕ СТАЦИОНАРНЫХ ПРОЦЕССОВ 599 Рассмотрим для определенности лишь задачу оптимальной (в среднеквадратическом смысле) линейной фильтрации. Чтобы иметь возможность применить теорему 15.3, достаточно показать, что процесс v/ = (9/, £,), t^0y может быть представлен в виде компоненты процесса, удовлетворяющего системе уравнений типа (15.44). Используя теорему 15.4, находим, что вектор v, является компонентой вектора (9„ £,), имеющего размерность п N=£ l>nrqi (15.83) где nrq — степень знаменателя дроби Wrq(z), a nq — число несовпадающих элементов Wrq в столбце с номером q в матрице W (г). Ясно, что вектор 0, содержит все компоненты вектора 9,. Поэтому оценивание вектра 9/ решает заодно и задачу оценивания вектора 9,. В силу теоремы 15.4 (9,, £,), f>0, удовлетворяет системе стохастических уравнений dbt = [a A + a2h]dt + b dWt, ' L . 5' ^ ' (15.84) d$t = [A{Qt+A2tt]dt+BdWt с матричными коэффициентами соответствующих размерностей и векторным винеровским процессом в широком смысле Если матрица ВВ* является положительно определенной, то тогда возможно применение теоремы 15.3. В самом деле, для этого достаточно установить, что найдутся некоррелированные между собой винеровские процессы в широком смысле W{ (t) = (wn (о,..., wL n-t (/)), w2 (t) = {w2l (0,..:, w2l (t)) такие, что bWt = bxW{ (t) + b2W2 (/), BWt = BXWX (t) + B2W2(t). (15.85) Возможность такого представления доказывается так же, как ив лемме 10.4. При этом матрицы Ьи Ьъ Вх и В2 определяются из равенств Ьф* + Ь2К = ЬЬ\ Ь{В\ + Ь2В*2 = ЬВ\ В{В* + В2В*2 = ВВ\ (15.86) Замечание. Если матрица ВВ* вырождена, то, в соответствии с результатом § 4 гл. 10, имеется возможность получать линейные (неоптимальные) оценки для 9„ близкие в среднеквадратичном смысле к линейным оптимальным оценкам.
600 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 4. Приведем один пример, иллюстрирующий технику нахождения оптимальных линейных оценок. Пусть W{z) = Тогда z + a уъ о 2+а 2+Р а>0, р>0, с, >0, I =1,2. г— Г еш —-оо 00 ОО Если обозначить оо аш а + р Ф2(^), то ^ = 9^ + 4/ и задача оценивания 9, по gj = (gs, s</) есть обычная задача выделения «сигнала» 9, из смеси с «шумом» r\t. Согласно 15.4 найдутся некоррелированные между собой винеровские процессы в широком смысле Wx (t) и W2 (t) такие, что rfe, = - аВ tdt + V^dW{ (t), dx\t = - $r\tdt + V~% dW2 (t). Следовательно, для частично наблюдаемого процесса (9„ £,), t^O, справедлива система уравнений dBt=-aBtdt+V~xdW{ (*), d\t = [- (а - р) 9, - ffi J dt + VT{ dWx (t) + VT2dW2 (0. Применяя к этой системе теорему 15.3, находим, что оптимальная линейная оценка Xt и ее ошибка yt = М (9, — А,,)2 находятся из системы уравнений gi + v/(P-q) С\ + С2 [gi + Y/(P- ^Л/ = — ей/ d/ + Y/ = — 2ау, + С! a)]2 ■((p-aH.-pg,)*], (15.87) Найдем начальные условия Х0 и Yo = М (90 — Я0)2. По теореме 15.3 Мв0Бр_ t ., _ mq2 (MQogo)2 ** = ■ МБ? -lo> Y0 = M902- Mgg Обозначим rfu = МЭо, di2 = M9o!o> я?22 = М|о> £> = М2 а22
§3] ОЦЕНИВАНИЕ СТАЦИОНАРНЫХ ПРОЦЕССОВ 601 В силу (15.78) с AD + DA* + BB* = 0 Поэтому -а 0 \ _(УС\ 0 Л-'р-а -pj' В~\УТ{ V72 — 2adn -f сх = 0, (P-a)rf„-(P + a)dI2 + (?1 = 0> 2 (р - a) dl2 - 2pd22 + c{ + с2.= 0 и Итак, оптимальная линейная оценка 8, по gj={£s, s^/} находится из уравнений (15.87), решаемых при условиях Ло=ос2 + рс, ^ Yo=2o(a^+p£.l)- (15.88) Если оценивать 9, по £Lr = {£s, — Г<5<^}, где Г>0, то Xt, Y/ также определяются из системы (15.87) с Я_г = _£iE_ g Y = *'** , (15.89) 1 ac2 + Pci r y 2a(a£2 + Pci) Полагая Г->оо, из (15.87) и (15.89) нетрудно найти, что оптимальная линейная оценка Л, и ошибка оценивания У==М[Я, — 8J2 величины 8/ по gLoo = fts, —oo<s^.t] определяются из равенств h = 4t + j e-h ('-) [во - 6,62] Ь ds, где 60 = 6,0, fi^liL-^ta, б2 = б;(Р —a) + a, Y = p—^ . « Ф p, - ClC2 a = p. 2a (c, + c2) ' В частности, при a = p, т. е. когда «спектральные составы» сигнала и шума совпадают,
602 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 § 4. Сравнение оптимальных линейных и нелинейных оценок 1. Пусть 9,, t^ 0, — марковский процесс с двумя состояниями 0 и 1, Р(90=1)=я0, переходная вероятность которого Р\а(*> 5) = P(8/=l|8s = a), a = 0,1, удовлетворяет уравнению Колмогорова dPladttiS) = Л (1 - 2PIa (t9 s))t Я > 0, t > s. (15.90) Будем предполагать, что процесс 8„ называемый «телеграфным сигналом», ненаблюдаем, а наблюдению доступен процесс b=Je,ds+lF„ (15.91) о где Wt, t^O, — винеровский процесс, не зависящий от 9^, /!>0. На примере задачи фильтрации значений 9, по Ц = {£s, s^t) сравним качество оптимальных линейных и нелинейных оценок. Оптимальная (в среднеквадратическом смысле) нелинейная оценка щ величины 9, по |s, s^f, есть условное математическое ожидание щ = М (9/1 У)) = Р (О* = 11 У))- Согласно (9.86) щ9 t^O, является решением стохастического уравнения йщ = Я (1 — 2щ) dt + щ (1 — щ) {dlt — щ dt). (15.92) (Из этого уравнения, в частности, видно, что оптимальная оценка щ действительно является нелинейной.) Чтобы построить оптимальную линейную оценку \и достаточно рассмотреть задачу оптимальной фильтрации для про- цесса в, по значениям |s, s</, где |,= j Qsds + Wt, Wt — ne- о который винеровский процесс, а 8S — гауссовскии процесс, не зависящий от Wu t^O, и имеющий те же первые два момента, что и процесс 9„ ^0. Используя уравнение (15.90), стандартным путем находим, что nt = MQt удовлетворяет уравнению ^ = Л(1-2«,)( п0 = я0, (15.93) а корреляционная функция K(t, s) определяется из равенства K(t, s) = K(s, s) е-2*-1 *— l, где К (s, s) = М [в, - nsf = ns — л*. Решая уравнение (15.93), находим щ = -^[\ — (1 — 2по) е~ш1
§ 4] СРАВНЕНИЕ ОЦЕНОК 603 Следовательно, М (9, — nt)2 = К {U t) = -j[l —(I — 2щ)2 е~ш] и lim М(9,— я,)2 =1/4. f-»oo Нетрудно теперь заметить, что требуемый гауссовский процесс 9,, />0, имеющий MQt = nt и М (9, — nt)(Qs — ns) = K(ty s), можно построить как решение стохастического дифференциального уравнения dQt = X(l—2Bi)dt+V'bdWl(t)9 (15.94) где W{ (0 — некоторый винеровский процесс, не зависящий от Wt, />0 (см. также теорему 15.2). Тогда, обозначая W2{t) = Wt, получаем, что d\t = Qtdt + dW2(t). (15.95) Применяя к системе (15.94), (15.95) теорему 15.3, находим, что U = M(9/,|#i) и Y* = M(8* — h)2 удовлетворяют системе уравнений dXt = X(l —2Kt) dt + yt(dlt — ktdt), K = no> (15.96) Vt = ~4^ + X — yp Yo = % — nl- (15-97) Можно показать (см. также далее теорему 16.2), что существует limY/ = YW> причем y(t) является единственным по- ложительным решением уравнения у2{Х) + Ыу{%) — 'к = 0. (15.98) Поэтому и, значит, у(Я) = УМ-4Л2 ■ —2А,, (15.99) Ух +о (л), к \ о, У(*)={±_1_пШ и~ (15.100) + о(1), *!.<*>. 2. Найдем теперь величину 6(Х)= lim М(9,— щ)2 для опти- мальных нелинейных оценок щ, t^O. Согласно теореме 7.12 процесс W = {Wt, $F% />0, с t Wt = lt— j nsds (15.101) о является винеровским. Поэтому уравнение (15.92) может быть переписано в виде Ai, = А, (1 — 2я,)dt + щ(1— щ) dWt9 я0 = п0. (15.102)
604 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 Далее, поскольку М (8/ — я,)2 = Мя,(1 — я,), то для отыскания 6(1) надо уметь находить lim Мя,(1 —nt) для процесса я,, /^0, с дифференциалом (15.102). Согласно теореме 4.6 уравнение (15.102) имеет единственное сильное (#~Г-измеримое при каждом t^O) решение. Можно показать, что это решение является марковским процессом, одномерная плотность распределения которого q (г, х) = —' удовлетворяет прямому уравнению Колмогорова *>0. (15.103) В силу того, что процесс я,, t^0, является (в терминологии теории марковских процессов) возвратным и положительным *), 6Щ = lim Мя/(1 — щ) = lim \ x{\—x)q(t, x)dx существует и t -» оо t -> оо J 1 b(\)=^x(\—x)q(x)dx, (15.104) о где q(x) есть единственное вероятностное j q (х) ^ О, Г q(x)dx=l I решение уравнения -*-[l(l-2x)q(x)]=±-£T[x4l-x)2q(x)]. (15.105) Нетрудно найти, что это решение задается формулой ехр{-7ГгЬ)-} q{x)= , l *^~*> > *20-*)2 ш (15.106) Поэтому б(Я) = - fexpl- 2Я 1 '* 0 fexpf ?Я, \_*£. J Н\ д: (1 — дг) j *(1- И-йЬу) d* а:2(1 -*)2 *) См. леммы 9.3 и 9.4 в гл. 4 [157].
§4] СРАВНЕНИЕ ОЦЕНОК 605 или, в силу симметрии подынтегральных функций относительно точки х= 1/2, 1/2 dx 6(А,)= J ""г\ х(\-х)) х(\-х) (15.107) 1/Z J еХр(~ х(\-х)) _о 1/2 f ехр( 2А—\ dJL x)2 Исследуем Птб(Я). Делая в (15.107) замену переменных л:(1 — л:) находим, что 2Х i --/х + 8Я <fy у у + ш 6(А,) = - (15.108) ■8Л /.-/.£±Ь<, о Поскольку при 0 < с < оо ОО Л/< оо, то по теореме Лебега о мажорируемой сходимости (теорема 1.4) оо оо Hm f е-ут/У±Ы dy= Г e-vdy = \. Далее, оо 2х\е- dy Vv (У + 8Я) оо где d(X) = J* е-У ^ ■ 2Х Vv {у + 8Я,) 1 \е-У-г=Ш=+й{%) J fy(y + 8X) оо , d(0) = \imd(X)=*[ ■£?- dy<l. \-kCi J У Поэтому по теореме о среднем (е-1^с(Я)^1) 21 оо Г е~У-~ J Vv dy (У + 8А) 2Х 1 dy У У (У + 8А) + <*(Я)
606 ЛИНЕЙНОЕ ОЦЕНИВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ [ГЛ. 15 Но 1 Г dy ^ |n^[l , In 8 1п[2)Л+8Д + 2 + 8А,] 1 J Vv(y + M) L in л in л J' значит, 6 (я,) = - 2K In Я [с (А,) + О (-jji-)], Я | 0. (15.109) Подобно тому, как показывалось существование 1 lim Мя, (1 — щ)= \ х{1 — х) q (x) dxt t + oo J можно показать, что существуют lim M(l -2я,)2, lim Мя2(1 -я,)2, причем lim М(1-2яЛ2=4-Пт Мя2П—я,)2. (15.110) (Заметим, что к (15.110) можно было бы прийти следующим путем. Из (15.102) по формуле Ито получаем t t Я,(1 -Я,) = Я0(1 ~П0) + \ J (1 -27tsfds- J Я2(1 ~Я5)2Й5 + 0 0 t о Отсюда следует t t Mnt(l-nt) = n0(l-n0)i-lJM(l—2ns)Us—JMnl(l—ns)2dst о о или L tKdt ^ = Ш(1-2я,)2-Мя2(1-я,)2. (15.111) *\Млф(\-п,)] Но естественно ожидать, что lim —-—-\-. — = 0. Вместе с (15.111) это приводит к соотношению (15.110).) Замечая теперь, что (1 — 2х)2 =1 — 4х (1 — л:), из (15.110) получаем 11тМяД.-„,)-|-,™^<1р)1_1 + 0(1). (,5.П2)
§ 4J СРАВНЕНИЕ ОЦЕНОК gQ7 Итак, объединяя оценки (15.109) и (15.112), получаем \ -2Х\пК(с(Х) +О (-—)), Л|0, 6(*) = < , /п (15.113) [т + °(х)' И». Вместе с (15.100) для величины эффективности е(Я) = ^~- 0(A) оптимальной нелинейной оценки по отношению к оптимальной линейной оценке находим следующее выражение: 1 [l+o(l)L XJ0, е (Л): 2Vl\nl ' ' (15.114) 1+0(1), А, |оо. Отсюда видно, что при малых X (т. е. когда среднее время пребывания «телеграфного сигнала» в нулевом и единичном состояниях велико) линейный фильтр значительно «проигрывает» в среднеквадратической точности нелинейному. В случае же X \ со оба фильтра эквивалентны и работают одинаково «плохо»: 6(Л)~ lim M(Qt — nt)2 = Y, y{X)~ lim M(8, — л,)2 = j-, Л-мх>, т. е. дают при больших X ту же самую ошибку, что и «априорный» фильтр, для которого в качестве оценки величины 9, берется среднее значение nt. Поскольку lim M(Qt — nt)2 = -T при всех X > 0, то из (15.100) также видно, что при малом X оптимальный линейный фильтр работает «хорошо» (с точки зрения асимптотического «отслеживания» процесса 9, по сравнению с «априорным» фильтром) lim N/1(9,-Я,,)2 Однако в этих условиях (т. е. при малом X) нелинейный фильтр дает еще большую точность «отслеживания»: Это замечание отражает тот наблюдаемый в задачах фильтрации факт, что выигрыш, дистигаемый с помощью нелинейного фильтра, тем значительнее, чем выше точность «отслеживания», получаемая при применении оптимального линейного фильтра.
ГЛАВА 16 ПРИМЕНЕНИЕ УРАВНЕНИЙ ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ И ТЕОРИИ ИНФОРМАЦИИ § 1. Одна задача оптимального управления по неполным данным 1. В этом параграфе обобщаются на случай непрерывного времени результаты, полученные в § 3 гл. 14 для задачи управления (по неполным данным) линейной системой с квадратичным функционалом потерь. Будем предполагать, что частично наблюдаемый управляемый процесс (9, g) = [(91(0, ••., 6,(0); (ii(0> •••> £/(*))], 0< г^/^Г, задается стохастическими уравнениями dBi = [c(t)ui + a{t)Bg]dt + b(t)dWl(t)9 d\t = A (t) Qtdt + B (t) dW2 (t). ( ' Матрицы c(t)9 a(t)9 b(t), A(t)y B(t) имеют размерности (kXr), (k X &)> (^ X &)> {I X &), (l X /) соответственно, их элементы cij(t)> a//(0» bif(t), Aij(t)9 Bij(t) являются детерминированными функциями времени, причем k//WK'' \"it(t)\<c9 \bif(t)\<c9 т т J A2t,(t)dt <oo, J B2u{t)dt<°o о о при всех допустимых значениях /, /. Предполагается также, что элементы матриц (B(t)B*(t)yl равномерно ограничены. Входящие в (16.1) независимые винеровские процессы W{ = — (Wn{t)9...9Wlk(t))9 W2 = (W2l(t)9...9W2l(t))9 0<*<7\ не зависят от гауссовского вектора 80 (MQQ = m09 cov(80, B0) = y0)9 а £о = 0> Вектор ut = [ul(t9 |), ..., ur(t9 £)], входящий в (16.1), называется управляющим воздействием в момент времени /. Изме-
§ 1] ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ 609 римые процессы u^t, |), /=1, ..., /*, предполагаются такими, что T г M\%(uf(t,t))4t<oo, (16.2) 0 /=1 а величины uf(t> £) — ^-измеримыми. Управления u=(ut), O^t^T, для которых система уравнений (16.1) имеет единственное сильное решение и для которых выполнено условие (16.2), будут в дальнейшем называться допустимыми. 2. Чтобы сформулировать цель управления, введем в рассмотрение функционал потерь. Пусть Л, H(t) — симметрические неотрицательно определенные матрицы порядка {ky^k). Обозначим R(t) симметрические равномерно *) положительно определенные матрицы (размерности (гХО)- Предположим, что элементы матриц H(t) и R(t) являются измеримыми ограниченными функциями /. Для каждого допустимого управления u = (ut), O^t^T, рассмотрим функционал потерь V(u; Т) = м\ Q*ThQT+ j [Q*tH(t)Qt + u*tR(t)ut]dt . (16.3) Допустимое управление и называется оптимальным, если V{u; T) = MV(u; Г), (16.4) и где inf берется по классу всех допустимых управлений. Рассматривая допустимые управления и, положим ет« = М (9, | <Г|), у? = М [(9, - ет?) (9, - етЭД, где 8, и %t — соответствующие этому управлению процессы, определяемые системой (16.1). Теорема 16.1. В классе допустимых управлений оптимальное управление и = (ut), 0 ^ / ^ Г, существует и определяется формулами ut=-R-l(t)c*(t)P(t)mt, 0<*<7\ (16.5) где неотрицательно определенные симметрические**) матрицы P(t) = \\Pij(t)\\ порядка (kXk), 0</<7\ являются решением *) Элементы матриц R (t) равномерно ограничены. **) Неотрицательная определенность и симметричность матрицы Р (/), удоплетворяющей уравнению (16.6), доказывается так же, как и в случае дискретного времени (§ 3 гл. 14).
610 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 уравнения Риккати .--^ = а* WpW +JM'KW + tf (0- -P(t)c(t)R-{(t)c'(t)P(t), P(T) = h, (16.6) а вектор mt определяется из системы уравнений dm, = [с (0 щ + а (0 щ] dt + ytA* (/) (В (t) В' (/))"' [d\t - A (t) tht dt], то = /ио = М0о, (16.7) yt = a(t)yt + yta'(t) + b(t)b'(t)-ytA'(t)(B(t)B'(t))-1A(t)yu. Yo = cov(G0, 90). (16.8) При этом V(u,T) = p(0) + mlP(0)m0 + + Sp где f HU2{t)ytH{l2{t)dt + til2yTh 1/2 "-О T k P(0=J 2 Dij{s)Plj(s)ds, t i, /-1 a D,-/(/) — элементы матрицы Z)(0 = YH,(0[fi(0S*.(0r1vi(0Y/- Доказательство. Прежде всего отметим, что при сделанных выше предположениях , (16.9) (16.10) (16.11) М sup 201(0 Lo</<r/=i ' J < °°, что доказывается, как и в лемме 12.1. Далее, так же, как и при доказательстве теоремы 14.2, устанавливается, что v (и, t) = м е;лег + j [е;# (о е, + u)r (t) ut] dt = = м j м (е;/гег | т\) + j [м (е;я (/) е, | г)) + «до ut\ dt [ = = М I (mf)'hmuT + J [(m»)* Я(/) m» + u'tR(t) ut\ dt + + sJhll2yuThU2+JHll2(t)yutHm(t)dt L о . (16.12)
§ I] ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ 611 Важно заметить, что функция у" не зависит от управления и и совпадает с функцией yt, удовлетворяющей уравнению (16.8) (см. теорему 12.1). Поэтому V(u; T)= Sp | hmyThm + j HV2(t)ytHl/2(t)dt | + о j + Ml (m?)'Am»+ J \(mff H{t)m» + utR{t)ut]dt , (16.13) где согласно той же теореме 12.1 muv 0^/^Г, находится из уравнения dmut = [с(t) ut + a (t) m»] dt + yt (B (t) B* {t))~x[dlut — A (t) mut dt], m» = m0> (16.14) с процессом £'/, О^^Г, определяемым из системы (16.1). Согласно векторному варианту леммы 11.3 процесс Wu = = (#?, Ff), 0<*<7\ t Wt=j B~l{s)[dlus-A(s)musdu]t (16.15) о является винеровским. Поэтому в силу (16.14) и (16.15) dm» = [с (0 ut + a (t) m«] dt + ytAm {t) (В* (t))~l dW». (16.16) 3. Для решения исходной задачи рассмотрим теперь следующую вспомогательную задачу. Пусть (Q, &~9 Р) — некоторое вероятностное пространство, {@~t)> O^t^T,— неубывающее семейство а-подалгебр 5r, z = = (zt, @"t) — r-мерный винеровский процесс, u = {ut, £Tt) — r-мер- ный процесс, удовлетворяющий условию т г М J Jjttjtf, <*)dt< oo, (16.17) 6 /=.i где (tii(t, со), ..., ur(t, со)) = ^. С управлением u = (uty (Ft), 0^/^Г, свяжем управляемый процесс rfli» - \с (t) щ + а (t) |ijf] dt + ytA* {t) (В* (t)rl dzi% (16.18) где c(t), a(t), yty A(t)y В(/) — введенные выше матрицы, jn£==m0. Как и раньше, управление и = (ир !Ft)% 0</<7\ будем на-
612 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 зывать допустимым, если для него выполнено условие (16.17) и уравнение (16.18) имеет единственное сильное решение. В качестве функционала потерь рассмотрим функционал 7 (и; Г) = М| (|х^у А (|*«) + J [(I*?)* «(О |*? + ««;/? (О «f#] Л J. (16.19) Покажем, что в этой задаче оптимальное управление й = = (uty &~t) определяется формулами ut=-R~l(t)c*{t)P(t)iit, (16.20) где ft,, О^О^Г, находится из уравнения d\it = W (t) - с (t) /Г' (t) с* (t)P(t)] Д, dt + ytA* (t) (В* (t))~l dzi% £L0 = "V (16.21) С этой целью введем функцию Q(t, x) = x*P(t)x + p(t)y x<=R\ 0<f<7\ (16.22) где P(t) определяется из уравнений (16.6), a p(t) — из (16.10). Лемма 16.1. Функция Q(ty x) = x*P(t)x + p(t) является решением дифференциального уравнения Ф(*. х, Q(t, *)) = 0, (16.23) где Ф(/, х, Q(t, х)) = х*Н(t)х + х*а*(t) gradxQ{t, x) + k , I V Л и\ d*Q С» х) | д® С» х) » + -2 Zi Dii{t) дх{дх, + dt + + min [и*/? (0 a + иV (0 grad* Q (f, *)] и £ u — {uu ..., иг), Q(7\ л;) = л;7гл;. Доказательство. В силу положительной определенности матриц R(t), 0^/^Г, квадратичная форма / (и; f) = ы*/? (/) и + и V (0 grad* Q (*, *) является положительно определенной и достигает минимального значения на векторе ut{x) = {ux (/, х), ..., йг(/, *)), удовлетворяющем системе линейных алгебраических уравнений gradM/(tt; t) = 0. Поскольку gradtt/(jr, t) = 2R(t)u + c*(t)gradxQ(t, x), Щ (x) = - ~ /Г1 (t) c\{t) grad, Q(t, x).
§ 1] ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ 613 Но gradxQ(t,x) = 2P(t)x. (16.24) Поэтому ul(x) = -R~l(t)c,(t)P(t)x. (16.25) В силу (16.6), (16.22) ^-OU x) — x'dPit) v* I dp{t) - д{ цдг, х) — х dt х -jr dt — = *•[- a'(t)P(t)-P{t)a{i) — H(t) + P(t) c(t) Я~\*)с'Ц)Р(0]х- k d2Q (t, x) - ^ Dlf(t)Pit(t) (16.26) dxi dxf = 2PtJ(t). (16.27) Формулы (16.24) — (16.27) вместе с равенством /(й; /) = = min/(w; t) показывают, что функция Q(t, x) = x*P{t)x + p(t) и удовлетворяет уравнению (16.23). Лемма доказана. Покажем теперь, что для вспомогательной задачи управление, определяемое формулой (16.20), является оптимальным. Из (16.23) ясно, что Ф(*. £/, Q(t, W) = 0. • (16.28) Пусть теперь ut = (ul(t)J ..., ur(t))> O^t^T, — любое из допустимых управлений и \it = (ц, (/),..., \ik(t)) определяется из уравнения d\xt = [с (t) ut + a (t) \it] dt + ytA] (B* {t))~l dzt. (16.29) Тогда из (16.23) и неравенства /(й; t)^J(u, t) вытекает, что Ф0, и„ Q(u ii,))>o. . (16.30) Применяя к Q(t, \xt) формулу Ито, находим, что Q(T, M-Q(o, До)- т ч dQ t fe) + (с (s) щ + a (s) Hsy gradA Q (s, Д.) + ft e?s + t + { [gradA Q(s, it,)]'YH,(s)(fi,(s)r,dz,. (16-31)
614 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 Отсюда, принимая во внимание (16.28), находим т Q (т, \хт) - Q (О, До)== — J Ш* я (5) А* + Ш*«(5) as] ds + о + J [gradAQ(s, Д,)]ЧЛЧ*)(Д'(*))"'**,. (16.32) о Беря теперь математическое ожидание от обеих частей этого равенства и учитывая равенство Д0 = ап0, получаем, что Q(0, m0) = - М (АгГЛАг + { [(А/ н(/) А, + <й,Г R(t) S/1Л . (16.33) Аналогично, применяя тот же прием к Q(t, iit), находим, что Q(0, ш0)< < М (ДГГ АДГ + J [(ц,)' Я (0 |х, + (а,)* /? (О а,] Л [ . (16.34) Сравнивая (16.33) и (16.34), получаем P(a;7,) = Q(0>m0)<K(M, Г). (16.35) Управление й, определяемое формулой (16.20), является допустимым, поскольку линейное уравнение (16.21) имеет, и притом единственное, сильное решение (теорема 4.10). Условие (16.17) выполнено в силу векторного варианта теоремы 4.6. Вместе с (16.35) это доказывает, что в классе допустимых управлений управление й является оптимальным. Этот результат можно получить тем же методом, что и при доказательстве теоремы 6.1. Он получается также из этой теоремы при формальном предельном переходе, если положить B4(t) = z, г \0. 4. Чтобы завершить доказательство теоремы 16.1, рассмотрим подробнее процессы Wu = (Wt, *Т), 0<><7\ Из (16.14) и (16.1) следует, что с вероятностью единица величины 8{* — mut и 9^ — m°t совпадают (индекс 0 соответствует «нулевому» управлению ut^0y 0</<Г). Поэтому из (16.15) ясно, что с вероятностью единица все процессы W? совпадают
§ 1] ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ б 15 (U7" = U7?) и, значит, уравнение (16.16) можно записать в таком виде: dm" = [с (t) ut + a (t) mut\ dt + ytA* (t) (ВТ (0Г1 df°. Пусть теперь й — некоторое допустимое управление, \й = (£,), 0^/^Г,— соответствующий ему процесс и Воспользуемся результатами п. 3, взяв 2Г\ = ?Ff, zt = W°t. Пусть U — класс всех допустимых управлений и = (щ), 0 ^ ^ Г, являющихся ^"-измеримыми при каждом /. Поскольку для любого й _ то управление й, задаваемое формулой (16.21), принадлежит U для любого й (допустимость управления й следует из теоремы 4.10 и векторного варианта теоремы 4.6). Поэтому (см. (16.35)Ji V(й; Г)<У(ы; Т) для всех «el/ и, в частности, V(й; Г)^ V (й; Г). В силу произвольности управления й отсюда следует, что управление и является оптимальным. Наконец, заметим, что формула (16.9) вытекает из (16.13) и равенств V (й, Т) = Q (0, т0) = т;/>(0) т0 + р(0). Замечание. Как и в случае дискретного времени (§ 3 гл. 14), доказанная теорема иллюстрирует (справедливый и в более общей ситуации [26]) так называемый «принцип разделения», в соответствии с которым задача оптимального управления по неполным данным распадается на две: задачу фильтрации и задачу управления по полным данным для некоторой системы. 5. Рассмотрим один частный случай системы (16.1). Пусть 6(0 = 0, Л(/) = £(*х*)! В (0 = 0- Тогда, в задаче управления процессом 8 = (9/), 0</<7\ с -Zf = c(t)ut + a(t)ety (16.36) где 80—- детерминированный вектор, и функционалом т v {Uy т) = е;лег + J [в;я (/) е, + u\r (t) ut\ dt о оптимальное управление й = {ut), 0^<7\ существует и
616 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 задается формулой ut=-R-l(t)c'(t)P(t)Bi9 (16.37) где P(t) является решением уравнения (16.6). При этом V(u;T) = lnlV{u; Т) = %Р(0)%. (16.38) и Этот результат можно получить тем же методом, что и при доказательстве теоремы 6.1. Он получается также из этой теоремы при формальном предельном переходе, если положить Bif(t)^ey ejO. § 2. Асимптотические свойства фильтра Калмана — Бьюси 1. Рассмотрим гауссовский частично наблюдаемый случайный процесс (9,|) = [(9,(О, ..., 9,(0), (ii(0, •-., 1/(0)1, *>0, удовлетворяющий системе стохастических уравнений dBt = [afit + a&t] dt + bx dW{ (t) + b2 dW2(t), d\t = [Afit + A2U dt + Bx dW{ (0 + B2 dW2 (0 ( } с постоянными матрицами alt аъ Аи Аъ bu b2, В{ и В2 порядков (*Х*). (*Х0, (/X*), СХО, (*Х*), (*Х0, (/Х.А)и (/Х0 соответственно. Независимые между собой винеровские процессы ^ = (ИМ0, ..., Wlk(t)) и W2(t) = (W2l(t), ..., Г2/(0), ^0, предполагаются, как обычно, не зависящими от гаус- совского вектора начальных значений (90,£0)- Если матрица (В о В) = В\В* + В2В*2 положительно определена, то согласно теореме 10.3 вектор апостериорных средних значений т, = М (9, | #"£) и матрица ковариаций .У/-М[(9,-т/)(в/-т/Л (16.40) удовлетворяют системе уравнений dmt = [a{mt + a2lt\ dt + + [(b о В) + ytA\\ (В о ВГ1 [dlt - (Axmt + A£t) dt], (16.41) Y* = «iY, + Y,< - \(b о В) + ytA\] (В о В)'1 [(b о В) + ytA\] + (b о 6), (16.42) где (b о Ь) = bib* + b2bl (6 о В) = Ь{В\ + Ь2В2. Компоненты вектора mt = М (9, | fTf) являются наилучшими (в среднеквадратическом смысле) оценками соответствующих компонент вектора 8, по наблюдениям Ц. Элементы матрицы yt> ее след SpY/> показывают точность «отслеживания» оценкой mt
§2] АСИМПТОТИЧЕСКИЕ СВОЙСТВА ФИЛЬТРА Q\J ненаблюдаемых состояний 8,. При этом, как и в аналогичной задаче для случая дискретного времени, возникает важный для приложений вопрос об условиях, когда матрицы yt стабилизируются при /1 оо. Исследованию вопроса о существовании предела lim у* и способах его вычисления и посвящен настоя- щий параграф. 2. Прежде чем переходить к точным формулировкам, заметим, что, полагая a = ax — (boB)(BoB)-lAl9 Ь = [(ЬоЬ)-(ЬоВ)(ВоВГ1(ЬоВУ]11\ (16.43) В = [ВоВ]ч\ А = Аи уравнение (16.42) можно переписать в несколько более удобном виде: Y* = *Y/ + Ъ** + ЬЬЧ - ytA* (BBT1 Ayt. (16.44) Это уравнение совпадает с уравнением для ковариации при рассмотрении гауссовской пары процессов (9, |), удовлетворяющих системе dQt^aQtdt + bdW{(t), d\t = AQt dt + B dW2 (/). ( ' Так что с точки зрения исследования поведения матриц у* ПРИ t->oo достаточно вместо системы (16.39) рассматривать более простую систему (16.45). Теорема 16.2. Пусть рассматривается система (16.45), для которой выполнены следующие условия: (I) ране блочной матрицы (16.46) размерности {kiy^k) равен k\ (II) ранг блочной матрицы G2 = (b ab ... а*~1Ь) (16.47) размерности (k X Ik) равен k\ (III) матрица В В* не вырождена. Тогда для yt = М (8/ — mt) (8/ — mt)* существует lim yt = у. t-*oo Этот предел у не зависит от начального значения у0 ц является
6lg ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 единственным (в классе положительно определенных матриц) решением уравнения ау + уа* + ЬЬ* — у А* (В*Ву{ Ау = 0. (16.48) Доказательству этой теоремы предпошлем ряд вспомогательных утверждений. 3. Лемма 16.2. Пусть D и А — матрицы размерностей (I X &)> (&Х&)- Образуем блочную матрицу {порядка {nlXk)) D \ D П " т Тогда матрицы D*nDn и [ e'AHD*De-Atdt, 0<Г<оо, одно- о временно либо вырождены, либо невырождены. Доказательство. Согласно лемме 14.4 матрицы D*nDn и DIDky n^k, одновременно или вырождены или невырождены. Если матрица D\Dk вырождена, то по этой же лемме найдется ненулевой вектор х = {хи ..., хп) такой, что D/Hjx = 0f j = 0, 1, ..., fe, k + 1, ... Но тогда °° De- д< х =2 -tj^- {DSjx) = 0, /=о и, следовательно, т х* | e-AHD*De-At dtx = 0y (16.49) о т что и доказывает вырожденность матрицы e-AHD'De~st dt. о Наоборот, пусть выполнено (16.49). Тогда, очевидно, x*e-AHD*De-Atx^0y 0</<7\ Поэтому De~Atx = 0 (16.50) и (после дифференцирования по /) DSe-Atx = Q, (16.51) D^~le~At^0. Из (16.50) и (16.51) при / = 0 вытекает, что DAyx==0, / = 0, ..., k—1, что эквивалентно равенству x*DlDkX = Q. Демма доказана.
§2J АСИМПТОТИЧЕСКИЕ СВОЙСТВА ФИЛЬТРА 619 Следствие. Пусть Dk = (D AD ... A* lD) — блочная матрица порядка (k X kl), где D и А —- матрицы размерностей т (kXl) и (kXk). Тогда матрицы DkD\ и [ e-AtDD*e-*** dt о одновременно либо вырождены, либо не вырождены. Лемма 16.3. Если матрица G2 имеет ранг k, то при t>0 матрицы yt, определяемые из уравнения (16.44), являются положительно определенными. Доказательство. Матрица yt является матрицей ко- вариаций условно-гауссовского распределения Р (9,^ а \ &~\\ Если это распределение имеет (Р-п. н.) плотность, то тогда, очевидно, матрица yt будет положительно определенной. Рассматривая систему уравнений (16.45) и принимая во внимание следствие 1 теоремы 7.23 (п. 5 § 9 гл. 7), получаем, что распределение Р(8, <а|#~|), ^>0, имеет плотность (Р-п. н.), если плотностью обладает распределение Р(9/^а), что эквивалентно условию положительной определенности матрицы r/ = cov(9/, 8,). Согласно теореме 15.1 матрицы Г, являются решениями дифференциального уравнения tt = art + rta* + bb\ (16.52) Отсюда находим Г, = eatYQeaH + eat f e~asbb*e~a*s ds ea*< d J Но в силу следствия леммы 16.2 матрицы Г„ t > О, положительно определенные, поскольку таковой же является и матрица G2G2 (rangG2 = fe). Лемма доказана. Лемма 16.4. Если ранг матрицы G{ равен /г, то элементы всех матриц yt равномерно ограничены. Доказательство. Рассмотрим вспомогательную задачу управления детерминированным процессом xt = (x{(t), ..., xk (t)), 0<^<Г, удовлетворяющим уравнению dx, --J-. = a xt + A ut, x0 = x, (16.53) с функционалом т V (щ Т) = x*TyQxT + j [x]bb*xt + u]BB*ut] dt о Управления uh 0</<Г, выбираются из класса допустимых (см предыдущий параграф).
620 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 Согласно (16.37) оптимальное управление ut существует и задается формулой йг = — (BBY1 Луг-л, (16.54) где Xf — решение уравнения (16.53) с ut = uu 0^/^7\ При этом V{й\ Т) = х*утх. Поскольку элементы матриц yt являются непрерывными функциями, для доказательства леммы достаточно показать, что равномерно ограничены все элементы матриц ут при Т > 1. Поскольку rangGj = fe, матрица G\G\ не вырождена, и по лемме 16.2 не вырождена матрица 1 \е-а**А*Ае-*<Ц. о Возьмем теперь специальное управление -Ae~at( f e-a*sA*Ae-as) x, 0<f<l, I о, t>u и пусть Jtt — решение уравнения (16.53) с ut = ut> Решая это уравнение, находим, что ^ = 0, />1. Но тогда в силу оптимальности управления utt O^t^T, T> 1, 1 х*утх^ J [Xtbb*Xt + utBB*ut]dt < оо, что и доказывает лемму. Лемма 16.5. Пусть y°t — решение уравнений (16.44) с у2 = = Y0 = 0 u rangGj = /j. Тогда существует lim y°t и у0 = lim y? является неотрицательно определенной симметрической матрицей, удовлетворяющей уравнению ауо + уоа* + bb* _ уоД* (ВВТ1 Ау° = 0. (16.55) Если к тому же rangG2=&, то у0 является положительно определенной матрицей» Доказательство. В силу предположения rangGj — ft из предыдущей леммы следует, что элементы всех матриц y°t, /^0, равномерно ограничены.
§ 2] АСИМПТОТИЧЕСКИЕ СВОЙСТВА ФИЛЬТРА 621 Покажем, что при Yo^O функция х*у°тх монотонно не убывает (по Г). Пусть Т2>ТХ. Тогда, обозначая ut(Tt) и xt(Tt) оптимальные управления и отвечающие им процессы во вспомогательных задачах управления, /=1, 2, находим, что х\х = \[{xt (Т2))* bb*xt (Т2) + (щ (Т2)У ВВ*щ (Т2)] dt > о > J [(*,(Т2)У bb*xt (T2) + (ut(T2)Y BB*ut (T2)]dt> о > J [(*, (ТХ)У bb*xt (Т{) + (щ (Т{)У ВВ*щ (Г,)] dt = x*yTlx. о Из ограниченности и монотонности функций х*у^х вытекает существование матрицы у°= Игл у°т с указанными свойствами. Если же дополнительно rangG2 = fe, то по лемме 16.3 не вырождены матрицы y°t> а следовательно, таковой же является и матрица у°= lim y°r 4. Доказательство теоремы 16.2. Обозначим у° = = lim у? при Yo^O и положим щ=-(ВВ*Г1 АуЧи (16.56) где л;,—-решение уравнения (16.53) с ut = uti xQ = x. Покажем, что *,->(), /->оо. Для этого достаточно, например, показать, что lim#Y°U = 0, (16.57) <-*00 поскольку матрица у0 является симметрической и положительно определенной. В силу (16.53), (16.55) и (16.56) ± (x*ty4t) = $у0 [а* - А' (ВВТ1 Ау°] х, + + х\ [а - YM* (BBT1 Ау°] Я, - х\^А* (ВВТ1 Ау0*, = = - xibb'xt - xiy°A' (ВВУ* {ВВ*) (ВВТ1 Аурх, = = — [x'tbb'xt + ЩВВ*щ\,
622 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 1б Значит, по лемме 16.5 т О < хту°хт = х*у°х - [ [x*tbb*xt + шВВ*ш] dt < о т < ху°х - [ [xtbb*xt + uWB%] dt = о = х*[у° — у°т]х->0, Г->оо, (16.58) где ut — оптимальное управление, определенное в (16.54). Из (16.58) вытекает также, что т lim f [x\bb*xt + utBB%] dt = х*у°х. (16.59) Далее, пусть у0 — произвольная неотрицательно определенная матрица. Тогда т хтУоХт + J [x*tbb% + utBB%] dt^z о т > х*утх = х*ту0хт + J [x*tbb*xt + u*tBB*ut] dt > о > J [x*tbb*xt + u*tBB*ut]dt^\ [£tbb% + utBB%]dt = *'y°jc, о о (16.60) где ut= — (BB*)~l Ay°T__txt, а *, —решение уравнения (16.53) с ut = ut. Из этих неравенств и (16.59) следует, что \\тп х*у(хт + x*y°x^\\mx*yTx^ \\mx*yTx^ lim x*y°Tx. Г->оо U Г->оо jr^o Г->оо Но согласно (16.57) lim x*уп*т=0, а Пт*У^=л;*у0* (лемма 16.5). Г-»оо U i Г->оо Поэтому существует lim х*утх (= х*ух), Т-*оо ' lim x*yTx = х*у°х, Т-*оо и y = Нт Ут = Y0- Г->оо Предельная матрица у = lim yT не зависит от значения yQ и удовлетворяет в силу (16.55) уравнению (16.48).
§ 3] ВЗАИМНАЯ ИНФОРМАЦИЯ И ПРОПУСКНАЯ СПОСОБНОСТЬ 623 Единственность решения этого уравнения (в классе положительно определенных матриц) доказывается, как и в теореме 14.3. Замечание. Если собственные числа матрицы а лежат в левой полуплоскости, то можно отказаться от предположения (I) теоремы 16.2, поскольку тогда Sp у*^ Sp М 9/9* < оо, £>0. § 3. Вычисление взаимной информации и пропускной способности гауссовского канала с обратной связью 1. Пусть (Q, @~у Р) — некоторое вероятностное пространство, (#",), 0 ^< Ту — система неубывающих сг-подалгебр #~. Пусть 9 = (9„ #",), 0 </ ^ Ту — некоторое «посылаемое сообщение», которое надо передать по каналу с гауссовским «белым» шумом. Чтобы это описание сделать точным, предположим, что задан винеровский процесс W = (Wt9 #",), не зависящий от процесса 9 = (9„ #",), О^^Г. Если «принятое сообщение» l = (lt, УД имеет вид dlt = at(B)dt + dWt, h = 0> (16.61) т. е. t l^jfliWds + Wt, (16.62) О то говорят, что «сообщение» 9 послано по каналу без обратной связи с гауссовским «белым» шумом *). Функционалы а5 (9), 0 < s < Ту с Р И | as (9) | ds < оо ) = 1 задают кодирование и предполагаются неупреждающими. В том же случае, когда «принимаемое сообщение» £=(£/, @~t), 0^/^Г, допускает представление dlt = at(Q,.l)dt + dWt9' ^o = 0, (16.63) с неупреждающим функционалом а, (9, g), 0</<Г, РМК(0> £)|Л<оо| = 1, то говорят, что передача осуществляется по гауссовскому каналу с «белым» шумом при наличии (бесшумной) обратной связи. Таким образом, в случае бесшумной обратной связи «принятое сообщение» £ отсылается обратно и может быть учтено в дальнейшем при передаче «сообщения» 9. *) В технической литературе вместо записи (16.62) используют ее формальный аналог | (t) == at (6) -j- W^ называя Wf «белым» гауссовским шумом..
624 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 Пусть (в, ЗВ$) — измеримое пространство, которому принадлежат значения сигнала 8 = (8,), 0</<7\ Через (Сг, $т) будем обозначать измеримое пространство непрерывных на [О, Т] функций x = (xt), 0^/^Г, с х0 = 0. Пусть [i^, jli| и He.S~~меры, отвечающие процессам W, I и (8, £). Если некоторое кодирование а, (8, £), 0^/^Г, выбрано, то естественно поставить вопрос о том, какая информация h (б» 6) содержится в «принятом сообщении» |=={|5, s^t} относительно «переданного сообщения» 8 = {8S, 5^/}. По определению Me, |) = Mind[^^](e,i). . 06.64) причем полагается 1г(8, |) = <х>, если мера |хед не является абсолютно непрерывной относительно меры jne X Ш- Теорема 16.3. Пусть выполнены следующие условия: (I) уравнение (16.63) имеет единственное сильное (г. е. &~t,w-измеримое при каждом t, O^t^T) решение; (II) {Ма2(6, l)dt<oo. Тогда где Л М9> 1) = уМ J [а* (9, l)-a)(l)}dt, (16.65) О б/(Е) = М[а,(е, l)W\\. (16.66) Доказательство. Согласно сделанным предположениям и леммам 7.6 и 7.7 \х% < \xw и ц0| s < Не X М^. Поэтому в силу замечания к теореме 7.23 Но в силу лемм 7.6 и 7.7 г <Ч,& rffHeXn^j (9, £) = ехр Г 1 N а, (в, 6)^-4" J а?(в, |)Л . Lo о J vE)==exp ■о о (16.68) \at{l)dl,-\la)(t)dt , (16.69) о о '
§ 3] ВЗАИМНАЯ ИНФОРМАЦИЯ И ПРОПУСКНАЯ СПОСОБНОСТЬ 625 где at(x)=M[at(Q,l)\9-lt]i_x. При этом т т т |Ма?(Е)Л=|М[М(а,(е, Б) l^|)f Л< J Ma?(9f g)d/<oo. 0 0 0 Из (16.67) —(16.69) следует, что т т = J [^ (в, I) - at (|)] d\t-\\\a\ (9, |) - а? Щ dt = о о т = /(ме, 6)-MS)] а, (в, 6)—j [а? (9, 6)-а?(6)])л + о г + <[ме,6)-а,(6)]<НР/. (16.70) о Отсюда по свойствам стохастических интегралов Т 2 о J М [а? (9,|)- 2а, (9, 1) at (I) + а] Щ dt = т = i-j*MK(9, l)-at(l)Ydt = О т = 1/м{М[аД9, l)-at(t)f\^}dt = О = 4{М[^(9, Б)-а?(Б)1Л, (16.71) о что и доказывает теорему. 2. Используем эту теорему для доказательства того, что (при определенных «энергетических» ограничениях) обратная связь не увеличивает пропускной способности.
626 ^ ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 По определению для канала с обратной связью пропускная способность C = supJrIr(ef £), (16.72) где sup берется по всем сообщениям 9 и неупреждающим функционалам {at(Q, g), 0^/< Г}, для которых уравнение (16.63) имеет единственное сильное решение и т -~|ма*(9, £)Л<-Р (16.73)' о с константой Р, характеризующей энергетические возможности передающего устройства. В силу (16.71) т о<ме, 1)=ym /К(М)-а?(б)]л< О т <4-М J а»(в, |)<й<-^-. (16.74) о Следовательно, С<^. (16.75) Покажем теперь, что для канала без обратной связи C0 = sup-llr(e, Б) = 4. О6-76) где sup берется по всем сообщениям 9 и неупреждающим функционалам а, (9), 0</^Т, для которых т -|г/ма2(е)Л<Р. о Поскольку С^С0, то из (16.75) и (16.76) будет следовать, что обратная 'связь не увеличивает пропускной способности: С = С0 = -~. (16.77) С этой целью рассмотрим следующий Пример 1. Пусть at (х) = xt и 9а = (0?), О < / ^ Г, является гауссовским стационарным процессом с М9? = 0 и корреляционной функцией /С(/, $) = Рехр{-еН'-'|}.
§ 3] - ВЗАИМНАЯ ИНФОРМАЦИЯ И ПРОПУСКНАЯ СПОСОБНОСТЬ 627 Будем предполагать, что сообщение £ = (£/), 0</<7\ на выходе канала задается в виде где W = {Wt)y ^>0, — винеровский процесс, не зависящий от процесса 8а. Согласно теореме 15.2 процесс 9? имеет дифференциал rf9? = - а9? dt + /2аГ dzt, где z = (zt), t^O, — винеровский процесс, не зависящий от W. Положим т?=М(б?|#1), Y?=M(e? —/и?)2. По теореме 10.1 dm" = — am? dt + Y? (dlt ~ m<t dt)> mo = °» . Y? = - 2aY? + 2aP - (Y?)2, y? = P (16'78^ Из (16.78) и гауссовости процесса 9a следует выполнимость предположений теоремы 16.3, и, значит, 1 iT(е<\ |) = i-1 [ м(е?)2dt-JM(m?)2л 1-0 0 J о Покажем, что т lim f M(m«)2^ = 0. (16.80) По теореме 7.12 процесс W = {Wt, ST}) с Wt = lt— \ masds о является винеровским. Следовательно, dm* = — am«dt + y*dWt, откуда t ma = e-at j easya ^^ 0 и по свойствам стохастических интегралов получаем t t M (m«)2 = J e-2a(t-8)(yay ds ^ f g-2a(*-*)p2 rf5 = 2a = P2-iZ£— • (16.81)
628 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 поскольку y? = M(9« — m°)2<M(8«)2 = P. Из (16.81) вытекает требуемое соотношение (16.80). Итак, доказана Теорема 16.4. Пусть выполнены условия теоремы 16.3. Тогда пропускная способность С канала с обратной связью совпадает с пропускной способностью С0 канала без обратной связи и С = С0 = ^ • § 4. Оптимальное кодирование и декодирование при передаче гауссовского сигнала по каналу с бесшумной обратной связью 1. Развитая в предшествующих главах теория оптимальной нелинейной фильтрации условно-гауссовских процессов дает возможность найти оптимальный метод передачи гауссовских процессов по каналам с аддитивным «белым» шумом при использовании мгновенной бесшумной обратной связи. Предположим сначала, что сообщение, которое требуется передать, есть гауссовская случайная величина 8сМ8 = т, D9 = y>0» причем параметры пг и у известны как на передающем, так и на приемном концах. Сигналы g = (gf), O^tf^T, принимаемые на выходе «передающего устройства», предполагаются удовлетворяющими стохастическому дифференциальному уравнению d$t = A(tyQ,l) dt + dWt, £o = 0, (16.82) где W = {Wt)f 0^<T, — винеровский процесс, не зависящий от 9. Неупреждающий функционал A = {A(t, 9, £)), О^^Г, задает кодирование и предполагается таким, что уравнение (16.82) имеет, и притом единственное, сильное решение с т |Л2(5, 9, £)ds<oo 1 = 1. о Будем считать также, что на функционалы А = (A (t, 9, £)), 0^/<Т, наложено ограничение: t j-J МЛ2 (5, 9, £)tfs<P, <16'83) о где Р — заданная константа. (Кодирования, удовлетворяющие перечисленным выше условиям, будем называть допустимыми.) В каждый момент времени t по принятому сигналу Ц=* ss={ls* s^.t] можно построить «сообщение на выходе» &(£).
§ 4] ОПТИМАЛЬНОЕ КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ 629 Задающий декодирование неупреждающий функционал 0 = = (8*(!))> 0^/^Г, должен выбираться, естественно, так, чтобы оптимальным в некотором смысле образом «воспроизводить» сообщение 8. Обозначим A(0 = infM[e-ft,(6)]2. 0</<Г, где inf берется по всем допустимым кодированиям Л = = (Л(5, 9, £)), $>0, и декодированиям 0,(6). Задача состоит в том, чтобы найти оптимальные кодирование, декодирование (конечно, если таковые существуют) и минимальную ошибку воспроизведения Д(^) сообщения 8 за передачу в течение времени /. Поскольку (при заданном кодировании) М[8-Ш)]2>М[8-т,(1)]2, где mt = М (8 | &)), то ясно, что Д (/) = inf M [8 — mtf и оптимальное декодирование (по сигналам Щ есть апостериорное среднее mt = М (8 | У\). Итак, исходная задача сводится к задаче отыскания лишь оптимального кодирования. 2. Рассмотрим сначала подкласс допустимых кодирующих функций А (/, 8, Q, линейно зависящих от 8: Л(*,е,|)==Л0(а) + А(*,|)е, (16.84) где А0 = (Л> ('.£))> Ai=(Ax(t9Q), 0</< Г, — неупреждающие функционалы. Обозначим Д*(0= inf M[8-m,]2 (16.85) Me, Ai) и найдем величину Д*(<) и оптимальные кодирующие функции (ЛЗ, Л*), на которых достигается inf в (16.85). Пусть некоторое кодирование (Л0, Ах) выбрано и £ = (£,), (X ^ Г, — процесс, удовлетворяющий уравнению dlt = [Л0 (t91) + A{ (t91) Q]dt + dWu g0 = 0. (16.86) Тогда согласно теореме 12.1 mt = М (81 #~|) и yt — М [(8 — — mty \@")\ удовлетворяют уравнениям dmt = ЪАХ (/, 6) [d%t - (Л0 (/, g) + Л! (/, 6) /я,) dtl (16.87) Y/= — YMiC'6) (16.88)
630 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 1б с т0 = ту у0 = Y- Уравнение (16.88) имеет решение (теорема 12.2) Y 1 + Y | а\& I) ds о причем видно, что Р ( inf Ys>0) = 1- Поэтому из (16.88) получаем и, следовательно, t lnY/ -1iiy=-JyHi (s>t)ds, о т.е. Y, = Yexp I- jy8A\(s9l)ds . (16.89) Поскольку М[Ло(М)+^1(^^)е]2=М{[Л0(/,^)+т, AX(U 6)]+[e-m,] Л, (М)}2= = М {Л0 (*, I) + Л, (*, Е) m,}2 + MY, A] (/, g), (16.90) то в силу ограничения (16.83) t JMysA](s,$)ds^Pt. (16.91) о Поэтому в силу неравенства Йенсена (Ме-^^е ~Мт]), (16.89) и(16.91) My,>Y^p'> 0</<7\ (16.92) Итак, для заданного кодирования (Л0, Ах) М [8 - mt]2 = My* > ye-**, (16.93) и, следовательно (см. (16.85)), A*(*)>Y<rp*. (16.94) Для оптимального кодирования (Ло, Л*) неравенства в (16.91) и (16.92) должны превратиться в равенства. Это произойдет, если взять A\(t) = yi-eM, (16.95) поскольку тогда соответствующее yHcm. (16.88)) будет в точности равно ye~~pt.
§ 4] ОПТИМАЛЬНОЕ КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ 631 Сравнивая (16.90) и равенство t t \ My s*(A\(s)fds = J y*s(A\(s))4s = Pt, о о находим, что должно быть также выполнено равенство Ao(t,l*) + A*{(t)mHt) = 0, (16.96) где согласно (16.87) оптимальное декодирование т\ определяется из уравнения йт^У/Ще-^йХи mi = m9 (16.97) а передаваемый сигнал g* = (£?), 0<^<Г (см. (16.86)), удовлетворяет уравнению *Vt = Y— ePm(Q-ri)dt + dWt, Й = 0. (16.98) Из (16.97) видно, что оптимальное декодирование может быть записано также в следующем виде: *• ?s mi о = m + KPY [e"1" It + j JVY & ds]. (16.99) Pt l PS Уравнение же (16.98) показывает, что оптимальная операция кодирования состоит в том, чтобы посылать все время не само сообщение 0, а «расхождение» 9 — т) между величиной 9 и ее оптимальной оценкой т)у умноженное на 1 /— Итак, доказана Лемма 16.6. В классе допустимых линейных кодирующих функций (16.84) оптимальное кодирование (Ло, А\) существует и задается формулами Л1(0 = ]/у^/2, (16.100) Al{UV)= -A\(t) ml (16.101) При этом оптимальное декодирование т) и передаваемый сигнал £j удовлетворяют уравнениям (16.97), (16.98). Ошибка воспроизведения ЫЦ) = уе-**. (16.102) Замечание^. Рассмотрим класс линейных кодирующих функций AQ(t) + Ai(t) 9, не использующих обратную связь. Иначе
632 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 говоря, будем предполагать, что функции A0(t), A{{t) зависят т лишь от времени, J [Л2 (t) + А] Щ Ш < ос и о t т| M[^0(5) + ^i(5)9]2d5<P, 0</<7\ о Поскольку М [А0 (s) + А{ (s) 9]2 = [А0 (s) + шАх (s)]2 + у A] (s), то из вышеприведенного энергетического ограничения находим, что t \A*{s)ds^lt. О Отсюда вытекает, что Y* — t ^ 1 + Р/ • 1+yJ 42(s)ds о и, следовательно, минимальная среднеквадратическая ошибка воспроизведения (без использования обратной связи) A(0 = infM[9~mJ2>rfp-r • Но для кодирующих функций Л,(0 = ]/у' A0(t)=-Ax(t)m среднеквадратическая ошибка в точности равна узгрГ' Цоэтому МО y 1 + р* Замечание 2. Отметим еще одну особенность процесса £*, являющегося оптимальным передаваемым сигналом. Если (Л0, А{) —некоторое допустимое кодирование, то согласно теореме 7.12 и уравнению (16.86) dlt = [Л0 (t, I) + А{ (t, I) mt\ dt + dWti где W = (Wt, STf) — винеровский процесс,
§ 4] ОПТИМАЛЬНОЕ КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ 633 Для оптимального сигнала I* Ao(t, l*) + A\(t, £*)m? = 0. Поэтому процесс £* = (£?), 0</<Г, совпадает с соответствующим ему обновляющим процессом W = (Wt, &")*). Следовательно, в оптимальном случае передача устроена так, что передавать надо только обновляющий процесс W = {Wh Ffy 3. Покажем теперь, что найденное в лемме 16.6 кодирование (Ло, А\) является оптимальным также в том смысле, что оно дает наибольшую информацию 1*(8, {■) о 9 в принимаемом сообщении gg = {£e, s^/} для каждого t, 0<^Г. Пусть lf = supl,(9, |), где sup берется по всем сигналам |£ = {£s, 5</}, удовлетворяющим уравнению (16.82) с допустимыми кодирующими функциями А = {A (t, 9, £)), О^^Г. Лемма 16.7. Процесс |* = {£s, 0<5^Г}, найденный в лемме 16.6, является также оптимальным в том смысле, что для него 1, = 1,(9,Г) = Х' 0<*<7\ (16.103) Доказательство. Пусть А = (A (t, 9, £)), 0 ^ ^ Г,—некоторое допустимое кодирование. Тогда из теоремы 16.3 и предположения (16.83) следует, что t V(6, g) = «■ J M [ Л2 (5, 9, g) - Л2 (5, g)] ds < 0. t <4|M^2(s)0,i)ds<^-, (16.104) 0 где 1(5, l) = M[A (s, 9, g) | <F|]. С другой стороны, возьмем A (s, 9, g*) = АЪ (s, £) + А\ (s) 9 с Ло(5, |) и Л? (s), определенными в лемме 16.6. Тогда в силу (16.101) М [Л (5, 9, Г) I #1] = Л; (s, Г) + А\ (s) m\ = 0, и, значит, согласно (16.104), (16.90) t \t (9, Г) = I J M [A'0(s, 1) + ЛН«) О]2ds = -^, о что вместе с (16.104) доказывает требуемое равенство (16Л03). 4Ч В настоящем пункте будет показано, что линейное кодирование (Ло, Л*) является оптимальным в классе всех до* пустимых кодирований.
634 Применение к некоторым задачам управления [гл. 16 При доказательстве этого предложения оказывается полезным приводимое ниже неравенство (16.105), в определенном смысле аналогичное неравенству Рао-Крамера. Лемма 16.8. Пусть 9 — еауссовская случайная величина, 8 ~ N (гп, у) и 8 — некоторая случайная величина. Тогда M[0-0]2>y^I(8'0^. (16.105) Доказательство. Обозначим е2 = М [0 — в]2. Не ограничивая общности, можно считать, что 0<е2<оо. Рассмотрим теперь е-энтропию Не (9) = inf {I (9, 8): М (8 ■— в)2 < е2}. Согласно известной формуле для е-энтропии Яе(9) гауссовской величины 9 (см. формулу (12) в [88]) tfe(9)=JLlnmax(-£, lj. (16.106) Следовательно, v , ) ^ ev ) ^ 2 е2 2 М[9-9]2 что и доказывает требуемое неравенство (16.105). Теорема 16.5. Пусть Q—гауссовская случайная величина, передаваемая по каналу связи, описываемому уравнением (16.82). Тогда Д(0 = Д*(0 = уе~р' (16.107) и, следовательно, в классе всех допустимых кодирований оптимальным является линейное кодирование (Ло, А*), найденное в лемме 16.6. Доказательство. Ясно, что А (/) < Д* (/) = ye~pt. Поэтому для доказательства теоремы достаточно убедиться в том, что М0>уе~р'- (16.108) Пусть %=*{&), 0</<Г,—процесс, отвечающий некоторому •допустимому кодированию (см. 16.83)), и 0 = 9; (I)—какое-то декодирование. Тогда в силу леммы 16.8 М [9 - 6/ (I) f > \е~21 (е' б/ <*». (16.109) Но, как хорошо известно, I (g, &(£))^Me» £)• К тому же по лемме 16.7 1,(9, £)< 1Д8,■ |*) = Р//2. Поэтому M[9-8,a)]2>Ye-p'> что и доказывает требуемое неравенство (16.108). Теорема доказана.
§ 4] ОПТИМАЛЬНОЕ КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ 635 5. Метод, примененный при доказательстве леммы 16.6, может быть использован для отыскания оптимального линейного кодирования и для того случая, когда передаваемое сообщение 8 = (8,), 0^/^Г, является гауссовским процессом с дифференциалом dQt = a (t) в, dt + b{t) dWt, (16.110) где винеровский процесс W= (Wt), 0^t^Ty не зависит от гауссовской случайной величины 90 с заданными значениями M90=m, D80 = y>0, а |а(0|</С, |6(0К*. Будем предполагать (ср. с (16.86)), что процесс £ = (£,), 0^/<Г, получаемый на выходе канала, является единственным сильным решением уравнения dlt = [A0(ti l) + Ax(Ul)Qt\dt + dWu ^o = 0, (16.111) где винеровский процесс W = (Wt), 0^/^Г, не зависит от W, 90 и (неупреждающие) кодирующие функции AQ(t, I) и А{ (tt £) удовлетворяют условиям Р I ( Al (t,l) dt < оо 1 = 1, sup | Л, (/, х) |< оо U J **c.t<T и энергетическому ограничению М[Л0^9 + А,«>Б)в,Р<Р с заданной константой Р. Пусть A*(/) = infM[e,-e,(i)]2, где inf берется по всем описанным допустимым кодирующим функциям и декодированиям 0*(|). Ясно, что Д'(/) = inf М[8, —m,]2, где т, = М(вН#1)- Обозначим Y* = M[(e,-m,)2|0l]. (16.112) Тогда А*(0= inf MY*. (16.113) Mo. Ах) Если кодирование (А0, А{) задано, то по теореме 12.1 dmt = a(t) mt dt+ytA{ (/, g) №,-(А> (/, 1)+А{ (/, £) mt) dt], (16.114) Y, = 2a(/)Y,-vMi(M) + *2W (16.115) с m0 = m, Yo = Y-
636 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 Как и в (16.90), находим, что М [А0 (t, I) + Л, (t, I) mtf + М [у,Л? ((• Щ < Р- (16.116) Заметим теперь, что уравнение (16.115) эквивалентно интегральному уравнению Y, = V ехр I 2 | a (s) ds — jysA] (s, |) ds 1 + t , t t . + J b2 (s) exp J 2 J a (u) du — J" yu Л? ("» Ю dw 1 ds- 0 Is s ) Отсюда в силу неравенства Йенсена (Me~n^e~Ml1) получаем М [в, - tntf > у ехр ( 2 J a (s) ds - J M\SA2 (s, |) ds 1 + I о о J ' f ' ' 1 + J b2 (s) exp J 2 J a (и) du — J Му„Л> (и, |) rf« rfs, (16.117) 0 V s s i что вместе с неравенством MyHi(/, £)^ P> вытекающим из (16Л16), дает для Му/ оценку снизу: MY<>Yexpl2j[a(s)--|]dsJ + + |б2(5)ехр 2jja(a)_P.j^L5. (-16.118) Укажем теперь кодирование (Ло, Л(), для которого в (16Л18) достигается знак равенства. Поскольку по предположению у0 = = Y>0, то Р{inf у/>0}=1 (теорема 12.7) и, следовательно, для всех tt 0<*<7\ определены функции л;(/,г)=-л;(мгш;, (ш.120) гдет;«м(е^ау;«м1(е,-т;)ч^П.а&*КФ.0<<<г»
§ 41 ОПТИМАЛЬНОЕ КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ 637 является решением уравнения db = \/lIu l) + A\{U l)9/]dt + dWu Ь = 0. (16.121) Важно заметить, что в силу (16.119) (A](t, g*))2 у^ = Р, и, следовательно (см. (16.115)), y; = [2a(t)-P]y't + P(t), V*o = y. (16.122) Это линейное уравнение имеет единственное решение Y; = Yexp 2 J Ja(5)_|]ds + + jV(s)exp 2 J [a (и)-|] A* Ids, (16.123) которое не зависит от «случая». Сравнивая (16.113), (16.118) и (16.123), убеждаемся в том, что b'(t) = yl 0<*<7\ (16.124) Итак, доказана Теорема 16.6. При передане по схеме (16.111) гауссов- ского процесса 9„ подчиняющегося уравнению (16.110), опти' мальная передача описывается уравнением dVt== ]/^e*~m**\dt + dW» ^ = °' (16Л25> где оптимальное декодирование m*t = Mt(Qt \@"\) определяется из уравнения dm] = a{t)m)-dt + VWtdl*u m\ = m, (16.126) y] = [2a(t)-P}y*t + b>(t)yyl = y. (16.127) Минимальная ошибка воспроизведения A'(/)-vexpj2.f [a(s)-|-]rfs + I о + jb2(s)exp j2 J[a(M) —^]rfM|rfs.[ (16.128) Следствие. Если a{t) = b{t) = 0, то (ср. с (16.102))
638 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16 Замечание 1. Если в передаче по схеме (16.111) обратная связь не используется, то оптимальные кодирующие функции AQ(t), Ax(t) задаются формулами Л■ W = V Щ • А°(/) = ~ л~ W ме<* При этом среднеквадратическая ошибка воспроизведения A (t) находится из уравнения А (0 = 2а (t)& (0 + Ь2 (0 - -А- А2 (О, А (0) = у. Для сравнения величин Д*(/) и Д(/) рассмотрим следующий Пример 2. Пусть а (/) s= — 1, 6 (/) == 1, у = —, т = 0, т. е. пусть процесс 9,, /^0, является стационарным гауссовским марковским процессом с dBt=—Qtdt-\-dWt и 90~#(0, 1/2). Тогда М9, = 0, D9, = 1/2 и A (t) = — 2Д (t) + 1 — 2РД2(0, А (0) = 1/2. Отсюда нетрудно найти, что X г а и\ У1 +2Р- 1 t+oo Я? В то же время согласно (16.128) д* (А = —! и е- (2+р) t П ! 1 а W 2 + р т*е [2 2 + pj * и, значит, Ар= lim Д* (/) = ——. Поэтому t -> оо Z-f- У Ар _ 2Р ^"(г + РК^Г+гР-О' и, следовательно, 7хр ( 1, Р->0. Иначе говоря, при больших Р использование обратной связи дает ошибку воспроизведения существенно меньшую, нежели без использования обратной связи. При малых Р ошибки воспроизведения в обоих случаях асимптотически (при / -> оо) эквивалентны. Замечание 2. Кодирование (Ло, /li), найденное в теореме 16.6, является также оптимальным в том смысле, что 1,(9, £*) = sup 1,(9, 6). (16.129) где sup берется по всем допустимым линейным кодированиям, а 1/(9,1) определено в (16.64). Доказательство равенства (16.129) проводится так же, как и в лемме 16.7.
ГЛАВА 17 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ СТАТИСТИЧЕСКИХ ГИПОТЕЗ ДЛЯ ПРОЦЕССОВ ДИФФУЗИОННОГО ТИПА § 1. Метод максимального правдоподобия для коэффициентов линейной регрессии 1. Пусть ! = (|<), О^^^Г, — случайный процесс с Ь^ЕММ + ть, (17.1) где 9 =(8!, ..., 9^) —вектор-столбец неизвестных параметров, — oo<6t<oo, /=1, ..., N, a at = (al(t)1 ..., av(/)) — известная вектор-функция с измеримыми детерминированными компонентами а*(0> /=1, ..., АЛ Случайный процесс r\ = (r\t)y —. оо < t < оо, предполагается стационарным, Мг|0 = 0, гауссов- ским с дробно-рациональной спектральной плотностью "/(*,) = (Га) (17.2) Qn 0'W «—I « где Pn_{(z) = 2 Ь/г1', 6Л_, ^ 0, Q«(z)=Sfl/Z/, a„=l и корни уравнения Qn(z) = 0 лежат в левой полуплоскости. Основываясь на выведенных ранее уравнениях оптимальной фильтрации, найдем оценки максимального правдоподобия вектора 9 по результатам наблюдений gj = {gs> O^s^T}. 2. Будем предполагать, что у функций <*/(/) существуют производные gj{t)f /=»1, ..., N, и т J g*(t)dt <oo. (17.3) о Согласно теореме 15.4 процесс т] = (г]^), 0</<7\ является компонентой я-мерного процесса (rji(0, •.. »ть(0)>- гАе rl/==rli(0>
640 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 удовлетворяющего уравнениям dr\j(t) = r]j+i(t)dt + ^dWty /=1, ..., n-U (ПА) dx\n (t) = - 2 Я/Лу-н (i)dt + р„ ЙГ„ (17.5) /=о где Н? = (И^), О^^^Г, — некоторый винеровский процесс, не зависящий от т)/(0), /= 1, ..., п, а числа ру, /= 1, ..., N, задаются формулами i=l Согласно предположению p1 = &rt^1=^=0 и ^«[SftWei + ThWJ^+Pi^. (17.6) Поэтому, если g, = (g! (/), ..., gN (t)) — вектор-функция (строка), а б = (619 ..., QN)— вектор (столбец) неизвестных параметров, то dh = {gfi + r\2(t)]dt + ^dWt (17.7) dr\f(t) = r]m(t)dt + ^dWtt / = 2, ..., /i-lf я-1 1 <*o(h ~ М) - S я/Л/Ч 1 (0 Л + Р« <Я^. /=2 J В системе (17.7), (17.8) компоненты r\2(t), ..., r\n(t) являются ненаблюдаемыми. Процесс \t наблюдаем. Зафиксируем некоторое 9е^ и для соответствующих этому значению процессов \t и r\j(t) обозначим mdi(t,t) = M[r\i(t)\ts, 0<s<^ / = 2, .,., п, Y?,(0=M[(4| (*)-m?(*f g))(4/(0-mJ(/f 6))],/,/ = 2, ...f /i. Согласно уравнениям теоремы 10.3 ковариации у?/(0 не зависят от 8. При этом Yt7(0 — Y?/(0 удовлетворяют уравнениям (10.82), а + PlP/ + Y2/(/) [^-(g.e + mS^ Б))Д], / = 2, ..., /i-lf (17.9) Pi dmlV, |) = [- a0(|, - а,9) - *2 «/«y+i С S)l <" + + ii6n + YW(0tdgf_(g<e^.wfl(/> |))d^ (17Л0)
§ 1] МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 641 Далее, по теореме 7.17 процесс £ = (&), 0</<7\ допускает дифференциал dtt = [gfi + mQ2(t, D\dt + lxdWv (17.11) где W = {Wt, F]) — винеровский процесс и Р \(тЩ9 Dfdt <оо 1 = 1. о Наряду с процессом £ = (£/), 0<£^7\ рассмотрим процесс b = io+frWt, Io = гц (0), (17.12) и процессы tnef(ty |), / = 2, ..., п— 1, удовлетворяющие системе (17.9), (17.10), где вместо £ подставлен процесс |- Пусть fxe и Д — меры на (Сг,^г), соответствующие *) процессам l = (lt) и ! = (!/), 0<^<7\ определяемым из (17.11) и (17.12). В силу теоремы 7.19, леммы 4.10 и того факта, что £0 и |о = r)i (0) — гауссовские случайные величины (D|0 = D|0 > 0)> меры ц,е и ji эквивалентны, причем о pi о Pi J где-б?=М1о (—Мл? (О))- Выясним структуру величин mS|(/, £), входящих в (17.13). Из уравнений (17.9) и (17.10) нетрудно вывести **), что m\(U 6) = v0(/, t) + v{(t)Q, (17.14) где v0(t, £) ^-измеримы при каждом tt a v{(t) = (vn(t)9 ... ..., v]N(t)) — детерминированная вектор-функция (строка). *) $Т — борелевская а-алгебра в пространстве С~ непрерывных функций х = (xs), 0 < s < Т. **) Соответствующие рассуждения для случая дискретного времени см, в § 2 гл. 14.
642 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ (ГЛ. 17 Из (17.13) и (17.14) получаем ~5д-^ —ехр| 62 2 б2 -г- т , Г (g< + vi«))e + v0«, 1) ^ 1 Г i(gf + v, (р)е + у„ (/,!)]» ^ + j g ^-Tj g -at j. (17.15) Предположим, что матрица Dr=^i+ f^+v.coruri + v.wi^ (17Л6) о Pi является положительно определенной. Тогда из (17.15), дифференцируя, находим, что вектор Т вг(1) = DrX { ^ + j М+|Ж {dlt_ VQ (/, s) dt) J (17.17) максимизирует (17.15) и, следовательно, является оценкой максимального правдоподобия вектора 8. 3. Остановимся на некоторых свойствах оценок 9Г(£). Из (17.16), (17.17) и (17.11) следует, что вгЮ-D,- \^ + jla±^L[gt + Vimdt + I о Р{ > = e + DF1{^^ + /^t|Ml^/}, (17.18) и, значит, Мёг(|) = в, (17.19) М [(ёг (I) - 6) фт (g) - 0)*] = DT. (17.20) После несложных преобразований находим, что -^(D = exP{e-Dr6ra)-{e*Dre}. (17.21)
§ 1] МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 643 Отсюда вытекает, что оценка 9Г(|) является достаточной статистикой (§ 5 гл. 1). Наконец, так же, как и в случае дискретного времени (§ 2 гл. 14), показывается, что оценка 9Г(|) является эффективной. Итак, доказана Теорема 17.1. Пусть матрица DT, определяемая (17.16), является положительно определенной. Тогда оценка максимального правдоподобия QT(Q вектора 9 в схеме (17.1) задается формулой (17.17). Эта оценка является несмещенной и эффективной. 4. В качестве иллюстрации приведем один Пример. Оценим среднее значение 9 стационарного гаус- совского процесса £„ — оо < t < оо, со спектральной плотностью f(X) = a + i (а)2 + а +1 по результатам наблюдений g£ = {£s, 0<$<Г). Пусть 4)t = h — 9. Тогда r\t — стационарный гауссовский процесс с Мт), = 0 и спектральной плотностью f(l). По теореме 15.4 процесс r\t является компонентой двумерного процесса ("Hi (О» Лг^))» 41/ = 411(0» удовлетворяющего уравнениям dr\2(t) = [-r\i(t)-r\2(i)]dt, и, следовательно, dh = ib(t)dt + dWi9 dy\2 = [b-lt-i\2{t)]dt. Обозначим при фиксированном Oei?1 m» (t, I) = M (т)2 (t) \Г\) и Y (t) = M [t]2 (t) - m« {U l)\\ По теореме 10.3 и в силу уравнений для процесса (l(t), r\2(t)) имеем уравнения для mQ(t, l) и y(t): dm* (/, I) = [9 - \t - mQ (t9 I)] dt + y (t) [dh - m* (/, g) dt]9 y(0 = -2Y(0-y2(0. Эти уравнения решаются при начальных условиях те(0, I) = М h2(0) |У = М h2(0)| r){ (0) + 9], Y(0)=M[rb(0)~me(0, g)P>
644 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 которые находятся с помощью теоремы о нормальной корреляции (теорема 13.1). Согласно этой теореме те(о>|)==Млд(0)п2(0)(|о_е)) Мт]](0) v(o)»Mig(0)-^yy. Для отыскания моментов Мл?(0), Мт]2(0), МлДО) т)2(0) В0с' пользуемся стационарностью процесса (г){ (/), т)2(0)> — °° < t < оо, и тем фактом, что матрица Г^М Л? (О MOW Л ('К (О W > является единственным решением системы уравнений (теорема 15.4) АГ + ГА* + ВВ* = 0 Отсюда находим МЛ?(0) = 1, Мтй(0)=4, Мт|,(0)ть(0) = —g-. тв(0,1) = |(е-|0), y(0)=j. Таким образом, легко проверить, что e(M) = expl-J(l + Y(s))rfs 1у(е-10) + + JexpM(l + Y("))d« (0-|s)ds + о L0 J t |- S + J exp j (1 + Y(«))rf« Из этой формулы следует (см. (17.14)) Ш [t, l) = vy(/, D + v,(0e, Ys d£s f •
$ 21 ПРОЦЕСС ДИФФУЗИОННОГО ТИПА 645 и нетрудно подсчитать, что v0 (*,»=■< ,(M) = expl-J(H-Y(s))rfsJI—1-- t Г S -| -Jexp J(l+Y(a))d« \tudu + о Lo J + Jexp J (l+y(u))du v.dg.}. v1(0 = exp{-J(l + Y(s))rfs}{-5- + + jexpU(l+y(u))du\ds\. Поскольку Dg0 = MtjJ (0) = 11 то величина (см. (17.16)) Dr = т = 1 + J v\{t)dt > 0 (в нашем случае g, = 0) и оценка макси- о мального правдоподобия 9r(g) для среднего значения процесса lt задается формулой т вг (I) - —^ , . l + Jvf(/)£tt о § 2. Оценка параметра коэффициента сноса для процессов диффузионного типа 1. Пусть 8 — неизвестный параметр, — оо<6<оо, а | — —(£/> ^)» 0^/<Г, — процесс диффузионного типа с дифференциалом d\t = Qat (I) dt + dWti |0 - 0, (17.22) где W = (Wt, &~t) — винеровский процесс, a at (x) — неупрежда- ющие функционалы, 0^/^Г, хеСг. Рассмотрим задачу оценивания параметра 9, входящего в коэффициент сноса 9а,(£), по наблюдениям £o = {S,» $<7'}-
646 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 Будем предполагать, что функционалы at(x) удовлетворяют условиям pJla't(l)dt<oo\ = pJja^W)dt<oo\ = l9 (17.23) где индекс 9 у Ре подчеркивает то, что распределение процесса I рассматривается для данного значения 8. Согласно теореме 7.7 меры jxj| и \iw (цЦ (В) = Ре (со: |еВ}, В е $г), определенные на (Сг, $т), эквивалентны и е [ т т ) ^.(g)-expJeJa,(|)^-^JaJ(g)d/J. (17.24) Отсюда вытекает, что при условии Ре | J a2t(Qdt > 0 | = 1, Be/?1, оценка максимального правдоподобия QT(Q задается формулой т \at(l)dlt втШ = 1т— • (17.25) \a2t(l)dt о Изучим свойства этой оценки. Теорема 17.2. Пусть выполнены следующие условия: т sup f MeaJ6(|)d/<oo, (17.26) (T \~16 sup Me f a\{l)dt\ < oo (17.27) e,<e<e2 \J J для любых Qu 82 (— oo < Qx < 02 < oo). Тогда смещение 6r(8) = Me[9r(g) — 9] и среднеквадратичен екая ошибка Bt(Q) = Mq[Qt(Q — Q]2 определяются формулами т х -1 Ме)--^МвЦа|(Б)л| . (17.28) М9)-Мву аНОл) +да-Мву а|(Б)л] . (17.29)
§2] ПРОЦЕСС ДИФФУЗИОННОГО ТИПА 647 2. Предварительно установим справедливость следующих двух лемм. Лемма 17.1. Пусть 6 = 6(*) — ^-измеримая функция с sup Ме64(£) < оо для любых Qlf 92 (— оо < 9! < 92 < оо). 01^0^02 Если т sup MQi a*(l)dt<oof — oo<91<92<oo, (17.30) 0t<0<02 ft то функция Ме6(£) дифференцируема по 9 и ^Меб(|) = Мс 1 >(g)j*MI) <ш, (17.31) Доказательство. Обозначим е { т т Ф(е, Г) = -^-(Г) = ехр 9 jat(W)dWt-^- \a){W)dt w I о о Функция ф(9, W) дифференцируема по 0, и (Р-п. н.) ду (9, W) _ jat(W)dWt-Q \a]{W)dt Ф(9, W). (17.32) Пусть — оо < 9! < 92 < оо. Тогда в силу (17.32) Ме2бШ-Ме1ба) = Мб(Г)[Ф(92, W)-<p(Bu Г)] = е2гг = M6(^)J \at{W)-Q\a){W)dt е,1-о о Заметим, что согласно предположениям леммы Ф(9, W)dQ. е2 | г т т -ji |МU{W)\ j at(W)dWt — QJ a2t(W)dt L(9, W)dQ = e2 I г т т -| 1 = JMe 5(g) | at(l)dlt~Q \a]{l)dt U = e, I U о JI - /Me a(g)Ja,(g)£fldde<J Me62(i)MeJa2(|)^ et | о I o, L о J dd < oo.
648 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 Поэтому по теореме Фубини е2 г т т M6(W)j \\at{W)dWt-$\a\{W)dt е, Lo ф(8, W)dQ = т t dQ- /Мвв(Б) J at(l)dlt-Q\a](l)dt\ e, L0 о J = JMe 6(1) jat(t)dWt\dQ, 0, L 0 J и, значит, е2Г / т \ Мб26 (g) - Мо.б (Б) - J Me ( в (Б) J4 (Б) ^ в. dQ. (17.33) Отсюда следует, что М06(|) является абсолютно непрерывной функцией. Покажем теперь, что в (17.33) подынтегральная функция Ме6(|) Т "I Г Г Т "I j Ml) <НР, =М96(|) / at&)d$t-0 J a?(6)Л о J L0 о J является непрерывной по 9. Обозначим б, (6) = б (£) J a, (|) rfg„ 62 (|) = б (|) J a? (6) Л. Тогда Me6(i) Lo = Мвб,(Б)-еМА®, и для доказательства непрерывности достаточно лишь установить, что sup Ме6?(Б)<оо, /=1, 2, 0J<0<02 (17.34) для любых 81 < 82. Действительно, при выполнении этих условий функции Ме6*(Б), /=1, 2, как было показано, будут абсолютно непрерывными, а следовательно, и непрерывными. Имеем г т меад< меб<(юм lat(l)dtt 4ч 1/2
§ 2] ПРОЦЕСС ДИФФУЗИОННОГО ТИПА 649 где в силу неравенства Гёльдера (р = 4, q = 4/3) М6 Lo <2»| J4(D<*lJ -MeM at{l)dWt + Q\a](l)dt\ * о J Lo о J Гме IJ at (|) dw\ + 0<M9 f J a? (|) dt\ 1 < Г г г 1 < 23 36Г J M0a< (6) dt + в4Г3 J Ma» (g) Л . (17.35) (Здесь использована оценка I т .4 г М9М a,(|)dflM <36г|мвв«(6)Л, доказанная в лемме 4.12.) Из (17.35) и (17.30) следует требуемая оценка (17.34) с 1=1. Аналогично устанавливается оценка (17.34) и с / = 2. Лемма 17.2. Пусть 6(х)—<%т — измеримая функция и sup Me68(£)<oo (17.36) для любых 91 < 92. Если т sup Me f a\*&)dt< со, (17.37) е,<0<02 0 то функция Меб(|) дважды дифференциируема по 8 и ( Т v 2 Г -j \at{l)dWA -Ja|(6)tfJ. (17.38) Д зательство. В силу (17.31) и определения функ* ций 61Чо/, б2(|) (см. доказательство леммы 17.1) ^ Меб (Е) - Меб1 (|) - 9М А (6). (17.39) d2 Поэтому для существования второй производной -^ Меб (|) достаточно в силу леммы 17.1 проверить, что sup Me6?(£)<oo, * = 1,2# (17.40) е,<0<02 для любых 0! < 92.
650 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 1? В силу неравенства Коши — Буняковского Т ч8п1/2 меад = Metf(g)MeM at®dtt Используя неравенство Гёльдера (р = 8, q = 8/7) и лемму 4.12, находим, что (Т ч 8 г- Т Т -.8 J4(£)dU =М6 N0,(1)^ + 9/^(6)* < <27|Ме(/ at{l)dw\ + ВщЛ a){\)dt\ 1 < <27|284Г3/ Ма8(|)Л + 68Г7/ Меа'6(6)л1. (17.41) Аналогично показывается, что NU(|)<Гмеб8(6)Me(/ а\{%)dt\ 1/2 < < М^(1)Р /М6а'б(|)Л 1/2 Из этих неравенств и предположений леммы получаем требуемые неравенства (17.40). Для завершения доказательства осталось лишь заметить, что формула (17.38) следует из (17.39) и (17.31). 3. Доказательство теоремы 17.2. В силу (17.22) и (17.25) г \at(t)dWt er(i) = e + -4 (17.42) /«?<« dt Поэтому смещение т \at(l)d&t bT (в) = МЖ (£) - 0] = Мв -S \a](l)dt (17.43)
§ 3] ГАУССОВСКИЙ МАРКОВСКИЙ ПРОЦЕСС 651 По предположениям теоремы и в силу формулы (17.31) ■е т \а)(1) dt -1 jat(%)dWt p г -J-, Lo J что вместе с (17.43) доказывает представление (17.28). Далее, из (17.42) получаем Яг(е) = Ме[9гф-9]2=М9 Но по лемме 17.2 г* 7* 2 г- Т L,g г Т d2Mn т-2 J4d) dt d92 = Mfl Г T I"2 f / T \2 т J a? (6) Л Mat(S)drJ - \ a]{\) dt Lo J I \o /o = BT(Q)~ M Г T 1 /в?(5)Л -1 что эквивалентно (17.29). Теорема доказана. Замечание. Более детальное исследование величин Ьт(6) и BT(Q) для случая, когда at(x) = xt, проводится в следующем параграфе. § 3. Оценка параметра коэффициента сноса для одномерного гауссовского процесса 1. Будем предполагать, что наблюдаемый процесс £ = (!*, #"*), O^t^T, имеет дифференциал dlt = Qltdt + dWh £0 = 0 (17.44) (ср. с (17.22)), где 8 — неизвестный параметр, — оо<0<оо.
652 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ (ГЛ 17 Согласно (17.25) оценка максимального правдоподобия т J Ь dh 2 _ 6г(Б)—Ь вЛ-^-. (17.45) о о поскольку в силу формулы Ито ltdlt = -к[12т — Г]. о Найдем для рассматриваемого случая смещение &г(9) = = М0(9Г (I) — 9) и среднеквадратическую ошибку Вт (6) = = ме[ег(|)-е]2. Введем в рассмотрение вспомогательную функцию ММ)-Г 2KPT2J у^-Г. (17.46) Теорема 17.3. Смещение bT(Q) и среднеквадратическая ошибка BT(Q) задаются формулами ее ^(в)=J 4{ехр(--т-)р^9' а>На> <17-47) О г г Вг(6) —exp(-4f)| pr(9, a)da+Ja-^{exp(~-^)pr(9,a)}da. о о (17.48) Доказательство. Для отыскания величин Ьт (9) и Вт (9) воспользуемся представлениями (17.28), (17.29), полученными в теореме 17.2. Предварительно проверим выполнение предположений этой теоремы. Процесс l — du^t), 0<*<7\ с дифференциалом (17.44) является гауссовским с MGg, = 0 и дисперсией Г, (9) = Ме^, удовлетворяющей уравнению (см. теорему 15.1) ^Ж-2еГ,(е)+1, Г0(6) = 0. dt Отсюда находим г /а^ 29 что влечет за собой условие (17.26) теоремы 17.2. Г/(в)-4(^-1),
§3] ГАУССОВСКИЙ МАРКОВСКИЙ ПРОЦЕСС 653 Для проверки условия (17.27) и вычисления математических г Т ожиданий М0 т -I \l]dt\ , М6 \\l]dt -2 используемых при оты- (17.49) екании bT(Q) и flr(8), поступим следующим образом. Пусть а > 0 и г|)г(9, а) = Меехр|-а \l\dt\. Если предположить, что 00 { ak~l<tyT (Q, a) da <оо, — оо<6<оо, & = 1, 2, ..., (17.50) о то тогда моменты М0М l]dt\ , k = l, 2, ..., можно найти, используя функцию г|)г(8, а), по формулам г Т -,-fc оо U J о В самом деле, если для некоторого & = 1, 2, ... выполнено условие (17.50), то тогда по теореме Фубини 00 ОО / Т \ J а*-Ч7'(б> a)rfa= J a^^eexpf-a J ifrfnda = о о \ о / = Ме| а^»ехр(~а||2Л)йа==(й--1)!МеМ |» # j f & = 1, 2, ..• Итак, найдем функцию г|)г (9, а) и проверим справедливость неравенств (17.50). 2. Лемма 17.3. Функция фг (е, а) = ехр (- ^-) рг (9, а), (17.52) где рт (8, а) определено в (17.46). Доказательство. Пусть К== |Л)2 + 2а, 0<а < оо. Обозначим (igU и jLt^A. меры на (Сг, $г), отвечающие процессам £е и |\ имеющим соответственно дифференциалы d$ = e$dt + dWt9 |е0 = 0, dt) = Xt)dl + dWt, g*-0.
654 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 Согласно теореме 7.19 меры р^е и Я^л эквивалентны и d\i dh* е!«м«= (£*) = ехр ^-k)\\)d\\-^-\^fdt Поэтому i|)r(8, a) = M0exp f T ) [ T \-a\l\dt =Mexp -flj(g?)2 . T T T = Mexp \-aj(l)fdt + (B-X)jl)d%-?=P-j{l)y dt dt Поскольку а + ^ = 0, 17.53) (17.54) то f T 1 t|)r (9, a) = M exp [9 - Я] J g*d|* = M exp { i^i [(t*)2 - Г)} = l о .' = exp(A=^r)Mexp{l^(it)2}. Случайная величина |£ имеет нормальное распределение ЛМО, 2^(^2,—1))» и» значит (лемма 11.6), Ч 2 ^ГМ I (Я, — в) (в2ЛГ — 1) + 2Л J Вместе с (17.53) это приводит к следующему представлению: ^(9, a) = e 2 2к (Х-в)(е2КТ U+»r- <17-55) где согласно (17.54) Л=}/2а + 92. После простых преобразо- саний из (17.55) получаем требуемое представление (17.52). Замечание. Если 8 = 0, a = 1/2, то т Фг (o^Mexpj-jjVuj-P^j)»/^-^. 'Ср. с примером из § 7 гл. 7.) Завершим доказательство теоремы 17.3. Анализируя представление (17.52), находим, что неравенства (17.50) выполнены для любого £=1, 2, ... Поэтому формулы (17.47) и (17.48) ледуют из представлений (17.28), (17.29), (17.51) и (17.52).
ГАУССОВСКИЙ МАРКОВСКИЙ ПРОЦЕСС 655 3. Теорема 17.4. Оценка максимального правдоподобия Qr(l) сильно состоятельна, т. е. для каждого 9, —оо < 9 < оо, Pe{limfir(£) = e} = l. (17.56) Г->оо Доказательство. Из (17.49) получаем где +г(е,1)-ехр{(-{-!^-')7-)х 1/2 (/е2 + 2-е) + (j/e2 + 2 + е)ехР(- 2г у^ + е2) j # Поскольку limi|)r(9, 1) = 0, — оо < 9 < оо, то Г-Юо Ясно, что г \ltdWt er(i) = e J< (17.57) (17.58) \dt Поэтому для доказательства (17.56) достаточно показать, что } h dWt lim Л Г-Юо J« dt = 1, -оо<9<оо. Вытекает это из следующего общего утверждения. Лемма 17.4. Пусть на некотором вероятностном пространстве задан винеровский процесс W = (Wt, @~t)t t^O, и случайный процесс / = (//, &*t), />0 такой, что 1) Ру \ ftdt <оо) = 1, 0<Г<оо; 2)PnfUt=oo) = L
656 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 Тогда случайный процесс z = (zSi $s), 5^0, с zs = J ft dWt, о &s == ^т5, где xs = inf If: J /w da = s J , является винеровским о а с вероятностью единица *) J» о и <**« Hm -s-j = 0. (17.59) Доказательство. Если ft > 0 (Р-п. н.) для всех / > 0, то с вероятностью единица ts будет монотонно возрастающей непрерывной функцией от s. Отсюда следует, что случайный Ъ процесс zs= j ft dWt также имеет (Р-п. н.) непрерывные тра- о ектории. Далее, если s2^s{> то по свойствам стохастических интегралов M(*J»J-M(j"f.<flT.|r x) = ffudWu=zSi \Q J 0 И = My)ldul3rXs^ = s2 — sx. (17.60) Следовательно, процесс z = (zSi $s), s>0, является квадратично интегрируемым мартингалом со свойством (17.60). Значит, по определению (§ 1 гл. 4) этот процесс является винеровским. *) Под Г fa dWu подразумевается непрерывная модификация стохасти- о ческого интеграла, существующая согласно (4.47) и обобщению этого свой* етва для функций / е &т.
§ 31 ГАУССОВСКИЙ МАРКОВСКИЙ ПРОЦЕСС 657 Если же функция ft обращается в нуль, то проверка мар- тингальности и свойства (17.60) остается без изменений. Поэтому нужно лишь показать, что и в этом случае процесс Zs = \ fu dWu имеет (Р-п. н.) непрерывные траектории, о Процесс ts, 5^0, является монотонно неубывающим, и, следовательно, его разрывы имеют вид скачков. Разрывы же процесса zs, 5^0, могут происходить только в моменты раз- рыва процесса ts, s^O. Пусть ts- < ts+. Тогда J f2udu=0 и, следовательно, zs+ — zs- = J fudWu = 0. Это доказывает непрерывность (Р-п. н.) траекторий процесса zs> Перейдем к доказательству свойства (17.59). Обозначим t \fudWu ч-Ч о ts = inf I /: j f2u du — s I. Поскольку ts, s^O, является монотонно неубывающей функцией от st то для доказательства' (17.59) достаточно установить, что с вероятностью единица т)т ~>0, 5~>оо. Но для s>0 \hdWtt и введем моменты 'to ?о С J« du и из закона повторного логарифма (1.38) следует, что с вероятностью единица lim zs/s = Q. S-> О© Лемма доказана.
658 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 § 4. Двумерный гауссовскии марковский процесс. Оценка параметров 1. Предположим, что на интервале 0</^Г наблюдается двумерный гауссовскии марковский стационарный процесс l/ = (li(0. hit)) с нулевыми средними M|1(/) = Mg2(0 = 0» — оо < t < оо, допускающий дифференциал dlt = Altdt + dWt. (17.61) Здесь Wt = (Wi(t), №2(/)) —винеровский процесс с независимыми компонентами, не зависящий от |0, и / — в, — в2\ А={ е2 -ej <17-62> ■—матрица, составленная из координат вектора 0 = (8,, 92) с Q{ > О, —оо<82<оо, подлежащего оцениванию по наблюдениям Ц = [ъа§ о < 5 < г). Построим оценки максимального правдоподобия Q{ (Г, £) и 92(Г, |) неизвестных параметров 9! и 92. Теорема 17.5. Г. Оценка максимального правдоподобия 0j (Г, |) является решением, уравнения т МГ.б 1 2§t (Г, В) Б!(0) + Е2а(°) + 71[й(') + Й(0]л о т = j[h(t)dtl(t) + h(t)d%2(t)i (17.63) О 2°. Оценка т е2(г, g)=^—у : . (17.64) |[б!(о + й(0]л о 3°. Условные распределения*) PQ{Q2(T,l)<ci\t\(t) + ll(t), t<T) *) Ре обозначает распределение вероятностей, отвечающее фиксированному 9 = (6i, 02)v
§ 4] ДВУМЕРНЫЙ ГАУССОВСКИЙ МАРКОВСКИЙ ПРОЦЕСС 659 являются Ре-п. н. гауссовскими с параметрами Мв[§2(Г,6)1Е?(0+Ц(0, t<T\ = %, Mel(M<.8-W(0 + si(0. t<T\ = г Т I -1 В частности, распределение случайной величины (17.65) (17.66) [ё2(7\|)-е]|/ J [6?(О+ б|(0]л о яе зависит от Э = (81, 92) и является в точности нормальным, N(0, 1). 2. Доказательству этой теоремы предпошлем два вспомогательных утверждения. Лемма 17.5. Для каждого t, 0^/^Г, гауссовский вектор (£i (t), h(t)) имеет независимые компоненты с D^(0 —"og"» i=l, 2. Доказательство. Отметим прежде всего, что предположение стационарности процесса £,, —оо</<оо, автоматически влечет за собой ограничение 9, > 0, поскольку собственные числа матрицы А должны лежать в левой полуплоскости. Пусть Г = Щ^. Тогда по теореме 15.4 матрица г/г„ iv \ Г12 Г22/ является единственным решением уравнения ЛГ + ГЛ* + £'==0 или, что то же -2е1Г11-292Г12+1=0, — 29^,2 + в2 (Г„ — Гяа) = 0, 201Г12-291Г22+1=О. Отсюда находим Гп = Г22 = -2§-, Г12 = 0. Лемма доказана. Следствие. Функция распределения F* (хи х2) = Ре (Ei (0) < хи %2 (0) < х2) имеет плотность
660 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 Для формулировки следующего утверждения введем некоторые обозначения. Пусть (Сг, 3Вт) = (Сг X Сг, $т X 31т) — измеримое пространство функций c = {(cx(t), c2(t))y 0<^<Г}, где каждая из функций Ci(t)9 i=l, 2, является непрерывной. Через сх, где х = (хи х2), будем обозначать функции из 0?т с с{(0) = х19 с2(0) = хг Пусть ц|— мера в (С^,, Щ)9 отвечающая процессу l==(lt)> O^f^r, с заданным 9 = (8,, 92), a \iwx и \х\х — меры в (Сг, ^г), соответствующие процессу Wf = x-\-Wt (т. е. WXi(t) = — Xi + Wiit), /=1, 2) и процессу Iх с дифференциалом dft = Aftdt + dWt9 f0=x. (17.68) Если множество В е $г, то V\ (Г) - I ц\* (В) fB(xl9 x2) dx{ dx2. (17.69) {х €= R2: с* е в] В самом деле, решения уравнений (17.61) и (17.68) задаются соответственно формулами — oAt h = e t] = eAi Ъо+je-fdWt о t х+ je-A'dW, Поэтому из независимости случайных величин £0 и e~As dWs о следует Ре{| е В \10=х] = РвЙ* € B} = iil*(B), что, очевидно, и доказывает (17.69). Введем в (Сг, &т) новую меру *) v, полагая для В е $| '(Г)= J ц^ (B)dxxdxr {хеЯ2: /ев) (17.70) (Для краткости вместо (17.70) будем писать dv(x9 yx) = ^d\iwx{yx)dxxdx2, f еС2г) •) Отметим, что вводимая мера v неотрицательная и а-конечная.
ДВУМЕРНЫЙ ГАУССОВСКИЙ МАРКОВСКИЙ ПРОЦЕСС 661 По теореме 7.19 меры ц^ и ц^д эквивалентны и *ехр J {Wfj A' dW't-\\ {Wf)' A'AW? dt (17.71) о о Поэтому по теореме Фубини из (17.69) и (17.70) получаем, что "! (Г)= АГ-^'в(*1. X2)dv(X, у'), где fQ(xu x2) определяется формулой (17.67). Отсюда следует абсолютная непрерывность меры jli? no v и формула в, ■#в)-т«И 0 -±jrtA*Altdt\. (17.72) Итак, доказана Лемма 17.6. Мера р| абсолютно непрерывна относительно d\il меры v, t/ ее плотность -j-MS) определяется формулой (17.72). 3. Доказательство теоремы 17.5. Формулы (17.63) и (17.64) для оценок максимального правдоподобия Q{ (t, g) и ®2(Т, I) следуют из (17.72), поскольку они доставляют минимум d\il ln-j^-(^), что проверяется непосредственным подсчетом. Перейдем к доказательству заключительного пункта теоремы. Обозначим y\t = l2l(t) + ||(/). С помощью формулы Ито вычисляется, что Ль = 2g, (/) dg, (0 + 2g2 (0 tfg2(*) + 2 Л = = 2g,«) [- в.б! (0 -в2Ь«)]Л + 2li(t)dW{{t) + + 2g2 (/) [Bjg, (0 - 6& (0] Л + 2£2 (0 ЙГ2 (0 + 2 Л = - - 29, [g? (0 + g| (/)] dt + 2dt + 2 [g, (t) dWx (t) + g2 (t) dW2 Щ = = 2(1-8^1^ + 2 V^dWx(t), (17.73) где (в предположении, что r\s > 0) t t '#,(*)= (h&rdwl(s)+ \kl?LdW2(s). (17.74)
662 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 Из теоремы 4.1 вытекает, что (W{(t), &"t), 0</<7\ является винеровским процессом. Следовательно, для заданного 0 = (01, 02) совокупность объектов s£ = (Q, &', SFи Р, х\и W{ (t)) образует слабое решение *) стохастического дифференциального уравнения dr)t = 2 [ 1 - в,^] dt + 2V^t dWx (t). (17.75) Покажем сейчас, что для каждого t, O^t^T, величины r\t являются #~?0' Wl -измеримыми и Р {inf r\t > 0} = 1. Иначе го- воря, процесс Л/— S? (0 + £! О является сильным решением уравнения (17.75), где винеровский процесс (W{ (t), &~t), 0</<7\ определен в (17.74). С этой целью изучим некоторые свойства слабых решений уравнения типа (17.75). Пусть s4> = (Q, &~, #"„ Р, xty zt) есть слабое решение уравнения dxt = 2[\—axt]dt + 2YTtdzti a>0, (17.76) где х0 таково, что Р(х0 > 0) = 1, MxQ < оо. Докажем, что Msudat^oo. Для этого положим Ом = \ ( inf{/<T: supxs^N), Г, если supxs<N. s<7* Тогда в силу (17.76) t AoN t A oN xtAoN = xo + 2 J [l-a*.]ds+ j \[Tsdzs, (17.77) tAoN и поскольку М j \/xs dzs = 0y то о tAoN MxtAo = Mx0 + 2M J [1 — axs]ds^ о t AoN <Mx0 + 2M j \l + axsAoN]ds^ 0 t t <MU0+2M f [1 + axsAON\ds^MxQ + 2T + 2a]i MxsA<,Nds* *) См. определение 8 в § 4 гл. 4*
§4] ДВУМЕРНЫЙ ГАУССОВСКИЙ МАРКОВСКИЙ ПРОЦЕСС 663 2аТ (17.78) <Лол Отсюда по лемме 4.13 следует М*(Лвлг<(М*ь + 27)* а значит (лемма Фату), Мх^(Мх0 + 2Т)е2аТ. Далее, т ШХ*л°„°о + 2 J П + axa]ds + 2suq и Т I * Л Оц Msupx,An <MU0 + 2 f [l+aMxs]ds + 2Msup\ f ]/~xsdWs В силу неравенства Коши — Буняковского и (4.54) J /*5 dzs М su sup *ЛоЛ J Vx8 dzs * Л°ы 12 п 1/2 Поэтому М sup I | Y~xl dzt <2l M J xsds\ <2(М $ xsds\ . T r- T -,1/2 sup^A„ <:Мх„ + 2 [[l+aMxs]ds + 4\ [ Mxsds\ . t<TlAaN J [J J Применяя лемму Фату и используя оценку (17.78), получаем требуемое неравенство Msupx, <оо. Покажем теперь, что P{inf xt > 0} = 1. Для доказательства этого положим т« = inf^inf^^), оо, если inf*s>j^—. Из формулы Ито нетрудно найти, что -1пхХпАг = -\пх0 + 2а(тпЛТ)-2 j **L хплт VT*
664 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 15 Поэтому для е > О "¥о>е)1п\лг = = -Х{*о>е}1п*0 + Х{,0>е,2«(тпЛГ)»2 j* %o>e)i|< т„ЛГ <-X{„>e>ln^o + 2«7,-2 J Х{,0>е}-^. (17.79) о * s хпЛТ Поскольку М J %{Xo>e)-^ = Oy то о " s -Мк{Хо>е]\пхХпАТ^М\х{Хо>е]\пх0\ + 2аТ. (17.80) Но Цх0>г}{п\лТ = = Х{,о > Ш]Х^ Л г< 1} In хХпАТ + %{,„ > .jX^ лг>|}|п\лг< < Х{*0 > 8}XpTfj л г<'},П Ч л г + f JJ *«» что вместе с (17.79) приводит к неравенству М%о>е}Х{%лг<1}||пЧлН^ < М | Х(*. >е}1плг?( + 2аТ + М supr xs (= с (в) < оо), из которого в свою очередь следует неравенство Mx{,o>e}X{X/i<r}X{%<1}|ln^n|<c(8)<oo. (17.81) Пусть т = lim т„. Тогда, переходя в (17.81) к пределу при я->оо, получаем, что M^0>e}5C{x<n^t<i}|ln^|<^8)<00- (17-82) На множестве {т<Г} |lnxj=oo. Поэтому в силу (17.82) Р{х0>е, т<7\ хт<1} = 0. Но хх = 0 на множестве {т ^ Г}, следовательно, Р{*о>е, т<Г} = 0. (17.83) Наконец, Р{т<Г} = Р{т<Т, *0>в} + Р{т<7\ *0<е}< ^ Р [xQ <; &) -> 0, 8 | 0,
§ 4] ДВУМЕРНЫЙ ГАУССОВСКИЙ МАРКОВСКИЙ ПРОЦЕСС 665 что вместе с (17.83) приводит к искомому соотношению P{infx, = 0} = P{T<r} = 0. Итак, процесс r\t = £?(*) + £§(/), 0<*<7\ таков, что для любого 9 = (9b 82), Qi > 0, — оо < 92 < оо, Ре{inf т|/>0}=1. (17.84) Используем этот результат для доказательства того, что при каждом t, 0<*<Г, случайные величины x\t являются &*p,Wl- измеримыми. Введем функции 1 1 ^ . 8п(У) = \ , , 2 у п п Ьп(х)=1 + j gn(y)dy. i Ясно, что 0 < gn(y)<^ v- и "m bn(x)=]/rx- Для каждого 2 у п п>оо п=\у 2, ... рассмотрим уравнение t t t} = Чо + 2 J [1 - 9lVtjn)] ds + 2\bn (rfO dWx (s). (17.85) Коэффициенты этого уравнения удовлетворяют предположениям теоремы 4.6, и поэтому у него существует единственное сильное решение х\[п\ O^t^T. Обозначим (inf{«r:r,,<41 On (Л) = \ , Т, если . inf ть > —. ' . ( s<r " Тогда ясно, что для всех t<len(r\) т)<"> =ti<(Pe-n. н.) и оп(г\) = *= <т« (•П(га)). Следовательно, tftl^W»») = TW„w Ho величины;
666 ОЦЕНКА flAPAMEtPOB И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 Tj(n) , (n)v являются 2F^ ^'-измеримыми. Поэтому таковы же *) и величины тьд- (чЛ. Но в силу (17.84) liman(r\) = T (Ре-п. н.). Отсюда вытекает, что r\t Уу* ^'-измеримы для каждого U Преобразуя выражение (17.64) для е2 (Т, 1)> находим, что т т J Si (О dW2 (*)- \l2 {jt)dWx (t) Mr, 0-ea + -2 f ^ J [б? (0 + 62(0] л о T j V^dW2 (t) = 62 + - J > (17-86) J r\tdt где т W2 (t) = - f -Ш dfl^ (0 + f iiE tf№2 (0. (17.87) Из теоремы 4.2 следует, что [(ЙГ, (0, W2(t))> &~.t]> 0<f<7\ является винеровским процессом. Поскольку т}0 = |f (0) -+ + |2(0)>0 (Р-п. н.)и Мет]о = -^<оо длявсехе = (91,е2)с91>0, — оо<82<оо, то согласно доказанному выше r\t при каждом t &"$» ^-измеримо. Но процесс W2 (0 не зависит от % и W{ (t). Поэтому независимы между собой и процессы т) = (т]„ yt)t W2 = (w2(t), &~t). Отсюда вытекает, что Р-п. н. условное распределение Pel j" V^tdW2(t)^yUt, /<Г является нормальным, ЛМ0, J т^Л]. В частности, это доказывает формулы (17.65), (17.66). Теорема доказана. *) сг*алгебры ^J1»' w\ 0^/^Г, считаются пополненными множествами Ре-меры нуль для всех допустимых значений 9 = (9Ь 82).
§5] ПОСЛЕДОВАТЕЛЬНЫЕ ОЦЕНКИ 667 Замечание. Поскольку для любого допустимого 6 = (91э Q^} то из (17.63) и (17.64) нетрудно вывести, что оценки 9* (Г, g), /=1,2, являются состоятельными, т. е. для любого е>0 ИтРв{|в,(Г, i) — 9£ | > е} = 0. Г>оо § 5. Последовательные оценки максимального правдоподобия 1. Как и в § 2, пусть 9 — неизвестный параметр, — оо < 9 < оо, подлежащий оцениванию по наблюдениям за процессом 1 = = (£/, @~t)y />0, с дифференциалом d\t = Qat (I) dt + dWi9 g0 - 0. (17.88) В предположениях (17.23) оценка максимального правдоподобия QT(l) параметра 9 задается формулой (17.25). Вообще говоря, эта оценка является смещенной и ее смещение Ьт (9) и среднеквадратическая ошибка BT(Q) определяются (в предположениях (17.26), (17.27)) формулами (17.28) и (17.29) соответственно. При этом согласно неравенству Рао — Крамера — Вол- фовитца (теорема 7.22) вт{в)> 1 + сШ2 М« > о =L_L + М, J а](1) dt ^Ме J«! (i) I-U2 dt (17.89) где равенство, вообще говоря, может и не достигаться. Для рассматриваемой задачи изучим свойства последовательных оценок максимального правдоподобия, полученных с помощью последовательных планов А=Д (т, б) (см. § 8 гл. 7), каждый из которых характеризуется моментом прекращения наблюдений т = т(£) и ^i-измеримой функцией 6(g), являющейся оценкой параметра 9. Теорема 17.6. Пусть для всех 9, — оо < 9 < оо, Pe{ J <*?(£)#=«> } = !■ (17-90)
668 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 Тогда последовательные планы Дя = Д(т//, 6Я), 0<#<оо, с Тя(Й = 1п1/: \a]{l)ds = H\ (17.91) тя(6) Ьн(1) = тг \ а<(М< (17'92) о обладают следующими свойствами: Рв(тя(1)<°°)=1» -°о<е<оо, (17.93) Мебя(|) = е, -оо<0<оо, (17.94) Ме[бя(1)-е]2^-^. (17.95) Случайная величина 6Я(|) является гауссовской, ЛМ9, -^-). В классе Дя несмещенных последовательных планов Л (т, б), удовлетворяющих условию Ре JaJ(g)tf<oo J = Pel Ja^(r)rf/<oo| = l (17.96) а условиям X Me62(i)<oo, MeJa*(g)d*<#, (17.97) о где Н — заданная константа, 0 < Я < оо, ялая Дя = Д (тя, бя) является оптимальным в среднеквадратическом смысле: ме[бяа)-е]2<м0[б(£)-е]2. (17.98) Доказательство. Согласно теореме 7.10 и предположению (17.96) меры ц® s и \i*tW, отвечающие процессам | (с заданным 9) и W, эквивалентны и -^-(т(|), £) = ехр 9 Г at(l)dlt-^\ a](l)dt\. (17.99) Отсюда вытекает, что последовательная оценка максимального правдоподобия х(£) fit«>(g) = -T(S • (17.100) J a](l)dt
§51 ПОСЛЕДОВАТЕЛЬНЫЕ ОЦЕНКИ 669 Полагая в (17.100) т(£) = тя(£) и обозначая 6н(1) = ^хнаъ получаем для оценки 6Я(£) представление (17.92). Для проверки свойства (17.93) достаточно заметить, что откуда в силу (17.90) вытекает, что Pe{^^ = oo] = Pe{j«?(l)^<^}=0. *0 Далее, *я«> 6H($) = Q-± j at(l)dWt и по лемме 17.4 величина [6Я (|) — 9] ]/7/ является нормально распределенной, N(0,1), для каждого 9. Наконец, согласно теореме 7.22 для любого несмещенного плана Д = Д(т, б), удовлетворяющего условиям (17.96) и (17.97), Ме[6(|)-9]2>' MeJ a\(l)dt о ^77"' ~ 00<е<00- Сравнение этого неравенства с (17.95) показывает, что план Дя = А (тя, 6Я) является оптимальным в среднеквадратическом смысле. Теорема доказана. 2. Свойство (17.95) раскрывает смысл константы Н > 0, входящей в определение планов Дя = Д(тя, 6Я): если требуется построить последовательный план, для которого дисперсия ошибки (при всех 9, — оо < 9 < оо) равна заданной величине е>0, то в качестве такого плана можно взять план Ая= = Д(тя,6я)с#=4. Согласно утверждениям теоремы 17.6 этот план обладает рядом несомненных достоинств: он является несмещенным, а тот факт, что распределение величины (бя (|)—9) |/# является в точности нормальным, N(0f 1), дает возможность строить для 9 доверительные интервалы. Возникает, однако, существенный вопрос: не являются ли эти достоинства следствием того, что среднее время наблюдения М0тя является слишком большим? В приводимой ниже
670 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 теореме для случая *) at(x) = xt даются оценки этого среднего времени в зависимости от задаваемой величины дисперсии ошибки. Теорема 17.7. Пусть наблюдаемый процесс £„ / > 0, имеет дифференциал dh = Q$tdt + dWt. (17.101) Тогда для последовательного плана Дя = Д (тя, 6Я), Я > 0, при всех п= 1,2, ... Мет£ (IX оо, - оо < 6 < оо, (17.102) и Метя(|)<2[ |9 |Я + 2 УЩ + V8 (92Я2 + АН) + 2Я, (17.103) — оо < 9 < оо. Б случае 9 < 0 (Зля Метя (£) справедлива оценка снизу: Метя(£)>-29Я. (17.104) Доказательство. Прежде всего заметим, что в рассматриваемом случае оценка о может быть переписана в следующем виде: М5) = йу ПОСКОЛЬКУ | ^ tf^ = | (£2 _ fy о Для доказательства неравенств (17.102) заметим, что по формуле Ито l* = 2BJ%ds + 2ll8dWs + t. (17.105) о о Отсюда получаем о о \о ' о Ч ' *) Из теоремы 17.4 следует, что Ре \ \ ltdt = оо \ = 1, 19 | < oq.
§5] ПОСЛЕДОВАТЕЛЬНЫЕ ОЦЕНКИ 671 и, следовательно, *я(«/ t *я(«/ * \ тя^/ * \ т^(9<2Я-4в/ [\l\ds\dt-A\ \\lsdWs\dt о \о / о \о / I * <2Я + 4|9|тя(£) + 4т„(1) sup 0</<тн(5) (17.106) Обозначим р= sup получим *2я(1)-4тя(Ш1е|Я + р]-2Я<0, а значит для каждого 9 Тогда из (17.106) Тя(Ю<2[|6|Я+р]+1/4[|е|Я + р]2 + 2Я. (17.107) По теореме 3.2 для р>\ М0РР = Ме sup \1H® jtsdsl )<(7£_)РМв J g.^. |*я<*> Поэтому (р = 2m) МеГ<(^тГ|И0| jhdW. I 0 = (^Т)2т(2т-1)!!Я'"<оо( (17.108) поскольку случайная величина j |^й^~Л^(0,Я). о Из (17.107) и (17.108) получаем неравенство Ме[тд (£)]"< оо, — оо < 9 < то, п = 1,2, ... В частности, для случая п = 1 Метя(1)<2[ |9 |Я+(М9р2)'/а]+ У8(62Я2+ М9р2) + 2Я < <2[|9|Я + 2^Я]+1/8(92Я2 + 4Я) + 2Я. Для вывода оценки (17.104) достаточно заметить, что в случае 9 < 0 из (17.105) следует неравенство *н (в) *я(!)>-26Я- J %sdWs. О Усредняя обе части этого неравенства, получаем оценку (17.104). Теорема доказана.
672 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ . [ГЛ. 17 § 6. Последовательное различение двух простых гипотез для процессов И то 1. Пусть на вероятностном пространстве (Q, #", Р) заданы неубывающее семейство а-алгебр !Ft, t ^ 0, &~ts 5F, винеровский процесс W = (Wt, 2Tt) и (ненаблюдаемый) не зависящий от W процесс 8 = (8„#"f), /^0. Относительно наблюдаемого процесса £ = (£/,#"'/)> t^Oy имеются гипотезы Я0: dlt = dWi9 ^o = 0, (17.109) Я,: ^ = 9,^ + ^,^ = 0. (17.110) Иначе говоря, если процесс 9 трактуется как «сигнал», а винеровский процесс как «шум», то рассматриваемая задача состоит в различении двух гипотез относительно присутствия (гипотеза Я,) или отсутствия (гипотеза Я0) сигнала 9 по результатам наблюдений за процессом £, Будем рассматривать последовательные планы Д = Д(т, 6) различения гипотез, характеризуемые моментом прекращения наблюдений т и функцией заключительного решения б. Предполагается, что х = %(х) является марковским моментом (относительно системы &&t = a{x: xs, s^t}y где x = (xt)9 t^0,— непрерывные функции с *0 = 0), а функция б = 6(х) ^-измерима и принимает два значения: 0 и 1. Решение б(х) = 0 будет отождествляться с решением о принятии (справедливости) гипотезы Я0. Если же б(х)=1, то будет приниматься гипотеза Я]. С каждым планом Д = Д(т, б) свяжем величины*) а (Д) = Р1 (б (Е) = 0), р (Д) = Р0 {б (Б) - 1}, называемые вероятностями ошибок первого и второго рода. Хорошо известно **), что для случая Qt = c=£0 в классе Ад, р последовательных планов Д = Д(т, б) с а(Д)<!а, р(Д)<|3 (а и Р — заданные константы, а + р<1) и М0т(£)<оо, Mit(^)<oo существует план Д = Д(т, б), оптимальный в том смысле, что М0т<М0т, М,т<М!Т (17.111) для любого другого плана Д = Д (т,б) е Да, р. ' Оказывается, что в определенном смысле этот результат может оыть распространен и на более общий класс случайных процессов 0 = (0/, @~t), t^0. *) Pj обозначает распределение вероятностей для случая, когда рассматриваемый процесс £ удовлетворяет гипотезе Н^ i = 0, 1. Через Mt- бу* дет обозначаться соответствующее усреднение* **) См., например, § 2 гл. 4 в [169J.
§ 6] ПОСЛЕДОВАТЕЛЬНОЕ РАЗЛИЧЕНИЕ ГИПОТЕЗ 673 Будем предполагать, что рассматриваемый процесс 9 = = (9/>^/). ^0, удовлетворяет условию М|в/|<оо, t< оо, (17.112) и Р,{ J m*&)dt=oo |=Р0 { jm*(l)dt=oo\ = l9 (17.113) где функционал mt(x), t^O, таков, что при почти всех t^O тЛЪ) = ЩЬ\Р)) Р-п.н. Через Да, з обозначим класс последовательных планов Д = = Д (т, б) с а (Д) < а, р (Д) < р, где а + р < 1, и х (I) х (I) M0J m]{l)dt<ooy -Mi J m]{l)dt<oo. (17.114) о о Теорема" 17.8. Пусть выполнены условия (17.112), (17.113). Тогда в классе Да> р существует план Д = Д (f, 6), оптимальный в том смысле, что для любого другого плана Д = Д (т, 6) е е Да - р *($> ■ t(S) M0J m?(9*<M0J ет*(6)Л. о о *(&> T(g) M,J m?(g)*<Mj т?(|)Л. t°<t> *<» 07.116) о о Ялая Д = Д (т, б) определяется соотношениями x(l) = mi{f. К(1)Ф(А, В)}, (17.116) где о о При этом f (6) — а М0| т|(£)Л = 2ю(Р, а), о т<1> М, J т?(|)Л = 2ю(а, р), «а, (17-118)
674 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 где ©(*, 0) = О-*)1п-^+*1Птзр (17.119) Доказательству теоремы предпошлем ряд вспомогательных утверждений. 2. Лемма 17.7. Для плана Д = Д(т, б) Po(t(£)<~) = Pi(t(£)<°o)==1. Доказательство. В случае гипотезы Н0 lt = Wt и Ро (т (£) < оо) = Р (f (Г) < оо). Положим ^(^) = inf|/: J s О Тогда m](W)ds^n *тлопт U(F)ла„(F) (Ю = \ Щ(W)dWt-± j m\(W) dt о о иЛ<1|(W)лort(if) (Ю<В. Следовательно, t'dr)Aart(Tr) *тлопт Л< Г т,(Г)аИ^--уМ Г' m2s(W)ds^B. о о Поэтому f (1Г)Лап(1Г) М J m*{W)ds^2(B —A) <oo, (17.120) о поскольку 0< а + р< 1, и, значит, В—Л=1п |—-^ • Т <°о. Из (17.120) и (17.113) получаем, что t (W) М J m\(W)ds<2(Б — Л)< оо. о Поскольку Mj m2s(r)rfs>Mx{tWs=0O)f/n2(r)dS( о 6 то в силу предположения (17.113) P(x(W) < оо) = 1.
§ 6] ПОСЛЕДОВАТЕЛЬНОЕ РАЗЛИЧЕНИЕ ГИПОТЕЗ 675 Аналогично доказывается и равенство Pi(f(|) < оо) = 1. Для этого полезно заметить, что согласно теореме 7.12 процесс lti />0, с дифференциалом (17.110) допускает также дифференциал dlt = mt(l)dt + dWt (17.121) с некоторым винеровским процессом W = {Wt, У\\ />0. Следовательно, в случае гипотезы Н{ t t К (I) = \ ms (|) dWs +1j* m\ (|) ds. (17.122) 0 0 Следствие. Случайная величина A? (*)(£) принимает (P0- и Ррп. н.) лишь два значения: А или В. Лемма 17.8. Для плана Д = Л (т, 6), определимого в (17.116), (17.117), а(Д) = а, р(Д) = р. Доказательство. Поскольку а(Д) = Р1{в(6)-0} = Р,{Лт(е,(9 = Л} и Р (Д) = Po{6(g)=l} = Po {At (6) (Ю = В}, то для доказательства леммы надо установить, что Pi {*т <» (I) = А} = а, Ро = {Лт(6, (£) = В} = р, (17.123) где Л = 1пу^|-, fi = ln-^jpk (17.124) Для этого рассмотрим решения а(х)9 Ь(х), Л^л:<В, дифференциальных уравнений а"(*) + а'(*) = 0, a(A)=l, а(В) = 0, (17.125) Ь"{х) + Ь'(х) = 0, b{A) = 0y b(B)=V. (17.126) Ясно, что и в силу (17.124) рА (рВ-х __ Л х _ А a^= ев_ел }- b(x)=jsZ^I (17-127) а(0) = а, 6(0) = р. (17.128) Покажем, что Р,{Л?(£)(|) = Л} = а. Для этого обозначим o„(|) = inf Ь: Jm2(|)ds>« 1. Тогда, учитывая (17.122) и
676 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 (17.125), по формуле Ито, примененной к a (MS))» находим t(l)Aan(l) a(*t№>лоя (6)) = «(<>)+ J af(kt(l))mt(l)dWt + о f (5)ЛаЛ(1) + 1 J [а' (А,, (Б)) + а"(A, (I))] m\ (g) dt- о t ft) Л а„ ft) = а+ | а'(М6))М6)^. о Но tft)Aonft> t(6)Aan(6) М, ( [а'(М6))/М6)12Л< sup [a'(*)FM, f т?(Б)Л< <я sup [a' (x)f < oo. Поэтому tft)A0„ft) Mi J a4M£))m^)dr, = 0, о и, следовательно, беря в (17.129) математическое ожидание Mi( •), получаем M,a(A*fc>Aff/lft)(g)) = a. Функция a(x) при Л<х<В ограничена и lim art(£) — °o (Р-п. н.). Поэтому по теореме о мажорируемой сходимости (теорема 1.4) Ma (At (£)(£)) = а. Используя лемму 17.7 и ее следствие, находим, что а=М1а(Ях(|)Ш) = = 1 ' Pi (*t ft) (I) = А} + 0 • Р {А* и, (^) = В} = Р, {А, (6) (Б) = Л}. Аналогично доказывается и формула Ро{Ат(£)(£) = й} = Р- Лемма 17.9. Для плана Д = Д (т, б) справедливы формулы (17.118). Доказательство. Обозначим g0(*)> g\(x)> A^.x^B, решения дифференциальных уравнений ё'1 W + (- 1)'+' • St (*) = - 2, gt (A) =» ^ (В) = 0, / = 0, 1 • (17.130)
§6] ПОСЛЕДОВАТЕЛЬНОЕ РАЗЛИЧЕНИЕ ГИПОТЕЗ 677 Непосредственный подсчет показывает, что w-*\"-7?f-*+*-*] <»■ 131) 8\ Ы-*{{*-?1*ГА)-* + *]. 07Л32) С учетом (17.124) и (17.119) отсюда находим, что -£0(0) = 2со(р, а), (17.133) ^(0) = 2(о(а, р). (17.134) Пусть верна гипотеза Н0 и ап (W)=ini \ U f m\ (W) ds^n 1, л =1,2, ... Тогда, применяя формулу Ито к g0(M^))» получаем t(W)Aon(W) go (Ят (V) л оЛ (in (Щ = £о (0) + J ^ (К (Щ Щ (W) dWt- 0 t(W)Aon(W) -Т J [^(^(1Ю)-йГ(\(Ю)]«?(Г)Л=| о = £о(0) + J g'(\{W))mt{W)dWt+ J- ет*(1Р)Л. о о (17.135) ?(W) Л a„(W) Поскольку М J g' (Л, (Г)) mt (W) dWt = 0, то, усредняя обе о части (17.135), подходим к равенству т т л оп (W) М / «?0Г)Л=--*в(0) + М*о(ЯЧ1Г)Л „(Ю(^)> (17.136)
678 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 Переходя в (17.136) к пределу, получаем требуемое равенство М J m?OF)# = -go(0) = 2©(P,a). о Аналогично доказывается и равенство М, J m?(g)A = fifi(0) = 2©(a>p). Лемма доказана. 3. Доказательство теоремы 17.8. Пусть А = Д (т, 6) — некоторый план, принадлежащий классу Да.р. Обозначим \хх, i n\iXfW сужения мер ц^ и jx^, отвечающих процессу | с дифференциалом (17.110) и винеровскому процессу W, на а-алгебру $х- Тогда в силу условий (17.112) — (17.114) и предположения (17.121) из теоремы 7.10 находим, что \хх ^ ~ \хх w, x(W) x (W) ,П^77(т' Г)= j nts{W)dW8-jj m\{W)ds (17.137) о о ln*^i(Tfg) = - Jw.ttJ^ + jJ ^JOds. (17.138) Отсюда следует: Mein^f(T,a- t<6) t(W) :JM0 J m2(|)ds=4M J «S(W*. (17-1?9> M, 0 til) .In^-^O-iMj.»»©^. (17.140)
ПОСЛЕДОВАТЕЛЬНОЕ РАЗЛИЧЕНИЕ ГИПОТЕЗ 679 Используя неравенство Иенсена, получаем о -м,{|пм,[^,1)|а(|)]}- --Р,{в(Б) = 1}1пМ, -PiM)=0}lnM dP%. w d\iXt | d\iXt w (x,i) Utt)=i d|x т. I (T,l) 6(i)=o = -Pi{6(i) = i}in- Р,{в(|)-1}М, rfn T, rfp. t, I -(*.» 6(i) = i -P,{6(i)=o}in p1{6(i)=o}M, p.{*(i)-i} 4 6 *(l)-o p.{6(i)=o} (17.141) Заметим теперь, что в силу эквивалентности цт 5 ~ ц.т ^ для г = 0, 1 Po{6(i)=o=P{6W=t}=MlX{6(l)=i}-^:(T,i)= = М1{х{а(5) = »М1[^1(т(|)|б(|)=1-]} = -Р.{.в№)-*}м1[^(т,а|в©-/]. Отсюда следует, что неравенство (17.141) может быть преобразовано таким образом: *№) i-M.J* m]{l)dt>-Pi{b{\)=m 1]%%2^ - -p.(a(6)»o)ing;g;g:;; = -Pl{»(e-i)taftj{^+Pl№e,-4M„^=j> >(l-a)ln-i=^ + aln14? = 4MIJ mj(|)rf/f где последнее равенство вытекает из 4еммы 17.9Г
680 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 Аналогично доказывается и неравенство М0| т?(6)Л>М0/ m](l)dt о о Следствие. Пусть Qts=s(t)9 где s(t)t t^O, — детерми- оо нированная дифференцируемая функция такая, что j s2(t)dt=oo о a s(<)s'(0^0. (Яз эгшс предположений следует, что функция Ф(/) = Г 52 (и) du является выпуклой книзу, Ф (0) = 0, Ф (оо) = оо.) о Пусть а, р — заданные числа, 0<а + Р<1» и Да> § — рассмотренный выше класс последовательных планов. Обозначим Дг = — (Г, 6т) план, принадлежащий классу Да, р а имеющий фиксированную длительность наблюдения, равную Ту 0<Г<оо. (Приме-, ром такого плана является тест Неймана—Пирсона.) Тогда оптимальный план Д = (т, б)^Да, е имеет М0т^Г, Mjf^T. t(6) В самом деле, по доказанной теореме М* | s2(t)dt^O(T)t о 1 = 0, 1, откуда по неравенству Йенсена Ф (Г) > М*Ф (т (£)) > >Ф(М*т (£)), и, следовательно, Г>М,т(£), / = 0, 1. § 7. Некоторые применения к стохастической аппроксимации Пусть 9 — неизвестный параметр, — оо < 9 < оо, подлежащий оцениванию по наблюдениям за процессом £ = (£,), /^0, с дифференциалом dlt = [Ao(t> l) + Ax(t, t)Q]dt + B(t,t)dWt, g0 = 0. (17.142) Неупреждающие функционалы А0 (t, x), А{ (t, x), В (t, x), заданные на [0, оо) X С, где С — пространство непрерывных функций x = (xt), t^0, предполагаются такими, что т 1) |[Ло(/, х)+. A\{t, x) + B2(i, x)]dt <<х>, Г<оо, *е=С; о 2) B2(t,x)^d>0, t<oo, *<=С; оо 3) f A*{t,x) dt = oo, xz=C; ' j B* (t, x) 4) для B{t,x) выполнены условия (4.110), (4.111).
§ 7] СТОХАСТИ^СКАЯ АППРОКСИМАЦИЯ 681 Если бы параметр 8 был гауссовской случайной величиной, N(0, а2), не зависящей от винеровского процесса Wu />0, то тогда согласно (12.34) и (12.35) условное математическое ожидание mt = M (9/19")) и условная дисперсия у,=М [(9,—mt)2\ @~\\ задавались бы формулами ' Г ^ 2 "1-1 m<=ytjl?r^ldh-Ao(s,t)dsb yt = \±+jl±^ds о L о (17.143) которые следуют из уравнений dmt = У-ф^§- [dlt - (Л0 (t, |) + Л, (*, |) /»,) dt], m0 = О, (17.144) Y^lC» 6)- 2 ,17un Y<=" ЩЩ~' Yo = a- (17.145) (Г A* (s x) Заметим, что при а2 = оо и ' ' . ds > О, a;g С, оценка т,, о определяемая формулой (17.143), превращается в оценку максимального правдоподобия для параметра 9.) В том случае, когда о вероятностной природе параметра 8 ничего не известно, естественно задаться вопросом о том, а не будет ли оценка т*}, t^O, определяемая из уравнения dm*t — Ax(U l)4tB-2[ty \){^^{Ми\) + Ax(U\)mf)dt), (17.146) где 0 < а2 ^ оо, сходиться в каком-либо подходящем смысле к истинному значению параметра 9. Из (17.143) следует, что L о Поэтому в силу предположения 3) Но из леммы 17.4 следует, что верхний предел в правой части (17.147) равен нулю Ро-п. н. для любого 8. Следовательно, если истинное значение неизвестного параметра равно 9, то Pq-п. н.
682 ОЦЕНКА ПАРАМЕТРОВ И РАЗЛИЧЕНИЕ ГИПОТЕЗ [ГЛ. 17 m?->9, f->oo, где процесс т?, /^0, определяется уравнением (17.146), являющимся типичным примером уравнений, определяющих алгоритм стохастической аппроксимации. Интересен вопрос о том, насколько «быстро» процесс mav t^0y сходится к оцениваемому значению 9. Поскольку т^->8 с Р0-вероятностью единица, то для Ре-почти всех со и е > 0 найдется (наименьший) момент те (со; а) такой, что | т* — 9|^е при всех £!>те(со;а). (Заметим, что момент т = те (со; а) не является марковским.) Исследуем математическое ожидание М0те(со;а) времени те (со; а), необходимого для оценки неизвестного параметра с точностью до е, ограничиваясь случаем А0 = 0, А{ = 1, В== 1, <х= оо. Итак, пусть наблюдаемый процесс %и /^0, имеет дифференциал dlt = Qdt + dWt. (17.148) Для простоты записи будем обозначать mt = m°°t, те(со) = те (со; оо). В рассматриваемом случае уравнение стохастической аппроксимации (17.146) принимает следующий вид: dmt=j{dlt — mtdt). (17.149) Поскольку решение этого уравнения т*= ~ — у + — » то Te(<o) = inf{*:|^|<e, *>*}. Теорема 17.9. Для^любого 9, — оо < 9 < оо, и еде с — некоторая константа, 0 < с < оо. Доказательство. Воспользуемся тем фактом, что каждый из процессов , ltWw, t>0y ш _
§71 СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 683 является процессом броуновского движения (см. п. 4 в § 4 гл. 1). Тогда*) Рв{Ма)<7»} = Р{1Г'1</е' *>Т>\ = = P{\wt\^te,t>ji} = P{t\wilt\^(e, t>f2} = = p{|r,/,|<e,o£}=p{|u7e|<e, о <*<-£}= = Р {I ^.е/^ | <е, 0 < ^ < 1 } = =piVJL\wt.0ix\<- ■Ух ,0<t<1 = Хорошо известно**), что Р{ sup \Wt\<Vx}= J (-0*7= f e -1(у-2ЛТ^) d#. Л в= — оо -/- (17.150) Таким образом, ряд в правой части (17.150) задает распределение вероятностей для случайной величины е2т8 (со). Поскольку PeU2Te(cD)<x} = P{ sup Г?<х) 0<*<1 и в силу (3.8) М sup lF/<4, то Меб2те(со)<оо и, следова- тельно, Мет8 (о) = с/е2, где константа 00 г YT «I on г * * «= - ОО - /£ '-7S £ (-»' j .•4(-"w* dx < оо. Теорема доказана. *) {а/^я, t > s} означает событие, состоящее в том, что а/^а для всех t > s. **) См., например, [145], стр. 173.
ПРИМЕЧАНИЯ Глава 1 § 1. Аксиоматика теории вероятностей изложена в работе Колмогорова [86]. Доказательства приводимых теорем 1.1-—1.5 можно найти во многих руководствах. См., например, монографии Дуба [46], Лоэва [120], Колмогорова и Фомина [89], Мейера [126]. Теорема 1.6 доказана в статье [11]. Приводимая формулировка леммы Фату (теорема 1.2) содержится в [160]. Доказательство критерия равномерной интегрируемости Валле-Пуссена (теорема 1.8) см. в [126]. § 2. Подробнее об измеримых, прогрессивно измеримых, стохастически эквивалентных процессах см. [126]. Стационарным процессам посвящены книги Розанова [139], Крамера и Лидбеттера [91], известная статья Яглома [172]. Современной теории марковских процессов посвящены монографии Дынкина [47], Блюменталя и Гетура [12]. В книге Прохорова и Розанова [135] читатель найдет основные факты теории стационарных и марковских процессов. § 3. Свойства марковских моментов мы излагаем, следуя Мейеру [126], Блюменталю и Гетуру [12], Ширяеву [169]. § 4. Исчерпывающие сведения о процессе броуновского движения содержатся в книгах Леви [100], Ито и Маккина [61], Дуба [46], Гихмана и Скорохода [34], [36]. § 5. Подробнее об использованных понятиях математической статистики см. книги Линника [106], Крамера [90], Фергюсона [153]. Глава 2 § 1—4. Теория мартингалов и полумартингалов для случая дискретного времени изложена у Дуба [46], Мейера [126], Неве [130], Гихмана и Скорохода [37]. Глава 3 § 1, 2. См. также Мейер [126], Дуб [46]. § 3, 4. Доказательство разложения Дуба — Мейера заимствовано из статьи Рао [137] (см. также Мейер [126]). Глава 4 § 1. Доказательство теоремы Леви о том, что всякий винеровский процесс является процессом броуновского движения, есть у Дуба [46]. Мы приводим другое доказательство. Хотя специалистам и известен результат о непрерывности (пополненных) а-алгебр &"Y.порожденных значениями винеров- ского процесса Wa, s ^ /, доказательство этого результата (теорема 4.3) приводится, по-видимому, впервые,
'ПРИМЕЧАНИЯ 685 § 2. Построение стохастических интегралов по винеровскому процессу от разных классов функций восходит к Винеру [20] и Ито [59]. Конструкцию и свойства стохастических интегралов можно найти в недавних книгах Гих- мана и Скорохода [34], [36]. Интегралы Tt(f) вводятся впервые. Лемма 4.9 получена Ершовым [52]. § 3. Формула замены переменных Ито (см. [34], [36], [47], [60]) играет в теории стохастических дифференциальных уравнений фундаментальную роль. § 4. В стохастических дифференциальных уравнениях следует существенно различать понятия сильных и слабых решений. Слабые решения рассматривались Скороходом [144], Ершовым [52], [53], Ширяевым [166], Липцером и Ширяевым [111], Ямада и Ватанабе [174]. Существование и единственность сильных решений при интегральном условии Липшица (4.110) доказана Ито и Нисио [62]. Утверждение теоремы 4.7 содержится в статье Каллианпура и Стрибел [74]. Мы приводим иное доказательство. Глава 5 § 1, 2. По поводу доказательств теорем 5.1—5.4 см. также книгу Мейе- ра [126], статьи Куниты и Ватанабе [95] и Вентцеля [18]. Теорема 5.5 иным способом доказана Кларком [85]. Доказательство теоремы 5.5 сходно с доказательством Вентцеля [18]. § 3. Утверждения теоремы 5.6 частично содержится у Кларка [85]. Доказательство представления для гауссовских случайных величин принадлежит авторам. Теорема 5.7 доказана Кларком [85]. Утверждения типа теорем 5.8 и 5.9 можно найти также у Вентцеля [18]. § 4. Конструкцию стохастического интеграла по квадратично интегрируемым мартингалам мы приводим, следуя Куррежу [96]. § 5. Теоремы 5.13 и 5.14 являются новыми. Теорема Фубини для стохастических интегралов была впервые дана Каллианпуром и Стрибел [75]. Ее обобщения см. также в статье Ершова [51]. Приводимое нами доказательство основано на использовании результата теоремы 5.14. § 6. Структура функционалов от процессов диффузионного типа в случае 6*(£)г=1 изучалась в работе Фуджисаки, Каллианпура и Кунита [156]. Общий случай рассматривается впервые. Доказательство непрерывности а-алгебр &~\ (теорема 5.19) также дается впервые Теорема 5.21 является новой. Глава 6 § 1. Результаты этого параграфа принадлежат авторам. § 2. Теорема 6.1 доказана Новиковым [133]. С заменой множителя '/г на 1+8 и 72 + е эта теорема была доказана соответственно Гихманом. и Скороходом [36], Липцером и Ширяевым [118]. § 3. Теорема 6.2 обобщает важный результат Гирсанова [31], сформулированный в теореме 6.3. Глава 7 § 1, 2. Некоторые общие вопросы абсолютной непрерывности мер в функциональных пространствах содержатся в статье Гихмана и Скорохода [35]. Абсолютная непрерывность винеровской меры при различных преобразованиях изучалась Камероном и Мартином [80], [81], Прохоровым [134]. Результаты этих параграфов получены Ершовым [53], Липцером и Ширяевым [118], Кадота и Шеппом [66].
686 ПРИМЕЧАНИЯ § 3. Структура процессов, мера которых абсолютно непрерывна и эквивалентна винеровской, изучалась Хитсуда [158], Липцером и Ширяевым [118], Ершовым [53], Кайлатом [69]. § 4. Представление (7.73) для процессов Ито с помощью обновляющего процесса W было получено Ширяевым [166] и Кайлатом [67]. См. также статьи Ершова [52], Липцера и Ширяева [111], Фуджисаки, Каллианпура и Кунита [156]. § 5. Лемма 7.2 в случае гауссовских процессов с нулевым средним доказана в статье Кадота [64]. Приведенное доказательство возможности сведения общего случая (М(3* Ф 0) к случаю процессов с нулевым средним (MP/ = 0) было указано нам А. С. Холево. Представления типа (7.99) рассматривались Хитсуда [158]. При доказательстве гауссовости интеграла (Ле- т бега) а (0 dtoi гауссовского процесса a(t), 0 ^ t ^ Г, используются пред- о ставления для семиинвариантов, см. Леонов и Ширяев [103], Ширяев [164]. Другое доказательство гауссовости можно получить с помощью теоремы 2.8, приведенной Дубом [46]. § 6. Результаты этого параграфа получены авторами. § 7. Теорема 7.21 обобщает известный результат, принадлежащий Камерону и Мартину [80], [81]. § 8. Теорема 7.22 обобщает известное неравенство Рао — Крамера [90] и неравенство Волфовитца [22]. § 9. Леммы 7.3 и 7.4 содержатся в статье Каллианпура и Стрибел [74]. Глава 8 § 1, 2. Выводу представлений для условных математических ожиданий nt(h) при разных предположениях о (9,g,h) были посвящены работы многих авторов. Прежде всего необходимо отметить классические работы Колмогорова [87] и Винера [21], которые в рамках линейной теории рассмотрели задачу построения оптимальных оценок для случая стационарно связанных процессов. Развернутое изложение их результатов вместе с достижениями последних лет содержатся у Яглома [172], Розанова [139], Прохорова и Розанова [135]. По поводу результатов, касающихся нелинейной фильтрации, см., например, работы Стратоновича [146], [147], Вентцеля [19], Вонэма [25], Кушнера [98], [99], Ширяева [165], [166], [170], Липцера и Ширяева [111], [114]—[116], Липцера [108]—[110], Кайлата [67], [70], Фроста и Кайлата [155], Стрибел [148], Каллианпура и Стрибел [74], [75], Ершова [50], [51], Григелио- ниса [41]. Приводимый вывод следует в основном статье Фуджисаки, Каллианпура и Кунита [156]. Первые общие результаты по построению оптимальных нелинейных оценок для случая марковского процесса были получены Стратоновичем [146], [147] в рамках теории условных марковских процессов. § 3. Представление (8.56) для ttt(h) в случае процессов диффузионного типа было получено Ширяевым [165], Липцером и Ширяевым [111]. § 4, 5. Теоремы 8.4 и 8.5 приводятся впервые. Частные их случаи были получены Стратоновичем [147], Липцером и Ширяевым [112]—[116], Липцером [108]—[110]. § 6. Рассматриваемые стохастические дифференциальные уравнения с частными производными для условной плотности были выведены Липцером и Ширяевым [111]. Результаты о единственности решения принадлежат Розовскому [140]. Глава 9 § 1—3. Частные случаи теоремы 9.1 были опубликованы в работах Вонэма [25], Ширяева [166], Липцера и Ширяева [166], Стратоновича [147]. Приводимый мартингальный вывод дается впервые. Единственность решения
' ПРИМЕЧАНИЯ 687 нелинейной системы уравнений (9.23) изучалась Розовским и Ширяевым [141]. Выводу прямых и обратных уравнений интерполяции посвящены работы Стратоновича [147], Липцера и Ширяева [116]. Глава 10 § 1—3. Уравнения (10.10) и (10.11), определяющие эволюцию оптимального линейного фильтра, получены Калманом и Бьюси [78]. См. также гл. 9 в книге Стратоновича [147]. Мартингальный вывод уравнений (10.10) и (10.11) дается, по-видимому, впервые. Доказательство леммы 10.1 принадлежит авторам. Другое доказательство леммы 10.1 дано Рюмгаартом [1.42]. § 4. Уравнения для почти оптимального линейного фильтра в случае вырождения матриц В о В даются впервые. Глава 11 § 1—3. Важность выделения класса условно-гауссовских процессов для эффективного решения задач оптимальной нелинейной фильтрации была отмечена Липцером [108]. Условно-гауссовские процессы рассматривались в статье Липцера и Ширяева [111]. Доказательство теоремы об условной гаус- совости приводится впервые. Глава 12 § 1—5. Результаты этой главы принадлежат авторам. Частично они были ими опубликованы в [111], [113]—[115]. Глава 13 § 1. Теорема о нормальной корреляции (теорема 13.1), доказанная в общей постановке Марсаглиа [124] (см. также Андерсон [2]), систематически используется в разных главах этой книги. Доказательство теоремы 13.2 авторам сообщил Кицул. Свойства псевдообратных матриц см. также в книге Гантмахера [30]. Лемма 13.3 доказана Пятецким (дипломная работа). § 2—5. Содержание этих параграфов основано на статьях Липцера и Ширяева [119], Глонти [38]—[40]. Глава 14 § 1, 2. В этих параграфах систематически используется тот факт, что стационарная последовательность с дробно-рациональным спектром является компонентой многомерного стационарного процесса, подчиняющегося системе рекуррентных уравнений (14.15) (см. также гл. 15, § 3). Идея вывода рекуррентных уравнений заимствована у Лэнинга и Бэттина [122]. § 3. Задача оптимального управления линейной системой с квадратичным функционалом потерь изучалась Красовским и Лидским [92], Летовым [104], Калманом [79]. Эта же задача управления по неполным данным приведена у Аоки [3], Медича [125], Вонэма [24]. § 4. Теорема 14.3 аналогична соответствующему результату Калмана [77] (для случая непрерывного времени см. также § 2 гл. 16). . § 5. Результаты этого параграфа получены Альбертом и Ситтлером [1], Жуковским и Липцером [55]. Глава 15 § 1—3. В этих параграфах используются общие уравнения оптимальной фильтрации для линейного оценивания случайных процессов. § 4. Сравнение оптимальных линейных и нелинейных оценок производилось Стратоновичем [147] и Липцером [107].
688 ПРИМЕЧАНИЯ Глава 16 § 1. Доказательство теоремы 16.1 существенно основывается на результатах двенадцатой главы о виде уравнений для апостериорных средних и дисперсий в случае условно-гауссовских процессов (см. также Медич [125], Вонэм [26]) § 2. Теорема 16.2 получена Калманом [77]. § 3. Излагаемые результаты содержатся в статье Кадоты, Закаи и Зива [65]. § 4. Передача гауссовской случайной величины по каналу с обратной связью рассматривалась Шалквийком и Кайлатом [161], Зигангировым [56], Дьячковым и Пинскером [48], Хасьминским (см. задачу 72 в добавлении к книге [157]), Невельсоном и Хасьминским [128]. Доказательство теоремы 16.4, основанное на использовании уравнений оптимальной нелинейной фильтрации, принадлежит Катышеву (дипломная работа). Доказательство леммы 16.7 и теоремы 16.5 принадлежит Ихара (Sh. Ihara). Теорема 16.6 доказана авторами. Глава 17 § 1. Здесь систематически используются результаты седьмой и десятой глав. § 2. Оценки параметров коэффициента сноса для процессов диффузионного типа изучались Новиковым [131], Арато [4]. § 3. Результаты этого параграфа принадлежат Новикову [131]. § 4. Оценка параметров двумерного гауссовского марковского процесса рассматривалась в работах Арато, Колмогорова, Синая [5], Арато [4], Лии- цера и Ширяева [111], Новикова [131]. § 5. Последовательные оценки максимального правдоподобия 6я(£) были введены авторами. Свойства этих оценок изучались Новиковым [131] и авторами. Теорема 17.7 доказана Вогником. § 6. Теорема 17.8 обобщает один из результатов Лэдена [121]. § 7. Теорема 17.9 доказана в статье [143].
ЛИТЕРАТУРА 1. Альберт, Ситтлер (Albert A., Sittler R. W.), A method for computing least squares estimators that keep up with the data, SIAM J. Control 3 (1965), 384-417. 2 Андерсон Т., Введение в многомерный статистический анализ (перев. с англ.), Физматгиз, М., 1963. 3 А оки М., Оптимизация стохастических систем (перев. с англ.), «Наука», М., 1971. 4. А р а т о М., Вычисление доверительных границ для параметра «затухание» комплексного стационарного гауссовского марковского процесса, Теория вероятн. и ее примен. XIII, 1 (1968), 326—333. 5. Арато М., Колмогоров А. Н., Синай Я. Г., Об оценке параметров комплексного стационарного гауссовского марковского процесса, ДАН СССР 146, 4 (1962), 747—750. 6. А с трём (Astrom К. I.), Optimal control of Markov processes with incomplete state information, J. Math. Anal. Appl. 10 (1965), 174—205. 7. Балакришнан (Balakrishnan A. V.), Stochastic differential systems, 1, Lecture notes, Dept. of System Science, VCLA, 1971. 8. Балакришнан (Balakrishnan A. V.), A martingale approach to linear recursive stale estimation, SIAM J. Control 10 (1972), 754—766. 9. Б е л л м а н Р., Кук К. «П., Дифференциально-разностные уравнения (перев. с англ.), «Мир», М., 1967. 10. Бенсуссан (Bensoussan A.),' Filtrage optimal des systemes lineaires, Dunod, Paris, 1971. 11. Блэкуэлл, Дубине (Blackwell D., Dubins L.), Merging of opinoins with increasing information, AMS 33 (1962), 882—886. 12. Блюменталь, Гетур (Blumental R. M., Getoor R. K), Markov pro* cesses and potential theory, Academic Press, N. Y. and L., 1968. 13. Большаков И. А., Репин В. Г., Вопросы нелинейной фильтрации, Автоматика и телемеханика ХХ11, 4 (1961), 466—478. 14. Брейман (Breiman L.), Probability, Addison-Wesley Publ. Company, 1968. 15. Бьюси (Bucy R. S.), Nonlinear filtering theory, IEEE Trans. Automatic Control AC-10 (1965), 198. 16. Бьюси, Джозеф (Bucy R. S., Joseph P. D.), Filtering for stochastic processes with application to guidance, Interscience, N. Y., 1968. 17. Бэккенбах Э., Беллман Р., Неравенства (перев. с англ.), «Мир», М., 1965. 18. Вентцель А. Д., Аддитивные функционалы от многомерного винеров- ского процесса, ДАН СССР 130, 1 (1961), 13—16. 19. Вентцель А. Д., Об уравнениях теории условных марковских процессов, Теория вероятн. и ее примен. X, 2 (1965), 390—393. 20. Винер (Wiener N.), Differential space, J. Math, and Phys. 58 (1923), 131 — 174. 21 Винер (Wiener N.), Extrapolation, interpolation and smoothing of stationary time series, J. Wiley & Sons, N. Y., 1949.
690 Литература 22. Волфовитц (Wolfowitz J.), On sequential binomial estimation, AMS 17 (1946), 489—493. 23. Волфовитц (Wolfowitz J.), The efficiency of sequential games estimates and Wald's equation for sequential processes, AMS 18 (1947), 215—230. 24. Вонэм (Wonham W. M.), Stochastic problems in optimal control, Tech. report 63-14, Research Institute for Advanced Study, Baltimore, 1963. 25. Вонэм (Wonham W. M.), Some applications of stochastic differential equations to optimal nonlinear filtering, SIAM J. Control, 2 (1965), 347—369 26. Вонэм (Wonham W. M.) On the separation theorem of stochastic control, SIAM J. Control 6 (1968), 312—326. 27. Вонэм (Wonham W. M.), On a matrix Riccati equation of stochastic control, SIAM J. Control 6 (1968), 681—697. 28. Гальчук Л. И., Об одном представлении скачкообразных процессов, Советско-японский симпозиум по теории вероятностей, Хабаровск, 1969. 29. Гальчук Л. И. Фильтрация марковских процессов со скачками, УМН XXV, 5 (1970), 237—238. 30. Г а н т м а х е р Ф. Р., Теория матриц, «Наука», М., 1967. 31. Гире а нов И. В., О преобразовании одного класса случайных процессов с помощью абсолютно непрерывной замены меры, Теория ве- роятн. и ее примен. V, 3 (1960), 314—330. 32. Г и х м а н И. И., К теории дифференциальных уравнений случайных процессов, Укр. матем. журн. 2, 3 (1950), 45—69. 33. Гихман И. И., Д о р о г о в ц е в А. Я., Об устойчивости решений стохастических дифференциальных уравнений, Укр. матем. журн. 17, 6 (1965), 3—21. 34. Гихман И. И., Скороход А. В., Введение в теорию случайных процессов, «Наука», М., 1965. 35. Гихман И. И., Скороход А. В., О плотностях вероятностных мер в функциональных пространствах, УМН 21 (1966), 83—152. 36. Гихман И. И., Скороход А. В., Стохастические дифференциальные уравнения, «Наукова думка», Киев, 1968. 37. Г и х м а н И. И., Скороход А. • В., Теория случайных процессов, том I, «Наука», М., 1971. 38. Г л о н т и О. А., Последовательная фильтрация и интерполяция компонент марковской цепи, Литовский матем. сб. IX, 2 (1969), 263—279. 39. Г л о н т и О. А., Экстраполяция компонент марковской цепи, Литовский матем. сб. IX, 4 (1969), 741—754. 40. Г л о н т и О. А., Последовательная фильтрация компонент марковской цепи при вырожденности матрицы диффузии, Теория вероятн. и ее примен. XV, 4 (1970), 736—740. 41. Григелионис Б., О стохастических уравнениях нелинейной фильтрации случайных процессов, Литовский матем. сб. XII, 4 (1972). 42. Григелионис Б., О структуре плотностей мер, соответствующих случайным процессам, Литовский матем. сб. XIII, 1 (1973). 43. Г у л ь к о Ф. Б., Новосельцева Ж. А., Решение нестационарных задач фильтрации и упреждения методами моделирования, Автоматика и телемеханика 4 (1966), 122—141. 44. Д а шев с к и й. М. Л., Липцер Р. Ш., Применение условных семиинвариантов в задачах нелинейной фильтрации марковских процессов, Автоматика и телемеханика 6 (1967), 63—74. 45. Д а ш е в с к и й М. Л., Метод семиинвариантов в задачах нелинейной фильтрации марковских процессов, Автоматика и телемеханика 7 (1968), 24—32. 46. Дуб Дж. Л., Вероятностные процессы (перев. с англ.), ИЛ, М., 1956. 47. Д ы н к и н Е. Б., Марковские процессы, Физматгиз, 1963.
ЛИТЕРАТУРА 691 48 Дьячков А. Г., П и н с к е р М. С, Об оптимальном линейном методе передачи по гауссовскому стационарному каналу без памяти и с полной обратной связью, Проблемы передачи информации 7, 2 (1971), 38—46. 49. Дюге Д., Теоретическая и прикладная статистика, «Наука», М., 1972. 50. Ершов М. П., Нелинейная фильтрация марковских процессов, Теория вероятн. и ее примен. XIV, 4 (1969), 757—758. 51. Ершов М. П., Последовательное оценивание диффузионных процессов, Теория вероятн. и ее примен. XV, 4 (1970), 705—717. 52. Ершов М. П., О представлениях процессов Ито, Теория вероятн. и ее примен. XVII, 1 (1972), 167—172. 53. Е р ш о в М. П., Об абсолютной непрерывности мер, отвечающих процессам диффузионного типа, Теория вероятн. и ее примен. XVII, 1 (1972), 173—178. 54. Ершов (Yershov M. P.), Stochastic equations, Proc. Second Japan — USSR Sympos. Probab. Theory, Kyoto, I (1972), 101—106. 55. Жуковский Е. Л., Липцер Р. III., О рекуррентном способе вычисления нормальных решений линейных алгебраических уравнений, ЖВМ и МФ 12, 4 (1972), 843—857. 56. Зигангиров К- Ш-» Передача сообщений по двоичному гауссовскому каналу с обратной связью, Проблемы передачи информации 3, 2 (1967), 98—101. 57. И б р а г и м о в И. А., Розанов Ю. А., Гауссовские случайные процессы, «Наука», М., 1970. 58. И б р а г и м о в И. А., X а с ь м и н с к и й Р. 3., Информационные неравенства и суперэффективиые оценки, ДАН СССР 204, 6 (1972). 59 Ито (Но К.), Stochastic integral, Proc. Imp. Acad. Tokyo 20 (1944), 519-524. 60. Ито К., Об одной формуле, касающейся стохастических дифференциалов, Математика, сб. перев. иностр. статей, 3:5 (1959), 131—141. 61. Ито К., Маккин Г., Диффузионные процессы и их траектории (перев. с англ.), «Мир», М., 1968. 62. Ито, Ни си о (Ito К., Nisio M.), On stationary solutions of stochastic differential equations, J. Math. Kyoto Univ. 4, 1 (1964), 1—79. 63. К а г а н А. М., Линник Ю. В., Р а о С. Р., Характеризационные задачи математической статистики, «Наука», М., 1972. 64. Кадота (К a d о t а Т. Т.), Nonsingular Detection and Likelihood Ratio for Random Signals in White Gaussian Noise, IEEE Trans. Inform. Theory IT-16 (1970), 291-298. 65 Кадота, Закаи, Зив (Kadota Т. Т., Zakai M., Ziv I.), Mutual information of the white Gaussian channel with and without feedback, IEEE Trans. Inform. Theory IT-17, 4 (1971), 368—371. 66 Кадота, Шепп (Kadota Т. Т., Shepp L. A.), Conditions for the absolute continuity between a certain pair of probability measures, Z. Wahr- scheinlichkeitstheorie verw. Gebiete 16, 3 (1970), 250—260. 67. Кай лат (Kailath Т.), An innovations approach to least-squares estimation, Parts I, II, IEEE Trans. Automatic Control AC-13 (1968), 646—660. 68. Кай лат (Kailath Т.), The innovations approach to detection and estimation theory, Proc. IEEE 58 (1970), 680—695. 69. К а и л а т (Kailath Т.), The structure of Radon — Nykodym derivatives with respect to Wiener and related measures, AMS 42 (1971), 1054— 1067. 70 Кай лат, Г из и (Kailath Т., Geesey R.), An innovations approach to least-squares estimation, Part IV, IEEE Trans. Automatic Control AC-16 (1971), 720—727. 71. Кай лат, Закаи (Kailath Т., Zakai M.), Absolute continuity and Radon — Nykodym derivatives for certain measures relative to Wiener measure, AMS 42, 1 (1971), 130-140.
692 ЛИТЕРАТУРА 72 К а л а ч е в М Г., Аналитический расчет стационарного фильтра Кал- мана — Бьюси в одной многомерной задаче фильтрации, Автоматика и телемеханика 1 (1972), 46—50. 73. Калачев М. Г., Петровский А. М., Многократное дифференцирование сигнала с ограниченным спектром, Автоматика и телемеханика 3 (1972), 28—34. 74. К а л л и а н п у р, Стрибел (Kallianpur G., Striebel С), Estimation of stochastic systems: Arbitrary system process with additive white noise observation errors, AMS 39 (1968), 785—801. 75. Каллианпур, Стрибел (Kallianpur G., Striebel C), Stochastic differential equations a occuring in the estimation of continuous parameter stochastic processes, Теория вероятн. и ее примен. XIV, 4 (1969), 597— 622. 76. Калман (Kalman R. E.), A new approach to linear filtering and prediction problems, J. Basic. Engrg. 1 (1960), 35—45. 77. Калман (Kalman R. E.), Contributions to the theory of optimal control, Bol. Soc. Mat. Mexicana 5 (1960), 102—119. 78. Калман Р. Е., Бьюси Р. С, Новые результаты в линейной'"фильтрации и теории предсказания (перев. с англ.), Техническая механика 83, сер. Д, 1 (1961), 123. 79. Калман Р., Ф а л б П., А р б и б М., Очерки по математической теории систем (перев. с англ.), «Мир», М., 1971. 80. Камерон, Мартин (Cameron R. H., Martin W. Т.), Transformation of Wiener integrals under a general class of linear transformations, Trans. Amer. Math. Soc. 58 (1945), 184—219. 81. Камерон, Мартин (Cameron R. H., Martin W. Т.), Transformation of Wiener integrals by nonlinear transformation, Trans. Amer. Math. Soc. 66 (1949), 253—283. 82. К и ц у л П. И., Нелинейная фильтрация по совокупности непрерывных и дискретных наблюдений. Доклады II Всесоюзного совещания по статистическим методам теории управления, Ташкент, сб. «Адаптация, самоорганизация», 1970, 52—57. 83. Кицул П. И., О непрерывно-дискретной фильтрации марковских процессов диффузионного типа, Автоматика и телемеханика И (1970), 29—37. 84. Кицул П. И., Одна задача фильтров, оптимальных в классе линейных систем, Автоматика и телемеханика И (1971), 46—52. 85. Кларк (Clark I. М. С), The representation of functionals of Brownian motion by stochastic integrals, AMS 41, 4 (1970),' 1282—1295. 86. Колмогоров А. Н., Основные понятия теории вероятностей, ОНТИ, М. — Л. 1936. 87. Колмогоров А. Н., Интерполирование и экстраполирование стационарных случайных последовательностей, Изв. АН СССР, сер. матем. 5, 5 (1941). 88. Колмогоров А. Н., Теория передачи информации, Изд-во АН СССР, 1956. 89. К о л м о г о р о в А. Н., Фомин С. В., Элементы теории функций и функционального анализа, «Наука», М., 1968. 90. Крамер Г., Математические методы статистики (перев. с англ.), ИЛ, М., 1948. 91. К р а м е р Г., Л и д б е т т е р М., Стационарные случайные процессы (перев.с англ.), «Мир», М., 1969. 92. Красовский Н. Н., Л и д с к и й Э. А., Аналитическое конструирование регуляторов в системах со случайными свойствами. III. Оптимальное регулирование в линейных системах. Минимум среднеквадратичной ошибки, Автоматика и телемеханика 11 (1961), 1425—1431,
ЛИТЕРАТУРА 693 93 Крылов Н. В., О стохастических интегральных уравнениях Ито, Теория вероятн. и ее примен. 14, 2 (1969), 340—348. 94. Кунита (Kunita Н.), Asymptotic behavior of the nonlinear filtering errors of Markov processes, J. of Multivariate Analysis 1, 4 (1971), 365—393. 95. Кунита X., Ватанабе Ш., О мартингалах, интегрируемых с квадратом, Математика, сб. перев. иностр. статей, 15:1 (1971), 66—102. 96. Кур ре ж (Courrege Ph.), Integrates stochastiques et martingales de carre integrable, Seminaire Brelot — Choquet — Deny, 7-e annee (1962/63). 97. Курреж (Courrege Ph.), Integrates stochastiques associees a une martingale de carre integrable, С R. Acad. Sci. 256 (1963), 867—870. 98. Куш нер (Kushner H. J.), On the dynamical equations of conditional probability density functions, with applications to optimal stochastic control theory, J. Math. Anal. Appl. 8 (1964), 332-344. 99. Куш нер (Kushner H. J.), Dynamical equations for optimal nonlinear filtering, J. Differential Equations 3 (1967), 179—190. 100. Л е в и П., Стохастические процессы и броуновское движение, «Наука», М., 1972. 101. Левин Б. Р., Теоретические основы статистической радиотехники, «Сов. радио», М. кн. 1, 1966, кн. 2, 1968. 102. Леман Э., Проверка статистических гипотез, «Наука», М., 1964. 103. Леонов В. П., Ширяев А. Н., К технике вычисления семиинвариантов, Теория вероятн. и ее примен. IV, 2 (1959), 342—355. 104 Летов А. М., Аналитическое конструирование регуляторов. I—IV, Автоматика и телемеханика 4 (1960), 436—441, 5 (1960), 561—568, 6 (1960), 661—665, 4 (1961), 425—435. 105 Ли Р., Оптимальные оценки, определение характеристик и управление (перев. с англ.), «Наука», М., 1966. 106 Лин ник Ю. В., Статистические задачи с мешающими параметрами, «Наука», М., 1966 107. Липцер Р. Ш., Сравнение нелинейной и линейной фильтрации некоторых марковских процессов, Теория вероятн. и ее примен. XI, 3 (1966), 528—533. 108 Липцер Р. Ш., О фильтрации и экстраполяции компонент диффузионных марковских процессов, Теория вероятн. и ее примен. XII, 4 0967), 764—765. 109. Липцер Р. Ш., Об экстраполяции и фильтрации некоторых марковских процессов. I, Кибернетика 3 (1968), 63—70. ПО. Липцер Р. Ш., Об экстраполяции и фильтрации некоторых марковских процессов. II, Кибернетика 6 (1968), 70—76. 111. Липцер Р. Ш., Ширяев А. Н., Нелинейная фильтрация диффузионных марковских процессов, Труды Матем. ин-та им. В. А. Стеклова АН СССР 104 (1968), 135—180. 112. Липцер Р. Ш., Ширяев А. Н., О фильтрации, интерполяции и экстраполяции диффузионных марковских процессов по неполным данным. Теория вероятн. и ее примен. XIII, 3 (1968), 569—570. 113. Липцер Р. Ш., Ширяев А. Н., Экстраполяция многомерных марковских процессов по неполным данным, Теория вероятн. и ее примен. XIII, 1 (1968), 17—38. 114. Липцер Р. Ш., Ш и р я е в А. Н., О случаях эффективного решения задач оптимальной нелинейной фильтрации, интерполяции и экстраполяции, Теория вероятн. и ее примен XIII, 3 (1968), '570—571. 115. Липцер Р. Ш., Ширяев А. Н., Нелинейная интерполяция компонент диффузионных марковских процессов (прямые уравнения, эффективные формулы), Теория вероятн. и ее примен. XIII, 4 (1968), 602—620. 116. Липцер Р. III., Ширяев А. Н., Интерполяция и фильтрация скачкообразной компоненты марковского процесса, Изв. АН СССР, сер. матем. 33, 4 (1969), 901—914.
694 ЛИТЕРАТУРА 117. Л ипцер Р. Ш., Ширяев А. Н., О плотности вероятностных мер процессов диффузионного типа, Изв. АН СССР, сер. матем. 33, 5 (1969), 1120—1131. 118. Л и п це р Р. Ш., Ш и р я е в А. Н., Об абсолютной непрерывности мер, соответствующих процессам диффузионного типа, относительно винеровской, Изв. АН СССР, сер. матем. 36, 4 (1972), 874—889. 119. Липце р, Ширяев (Liptser R. S., Shiryayev A. N.), Statistics of conditionally Gaussian random sequences, Proc. Sixth Berkeley Sympos. Math. Statistics and Probability (1970), Vol. II, Univ. of Calif. Press, 1972, 389— 422. 120. Лоэв М., Теория вероятностей (перев. с англ.), ИЛ, М., 1962. 121. Лэден (Laidain M.), Test entre deux hypotheses pour un processus defini par une equation differentielle stochastique, Rev. Cethedec 8, 26 (1971), 111-121. 122. Лэнинг Дж. X., Бэтти н Р. Г., Случайные процессы в задачах автоматического управления (перев. с англ.), ИЛ, М., 1958. 123. Маккин Г., Стохастические интегралы (перев. с англ.), «Мир», М., 1972. 124. Марсаглиа (Marsaglia G.), Conditional means and covariance of normal variables with singular covariance matrix, J. Amer. Statist. Assoc. 59, 308 (1964), 1203—1204. 125. Мед ич (Meditch J. S.), Stochastic Optimal Linear Estimation and Control, N.Y., 1969. 126. Мейер (Meyer P. A.), Probabilites et potentiel, Herman, Paris, 1966. 127. Нахи (Nahi N. E.), Estimation theory and applications, J. Wiley & Sons, N.Y., 1969. 128. H ев е л ьсо н М. Б., Хасьминский Р. 3., Стохастическая аппроксимация и рекуррентное оценивание, «Наука», М., 1972. 129. Неве Ж-, Математические основы теории вероятностей (перев. с англ.), «Мир», М., 1969. 130. Неве (Neveu J.), Martingales, Notes partielles d'un course de 3eme cycle, Paris, 1970—1971. 131. Новиков А. А., Последовательное оценивание параметров диффузионных процессов, Теория вероятн. и ее примен. XVI, 2 (1971), 394—396. 132. Новиков А. А., О моментах остановки винеровского процесса, Теория вероятн. и ее примен. XVI, 3 (1971), 548—550. 133. Новиков А. А., Об одном тождестве для стохастических интегралов, Теория вероятн. и ее примен. XVII, 4 (1972), 761—765. 134. Прохоров Ю. В., Сходимость случайных процессов и предельные теоремы теории вероятностей, Теория вероятн. и ее примен. I, 2 (1956), 177—238. 135. Прохоров Ю. В., Розанов Ю. А., Теория вероятностей. Основные понятия, предельные теоремы, случайные процессы, «Наука», М., 1967. 136. Пугачев В. С, Теория случайных функций и ее применение к задачам автоматического управления, Физматгиз, М., 1962. 137. Pao (Rao С. М.), On decomposition theorems of Meyer, Math. Scandi- navica 24, 1 (1969), 66—78. 138. Pao С. Р., Линейные статистические методы и их применения (перев. с англ.), «Наука», М„ 1968. 139. Розанов Ю. А., Стационарные случайные процессы, Физматгиз, М., 1963. 140. Розо в с к и й Б. Л., Стохастические дифференциальные уравнения в частных производных, возникающие в задачах нелинейной фильтрации, УМН XXVII, 3 (1972), 213-214.
Литература 695 141. Розовский Б. Л., Ширяев А. Н., О бесконечных системах стохастических дифференциальных уравнений, возникающих в теории оптимальной нелинейной фильтрации, Теория вероятн. и ее примен. XVII, 2 (1972), 228—237. 142. Рюмгаарт (Ruymgaart P. A.), A note of the integral-representation of the Kalman —Bucy estimate, Indag. Math. 33, 4 (1971), 346—360. 143. Сигм у нд, Роббинс, Вендель (Siegmund D., Robbins H., Wen- del J.), The limiting distribution of the last time Sn>m, Proc. Nat. Acad. Sci. 62, 1 (1968). 144. Скороход А. В., Исследования по теории случайных процессов, Изд-во Киев, ун-та, 1961. 145. Скороход А. В., Случайные процессы с независимыми приращениями, М., изд-во «Наука», 1964. 146. Стратонович Р. Л., Условные процессы Маркова, Теория вероятн. и ее примен. V, 2 (1960), 172—195. 147. Стратонович Р. Л., Условные марковские процессы и их применение к теории оптимального управления, Изд-во МГУ, 1966. 148. Стрибел (Striebel С. Т.), Partial differential equations for the conditional distribution of a Markov process given noisy observations, J. Math. Anal. Appl. 11 (1965), 151—159. 149. Тихонов А. Н., Об устойчивости алгоритмов для решения вырожденных систем линейных алгебраических уравнений, ЖВМ и МФ 5, 4 (1965), 718—722. 150. Турин Дж., Лекции о цифровой связи (перев. с англ.), «Мир», М., 1972. 151. У и ттл (Whittle P.), Prediction and regulation, London, 1963. 152. Фельдбаум А. А., Основы теории оптимальных автоматических систем, «Наука», М., 1966. 153. Фергюсон (Ferguson T. S.), Mathematical statistics, Academic Press, N.Y., 1967. 154. Фридман А., Уравнения с частными производными параболического типа (перев. с англ.), «Мир», М., 1968. 155. Фрост, Кайлат (Frost P., Kailatt Т.), An innovations approach to least-squares estimation, Part III, IEEE Trans Automatic Control AC-16 (1971), 217—226. 156. Фуджисаки, Каллианпур, Кунита (Fujisaki M., Kallianpur G., Kunita H.), Stochastic differential equations for the nonlinear filtering problem, Osaka J. Math. 9, 1 (1972), 19—40. (Русск. перев.: Математика, сб. перев. иностр. статей, 17 : 2 (1973), 108—128.) 157. X а с ь м и н ски й Р. 3., Устойчивость систем дифференциальных уравнений при случайных возмущениях, их параметров, «Наука», М., 1969. 158. Хитсуда (Hitsuda M.), Representation of Gaussian processes equivalent to Wiener processes, Osaka J. Math. 5 (1968), 299—312. 159. Цыпки н Я- З., Адаптация и обучение в автоматических системах, «Наука», М., 1968. 160. Чао, Роббинс, Сигмунд (Chow Y. S., Robbins H., Siegmund D.), Great expectations: The theory of optimal stopping, Houghton Mifflin Company Boston, 1971. 161. Шалквик, Кайлат (Shalkwijk J. P. M., Kailath Т.), A coding scheme for additive noise channels with feedback, Part I, IEEE Trans. Inform. Theory IT-12 (1966), 172—182. 162. Шаташвили А. Д., Нелинейная фильтрация для решения некоторых стохастических дифференциальных уравнений, Кибернетика 3 (1970), 97—102. 163. Шепп (Shepp L. A.), Radon — Nykodym derivatives of Gaussian measures, AMS 37 (1966), 321—354.
696 ЛИТЕРАТУРА 164. Ширяев А. Н., Некоторые вопросы спектральной теории старших моментов. I, Теория вероятн. и ее примен. V, 3 (1960), 293—313. 165. Ширяев А. И., О стохастических уравнениях в теории условных марковских процессов, Теория вероятн. и ее примен. XI, 1 (1966), 200—206. 166. Ширяев А. Н., Стохастические уравнения нелинейной фильтрации скачкообразных марковских процессов, Проблемы передачи информации II, 3 (1966), 3—22. 167. Ширяев А. Н., Некоторые новые результаты в теории управляемых случайных процессов, Trans. 4th Prague Confer. Inform. Theory (1965), Prague, 1967, 131-203. 168. Ширяев А. Н., Исследования по статистическому последовательному анализу, Матем. заметки 3, 6 (1968), 739—754. 169. Ширяев А. Н., Статистический последовательный анализ, «Наука», М., 1969. 170. Ширяев (Shiryayev A. N.), Sur les equations stochastiques aux deri- vees partielles, Actes Congres Intern. Math., 1970. 171. Ширяев (Shiryayev A. N.), Statistics of diffusion type processes, Proc. Second Japan —USSR Sympos. Probab. Theory, I (1971), 69—87. 172. Яглом А. М., Введение в теорию стационарных случайных функций, УМН7, 5 (1952), 3—168. i 173. Язвинский (Jazwinski A. H.), Stochastic processes and filtering theo*( ry, Academic Press, N. Y., 1970. 174. Я м а д а, Ватанабе (Yamada Т., Watanabe Sh.), On the uniqueness^ of solutions of stochastic differential equations, J. Math. Kyoto Univ. 11,! 1 (1971), 155—167. 175. Яшин А. И., Фильтрация скачкообразного марковского процесса с не* известными вероятностными характеристиками при аддитивной помехе, Автоматика и телемеханика 12 (1968), 25—30. 176. Яшин А. И., О выделении скачкообразно меняющихся параметров многомерных процессов, Автоматика и телемеханика 10 (1969), 60—67,