Текст
                    

А.А.КРАСОВСКИМ И.Н.БЕЛОГЛАЗОВ Г П.ЧИГИН ТЕОРИЯ КОРРЕЛЯЦИОННО-ЭКСТРЕМАЛЬНЫХ НАВИГАЦИОННЫХ СИСТЕМ МОСКВА «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1 979
Теория корреляционно-экстремальных навигационных систем. А. А. Красовский, И. Н. Белоглаз о в, Г. П. Ч и г и н. — М.: Наука. Главная редакция физико-математической литературы, 1979, , 448 с. , ... 5 ’ . .В книге излагаются теоретические' основы синтеза алгоритмов нового класса навигационных систем, использующих пространственные и поверхностные физические поля Земли (поле рельефа, аномальное магнитное поле Земли и др.)/Синтез алгоритмов осуществляется посредством общих и специальных методов теории оптимального оценивания, идентификации и управления. Эти методы имеют самостоятельное значение и могут применяться для решения широкого круга задач современной науки и техники. Им посвящена значительная часть книги. Структура оптимальных алгоритмов оценивания в задачах навигации по геофизическим полям такова, что содержит вычисления аналогов корреляционной функции и поиск экстремума. Поэтому данные алгоритмы относятся к классу корреляционно-экстремальных. В книге приводится значительное число примеров корреляционно-экстремальных алгоритмов и результаты аналитических и численных исследований ил функционирования. Эти результаты образуют прикладную теорию данного класса систем. i *« Книга предназначена для научных работников и инженеров, а также студентов старших* Курсов, специализирующихся в области оптимальной', обработки информации и навигации. Табл. 3, илл. ИЗ, библ. 139 наэв. ИЗ © Главная редакция гуд-167-79. 1502010000 Ж^“рыМатической ' издательства «Наука», 1979
ОГЛАВЛЕНИЕ Предисловие............................................ Введение............................................... Глава I. Теоретические основы беспоискового оптималь-< него оценивания, идентификации и управления . . . . § 1.1. Основная теорема оптимизации по критерию обобщенной работы и теорема разделения................. § 1.2. Алгоритмы оценивания координат............... § 1.3. Достаточные условия точного оценивания . . . .§1.4, Декомпозиция и перераспределение информации в задачах оценивания................................ § 1.5. Алгоритм идентификации ...................... ; § 1.6. Алгоритм оптимального управления с прогнозирующей моделью . ................................... § 1.7. Особенности задачи оценивания в корреляционноэкстремальных системах............................. Глава II. Теоретические основы поисковых методов оценивания .............................................. § 2.1. Элементы теории статистических решений . . . § 2.2. Рекуррентно-поисковое оценивание............. § 2.3. Частные случаи рекуррентно-поискового оценивания ............................................. § 2.4. Непрерывный аналог рекуррентно-поискового оценивания ........................................... Глава III. Математические модели геофизических полей и навигационных систем................................ § 3.1. Обоснование статистического подхода в теории корреляционно-экстремальных навигационных систем .............................................. § 3.2. Математические модели пространственных полей § 3.3. Математические модели ошибок инерциальных ,, систем........................................... Глава IV. Беспоисковые алгоритмы оценивания в корреляционно-экстремальных навигационных системах . . . § 4.1. Синтез и аналитическое исследование простейших беспоисковых алгоритмов КЭНС....................... ; । § 4.2. Некоторые результаты математического моделиро-, , вания простейших беспоисковых алгоритмов КЭНС § 4.3. Алгоритмы и процессы в КЭНС, использующих гладкие поля ...................................... § 4.4. Обобщенные приближенные аналитические оценки точности беспоисковых КЭНС......................... § 4.5. Бесплатформенная инерциальная беспоисковая КЭНС [4.6].........................................
§ 4,6. Алгоритмы оценивания высоты................. § 4.7. Корреляционно-экстремальная система совмещения изображений с конечномерным вектором наблюдения [4.2] ........................................ Глава V. Поисковые алгоритмы оценивания в корреляционно-экстремальных навигационных системах . . . . § 5.1. Постановка задачи. Вывод формулы среднего риска. Оптимальные решающие правила................... § 5.2. Выражение риска через статистические характеристики вектора значений функционала................ § 5.3. Оптимальные поисковые алгоритмы совместного оценивания местоположения и скорости движущихся объектов [5.5], [5.6]......................... § 5.4. Оптимальные поисковые алгоритмы корреляционно-экстремальных навигационных систем, использующих одновременно несколько полей [5.8] . . Глава VI. Рекуррентно-поисковые алгоритмы оценивания в корреляционно-экстремальных навигационных системах § 6.1. Рекуррентно-поисковое оценивание ошибок инерциальной системы при наличии вертикальных маневров [6.1] ......................................... § 6.2. О возможности сокращения традиционного состава датчиков при использовании рекуррентнопоискового оценивания [6.4]......................... § 6.3. Рекуррентно-поисковое оценивание ошибок инерциальной системы в режиме полета на малой высоте и облета препятствий........................... § 6.4. Рекуррентно-поисковое оценивание ошибок курсодопплеровских систем ............................... Глава VII. Синтез контуров и выбор оптимальных режимов коррекции корреляционно-экстремальных инерциальных систем ................................................ § 7.1. Синтез контура коррекции корреляционно-экстремальной инерциальной системы при беспоисковом оценивании вектора состояния........................ § 7.2. Синтез контура коррекции корреляционно-экстремальной инерциальной системы при поисковом оценивании вектора состояния........................ § 7.3. Выбор оптимальных режимов коррекции корреляционно-экстремальных инерциальных систем . . . Глава VIII. Алгоритмическое обеспечение навигационных комплексов............................................. § 8.1. Методы навигации и критерии оптимизации . . § 8.2. Алгоритмы навигационных комплексов........... § 8.3. КЭНС, оптимальное траекторное управление и структура навигационных комплексов.................. Приложение ........................................... Литература............................................
ПРЕДИСЛОВИЕ После появления бортовых цифровых вычислительных машин (БЦВМ) навигационные системы самолетов, кораблей и других подвижных объектов превратились в сложные комплексы. В этих комплексах обычно осуществляется автономное определение или, как говорят, счисление координат по сигналам систем, накапливающих ошибки с течением времени (инерциальные, курсо-допплеровские и иные системы), и систематическая или эпизодическая коррекция по сигналам радионавигационных систем (ближних, дальних, глобальных), бортовых радиолокационных станций и устройств визирования ориентиров. В данной книге рассматриваются принципы построения и теория относительно нового класса навигационных систем (комплексов), в которых коррекция осуществляется не с помощью искусственных навигационных полей, а посредством естественных геофизических полей таких, как поле рельефа, аномальное магнитное поле Земли и др. Эти системы основаны на сопоставлении информации устройства наблюдения (датчика поля) с картой поля, хранящейся в бортовом блоке памяти. Как бы не создавались алгоритмы подобных систем — эвристическим путем или посредством строгого синтеза оптимальных алгоритмов, в них обнаруживается структура, напоминающая вычисление взаимной корреляционной функции, и структура, соответствующая поиску экстремума этой функции. Поэтому эти системы получили название корреляционно-экстремальных систем (КЭС). Данная книга посвящена прикладной теории навигационных КЭС (КЭНС). Теория КЭС получила основное развитие в трудах советских ученых. Однако в книгах [1, 5, 10] задачи синтеза КЭС почти не затрагивались. В данной книге проб-
лемам синтеза оптимальных и субоптимальных КЭНС уделено основное внимание. Это привело к созданию нескольких классов новых алгоритмов. Исследование процессов в соответствующих КЭНС составляет значительную часть содержания монографии. Кроме того, рассматривается довольно широкий круг задач и методов оценивания, идентификации и управления применительно к построению навигационных систем и в более общих применениях. Изложение сопровождается многочисленными примерами и материалами математического моделирдвания. Монография базируется в основном на оригинальных работах авторов. Она рассчитана на инженеров, аспирантов, научных работников и студентов старших курсов, специализирующихся в области навигации и управления Летательными аппаратами. А. А. Красовским написаны главы I, VIII, И. Н. Белоглазовым — главы II, III, V—VII и § 4.7. Глава IV написана А. А. Красовским и Г. П. Чигиным совместно. Авторы выражают благодарность проф. В. П. Тарасенко за рецензирование рукописи книги и полезные замечания.
ВВЕДЕНИЕ Корреляционно-экстремальные системы весьма разнообразны и могут иметь различное применение. Одним из удобных способов классификации КЭС является классификация по объему или характеру полезной информации, снимаемой с поля в каждый данный момент времени. В соответствии с этим КЭС делятся на системы, в которых информация в текущий момент времени снимается в точке (КЭС-I), с линии (КЭС-П) и с площади (кадра) (КЭС-Ш). Рис. В.1 иллюстрирует эту классификацию применительно к корреляционно-экстремальным навигационным системам. Рис. В.1. Классификация КЭНС. Системы с точечным зондированием поля (КЭНС-1) могут использовать как поверхностные поля (поле рельефа, оптического или радиолокационного контраста и др.), так и пространственные поля (аномальные магнитное, гра-
витационноеполя). Эти системы впервые были предложены вАСССР в 1961 году авторами данной монографии. Системы, снимающие мгновенно информацию с линии или кадра (КЭНС-П, КЭНС-Ш), могут использовать только поверхностные поля, так как подвижные объекты имеют обычно малые размеры в сравнении с так называемым радиусом корреляции пространственного поля. КЭНС-П и КЭНС-Ш по назначению вплотную примыкают к системам опознавания образов и совмещения изображений. Обстоятельные исследования определенных видов этих систем выполнены В. П. Тарасенко [1—4]. Следует заметить, что помимо указанных трех видов КЭС и КЭНС существуют промежуточные виды: с одновременным съемом информации в нескольких точках, с нескольких линий, со сканированием. При этом ясно, что, например, системы с быстрым сканированием по линии приближаются к КЭНС-П, а по кадру — к КЭНС-Ш. Данная книга посвящена в основном КЭНС-I. Однако излагаемая общая теория может быть в определенной мере распространена на КЭНС-П и КЭНС-Ш, что проиллюстрировано в §§ 1.7, 4.7 и Приложении. В развитии теории корреляционно-экстремальных навигационных систем (КЭНС-Т) можно выделить три — четыре этапа — направления. Первый «тап составила теория квазистационЭрных режимов непрерывных аналоговых схем КЭНС эвристического происхождения. Квазйстационарным '.режимом КЭНС-I называются режимы, при котором переходные процессы определения координат, (переходные процессы в контуре КЭНС) протекают достаточно медленно. Длительность этих процессов, выраженная в расстоянии, проходимом подвижным объектом, в йвазистационарном режиме должна составлять по крайней мере десятки радиусов корреляции используемого поля. Как и для других экстремальных систем, приближенная теория квазистационарных режимов сводится к обычной теории следящих систем, в общем случае нелинейных. Этой теории были посвящены работы авторов периода 60-х годов [5—9]. Рассмотренные в этих работах эвристические непрерывные алгоритмы КЭНС можно отнести к беспоисковым в том смысле, что здесь отсутствует перебор гипотез и движение к экстремуму корреляционной функции осу
ществляется посредством градиентного метода или его аналогов. Главными недостатками этих алгоритмов являются неоптимальность и расходимость при больших начальных отклонениях, превышающих радиус корреляции используемого поля [6]. Предложенные частные способы ликвидации больших отклонений при этих алгоритмах [8] не приобрели существенного значения. Уже в 60-х годах, главным образом в исследованиях И. Н. Белоглазова, начинает развиваться второе направление — теория поисковых КЭНС. В поисковых КЭНС задается множество гипотез об истинном движении объекта на некотором интервале времени, предшествующем текущему моменту. Каждой гипотезе соответствует определенная реализация, извлекаемая из блока карты поля. Сигнал датчика поля, записанный на указанном интервале времени, сопоставляется со всеми реализациями, соответствующими принятым гипотезам. Сопоставление осуществляется путем вычисления некоторого функционала. Гипотеза, соответствующая минимуму функционала, считается истинной. Теория йоисковых КЭНС строится на основе широко известной теории статистических решений. Поисковые алгоритмы КЭНС в принципе не имеют ограничений по величине начальных ошибок, однако требует значительной производительности БЦВМ в случае многопараметрического оценивания. В связи с этим в последнее время интенсивно развиваются два новых направления теории КЭНС — оптимальные беспоисковые алгоритмы и оптимальные комбинированные алгоритмы. Оптимальные беспоисковые алгоритмы ;КЭНС ведут свое происхождение от фильтра Калмана, примененного к специфической задаче наблюдения нерегулярного и не поддающегося аналитическому описанию навигационного поля. Дальнейшее развитие этого направления привело к созданию более экономных в вычислительном отношении алгоритмов, удобных для реализации в БЦВМ. Комбинированные алгоритмы представляют собой сочетание поисковых и беспоисковых алгоритмов, полученное на основе строгого решения задачи оптимизации. Все эти направления, за исключением первого (уже в известной степени устаревшего), получили отражение в
данной книге, построенной в основном на оригинальных результатах авторов. Первая глава данной монографии посвящена теоретическим основам беспоискового оптимального оценивания, идентификации и управления. Рассматриваемый здесь принцип минимума обобщенной работы, соответствующая теорема разделения, алгоритмы идентификации и управления выходят за пределы собственно теории КЭЙС, но могут применяться в алгоритмическом обеспечении бортовых комплексов. Алгоритмы оценивания, достаточные условия их сходимости (условия точного оценивания), декомпозиция и перераспределение информации в задачах оценивания являются основой теории беспоисковых КЭНС. Теоретические основы поисковых методов оценивания рассматриваются во второй главе. Здесь помимо известных положений теории статистических решений (§ 2.1) излагаются оригинальные материалы по комбинированному (рекуррентно-поисковому) оцениванию.' | Третья глава посвящена краткому рассмотрению математических моделей геофизических полей и навигационных некорректируемых систем. Беспоисковые алгоритмы оценивания КЭНС подробно рассмотрены в четвертой главе. Здесь осуществляется синтез как простейших, так и относительно сложных алгоритмов многопараметрического оценивания при наблюдении одного или нескольких навигационных полей и измерении других величин. Рассматриваются условия сходимости и приближенные аналитические оценки точности для многих вариантов КЭНС. Излагаются результаты математического моделирования и производится их сопоставление с приближенной аналитической теорией. Содержание главы имеет как теоретическое, так и прикладное значение. То же самое можно сказать о последующих главах, в частности, о пятой, посвященной поисковым алгоритмам. Здесь также осуществляется син-тез алгоритмов — оптимальных решающих правил. Рассматриваются оптимальные поисковые алгоритмы совместного оценивания местоположения и скорости движущихся объектов, поисковые КЭНС, использующие несколько полей.
Шестая глава посвящена комбинированным, а именно рекуррентно-поисковым алгоритмам КЭНС. Комбинированные алгоритмы сочетают преимущества поисковых и беспоисковых алгоритмов: работоспособность при больших начальных ошибках и возможность высокоточного многопараметрического оценивания при умеренной производительности БЦВМ. Поэтому возможности применения подобных алгоритмов достаточно широки. Как можно было заметить уже из предыдущего изложения, КЭНС сопрягается с той или иной вспомогательной навигационной системой инерциального, курсо-допплеровского или иного типа. Эта система в дальнейшем именуется «грубой» (ГНС). Сопряжение КЭНС с ГНС может быть односторонним («аналитическим»), когда обратное воздействие со стороны КЭНС отсутствует, и двусторонним, когда существуют замкнутые контуры коррекции ГНС посредством КЭНС. В перечисленных главах рассмотрены системы с односторонней связью. В седьмой главе синтезируются контуры коррекции инерциальной системы посредством беспоисковой и поисковой КЭНС. В этой же главе рассматривается вопрос оптимизации комплекса при использовании разрывного (не сплошного) навигационного поля. В заключительной главе изложены более общие вопросы построения навигационных комплексов. Здесь кратко рассматриваются методы навигации и критерии оптимизации траекторного движения. Обосновывается возможное разделение функций между пилотажным и навигационным комплексами. При этом на навигационный комплекс помимо оценивания навигационных координат возлагается задача формирования оптимальных траекторных управлений. Показано, что если оптимизацию траектории осуществлять в инерциальной системе координат и по принципу минимума обобщенной работы, то она может выполняться БЦВМ умеренной производительности.
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ БЕСПОИСКОВОГО ОПТИМАЛЬНОГО ОЦЕНИВАНИЯ, ИДЕНТИФИКАЦИИ И УПРАВЛЕНИЯ В беспоисковых системах, как уже отмечалось выше, отсутствует поиск, перебор на конечном множестве гипотез. Здесь гипотеза одна, но параметры (координаты) могут принимать значения из бесконечного непрерывного (для непрерывных систем) множества. Общей теоретической основой беспоисковых систем служит современная теория оптимального оценивания, идентификации и управления. Эта теория, как известно, весьма обширна. Соответствующая литература насчитывает сотни и тысячи наименований. Здесь приведем лишь те положения и результаты, которые с нашей точки зрения наиболее эффективны при решении сложных практических задач. В области собственного управления — это теория, базирующаяся на так называемом критерии или принципе минимума обобщенной работы [1.1 — 1.5, 1.28], в области оценивания и идентификации — это фильтр Калмана и его модификации, которые также могут быть интерпретированы с позиций упомянутого критерия. § 1.1. Основная теорема оптимизации по критерию обобщенной работы и теорема разделения Приведем формулировку и доказательство основной теоремы оптимизации по критерию обобщенной работы для случая, когда объект (управляемый процесс) описывается обыкновенными дифференциальными уравнениями в форме Коши, функционал является квадратичным относительно управлений и шумы отсутствуют (детерминированная задача). Ряд обобщений основной теоремы для
непрерывных систем можно найти в работах [1.1, 1,2, 1.6, 1.7]. а) Основная теорема для непрерывного процесса. Для процесса, описываемого уравнениями т + А (*£> О = Vi t)u}, i = 1, 2,..., п, (1.1) j=i оптимальными в смысле минимума функционала / = р8(^(М) + ^(^ + С1-2) 11 11 3 являются управления n Uj = ujoa = — fcj У, <Pfcj (a?, 0 , (1.3) k где V = V(x, t) — решение уравнения Ляпунова i=4 при граничном условии Vl=t, = V8, х = (х15 х2, . . ., хп) — вектор состояния, А, <ргу, Q, V3 — заданные непрерывные функции, А® >• О — заданные коэффициены. Функционал (1.2) содержит заданную функцию конечного состояния V3 (ar(t2)). Он называется терминальным (или квазитерминальным) функционалом обобщенной работы. Само название функционал или критерий «обобщенной работы» в значительной мере условно. Оно отражает то, что помимо члена, фигурирующего и в обычном критерии (Летова — Калмана), и соответствующего работе синтезируемых управлений Uj, данный критерий содержит член соответствующий работе управлений в оптимальной системе. Работа здесь понимается в обобщенном смысле — как значение интеграла от взвешенной суммы квадратов управлений. При специальном задании коэффициентов она
может иметь размерность энергии, т. е. может представлять собой действительную работу, совершаемую управлениями за время i2 — tv Одно из наиболее простых доказательств приведенной теоремы заключается в следующем. Полная производная по времени функции V(x, t) в силу уравнений (1.1), (1.3), (1.4) равна п пт tyijUj — ujonuj (1-5) Интегрируя в пределах от tx до i2, получаем /г /г т У/=/2 - Vt=tl = - j Q dt - j dt. ti ti j=i 3 Таким образом, /2 f 2 m W -д Ц Ц Qdt = it h j=l 3 Подставляя в выражение (1.2)', находим (“j —цзоп)2 (1-6) Отсюда непосредственно видно, что функционал I имеет минимум при Uj — UjOn, т. е. справедливо выражение (1.3). Приведем очень краткие пояснения функционала (1.2). В оптимальной системе, как видно из (1.3), и j — Wjon И В отношении физической или технической содержательности функционал (1.2) мало отличается от традиционного (2 Гг т 2 Из(^2)) + $С^ + y£_^dt. ti ti s-
Однако минимизация традиционного функционала приводит к нелинейному уравнению в частных производных (уравнению Веллмана или Гамильтона — Якоби), в то время как минимизация функционала обобщенной работы (1.2) приводит к линейному уравнению Ляпунова (1.4). Это имеет принципиальное значение. Принципиальное отличие обусловлено тем, что при вариациях Uj величины UjOn в (1.2) также варьируются, но не непосредственно, а через вариации х в силу уравнений (1.1). Терминальные (квазитерминальные) задачи оптимизации характерны для таких этапов полета, как посадка, приземление, самонаведение, стыковка, а также для так называемого циклического оценивания (см. ниже). Оптимизация по терминальным критериям приводит к нестационарным управлениям, зависящим от относительного времени^ — tt, где t2 — фиксированный конечный интервал времени. Для стационарных режимов необходимы стационарные или нетерминальные оптимальные управления. Для получения нетерминальных'управлений используется нетерминальный функционал вида it т 2 । 2 = + (I-7) где V — «вынужденное» (частное) решение уравнения (1.4), не зависящее от каких-либо граничных условий. При решении нетерминальной задачи возникает следующее затруднение. Минимизация функционала (1.7) имеет практический смысл, если Q, V — положительно определенные функции вектора состояния. Функция Q назначается положительно определенной. Однако функция V, получаемая как вынужденное решение уравнения (1.4), может не обладать свойством положительной определенности. Это особенно характерно для того случая, когда невозмущенное состояние (х = 0) неуправляемого процесса неустойчиво [1.1, 1.8]. Для преодоления этого затруднения используется способ нестационарного функционала [1.1, 1.8, 1.9]. Назначаем функцию Q в виде Q = <?*(х, /)ехр (—-£-) ,
где Q* — положительно определенная относительно х функция, Tq — положительная постоянная, носящая название времени релаксации функционала. Функцию V ищем в виде V = У*ехр(—г/Tq). Подставляя эти выражения в уравнение (1.4), находим Для того чтобы получить стационарные оптимальные управления (хотя бы для случая, когда Q*, ft, cptj не зависят явным образом от времени), полагаем к] = к* ехр . В результате получаем следующую формулировку основной теоремы. Для процесса, описываемого уравнениями (1.1), оптимальными в смысле минимума функционала I = P?=tsexp (—7^-) + являются управления п Uj = w;on= — к* (1-10) где V* — вынужденное решение уравнения (1.8). Для получения нетерминальных управлений можно также использовать функционал со скользящим интервалом оптимизации ‘+’’оп Н-Топ т 2 2 t j=l з где Топ = const — заданный интервал оптимизации, t — текущий момент времени. В этом случае оптимальные управления выражаются формулой (1.3), где V = V (х, t) — решение уравнения
(1.4) при V (х, t + Топ) = 0. Прежде чем продолжать изложение вопросов оптимизации, заметим следующее. Реализация оптимальных управлений чаще всего возможна в цифровых или гибридных управляющих машинах. При этом имеет место дискретность управления во времени. Между тем управления вида (1.3) непрерывны во времени. Существует два пути получения дискретных во времени оптимальных (точнее, субоптимальных, т. е. близких к оптимальным) управлений. Первый путь заключается в том, что используется естественная непрерывная математическая модель управляемого процесса вида (1.1) и строится дискретный аналог (разностная схема) оптимальных управлений (1.3) или (1.10). Дискретный аналог оптимальных управлений далее реализуется в цифровой или гибридной управляющей машине. Достоинством этого подхода является то, что его основой служит непрерывная математическая модель управляемого объекта, которая в подавляющем большинстве случаев адекватна самой природе управляемых процессов, т. е. является естественной и точной. Недостатком данного подхода является то, что при построении дискретного аналога непрерывных оптимальных управлений всегда существует опасность либо завысить требования к быстродействию ЭВМ, либо существенно понизить точность или даже устойчивость управления из-за потери информации. Другой подход с самого начала опирается на дискретную модель управляемого процесса и позволяет получить оптимальные управления сразу в дискретной форме. Достоинством этого подхода является то, что отсутствуют ошибки, связанные с переходом к дискретному аналогу непрерывных управлений, однако для нелинейных непрерывных управляемых процессов существуют ошибки, обусловленные переходом к дискретной математической модели. Дело в том, что только для линейных процессов существует общий метод построения точной дискретной модели, т.'е. точных математических выражений, связывающих вектор состояния и управляющие воздействия в заданные дискретные моменты времени. Для процессов,
описываемых нелинейными дифференциальными уравнениями, такого общего метода не существует. Зато имеется развитый аппарат численного интегрирования обыкновенных дифференциальных уравнений, который в основном и сводится к построению дискретных математических моделей непрерывных процессов. Теорема оптимизации по критерию обобщенной работы для линейных дискретных процессов рассмотрена в статьях [1.10, 1.11]. б) Теорема разделения. Задача оптимального управления рассматривалась выше в детерминированной постановке. Вектор состояния управляемого процесса считался измеримым (наблюдаемым) без шумов и искажений. Сам объект управления не подвергался возмущающим воздействиям кроме начальных отклонений. Между тем в реальных условиях вектор наблюдения z обычно связан с вектором состояния х некоторым соотношением, включающим шумы (ошибки) измерения. Наблюдаемые и управляемые процессы (объекты) подвержены воздействию непрерывно действующих возмущающих сил. Поэтому необходима стохастическая постановка задачи оптимизации с учетом шумов и прямых и косвенных измерений. Самое простое обобщение основной теоремы получается для случая, когда условия измерения идеальны (z = х), но на объект управления воздействуют возмущающие силы типа белых шумов. Векторное описание непрерывного объекта в этом случае имеет вид £ + / (ж, 0 = <р (ж, t)u + ф (х, t)lx, где ср, ф — матрицы заданных функций, — векторный белый шум. Доказано (см. [1.1]), что управления (1.10) и = иоп = — /с2срт (ж, t) (4г)Т (фТ — транспонированная матрица, (дУ/дж)т — вектор-столбец частных производных, кг — диагональная матрица заданных коэффициентов) сохраняют силу оптимальных и для данного случая в смысле минимума математического ожидания функционала обобщенной работы М [7]. Доказательство, приведенное в [1.1], построено для модели белого шума в виде последовательности случайных по «площади» б-импульсов, разделенных произвольными,
ио конечными интервалами времени. Однако указанное положение справедливо и для некоторых других моделей белых шумов, по крайней мере для случая линейного объекта и квадратичного функционала. Таким образом, наличие возмущающих воздействий указанной структуры в объекте не меняет оптимальные управления. Иначе обстоит дело при наличии шумов датчиков и косвенном измерении, когда вектор наблюдения z связан с вектором состояния х соотношением z = ht (ж) + gz. Здесь — векторный белый шум, hz — заданная векторная функция векторного аргумента. Для линейного наблюдения г = hzx + (1.Н) где hz — заданная матрица коэффициентов, в общем случае прямоугольная, и линейного процесса вида х + ах = Ъи + (1.12) (а, Ь — матрицы коэффициентов, — гауссовский векторный белый шум) при традиционном квадратичном критерии оптимизации, при котором V, Q — квадратичные формы и в минимизируемом функционале ujoa отсутствует, справедлива известная теорема разделения [1.12, 1.13]. Согласно этой теореме оптимальная система состоит из фильтра Калмана, формирующего оценку х вектора состояния, и регулятора, оптимального в смысле традиционного квадратичного критерия при полной непосредственной наблюдаемости и отсутствии шумов (z = ж), причем в регуляторе вместо вектора х используется выходной вектор фильтра Калмана х. Для случая линейного" процесса, оптимизируемого по квадратичному критерию обобщенной работы, теорема разделения впервые доказана И. Е. Казаковым [1.14]. Другое доказательство приведено в [1.8]. Результат получается аналогичным: ^оптимальная система состоит из фильтра ’Калмана и регулятора, оптимального по критерию обобщенной работы в детерминированной задаче,
причем на вход регулятора вместо х подается выходная величина х фильтра Калмана. Заметим, что для квадратичного критерия 7 = у (Za) Аах (t2) + f, t2 + dt + -у- (Л-2и. UonAr2uon) dt, (1.13) h ti где A3, p — заданные матрицы коэффициентов, и линейного процесса (1.12) решение уравнения Ляпунова (1.4) сводится к решению обыкновенного матричного дифференциального уравнения А — Аа — атА = —р (1.14) при граничном условии A (Z2) = 43. Само оптимальное управление в данном случае имеет вид uon = — №ЬтАх. (1.15) Таким образом, для линейного процесса, линейного условия наблюдения и квадратичного функционала обобщенной работы справедлива следующая формулировка теоремы разделения. Для линейного процесса (1.12) и вектора наблюдения (1.11) оптимальным управлением, минимизирующим квадратичный функционал обобщенной работы М [7], является и = иоп = — WlrAi, (1.16) £ + а£ = RhzS? (z - hz£) + bu, (1.17) где ковариационная матрица ошибок оценивания R — = М [(х — £)(х — 4)т] есть решение матричного уравнения Риккати R + aR + RcF + Rh'zS?hzR = Sx, (1.18) а матрица А есть решение уравнения (1.14) при указанном граничном условии. Здесь 5Z, Sx — матрицы спектральных плотностей (интенсивностей) независимых векторных белых шумов £г, соответственно, причем матрица Sz считается неособой. Уравнение (1.16) вместе с (1.14) представляют собой уравнения оптимального регулятора, а уравнения (1.17), (1.18) — уравнения фильтра Калмана.
При этом выражение (1.17) и его обобщения будут в дальнейшем именоваться основным блоком (модулем) алгоритма Калмана, а выражение (1.18) и его обобщения — блоком (модулем) ковариаций. Для нелинейных систем строгое разделение алгорит- * мов оптимального управления и оптимального оценивания невозможно. Однако приближенное разделение возмож- ; но и целесообразно. Оно является тем более точным, чем выше точность оцениванид,. Обоснование приближенного разделения при оптимизации по критерию обобщенной работы дано в [1.8] и излагается ниже. Оптимальность соответствует минимуму функционала М[1] = 1« /,* т а 2 ' = М Гка(^2)) + \ Q (х, t)dt 4- 4- \ ^-* + “jon dt] , 1 Г А^Л к А где М — безусловное математическое ожидание. Согласно (1.6) этот функционал равен m М [I] = М [7(=(1] +4-М [ J dt] . ti ki Первый член этой суммы от управления на интервале оптимизации не зависит и величина М [Z] минимальна, если минимален второй член. Очевидно, что минимизация этого члена может осуществляться только при использовании вектора наблюдения z, когда математическое ожидание становится условным математическим ожиданием. В соответствии с этим условие оптимальности системы имеет вид t, т minM dt|z] , “ t, kj где вертикальной чертой обозначено условное математическое ожидание по z. В векторной форме ti min М Г f (и — ггОп)т^-2 (и — иоп) dt I zl. (1.20) и Ц J
Допустим, что посредством системы измерения (наблюдения) и оценивания вектор состояния х оценивается достаточно точно, так что условное распределение вероятностей близко к 6-распределению 6 (х — х), где х = = М [х | z (tx, t)] — условное математическое ожидание при наблюдении вектора z на интервале времени от tr до t. Тогда очевидно, что приближение в пространстве управлений по способу наименьших условных квадратов (1.20) близко к приближению по условным математическим ожиданиям в этом пространстве и == 7W [иОп ] z (£х, /)], Согласно основной теореме (см. [1.3]). Поэтому и = - к*М £фт(гг, f) ( - )T|z(/x, о] • На основании предположения о близости условного распределения к 6-распределению можно принять м[фт(ж, z) = п, где х = М 1х | z (^, £)] — условное математическое ожидание вектора состояния. Таким образом, оптимальное управление при указанных условиях приближенно равно u = (1-21) При том же условии достаточно высокой точности оценивания условное математическое ожидание £ формируется (приближенно) нелинейным фильтром Калмана [1.13], который для процесса X + f (х, t) = <р (х, t)u + (1.22) и условия наблюдения Z = hz (х, t) + (1-23)
имеет вид х 4- / (х, t) = R S;1 [z - hz (х, 0] + Ф (*. 0 и, (1.24) R 4- -g- R 4- R + R S-Zl^-R = Sx, (1.25) R = Ro. (1.26) Здесь ^4-, — матрицы Якоби, вычисленные в точке дх дх х — х. Заметим, что везде в данной книге матрицы Якоби образуются следующим образом. Если h (х) = (h± (х), . . .,hm (х)) — дифференцируемая векторная функция векторного аргумента х = (хп . . . , хп), то dhj dhj * * dxi ‘ дхп Если V (х) — скалярная функция векторного аргумент та, то = ... *q. (1.28) дх I dxi дхп || ' ' Если вместо (1.27) за матрицу Якоби принять транспонированную матрицу, как это сделано в 11.8], то дифференциал функции h будет иметь выраядение dh = dx, т. е. появляется знак транспонирования в выражении дифференциала, что не совсем удобно. Поэтому принимаем выражения (1.27), (1.28). Итак, можно сформулировать следующий результат, Для процесса (1.22) и условия наблюдения (1.23) приближенно оптимальными (субоптимальными) управлениями в смысле минимума стохастического функционала обобщенной работы (1.20) являются управления (1.21), где функция V есть решение уравнения Ляпунова (1.4), а оценка вектора состояния х получается посредством алгоритма оценивания (1.24)—(1.26). Это обобщение теоремы разделения будет широко использоваться в дальнейшем.
§ 1.2. Алгоритмы оценивания координат Алгоритмы оценивания (фильтрации) являются основой построения информационной части автоматизированного бортового комплекса, в частности навигационного комплекса. Длительное время в навигационных системах использовались простейшие алгоритмы оценивания эвристического происхождения. Лишь в последнее время в НК широкое применение получают оптимальные алгоритмы оценивания, базирующиеся на дифференциальных или разностных математических моделях контролируемых процессов. Видная роль в новом алгоритмическом обеспечении НК принадлежит теории калмановской фильтрации. Это согласуется с содержанием теоремы разделения, изложенной выше. Уравнения непрерывного нелинейного фильтра Кал-мана, представленные выражениями (1.23)—(1.26), можно несколько обобщить, записав в следующем виде. Для процесса А + f (х, и, t) = Zx (1-29) и условия наблюдения z — hz (х, и, t) + £г, (1.30) где и взаимно независимы, приближенный алгоритм оптимального оценивания имеет форму x + f(x, и, t) = S?[z — hz(x, и, «)], (1.31) + + = (1.32) R (0) = Ro. (1.33) Как уже указывалось, уравнение (1.31) будем именовать основным блоком (модулем) алгоритма оценивания, а уравнение (1.32) — блоком ковариаций. Следует иметь в виду, что при наличии шумов измерения уравнение (1.32) для нелинейных систем является стохастическим и R — случайная матричная функция. Для таких систем лишь регулярная часть R (математическое ожидание) приближенно равняется ковариационной матрице ошибок оценивания М Цх — i)(x — 2)т]. Однако чем точнее оценивание, тем ближе R к безусловной ковариационной
матрице ошибок оценивания (см. ниже). Соотношение (1.33) представляет собой начальное условие для ковариационной матрицы ошибок оценивания. Оно должно задаваться на основе априорных соображений и по возможности согласовываться с начальным условием для вектора оценки £. Так, если £ (0) = 0, т. е. основной блок запускается из нулевого состояния, то матрицу R (0) целесообразно задавать по возможности близкой матрице М [ж (0)жт (0)1 для контролируемого процесса. Если известно математическое ожидание оцениваемого вектора в начальный момент времени М [ж (0)], то целесообразно задавать £ (0) = — М [х (0)]. В этом случае матрица R (0) должна быть по возможности близкой ковариационной матрице самого оцениваемого процесса. Следует отметить, что для устойчивого фильтра допустим определенный произвол в назначении R (0) = 7?0: вне зависимости от того, как назначается Ro в пределах некоторой области, дисперсии ошибок оценивания с течением времени стремятся к одним и тем же установившимся значениям (R (/)-> R (оо)). Разумеется, здесь предполагается, что установившиеся значения дисперсий ошибок оценивания достаточно малы. Для линейного стационарного процесса и линейного стационарного условия наблюдения £ + ах = Ьи + (1.34) z = hzx 4~ £г, (1.35) а — const, b — const, hz = const, основной блок (1.31) является линейным: £ + ах = RhlS? (z - hz£) + bu, (1.36) а блок ковариаций представляет собой уравнение Риккати R + aR -Ь Rdc + Rhl S?hzR = Sx. (1.37) Известно (1.15], что если в этом случае выполняется условие полной наблюдаемости по Калману, т. е. ранг матрицы составленной из прямоугольных матриц Ce’Aj.....................(aT)n-1AL
равен порядку п системы уравнений (1.34), то матричное уравнение Риккати (1.37) имеет единственное устойчивое решение, к которому стремятся все другие решения при произвольных начальных условиях. Основной блок алгоритма (1.36) при этих условиях также устойчив *) и вектор £ (0) в принципе может назначаться произвольно. Таким образом, при указанных условиях для линейной задачи фильтрации «область притяжения» устойчивого фильтра неограниченно велика и R (0), £ (0) могут быть произвольными. Иначе обстоит дело для общего случая нелинейного процесса (1.29) и нелинейного условия наблюдения (1.30). Дело в том, что для нелинейной задачи само уравнение ковариаций (1.32) является приближенным, справедливым лишь при достаточной малости ошибки оценивания Дж = £ — х. Действительно, если подставить в уравнение (1.31) выражение (1.30) и вычесть (1.29), то получим ДА + / (£, и, — и, t) = - - r [м?, и, t) - hz (ж, и, о] + + (1.38) Если принять, что вследствие малости Дж Ж и, — и, t)--= Л-рДж, hz(£, и, t) — Аг(ж, и, t) = Л-г-Дж, (1.39) ;го, записывая для (1.38) ковариационное уравнение как для линейного уравнения с детерминированными коэффициентами, после преобразований получаем (1.32). Таким образом, можно полагать, что алгоритм (1.31)— (1.33) сохраняет силу лишь при той точности начального и последующего оценивания, при которой допустима линеаризация (1.39). •) Аналитическую устойчивость не следует смешивать с численной устойчивостью при реализации дискретного .аналога алгоритма на ЦВМ. При наличии аналитической устойчивости вследствие целого ряда причин может возникать численная неустойчивость.
В следующем параграфе рассмотрены достаточные условия сходимости алгоритма (1.31)—(1.33). Здесь заметим следующее. - В некоторых случаях уравнение (1.32) имеет постоянное устойчивое решение R — R (ро) = const. Это имеет место для линейной стационарной задачи при полной наблюдаемости, может иметь место для нелинейной задачи при постоянстве оцениваемого вектора (х = const) д в некоторых других сдучаях, Основной блок фильтра Каймана (1.31) при R =const и f, hz, не зависящих явным образом от времени, будем называть стационарным. Стационарный фильтр Калмана оптимален, строго- говоря, только в установившемся режиме. В переходном режиме,„дд7 пинающемся, например, Со значения х (0) — 0, этот фцль^р’ в лучшем случае может играть лишь роль субоптймаль-ного. Зато он прост в реализации. Действительно, если условия существования решения R = const выполняются, то ковариационное уравнение может быть решено еще.на стадии проектирования и матрица R = const заложена в готовом виде в память ЭВМ. Все же главным в задачах навигации является нестационарный фильтр, состоящий из собственно фильтра (1.31) (основной модуль) и блока ковариаций (1.32), запускаемого в начальный момент времени, согласно условию (1.33). Однако при длительном времени оценивания численная реализация алгоритма (1.31)—(1.33) из-за неизбежного накопления ошибок нередко приводит к расходимости оценок. В этой связи заслуживает внимание вариант' алгоритма (1.31)—(1.33), который может быть назван циклическим алгоритмом Калмана. а) Циклическое оценивание. Все время функционирования системы разбивается на циклы, именуемые циклами оценивания. Считается, что для целей навигации или других применений достаточно иметь оценки вектора состояния в конечные моменты циклов. Алгоритм (1.31)—(1.33) «запускается»- в начале каждого цикла, например, из ну-‘ левого состояния х (0) = 0 и функционирует до получения оценки х (Гц) в конце цикла. Циклический фильтр имеет' те положительные качества, что для достаточно малых Гц могут использоваться упрощенные математические модели контролируемых процессов, а также то, что ошибки, численной реализации сбрасываются вместе с оценками
в конце каждого цикла. Если для контролируемого процесса допустима детерминированная модель х -f- f (х, и, t) — О, что, обычно имеет место или при достаточно малом времени оценивания Тц, или при достаточно точном контроле случайных возмущающих воздействий, рассматриваемых как компоненты и, то Sx = 0. При этом уравнение кова-рцаций (1.32) целесообразно заменить уравнением для обратной матриц» А к = Я"1, производная которой согласно общему правилу равна Ак = —R~lRR~l = -AkRAk. Умножая (1.32) слева и справа на при Sx = 0, получаем Ак -Ак-^г- (-О Ак = . (1.40) К К д& \ дх / к \ д& / 4 ' Основной блок будет иметь вид i+ /(i, и, 0 = Ак\^УS?\z-hM, U, 0]. (1.41) Матричное уравнение (1.40) интересно тем, что оно линейно относительно Ак. Для линейного процесса и линейного условия наблюдения это уравнение вообще линейно. В некоторых случаях оно может быть точно или приближенно проинтегрировано в элементарных функциях-матрицах или в квадратурах. Так, при / = 0 4,(0)(1.42) О Эти выражения цредставляют интерес не столько с точки зрения использования при построении «рабочих» численных алгоритмов, сколько для целей приближенного аналитического исследования процессов оценивания. Именно для этого они часто будут применяться в дальнейшем. Прежде чем закончить рассмотрение непрерывного фильтра Калмана, целесообразно привести интерпретацию этого алгоритма с позиции оптимизации по локальному критерию обобщенной работы. - Локальным критерием обобщенной работы назовем критерий, получаемый из (1.2) при стремлении к нулю интервала оптимизации —
— tlt точнее, так будем называть выражение m 9 , л 4 V4 и • 4- и 7 + /°П ’ (1-43> j=l j где V3 — заданная функция текущего вектора состояния и, быть может, другого вектора z (Z), ,2 V , А dV3 uj ОН — Kj / , (₽fc j I) дх ic^i л (для объекта (1.1)). Аналогично (1.5), (1.6) доказываем, что в данном случае и оптимальное в смысле минимума (1.43) управление равно / \т W = Иоп = — /с2фт (ж, Z) • (1.44) Таким образом, в случае локального критерия обобщенной работы оптимальное управление строится непосредственно по заданной функции Р3 без решения уравнения Ляпунова. Задачу синтеза алгоритма фильтрации можно ставить как задачу оптимального управления некоторой моделью оцениваемого процесса. Пусть оцениваемый процесс и условие наблюдения имеют вид (1.29), (1.30). Рассмотрим управляемую модель оцениваемого процесса х + f (х, и, t) = и~, (1.45) где U' должно быть определено из условия минимума следующего локального квадратичного критерия обобщенной работы: 7 = 4- [z — hz (i, и; ttfS? [z — hz (x, u, Z)] + + -г“гЯ',“г + 4’“5опл’Чоп, (,-w) “s«. - -11 (i v^) “ R (->-)' ' I* - № “• <>!
Первый член правой части выражения (1.46) представляет собой положительно определенную квадратичную форму разности вектора наблюдения z ъ оценки этого вектора hz (<г, и, t). Матрица коэффициентов этой квадратичной формы равна обратной матрице спектральных плотностей шумов наблюдения. Это в общих чертах согласуется с так называемым способом равных вкладов максимальных ошибок [1.1, 1.18]. Второй член критерия (1.46) представляет собой положительно определенную квадратичную форму синтезируемого управления, причем матрица коэффициентов этой формы равна обратной ковариационной матрице ошибок оценивания в синтезируемой системе. I’aKoe задание коэффициентов критерия в части управлений также довольно прозрачно, так как синтезируемое управление имеет размерность вектора скорости изменения оценки состояния (см. (1.45)) и разумные уровни компонент и- должны соответствовать уровням флуктуаций компонент А, которые В Значительной мере характеризуются матрицей R. Итак, применение критерия в виде (1.46) представляется в достаточной мере естественным. При оптимизации по этому критерию согласно (1.44) м- = и-оп и алгоритм оценивания (1.46) принимает вид % + и, t) = SzX[z — hz(i, и, «)]. Это совпадает с основным блоком алгоритма Калмана (1.31). б) Субоптимальный алгоритм оценивания с эмпирической ковариационной матрицей. При реализации алгоритма калмановского оценивания для многомерных много-связных процессов наибольшие затруднения возникают при осуществлении ковариационного блока (1.32). Действительно, если система дифференциальных уравнений, описывающих контролируемый процесс, имеет порядок п, т. е. размерность пространства состояний равна п, то такой же порядок имеет и основной блок фильтра Калмана (1.31). Порядок системы дифференциальных уравнений, эквивалентных матричному уравнению ковариаций (1.32), с учетом симметрии матрицы R = 7?т равен V2n (п 4-1). При п = 10—20 и более и высоком темпе оцениваемых процессов производительность ЭВМ, необходимая для
численного интегрирования уравнений (1.31), (1.32) в реальном масштабе времени, чрезмерно высока. К этому добавляются затруднения, связанные с численной неустойчивостью и ограниченной применимостью блока ковариаций (1.32). В последнее время предложены алгоритмы, в которых оценка ковариационной матрицы R определяется не путем численного решения уравнения (1.32), а посредством «статистической обработки» сигналов на выходе вспомогательной модели или выходных сигналов основного блока 11.8, 1.19]. Эти алгоритмы будем здесь именовать алгоритмами с эмпирической ковариационной матрицей. Для пояснения первого из этих алгоритмов вычитаем уравнение (1.29) из (1.31) и, используя предположение о малости ошибок оценивания, полагаем /(т, a, t) — f(x, и, t) = Дх, дх Ах = х — х. Получаем Ах-\--^-Ах = r( [z - hz (x, и, «)] - (1.47) дх \ дх J Если шум £ж = (/), возбуждающий оцениваемый про- цесс, не измеряется, А) воспроизвести его невозможно-Однако можно' воспроизвести статистически эквивалент, ный белый шум g? = gj (t), т. е. белый шум с той же матрицей спектральных плотностей Sx, что и £х. Ковариационная матрица ошибок оценивания при М [Да:] = 0 по определению равна R — М [АхАхт]. В субоптимальной или квазиоптимальной системе усреднение по ансамблю может быть заменено усреднением по времени, например, в виде скользящего среднего. Можно применить еще более простую операцию усреднения в апериодическом звене Уф Й + Й — Д®Джт, где Тф — скалярная постоянная времени, R — оценка ковариационной матрицы. Для того чтобы оценка R по истечении некоторого времени после включения фильтра
стала близкой к R, необходимо, чтобы значительно превосходило время корреляции матричной функции ДхДхт. Это время корреляции, вообще говоря, меньше времени корреляции оцениваемого процесса. Последнее следует из того, что динамические ошибки в оптимальной системе оценивания должны быть достаточно малы, а значит, инерционность этой системы меньше, чем «постоянные времени» оцениваемого процесса. Итак, выбирая Т$ большей наибольшей из постоянных времени оцениваемого процесса, имеем основание считать, что R будет близко к Я по крайней мере в установившемся режиме для стационарных процессов. Заменяя в (1.31), (1.47) R на R и — на £*, получаем полную совокупность блоков рассматриваемого алгоритма / Oh \Т х 4- /(х, и, t) = R |S? [z — hz(x, и, /)], (1-48) \ дх J Ы + Дх = R (—Л) S? [z — hz(x, + %*, (1.49) Ox \ дх J ТфЯ 4-R = ДхДх’, R(0) = Ra. (1.50) Порядок системы уравнений (1.48)—(1.50) даже выше, чем (1.31)—(1.33), а именно с учетом симметрии матрицы R он равен 2n + V2n (п + 1) вместо п + п (п, + 1)/2 для (1.31)—(1.33). Однако реализация (1.48)—(1.50) требует существенно меньшей производительности ЭВМ, чем реализация фильтра Калмана. Дело в том, что уравнения (1.50), имеющие в скалярной форме вид T$Ri] + Rij = Дх/Дх), автономны (независимы друг от друга) и весьма просты. Количество элементарных операций, необходимое для численного интегрирования этих уравнений, относительно мало. Поэтому трудоемкость алгоритма (1.48)—(1.50) определяется в основном численным.интегрированием системы уравнений (1.48), (1.49) 2п-го порядка. Необходимая производительность ЭВМ для многомер- , ных многосвязных процессов снижается на один — три порядка и более в сравнении с алгоритмом Калмана. Заметим, что алгоритм (1.48) — (1.50), как и алгоритм Кал-
мана, требует знания статистических характеристик (матрицы спектральных плотностей) белых шумов, возбуждающих контролируемый процесс. В тех случаях, когда сведения об этих шумах отсутствуют и отсутствует всякая возможность их контроля, целесообразно применять способ вычисления оценки ковариационной матрицы R, основанный на измерении высокочастотных флуктуаций выходного вектора самого основного блока (1.48). Соответствующая разновидность алгоритма с эмпирической ковариационной матрицей в работе [1.19] названа адаптивной. Ее вычислительная трудоемкость даже меньше, чем для алгоритма (1.48)—(1.50). Основой алгоритма (1.48)—(1.50) является аналогия с фильтром Калмана. Однако можно пойти дальше, построив еще более экономные в вычислительном отношении алгоритмы. Работоспособность их должна проверяться прежде всего путем исследования сходимости (устойчивости). Весьма экономный в вычислительном отношении алгоритм получается из (1.48)—(1.50) при 7$ — 0, когда R = АжАжт. Подставляя это выражение в (1.48), (1.49), получаем х + / (х, и, t) = пЛх, М -]- Аж = лДж + Й, где (ал \* - —тг-Дж Sz [z — hz(x, u,t)] дх / (1.51) (1.52) (1.53) — скалярная величина. В частном случае, когда / = 0, алгоритм еще упрощается: х = л Аж, (1-54) Д£ = лАж + (1.55) Ввиду скалярностд л векторные уравнения (1.54) (1.55) распадаются на скалярные дифференциальные уравнения первого порядка, связанные только через л. Это и определяет особую простоту численного интегрирования. 2 А, А. Красовский
Шумы измерителей чаще всего независимы и матрицы Sz, Sz1 — диагональные. Алгоритм (1.51), (1.52) приводится к виду (1.54), (1.55) не только для случая / = 0, но и для случая низкого уровня шумов измерителей, когда диагональные элементы матрицы Sz* велики и члены, содержащие л, имеют преобладающее влияние. Достаточные условия сходимости алгоритмов (1.51)—(1.55), как и нелинейного фильтра Калмана (1.31)—(1.33), при некоторых дополнительных предположениях будут рассмотрены в следующем параграфе. § 1.3. Достаточные условия точного оценивания Рассмотрим сначала процесс и условие наблюдения без шумов ж + / (ж, u, Z) = О, z = hz (ж). (1.56) Здесь /, hz — известные п — 1 раз дифференцируемые векторные функции. Функции времени z (t) == hz (ж (t)), и (t) также считаются п — 1 раз дифференцируемыми по времени. Процесс (1.56) будем считать вполне наблюдаемым, если абсолютно точное измерение (наблюдение) величины z на сколь угодно малом интервале времени, содержащем момент t, позволяет абсолютно точно определить вектор состояния ж (t). Продифференцируем z (t) = hz (х (t)) п — 1 раз по времени, заменяя каждый раз х на —/ согласно (1.56). Получаем ht (®) = я, Lht (х) = z, ц L^hz (ж) = z<n-1>, где L — линейный дифференциальный оператор полной производной по времени в силу уравнения ± -f- / = 0 (оператор Ляпунова). Для произвольной функции у L,,_ _ + 9 дх ' 1 ди 1 dt Рассматривая (1.57) как систему алгебраических уравнений относительно ж, заключаем, что вектор ж (i) может
быть однозначно выражен через z (i), z (£), . . z(Tl-1) (t) тогда и только тогда, когда rank dhz дх ИЛИ II / dh, \т / а \т 1а \т П ranklbf) •••U£n’1N lr ”• (1-58) Таким образом, условие (1.58) является необходимым и достаточным локальным условием полной наблюдаемости в рассматриваемом смысле. Локальность данного условия означает следующее. Из самого способа получения уравнений (1.57) следует, что х (f) является решением этих уравнений, причем именно тем решением, которое необходимо найти по смыслу задачи наблюдения. Однако у уравнений (1.57) даже при выполнении условия (1.58) могут существовать другие решения, отличающиеся от х (f) на конечные величины. Условие (1.58) гарантирует лишь то, что в бесконечно малой окрестности х у уравнений (1.57) нет других решений, кроме х. Если величина z и ее производные измеряются с ошибками, то и решение уравнений, подобных (1.57), отличается от истинного вектора состояния х. Однако если условие (1.58) выполняется, то при стремлении к нулю ошибок измерения решение уравнений типа (1.57) стремится к истинному значению вектора состояния. Поэтому условие (1.58) может быть названо необходимым и достаточным условием точного оценивания (при наблюдении z и его производных) в смысле, подробнее рассматриваемом ниже. Для линейного стационарного процесса / = ах — Ъи, hz (х) = hz-x, а, Ъ, hz = const и условие (1.58) превращается в условие полной наблюдаемости Калмана: rank || hl a*hl... (a’)"-1 hl || = п. (1.59) Однако если даже условие полной наблюдаемости (1.58) выполняется, соотношения (1.57) обычно не дают
практически приемлемого алгоритма определения х (t). Действительно, измерению обычно сопутствует шум, а многократное дифференцирование наблюдаемой величины резко увеличивает уровень широкополосной помехи. Практическими являются алгоритмы оценивания, изложенные в предыдущем параграфе. Применительно к оптимальным, субоптимальным и даже простым эвристическим алгоритмам оценивания целесообразно ввести понятие условия точного оценивания. Пусть имеется процесс и вектор наблюдения ± = f (х, и, £), z — h (х) + (1.60) где — белый шум с матрицей интенсивностей Sz, /, h, и — и (t) — точно известные функции. Допустим, что для (1.60) построен алгоритм оценивания, обеспечивающий формирование оценки A (t) вектора х (£) с некоторой точностью, характеризуемой ковариационной матрицей ошибок оценивания R (t) = М I ДхДхт], Дх = х — х. (1.61) Будем говорить, что имеет место условие точного оценивания, если при достаточно малых элементах начальной ковариационной матрицы R (0) текущее значение R (t) стремится к нулю при Sz -> 0 и любом конечном t > 0. Условие точного оценивания может иметь место даже в том случае, когда z — скалярная величина, т. е. наблюдается одна-единственная функция вектора состояния. Практическое значение условия точного оценивания заключается в том, что при его выполнении достаточно точное измерение одной или нескольких величин позволяет достаточно точно оценить все компоненты вектора состояния. Конечно, условие точного оценивания многомерного вектора при наблюдении, например, лишь одной величины может выполняться лишь за счет точного знания уравнения наблюдаемого процесса (функции /) и функции h. Однако именно в навигационных задачах эти функции могут быть точно известными. Действительно, в навигации уравнениями оцениваемых процессов чаще всего являются кинематические соотношения, обладающие практически абсолютной достоверностью. Итак, для навигационных комплексов условия точного оценивания имеют важное значение.
Рассмотрим сначала достаточные условия точного оценивания для нелинейного фильтра Калмана (1.31)— (1.33). В соответствии с (1.60) Sx = 0 и ковариационное уравнение (1.32) принимает вид • df / at \т / dh, \т , dh_ R +-^R + Rl—^-] +R S^^R = 0. (1.62) dx \dx] \ dx J dx ' По условию интенсивности шумов %z стремятся к цулю. Полагаем S?=±DZ, sz (1.63) где sz — скалярная сколь угодно малая положительная величина, Dz — матрица, положительно определенная, как и S71 (как правило, диагональная). Применяя замену независимой переменной (времени) 1 1 т ——t, dx ——dt, s, ’ s„ в соответствии с (1.62), (1.63) получаем ап / dh. \T dh. i af ^- + R Dz—^-R = ~sz(—~R dX \ дх I dx \ dx T- По условию sx -*• 0 и условие точного оценивания сводится к асимптотической устойчивости при достаточно малом R (0), т. е. к асимптотической устойчивости по Ляпунову решения R = 0 уравнения +(^~rY Dz-^-R = 0. (1.65) dx‘ \ дх )дх ' Но квадратичная форма yrDzy положительно определенная. Поэтому, если dh —Л- R ф 0 при R = cosnt 0, (1.66) то все диагональные элементы матрицы dRIdx отрицательны при R Ф 0 или равны нулю в отдельные моменты времени. Таким образом, при выполнении условия (1.66) диагональные элементы ковариационной матрицы R (дисперсии ошибок оценивания) монотонно стремятся к нулю.
Все остальные элементы матрицы R по самому смыслу этой матрицы также при этом стремятся к нулю. Ковариационная матрица 7? (т) при соблюдении условия (1.66) стремится к нулю асимптотически при т оо. Однако t = szt и при достаточно малом sz любое сколь угодно большое заданное значение т трансформируется в сколь угодно малое t. Итак, условие (1.66) в сочетании с достаточной малостью 7? (0) является достаточным условием точного оценивания. Вследствие близости вектора оценки А к вектору состояния х это условие может быть заменено на следующее: dh -~R^Q при R = const =/= 0. (1.67) Оно должно выполняться на любом из оцениваемых движений х (£). Достаточное условие точного оценивания (1.67) эквивалентно линейной независимости столбцов dhjdx. Можно получить также другое достаточное условие точного оценивания для алгоритма Калмана. Допустим, что dh (1.68) Учитывая, что х -х. х, полагаем также dh, —±R = 0. дх Согласно (1.65)! при этом dRIdx == 0, а стало быть, 7? = 0. Дифференцируем (1.68) последовательно по времени п — 1 раз, каждый раз заменяя f на —/ согласно (1.60). Получаем / dh, \ / dh, \ -^7? = 0, 1* 7? = 0............. £п-х » я-=0. (1.69) Если rank 3ft, \т / dh, ____£| ( т_______£| дх ) \ дх / П, (1-70) то соотношения (1.69) могут выполняться только при 7? == = 0. Таким образом, условие (1.70) является также достаточным условием точного оценивания для алгоритма
Кидмана. Оно напоминает необходимое и достаточное условно полной наблюдаемости (1.58), однако принципиаль-но от него отличается (операторы и L поменялись местами). Условие (1.70) можно записать также в виде III \т / гапк|Ьт) ( d dt dh\^ дх J dt*'1 dh, \т I ar) =«’ d-71) где полные производные по времени вычисляются в силу уравнения оцениваемого процесса х + / — 0. Рассмотрим теперь достаточные условия точного оценивания для наиболее удобного в вычислительном отношении алгоритма (1.51)—(1.53) при = 0. Осуществляем, как и ранее, замену времени т = i/sx 1 1 в уравнении (1.52), полагая Sx = —Dz. С учетом выра- s2 жения (1.52) находим = -I f—Л Дх) Dz [z — hz (х, и, /)]1 Дх — sz Дх. Рассматривая предельный переход sz -> 0, полагаемв что условие точного оценивания в данном случае сводится к условию асимптотической устойчивости тривиального решения Дх s 0 уравнения dAa < / dh, \» ~dt~ ~ 1 I (х> 0 “ ^z(^, и, ^)] > Дх. В фигурных скобках здесь скалярная величина и достаточным условием асимптотической устойчивости и, по предположению, точного оценивания является неравенство -Л- ДхГ Z)2 [hz(x, и, t) — hz(x, и, /)] > 0 (1-72) при Дх = const =0= 0. Ценным качеством достаточного условия точного оценивания (1.72) служит то, что оно сохраняет силу для больших отклонений Дх = х — х. Для малых отклонений
(малых ошибок оценивания), когда можно принять dh hz (х, и, t) — hz (х, и, t) = Ах, дх вследствие положительной определенности матрицы Dz условие (1.72) превращается в dh Ах ф 0 при Дх = const =5^ О, дх т. е. в условие линейной независимости столбцов dhjdx (или dhjdx). Таким образом, «в малом» достаточные условия точного оценивания для нелинейного фильтра Калмана и алгоритма (1.51)—(1.53) одинаковы. Эти достаточные условия будут использованы в дальнейшем. § 1.4. Декомпозиция и перераспределение информации в задачах оценивания Как уже отмечалось, реализация алгоритмов оптимального оценивания процессов высокой размерности требует большой производительности ЦВМ. Кроме указанного пути («эмпирического» вычисления ковариационной матрицы) существует целый ряд других способов снижения требуемого быстродействия. Один из этих способов заключается в декомпозиции задачи оценивания — расчленения этой задачи на совокупность задач меньшей размерности. а) Декомпозиция в задачах оценивания. Как известно, квазидиагональной квадратной матрицей называется блочная матрица, по главной диагонали которой расположены квадратные матрицы-блоки, а остальные блоки содержат лишь нулевые элементы. Обозначим такую матрицу следующим образом: (1.73) Здесь Ai [nJ — квадратный блок размера пг х пг. Вся
матрица А . ир] имеет размер п X п, где п == пх + I . . . + пр. Ясно, что в форме (1.73) могут быть представлены квадратные матрицы с разной структурой. Так просто диагональная матрица может быть представлена в форме (1.73), причем п; в этом случае могут быть любыми натуральными числами, удовлетворяющими соотношению пг + п2 + I . . . + пр = п. Допустим, что оцениваемый процесс и условия наблюдения таковы, что квадратные матрицы df / dh, \Т dh, u! I z \ ci^l z г» ✓s « I I Or z' « Or dx \dx dx в уравнении ковариаций (1.32) фильтра Калмана являются квазидиагональными вида (1.73). Это будет иметь место тогда, когда уравнения оцениваемого процесса (1.29) и условия наблюдения (1.30) распадаются на р независимых систем дифференциальных уравнений и соотношений *): X(D I • • • - / = ®(р) II hz = l^zd) (sd)>u> 0 |АЦр)(х(р)-“- г> 7(1) (*(!).«. <) Лр)(Ж(Р)’“’ и матрицы спектральных плотностей Sx, Sz имеют соответствующую квазидиагональную структуру. В этом случае в соответствии с правилами блочной матричной алгебры как основной модуль (1.31), так и модуль ковариаций (1.32) фильтра Калмана распадаются на блоки А») Н" А») (^ц)’ 0 = = 7?(t) ( /(t) Sz’i) [Z(i> — hza) (X(i), u,i)b (1.74a) \ 9®(i) / у i ^/(i) „ . p [ 9/(i) \T ax(i) \ dx{i} j + p(i)(^Vs;\)-^-n(i) = sx(i), (1.746) _________________\ 9a;(i) / 9xa) *) Размерность вектора наблюдения здесь‘принимается равной размерности вектора состояния.
которые могут иметь существенно меныпую размерность. Этот результат тривиальный, его можно предвидеть сразу, не прибегая к блочному представлению матриц. Однако декомпозицию, вообще говоря приближенную, можно осуществлять в некоторых более сложных случаях. Допустим, что существует установившийся режим работы системы оценивания, в котором ковариационная матрица R = Д практически постоянна (не зависит от времени). Осуществим осреднение соотношения (1.32) для этого режима по некоторому интервалу времени, обозначая осреднение чертой сверху *). Получаем + + = (1.75) дх \ дх ) \ дх } дх х v ' Во многих задачах, рассматриваемых в данной книге, матрицы &hz\T дх ) »t дх , dh. , Sz SX,S? дх оказываются квазидиагональными (или даже диагональными), т. е. имеют форму (1.73). Соответственно этому уравнение (1.75) установившейся ковариационной матрицы ошибок оценивания распадается на блоки (а/ \ _ _ l \т — Г/ dh, \т , dh. 1 _ ’Г’'-) ^(i) + ^(i) (“Т’-| “Г | S2(i)—т- ^(i) = S3C(i). дх /(i) \ ox / |Д дх / dx J(i) (1.76) Следует заметить, что основной модуль (1.31) фильтра Калмана при этом на блоки не распадается. Уравнения вида (1.76) нередко удается решить даже в аналитическом виде, т. е. найти аналитические выражения для Таким путем получаются аналитические формулы установившейся точности оценивания. В этом ♦) Как известно, на основе теории усреднения Крылова—Боголюбова — Митропольского — Волосова [1.29—1.34] усреднение может выполняться при соблюдении определенных условий не только в^статическом, но и динамическом режимах, причем могут быть построены приближения различного уровня. Здесь ограничиваемся только равновесным установившимся режимом.
основное применение указанного подхода. Что касается использования соотношений (1.76) в качестве модуля рабочего алгоритма ЦВМ (с соответствующей трансформацией для численного решения), то необходимо иметь в виду следующее. Совокупность алгоритмов (1.31), (1.76) является оптимальным (точнее, субоптимальным) алгоритмом оценивания только в установившемся режиме. Но сам установившийся режим при алгоритмах (1.31), (1.76) может не получаться, т. е. процесс оценивания может расходиться. б) Распределение информяпии. Оценивание состояния процесса или объекта осуществляется на основе информации, получаемой от измерительных систем-датчиков. Важное значение для алгоритмов и структуры системы в целом имеет рациональное распределение информации (задание вектора наблюдения и вектора управления). Под этим понимается следующее. Обратимся к общему уравнению оцениваемого процесса (1.29) и условию наблюдения (1.30). Под вектором управления и здесь понимается некоторая совокупность переменных, которые нам известны через измерение (или известны априорно). Под вектором наблюдения z также понимается некоторая совокупность переменных, функционально связанных с вектором состояния и известных через измерение. Если имеется некоторый состав измерительных сис-.11-— ———1 !!«»- . и । а । ни шпини ч» 1»*И—'|| huiiiir I г-цщгг ! тем-датчиков, то отлоди.иссладоватедя.даиконструктора Зависит, сигналы как^х датчиков отцвети к вектору управления и, а каких — к вектору наблюдения z. Этот произвол и порождает способ распределения информации. С первого взгляда кажется, что наивысшая точность оценивания получается, если все имеющиеся сигналы датчиков включить в вектор” наблюдения, а и рассматривать как дополнительный вектор состояния. Однако это требует математической модели для процесса изменения и, часто малодостоверной. Это также влечет увеличение размерности и сложности оцениваемого процесса и особенно алгоритмических модулей оптимального оценивания, что приводит к трудности их реализации. Другой крайний случай заключается в том, что все сигналы датчиков рассматриваются как компоненты вектора управления. В этом случае структура алгоритма оце
нивания предельно проста. Согласно (1.31) она имеет вид 3 + /U, и, 0 = 0, (1.77) т. е. представляет собой простую (разомкнутую, не охваченную обратной связью) модель процесса. Ясно, что подобная разомкнутая модель крайне чувствительна к ошибкам в априорных данных (функции /), ошибкам в начальных условиях. Алгоритмы вида (1.77) применяются на практике (некорректируемые инерциальные навигационные системы, другие счислители пути). Однако вследствие указанных недостатков они не могут считаться оптимальными. Наилучших результатов, как правило, удается достигнуть при компромиссном решении, когда часть сигналов отнесена к вектору управления, а часть сигналов — к вектору наблюдения. Для пояснения способа или принципа распределения информации рассмотрим довольно общий пример. Пусть векторная функция / в уравнении оцениваемого процесса (1.29) является суммой двух функций / = F (х) + ¥ (х, a, t), где F (х) — строго заданная функция вектора состояния, недоступная для непосредственного измерения, T (х, a, t) — функция, зависящая помимо х от вектора точно неизвестных параметров а или вообще неопределенная функция, доступная, однако, для непосредственного измерения в совокупности с белым шумом £и. В этом случае естественно совокупность сигналов датчиков, контролирующих V, принять за вектор управления и записать уравнение оцениваемого процесса в виде i + F + и = С, (1-78) где I? = Ех + Su- Сигналы остальных датчиков рассматриваются как компоненты вектора наблюдения z = hz (х) + (1.79) Алгоритмы оптимального оценивания (1.31), (1.32 )
данном случае принимают вид • / dh, \т , х F {£) + и = R -Л1 S? [z - hz (х)], \ дх ) (1.80) где S* — матрица спектральных плотностей £*. Главное достоинство здесь заключается в том, что функция F, т. е. основная часть используемой математической модели, обладает высокой или абсолютной достоверностью. В то же время сохранена размерность оцениваемого процесса и упрощена структура алгоритма оценивания. То, насколько это может иметь значение, легко проиллюстрировать на задаче оценивания процессов навигации летательного аппарата. Если использовать полную математическую модель, т. е. не прибегать к способу разделения информации (все сигналы относить к вектору наблюдения), то разделить навигационные и пилотажные процессы практически невозможно. В этом случае математическая модель процессов содержит выражения сил и моментов как функций угла атаки, угла скольжения, угловых скоростей и т. д. Подобная модель содержит массу коэффициентов, точность априорного задания которых невысока. Идентификация в реальном времени, т. е. определение коэффициентов в полете, хотя и возможна (см. следующий параграф), но сопряжена с дополнительными трудностями. Оценивание таких параметров, как углы атаки, скольжения, угловые скоростЙ и др., требует высокой производительности ЭВМ. Таким образом, без применения способа распределения информации задача оценивания навигационных координат (параметров) отягчена задачей оценивания многих пилотажных параметров и затруднена. Способ распределения информации здесь заключается в том, что устанавливаются датчики (акселерометры) линейных и угловых ускорений и их сигналы рассматриваются как компоненты вектора управления и. Известно, что для жесткого летательного аппарата линейные и угловые акселерометры измеряют ускорения, создаваемые активными (аэродинамическими, реактивными) силами и моментами. Именно эти силы и моменты сложным обра
зом зависят от пилотажных параметров и соответствующие характеристики известны с невысокой точностью. Использование сигналов акселерометров в качестве компонент вектора и приводит задачу к форме (1.78)—(1.80) и делает навигационную систему оценивания практически независимой от пилотажной системы. Следует упомянуть, что иногда состав датчиков позволяет использовать модель (1.78), в которой F вообще отсутствует, т. е. х + и = £*. В этом случае алгоритм оценивания (1.80) принимает вид / dh, \т 1 X + и = RI —^-) S? [z — hz (£)], \ дх I dh, * R = S*. ox (1.81) Способ распределения информации будет широко использоваться в дальнейшем изложении как при рассмотрении отдельных примеров, так и структуры навигационных комплексов в целом. § 1.5. Алгоритм идентификации Идентификацией называется определение коэффициентов, параметров, характеристик математической модели объекта или процесса по экспериментальным данным. Задачу идентификации можно рассматривать как задачу параметрического оценивания, т. е. как задачу оценивания вектора параметров а, обычно постоянного (а = 0) или медленно меняющегося во времени. Задача идентификации особо актуальна для пилотажных комплексов, базирующихся на математических моделях с большим числом точно неизвестных и меняющихся от режима к режиму коэффициентов. Для навигационных комплексов с учетом изложенного выше принципа распределения информации часто можно обойтись математическими моделями, не содержащими неизвестных коэффициентов. Иными словами, при построении навигационного комплекса в основном можно базироваться на геометрических и кинематических соотно-
шониях, абсолютно точных в пределах принятой геометрии и систем координат. И все же задача идентификации возникает и в навигационных комплексах. Это относится прежде всего к измерительным системам — датчикам навигационной информации. Помимо начальной юстировки, которая представляет собой вид начальной идентификации, осуществляемой при монтаже или эксплуатации, многие измерительные системы нуждаются в текущей идентификации. Так, например, крутизна характеристик курсо-глиссадных посадочных маяков меняется во времени и от аэродрома к аэродрому [1.20]чПоэтому идентификация этой крутизны в полете является актуальной задачей. Целесообразна идентификация в полете ряда параметров допплеровских измерителей путевой скорости и сноса (ДИСС). Рассмотрим алгоритм идентификации, базирующийся на изложенных выше решениях нелинейной задачи оценивания. Допустим, что вектор оцениваемых параметров а постоянен: а = 0. (1.82) Наблюдаются в совокупности с белыми шумами £z некоторые функции этого вектора и вектора координат х: z = ht (а, X) + gz. (1.83) Вектор координат х измеряется системой датчиков непосредственно или косвенно с помощью специальной автономной системы оценивания. В обоих случаях оценку вектора х будем обозначать &. Сопоставляя эту постановку задачи <? задачей (1.29), (1.30), убеждаемся, что они аналогичны, если в (1.29), (1.30) заменить х на а, и на х и положить / = 0, = 0. В соответствии с этим и выражениями (1.31)—(1.33) алгоритм оптимальной (субоптимальной) идентификации запишется в виде / dh, \т , й = Ra (-Л) s? [z - hz (d, z)J, (1.84) \ да J I _ dh п Яа+Яа(-^-) S71-#-7?a = O, 7?а(0) = /?а- (1-85) \ да / да Здесь а — оценка вектора идентифицируемых параметров, 7?а — ковариационная матрица ошибок идентификации (Яа — ее начальное значение).
Если ввести обратную матрицу Ка — На1, то уравнение (1.85) преобразуется к виду Далее получаем Ка = (/?’)-* 4- s;1 ^-dt. (1.86) v \ oa / oa Совместно с выражением . - / dh \т ч Й = s;1 [z - ht(d, i)] (1.87) \ da ] это составляет замкнутую форму алгоритма идентификации. При высокой размерности вектора а в алгоритме идентификации (1.86), (1.87) следует применять декомпозицию, при которой он распадается на блоки. Легко показать, что даже без дополнительных допущений матрица Ка имеет квазидиагональную форму, причем наибольший размер ее диагональных блоков соответствует наибольшему числу идентифицируемых параметров в строке (элементе) матрицы z. Сходимость и точность процесса идентификации во многом зависит от «информативности» процесса х (£), на котором осуществляется идентификация. В частности, идентификации линейных зависимостей способствует слабая коррелированность компонент i, (t), рассматриваемого как вектор случайного процесса. Рассмотрим самый простой пример идентификации крутизны характеристики одного линейного измерителя Zj =: я^х^ 4“ == 0. В этом случае и алгоритм (1.86), (1.87) принимает вид t Каи =4-4-^-^*, (1.88) ^ = -4-4(2!-^), (1.89) ла11 ° Л
где °ао — начальное значение дисперсии ошибки оценивания параметра аг Из (1.88), (1.89) вытекает: 6* г \ • + \ xtdt | = хг (zi — (Mi)- (1.90) бао о ' Введем обозначения ошибок «1 — ai — Аах, — xi ~ Axi- (1.91) Из (1.69), (1.70) получаем Легко показать, что процесс идентификации здесь всегда устойчив и при Azj = 0 ошибка идентификации стремится к нулю с течением времени для любого стационарного случайного процесса (2). Для задач многопараметрической идентификации, когда размерность вектора а велика, целесообразно применять алгоритмы с эмпирической ковариационной матрицей типа (1.48)—(1.50) или (1.51)— (1.53) [1.21, 1.22]. § 1.6. Алгоритмы оптимального управления с прогнозирующей моделью Согласно теореме разделения оптимальная система состоит из системы оптимального оценивания и системы оптимального управления. Согласно основной теореме оптимизации по критерию обобщенной работы (§ 1.1) получение оптимальных управлений при заданной математической модели управляемых процессов и заданном функционале (критерии) сводится к решению линейного уравнения в частных производных — уравнения Ляпунова (1.4). При этом целесообразно различать две задачи синтеза оптимальных управлений: синтез на стадии проектирования и «синтез» в процессе функционирования системы («совмещенный синтез»). Синтез законов управления при проектировании автоматических систем является традиционной задачей алгоритмического обеспечения, которая в историческом аспекте решалась разными метода
ми на разных научных уровнях. О недостаточности классических методов синтеза для алгоритмического обеспечения перспективных комплексов уже говорилось выше. Синтез на стадии проектирования оптимальных по критерию обобщенной работы управлений заключается в том, что тем или иным способом решается уравнение (1.4), т. е. определяется функция V (х) или V (х, t). Далее согласно (1.3) находятся оптимальные управления. Дальнейшее сводится к проверке (путем численных экспериментов) и реализации полученных законов. Синтез оптимальных управлений на стадии проектирования путем минимизации заданного функционала получил название аналитического конструирования (более узкое название — аналитическое конструирование оптимальных регуляторов — АКОР). Для линейных объектов и квадратичного функционала обобщенной работы (функции Q, У3 — квадратичные формы) задача сводится к решению системы обыкновенных линейных дифференциальных или алгебраических уравнений 1/2га (га + 1)-го порядка (1.1]. Соответствующие методы АКОР и программное обеспечение хорошо разработаны [1.1, 1.9, 1.23]. Для нелинейных объектов с полиномиальными характеристиками уравнение (1.4) решается методом степенных рядов [1.1]. Соответствующие алгоритмы аналитического конструирования также довольно полно разработаны [1.1, 1.3, 1.24]. Однако для сложных многомерных объектов и высокой сте-’ пени приближения к оптимальности законы управления получаются громоздкими. Реализация таких законов в аналоговой аппаратуре, а иногда и в БЦВМ затруднена. Но дело не только и даже не столько в этом. Синтез на стадии проектирования вообще не вполне отвечает потребностям перспективного алгоритмического обеспечения бортовых комплексов. Основные недостатки синтеза на стадии проектирования сводятся к следующему. При изменении коэффициентов и тем более структуры математической модели объекта синтез необходимо выполнять заново. Оптимальное алгоритмическое обеспечение получается индивидуальным, а не унифицированным. Одним из возможных путей преодоления этих недостатков является создание алгоритмов, обеспечивающих оптимизацию в самом процессе функционирования системы. В широком плане это адаптивные алгоритмы оптимально
го управления. В более узком плане это алгоритмы оптимального управления, не требующие синтеза на стадии проектирования, а осуществляющие синтез управлений в самом процессе функционирования системы. В принципе любой полностью формализованный метод синтеза может быть преобразован в алгоритмы совмещенного синтеза при достаточной мощности бортовой вычислительной системы. Это относится и к методам аналитического конструирования. Однако для сложных нелинейных объектов невозможно непосредственно поручить бортовой вычислительной системе функции аналитического конструирования, выполняемые на стадии проектирования квалифицированными»проектировщиками, вооруженными мощными универсальными ЭВМ и располагающими значительным временем. Однако существуют алгоритмы совмещенного синтеза, которые могут быть реализованы в современных и особенно перспективных бортовых вычислительных системах. К ним прежде всего можно отнести алгоритм с прогнозирующей моделью, осуществляющий оптимизацию по критерию обобщенной работы. Этот алгоритм впервые предложен в статье [1.25], получил развитие в трудах [1.8, 1.26] и в настоящее время получает значительное применение. Рассмотрим несколько форм этого алгоритма. а) Алгоритм с прогнозирующей моделью и численным дифференцированием. Обратимся к основной теореме оптимизации по критерию обобщенной работы (соотношения (1.1)—(1.4)). На решении уравнений свободного движения объекта («> = 0) it + ft (х, t) = 0 левая часть уравнения Ляпунова (1.4) обращается в полную производную по времени дУ _ VI , дУ _ dt дхг “ п = ^+£-^*<^ = -<2 <L92) г —1 Здесьхм = хм (t) обозначает вектор свободного движения,
описываемого уравнением ям + f (хм, /) = 0. (1.93) Индекс «м» введен потому, что свободное движение практически может быть воспроизведено лишь в математической модели реального управляемого объекта. Как сейчас будет пояснено, для осуществления алгоритма необходима модель свободного движения в ускорен-t ном времени т = —, где х = const — значительно превышает единицу (имеет порядок десятков или сотен). Подобная модель описывается уравнением + х/ (*м, хт) = 0 (1.94) и, используемая для будущего интервала времени, называется прогнозирующей. Допустим, что рассматривается терминальная («квази-терминальная» [1.1]) задача оптимизации и интервал оптимизации простирается от текущего момента времени t до заданного момента t2. Интегрируя (1.92) по этому интервалу и учитывая, что V [хи (t2)] = Va [ям (#2)], получаем ь V км (0] = Va [хк (/2)] + J Q (хк, t) dt. (1.95) t Здесь х„ — решение уравнения (1.93) при начальном условии хк (t) = х (t). В ускоренном времени т, V [ям (т)] = Va [хм (т4)1 4- X J Q (хм, хт) dx, (1.96) т где т2 = t2/x, хм (т) — решение уравнения (1.94). Итак, определение функции V при наличии прогнозирующей модели сводится к квадратуре и вычислению Va в конце интервала оптимизации или (при Q — 0) только к вычислению Va [ям (т2)1. По самому своему существу алгоритм с прогнозирующей моделью является дискретным. Текущее время и интервал оптимизации разбивается на достаточно короткие циклы Л£ц. Длительность цикла Д/ц сверху лимитируется
допустимой дискретностью управления рассматриваемым процессом, а снизу Д2Ц ограничивается необходимой производительностью ЭВМ, реализующей алгоритм. Начало очередного цикла с точностью до Д£ц совпадает с текущим временем t. В начале каждого цикла система ^контроля и оценивания реального управляемого процесса определяет (оценивает) вектор состояния этого процесса и задает начальное условие в прогнозирующую модель (1.94). Таким образом, в начале каждого цикла х^ = х (с точностью до ошибок оценивания или измерения). Прогнозирующая модель воспроизводит свободное движение в ускоренном времени на всем интервале оптимизации, причем делает это в течение каждого цикла несколько раз. Последнее необходимо для численного определения частных производных функции У, входящих в выражение (1.3) оптимальных управлений. Точнее, как видно из (1.3) п ui = kj Ф»1 » у = 1,2,..., тп, для построения управлений необходимо определить т скалярных произведений вектора градиента (dV/dxlf . . . . . ., dV/dxn) на векторы эффективности управляющих воздействий (фх;, . . ., фпу). Обычно число управлений т меньше размерности пространства состояний п и выгодно сразу определять проекции вектора градиента на (ф^, . . . . . ., ipnj), а не на координатные оси (т. е. д¥/дхк). Если для вычисления компонент и проекций вектора градиента применять простейшую двухточечную «правую» разностную схему, то Л2 г ГТ <’•»+») <? - Л X J т2 -[г3(хм(тг)) + х^йт] }. (1.97) х Здесь ф; — вектор-столбец с компонентами ф^, . . ., фп>, II Ф/ II — норма этого вектора, е — малая действительная (скалярная) величина. Квадратура и функция Уа в квадратных скобках вычисляются на свободном движении — движении прогно
зирующей модели, возбуждаемом начальными условиями, которые для первой скобки соответствуют х + e<pj, а для второй скобки — х (х — вектор состояния в начале рассматриваемого цикла). Для определения всех т управлений согласно (1.97) необходим в каждом цикле т 1 «запуск» модели. Если применять симметричную двухточечную схему, то "1 - - 7Г57 {[’'<*“ (т=и + * J С ««W~+1 - V - [Уз (*М (Г2)) + х dr] Ям(г)=х_ _1_еф.} . (1.98) т В этом случае в каждом цикле приходится запускать модель 2т раз. Сформированные согласно (1.97) или (1.98) управления подаются на управляемый объект х + / (х, t) = <pu и остаются неизменными в течение очередного цикла длительностью At4. В течение этого очередного цикла вновь запускается прогнозирующая модель с начальными условиями, соответствующими текущему вектору состояния, и варьированными начальными условиями, вычисляются оптимальные управления согласно выражениям (1.97) или (1.98), полученные значения zzj посылаются в управляемый объект и остаются в течение следующего цикла постоянными. Операции повторяются на следующем цикле и так далее до конечного момента времени t — t2. Такова сущность алгоритма с прогнозирующей моделью для задачи терминального управления. Структуру этого алгоритма поясняет рис. 1.1. Информация снимается с датчиков в начале каждого цикла. Система оценивания может отсутствовать. Следует отметить, что изображенная на рис. 1.1 и описанная выше структура алгоритма соответствует управлению процессом в реальном времени. Применение алгоритма на стадии проектирования, например для оптимизации программных траекторий, приводит к некоторому изменению, упрощению алгоритма 11.8]. Описанный алгоритм соответствует задаче терминального (при Q 0 — квазитерминального) управления. Он
легко преобразуется в алгоритм нетерминального управления путем перехода к скользящему интервалу оптими- Рис. 1.1. Структура алгоритма с прогнозирующей моделью: 1 — объект управления (управляемый процесс); 2 — датчики, система оценивания; 3 — модель свободного движения в ускоренном времени; 4 — вычисление значения функционала для очередного цикла; 5 — численное дифференцирование и формирование управляющего воздействия на очередной цикл. величина. Функцией Va может служить любая подходящая неотрицательная функция, в частности, при <2 =# О можно задавать Va = 0. б) Алгоритм с прогнозирующей моделью при управлении скоростью изменения сигналов. Алгоритм с прогнозирующей моделью в принципе является строго оптимальным. Это означает, что с точностью до ошибок, связанных с дискретизацией (конечной длительностью циклов Д£ц), ошибок численного интегрирования дифференциальных
уравнений и ошибок численного дифференцирования, формируемые управления являются строго оптимальными в смысле критерия обобщенной работы. Если указанные ошибки стремятся к нулю, то управления становятся строго оптимальными. Однако при практической реализации алгоритма как на цифровых, так и на гибридных ЭВМ ошибки существуют и при неудачном программировании могут нарушать даже работоспособность алгоритма. В частности, существенное влияние могут оказывать ошибки численного интегрирования уравнений свободного движения, которые помимо шага численного интегрирования и интервала оптимизации зависят от характера свободного движения. В описанном варианте алгоритма за свободное движение объекта принималось движение при и = 0. Если для летательного аппарата вектор и характеризует положение органов управления, то свободное движение при и = 0 будет представлять собой движение при нулевых положениях органов управления. Такое движение может сильно отличаться от реального управляемого движения на интервале оптимизации, особенно если этот интервал имеет значительную длину. К навигационному комплексу целесообразно относить задачи траекторного управления (подробнее об этом будет сказано в главе VIII). В траекторных задачах управляющими воздействиями удобно считать перегрузки или ускорения. Движение при нулевых перегрузках, воспроизводимое в прогнозирующей модели, может также весьма сильно отличаться от реального движения. В принципе все это не нарушает оптимальности алгоритма, однако при численной реализапии на ЭВМ может привести к недопустимым погрешностям. В частности, если свободное (неуправляемое) движение неустойчиво, то при значительном интервале оптимизации может происходить даже переполнение разрядной сетки ЦВМ. В указанном отношении преимущество имеет алгоритм, в котором на каждом цикле и не равно нулю, а постоянно: и = const, причем это значение определено на предшествующем цикле. В работах [1.8, 1.26] этот алгоритм назван алгоритмом с прогнозирующей моделью при управлении скоростью отклонения регулирующих органов. Рассмотрим данный вариант алгоритма с прогнозирующей моделью.
Векторные уравнения управляемого процесса записываются в виде х 4- / (х, у) = 0, у = и, (1.99) где х — (xlt . . хп) — вектор состояния собственно объекта» У — (Ун • • •» Ут) — вектор «положения органов управления» или задающих воздействий, и = (щ, . . ит) — вектор управления. Уравнения свободного движения X + / (х, у) = 0, у = О воспроизводятся прогнозирующей моделью в ускоренном времени dx . d'lK. -£ + X/ (*м, Ум) = 0, -g- = 0. (1.100) В начале каждого цикла длительностью Д£ц координаты реального движения вводятся в прогнозирующую модель: Хм = х (t), Ум = У (0- (1.101) В данной задаче мы имеем расширенный вектор состояния (ж, у) и согласно основной теореме (1.1)—(1.4) оптимальными управлениями, минимизирующими функционал ft ft тн » 2 I = Fa (X (tt), у «,)) + J Q (ж, y) dt + A- $ У, U}Ti0Tl dt' t h j=i i являются управления = (1.102) где V — решение уравнения dV dV при Vl=t2 = V3. (1.103) Как и в предыдущем случае, значение функции V может быть вычислено на движении прогнозирующей модели (1.100), запускаемой на каждом цикле с начальными условиями, соответствующими фактическому состоянию управляемого процесса в начале цикла. Согласно (1.102) численное дифференцирование в данном случае осуществляется по у и алгоритм при симметричной двухточечной
схеме дифференцирования имеет вид ui = ~ I (Из+М\ Q dr) - (Va~ где выражение в круглых скобках Рис. 1.2. Структура алгоритма оптимального управления с прогнозирующей моделью при управлении скоростью изменения управляющих воздействий: 1 — управляемый процесс; 2 — датчики, система оценивания; 3 — модель свободного движения в ускоренном времени; 4 — вычисление функционала на текущем цикле; 5 — формирование управляющих воздействий на очередной цикл. т с индексом «1» вычисляется при я:м (т) = х (<), J/м (Т) = У (/) + -J- erj, а то же выражение с индексом «2» вычисляется при (т) = X (/), 2/м(т) = i/(0 —-y-erj, где о = У]< | Уз \У1 I-модуль yj. Структура соответствующего алгоритма в общем виде представлена на рис. 1.2. Наличие численного дифференцирования может рассматриваться как недостаток описанных выше вариантов алгоритма с прогнозирующей моделью, так как численное дифференцирование является источником дополнительных ошибок. । Численного дифференцирования не содержит алгоритм, именуемый модифицированным алгоритмом с прогнози рующей моделью [1.8, 1.26]. Однако ввиду того, что этот алгоритм в дальнейшем изложении непосредственно не используется, описывать его здесь не будем.
§ 1.7. Особенности задачи оценивания в коррелядионно-экстремальных системах Как уже отмечалось, для синтеза алгоритмов корреляционно-экстремальной коррекции навигационных систем, основанных на использовании естественных навигационных полей, в определенных рамках могут быть применены изложенные общие методы оптимального оценивания и управления. Однако естественные навигационные поля, такие как поле рельефа, аномальное магнитное и гравитационное поля даже в пределах небольших районов описываются весьма сложными функциями координат, напоминающими реализации случайных функций. Еще более сложными являются функции, описывающие оптические или иные изображения, содержащие множество мелких деталей. Таким образом, в комплексах с корреляционноэкстремальной коррекцией вектор наблюдения или его часть является сложной функцией вектора состояния. Эта функция хотя и известна с определенной точностью (карта поля), но имеет характер реализации случайной функции. Это создает особенности задачи оценивания. Данные особенности рассматриваются в настоящем параграфе. а) Беспоисковые непрерывные алгоритмы оценивания. Пусть движение обобщенного объекта, который может включать как собственно летательный аппарат, так и часть аппаратуры комплекса, с использованием принципаТрас-пределения информации (см. § 1.4) описывается уравнением вида (1.29) t + / (х, и) = а вектор наблюдения состоит из двух векторов: 'И НИ Здесь z(1) = hz^ (х, и) 4- — вектор сигналов датчиков (измерительных систем) координат и управлений, z(« = h? (х) + — вектор сигналов датчиков естественных навигационных полей, h'z1} — известная даже в своем аналитическом выражении векторная функция, /42) — известная (храня-
щаяся в блоке памяти) весьма сложная функция вектора состояния, |z2) — векторные белые шумы с ма- трицами спектральных плотностей Sx, S®. Функции h(z \ а также f будем считать дифференцируемыми *). Нелинейный фильтр Калмана (1.31)—(1.33) в данном случае принимает вид Kdh1^ V —н fz(I) - h*} м)] + + [z(2) - («)] 1. (1-105) \ дх / J R + Л-7?+7?(-4-У + дх \ дх / Г ( ЭЪ™ V м д№ ( д№ + Я (S^r1—^- + (— I \ дх / дх \ дх R (0) = Яо- ? = sx, (1.106) Величина hl? (х) (в общем случае векторная) извлекается из блока памяти (блока карт) вместе с получением оценки х. Величина dh!x’/д± (в общем случае — матрица Якоби) вычисляется путем численного дифференцирования или извлекается из специального блока памяти, хранящего производные полей. Как видно, алгоритм (1.105), (1.106)содержит произведения компонент dh^/dx и h(® ($). Это характерно для корреляционных алгоритмов. Заметим, что нелинейный алгоритм Калмана строится на предположении о возможности линеаризации функций относительно ошибок оценивания. В данном случае поля описываются заведомо нелинейными функциями, линеаризация которых возможна лишь в радиусе корреляции поля — расстоянии, в пределах которого аномалии поля коррелированы. Поэтому можно ожидать, что алгоритмы типа (1.105), (1.106) будут работоспособными, если начальные ошибки оценивания координат не превышают радиуса корреляции ис *) Как обычно в технических и физических задачах, обобщение на кусочно-дифференцируемые функции может быть получено путем доопределения поведения системы в точках (поверхностях) разрыва производных.
пользуемого поля. Для случая одновременного использования нескольких полей (векторная величина Л®) с разными радиусами корреляции ошибки начального оценивания не должны превышать максимальный радиус корреляции. Эти предположения в общем подтверждаются приведенными в последующих главах результатами численных экспериментов. В то же время, используя достаточные условия точного оценивания, изложенные в § 1.3, можно указать (подобрать) местные (локальные) особенности поля, обеспечивающие сходимость при отклонениях, больших «среднего» радиуса корреляции. При постановке численных экспериментов, да и теоретических исследований процессов оценивания координат с использованием геофизических полей, немаловажное значение имеют понятия локальной сходимости и глобальной сходимости в заданном районе. Эти понятия означают следующее. Можно рассматривать многократно повторенный (с различными, но мало отличающимися или одинаковыми начальными условиями) процесс оценивания на одном и том же маршруте (траектории). Сходимость такого процесса оценивания будем называть локальной сходимостью. Если локальная сходимость при заданных уровнях шумов и ошибок имеет место для любых маршрутов в заданном районе, говорят о глобальной сходимости в этом районе. Допустим, что экспериментально исследуется локальная сходимость. Проводится статистическое моделирование, т. е. многократно воспроизводится процесс оценивания и путем статистической обработки находятся дисперсии (оценки дисперсии) ошибок оценивания координат. Если эти дисперсии с течением времени стремятся к определенным пределам, то имеет место локальная сходимость дисперсий ошибок оценивания. Однако может быть и другая ситуация. Допустим, что моделируется алгоритм оценивания (1.105), (1.106) для заданного маршрута. Ввиду заведомой нелинейности условий наблюдения («карты» поля Л®) матрица R только по названию является ковариационной матрицей ошибок оценивания. В действительности она может быть как весьма близкой к этой матрице (случай малых текущих отклонений Дж = £ — х), так и сильно отличающейся от действитель
ной матрицы ковариаций М [(£ — х) (х — ат)'г] (случай расходящихся процессов оценивания, больших отклонений). При численных экспериментах может быть такая ситуация, когда диагональные элементы матрицы R алгоритма (1.105), (1.106) сходятся (стремятся к определенным пределам), а ошибки оценивания (норма вектора До: — £ — х) неограниченно нарастают. В этом случае будем говорить о сходимости оценок дисперсий, но расходимости процесса оценивания. Все эти понятия, для которых сознательно не вводятся строгие математические определения, будут неоднократно использоваться в дальнейшем. б) Алгоритм с эмпирической ковариационной матрицей. Для сложных моделей движения, когда размерность вектора высока и процессы взаимосвязаны, трудоемкость алгоритма (1.105), (1.106) может оказаться чрезмерно высокой. Как и в общем случае, существенный выигрыш дает переход к субоптимальному алгоритму с эмпирической ковариационной матрицей типа (1.48)—(1.50). Применительно к данной задаче этот алгоритм будет иметь вид л - (/ dh^ \т х 4- / (о:, и) = R I (—) (S?5)-1 [z<2) — hi? (х, н)] 4-I \ дх / \Т Л ~~ (^У1 [z<2> - й<2) (ж)1 , (1.107) да? / J М 4- Л- Ьх = Я (-4-) (511)Г1 [«(1> -дх (\ дх / № (ж, м)] 4- (Л/jW \т 1 -4- - Л<2> (£)] 4- & (1.108) ОХ / J Тфк 4- R = Дж Джт, R (0) = Яо. (1.109) Здесь В* — генерируемый белый шум, имитирующий L-Как уже отмечалось, переход от алгоритма (1.105), (1.106) к алгоритму (1.107)—(1.108) может сопровождаться значительным снижением требований к производительности ЦВМ. Еще более снижаются эти требования при алгорит
ме (1.51)—(1.53), который в данном случае имеет вид х + / (ж, и) — лДх, (1.110) Дж + Дж = л&с 4- (1.111) дх (dfoW \т —Дж) (5'i1>)"1 [z<y — h/P (ж, м)] 4-дх / (aft? \т кх (Я*50)-1 [2<а) - № (ж)]. (1.112) дх / Здесь л, как и раньше, скалярная величина. в) Декомпозиция КЭНС. Выше в § 1.5 в общем виде были рассмотрены условия декомпозиции для установившегося режима оценивания. Эти условия с той или иной степенью приближения выполняются в некоторых задачах экстремальной навигации и могут быть использованы прежде всего для получения приближенных формул точности в установившихся режимах. Типовой является задача разделения продольного и бокового каналов КЭНС. Действительно, как увидим далее, в типовой задаче навигации по геофизическим полям оценивается как продольная, так и боковая (по отношению к направлению движения) ошибки. При этом уравнения продольного и бокового движений во многих случаях могут быть разделены, т. е. матрица df/dx часто может быть сделана кваэидиагональной. Выражение <может быть сделана» следует понимать в том смысле, что путем выбора переменных и использования принципа распределения информации (см. § 1.4) часто удается привести матрицу df/dx к указанному виду. В еще большей степени это относится к усредненной по времени матрице df/dx. В этих условиях при z(1) = 0 (вектор наблюдения составляют только сигналы датчиков полей) в большинстве случаев достаточным условием декомпозиции в установившемся режиме является квазидиагональность матрицы V , dh / \т , д№> дх / дх \ дх / дх (1.113) (Sx и Sz — обычно диагональные матрицы).
Бели используется одно поле, интенсивность которого зависит от продольной и боковой х2 координаты, то матрица (1.113) имеет следующую структуру: .“аг; 571 ИГ 9hzl di>i di2 1 Szl О dhzl dhzl di\ di2 О 0 . . . 0 0. . .0 0 . . . 0 0 dhzl V о 0 . . . 0 0 . . . 0 0 . . . 0 0 . . . 0 0 . . . 0 0 0 . . .0 0 0 . . . 0 (1.114) Необходимое условие декомпозиции выполняется, если dhzl dhzt ft д£х di2 (1.115) Как указывалось, hzl (xlt x2) представляет собой реализацию двумерной случайной функции. В процессе движения величины dhzi dhzl ’ д&2 (1.116) являются случайными функциями времени. Условие (1.115) при достаточном времени усреднения выполняется, если величины (1.116) центрированы и независимы (некор-релированы). Поле, удовлетворяющее этому условию на заданном множестве реализаций ix (t), i2 (t), назовем изотропным. Таким образом, для КЭНС, использующей изотропное поле и независимые модели продольного и бокового движений, возможно разделение каналов в установившемся режиме оценивания. Ниже мы часто будем пользоваться этой возможностью. г) Особенности задачи оценивания для КЭНС со сканированием. Для КЭНС, использующих поверхностные геофизические поля, возможно применение сканирования.
Это увеличивает объем текущей информации и сокращает необходимое время определения координат. Задача оценивания для случая сканирующего датчика поля в общем виде (но при z(1) = 0) ставится так. Имеется процесс X + / (х, и) = (1.117) и вектор наблюдения z = hz [ж + л:Ск (if)J + 1г, (1.118) где жск (f) — заданное, как правило, точно известное сканирующее движение. Требуется указать алгоритм оценивания х. Эта задача полностью соответствует общей теории и не нуждается в специальном решении (решениях). Согласно (1.31)—(1.33) записываем а / dh \т X +f(&u) = R Sz*{z — hz [ж + 2CK (f)]}, (1.119) + (1.120) Следует заметить, что как hz [х + aci:(Z)], так^и dhzld& вычисляются здесь не в точке оценки х = х, а в точке, соответствующей сканированию относительно точки оценки (х + а?ск (t))- Таким образом, синхронно со сканированием датчика поля должно осуществляться сканирование в блоке памяти. В выражении (1.119) нетрудно усмотреть синхронное детектирование, часто применяемое в поисковых адаптивных системах [1.27]. Вообще подобные КЭНС со сканированием занимают в известном смысле промежуточное положение между поисковыми и беспоисковыми системами, а также системами совмещения изображений («кадровыми») и системами с точечным зондированием (см. Введение). Однако будем относить эти системы к беспоис-ковым на том основании, что здесь нет поиска на дискретном конечном множестве вариантов-гипотез. д) Оптимальные беспоисковые алгоритмы в системах сопоставления изображений. Согласно классификации, приведенной во Введении, корреляционно-экстремальные системы совмещения изображений (КЭНС-Ш) характерны тем, что информация одновременно поступает с целого участка (кадра) поверхностного поля. В КЭНС-П информация одновременно снимается с линии. Таким образом, 3 А. А. Красовский
системы совмещения изображений можно рассматривать как системы с бесконечномерным вектором наблюдения. Это предполагает бесконечное число параллельных каналов, в частности, детекторов излучения. Хотя во всякой реальной системе разрешающая способность ограничена и целесообразное число параллельных каналов также ограничено, подобная модель очень близка к реальной оптической системе с мозаикой детекторов излучения (или очень быстрым сканированием). При бесконечномерном векторе наблюдения величину hz следует рассматривать как функцию дополнительного аргумента ц, изменяющегося в пределах кадра: = hz (х, ц). Для КЭНС-П1 величина ц — двумерный вектор, для КЭНС-П — скалярная величина. Чаще всего ц аддитивно по отношению к некоторым компонентам вектора состояния х. Шумы элементов мозаики приемников излучения обычно можно считать независимыми. Тогда вместо матрицы Sz1 в бесконечномерном случае будет фигурировать функция dz (rj), отображающая распределение обратной интенсивности шума по кадру. В соответствии с отмеченным все алгоритмы оптимального (субоптимального) оценивания, описанные в § 1.2, легко обобщаются на случай КЭНС-Ш, КЭНС-П (корреляционно-экстремальные системы совмещения изображений). Так, для нелинейного фильтра Калмана (1.31)—(1.33) получаем следующий аналог *): а с ! dh \т х+ /(£, и, t) = Я dz (ti) [z - ht (i, T])] <4 к ' v ' (1.121) г {• [ dh, \T dh, q + [ j ("ЗУ/ R = $v * * * * х’ к _______________ R (0) = Ra. ♦) Здесь рассматриваются случаи, когда наблюдаемой величиной является лишь функция поля hz (х, ц).
Здесь интегрирование осуществляется по площади кадра (для КЭНС-П — по линии). Аналогом алгоритма с эмпирической ковариационной матрицей (1.48)—(1.50) будет служить а 5/г \т X + / (х, и,t) = R dz (ц) [z — hz (х, ц)] dr], к 4 Л р / dh. \т . = R dz (ц) [z — hz (х, т])1 dr) + к4 ТфЙ + R = ДхДхт, R (0) = /?0. Аналог алгоритма (1.51)—(1.53) имеет форму х + / (х, и, t) = лДх, Д£ + -fj- Дх = лДх + С / д1г, \т Л = J ) ^(п) [2 — hz (X, Т))] dr], к 4 (1.123) Таким образом, оптимальные (субоптимальные) алгоритмы оценивания для случаев бесконечномерного вектора наблюдения описываются не дифференциальными, а интегро-дифференциальными векторными уравнениями. Входящие сюда интегральные операторы (операции параллельного типа) проще всего реализуются в оптических системах, в частности голографических [1.40]. В целом алгоритмы (1.121)—(1.123) могут быть реализованы в электронно-оптических, системах. Существует множество других подходов к синтезу беспоисковых алгоритмов совмещения изображений [1.36, 1.37, 1.39]. е) Алгоритмы с ретроспективной моделью и поисковые алгоритмы экстремальной навигации. Задача оценивания вообще и задача алгоритма экстремальной навигации (алгоритма КЭНС—I), в частности, может также ставиться следующим образом. Имеется процесс £ + / (х, и, у) = 0 (1.124)
и вектор наблюдения z = hz (х) (шумы датчиков не учитываются), запоминаемый на всем предшествующем интервале времени функционирования системы. Здесь и — известный’вектор управления, у — неизвестный вектор воздействий. Строится модель тм + / (^М, U, ух) =0, ?/м = иу (1.125) и ставится задача так управлять вектором ум, чтобы минимизировать нетерминальный функционал обобщенной работы, в котором функция Q задана в виде Q = Q [z —• hz (жм)1, а интервал оптимизации обращен в прошлое и простирается от t — Топ ДО t Легко видеть, что для решения этой задачи можно использовать алгоритм модели, но не прогнозирующей, а ретроспективной, т. е. воспроизводящей прошлое. Действительно, разобьем непрерывное время на циклы Д£ц и в каждом цикле будем запускать ретроспективную модель в ускоренном времени dx dv -^ + ^(xK,u,yM) = 0, -^- = 0, (1.126) осуществляя численное интегрирование этих уравнений в интервале от — ы — Т) до — t. При каждом запуске модели задаются новые начальные условия по хм или yw в окрестности ожидаемых значений х, у. При каждом запуске модели вычисляется также величина f/ч х f Q [z — hz (хм (t))J dx. (1.127) Здесь hz (zM) в случае экстремальной навигации извлекается из блока карт, a z (т) из памяти, где записан сигнал датчика поля. Если действовать далее по аналогии с алгоритмом прогнозирующей модели, то следует вычислять компоненты градиента величины (1.127), варьируя начальные значения ум, и задавать иу «пропорциональным» этому градиенту. В случае одноэкстремальной задачи так и
следует делать. Однако при больших начальных отклонениях, когда компоненты векторов ха — х, ум — у велики, задача, как правило, становится многоэкстремальной и простой градиентный метод не приводит к цели (процесс оценивания не сходится). Приходится прибегать к методу перебора или приемам, устраняющим многоэкстремаль-ность. Заметим, что при небольшом Т модель движения (1.125) в виде дифференциальных уравнений часто удается заменить простой алгебраической моделью. В этом случае воспроизведение каждого варианта движения («запуск» модели) требует весьма малого количества элементарных операций. Так от теории оптимального управления и алгоритма с прогнозирующей (ретроспективной) моделью мы логически перешли к другому направлению теории корреляционно-экстремальных систем — поисковым алгоритмам. Теоретическим основам поисковых алгоритмов посвящена следующая глава.
ГЛАВА II ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ПОИСКОВЫХ МЕТОДОВ ОЦЕНИВАНИЯ § 2.1. Элементы теории статистических решений В своем современном виде теория статистических решений основана главным образом на двух дисциплинах: математической статистике и теории игр. Из математической статистики теория статистических решений впитала в себя направление, связанное с оценкой параметров, которое возникло в 20-х годах в работах Р. Фишера и развивалось в последующем Г. Крамером. Из математической теории игр теория статистических решений позаимствовала теорию проверки статистических гипотез — направление, интенсивно разрабатывавшееся в 30-е годы и связанное с именами Ю. Неймана и Е. Пирсона. В конце 40-х годов оба родоначальных направления усилиями А. Вальда были объединены в новую научную дисциплину-теорию статистических решений [2.1]. В рамках теории статистических решений А. Вальд разработал также перспективную область математической статистики — последовательный анализ. Первые технические приложения вновь возникшая дисциплина нашла в теории связи. Математическая и техническая ветви теории слились в 50-х годах в работах Д. Миддлтона [2.2]. В дальнейшем теория статистических решений завоевывала все новые области применения. В частности, она проникла в теорию управления. Первыми работами в этой области явились исследования А. А. Фельдбаума, выполненные в начале 60-х годов и приведшие к созданию теории дуального управления [2.3]. Результаты исследований зарубежных авторов в области оптимизации стохастических систем изложены в книге А. Аоки [2.4].
Теория статистических решений в единой математической постановке объединяет несколько отдельных подходом (в частности, теорию проверки статистических гипотон, теорию оценки параметров, теорию фильтрации) и разнообразные критерии оптимальности. Она позволяет па единой методической основе производить сравнение идеальных и различных реальных технических устройств. В дальнейшем в главах V—VII будет показана возможность естественного использования идей теории статистических решений для синтеза оптимальных поисковых алгоритмов корреляционно-экстремальных навигационных систем (КЭНС), т. е. алгоритмов, связанных с последовательным перебором вариантов, когда оптимальное решение принимается в результате поиска экстремума определенным образом сформированного функционала. Причем при разработке оптимальных поисковых алгоритмов оказывается возможным с равным успехом использовать как теорию проверки статистических гипотез, так и теорию оценки параметров. а) Вывод формулы байесова риска. Основными математическими объектами, фигурирующими в теории статистических решений, являются пространства сигналов Я, входов (выборок, наблюдений) Г, решений (или пространство гипотез) G, функция потерь W (S, D), решающее правило (решающая функция) F (D | z). Рассмотрим последовательно различные возможные постановки задачи, отличающиеся строением пространства сигналов и решений Я, G. Вариант I. Пространства Я, G-метрические. В этом случае предполагается одинаковое строение пространств Я и G. Их элементы — векторы сигнала S = (sj, . . ., «й)т и решений (гипотез) D = (dj, . . ., dfc)T — являются точками евклидовых пространств Я = Я* и С = Наблюдения z = (zn . . ., zft)T, образующие пространство входов Г, также предполагаются точками евклидова пространства Г = Rz. Предполагаются известными статистика шума п = (пх, . . ., и/с)т, а также способ комбинирования сигнала и шума, в результате которого образуется наблюдение z. Этот факт условно обозначается записью z = --[S X л]. Статистика шума определяется плотностью вероятности pN . . ., п*). Необходимо по проведен
ным наблюдениям z принять определенное решение (выбрать гипотезу D). Каждой реализации принятого сигнала z Е Г должно быть сопоставлено некоторое решение D G= G. Геометрически это означает преобразование пространства Г в G. Правило такого преобразования называется стратегией решающего устройства. В теории статистических решений рассматриваются два типа стратегий. В первом из них каждой выборке z соответствует вполне определенная единственная точка D пространства решений. Такие стратегии называются детерминированными или регулярными. Во втором типе стратегий принятой выборке z соответствует некоторая плотность распределения F (D | z) точек пространства G. Подобные стратегии называются рандомизированными или случайными. Ясно, что детерминированные стратегии являются частным случаем рандомизированных, когда плотность вероятности F (D | л) превращается в 6-функцию, группируясь вокруг единственной точки D. Конкретное содержание понятий сигнала S, решения D, наблюдения z определяется физической сущностью реальной задачи. Часто решения D совпадают с сигналами S, т. е. существо задачи состоит в том, чтобы, наблюдая один из возможных сигналов в шуме, вынести решение, какой именно сигнал присутствует на входе. Для введения критерия оптимальности задается функция потерь W (sx, . . ., Sic; dlt . . ., dk), определяющая потери, которые наносятся решающим устройством, если при наличии на входе сигнала S = (sx, . . ., 8^)т оно принимает решение D = (dlt . . ., d!c)T. Различным функциям потерь соответствуют разные критерии оптимальности. Наибольшее распространение в теории статистических решений нашли простая, линейная и квадратичная функции потерь. Простая функция потерь Ж (fy, . . ., S/с; dlf . . ., dk) = = 1 - 6 (8Х - dx) . . . 6 (sk - dk), (2.1) где’6 — знак дельта-функции, приписывает правильному решению dx = sx, . . ., dk = sk штраф —oo, а всем неправильным решениям — единичный штраф +1. Линейная (модульная) функция потерь равна л W(s1,...,sk;di,...,d]{) = J) |s{ —d<|, (2.2) 1=1
а квадратичная функция потерь имеет вид к W(s1,...,sk,d1,...,dk') = SCsi-diA (2.3) i=l При наличии информации об априорной плотности сигнала рар (^, . . sk) в качестве меры средних потерь (и критерия оптимизации) выбирается байесов риск R, представляющий собой математическое ожидание потерь R .....4)1 = ОС 00 = J . • • j W (sx,..., sk; di,..., 4) x —CO —00 X p (si,..., sk; dlt..., dR) dsi... dskddt... ddk, (2.4) где p (sj, . . ., sk; d±, . . dk) — совместная плотность вероятности векторов S и D, М — знак математического ожидания. Формулу (2.4) можно записать также в ином виде, если воспользоваться соотношением для условных плотностей вероятности Р (sj, • • sk\ d^, . . ., dk) — = р (dx, . . ., dk ] sx, . . ., s^Pap (Si, . . sk). (2.5) Тогда OO 00 OO CO R - J* ... J W (si,..., sk; dt,..., dk) x —OO — OO —00 —OO X P (du ..., dk I , Sfc) dd-t... ddk] X X pap (®1, • • • , Sjf) d$t • • . dsk. Стоящее в квадратных скобках под знаком интеграла выражение представляет собой условное математическое ожидание М [W(sx,..., sk; dlf..., dk) | sx, . . ., sft] и носит название условного риска г fo, . . ., sj): 00 со г($1,..., sfr) = J... f w (st,. ..,sk-,dlt...,dk) х —00 —OO X р (di,..., dk I sx,..., sfc) ddt... ddk. (2.6) Следовательно, байесов риск связан с условным риском
равенством ею оо R = J... J* r(st,.. ., sk) Pap (81,... ,sk)dsL.. .dsk. (2.7) —оо — оо Введем в рассмотрение совместную плотность вероятности р (а17 . . sk‘, dy, . . dk; zx, . . zk). На основании свойств условных плотностей можно записать p(s1( ...,sk;dx, ...,dJr) = оо ОО = I ‘ У Р (S1’ • • • > St! di,..., dk', zx,..., Zk) dzi... dzk ~°° (2.8) и, кроме того, P (®1> • • ч dx, . . dk; zx, . . ., zk) = = p(dx, . . ., dk | zx, . . ., zk; sx, . . ., sk) p(zx, . . . . . zk 1 SX, . . ., sk)p (sx, . . ., sk). (2.9) По физической сущности задачи условная плотность вероятности решений dx, . . ., dk р (dx, . . ., dk | zx, . . zk; Sj, . . ., sk) зависит только от наблюдений zx, . . ., zk и не зависит от сигнала sx, . . ., sk, так как решения выра-. батываются лишь на основе проведенных наблюдений. Поэтому р (d^ . . ., dk | zx, . . ., zk; slt . . sk) = = p (d15 . . ., dk | zx, . . zk) совпадает с решающей функцией F (d±, . . dk | zx, . . ., zk). Плотность вероятности p (sx, . . ., sk) — это упоминавшаяся уже априорная плотность вероятности сигнала рар (sx, . . sk). Для сокращения записи введем векторные обозначения величин W (з„ . . dx, . . ., dfr) == = W(S,D),F(d1, ... dk |zx, . . .,zk) = = F(D | z), p (zx, . .., zk |ax, .. ., sk) = P (z | S), Pap ($x, . . ., Sfc) = Pap (*^)7 dz = dz^y ... dzk, dD = dd^ . . . ddk, dS = dSi . . . dsk. Тогда, подставляя (2.8), (2.9) в (2.4), получим R [Pap {S), F\ = = у... У W(S,D)P(z\S)F(D\z)p!lp(S)dzdDdS, (2.10)
Из сопоставления (2.7) и (2.10) найдем также необходимое для дальнейших рассуждений выражение условного риска СО оо r(S,F)= f... j W (S,D)P\z\S)F(D\z)dzdD. (2.11) —ОО —00 В формулах (2.10), (2.11) аргументами функций байесова и условного риска являются решающее правило F, априорная плотность вероятности сигнала рар (8) и сигнал S. Подобные обозначения иногда вводятся специально для подчеркивания того факта, что как байесов, так и условный риск зависят от решающего правила F (D | z), байесов риск определяется также априорным распределением pap (S), а условный риск зависит от сигнала S, в предположении наличия которого условный риск и вычисляется. Входящая в соотношения (2.10), (2.11) функция Р (z | 5), играющая важную роль в теории статистических решений, называется функцией правдоподобия, так как при фиксированной выборке z ее значения показывают, насколько один возможный сигнал «более правдоподобен», чем другие. Вариант II. й, G— абстрактные конечные множества. В рассматриваемом варианте й и G — абстрактные конечные множества: й = {5Х, . . ., £г, . . ., 5m}, G = {Z>i, ... . . ., Dj, . . ., Dm}, St и Dj — элементы этих множеств. , В задаче обнаружения, например, множество гипотез G состоит всего из двух точек Dx и D2. Точка Dx совпадает с утверждением «Сигнал на входе приемного устройства присутствует», а точка D2 означает, что «Сигнал на входе приемного устройства отсутствует». Заданы априорные вероятности сигналов рар (Ss). Поскольку предполагается, что на входе всегда присутствует один из сигналов, то т ^1 Pap (Si) = 1. г=1 Чтобы можно было воспользоваться уже выведенными соотношениями (2.10), (2.11), установим взаимно однозначное соответствие между элементами множеств й, G и некоторыми изолированными точками евклидовых пространств 7?s*, 7?д. Сигналу Si поставим в соответствие точку
5 = (0, . . ., О, 1, 0, . . 0)т, для которой sx = . . .= ' i = Sj-j = si+1 = ... ~ sm = 0, st = 1. Аналогично, решению Dj поставим в соответствие точку D = (0, . . ., 0,1, О, . . 0)т, для которой dx = . . . = dj-x — dj+1 = = . . . = 0, dj = 1. Тогда Pap • • • , $m) = = S Pap (й) s (Si) • • • d (s*_x) 6 (Si -1)6 (si+1)... 6 (sm), (2.12) i=i F(di,... ,dm|zi,...» z») = S F°(d1,... ,dm|zi,... ,zs) X j=i X 6 (di)... 6 (dj-J 6 (dj -1)6 (d;+x)... 6 (dm), (2.13) где f°(di, • • • ,dm|zi, ...,z») = F° (Dj |z) при dt = ... = dhl = dj+1 = ... = dm=O, = dj = 1 для j = l,m, (2.14) .0, в остальных случаях. F° (Dj | z) — это решающее правило в случае конечного множества решений; при фиксированной выборке z оно определяет вероятность принять решение Dj, причем по условию нормировки для любого z SF°(D;|z) = l. (2.15) J=i Подставляя (2.12)—(2.14) в (2.10), (2.11) и производя интегрирование по dsx, . . ., dsTO; ddt, . . ., ddm с учетом свойств 6-функций, получим т пг оо оо я = J ••• J ^PiP^ISOF-^lz)^ (2.16) г=1 j=i —оо —оо т со оо r= S J ... J И^Р(г|й)Р?(Р,|г)&. (2.17) — «* —СО
В равенствах (2.16), (2.17) введены обозначения Wij = W (0,..., 0,1,0,..., 0; 0,..., 0,1, 0,.. ., 0), * з P(z\Si) -= p(zi,.. . ,zft|0,. . , 1,0, ... ,0), Pi = Pap (Si), i где — потери в случае, когда при наличии на входе сигнала Sf принимается решение Dj, Р (z | St) — функция правдоподобия сигнала Sit т. е. плотность вероятности . .., z;[ при условии, что на входе присутствует сигнал S г. Вариант III. Q — метрическое пространство, G — абстрактное конечное множество. В этом случае сигналы S = (slt . . ., sfe)T принадлежат евклидову пространству Вг, а множество решений G = (Dlf . . ., D}, . . ., Dm) — абстрактное конечное множество. Как и в предыдущем пункте, установим взаимно однозначное соответствие между решениями Dj и некоторыми изолированными точками евклидова пространства Rm, поставив в соответствие решению Dj точку D — (0,.. ., 0, 1, 0, . . ., 0)т с коорди- 3 патами dk = . . . = dj^r = = . . . = dm — 0, dj = 1. Тогда плотность вероятности решения F(dx,. .., dm\ z15 ... . . z/,) определяется выражениями (2.13), (2.14). Под- ставляя (2.13), (2.14) в (2.10), (2.11) и проведя интегрирование по ddlt .... ddm, после необходимых преобразований получим m О' оо К S J ••• J W(S,Dj)P(z\S)FO(Dj\z)p&v(S)dzdS, —о© —ОО (2.18) т оо оо r = 2 J ••• f W(S,Dj)P(z]S)F°(Dj\z)dz, (2.19) ;=1 —со —оо где W (S, Dj) = W ta, . . ., 0,.. ., О, 1,0,.. ., 0) - з потери в случае, когда при наличии на входе сигнала S выносится решение Dj. б) Оптимальное решение для случая, когда £2, G — метрические пространства. Прежде чем переходить к отысканию оптимального решающего правила, изложим
теоретические основы поисковых методов [гл. п 78 кратко (без доказательства) некоторые известные и необходимые для дальнейшего сведения из общей теории статистических решений [2.2, 2.5]. В теории статистических решений рассматриваются два крайних случая состояния априорного знания: полное знание априорного распределения Pap (S) и отсутствие каких-либо сведений об этом распределении. Соответственно развиты два подхода к отысканию оптимального решающего правила: байесовский и минимаксный. Еслирар (S) известно, то имеется возможность записать выражение для среднего (байесовского) риска и выбрать байесовскую решающую функцию Fq (D | х) из условия минимума среднего риска R [Рар (5), F6] = min R [рар (5), F], F при этом характер оптимальности получаемого решения полностью определяется заданием функции потерь W (S, D). Сам минимальный средний риск получил название байесовского риска. При отсутствии априорных сведений о виде функции рар (5) нет возможности рассматривать средние потери, и поэтому исследуются условные риски г (S, F), зависящие как от решающего правила F (D | х), так и от сигнала S. Для произвольного фиксированного решающего правила F* из множества сигналов й можно выбрать такой сигнал SK, который обеспечивает наибольший условный риск г (5М, F*) = max г (5, F*). s Теперь всевозможные решающие правила можно сравнить на основе максимального условного риска г (SM, F) и выбрать в качестве оптимального такое правило FM, для которого условный риск г (SK, F) минимален: г (<$м, Fm) = min г (Su, F) = min max r (S, F). (2.2)) F F S Решение, удовлетворяющее условию (2.20), называется минимаксным. Существование байесовского и минимаксного решений доказывается в теории статистических решений при весьма общих условиях. Установлена также связь минимаксного решения с байесовским при определенном виде априорного распределения. Для этого из
класса всех возможных априорных распределений выделяется некоторое «наименее предпочтительное» распределение /?*р (5). Распределение рар (S) называется «наименее предпочтительным», если байесовский риск, связанный с этим распределением, больше байесовского риска, связанного с любым другим априорным распределением R [р*р (S), F*] = max R [рар (S), Гб]. Pap(S) Процедура нахождения «наименее предпочтительного»рас-пределения сводится к тому, что для каждого возможного априорного распределения pap(iS) отыскивается байесовское решение Fq л вычисляется байесовский риск 7? [рар (•$'), f’eL То распределение рар (5), на котором достигается максимум R [рар (S), Tgl и выбирается в качестве «наименее предпочтительного». Соответствующую этому распределению байесовскую функцию обозначим F*-При весьма общих предположениях в теории статистических решений доказано, что найденная отмеченным образом байесовская решающая функция совпадает с минимаксным решением FK = Fl Следовательно, для того чтобы определить минимаксное решение, необходимо найти байесовское решение для «наименее предпочтительного» распределения. Задача получения минимаксного решения обычно сводится главным образом к поиску «наименее предпочтительного» распределения. Одной из основных задач теории статистических решений явилось обоснование возможности отказа от рассмотрения случайных (рандомизированных) решающих функций. При таком обосновании важную роль играют понятия эквивалентности и е-эквивалентности решающихфункций. Две решающие функции Ft и Ft называются эквивалентными, если при любом сигнале 5 условные риски, соответствующие Fr и F2, совпадают: г (S, FJ = г (5, FJ для V5.| Аналогично, при любом е > 0 две решающие функции Ft Р Г г называются е-эквивалентныдои, если для произволу
яого сигнала S условные риски г (S, и г (S, F2) отличаются не более чем на е: \r(S,F1)-r(S,F2) |< в. В теории статистических решений при достаточно общих условиях доказано, что если пространство сигналов Q является ограниченным, то для любой рандомизированной решающей функции Ft найдется эквивалентная ей детерминированная решающая функция F2. Если же пространство сигналов Q неограничено, то для произвольного наперед заданного сколь угодно малого положительного числа 8 и для произвольной рандомизированной решающей функции Fy найдется s-эквивалентная ей детерминированная решающая функция t\. Общий вывод состоит в том, что для весьма широкого круга условий, которые обычно выполняются на практике, можно ограничиться рассмотрением только детерминированных решающих правил. Займемся теперь отысканием оптимального решающего правила. С точностью до 8-эквивалентности будем рассматривать только детерминированные решающие функции, которые могут быть представлены в виде Е (dj, . . ., dk [ Zj, . . ., Xfe) = = 6 — dx (zn . . ., zA)l ... 6 \dk — dk (zj, . . ., z,0). (2.21) Эта запись означает, что для принятой выборки z = (zx, ... . . ., Zk) в качестве решений dt, . . ., dk выбираются значения di (z), . . .,dk (z). Функции di (z), . . ., dk (z) определяют детерминированное решающее правило и геометрически означают преобразование пространства наблюдений Г в пространство решений G. Для детерминированного решающего правила (2.21) уравнение (2.10) преобразуется к виду оо оо R[Рар(«1, •. •,«»),И = J ••• f Wfo,..., sk; dt(«),...,4(z)]x —оо —оо X p(Zl, . . . , Zfc 1 S1( . . . ,8ft) Pap (sx, . . ^S^dzi. . . dzk dsi... dsk. (2.22) Рассмотрим одинаковое строение пространств сигналов и решений, когда решающее устройство в результате обрд-
ботки наблюдений z должно выбрать один из возможных сигналов !$ = («!,..., sk), т. е. D (z) = [dj (z), . . ., dk (z)] является оценкой вектора 5. Такая ситуация имеет место при применении теории статистических решений к задачам оценки параметров сигнала или фильтрации сигналов. 1. Остановимся сначала на простой функции потерь W (S, D) = 1 — 6 (зх — dj) . . . б (sk — dk). Подстановка W (S, D) в (2.22) приводит к соотношению оо со Л= J ... J" p(z1,...,zfc|si,...,sk)pap(si,...,sJf)ds1... —оо — оо 09 ОО 00 оо ... dskdzi ...dzjt— J ... J | J ... J 6 [st — di (z)J... —oo —oo —oo oo ... 6 [sk — dk (z)] p (zi... zk I slt..., 3») X X Pap (Si, • •. ,sk)dsi.. .dsk}dzi. • • dzk. (2.23) Первый из интегралов, стоящих в правой части равенства (2.23), на основании (2.5) и условия нормированности равен 1. Производя интегрирование по dst . . . dsk во втором интеграле, с учетом свойств 6-функции получим оо оо R = 1 — У • • • f Р [21,. • •, z1; ] 31 = di (z).sk = dk (z)] X —00 —oo X Pap [$i = <h (z),..., Sjr = dk (z)] dzi... dzk. Минимум риска обеспечивается, если для любой выборки z решения dx (z), . . ., dk (z) выбирать из условия максимума подынтегрального выражения J = р hl, . . ., zfe I «1 = di (z), . . ., sk — dk (z)l X x Pap [31 = di (z), . . .,sk = dk (z)]. По согласно (2.5) p [21, •. • , Zk I 31 = di (z),..., sk = dk (z)] Pap [3X = di (z),... ..., sk = dk (z)] = p [81 = di (z),..., sk = dk (z) |zx,..., zd X co oo X J • . . J P (Z1, . . . , Zk | Si, . . ., Sk) pap ($1, . . • , Sk) d$i.'.. dskt —oo —oo и максимум J достигается тогда, когда решения dx (z), . . ,
. . dk (z) выбираются из условия максимума апостериорной вероятности сигнала 5: Р [«1 = <4 (z), • • •, sjc = dk (z) | zi,..., zk] = = max p(si, ...,sk\z1, ...,zk). s*.sk Итак, оптимальное байесовское решение при простой функции потерь максимизирует апостериорную вероятность сигнала. 2. Рассмотрим теперь линейную функцию потерь к W (S, £>) = 2 lsi ~ ^il- Подстановка W (S, D) в (2.22) дает 1=1 ОО ОО ОО ОО к X р (zj,..., zjt | $i,..., S/j) рар (sj,..., S/c) dsi...dskf dzi... dzk. Минимум риска будет обеспечен, если для любой выборки решения dt (z) выбираются из условия минимума подынтегральной функции ОО 00 fc J = J J 2 I Si — (Z) I P («I, • • • , Zk | Si, . . . , Sfe) X X Pap (81,..., sk) dSi .. . dsk. Согласно (2.5) к оо оо ее J = 2 J I «г — (z) 11 J ... j p (zi, .. ., z^; $i,.. ., sfc) x i=l —<jo —©о —oo X ds^ e • dSi. Учитывая условия согласованности распределений, находим к оо / = 2 J |®{ — di(z) |p(zx,,.. ,Zk;Si)dSi = i=l —oo It 2i(z) = 2 { J [Si — di(z)]p(zi, ...,Zk;si)dsi + i=l —oo oo + f № (z) — p (zv ..., zk; Si) dsj.
Условия экстремума -g- = 0, / = (2.24) с учетом правила дифференцирования функций, зависящих от параметра [2.6], приводят к равенствам со j р (Z1,..., Zu; Si) dSi = J p (Zi,..., zk; s{) dsi, i = l,k. 2i(z) (2.25) Разделив обе части равенств (2.25) на -р (zlt . . ., zfc) и приняв во внимание (2.5), получаем <'i<0 оо j p(si|zi,... ,zk)dsi = J p (st I Zi,..., zk) dsb i = i,k. (2.26) Соотношения (2.26) определяют оптимальные решения di (z) для линейной функции потерь как медиану апостериорного распределения. 3. Рассмотрим квадратичную функцию потерь к W (S,D) «= у (S| — di)2. В результате подстановки W(S, D) Si в (2.22) находим оо оо оо со ft * = J ••• J И ••• J 2[«*-й)]!х —оо —со '•—со —оо i=l X p(zi,..., Zjtjsx,..., sk) Pap (sx,..., sk) dsj,... dsk] dzk... dzk. Минимум байесова риска обеспечивается, если для любого z оптимальные решения dt (z) выбираются путем минимизации подынтегрального выражения оо оо I /= $ ... J 3 (Si — ^i(2)l2P(Zl, ....Zfc|Sl, ...,Sfc) x —co —co i=l X pap ($ij • • • , Sjc) dsi. • . dSfct
& Условия минимума (2.24) приводят к системе уравнений оо оо di (z) = J ... J p (zlt..., zk | Sx,..., sfc) pap (sx,:.., sk) dsv..dsk = •—OO -OO 00 « = J ... j Sip (Zx, . . . , Zfc I Si, . . . , S,r) Pap («X, . . . , Sfc) ds^.-ds*. —oo —oo (2.27) Разделив обе части (2.27) нар (zlt..., zk), учтя (2.5), а также условия нормированности и согласованности условных плотностей вероятности, получим ОО d{(z)= J Sip (s{ | Zx,..., z^) dsi, i = —00 t. e. в случае квадратичной функции потери оптимальным решением оказалось апостериорное математическое ожидание сигнала. Итак, в байесовском подходе при разнообразных употребляемых функциях потерь оптимальные решения выносятся на основе рассмотрения апостериорной плотности вероятности сигнала р (sj, . . ., sk | z15 . . ., z^) и для различных критериев в качестве оптимальных решений принимаются значения, доставляющие максимум апостериорной плотности вероятности, медиана или математическое ожидание этого распределения. Если апостериорное распределение симметрично и имеет один глобальный экстремум, то байесовские решения по всем трем рассмотренным критериям приводят к одному и тому же результату. в) Оптимальные решения для случая когда Q, G — абстрактные конечные множества. Рассмотрим случай конечных множеств сигналов и решений (гипотез), когда байесов риск определяется выражением (2.16), и будем считать, что множества сигналов и решений устроены одинаково, т. е. элементами множества решений являются сами сигналы. Задача решающего устройства состоит в том, чтобы путем проведения наблюдений над входом z, связанным определенным известным образом с присутствующим на входе сигналом S,, выбрать такое решение, которое совпадало бы с St. Подобная ситуация возникает
в теории проверки статистических гипотез (теории многоальтернативных решений). Поскольку множества Q и G не образуют метрического пространства, использование линейной или квадратичной функций потерь невозможно, так как (в общем случае) не определены понятия расстояния между сигналом St и гипотезой Dj. Ограничимся рассмотрением лишь простой функции потерь, которая в рассматриваемом варианте задается матрицей Wc элементами Wjj, i, j = 1, . . ., т: 0 1 ... 1 (2.28) 11 ... 0 Такая простая функция потерь является индикатором неверного решения Dj Sit так как она равна 1 при принятии неверного решения и обращается в 0 в противоположном случае. Известно [2.7], что математическое ожидание от индикатора некоторого события совпадает с вероятностью этого события. Значит, байесовский риск для рассматриваемой простой функции потерь совпадает с вероятностью принятия неправильного решения. Байесов риск (2.16) можно представить в виде оо оо m Я = J ... J [S /jF»(Dj|Z)ldz1...dzb (2.29) —оо —оо Уе=1 где т ^P^WijP^Si). i=l Риск (2.29) обращается в минимум, если для любого наблюдения z подынтегральная функция ^JjF°(Dj\z) i будет минимальной. На основании упоминавшегося выше понятия эквивалентности решающих функций рассмотрим только детерминированные решающие правила, которые могут принимать лишь значения 0 или 1. Если для некоторого наблюдения z решающее правило выбрало гипотезу Dq, то ^°(^И) = {о при ] = q, при j=jt=q,
при этом т 3 J/»(Dy|z) = Je. (2.30) 3=1 Геометрический смысл принятия решения при детерминированном решающем правиле состоит в разбиении пространства входов на непересекающиеся области Гх, . . ., Гт такие, что при попадании выборки z в область Г7- принимается решение D}. Условие (2.30) подсказывает, что согласно оптимальному байесовскому решающему правилу по проведенным наблюдениям zx, . . zic для каждой возможной гипотезы Dy должны рассчитываться числа (значения функционала) т Jj = S WiiP (й) Р (zi,..., zk I Si), i=l а затем определяться гипотеза Dv, которая минимизирует функционал Jy. Эта гипотеза и выбирается в качестве ответа решающим устройством. Нахождение решения связано с перебором различных возможных вариантов и поиском такого варианта, который минимизирует функционал J}. На этом основании подобные методы принятия решения называются поисковыми. В случае простой функции потерь т т J-3= ^lP{Si)P{z\Si)= 5j Р(Si)Р(z[Si) — р(Sy)Р (z|Sy) i=l i=l м? и минимум J у достигается на той же гипотезе, на которой достигается максимум величины р (Sy)P (z 1 Sy) = Р (Sy I z)p (z), (2.31) т. e. оптимальное байесовское решение при простой функции потерь максимизирует апостериорную вероятность сигнала P(Sy|z). Если же гипотезы равновероятны, т. е. р (Sy) не зависит от /, то критерий максимума апостериорной вероятности превращается в критерий максимума правдоподобия maxP(z|Sy). з Остановимся еще кратко на случае, когда априорные ве
роятности гипотез р (Si) неизвестны и необходимо выносить минимаксное решение. Для простой функции потерь А. Вальдом в весьма общих предположениях было доказано следующее утверждение. Если при некотором распределении априорных вероятностей сигналов р (SJ = = Pi, • • •» Р \^т) = Р™ соответствующее этому распре-делению байесовское решение F* таково, что условные риски равны между собой: г (Sx, Fl) - . . . = г (Sm, Fl), (2.32) то pl, . . ., pm — наименее предпочтительное распределение, a F* — минимаксное решение. В рассматриваемом случае конечных абстрактных множеств Q, G и простой функции потерь выражение условного риска г (St, F) может быть получено подстановкой (2.28) в (2.17). После необходимых преобразований находим ОО ОО 7П r(S{,F)= J ... J [2 Е°(^ЫР(2|й)^- -оо —оо J со оо - J ... $ F°(Di\z)P(z\Si)dz. —оо —оо С учетом равенства (2.15), а также условия нормированно-сти функции правдоподобия ОО 00 j ... J P(z\Si)dz = 1 — со —00 получаем г (Si, F) = 1 — Рц, i = 1, . . ., т; здесь обозначено во &f Рц = j ... J F°(Di\z)P(z\Si)dz = J P(z\Si)dz. —oo —©о Г • Рц — означают вероятности правильного решения Dt при условии присутствия сигнала 5г. Таким образом, в случае простой функции потери критерий (2,32) наименее предпочтительного распределения превращается в тре
бование равенства вероятностей правильных решений для всех возможных сигналов Р11 ~ Ртт- В ряде задач наименее предпочтительное распределение совпадает с равномерным р* (FJ = ...== р* (Sm) = 1/т. Тогда согласно (2.31) байесовское решение F* должно находиться из условия максимума функции правдоподобия Р (z | Sj); следовательно, и минимаксное решение FM максимизирует функцию правдоподобия. г) Вычисление функций правдоподобия. Из сказанного ранее следует, что функции правдоподобия играют важную роль в теории статистических решений. Рассмотрим случай, когда наблюдение z, сигнал S и шум п являются ft-мерными векторами z = (zx, . . ., zft)T, S = ($ь . . ., ss)T, n — (n17 . . ., res)T и z — [S' X n], что означает некоторый способ комбинирования сигнала и шума. Предполагаются способ комбинирования сигнала и шума, а также статистика шума известными. В этих условиях можно найти функцию правдоподобия сигнала Р (z | S). Ограничимся рассмотрением аддитивного центрированного шума, когда z = S + п, и пусть задана плотность вероятности шума р#(пх, . . ., гей). При фиксированном сигнале 5 условное математическое ожидание М [z | 5] равно S, а центрированное значение наблюдения i равно z == z — М [z | S] = п, поэтому условная плотность вероятности вектора z определяется видом рп (п) и равна Р (z I S) = pN (z — 5) = pN (zx — slf . . z/t — sk). (2.33) В частном случае гауссова шума, когда р„ . п,) - exp (- 4- П’АЛ), где Кп = М [ппт] — ковариационная матрица шума, функция правдоподобия сигнала имеет вид P(z|5)--<W7Wmp • (2.34)
Часто сигнал зависит от некоторого случайного вектора параметров Л = (Лх, . . Лг) так, что при фиксированном значении параметров сигнал превращается в детерминированную функцию 5 = 5 (Л) = [sx (Лх, . . Лг), . . ., а* (Лх, . . Л,)]’. (2.35) В этом случае правильнее говорить о функции правдоподобия параметров, которая может быть получена подстановкой (2.35) в (2.33) или (2.34). Например, при гауссовом аддитивном центрированном шуме Р (z 1 Л) = —к 1 /—X 1 ' (/2n)fc]/detXn X exp [z — S (Лх,..., Лг)]тКп1 [z — S (Лх,..., Лг)]}. (2.36) В теории статистических решений большое значение имеют понятия существенных и несущественных параметров. Обозначим вектор существенных параметров Лх = (Лх,... . . ., Лр), а вектор несущественных параметров Ац — = (Лр+Х, . . ., Лг). Сигнал S (Л) зависит как от существенных, так и от несущественных параметров, т. е. Л = (Лх, Ли), а решение должно выноситься лишь относительно существенных параметров (этим фактом и объясняется их название). Для принятия решения необходимо знать функцию правдоподобия только существенных параметров. Покажем, что она может быть получена из функции правдоподобия всех параметров усреднением по несущественным параметрам. Действительно, Р (z | Aj) = Р (z, Л^Р-1 (Aj). (2.37) Известно, что Р (z, Лх) может быть получена из Р (z, Л) — = Р (z, Ai, Ац) путем интегрирования этой плотности по йЛд = <2Лр+х . . . dAz: Р (z, Лх) = J ... J Р (z, Лх, Лп) dAn,
что совместно с (2.37) дает со оо Р (z I Ат) = Р-1 (Л1) J ... $ Р (Z, Ль Лп) ЙЛП = —<эо — оо со оо = J ... $ Р(г|ЛьЛп)Р-1(Л1)Р(ЛьЛп)с/Лп = —в© —ОО ОО ОО = J ... f P(z|A)P(An|Ai)dAn, —ПО —оо или в развернутом виде с учетом (2.33) р (zlf..., zk | Ль ..., Лр) = 00 ОО = J ••• 5 PHzi — s1(A.1,...,Al),...,zk — sfc(Ai,...A)]X X р(Лр+ь ..., Лг | Ах,..., Ар)d\p+t... йЛг. (2.38) § 2.2. Рекуррентно-поисковое оценивание Теория статистических решений, а точнее одна из ее ветвей, связанная с проверкой статистических гипотез, может служить теоретической основой поисковых методов оценивания в корреляционно-экстремальных навигационных системах. Этот вопрос будет подробнее рассмотрен в главе V. Однако применение теории статистических решений к задачам, в которых существуют сложные дифференциальные зависимости между последовательно производимыми наблюдениями zlt . . ., zk, наталкивается на определенные трудности. В этих условиях плодотворным оказывается комбинирование идей дискретной калманов-ской фильтрации [2.4] и теории проверки статистических гипотез. Именно таким подходом является излагаемое в настоящем параграфе рекуррентно-поисковое оценивание (РПО). Математическая постановка задачи в рекуррентнопоисковом оценивании осуществляется следующим образом [2.8]. Заданы дискретная динамическая система Хг+1 = At (D)Xt + Ь, (2.39) Zt = Ht (D)Xt + Ft (D) + th, i = 0, 1, . . ., N, (2.40)
где Xt = (Хг1, . . ад Zt = (Zfl, . . Zimy, Si = (Sili • • •> Sin)T> “Hi = Olil» • • •» 11im)Ti Ft (D) = [Fix (D), . . ., Fim (D)]T, множество гипотез G = {DT, . . D}, . . ., DJ и априорные вероятности этих гипотез pj = Р (Dj), Матрицы объекта At (D) и канала наблюдения Ht (D), Fi (D), а также ковариационные матрицы Qi (D), Rt (D) центрированных нормальных возмущающих воздействий £;, т|г и параметры начального нормального распределения р (Хо | D) зависят от гипотезы О G G, имеющей место во время проведения наблюдений на интервале i = О, 1, . . ., N: М <& | D> = О, М <цг | D> = О, М I D> = О для VD, М <U* | Dy = Qi (D)^, М I Dy = Ri (D)6iq, P (Xo I D) €= N Im (D), G (D)], (2.41) 6ig — символ Кронекера, m (D), G (D) — математическое ожидание и ковариационная матрица распределения вектора Хо. Требуется по проведенным наблюдениям Zo, . . . .. ., Zn наилучшим образом оценить вектор состояния Х^ и выбрать гипотезу Dj. Рассматриваемая задача линейна по отношению к вектору состояния Хр, в то же время матрицы Ait Ht, Ft, Qt, Ri,m,G произвольным детерминированным образом зависят от гипотезы D. Для проведения доказательства и для формулирования критерия оптимальности зафиксируем векторы Xi = («г1, . . жгп)т, dxt — (dxir, . . ., йхгп)т, Zi = (z/i> • • •, zim)T, dzt = (dztl, .. ., dzimy и введем в рассмотрение следующие события. Событие 0г состоит в том, что xtl < Xtl < xtl + dxtl, . . ., xin < Xln < xin + dxin, или в векторной форме xt<. Xt xt + dxt *). Аналогичным образом определяется событие Cf. zil ^il zll dz-ti, • • •> zim ^tm zim dZim, *) Здесь и далее большими буквами Хц, Х-,2 , . . Zu, . . обозначаются случайные величины, а малыми буквами х ]t х 2, .. . . . zilt ... — возможные значения этих величин.
ИЛИ Zj < Zj Zf 4~ dzp Событие, заключающееся в том, что на интервале наблюдения i =0, 1, . . ., N выполняется гипотеза Dj, обозначим согласно предыдущему Р (Lj) = р7-. Обозначим также С* = Ск, Ej{ = Lj 9{. fc=0 Нас будет интересовать условная вероятность Р (Е^ | С’), а также предельное значение ее частной производной, которое обозначим , дР(Е..\(У) p(xi,j\z') = lim -------. (2.42) dzo-»o,-.,dzi-‘-o p (xi, j | zl) обладает свойствами вероятности по отноше-нию*к гипотезе Dj и свойствами плотности вероятности — по отношению к вектору состояния Xt. В качестве критерия оптимальности оценивания примем J — max р (xN, j | z”). (2.43) XN> Dj Перейдем к выводу оптимального алгоритма, причем матрицы Ot, Rt для любого момента времени i и любой возможной гипотезы Dj считаем невырожденными. Справедлива цепочка равенств Р (E}tn П Ci+1) = Р П Ci+1 П С1) - = Р(ЯЯ+1ПС1+1ПС‘П U о*) = 0< = 2^(0шП^П^+1П0гПС1) = 0i = 2^(^+1|0<+1П^П0<ПС‘) х ei xP(0i+1|£Jneinci)P(L3n9in^). (2.44) В (2.44) сумма (J0; берется по всевозможным непересе-кающимся, образующим полную группу событий множествам 0г, и на этом основании возможно третье равенство в цепочке (2.44). Из соотношений (2.39), (2.40) и
нормальности возмущений £г, т), вытекает Р(С||0<Л^пе*-1П см) = ехр(-4-|1М’-1) = Р (G10» Л L-) ----------=^-; =? dz„ (2.45) И(2л)’п|Яя| где Дл = zt — H}iXi — F3i, Р (0i+11 L-} Л Oi n C1) = p (0i+110i л Li) = exp ----------r—dxi+1, i = 0,1,... (2.46) V (2«)n | Q3i I В (2.45), (2.46) и в дальнейшем принят распространенный сокращенный вид записи квадратичных форм ХТАХ = || X ||д, а также введены сокращенные обозначения Лг(Я;) = Лп Яг(£>у) = Яя, Рг(^) = Рл, Qt(D}) = Qjt и Rt (D3) = Rjt. Разделив крайние выражения цепочки (2.44) на Р (С'+1) и воспользовавшись соотношениями для условных вероятностей, получим рекуррентную зависимость Р (Е} i+11C1+1) = Р"1 (С<+11 С1) 25 Р (G+110{+1 л L}) х 6 • X Р (0<+110» Л L-) Р (E}i | С*), (2.47) позволяющую рассчитать Р (Ел | С’) для любого момента времени, если задано Р (Е}0 | С°). В свою очередь, Р (Ei0 | С°) = Р’1 (С°) Р (0О П L} Л Со) = = Р-i (С°)Р (Со | 0О Л L})P (0О | L3)ph (2.48) причем в силу (2.45), (2.41) Р(Со|0оП^) = = [(2л)т | Rj0 Ц"~ ехр (-L || Д;0 Ill-х) dz0, (2.49) Р (001 Lj) = [(2л)пI Gj |] a exp (— у || x0 — m3 II® Tx) dxa, (2.50) где nij = m (Dj), G3 = G (D3).
Найдем Р (Ejt | С’)- Воспользуемся методом математической индукции. Предположим, что Р (E}i | С1) имеет вид тио = = Р"1 (С1) dzidxiai exp 5-(II xi — II*-i + ^л)]» (2.51) « Г ,ч где £л и Ijt — соответственно вектор и скаляр, зависящие от момента времени i, проверяемой гипотезы Dj и всех проведенных наблюдений zl = Zi)T, Г#1 — сим- метричная положительно определенная матрица; dz1 = = dzodzj^ . . . dzt. Проверим сначала справедливость представления (2.51) для i — 0. Подстановка (2.49), (2.50) в (2.48) дает Р(^о|С«) = = Р-i (С°) dzPdxtfj |(2л)т+п | G} 11 Rj01 ]~~exp (- -f-) , (2.52) где В = II Хо - т} 11* ! 4- II Ajo II* 1 = з “зо — Il^ollp-i — 2xq [Gjbnj HjoRja (zo — Fjo)] + 30 4-11^-1 + 1120-^0 11*--!. 3 30 здесь ^=G? + Hy$H}0. (2.53) В силу симметричности и положительной определенности матриц GJ1 и BJo матрица Г^1 обладает теми же свойствами. Воспользуемся известным матричным тождеством, справедливым для симметричной положительно определенной матрицы А: М2а + 2u*z = ||и + - I|2||a-i, (2.54) которое легко устанавливается проверкой. После необходимых выкладок получим В = || х0 - х}01|* + W; (2.55) 1 jo
в формуле (2.55) приняты обозначения ijo = Tj0 [G^mj 4- Н(z0 ^о)1< (2.56) IF = 4- ||z0 — Fло(1д71 — 4- HjoRjo (zo ^’jo)llr^- j ’ * (2.57) Подстановка в (2.56), (2.57) G]\ вычисленного на основании равенства (2.53), приводит к соотношениям ijo = Hij 4- #jo == ГjoHjj)Rj0, (2.58) W = ||mX_! - |ЦпХт 4- ll20 - Fjoll®-i - 1 jo "ja“jo jo /о — 4- ^BjoMr* ~ )lZo — ^°^{”01 il^JoWjlljj-i — 2m]H]0Rj^j0 — ||^о11д-1 т -i = IlAjoll -i> (2.59) "jo " jo1 jo" jo" jo ^jo 2$ = Rfi - R^HjorjoHT^. (2.60) Совместное рассмотрение (2.52), (2.55) и (2.59) дает Р(МС°) = = Р"1 (С°) dz°dzo«o exp £--g- “ Mp-i + Ajo) J» причем a0 = (|Л2л)“<’"+п\ 7jo = IlAjollv-i + ejo> ejo — In (| Gj 11 Rjo] Pj2). (2.61) jo Следовательно, для i = 0 индуктивное предположение (2.51) выполняется. Пусть представление (2.51) выполняется для некоторого i. Подставим (2.45), (2.46), (2.51) в (2.47). Тогда в соответствии с предыдущими допущениями, а также в силу предполагаемой бесконечной малости dxt сумма (2.47) превратится в многократный интеграл по dxt, вычисляемый в бесконечных пределах Р (Eji+11Г+1) = Р~1 (С*+1) dz^dx^ к X [(2n)m+n| Q^\ | Rjt+11] 2 exp Г 9~(^ji 4- II Aji+ilL-i , 4- llx{ — XjilP-i 4- — 4ji^X-i)l dx<. (2.62) 1 /i Qji
Осуществив с учетом (2.54) преобразование квадратичной формы, стоящей в показателе экспоненты, и проведя интегрирование, получим Р(£Я+1|С*«) = = Р"1 (С*«) dzi+1dxi+1ai+1 exp Г — -t- + || Д3- i+1 j]® r L * H3i+1 + ll#i+l—l|2 -1 + eji+l)]’ (2.63) Mi z+i где ®i+l — (2л) 2 di, &ji+i — In | Qji 11 Rji+i | | Ilji | , nj? = Г7* + AjiQ^Aji, A/Ti+1 = Qli — QliAjAAjiA^iQ^. (2.64) При интегрировании (2.62) использовалось равенство [(2л)п( Д|] * ехр (----|-||ж —= 1, (2.65) являющееся условием нормированности «-мерного нормального распределения. Воспользовавшись снова тождеством (2.54) и преобразуя на этой основе (2.63), находим Р(ЯИ+1|С^) = = Р"1 (Ci+1) dzi+1dxi+1ai+1exp [— у (И ~ хз i+lllr7i+i + i+1)]' (2.66) Здесь обозначено rj}+1 = M]l+1 + (2.67) ^ч+1 ~ lji+i (zi+i — Fji+i) + Afji^AjiXji], (2.68) lji+1 = Iji — ll#Ji+l-^;i+l(Zi+l — Fjt+1) -|- Mj i+1AjiXji |1г3ч+1 + + II zi+l — II® —! -J-p^i+i. (2.69) К j i+1 M;i+1 Поскольку при симметричности и положительной определенности матриц TJi, Q~ji, Rji+i преобразования (2.64), (2.67) сохраняют за матрицей ГД*! эти свойства и в силу (2.66) индуктивное предположение о виде (2.51) условной вероятности Р (Ец | С1) выполняется для любого i.
Вычислив М]1+1 на основании равенства (2.67) и подставив найденное значение в (2.68), (2.69), после преобразований, аналогичных тем, которые были проведены при выводе (2.58), (2.59), (2.60), получаем f’ji+l ~ -Aji&ji + TTji+iA^i+i, = i+l^ji+l, (2.70) hi+l — hi N &ji+l H^r-l + eji+l’ (2.71) Sji+1 = R?i+1 - R-l+1Hji+1rii+1H]i+1R^. (2.72) По формуле (2.42) находим P (®i, 71 г1) = h exp [ — -|-(|| Xi — x}i || ® x 4- hi) J , (2.73) где b:i = a-i lim P-1 (C’) dz’, i = 0, 1,..., N. (2.74) dzo-*o,...,dZ|-*O Предел (2.74) существует, определим его. G этой целью рассмотрим, плотность вероятности р (xt | гг), для чего сначала найдем условную вероятность Р (0г | С1). По- скольку (J Lj образует достоверное событие, то 3=1 р(е{|с{) = Р(е4пи^|0 = 3=1 = Р(и0гП^|^) = ^(и^г|^). 3=1 3=1 Так как при разных / события Ец несовместимы, то i тю = £тнс‘)== 3=1 I = а{Р-1 (С1) djdXi У, exp [ — (|| — xj{ Ц^-j + . Но Р (0, | Сг) = р (xi | z^dxi. Из сопоставления двух последних уравнений вытекает i р (Xi I z’) = diP-1 (С!) dz{ У, exp [ — ^-(|| Xi — x}i ||®_г + 7Я)] . j=i (2. 75) 4 А. А. Красовский
Проинтегрируем р (жг | z‘) по всем возможным значениям xt. Приняв во внимание равенство (2.65), получим i § Р (*< | г1) dxi = (С1) dz* /(2л)п | Гя | exp (— . 3=1 Но, с другой стороны, по условию нормированности этот интеграл должен быть равен 1, следовательно, Ь{= |Гн|ехр (- 4-Л0]’ • (2-76) 3=1 Соотношения (2.73), (2.76) полностью определяют вид критерия оптимизации. Ввиду конечности множества гипотез общий максимум (2.43) можно вычислять последовательной максимизацией J = max [max р (xn, j | zIV)]. С этой целью для каждой Dj XN из возможных гипотез D j необходимо определить значение xjN, доставляющее максимум функции р (xN, j | zN). В силу (2.73) и доказанной положительной определенности матрицы rjjy в качестве хщ следует выбрать xiN, при этом / = max Ьм ехр (—IjNl2), и для нахождения полного Di экстремума осталось найти min IjN. (2.77) пз Соотношения (2.70), (2.67), (2.64) являются уравнениями дискретного фильтра Калмана, построенного для гипотезы!);. Эти уравнения решаются рекуррентно при начальном условии, определяемом равенствами (2.58), (2.53). Значение функционала IjN, соответствующего гипотезе Dj, также рассчитывается рекуррентно по формулам (2.71), (2.72) при начальном условии (2.61). Следовательно, оптимальный алгоритм таков. Для каждой из возможных гипотез Dj моделируется по уравнениям (2.70), (2.67), (2.64) соответствующий ей фильтр Калмана и производится оценивание вектора состояния i = 0, 1, . . ., N. На основании оценки «;г, вычисле
ния ковариационной матрицы и проведенных наблюдений z’ согласно (2.71) рассчитывается функционал Гипотеза Dv, на которой достигается (2.77), и соответствующая ей оценка вектора состояния выбираются в качестве оптимальных. Рис. 2.1. Схема рекуррентно-поискового алгоритма оценивания. Схема оптимального алгоритма оценивания изображена на рис. 2.1, где т означает блок единичного запаздывания. Видно, что алгоритм оценивания структурно распадается на две части: рекуррентную, где моделируются дискретные фильтры Калмана и рассчитываются значения функционалов Ijt, и поисковую, в которой отыскивается
minZ/jv. Этим обстоятельством и объясняется название алгоритма . Подведем итог проведенному доказательству и сформулируем полученный результат в виде специальной теоремы. Теорема 2.1. Пусть имеется конечное множество гипотез G = {Dx, . . . ., DJ и заданы априорные вероят- ностигипотез pj = Р (Dj). В дискретные моменты времени i = 0, 1, . . N наблюдается сигнал Zi = HjiXi + F]t + Т)г, (2.78) зависящий от вектора состояния Xt линейной дискретной динамической системы, описываемой уравнением = Aji Х( + (2.79) Матрицы объекта A }i = At (Dj), канала наблюдения Hji = = Hi(Dj), Fji = Fi (Dj), статистические характеристики возмущений рг, и начального распределения вектора состояния Хй зависят от гипотезы, имеющей место на интервале наблюдения i = 0,1,. . .,N. Наблюдателю априори неизвестно, какая из гипотез выполняется. Случайные возмущения т)ь £« — центрированные нормально распределенные дискретные «белые» шумы, их условные ковариационные матрицы равны М | Dj> = Qjfiiq, (2.80) М <W9 ! Ру> = 0, М <Т]^ I Dj> = Rji 6iQ. (2.81) Начальные условные распределения вектора Хо нормальные р(Хй \Dj)(=N(mj, Gj), j = 1, . . ., I, (2.82) гдетп; = m (Dj) nGj = G (Dj)— условное математическое ожидание и ковариационная матрица распределения р (Хо \ Dj). Тогда оптимальный в смысле максимума р (xn, j | zN) алгоритм оценивания вектора состояния XN и выбора гипотезы Dj включает три группы уравнений: уравнения оценок •^ji+1 h Хц+iAj i+i, Aji+l ~ Zi+1 <+i, Xji+i = V j i+iHji+i Rj i+15 (2.83)
уравнения ковариационной матрицы Г3Ч+1 — 4- Нji+n ^Л+1 = — QjiAjifiji-AjiQji, и уравнения функционалов Л' 1+1 = Ли + ^ji+l-^jJ+1Aj{+1 -4 Ej i+1, 8ji+1 — 1И (| Qji 11 Rji+1 |-1), ^ji+1 = Rji+l — (2.84) (2.85) которые рассчитываются для всех проверяемых гипотез (/ = 1, . . ., I) и для моментов времени i = 0, 1, . . ., N. Соотношения (2.83), (2.84), (2.85) решаются при следующих начальных условиях: для уравнений оценок Xjo — nij Ц- ZfjoAjo, Ajo = 2о 4/*jo^j F jo, Kj0 = Tjo/7 W; (2.86) для уравнений ковариационной матрицы По == G~i + HjA (2.87) для уравнений функционалов Zjo = AjoSjo1^ + Bjo> Ejo - In (| Gj 11 Rj01 p]2), s;ol = R-& - r^h^hX, (2.88) i = i, • По формулам (2.83)—(2.88) рассчитываются конечные значения функционалов IiN. В качестве наиболее вероятной выбирается гипотеза *DV, минимизирующая функционал IjN- Ivn = min IjN, з а оценка &vn, выдаваемая соответствующим этой гипотезе дискретным фильтром Калмана, является оптимальной оценкой вектора состояния XN. Равенства (2.83)—(2.88) полностью определяют алгоритм рекуррентно-поискового оценивания.
Выясним физический смысл Гц. Для этого определим условную ПЛОТНОСТЬ вероятности Р (xt | /, z1) = = дР (0г I Lj П С'удхц Поскольку р (бг । ь} п с1) = р (ь} п 0г П с1) р-1 (L, п а) = = Р (Еп | Г) Р-1 (L} | (Р), то с учетом (2.42) Р( Ъ 17, г‘) = р (xt, j | ?) Р-1 (L} 1 (*). (2.89) В свою очередь, Р (Lj | С1) = Р (Lj f"| (J 0; К’) = Vi Р (E}i | С*) ®i 0i и в предположении бесконечной малости dx^ Р(£ДС*) = р(хь ^z^dxi = = Р-1 (С‘) dz^i /(2л)"|Гя| ехр (- ; (2.90) при интегрировании (2.90) учтено равенство (2.73). Подставив (2.74), (2.75) и (2.90) в (2.89), находим Р 17, z1) = Г(2л)Л| Гя |]-“ехр (- -А- И - &ji С_х) . (2.91) Из формулы (2.91) вытекает, что распределение вектора Xt при условии выполнения гипотезы Dj и наблюдения вектора z* нормально, а Хц и Выявляются соответственно математическим ожиданием и ковариационной матрицей этого условного распределения. Рассмотренный критерий оптимизации max р (xN,j | zN) xN<i приводит к такой оценке вектора состояния и такому выбору гипотезы Dv, которые имеют наибольшую вероятность совместного появления при проведенных наблюдениях zN. По ходу доказательства, кроме р (xh j | z1), была найдена также апостериорная плотность вероятности вектора состояния р (xt | г), определяемая соотношением (2.75). Апостериорные вероятности гипотез Р (Dj | z’) могут быть получены из р (xt, j | z1) интегрированием по xt и имеют вид Р (Dj I ?) = MV 2S)” |/ таехр (- 4- ’ (2.92)
Апостериорные характеристики р (xN I zN) и Р (Dj ] zN) могут служить основой для использования других критериев оптимизации при оценивании вектора состояния Х^ и выборе гипотезы D j. Однако при любом критерии оптимизации оптимальный алгоритм структурно распадается на рекуррентную и поисковую части, которые совместно позволяют определить все необходимые апостериорные характеристики. § 2.3. Частные случаи рекуррентно-поискового о ;енивания Рассмотрим последовательно ряд интересных частных случаев рекуррентно-поискового оценивания. йч а) Частный случай I. Дискретный фильтр Калмана. Пусть множество гипотез состоит из одной гипотезы. В этом случае индекс / можно во всех записях опустить. Предположим также Ft е= 0. Тогда уравнения (2.78), (2.79) примут вид хг+1 = Агхг + ^, zt = ад + т]г. Критерий (2.43) превратится в требование max р (xN | zN), xN т. о. в качество оптимальной оценки вектора состояния Х^ необходимо выбирать такое значение, которое обеспечивает максимум апостериорной плотности вероятности. Следовательно, постановка задачи совпадает с исходной постановкой дискретной калмановской фильтрации [2.4]. Уравнения, определяющие оптимальную оценку xN, получаются из соотношений (2.83), (2.84) при отмеченных выше допущениях. Выпишем развернутую форму алгоритма дискретной калмановской фильтрации: ^г+i — Ajii (Zj+i Нi+}Ai£i), Xi+1 = ri+1Di+iJli+i, (2.93) rS1 = Mri+^+1K^i+1, МГА = q-1 - егЧгмЖ1, Щ1 = Г?1 4- AlQi'Ai. (2.94) Из изложенного ранее обсуждения формулы (2.91) следует, что апостериорное распределение вектора Xt при проведенных наблюдениях zl нормальное, a xt и Гг являются соот
ветственно математическим ожиданием и ковариационной матрицей этого распределения. Соотношение (2.93) называется уравнением оптимальной оценки, а равенство (2.94) — уравнением ковариационной матрицы ошибок оценивания. Рекуррентные зависимости (2.93), (2.94) решаются при начальных условиях io = т 4- ГоЯХ1 (Zo - Яотп), Г;1 = G-1 + где т, G — математическое ожидание и ковариационная Рис. 2.2. Структурная схема дискретного фильтра Калмана. матрица начальных ошибок оценивания, или, что то же самое, априорного распределения начального значения вектора Хо, предполагаемого нормальным. Структурная схема дискретного фильтра Калмана приведена на рис. 2.2. В рассматри ваемом случае рекуррентно-поисковое оценивание выродилось в чисто рекуррентное оценивание. б) Частный случай II. Рекуррентная форма алгоритма проверки статистических гипотез. Допустим, что Луг, Qu, Gj, т} не зависят от у, а Нц == 0. Физически это означает, что в наблюдении содержится лишь информация о проверяемых гипотезах, а поведение динамической системы от гипотез не зависит. Уравнения движения и наблюдения имеют вид Xi+1 = AiXt + Ъ, Zt = Ft(D) + т]г, i = 0, 1, . . .,N, M (^ | D) = 0, M <ni | Dy = 0, M | Z>> = 0, M I Dy = (?Дв, M <г]й« I Dy = Rt (D) 8i(l, p (Xo |P) e AT Im, GJ. □ (2.95)* Поэтому можно предположить, что Р (9г j Lj 0 С1) = *) Значок □ перед номером формулы означает, что данный номер относится к группе формул, перед первой из которых стоит значок
= Р (9;) И Р (Е„ I С1) = Р (9г I L} П С1) Р (Lj П С1) Р-1 (С{) = = Р (9;) Р (Lj | С1). (2.96) Для доказательства (2.96) воспользуемся методом математической индукции. Проверим правильность (2.96) для i — 0. В рассматриваемых условиях формулы (2.49), (2.50) превращаются в равенства /*(Со|9оП^) = 1(2«Г| ехр (~ ~ II Zo - Fj0 II?-?) dz„ ' Xi KjQ / -1-/1 X P(9o|^j) [(2п)п IG |] 2 exp( --^-||Xo — m ||’g-i) dx0, следовательно, P (CQ | 90 f] Lj) не зависит от 90 и совпадаете Р (Са | Lj), а Р (90 | Lj) не зависит от Lj и совпадает с Р (90). С учетом этих замечаний на основании равенства (2.4Н) получаем Р (Е)о | С«) - Р-i (С«) Р (Со | Lj) Р90) pj = = Р (90) Р (Lj | С«), т. е. для I — 0 индуктивное предположение (2.96) справедливо, Предположим, что (2.96) справедливо для произвольного I, и найдем вид Р (Eji+1 | Ci+1). С этой целью воспользуемся уравнением (2.47). Входящие в это уравнение условные вероятности Р(Сг+1 | 9г+] П Lj), Р (9f+1| 9г f| L3) определяются соотношениями (2.45), (2.46) и в рассматриваемом частном случае превращаются в P(Ci |9(р Lj) = [(2л)’п|Яц|Г~ехр(-1||г{-Ря^ ,)^, Р (9i+119;Г!L}) = = [(2л)” | Qi,] 2 exp (— lki+i — dxit следовательно, первая условная вероятность не зависит от 9$, а вторая — от Lj: Р (Cj \ ^Г\Е]) = Р (С( | Lj), P (9г+1 | 9г П Lj) = = P (Qi+1 | Qi). (2.97)
Подстановка (2.96), (2.97) в (2.47) дает Р (Eji+1\Ci+1) = = Р (L} 10 Р (Ci+11 L}) P-i (Ci+11 C1) S P (6i+11 0{) P (0<). 9i По теореме о полной вероятности Р (9i+I | 0;) Р (0;) = ei = Р (0;+1), а с другой стороны, Р (Lj | Ci+1) = Р (Lj П Cin П Cl) P-1 (Ci+1| С1)Р-\(Р) = - P (Ct+1 I Lj) P (L, 1 Cl) p-1 (Ct+1 I C1), т. e. и для момента времени i + 1 Р (EJi+1 I C1+1) = P (0i+1) P (L, I Значит, предположение (2.96) верно для любого i. Продифференцировав крайние части уравнения (2.96) по dxt и неограниченно уменьшая dz1, находим Р (ъ, j | z1) = p (xt) P (Dj | z1), где p (xt) — плотность распределения вектора Xt, P (Dj ] z*)— апостериорная вероятность гипотезы Dj при условии наблюдения вектора zi, в которую превращается Р (Lj | С”) при неограниченном уменьшении dz1. Совместное оценивание Х,-у и Л; по критерию (2.43) превращается в данном случае в раздельное оценивание: выбирается из условия max р (х^), a Dv — из условия max Р (Dj |z*). xjv } Структурная схема рис. 2.1 распадается на две независимые части: рекуррентную и поисковую (рис. 2.3). Рекуррентно-поисковое оценивание гипотез вырождается в рассмотренный в § 2.1 алгоритм проверки статистических гипотез по критерию максимальной апостериорной вероятности. Однако постановка и решение задачи в данном случае имеют некоторые особенности. Если из общей исходной постановки (2.95) выделить лишь часть, связанную с распознаванием гипотез, то на основе проведенных рассуждений получим следующее. ’ В дискретные моменты времени i'= 0,1, . . ., N наблюдается векторная величина Zt — (Zir, . . ., Zim)7, связан-ная с проверяемыми гипотезами D соотношением Zt = Ft (D) + т]'ь
т. е. в аддитивном шуме наблюдается некоторая детерминированная функция, произвольным (но априори известным) образом зависящая от гипотезы D, имеющей место во время проведения наблюдений. Множество возможных гипотез конечно: G = {Dj, . . Dj, . . Шум г|; — нестационарный, центрированный; его кавариационная Рис. 2.3. Рекуррентная схема алгоритма проверки статистических гипотез. матрица М | = Rjfiiq. Требуется по проведен- ным наблюдениям zN = z0, . . z^ выбрать гипотезу Dv, имеющую наибольшую апостериорную вероятность P(Dv|zN) = maxP(P>|2IV). з Точное решение этой задачи определяется уравнениями (2.83)—(2.88), если в них подставить Hjt = 0, Qjt = Qt, Aji = At, Gj = G, m,j = т. Определим сначала е;-0, e^, i — 1, . . ., N. Предварительно найдем выражение для Г/г.
Согласно (2.84) в рассматриваемых условиях rjLt = «2Г1 - <?гЧ (г;? + лШг’Ж а из (2.87) вытекает, что 1\0 = G, т. е. не зависит от j. Значит, и для любого момента времени Г л не зависит от /. Поэтому при расчете функционалов можно принять е/0 = In (| R}0 I pja), ел = In | Bn |, i = 1, . . ., N. Кроме того, в соответствии с (2.72) 2уг = Вц, поэтому формулы для вычисления приобретают вид Iji+l — Iji + [zi+l — Д+1 (Д)] Д'1+l lzi+l — Д+1 (Д)] + + ln|7?ii+11, i = 0, ...,/V-l, (2.98) До = [z0 - Po (DtfB^ \za - Д (Д)] I- In (I Bjf>1 pj2). Процедура оптимального выбора гипотез сводится к вычислению рекуррентным образом в соответствии с (2.98) значений функционалов IjN и выбору в качестве решения такой гипотезы Dv, для которой IxN принимает наименьшее значение. К аналогичному алгоритму проверки статистических гипотез можно прийти и на основе результатов, изложенных в § 2.1, если воспользоваться критерием максимальной апостериорной вероятности гипотез и рассчитать функцию правдоподобия по формуле (2.34). Однако алгоритм, вытекающий из классической постановки теории статистических решений, не является рекуррентным. В нем предполагается, что значения функционалов рассчитываются только после того, как проведены все необходимые наблюдения. Рекуррентный способ вычисления значений функционалов Ijt в определенных обстоятельствах может оказаться благоприятным с точки зрения уменьшения потребного быстродействия ЦВМ. в) Частный случай III. Рекуррентно-поисковое оценивание в случае, когда уравнения движения и наблюдения нелинейно зависят от координат свободного движения. Рассмотрим частный случай — уравнения движения и наблюдения нелинейно зависят от части фазовых координат, совершающих свободное движение: Xi+1 = At (Уг) Xt + YiH = ФгД, z+l 19 Zt = Ht (Yt) Xt + Ft (Yt) + T).- (2.99) (2.100) (2.101)
т] i — нормальные, центрированные, взаимно не коррелированные дискретные «белые» шумы с ковариационными матрицами Qt и В(. Матрицы At (Yi),Ft (Yt) произвольным образом зависят от вектора координат свободного движения Yг. Начальное распределение вектора Хо нормально: р (Хо) (= N (т, G). Требуется на основании наблюдения вектора в дискретные моменты времени i = 0, 1, . ., N и на основе заданной плотности р (Yу) априорного распределения вектора Yнайти оптимальные оценки координат динамической системы и Yjy. Покажем, что рекуррентно-поисковое оценивание позволяет с любой степенью точности решить сформулированную задачу. Пусть вектор Yw = (YN1, . . Yns)t принадлежит некоторой области В евклидова пространства Rs (Yм (= В CZ 7?s), и предположим, что Y^ может принимать в В лишь конечное число возможных значений Yjn, j — 1, . I. В рассматриваемом частном случае гипотезами Dj являются возможные значения Y вектора Yw, вероятности гипотез Pj легко вычисляются по заданной плотности р (Yjv). Условие конечности числа возможных значений вектора Yn, являясь теоретическим ограничением, практически не вызывает каких-либо затруднений, так как всегда возможно выбрать множество В достаточно плотным. Кроме того, при необходимости можно осуществить предельный переход и избавиться от этого условия. По аналогии с [2.9] введем дискретную фундаментальную матрицу решений W (г, q) уравнения (2.100), которая определяется разностным уравнением Yi = W(i,q)Yg (2.102) и удовлетворяет условию W (i, i) = Е для любого i, (2.103) здесь Е — единичная матрица. Из соотношений (2.100), (2.102), (2.103) находим w (1, д) = i—1 П Oi+q-fc-i, i > q, k=q E, i = q, (2.104) e-i -i (П , i < q- , 's=i '
Траектория вектора Уц, соответствующего конечному значению Yn — Уjn, определяется соотношением У a = W (i, N) YjN. (2.105) Подстановка (2.105) в уравнения (2.99), (2.101) дает Хг+1 = A}tX( + Вг, Zi = + Fn + i = 0, 1,. . ., N, где = A[lF(i,JV)yjw], Яд = ^[Ж(г, N)YjN], Fn^Fi[W(i, N)Y)n]. (2.106) Задача оптимального оценивания составляющих вектора состояния X/у и Умсвелась к частному случаю рекуррентнопоискового оценивания, когда ковариационные матрицы Qi, Rt шумов Bi и г],, а также начальное распределение р (Хо) вектора Хй не зависят от гипотезы Dj. Следовательно, оптимальный алгоритм таков. Для каждого возможного значения Уjn вектора Ул моделируется дискретный фильтр Калмана по уравнениям И Xj i-|-i = At [И7 (i, N) Уду] Хц Kj i+it K; i+1 = Г; 1+1Я?+1 [W (i, Я) Уду] Aj j+i = zi+i — #i+1 [W (i + 1, N) Уду] Ai [W (i, N) Уду] x}i — -/?Н1[ИЧ* + 1,Я)УдуЬ rj}+1 = МД+1 + Я<т+1 [W (i + 1, N) yjN] R& x X Hi+1 [W(i + l,N)YjN], = <?r - Q^Ai [W (i, Я) Уду] Пд4т ЦТ (t, АГ) Уду] Qi1, Пд1 = Гд1 + 4 [Ж (1, N) y}N] Q^Ai [W (i, N)yjN], i = 0, 1, . . ., У, □ (2.107) которые решаются при начальных условиях И XjQ = т -f- AJO = zo - Яо [W (0, iV)Уду] m - Fo [W (0, ^) Уду], Xj0 = Гд>Яот [ИЧ0, N)Y}n]R^\ По = G-1 + яот [W (0, N) y}N] R^H0 [W(P,N)YiN]. □ (2.108)
Далее в соответствии с соотношениями I] г+1 — Iji + II А; г+1 ||!,-1 — | Ilj-t |, 2Ji+l - R?Hi [W (i, N) YjN] [W (i, tf) KjN] Ri\ i = O,...,N, (2.109) при начальном условии Z50 == IlAjollI-i —21npj (2.110) । Ъ'о рекуррентным образом рассчитываются значения функционалов 1}1. В поисковой части находится такое значение Yvn, которое минимизирует IJ{f. В качестве оптимальных оценок выбираются Y л = YxNi = %vn ‘ (2.111) Так решается задача оптимального оценивания и рассматриваемом частном случае. Теперь можно было бы отказаться от требования конечности множества В возможных значений вектора Yjj и предположить, что В совпадает со всем евклидовым пространством Rs. Тогда в формулах (2.107)—(2.110) произойдет замена переменной YjN на Y^. Кроме того, требование поиска экстремума функционала IiN по Y}N трансформируется в условие dl^ldYpi = 0, которое и определит точную оптимальную оценку Y^. Однако получающиеся итоговые нелинейные уравнения в частных производных являются чрезвычайно сложными, не допускают простого решения, и мы их выписывать не будем. § 2.4. Непрерывный аналог , рекуррентно-поискового оценивания В настоящем параграфе уравнения непрерывного аналога РПО будут получены путем установления предельного вида рекуррентно-поискового алгоритма оценивания при неограниченном уменьшении интервала между измерениями Д£. Подобный метод доказательства уже неоднократно использовался в теории оптимального оценивания. В частности, подобным образом Калман вывел уравнение оптц-
мальной фильтрации [2.10], а Медич получил алгоритм оптимального сглаживания [2.11]. Пусть на отрезке [£0, 71] производятся измерения в дискретные моменты времени tt с интервалом Дд так что 4? . „1 to ti ’tt— • • • tpi t+At • • • T * " Z 1 >- ff) 4 t-t • • • t i+At, • • • T Ls . to ti • • • t f+Ats • • • T ' Рис. 2.4. Дискретное разбиение интервала [0, У]. ti ~ t0 + iAt и Т = t0 + NAt (рис. 2.4, а). Рассмотрим частный случай РПО, когда матрица объекта имеет вид Ajt = Е + В} (ti) М, (2.112) здесь Е — единичная матрица размера п х га. Шум объекта предполагается равным = Ы wt, (2.113) где Wi — дискретный «белый» шум с условной ковариационной матрицей М | D}> 6i4; (2.114) тогда Qti = М Swl (tt). (2.115) Предполагаем также (2Л16> т. е. считаем, что статистические характеристики шума наблюдений не зависят от проверяемых гипотез Dj. Это является некоторым сужением постановки задачи по сравнению с РПО. Однако случай SriJ (£;), т. е. вариант, когда ковариационная матрицарпума наблюдений зависит от проверяемых гипотез, оказывается сущест
венно более сложным при осуществлении предельного перехода, и по этой причине мы его рассматривать не будем. Целесообразность выбранного вида основных матриц РПО выяснится в дальнейшем. Окажется, что именно такой вид матриц Ал, Qjt и В л позволяет осуществить предельный переход. Рассмотрим сначала уравнения для ковариационной матрицы (2.84). Преобразуем эти уравнения, воспользовавшись известным матричным тождеством (см. [2.4], стр. 109), справедливым для произвольных невырожденных матриц В, С, U: если В~г — С~1 — С~Ч) (U~l 4-4- D^C^D)-1 то В = С + DUD'1' и наоборот. Полагая сначала В = С = Qti, D — A jt, U = Тц, преобразуем два последних равенства системы (2.84) к виду = Qu + Ал Г;; (2.117) Далее, полагая В — ГД+г, С = МJi+1, D = Bji+1, U = ВД+1, на основе первого равенства системы (2.84) получим Iji+l — — Мji+1-^Ji+l i+1 4“ + ^Л+1^Л+1^Я+1) 1 Нji+iM ji+i- (2.118) Подставив (2.112), (2.115), (2.116) в (2.117) и (2.118), находим Г}(</ + At) — Yf(tt) = •-= At [Г, (tt) BJ (tt) 4- Bj (t,) Г; (tt) + Swj (^)J + + At3 Bj (tt) Г; (tt) B] (t>) - At { Г,- (tt) + + At [Гл (ts) Bj (tt) + Bj (tt) Y} (tt) + Swj (tt)] 4- + Аг2 Bj (tt) Yj (tt) B] (tt)} Hl (tt + At) <5n (tt +At) + + AtHj (tt + At) {Г, (tt) + At [Г/ (tt) B] (tt) + + Bj (tt) Y} (tt) + SWj (tt)] + + Af2 Bj (tt) Yj (tt) BJ (ff)} HTj (tt + At)> x X Hj (tt + At) {Г7 (tt) + 4- At [Г, (tt) Bl (tt) + Bj (ti) Yj (ti) 4- Swj (tt)] + 4- At2 Bj (tt) Yj (tt) Bj (tt)}. (2.119) Зафиксируем некоторый момент времени t, совпадающий с точкой tt начального разбиения Жо отрезка Цо, 7], и начнем мельчить разбиение отрезка [£0, Г] так, что интервал Ats s-ro разбиения Х3 равен 2~sAf (см. рис. 2.4, б, в),
причем выбранная зафиксированная точка t входит во все разбиения 3%, Хг, . . ., 5?8. Уравнение (2.119) остается справедливым для любого разбиения Хв, если в нем заменить At на At,. Разделив обе части (2.119) на At8, устремив Ata к нулю и учитывая непрерывность функций Hj (t), St] (t), получим = Гу (t) BJ (t) + B5 (t) Г, (t) + Swу (t) - - Гу (t) Hj (t) (t) (t) Гу (t). (2.120) Поскольку для произвольной точки отрезка [t0, Т] всегда можно выбрать начальное разбиение 5?0 таким, чтобы эта точка попала в разбиение 5%, то проведенные рассуждения и предельный переход можно осуществить для любой точки отрезка It0, У] и, следовательно, уравнение (2.120) справедливо для произвольной точки t ЕЕ [t0, Г]. Уравнение для начального условия Гу (t0) согласно (2.87) имеет вид г;1 (to) = GJ1 + HJ (to) AtS^1 (to) Hy (to), (2.121) и при At -> 0 получаем Гу (to) = Gj. (2.122) Обратимся теперь к уравнению для оптимальной оценки (2.83). Подстановка (2.112), (2.116) в (2.83) и несложные преобразования дают + + {z (у{ + Ду) _ Н . (у. _|_ Ду)[2? + Ду В. (у.)] (у.) __ — Fy(t< + At)}, (2.123) = Гу (ty + At) HJ (t{ + At) S? (ti + At). (2.124) Устремляя At к нулю и учитывая непрерывность функций Ну (t), Fj (t), (t), Гу (t), находим dx ,(t) ~ _ = By(t)Xy(t) + + Гу (t) HJ (t) S? (t) [z - Hy (t) iy (t) - Fy (t)]. (2.125)
Начальное условие для решения этого уравнения определяется соотношением (2.86), которое в пределе при Дг —> О обращается в (£0) = ТП], так как согласно (2.124) lim К} (ti) = 0 для любого i = 0, 1, . . ., N. Д<->0 Осталось найти предельный вид уравнения для функционалов lj (ti). Чтобы облегчить операцию предельного перехода, не меняя существа задачи, несколько изменим вид функционала IJt. Вместо 1ц будем рассматривать смещенные относительно 1ц функционалы определяемые следующими рекуррентными соотношениями: Лн+1 =-Ля II Ди+1 Н?-1 +еЛ4-1—eii+ii i = Q,,..,N -1. (2.126) Также зададим смещение и начальному условию (2.88) Ло = II Д.]0 II?.-! + е;0 — е10> (2.127) здесь 81г — значение величины 8;-; для первой гипотезы. Запишем в столбец соотношения (2.126), (2.127) для моментов времени i = 0, 1, . . ., N: = || Дд II?-1 + е}0 — 810, Ъ’о Л1 = ^}0 + II Д>1 ||у-1 + еД — е11» Tj N—l = Тj JV-2 + || Д; W-l II?,-1 + 8j N-1 — 8j N—l JjN = Л’ N—l + II Ддх ll?-l + &jN ~~ S1N. zjN Просуммировав левые и правые части этих уравнений и приравняв результаты суммирования, найдем N N N Т}N = 5 II Дд II?,-! + 3 8Д — 2j 8Ц* i=0 ^ji i=o i=0 Точно таким же способом можно показать, что основной функционал РПО равен N N ijN = 21II Дд ll?-i + 2 8д, i=0 i=O
т. е. N IjN = ?jN ~*Г Eli-i=0 Значит, функционалы TjN и Iотличаются на некоторую постоянную для всех проверяемых гипотез величину 2е1; и min Тдостигается па той же гипотезе, что и минимум з основного функционала На этом основании далее рассматриваем смещенные функционалы 1ц. Подставим в уравнения (2.85) для ел значения Qu и из (2.115), (2.116) и получим выражение разности I Af.S-wj (/) 11 + А«) 11 HJ1 (<) ] 1П ।11 п?1 । На основании правил вычисления определителя обратной матрицы и определителя произведения матриц находим 8j i+l — е1 <+1 = 1п I Af^ «.) OJ1 (^) ( (2.128) Умножив третье из равенств системы (2.84) слева на MSwj (tt) и воспользовавшись уравнениями (2.112), (2.115) для Ац и Qu, после алгебраических выкладок получим msw} (*i) п;1 (ti) = е + msw) (fOir;1 (ц + + В] (fa) (fa) 4- (fa) Bj («{) + MB} (Z{) 8$ (f{) B} (it)]. Введем обозначение f = swi(^[г;1 (;{) + в} (fa) s-}^) + s^(ti)Bj(ti) + + MBJ (ti)S^}(ti) В}(ti)l), тогда MSWj (ti) П/ (ti) = E + MF. Элементы матрицы F обозначим far, вычислим определ итель
матрицы Е + MF 1 Ai/н • • • At/in Д^21 1 "I Д^22 • • • Д^2п Д^/fll Д^п2 ‘ ' ^Чпп разложением по первой строке: | е + MF | = = (1 + ДОи) Fu ^tfizFl2 + . . . + ( l)n+1 AtflnFln. Поскольку в каждом из миноров F12, F13, . . Fln найдется хотя бы один столбец, все элементы которого имеют порядок Д£, то | Е + AtF | = (1 Н- Д//п) Fu + о (ДО, здесь о (ДО— бесконечно малая величина высшего порядка, чем At. Разлагая минор 1 Д</гг Д4/гз • • • Д^2п ,, Д£/зг 1 + Д*/з.Ч • • • Д1/„„ г 11 = ..........................®п Д^п2 Д^пз ' 1 Atfnn по первой строке на основании приведенных выше соображений имеем | Е -I- AtF | = (1 + ДОп) (1 + Дг/22) Fu,u + о (At), где 1 + Д1/33 . . . Fu,u = Д*/пЗ • ' ' 1 “Ь Продолжая процесс раскрытия определителя Flltll таким же способом, находим |£ + AtF | = (1 + ДОц) (1 + ДО22) . . . (1 + ktfnn) + + о (ДО = 1 + М Sp2? + о (ДО, здесь Sp F = у, fa — след матрицы F. Поэтому i—1 In I Е + AtF I = At SpF + о (ДО
И in | Mswj nj1 (ti) | = = At Sp {5wj (ti) [Г3-1 (ti) -f- Bj (ti) Swj (ti) 4“ + Swj (ti) Вj (ti) 4- MB] (ti) S^ (ti) Bj (/<)]} 4- о (M) = = At Sp {5wj(4)[Г/ (t{) 4- B] (tf) (t|) 4- 5>4(ti) Bj(ti)]} 4- 4-o (At). (2.129) Подстановка (2.129) в (2.128) дает = AtSpfSjoj^ir/^i) 4- В] (ti)Swj(ti) -\-Swj(ti)Bj(t{)]} — — At Sp {>Swi (t^ [141 (ti) B] (ti) (ti) 4- + (ti) Bt (ti)]} 4- о (At2). (2.130) Нетрудно убедиться самостоятельно, что Sp [5Ш}- (tj)B] (tt) X xSw)(ti)] = Sp Bj (tt), поэтому выражение (2.130) может быть упрощено: 83 i-j-i Sj i-|~i = At Sp [5wj (ti) Г j (ti) 4" 2iBj (if) — - swl (ti) ГГ1 (ti) - 2Bi (ti)] 4- о (At2). (2.131) Определим вид || A^+i l|2-i — другой составляющей 2ji+l функционала 7jt+1. В соответствии с третьим равенством системы (2.85) и (2.116) = At^1 (t{) - At2^1 (t<) Н} (ti) Г, (t|) H] (h) S^1 (h) = = MSj (tt) 4- о (At2), i == 0,1,..., N. (2.132) Значит, с учетом второго уравнения системы (2.83) и формулы (2.112) II Дя+1 l£-i = <2 (Ь 4- At) - Hj (ti + At)[E 4- MBj (h)] x 2;<+i X Xj(ti) - Fj(ti 4- At)}»[AtS^ (ti + M) +о (At2)] X x {z(ti 4- At) - Hj (ti 4- M)[E 4- MBj (tj)] x X x"j(ti) - Fj(ti 4- At)} = At {z(ti 4- At) - Hj(Ц 4- At) Xj (t4) -— Bj (ti 4" At))T 5г,1 (ti 4- At){z (t{ 4- At) — - Hj (tj 4- At) Xj (ti) - Fj (h 4- At)} 4- о (At2). (2.133)
Подставляя (2.131), (2.133) в (2.126) и заменяя ti на t, имеем + + At <Sp [5^ (0 г;1 (0 + 2Bj (0 - 5wl (О Г71 (t) - 22?х (0) + + {z (t 4 ДО - Hj(t + ДО 'xj (t) -Fj{t+ A0)T X X 5^ (t + ДО{г (t + ДО — Hj (t + ДО Xj (0 — - ^(« + ДО» + о(Д«2). Перенеся Tj(t) в левую часть равенства, поделив обе части возникающего уравнения на At и переходя к пределу при At -> 0, получим d/Jt) = [z (0 - Hj (0 Xj (0 - Fj (OF Sn1 (*)[* (0 - - Hj (0 х} (0 - Fj (01 + Sp [2Bj (0 + sWj (0 r;1 (oi - - Sp [2Bi (0 + swl (0 IT1 (01. (2.134) Уточним предельный вид начального условия Гю. Совместное рассмотрение (2.127), (2.88), (2.116), (2.132) показывает, что при At —► О I jo -> In -—-——. (2.135) Составляющая Sp [25t (0 + SW1 (t) Г?1 (01 в уравнении (2.134) не зависит от проверяемых гипотез Dj и определяет t некоторое общее для всех гипотез смещение j* Sp [2Z?i (0 + о + Swi (017\01 конечных значений функционалов Т} (Т). Следовательно, эту составляющую можно опустить и уравнение для Ij (t) можно представить в виде di. „ , HjTj - F-)1 S^1 (z - HjXj - Fj) + + 3р(2^+ад1). (2.136) На том же основании и начальное условие (2.135) можно заменить на более простое Г,о = 1пДи (2.137) р1
Надо заметить, что если начальное условие (2.135) согласовано с уравнением (2.136) по размерности, то этого нельзя сказать о начальном условии (2.137). Однако это не должно вызывать недоумение. Численные значения Gj можно подставлять в формулу (2.137) в любых единицах измерения, так как масштабный коэффициент к под знаком логарифма приводит лишь к смещению всех функционалов Tj (Т) на одинаковую величину In к, что несущественно с точки зрения отыскания гипотезы, минимизирующей Tj(T). Критерий оптимальности при неограниченном уменьшении At превращается в требование max р[х(Т), /|z?J, X (Т), Dj здесь zj„ означает наблюденную реализацию z (t) при t Е= elio, Л- Остановимся теперь на предельном виде уравнений движения и наблюдения, а также статистических характеристик возмущений. Подставив (2.112), (2.113) в уравнение (2.79), получим X (Г + At) = X (0 4- Bj (t) Ы X (t) + Atip (t), Z(t) = Hj(t)X(t) + F}(t) + r\(t). Перенося в (2.138) X (t) в левую часть равенства, разделив получающееся соотношение на At и переходя к пределу при At -> 0, имеем -^ = ^(t)X(t) + u;(O. Ковариационная матрица возмущения w (ti) имеет вид М 1Dj} = - Sig. (2.139) Конкретизируем вид ковариационной матрицы, рассматривая w (ti) как дискретную выборку некоторой непрерывной случайной функции w (t). Полагаем, что внутри интервала дискретности ковариационная матрица М (w(t) wT (т)| Dj} имеет вид, показанный на рис. 2.5, и определяется следующим аналитическим выражением: М (гр (t) иР (т) | Dj} = j At при ।1 TI < 2 ’ I 0 в противном случае. (2,140) (2.138)
1'Гз формулы (2.140) для дискретных моментов времени получаем соотношение (2.139). Кроме того, J М {to(t)(т) | Dj) dx — SWj(t). (2.141) —00 При устремлении At к нулю дисперсия возмущения неограниченно возрастает, но для любого интервала At сохраняет- «—•—т- ся условие (2.141). Следователь- sift) но, в пределе возмущение w (t) обращается в «белый» шум с ин- i тенсивностью Swj (t), имеющий -°2 °------------7°—*“ корреляционную функцию tft Иш {М (w (t) nF (т) | Dj)} = Рис. 2.5. Ковариацион- &1~*° „ , , ная матрица возмуще- = Swj (t) 6 (t — т), ния w (t). где 6 (t) — дельта-функция Дирака. Аналогичным образом можно показать, что Иш {М <г) (t) if (t) | Dj)} = Sn (t) 6 (t — t). A1-»O Доказанный в этом параграфе результат сформулируем в виде специальной теоремы, причем, чтобы придать окончательному результату более традиционную форму, введем следующее переобозначение величин: Bj (t), Tj(t), SwJ (t) и Sn(t) заменим соответственно на Aj (t), lj (t), Sxj (t) и Sz (t). Теорема 2.2. Пусть имеется конечное множество гипотез G — {Di, . . .,Dj,. . .,DJ и заданы априорные вероятности гипотез р} — Р (Dj). На интервале It0, У] наблюдается сигнал Z (t) = Hj (t) X (t) + Fj (t) + n (t), (2.142) зависящий от вектора состояния X (t) линейной динамической системы, описываемой уравнением ^^Aj(t)X(t) + w(t). (2.143) Матрицы объекта Aj(t) = A (D}, t), канала наблюдения Hj (t) = Н (Dj, t), Fj (t) = F (Dj, t), статистические xa-
рактеристики возмущения w (£) и начального распределения вектора состояния зависят от гипотезы, имеющей место на интервале наблюдения [io, 71]. Наблюдателю априори неизвестно, какая из гипотез выполняется. Случайные возмущения w (t), т] (i) — центрированные нормально распределенные «белые» шумы, их условные ковариационные матрицы равны М {w (t) w* (т) | Dj) = Sxj (t) d(t — т), (2.144) Af (t) if (r) [ Dj) = Sz (t) 6 (t - t), 1 M {w (t) if (t) | Dj) = 0 для У/. J Начальные условные распределения вектора X (to) нормальные: р [X (io) | Dj] е АГ (т„ Gj), ] = I, (2.146) где nij = т (Dj) и Gj = G (D 5) — условные математическое ожидание и ковариационная матрица распределения р [X (to) | Dj]. Матрицы Hj (t), F} (t), Sz (t) непрерывны no t. Тогда оптимальные в смысле максимума р [х (Т), j | zfj оценивание вектора состояния X (t) и выбор гипотезы D j могут быть произведены следующим образом. По соотношениям di. Aj(t)Xj(t) + Ч* Tj (i) Hj (t) Szl (t) [z (t) Hj (t) Xj (t) Fj (i)], Xj (to) = m.j, (2.147) ^^j(t)A](t) + Aj(t)rj(t)- - Г, (t) H] (t) S? (t) Hj (t) Tj (t) + Sxj (t), r3- (to) = Gj (2.148) для каждой из возможных гипотез Dj моделируется I непрерывных фильтров Калмана и путем интегрирования на интервале [i0, Т] уравнений di. = (z — Hjij — Fj)* S? (z—H }х} — Fj) + . I G-l + Sp (2Aj + ад1), lj (to) = In -ЦЬ (2.149) pj рассчитываются конечные значения функционалов Ij(T).
В качестве наиболее вероятной выбирается гипотеза Z)v, минимизирующая функционал I] (Г): Iv(T) =minlj(7’), з а оценка xv(T), выдаваемая соответствующим этой гипотезе непрерывным фильтром Калмана, является оптимальной оценкой вектора состояния X (Г). Представляется, что РПО и его непрерывный аналог помимо использования для синтеза оптимальных алгоритмов КЭНС, что будет продемонстрировано в главе VI, могут найти достаточно широкое применение и в других областях, таких как идентификация динамических систем, статистическая радиотехника, контроль динамических систем и т. п. Применение целесообразно там, где теоретическому рассмотрению подлежат как выбор некоторой гипотезы, так и одновременное формирование оптимальных оценок о состоянии динамической системы.
ГЛАВА III МАТЕМАТИЧЕСКИЕ МОДЕЛИ ГЕОФИЗИЧЕСКИХ ПОЛЕЙ и навигационных систем § 3.1. Обоснование статистического подхода в теории корреляционно-экстремальных навигационных систем В теории КЭНС так же, как и просто при исследовании геофизических полей, весьма удобным является использование статистического подхода. Это позволяет изучать некоторые средние, общие характеристики геофизических полей и оценивать точность КЭНС при их использовании в определенных географических районах. Отказ от статистического подхода оставил бы нам лишь возможность анализировать точность КЭНС при движении по конкретным траекториям. Однако нет никакого основания точностные характеристики, полученные для одной траектории движения, распространять на случаи движения по другим траекториям. В этом состоит практическое неудобство использования детерминированного подхода. Само обоснование статистического подхода представляет некоторую трудность, если учесть, что реальные геофизические поля являются детерминированными функциями h (х*, у*, Н) пространственных координат х*, у*, Н. В настоящем параграфе в целях упрощения мы рассмотрим более простой вариант, когда поле /Г зависит только от горизонтальных координат х*, у* и не зависит от высоты полета Н. Такая ситуация имеет место при использовании поверхностных полей, а также при использовании пространственных полей в случае, когда изменения высоты полета несущественны. Даже в работах, специально посвященных статистиче-скому'анализу геофизических полей (см., например, [3.1],
13.2]), обоснование статистического подхода, строго говоря, не дается, т. е. не указывается, как математически вводится случайность в рассматриваемую задачу. По-видимому, обоснование статистического подхода должно определяться дальнейшим использованием рассчитываемых на его основе исходных статистических характеристик геофизических полей. С этой точки зрения ситуация в теории КЭНС относительно простая. Если одной из задач такой теории полагать выяснение средней точности КЭНС при движении по некоторому множеству траекторий, то случайность целесообразно вводить путем задания возможных траекторий движения и вероятностей движения по этим траекториям. Итак, исходное поле X (х*, у*) является детерминированным, а траектории движения Т* (t) — случайными. Рис. 3.1. Вид произвольных траекторий движения в исходной системе координат х*()*у*. Под векторной величиной Т* (/) понимается совокупность х* (t), У* (i) (рис. 3.1). Обычно задается конечное множество траекторий движения {Г* (t)}, i = 1, 2, . . ., q, и вероятности р, событий Н,, состоящих в том, что движение совершается по траектории Т* (t). Любые два события Hi, Нj при г =# / предполагаются независимыми. По условию нормировки i =-1. i=l
Как в этом случае перейти от детерминированного исходного поля h (х*, у*) к случайному полю? Рассмотрим лишь случай равномерного прямолинейного движения, когда перемещение движущегося объекта по любой возможной траектории совершается с одинаковой скоростью (рис. 3.2). Наряду с исходной системой координат х*О*у* введем системы координатах/)^, связанные Рис. 3.2. Вид равномерных прямолинейных траекторий движения в исходной системе координат х*О*р*. с траекториями движения Т* (t) следующим образом; центры этих систем Of поместим в начальные точки траекторий Т* (t), оси Xj совместим с положением вектора скорости движения, оси yi направим перпендикулярно осям xt так, чтобы движение от xt к происходило по кратчайшему направлению против часовой стрелки, как показано на рис. 3.1. ” В качестве реализаций ht (х, у) случайного поля h (х, у) рассмотрим линейные преобразования исходного детерминированного поля h (х*, у*), получающиеся заменой переменных: х* = xOj 4- х cosjcpj — у sin <pt, У* = У», + х sin q>i + у cos <pt, т. e. будем считать hi {x, y) = h (xol 4- x cos <p* — у simpt; yoi 4- x sin q>{ 4- у cos'q>,),' и припишем этой реализации вероятность pi рассматриваемой траектории движения т? («).
В новой системе координат хОу все траектории начинаются в начале координат (рис. 3.3) и уравнения этих траекторий имеют вид xt (t) = [х* (t) — XoJ cosipi + [у* (Z) — pui] siiiip,, Ut (0 = — (0 — sin <рг + [y* (Z) — t/oil cos <Pi, причем i-я траектория Tt (Z) = (xj (Z), yi (Z)) обладает вероятностью pt. Если через обозначить индикатор события Ht, т. е. такую функцию, которая равна 1, если событие произошло, и нулю в противном случае, то случайное поле Рис. 3.3. Вид равномерных прямолинейных траекторий движения в преобразованной системе коорднна г хОу. h (х, у) связано с индикаторами Xi и со своими реализациями ht (х, у) следующим образом: я h (х, ?/) = 3 /Л (-Л .'/), i-1 а траектория движения Т (i) определяется как T(t) = SxiW (3.1) Поскольку все исходные траектории Т* (Z) могут быть получены из какой-то одной траектории Та (Z) путем переноса начала координат и поворота координатных осей, то все преобразованные траектории Tt (t) в новой системе координат хОу совпадают с траекторией Тп (Z). Поэтому я T(t) = T„(t) з Xi-
Ч Так как сумма индикаторов Fi Xi полной системы несов-1=1 местных событий равна 1, то Т (t) = То (Z) и, следовательно, траектория движения Т (Z) является детерминированной. От исходной постановки задачи, когда случайной была траектория движения, а детерминированным — поле h (х*, у*), мы пришли к эквивалентной задаче, в которой траектория движения детерминирована, а поле h (х, у)— случайно. Легко найти математическое ожидание mlt (х, у) и корреляционную функцию R^ (Ти Т2) случайного поля h (х, у): Я Mh (х, У) = м {h (х, у)} - 2 рД (х, у) = т=1 Я ~ = 3 м (*oi + X cos tpi — у sin ipi, </oi + z Sin (pi. + y cos cp,), 1=1 (3.2) Я Rhh (?’i, Тг) = M {h (7\) h (П)) - 2 Pihi {T^hi (T2) = i=l Я _ = S Pih (xoi -f- Xi cos (pi— yt sin (p;, yoi-|- sin yx cos (p;) x i = l X h (Xoi + ^2 cos ф; — </2 sin cp,-, t/oi 4- x2 sin (pi + z/2 cos <р£). (3.3) Здесь M — символ операции математического ожидания, Т = (х, у). Помимо корреляционной функции можно рассматривать также ковариационную функцию Khit (Tt, Тг) поля h(x, у), связанную с Rhil (Tit Т2) зависимостью КД (Л. = Rhh (Л> Тг) — mh (Тх) mh (Т2). В случае центрированного поля понятия корреляционной и ковариационной функций поля совпадают. Подобное задание случайного поля h (х, у) на основании априорных вероятностей pt траекторий движения 7* (Z) позволяет получить исчерпывающие статистические характеристики этого поля. Зафиксируем координаты Тг, Т2, . . ., Тц и числа вх, а2, . . ., ак и найдем функцию распределения
F(alt аг, . . ак), равную вероятности события Л Тг Тк {h (^1) а1> (^г) \ а2» Л (Тк) <С а*}- Выберем те реализации hit (х, у), j = 1,...,тп,для которых ^1/ (^1) al> htj(Tа) а2> • • •> (^а) ак, и пусть Ht., / = 1, . т,— события, состоящие в том, что происходит движение по траектории Т* (t) и имеет место реализация hij (х, у). Поскольку события Hij несовместимы, то событие {Л (Т х) <? alt h (Г2) < ®2» • • •» Л (Тк) в/г} m равно U Hi и j=i m F (ак, а2,.. ., ак) = pif (3.4) Тх Тг Тк где Pij — вероятность траектории Tt. (t). Иногда, как это будет показано ниже, достаточно знать математическое ожидание mh (х, у) и взаимно корреляционную функцию Rlth (Тх, Тг), определяемые (3.2)и (3.3). Закон распределения, математическое ожидание и корреляционная функция поля, рассчитанные по формулам (3.2) — (3.4), однозначно определяются исходным полем Л(х*, у*), множеством траекторий Т* (t) и распределением вероятностей на этом множестве. Если множество траекторий движения меняется или на тех же траекториях задается новое распределение вероятностей, то математическое ожидание, корреляционная функция и закон распределения случайного поля также меняются. В качестве частного случая избранная постановка вопроса охватывает движение по одной-един-ственной траектории. При этом корреляционная функция поля тождественно равна нулю, а вся информация о поле содержится в математическом ожидании mh (х, у). Рассмотрим два частных случая задания семейства траекторий движения и расчета соответствующих им статистических характеристик навигационных полей. а) Пусть все траектории движения равновероятны (pt — i/q, t = 1, . . ., д) и расположены вдоль одной пря- 5 А. А. Красовский
мой, а начальные точки траекторий сдвинуты на расстояние Л1 (рис. 3.4), так что xOt = (i —1) AZ, {/о, = 0, «р, — 0. Тогда согласно (3.2), (3.3) mh(x,y) = -J-^A[(i — 1)AZ +«,?/], (3.5) i=i Z?hh Сч» 3/1» xi + Д«> У1 + A«) = = -L^fe[(i _ 1)Д/4-г1,yi]h[(i—1)AZ + j-i+Ax’-yi+Avl, i=l (3.6) в этой записи введены обозначения хг = + Дж, у2 = = У1 + Ди- Рис. 3.4. Случай, когда траектории движения расположены вдоль одной прямой. Предположим, что поле h (х, у) стационарно и число q выбрано достаточно большим для проявления стационарности, тогда математическое ожидание поля mh (х, у) не зависит от х, у, а корреляционная функция поля зависит только от сдвигов Дж, Ду и не зависит от xly yv Положив на этом основании в (3.5), (3.6) х — у = = = У1 = 0, найдем Q mft(0,0) =^-^A((i-l) AZ,O], (0, 0; Дх, Ди)— = v ГЛ1(/ _ 1} д/*01 - *)д/+д- д«]-i=l Часто при проведении теоретических оценок точности КЭНС рассматривается одномерный вариант системы, т. е.
предполагается, что боковые отклонения у от траектории движения тождественно равны нулю. В этом случае для оценки точности требуется знать лишь одно сечение пространственной корреляционной функции. Необходимые формулы принимают вид ч mh - (3.7) i-1 ЯЛЛ(Д) A[(i — 1)AZJ AIG — 1)AZ + AJ. (3.8) »=i В (3.7), (3.8) введены сокращенные обозначения: h (х, 0) = h (х), mh (0, 0) = mh, Rhn (0, 0; Дх, 0) = Rhh (Д). Формулы (3.7), (3.8) полностью совпадают с теми зависимостями, по которым обычно рассчитывают статистические характеристики навигационных полей. б) Пусть все траектории движения равновероятны и представляют собой параллельные линии, отстоящие друг Рис. 3.5. Случай, когда траектории движения параллельны друг другу. от друга на расстоянии Д/ (рис. 3.5), так что х0{ = 0, yOi = = (i —1) Д.1, q)j = 0. Тогда У) = ~ (i — 1) Д/]
И Ялл (-Г1, ?! Г Дх’ У1 -I- ДУ) = <1 = -уХ, Дг ’* У1^11л +Лл’ — + 'Z1 *'Лм1- i=l Предположив стационарность поля и рассмотрев одномерный вариант, находим ч т„ = ДИ, (3.9) i-1 <7 /?hh(A) = У,h [0, (i - 1) М] -h [A, (i — 1) А/]. (3.10 i=l Полученные расчетные формулы (3.7)—(3.10) могут быть) использованы для предварительной обработки информации о навигационных полях. Рассчитанные, таким образом, статистические характеристики описывают не один какой-то маршрут, а целый район. Если существует необходимость более тщательного учета особенностей поля в районе навигации, то не следует делать предположения о стационарности поля. Специальным выбором параметров q и AZ необходимо добиться, чтобы математическое ожидание поля nih (х, у) было постоянным или изменялось плавно; тогда основная информация о свойствах поля будет содержаться в корреляционной функции. Некоторые рекомендации по выбору параметров q и AZ в подобных случаях можно найти, например, в [3.3, 3.4}. § 3.2. Математические модели пространственных полей Распределения поверхностных полей не подчиняются каким-либо строгим математическим уравнениям и в этом смысле не существуют математические модели поверхностных полей. Не существует также по самой сути вопроса и проблемы пересчета поверхностных полей на высоту. Задача исследования поверхностных полей сводится к
картографированию этих полей и изучению их статистических характеристик: корреляционных функций, спектральных плотностей, дисперсий, радиусов корреляции, градиентов нестационарности и т. п. При этом могут использоваться сведения о поверхностных полях, уже накопленные в смежных областях. Так, например, некоторые сведения о рельефе земной поверхности на территории СССР можно найти в [3.5—3.7]. Иначе обстоит дело с магнитным и гравитационным пространственными полями в силу того определяющего факта, что распределения этих полей подчиняются уравнению Лапласа. Существующее на поверхности Земли и в приземном пространстве магнитное поле можно рассматривать как сумму постоянного поля и наложенного на него переменного поля, причем уровень переменного поля на несколько порядков меньше уровня постоянного [3.8]. Переменное магнитное поле порождается процессами, протекающими вне Земли, и иногда его называют вариациями магнитного поля Земли (МПЗ). С точки зрения осуществления навигации по МПЗ вариации являются неизбежными мешающими факторами. Полезной информацией является постоянное магнитное поле. Постоянное МПЗ вызывается источниками, которые находятся внутри земного шара, и поэтому имеет потенциальный характер. Для любой точки X, Y, Z среды с нулевой намагниченностью (например, вакуум или воздух) потенциал UM постоянного МПЗ подчиняется уравнению Лапласа ЭЧГ„ d*U„ Mi Mi м ~дХ*~ + “dZ5 Ускорение силы тяжести gt слагается из гравитационного и центробежного ускорений. Поле силы тяжести также является потенциальным, и его потенциал Жт определяется как сумма Wt = Ur + Уц (3.11) гравитационного потенциала UT и потенциала центробежных сил Уц. Если ввести связанную с Землей прямоугольную систему координат X, Y, Z, причем ось Z направить по оси вращения Земли, оси X, Y расположить в экваториальной плоскости так, чтобы ось X лежала в плоскости
нулевого мери.иана, то (О® Иц =-f-(X2 + r2), (3.12) здесь (о3 — угловая скорость вращения Земли. Из двух функций, входящих в выражение потенциала силы тяжести (3.11), вторая, как это следует из (3.12), является простой известной непрерывной функцией и не требует специального рассмотрения. Гравитационный потенциал, или потенциал притяжения, зависит от распределения элементарных масс Земли и подчиняется (для внешнего пространства) уравнению Лапласа 13.9] wr , дюг , дЧГг дХ2 "I дУ2 ' д/2 Итак, изложенное выше показывает, что многие вопросы, связанные с исследованием пространственных полей, сводятся к рассмотрению уравнения Лапласа д2и , д»и . д*и дХ2 дУ2 + az« ~ 0 (3.13) и определяются свойствами решения этого уравнения. Заметим также, что проекции напряженности постоянного МПЗ и гравитационного ускорения на произвольное направление s, определяемые как частные производные потенциальной функции dU/ds по этому направлению, тоже подчиняются уравнению Лапласа (3.13), в чем легко убедиться, продифференцировав (3.13) по s и поменяв порядок дифференцирования у частных производных I dU\ ./dU\ / dU \ в2(-аг) , п дХ2 + дУ2 + dZ2 “ В противоположность этому свойству проекций модуль напряженности постоянного МПЗ или ускорения силы тяжести уравнению (3.13), строго говоря, не удовлетворяет. а) Разложение пространственных нолей в ряды сферических функций. От прямоугольных координат X, У, Z перейдем к сферическим координатам г, 0, А (рис. 3.6), где г — радиус-вектор, 0 — дополнение сферической широты; А — долгота: X = г sin 0 cos А, У = г sin 0 sin A, Z = г cos 0. (3.14)
Уравнение Лапласа в сферических координатах записывается следующим образом [3.10]: . &U „ ди 1 д j . о ди \ , 1 дЧ/ dr* + 2 dr + sin 0 дв (sln 6 00 ) + sin2 0 'ЗХ2' “ °- (3.15) Потенциалы пространственных полей можно представить в виде ОО п и = R у1| (-у-)"*1 У*, (gn COS тк + hn sin т X) Р™ (cos 0), n=0 m—О (3.16) где Рп (cos 9) — присоединенные полиномы Лежандра, носящие также название сферических функций, g" и Рис. 3.6. Прямоугольные и сферическая системы координат. hn — коэффициенты разложения, R — некоторая постоянная (при сферической модели Земли — ее радиус). Конкретизация на основе физических соображений выражения (3.16) применительно к постоянному МПЗ дает следующее. При больших удалениях (г оо) постоянное МПЗ ведет себя как поле диполя, потенциал которого обратно пропорционален г2. Поэтому коэффициент g°t должен быть равен нулю [3.10] и потенциал Uv
постоянного МПЗ обычно описывается выражением UM = R У, (gn cos тк+ sin mk) P„ (cos 0). n=i m=o (3.17) Вывод о том, что для магнитного поля коэффициент go = 0, может быть получен и математически, если найти выражения, связывающие значения этих коэффициентов с распределением элементарных магнитных масс (элементарных диполей) внутри тела Земли. Условие gS = 0 обозначает, что сумма всех элементарных магнитных зарядов равна нулю. Конкретизируем теперь вид гравитационного потенциала (и потенциала силы тяжести). Здесь из физических соображений, связанных с интегральным характером распределения элементарных масс Земли, вытекает, что коэффициент g° = 0. Проводя несложные преобразования, учитывая соотношения (3.11), (3.12), заменяя cos 0 на sin ф и обозначая gm hm е' сп,п = Ц-, я2^ = /м3, = go So получим для потенциала силы тяжести следующее оконча- тельное выражение [3.11, 3.12]: WT - {1 + £ Jn (А)" рп (sin Ф) + п=2 оо п + У, (у-)’1 У, (спт COS mk -I- Snm sin тк) Р„ (sin ф)| + П=1 т=1 н----2~ cos2 ф, (3.18) где / — гравитационная постоянная, Ма — масса Земли, Ф — географическая широта, /п, Cnm, Snm — динамические параметры, характеризующие гравитационное поле и фигуру Земли. Прямоугольные проекции Я\, Я<₽, Нг напряженности МПЗ и составляющие gT>., gT<p, gTr ускорения силы тяжести
могут быть найдены дифференцированием потенциальных функций UM и WT по осям выбранной ортогональной системы координат. Обычно для этих целей вводится связанная с изучаемой точкой О геоцентрическая система координат ех, ег, оси которой ориентированы следующим образом: ось — по касательной к меридиану, положительно к северу, ось — по касательной к параллели, положительно к востоку, ось ег — радиально от центра сферы, положительно вверх (см. рис. 3.6). Элементарные смещения точки О по этим осям равны de<f = — г dQ, de^ = г sin Odl, der = dr. Следовательно, составляющие напряженности МПЗ определяются формулами дим _ 1 эи„ Г <^м 1 де^ г sin 0 дК Аналогично находятся и проекции ускорения силы тяжести. Представление пространственных полей рядами сферических функций целесообразно лишь для высот не менее нескольких сотен километров. На меньших высотах с помощью этих рядов можно представить лишь очень сглаженное поле, не отражающее даже весьма значительных по протяженности региональных аномалий. Уже при учете сравнительно крупных аномалий, имеющих протяженность порядка ста километров, необходимо развивать ряды до п = 350—400, т. е. сохранять в них более ста тысяч членов [3.13]. Однако использование небольшого числа первых членов сферического ряда оказывается полезным при выделении аномальных полей из полных пространственных полей. б) Методика пересчета пространственных полей на высоту. Задача пересчета пространственных полей на высоту Н может возникнуть, в частности, при составлении высотных карт этих полей. Как уже отмечалось выше, использование для этих целей разложения пространственных
полей по полиномам Лежандра практически невозможно. Распространенным является представление решений уравнения Лапласа с помощью интегралов Пуассона. Известно [3.14, 3.15|, что решение задачи Дирихле для сферы, когда задано распределение Un на сфере (на поверхности Земли} и необходимо найти значения потенциала во внешней по отношению к сфере точке О, определяется следующим интегралом Пуассона: Р-20» я где г =/? + //, р — расстояние от точки О до произвольной точки сферы, интегрирование производится по всей поверхности сферы S. Хотя зависимость (3.20) является точным решением уравнения Лапласа для сферической Земли, использование равенства (3.20) не вполне удобно, так как требует знания однородной информации о распределении пространственного поля по всей поверхности Земли и, кроме того, необходимо проведение чрезвычайно трудоемких вычислений. С другой стороны, нет никакой необходимости в использовании строгого соотношения (3.20). При пересчете пространственных полей на высоты в несколько километров можно пренебречь кривизной Земли и искать решение уравнения Лапласа для плоской задачи Дирихле, полагая, что задано распределение потенциала U (х, у, 0) на поверхности плоской Земли и необходимо найти значения потенциала U (х, у, Н) на высоте Н. Решение этой задачи определяется интегралом Пуассона для плоскости оо оо U(x,y,H) = -S— V ? -----------------------— d£dr]. 2я JL J к» - *)* + (У ~ П)’ + /г (3.21) Практически вместо интегрирования в бесконечных пределах производится интегрирование па интервале [— а, а], причем вполне приемлемая точность достигается, если а ЮН. При пересчете полей на высоты от несколько десятков до нескольких сотен километров уже нельзя пользоваться зависимостью (3.21), так как точность этого соотношения
становится неудовлетворительной. В этих условиях возможно применение комбинированного подхода, предложенного в [3.16]. Поле на высоте Н разбивается на нормальную иОа и аномальную ?7.1К составляющие U (х, у, Н) = Ua (х, у, Н) + U.A (х, у, Н). (3.22) Нормальную составляющую, если существуют достаточно качественные данные, можно сколь угодно точно представить с помощью отрезка ряда (3.16): U0(x, у, Н) = ' 11 = R у1, ( tf^/zjn+1 У, (gn COS т к + hn sin тк) Р™ (cos 6). п =0 m - !) (3.23) Имеются рекомендации выбирать N равным 6 или 9 [3.17, 3.18]. По формуле(3.23) можно рассчитать значения нормального поля на любую высоту И. Поле U0 (х, у, Н) содержит только самые общие черты пространственного поля, не включающие аномальных особенностей. Оставшуюся аномальную часть поля можно представить в виде (3.21): UAK, П, 0) --------- ----ТГ <4 (3.24) причем Uа (х, у, 0) = U (х, у, 0) — Vo (%, у, 0), где U (х, у, 0) — наземная карта поля. В соответствии с (3.23) Uо (х,у,0) -N п = R 3 5*i (g™cosmX л-A™sin mA,) P”(cosO). (3.25) n=o В работе [3.16] показана высокая точность подобного способа пересчета. в) Определение зависимости структуры аномальных пространственных нолей от высоты. Исходя только из того факта, что аномальные пространственные поля подчиняются уравнению Лапласа, можно вывести совершенно строгую зависимость структуры этих полей от высоты. Воспользуемся представлением (3.24) и найдем выражение кор
реляционной функции 7?гн аномального пространственного поля на высоте Н: RuH (*i, а-2, у2) = М (Ua (*!, yi, Н) ия (хг, уг, Н)> = - м / //2 ? ? Пя 111 ’0) Ua (^2’г‘2’0) х \ 4л2 Д ♦ • • ((Х1 _ 51)» + (?/1 _ Л1)2+ /Z2J>/3 Х , ^1 rf01 Па\ /□ 9КХ [(*2 - Ва)2 + (V» - Па)2+ H2J Меняя местами операции интегрирования и математического ожидания, получим RuH (-*!> !/v Уг) = _ н* С '? Hi-Bz, Па) W A ‘ " A [(Х* “ “ ’-,)8 + H2J,/I > х _________^.<011 ^2^2________ (3 21) |(Х2-^)2 + (?/2-П2)2+ Д2Г2 ’ " Поскольку мы рассматриваем только мелкоструктурные аномальные составляющие пространственных полей, то будем предполагать распределение аномального поля на поверхности Земли стационарным, т. е. положим Rr, (Bi, Пр ^2> Пг) = Ru, (11 — В». П1 — Па)- (3-28) Подставляя (3.28) в (3.27) и вводя преобразование переменных Bi = В + £», П1 = П + Па, Ва = ^2 — В', Па = У — П'> приходим к соотношению Кин(.ХЪУ1,Х1,у2) = - н* V С _______________________Д17.(Е, п)________________ _ 4л2 A A[(xi - *2+*' - *>2+ <»* - у» -1- ч' -п)2! "2is 2 (3 29) (В'2 + п'2+ Д2)л Из формулы (3.29) видно, что аномальные пространственные поля и на высоте Н остаются стационарными, так как их корреляционные функции зависят от разностей координат. Перепишем (3.29), используя обозначения
Дх = хх — х2, Ди = г/j — уг-. ^U}{ (Дх« Ду) _ Н2 F С ________________________________дг/о (?.П)____________________ /,д2 4, -1 f(\ -I - & -I- и' - »1)2 Я2]"7’ r/E, <?i] г/^' <7т]' (V2 1|'8 Z/2)*'2 Для дальнейших преобразований введем в рассмотрение спектральные плотности аномальных пространственных полей. Распространение теории преобразований Фурье на многомерный случай излагается в [3.19], где, в частности, показано, что для двумерных функций справедлива следующая пара преобразований Фурье: ОО 09 1 (* Sf(Qx, Q„) \ \ F (.г, у) е-1'"лх+ау‘1} (Irdy, (3.31) —оо —ОС /•’(т,//) -4- J jj^(«x,Qw)ei(S«x+av''’dQ.vdQv. (3.32) Первое из этих соотношений является определением преобразования Фурье, а справедливость второго (обратного преобразования) доказывается в [3.19]. Найдем спектральную плотность SuH (Qx, 0|;) для корреляционной функции RuH (Дх, Д,;). По определению (3.31) -%- $ Jj НИ ЛГГо(₽, п) [(Дх -I- К' - £)2 4- (Д„ -Ь П' -- П)2 -! Обозначая х = Дх 4- у' = Д(, + т/ — ц, проводя еще некоторые искусственные преобразования и меняя
порядок интегрирования, приходим к равенству оо оо 5t/H(Qx,Qv)= —00 —оо оо ОО -i(Q„x'+O1.y/) SC е у t j , J (z'2 + у'2 + №),/г dx dy —СО — ® -i(2^+QT|') —-------;-------5J- d% dr]'. (V + И' + Я2) Л (3.34) В (3.20) показано, что —О© —оо e-i(Kx5'+Q^') (Е/г + п-2 4- №)’/« 2л -я V я® +я2 ~Н~е поэтому а / 2 2 Su н (Йх, Qv) = е-2Н Y +я* Su, (Q„ Qa). (3.35) где SuA^Vy) = 4г И —со —ос (3.36) — спектральная плотность аномального пространственного поля на поверхности Земли. Уравнение (3.35) выражает общий закон преобразования спектральных плотностей стационарных случайных полей, подчиняющихся уравнению Лапласа. На основании (3.35) можно вывести соответствующие закономерности во временной области. С этой целью воспользуемся известным понятием радиуса корреляции р центрированного стационарного случайного процесса h (х), под которым понимается величина J R (Д) 4Д р - -"4(0)— ’ <3-37) где R (Д) — корреляционная функция процесса h (х). Радиус корреляции является некоторой обобщенной характеристикой спектральных свойств случайного процесса:
(3.39) чем меньше р, тем более высокочастотным является случайный процесс. При исследовании двумерных случайных полей h (х, у) под радиусами корреляции поля рх, р„ вдоль осей х, у будем понимать радиусы корреляции его одномерных сечений h (х, 0) и А (0, у): сх? оо рМ1(Дх,оидя Рх 0) ’ = я,,„(0,0) • (3-38) Наряду с этим введем в рассмотрение также понятие площади корреляции F: <х> оо р = _®_2_________________ я„л(0,0) Выше отмечалось, что уравнению (3.13), а следовательно, и выведенному на его основе равенству (3.35) подчиняются как потенциальные функции пространственных полей U, так и сами составляющие пространственных полей h (х, у), являющиеся частными производными от потенциала. Поэтому как частный случай (3.35) при = Qy =0 с учетом (3.31) получим Q0 СО оо оо J J 7?,lhH (Ах, Ay)dAx dAw J J Hhh0(Ax,Ay)dA.vdAv, — CO —OO —CO —OO (3-40) или, приняв во внимание определение площади корреляции, Рн<$н, (3.41) где (Дх, АД OhH = RhhH (0,0) и FH — корреляционная функция, дисперсия и площадь корреляции аномального пространственного поля на высоте Н. Аппроксимируем реальную корреляционную функцию аномального пространственного поля на поверхности Земли функцией вида /?Л/)О(ДХ, Ду) = al exp [-а2 (Д’+ Д’)1. (3.42) Проводя интегрирование в соответствии с равенствами
(3.38), (3.39) получим Рх == Pv = Т ’ <3-43) Ро = -5- • (3.44) Следовательно, радиусы поля по направлениям хну совпадают и поле обладает свойством изотропности. Обозначим этот общий радиус корреляции р0, тогда Fo = 4р®, т. е. для изотропного поля площадь корреляции пропорциональна квадрату радиуса корреляции. Эта закономерность проявляется и для других высот. Определим спектральную плотность поля на поверхности Земли. Подставляя (3.42) в (3.36) и вводя преобразование переменных | = Д со» <р, т) = Д »in ф, после необходимых выкладок приходим к соотношению S,O(QX, <>„)== - о?„ jj Де-«*‘ [-^- J e-Ufa«00S ”+nv sl"4,1 йф] ЙД. (3.45) о —л В формуле (3.45) внутренний интеграл легко преобразуется к виду я _L_ С e-iAnsinejA 2л J —я что является определением функции Бесселя 70 первого рода нулевого порядка, поэтому Sh. (йя, Й„) = ot J (ДО) ЙД, (3.46) где Й = Кй£ + Q*. Интегрирование соотношения (3.46) выполнено в [3.16], где получен результат = • (3.47) В соответствии с общим законом (3.35) преобразования
спектральных плотностей для произвольной высоты Н находим ShH (£)д, О,) = е~~ +2Н“) . (3.48) Определим корреляционную функцию поля для произвольной высоты Н. С этой целью вычислим обратное преобразование (3.32). Проделав те же математические выкладки, которые были выполнены при выводе (3.46), получим Khh ц (Дх, Д«) =; - $ ехР [- (-S' + 27/Q)] I*№)£ldQ, (3.49) О здесь Д = к Дд + Д®> Отсюда °hH — 2а2 J О и согласно [3.16] = <$, {1—2// [1- Ф (2а//)]}, (3.50) где Ф (z) — функция Лапласа. При 2а// 1 (чему эквивалентно условие Н р0) и формула (3.50) превращается в равенство о, =—----------= (3-51) н 2УТаН У2л ’ Подставляя (3.44), (3.51) в (3.41), находим Поскольку/ипропорциональнор’н, торьн пропорционально Н. Следовательно, среднеквадратическое отклонение аномального пространственного поля измепяется обратно пропорционально высоте полета, а радиус корреляции поля
пропорционален высоте. Эти выводы получены для конкретного вида (3.42) корреляционной функции поля у поверхности Земли. В работе (3.16] показано, что они сохраняют свою силу и для других типов корреляционных функций. § 3.3. Математические модели ошибок инерциальных систем Из всего существующего многообразия схем построения инерциальных систем (ИС) в настоящем параграфе будут рассмотрены лишь платформенные замкнутые ИС, в которых осуществляется шулеровская коррекция. Платформы Рис. 3.7. Гиростабилизированная платформа. таких ИС стабилизируются обычно с помощью трех устанавливаемых на них двухстепенных гироскопов (рис. 3.7). Гироплатформа имеет три оси вращения i], £ и вдоль этих осей ориентируются оси чувствительности двух
горизонтальных Л;, Лп и одного вертикального Л^ акселерометров. Соответствующее интегрирование сигналов акселерометров в вычислителе ИС позволяет определить скорость и положение движущегося объекта. Кроме того, на основании интегрирования сигналов горизонтальных акселерометров вырабатываются сигналы программного поворота гироплатформы, которые подаются на коррекционные моторы М^, М,}, осуществляющие управляемый разворот гироплатформы вокруг осей £ и т). Таким образом происходит отслеживание местной вертикали и гироплатформа все время находится в горизонтальном положении. Вычислители ИС подобного типа могут работать в различных системах координат: географической, ортодромической или свободной в азимуте. В первых двух вариантах подаются сигналы программного разворота на коррекционный мотор М^, осуществляющий стабилизацию гироплатформы в азимуте. Мы рассмотрим лишь случай свободной в азимуте гироплатформы, когда коррекция азимутального гироскопа не осуществляется. Этот вариант часто встречается при практической реализации. Соответствующие ему уравнения ошибок ИС являются достаточно общими. Некоторые дополнительные элементы, обязательные для гироплатформы подобного типа, такие как датчики углов поворота осей кожухов гироскопов относительно платформы, разгрузочные двигатели, датчики углов крена, тангажа и рысканья и пр., на рис. 3.7 не показаны. Для дальнейшего изложения нам понадобятся уже встречавшиеся и впервые сейчас вводимые следующие правые ортогональные системы координат: O^X^Y^Z* — инерциальная система коордиант, в которой по определению справедливы законы Ньютона, с произвольным расположением начала отсчета О*\ O^X^Y^Z^ — невращающаяся земная система координат с началом Ot в центре масс Земли (который в дальнейшем предполагается совпадающим с ее геометрическим центром), оси X*, Y*, Z* неподвижны в мировом пространстве, причем ось Z* направлена вдоль вектора угловой скорости вращения Земли ь>3, а оси X* и У* расположены в плоскости экватора (для определенности можно предполагать, что ось X* направлена в точку весеннего равнодействия);
OjXYZ — уже рассматривавшаяся ранее_жестко связанная с Землей система координат, ось Z совпадает с вектором со3, оси X, У лежат в плоскости экватора, причем ось X ^совпадает с линией пересечения экватора и гринвичского меридиана; вся,система OjXYZ вращается в мировом пространстве с угловой скоростью <о3; ~ система координат, связанная с гироплатформой, ее центр О совпадает с центром карданового подвеса, а оси £ и т] направлены вдоль осей чувствительности горизонтальных акселерометров; абсолютную угловую скорость системы обозначим <о; Oxyz — геоцентрическая свободная в азимуте система координат, ось z направлена по геоцентрической вертикали, а абсолютная угловая скорость <о системы координат Oxyz не имеет составляющей вдоль оси z (<о2 = 0); Ое^ецвг — геоцентрическая географическая система координат, ось ет направлена по геоцентрической вертикали, ось еф перпендикулярна вектору ег и лежит в плоскости, проходящей через векторы еф и со3, положительное направление оси ev — на север, ось направлена вдоль параллели положительно на восток; система Ое^е^ег вращается в инерциальном пространстве с угловой скоростью ыг; * £* — произвольная вращающаяся с угловой скоростью <о° координатная система. Принцип инерциальной навигации предполагает измерение акселерометрами суммарного абсолютного ускорения, вызываемого всеми силами негравитационного происхождения: а = (3-52) где а — векторный выходной сигнал идеального трехмерного акселерометра (или совокупность сигналов трех одномерных акселерометров) *), (Proojdt? — вектор абсолютного ускорения центра чувствительных масс акселерометров О, grp — вектор напряженности полного гравитационного поля в точке О, гоог— радиус-вектор точки О в инерциальной системе координат O*X*Y*Z*. ») Допущение об эквивалентности одного трехмерного акселерометра трем одномерным равносильно допущению о том, что чувствительные массы всех трех акселерометров находятся в одной точке О.
Подставляя в (3,52) выражение гоо. через радиус-вектор го,ом центра Земли и радиус-вектор г точки О в геоцентрической системе координат (рис. 3.8), находим d2rO,O, сРг . а “ dt* 1' dt2 Srp(r)- Напряженность полного гравитационного поля в точ- ке О вызывается напряженностью гравитационного поля Земли g и напряженностью гравитационного поля всех остальных небесных тел gx' grp (г) = g (г) + gt (г). В соответствии с законом Ньютона Рис. 3.8. Определение положения точки О в инерциальной и земной системах координат. а*Гп п -^ = gx(O)- поэтому rf2r , . , а = -rf/T-£(') + + (gs(0) — gs(r)]- (3.53) Если движение точки О происходит на небольшом удалении от поверхности Земли, сравнимом с радиусом Земли R, то разность gz (0) — gz (г) становится исчезающе малой. Так уклонения отвеса, вызванные разностью сил притяжения Солнца в центре Земли и на ее поверхности, не превосходят 0,008"; аналогичное воздействие Луны вызывает отклонения отвеса в 0,017", в то время как неравномерное распределение масс Земли приводит к отклонениям отвеса в несколько угловых секунд [3.21]. На этом основании величиной g? (0) — gs (г) в уравнении (3.53) можно пренебречь и считать « =---Jr-g(r). (3.54) Основой для получения уравнений идеальной работы и ошибок ИС служат точные соотношения механики, связывающие скорости и ускорения в относительном и абсолютном движении. Известно, что абсолютная производная dAldt некоторого вектора А в системе координат
O*X*Y*Z* связана с относительной (локальной) производной А этого вектора в произвольной вращающейся системе равенством dA 1 . п л = A -f- <оп х А. Используя формулу (3.55), запишем выражения для первой и второй абсолютных производных вектора г: (3.56) (3.55) dr • , п -7г = г со0 х г. at (Pr I dr \ 0 Вводя обозначение V - — У ~ dt ’ J ~ dt* ’ dt (3.57) (3.58) после элементарных преобразований уравнений (3.56), (3.57) найдем выражения локальных производных г, V: V = j - о0 х V, (3.59) г = V — <0° х г. (3.60) Векторные равенства (3.59), (3.60) можно переписать и в проекциях на оси В*, т]*, ^ = 4 + ^6.-^. (3.61) ^ = Pu+®CZn.-<*>Vc.> fru = Vn, + - o)j.ru, Ъ (3.62) Равенства (3.61), (3.62) могут быть использованы для получения уравнений идеальной работы как платформенных, так и бесплатформенных ИС. В случае бесплатфор-менных ИС угловая скорость <о° совпадает с угловой скоростью движущегося объекта; составляющие со^,
измеряются датчиками угловых скоростей. В платформенных ИС осуществляется управляемый поворот гироплатформы с угловой скоростью со0, определяемой координатами движущегося объекта и выбранной системой координат, в которой работает вычислитель ИС. Сама угловая скорость ю° при этом бортовыми датчиками не измеряется, суждение о скорости вращения гироплатформы выносится на основе знания управляющих (корректирующих) моментов, прикладываемых к гироскопам. Выведем уравнения платформенной ИС, работающей в геоцентрической свободной в азимуте системе координат, когда трехгранники ОЁцЛ]* £* и Oxyz совпадают, а со0 = со. В этом варианте ш2 = 0 и уравнения (3.61), (3.62) принимают вид Vx ~ ;х Z’ V U = /1/ + mz^z, = jz + «yVx — rs = Fx —(Ourz, ГУ = Vy + (»xr2, r2 = Vz + (DyTx — ШхГу. (3.63) (3.64) По самому определению системы координат Oxyz rx = = rv — 0, г2 — г. Поэтому из соотношений (3.64) получаются выражения для проекций <ох, <о(/ угловой скорости вращения сопровождающего трехгранника К V <ох = - . (3.65) Подставляя (3.65) в (3.63), (3.64), найдем уравнения идеальной работы ИС: V V Vx = jx-----7Х(0) = 7ХО, = Hv(O) = Vvo, у2 -]_ у2 V2 = j2 + -^-±, Кг(О) = КхП, г = Уг, г(0) = г0> J (3.66)
V V <,)Х = - -JL, о.,, = -2-, <ог ^ О, (3.67) здесь Vx0, VH0, V20, r„ — начальные значения местоположения и составляющих скорости движения. Формулы (3.66) еще не образуют полной системы уравнений вычислителя ИС, так как они не содержат уравнений вторых интеграторов, позволяющих вычислять местоположение движущегося объекта. Обычно местоположение движущегося объекта определяется координатами г, X, <р. Получим соотношения, связывающие широту ф и долготу X с Vx, Vy, г. С этой целью найдем выражения ортов е<₽, е'г в невращающейся земной системе координат OiX^Y^Z*. Проектирование единичных векторов ек, е<р, ег на ортыву,, еу,, ez, (см. рис. 3.6) приводит к равенствам ек = —sin (X 4- co3t) ех, + cos (X + wa<) еГф, (3.68) e,v = —sin ф cos (X + aat)ex, — sin <p sin (X 4- <o3/)ey, 4-4- cos ez., er — cos <p cos (X 4- <oei) eXt 4- cos <p sin (X 4- <n3/)^r. 4- 4- sin ср ez,. (3.69) Дифференцируя формулы (3.68), (3.69), получим выражения для абсолютных производных: de, = — cos(X I- (03t) (X 4- e>3) ех„— sin (X 4- со3Г) (X4- со3) еу¥, (3.70) der _ dt = [— sin ф cos(X <o3t) ф — cos ф sin (X co3£) (X 4- w3)] ex, 4~ 4- [cos (X 4-(o3Z) cos ф (X 4- <o3) — sin ф sin (X 4- (о3<)ф]еу, 4-4-созф-фвг.. (3.71) С другой стороны, в соответствии с (3.55) de, de = ёк 4- <ог х ек, — = ёг 4- <ог х ег, (3. /2) здесь (1>г — угловая скорость вращения трехгранника «х, еч, ег и локальные производные гх, вычисляются в геоцентрической географической системе координат;
поэтому они тождественно равны нулю. Из (3.72), (3.68), (3.69) находим de. —cos (X 4- ®3Z) ех„ + (Orzf sin (X 4- co3Z) 4- + [йгх, cos (X + w3Z) -|- wry¥ sin (X co3Z)| е7*, (3.73) de = [wry, sin q> — (orZ, cos <p sin (X -4 <o3Z)] ex* -|- + [wrz, cos tp cos (X + <o3Z) — wrx¥ sin (pj ey¥ - + lwrx¥ cos (p sin (X + waZ) — wry¥ cos ф cos (X w3Z)] e7*, (3.74) где <Огх.» <ory,, (orZ, — проекции угловой скорости сог на оси вх,1 ву,, ^z,. Совместное рассмотрение уравнений (3.70), (3.71), (3.73), (3.74) приводит к зависимостям Огх. = Ф sin (X + o>3Z), о)гу, —ф cos (X + (o3Z), wrz, = X + ш3, (Or — ф sin (X + a>at)-ex, — Ф cos (X 4- waZ) ey, + + (X + co3) ez,. Определим составляющие wrx, cor<f, (orr угловой скорости ыг в геоцентрической географической системе координат (огХ = (шгех) = — ф, (0гф = (X + (03) cos ф, (огг =(Х ф- со3) sin ф. (3.75) Теперь найдем проекции абсолютной скорости на оси е?., еф, ег. Для этого запишем уравнение (3.60) в системе координат Ое},ечег: V = г 4- сог х г. (3.76) В этой координатной системе г = егг, локальная производная г = егг и согласно (3.75), (3.76) *) V = e^r (X 4~ о),) cos ф -Ь ечгф + erf, *) Здесь кратковременно для различения вектора г и его модуля г введено обозначение вектора жирным шрифтом.
Г ф, • Д, Ж* Г X» мальной к геоцентрической Рис. 3.9. Взаимное расположение геоцентрических свободной в азимуте и географической систем координат. т. е. проекции абсолютной скорости движения на оси сопровождающего трехгранника ех, еф, ег равны Их = г (к 4- (о8) cos <р, Уф = гф, Vr = г, (3.77) здесь Иф и Ух — северная и восточная составляющие абсолютной скорости. Уравнения можно разрешить относительно производных 1, ф: X = —— <о8, ф=2з1. (3.78) г cos <р т г ' ' Vy лежат в плоскости, норвертикали (рис. 3.9) и легко выражаются друг через друга: Уф = Иж sin ф 4- 7„созф, I Их = Hxcos ф— Vv sin ф, J (3.79) где ф — угол поворота геоцентрической свободной в азимуте системы координат Oxyz относительно местного меридиана. Поскольку трехгранник Oxyz не вращается вокруг геоцентрической вертикали (<о2 = 0), а трехгранник Ое^е^вг вращается относитель но этой оси с угловой скоростью (огг, то с учетом (3.75), (3.77) ф = (Огг = tg <₽• (3-80) Интегрирование уравнений (3.78), (3.80) при известных начальных условиях X (0) = Хо, ф (0) = ф0, ф (0) = = ф0 позволяет найти текущую долготу X и сферическую широту ф движущегося объекта. Совместно с выведенными ранее уравнениями (3.66) формулы (3.78) — (3.80) образуют замкнутую систему кинематических дифференциальных соотношений, позволяющую по ускорениям 7х> 7v» 7z движущегося объекта определить его скорость и местоположение.
Сферическая широта ср может быть пересчитана в географическую широту ср', так как между ними существует взаимно однозначное соответствие. Зависимость <р' от <р определяется выбранным описанием формы Земли. Если в качестве референц-эллипсоида принят эллипсоид Клеро, что находит широкое практическое применение 13.21], то <р' = <Р + -у- 0 — sin 2(Р’ где е — эксцентриситет, а — большая полуось эллипсоида Клеро, Н — абсолютная высота движущегося объекта. Для геодезических и картографических работ на территории СССР приняты параметры, полученные Ф. Н. Красовским: е2 = 0,0066934, а = 6 378 245 м. Алгоритм вычислителя ИС, работающей в геоцентрической свободной в азимуте системе координат, повторяет уравнения (3.66), (3.78) — (3.80) с той лишь разницей, что входными воздействиями для этого алгоритма являются не ускорения jx, jv, jz, а измерения акселерометров, установленных на гироплатформе. Используя соотношение (3.54), выпишем полные уравнения вычислительного алгоритма. Измеряемые входные воздействия и различные величины, рассчитываемые БЦВМ, т. е. всю ту информацию, которая имеется на борту движущегося объекта, будем помечать верхним индексом ♦. Кроме того, уравнения вычислителя запишем не в дифференциальной, а в интегральной форме: е* Г V*г* 1 V* = [4-------**. <Р*)]л + v^, (3.81) о г* Г V* г* = J (/•*,>.*, <p*)jЛ + Г*, (3.82) О ел Г V*’ -I- V*' 1 V* = = jj |а* + х у- + g* (r*. X*, <р*)|dt + г*, о (3.83)
t r*= j* v*dt +г*, (3.84) О V* = V* cos ф* - V* sin Ip*, V* = V* sin ip* + V*cos ip*, (3.85) * / v* X* = Г -».)«+>..•, (3.86) 0 <P* - jj* + (₽0*, (3.87) О p ♦ V* Ф* -75-tgq>*(fc +%*, (3.88) 0 здесь af, a*, a£ — измерения акселерометров ИС, V*o, V*o, r*, r*, X*, ср*, ip* — начальные значения соответствующих физических величин, вводимые в вычислитель, gj (г*, X*, <р*), (г*, X*, ф*), g\ (г*, X*, ф*) — проекции на оси геоцентрической свободной в азимуте системы координат Oxyz гравитационного ускорения, соответствующего используемой модели гравитационного поля. Индекс * у интегралов означает, что в формулах (3.81) — (3.84), (3.86) — (3.88) речь идет не о математическом интегрировании, а об интегрировании приборном. Эти два понятия отличаются из-за ошибок, присущих приборному интегрированию. Причинами этих ошибок могут быть уходы нулей интеграторов, ошибки вычислений в БЦВМ, а также неточность измерения времени на борту движущегося объекта. К написанным уравнениям надо еще добавить выражения управляющих моментов М* М*, поступающих на коррекционные моторы гироплатформы для отслеживания геоцентрической вертикали: М'. H*V* м* -* , т-и-----3— (3.89) где Н*> Н* — предполагаемые значения кинетических моментов соответствующих гироскопов. Структурная схема алгоритма ИС представлена на рис. 3.10.
К корре/щионным моторам Рис. 3.10. Структурная схема алгоритма вычислителя инерциальной системы.
Хорошо известно (и об этом еще будет сказано в дальнейшем), что чисто инерциальные системы неустойчивы в направлении радиуса Земли 13.22]. Поэтому введение компенсирующих сигналов У?г*/г*, У*г*/г*, а также вычисление переменного коэффициента 1/г* в горизонтальных каналах ИС по данным вертикального канала может привести к потере точности горизонтальных каналов. Для расчета поворотных ускорений У*г*/г*'и коэф- фициента 1/г* желательно привлечение внешней дополнительной информации о высоте и вертикальной скорости. Кроме того, при полете на стабилизированной высоте или при незначительном вертикальном маневрировании возможно пренебрежение поворотными ускорениями. В подтверждение этой возможности оценим влияние ускорения V^r*/r*, предполагая = const. Тогда изменение скорости 6УХ, вызванное ускорением V*r*/r*, равно о TZ* 1 - Г 4 , Г* («) - г* (0) -| _ т/* Г* (I) - Г* (0) - Vx ,п I 1 +-------^(0)-----] - V*-------^(0)----- т. е. относительная ошибка измерения скорости составляет величину [r*(t) — r*(0)]/r*(0). Если г* (/) — г* (0) = = 1 км, а г* (0) = 6378 км, то 6VXIV* составляет 0,015%, что в определенных условиях может оказаться пренебрежимо малым. Аналогично обстоит дело и с ускорением Vjr*/r*. Возможность привлечения внешней информации гвн, гви неинерциального характера для измерения гиг отражена на рис. 3.10 постановкой переключателей 1, 2. Перейдем к выводу уравнений ошибок ИС. Рассмотрим только соотношения (3.81) — (3.84), не касаясь пока равенств (3.85) — (3.88)t Введем в рассмотрение ошибки определения текущих координат: ДРх = V? - vx, ДVv = V* - Vy, (3.90) ДVt = V* - Vt (Дг = r* - г), Дг = r* - r,
п ошибки задания начальных условий: А Ихо = И* - Ух0, AVy0 = У*о- Уу0, AVZO = У* -- V20 (Ar0 = rj - r0), Ar0 = r£ - r0. (3.91) Подставляя (3.90), (3.91) в (3.81) — (3.84) и производя группирование слагаемых, с точностью до малых величин первого порядка получим + ДУХ = 1\.г'+ ^Дг’ + &vxr - vx Дг Г + gx(r*, X*, <₽*)j X X dt duix 4" Ухо 4~ ДУхо, (3.92) Гу + дпу = J[«* -О Vyr+Vy^r-}-AVvr-Vy— Дг + gy (г*, X*, ф*)] dt + 6ulw + Уу0 4- ДУуо (3.93) V2 4- ДУ2 = J [а? 4- 2 О V W 4- V ДГ х^1 х' у^ у 4- g* (г*, X*, ф*)] dt 4- 6н12 4- г0 !- ДЛ„ f г 4- Дг J (Г2 + ДУ2)с^ 4- 6игг + гп 4- Дго. О (3.94) (3.95) В выражениях (3.92) — (3.9oj ошибки приборного интегрирования выделены отдельно и обозначены: 6и1ж, би1и, 6м12 — ошибки на выходах первых интеграторов, 6н22 — ошибка на выходе второго интегратора. Производя дифференцирование формул (3.92) — (3.95) и исключая из них кинематические уравнения (3.66), находим ДУХ == «* — /х 4- gx (r*, X*, ф*)-г — ДУх 4- 4- Ух-^-Дг 4 dtiix, ДУх(О) = ДУхо, (3.96)
jv + g* (г*, X*. ф*) - 21 Дг-------г- Д7„ -I- + Vv-±- Ar + ddlv, AVv (0) = АУ„01 (3.97) AVZ = fl* - jt + g* (г*, X*, ф*) + 2 A7K + 2 A- AV„ - J'2 i j/* -----Ar + &i12, AVZ (0) = Ar0, (3.98) Aj = AVZ + d<i2z> Дг (0) = Ar0. (3.99) Чтобы раскрыть выражения Aax = a* - jx + g* (r*, X*, Ф*), (3.100) Aav = a* — jv + g* (г*, X*, Ф*), (3.101) Aaz = a* _ д + gz* (г*, X*, <p*), (3.102) необходимо найти угловое рассогласование между сопровождающим трехгранником Oxyz геоцентрической свободной в азимуте системы координат и сопровождающим трехгранником О^т\ £ системы координат, связанной с гироплатформой. Управление гироплатформой осуществляется так, чтобы она отслеживала геоцентрическую вертикаль. Поэтому рассогласование между] координатными системами Oxyz и О£т|£ невелико. Зададим указанное рассогласование, как это часто делается в теории гироскопических устройств [3.21, 3.22], вектором угла малого поворота Ф. Связь между ортами ех, еу, ег и е?, ел, координатных систем Oxyz и O&i £ выражается с помощью вектора Ф следующим образом: = ех + Ф х еу = еу + Ф х eu, = = ez + Фхе2. (3.103) Нетрудно убедиться, что если ех, еу, ег — единичные ортогональные векторы, то с точностью до малых величин первого порядка (по Ф) векторы ел, определяемые формулами (3.103), также являются единичными и ортогональными. Обозначим проекции вектора Ф на оси системы координат Oxyz соответственно Фх, Фи, Фг и выясним физический смысл вектора Ф. Найдем матрицу С направляющих косинусов координатных систем Oxyz и О£т]£, для чего с учетом равенств (3.103) определим
следующие скалярные произведения: eX’6i = ех-ех + ех- (Ф х е») = 1, Сх'Ст) = бх*бу 4* ®х" (Ф X Су) ~ ®х‘(®гФх ®хФ2) ~ = -ф„ ®х‘в£ = ®x'®z 4“ бх* (Ф х бг) = вх* (ехФу СуФх) ~ Фр, бу** = ev>ex 4- <?У-(Ф X ех) = еу- (е„Фг — егФу) = Ф2, бу • бц == бу* Су 4“ бу • (Ф X бц) 1, = Gy’^t 4- бу* (Ф X б^) = бу* (вХФу буФХ) = = - Фх, 6z*cz = ег*бх 4- бz* (Ф X бх) -= cz* (е„Ф2 — егФу) = = - Фр, 6z-6n = 6z*ev+ бх*(Ф х ev) =ez- («гФх — ехФг) = Фх, е2-е{ = ez*6z + cz* (Ф х cz) = 1. Значит, искомые направляющие косинусы определяются табл. 3.1. Известно, что в общем случае переход от одной ортогональной системы координат к другой может быть осу- ществлен тремя последовательными поворотами на углы Таблица 3.1 Эйлера. Применим это общее положение к нахождению 5 Ч Е рассогласования между трехгранниками Oxyz и^О|ц^. Первым поворотом вокруг х оси х на угол а осуществим у переход от трехгранника Oxyz к вспомогательному трех- 1 -ф« -Фг 1 Ф X Ф У ~ФХ 1 граннику OfcxihSi (рис. 3.11, а). Вторым поворотом вокруг оси т)! на угол 0 перейдем от трехгранника О SiijiSi к новому вспомогательному трехграннику (?g2T)s(рис. 3.11, б). Наконец, третий поворот вокруг оси £8 на угол Дф позволяет перейти от вспомогательного трехгранника к трехграннику Оет)£ (рис. 3.11, в). Таблицы на- правляющих косинусов для трехгранников Oxyz, 6 А. А. Красовский
Им соответствуют аналогичные матрицы направляющих косинусов сп с2, с3. Перемножая матрицы с3, с2, Рис. 3.11. Задание пространственного поворота углами Эйлера. с3, получим матрицу направляющих косинусов с всего преобразования и соответствующую ей табл. 3. 2. Если поворот совершается на малые углы а, 0, Aip, то с точностью до малых величин первого порядка табл. 3.2 превращается в табл. 3.3. Из сопоставления табл. 3.1 и 3.3 заключаем, что Фх = а, Ф„ = 0, Фг •= Дф, (3.104)
Таблица 3.2 & n C X COS Р COS Дф — cos p sin Дф sin p У sin a sin р cos Дф + -f-cosa sinAip — sin a sin P sin Дф -|- -|- cos a cos Дф — sin a cos 3 Z — cos a sin Р cos Дф + + sin a sin Дф — sin a sin p sin Дф + + sin a cos Дф cos a cos т. е. проекции вектора угла малого поворота действительно равняются углам а, Р отклонения гироплатформы от геоцентрической вертикали и углу Дф ухода гироплатформы в азимуте. Найдем теперь дифференциальные уравнения для углов а, р, Д ф. Для этого запишем выражения абсолютных про- изводных единичных векто- Таблица 3.3 ров ex и e£. de = co X (3.105) 5 п с de* ~ -/ = co X (3.106) s 1 —Дф р ® — абсолютная угловая ско- y Дф -р 1 a — a 1 рость вращения системы координат Подстановка (3.103) в (3.106) приводит к соотношению de rf(l) de ~ ~ -у l-jj- X е« + Ф X -f = (О X J-W х (Ф X ех). (3.107) Рассматривая равенства (3.105) и (3.107) совместно, находим со X ех + х ех 4- Ф х (<о X ех) — со Хех — — со х (Ф X ех) = 0. Нетрудно убедиться, что Ф X (со х ех) — со х (Ф X ех) = — (со х Ф) х ех,
поэтому — io х Ф -|- о> — со) х ех = (со -> о) X (Ф X ех). (3.108) Правая часть уравнения (3.108) является малой величиной второго порядка в силу малости Фиш — ®. Пренебрегая правой частью равенства (3.108), получаем ---и X Ф + (о-ю) X ех = 0. (3.109) В силу произвольности вектора ех из (3.109) вытекает, что выражение, стоящее в скобках, тождественно равно нулю. Кроме того, согласно (3.55) d®ldt — w х Ф совпадает с локальной производной Ф вектора Ф в системе координат Oxyz. Окончательно находим ф = © - о. (3.110) Проекции угловой скорости ш подчиняются уравнениям (3.67). Найдем теперь вектор угловой скорости гироплатформы а. Угловая скорость а определяется действительными моментами М^, Мп, М^, прикладываемыми к гироплатформе, а заданные значения корректирующих моментов М*, М* формируются по закону (3.89). Действительные моменты отличаются от программных на моменты трения = М* + М^, = М* + М^, Mt = М^. (3.111) Составляющие угловой скорости а в рамках прецессионной теории гироскопов равны <о6 = - = -Jj- , = -/tJ- , (3.112) Ях, Н,/, Hz — действительные кинетические моменты гори-зонтирующих и курсового гироскопов. Подстановка (3.111), (3.89) в (3.112) приводит к уравнениям ~ Н* V* v „ Я* И* ®ч = ff + “дрп» (3.114) “С = “apt’
МЬ- Mt~ здесь шдр 5 , ®др „ = -±- , шдрС = -±- - угло- вые скорости дрейфов гироплатформы. В формулах (3.113), (3.114) заменим V*, V*, г* их выражениями через Vx, Vy, г и ошибки ДУХ, ДУ„, Дг. Кроме того, учтем, что предполагаемые значения кинетических моментов Н*, отличаются от Нх, Ну на неконтролируемые вариации ДЯХ = Н* — Нх, АНУ = = Н* - Я„. Тогда с точностью до малых величин первого порядка ~ V ДИ V V , «4 =----JL----£ + _^Дг_хг-^ + Шдр5, ~ V ДИ V V . й>п = —— -| ~-----Дг + —у- 4- (1)дрт1. Здесь параметры характеризуют нестабильность кинетических моментов гироскопов. Табл. 3. 3 направляющих косинусов позволяет с точностью до величин первого порядка малости от проекций 5$, 55л, перейти к проекциям <3Х, ®w, ®г угловой скорости гироплатформы на оси системы Oxyz: ~ V ЛУ V V V , ®х= +-^-Дг-Дф-^-хЕ-^ + ®ярЕ, (3.115) ~ У &У V V V , -- —jr 4 уг----Дг — Дф-~ 4- + ®дрп’ (3.116) ~ V V , <ог = а -^4- р 4- (оярС. (3.117) Теперь, записывая векторное уравнение (3.110) в проекциях на оси х, у, z и используя соотношения (3.104),
(3.67), (3.115) — (3.117), находим ДИ V И V , ' а ------Дг-Дф -Ь <оир6, а (0) = а(), ДИ. И И И Р =- -------4г Дг ~ Дф ~~ + хп ~~ 4' (,)дрп» 0(0) = 0о. V V Дф = а —-р- 4- 0 4- (ОдР£, Дф (0) = Дфо, (3.118) здесь а0, 0О, Дф0 — начальные угловые рассогласования гироплатформы. Рассмотрим выражения (3.100) — (3.102). Векторный выходной сигнал акселерометра а* равен а* = а + Дя~, где а определяется соотношениями (3.54), а Дя~ — вектор инструментальных погрешностей акселерометров. В проекциях на оси координатной системы это же уравнение выглядит следующим образом: Oj = dj -|- Дя£~, я,, = От] 4- Дят]~, яЕ = я^ 4~ Дя£~, (3.119) Дя£~, Дяп~, Дяг~ — инструментальные погрешности горизонтальных и вертикального акселерометров. С помощью табл. 3.3 направляющих косинусов я^, яп, я^ можно выразить через проекции ах, ау, az вектора я на оси трехгранника Oxyz я6 = ах 4- Дф®и — 0аг = = jx — gx 4- ДФ (/у — gy) — 0 <Jz — gz), яч = — Дфяж + аи + aaz = = — Дф (jx — gx) + jv — gv + a (Jz - gz), ®C ~ 0®x ®®y 4" ®г ~ = 0 (Jx — gx) — a (Zv — gy) 4- jz — gz- В формулах (3.120) слагаемые ДфяУ, Дф£х, 3gx, agy являются малыми величинами второго порядка в силу (3.120)
(3.121) (3.122) незначительности проекций gx, gv гравитационного ускорения по сравнению с gz. Поэтому указанные величины можно опустить и записать Ч = 7х — gx + Дф?и — Р (А — gx), «л = — Ш + iv — gv + а Uz — gz), Ч = Pfx — afv + h — gz- Подставляя (3.121), (3.119) в (3.100) — (3.102), находим Даж = Дф/У — р (jz — gz) — gz (г, X, <p) + + gx (Г*, X*, <p*) + Д<ц~, Да„ = — Дф/Х + a (jz — gz) — gv (г, X, ф) + + gJ(r*,X*,(p*) + Afln„ Да, = P?2 — aiv — gz (r, X, <p) -f- + g* (г*, X*, <p*) + ДаЕ~. Модельные значения g*, g*, g* проекций гравитационного ускорения отличаются от действительных gx, gv, gz на ошибки Agx, AgH, Agz представления гравитационного поля: gx (г, к, <р) = g* (г, к, ф) — kgx (г, к, ф), gv (г, к, ф) = g* (г, к, ф) — Ag„ (г, к, ф), gz (г, к, ф) = g* (г, к, ф) — Agz (г, к, ф). Разлагая функции gx (г, к, ф), g* (Г, к, ф), gz* (г, к, ф) в ряд по г, к, ф в окрестности точки г*, А*, ф* и ограничиваясь линейной частью разложения, получим gx (г, к, ф) = g* (г*, X*, ф*) — дВх A dg* Al dgX A A t 1 x _ __дг _____ ДХ _____ дф _ Lgx (r, X, ф), gv(r,k,(f) = g* (r*, x*, ф*) — 8gv Л dg* Al 9g* л A / 1 \ —Дг - -dk - -af Д,Р - X- 4’). gz (Г, x, ф) = g* (г*, X*, Ф*) — dg* dg* dg* --Дг ДХ Дф — Ag (г, X, <p). dr---------------------d(p f \ (3.123)
Совместное рассмотрение (3.122) и (3.123) приводит к уравнениям да* \ Даж = Д1|>/у — р (jz — gz) + -JL Дг + dg* dg* + Д^ + Д(р + Agx <г’ <Р> Да^~- dg* = — Д1|з/Х + a (Jz — gz) + Дг + 9g* dg* (ЗЛ24) + ~дГ ДХ + ~dyД(р + Д*« (г’Х’ + Дап~> dg* &az = ₽7х — ajv + — & + dg* 9g* + Д^ + Дф + Д#х (гА, ф) + Дв£~. . Если при получении алгоритма вычислителя ИС использование простейшей модели гравитационного поля Земли, в которой Земля предполагается однородным шаром, часто оказывается недопустимым, то при выводе уравнений ошибок ИС, когда уже речь идет о малых отклонениях от идеального движения, это вполне обосновано. Итак, ограничиваясь первым членом ряда (3.18), получим такую модель гравитационного потенциала ^(гД,Ф)= Ей соответствуют следующие модельные значения проекций ускорения силы тяжести ёх (Г, X, ф) = g* (г, X, ф) = О, поэтому & 9g* dg* dg* dg* dg* dg* dg* dr dk d<f dr dk d<f dk 3q> ’ (3.125) _ 9 /^3 dr '
Обозначая модуль гравитационного ускорения у поверхности Земли (при г — R) через g0: получим g:(r,X,(p)=_g0_^_, -^L = 2g0£. (3.126) С учетом (3.124), (3.125), (3.126) Дах = Дф/У - 0 (/2 - gz) + &gx + Да-_, Дау = Дф/Х + а (Jz — gz) 4- Agv -|- Д«п~, Да? = 3/х — ajv 4- 2g0 Дг + Д^? 4- Дас~. (3.127) Из совместного рассмотрения соотношений (3.96) — (3.102), (3.118) и (3.127) вытекают уравнения ошибок ИС: Дг ДУ2 6йг2, Дг(0) = Дгп; (3.128) ДЙХ =- (.ён 4- ь) а.х 4- — k* i'*r* - дих - Дг + Дг !- Д7х, ДИХ (0) дих0; (3.129) ДИ« (ён 4- /?) ам - Д-ф - тг Д^ - - Дг + W, <'•) - Al',.: (3.130) ли. - - /X - /X + + 2Р* 2V* + -7^- ДКх + -л ДК„ 4- Дь, ДИ? (0) - ДИ?(); (3.131) 1 V* dx =-----1-ДУх -]—тг- Д^ 4“ ^дрх! ах (0) = ctxoi (3.132) г г* 1 V* av —------f&Vy 4—~^~^r av (0) = av°' (3.133) Д1р - «)д1,2, Дф (0) = Д^о. (3.134) При получении уравнений (3.128) — (3.134) проведены
некоторые преобразования. Во-первых, для придания уравнениям ошибок симметричного вида проведено переобозначение величин ах = — 0, ау = а, Я2 / Я \2 ёН gz ё» г2 ( Я 4- Я ) ’ где gH — модуль гравитационного ускорения на высоте Н. Во-вторых, введены эквивалентные ошибки акселерометров Д/х = + 6й1я + \gx, -|- bgv, \]z = + бй12 + \gz и эквивалентные дрейфы гироплатформы , V , Г шДрх = — Хт|—у----ШД))П 4- Дф —— , , V , V “дрр = — «Е 4- «др£ — Дф -у- , V V “дрг = а -•?- + 0 —у— 4" шдрС* В-третьих, параметры реального движения, от которых зависят коэффициенты исходных уравнений (3.96) — (3.98), (3.118), (3.127), заменены в (3.128) - (3.134) на измеренные значения этих параметров. Такая подстановка, никак не искажая (с точностью до величин первого порядка малости) уравнений ошибок ИС, практически оказывается удобной, так как позволяет рассчитать коэффициенты дифференциальных уравнений ошибок по данным вычислителя ИС. Следует, однако, заметить, что ускорения 7*, /*, 7* не фигурируют в уравнениях (3.81) — (3.88) вычислителя ИС и их необходимо выразить через переменные, входящие в систему равенств (3.81) — (3.88). Определим выражения j*, j*, j**)- На основании известной теоремы механики можно записать d2r = г 4- 2(о х г 4- 8 х г 4- <о х (<в х г), (3.135) *) При проведении этого доказательства для различения век- тора г и его модуля г временно будем обозначать векторы жирным шрифтом.
здесь — абсолютное ускорение, г и г — первая и вторая локальные производные вектора г в геоцентрической свободной в азимуте системе координат Oxyz, <о и е —абсолютные угловые скорость и ускорение координатной системы Oxyz. В системе координат Oxyz векторы и и г в соответствии с (3.67) представляются так: ех-^4-еу —, г - ezr. Отсюда г = е'г, г — егг, 2® х г = 2-^(exVx + euVv), v®. + v®. ® х (О) х г) =-• — ez —--------------------- (3.136) Па основании (3.55) е = 1Г = ® + ® Х ® = ® + поэтому 8 X г = ех(ух - Уя) + ev (vy--------. (3.137) Подставляя (3.136), (3.137) в (3.135), находим = ех(ух + ~ Кя) + ev F„) + I.. y2 + V® \ + еДг - ? g. j , следовательно, ]х = vx + ~^VX, )v Vy,,, _ .. Г*’ J- V*’ ft r*-----? v .. . (3.138) Уравнения (3.128) — (3.134) следует еще дополнить формулами для ошибок Az, Ai/ определения местополо
жения в системе координат'Охуг. Поскольку Д7Х и ДУ„ — ошибки измерения скорости движения в геоцентрической свободной в азимуте системе координат, то = Д7Я, Ду = AVv. (3.139) Равенства (3.139) совместно с (3.128) — (3.134) образуют полную систему уравнений ошибок ИС. Проведем обсуждение и выясним возможности обоснованного упрощения уравнений ошибок ИС. Анализ соотношений (3.128), (3.131) подтверждает уже отмечавшуюся ранее неустойчивость вертикального канала ИС. Действительно, если в равенствах (3.128), (3.131) оставить только составляющие, зависящие от Дг, то после подстановки (3.131) в (3.128) получим д;_(2^_л£+Д:)д. = о. \ г* Г*’ / Второе слагаемое, стоящее в скобках, для реальных значений составляющих скорости F*, F* намного меньше первого. Поэтому движение по Дг неустойчиво и имеет место тенденция к нарастанию ошибок вертикального канала ИС. Но ошибка Дг входит в уравнения горизонтальных каналов и приводит к снижению их качества. Вследствие этого обычно необходимые для построения замкнутой схемы вычислителя значения гиг (см. рис. 3.10) вводятся не от вертикального канала ИС, а от внешних источников. В этом случае уравнения (3.128) — (3.134) сохраняют свою силу, но в них следует величины Дг и Дг заменить на ошибки измерения высоты Дг и вертикальной скорости Дг внешними измерителями. Так как Дг и Д/ невелики, то составляющие в уравнениях (3.129) — (1.333) становятся пренебрежимо малыми и их можно ввести в эквивалентные ошибки акселерометров Д/х, Д/у, Д/г и эквивалентные дрейфы
гироплатформы <оДрХ, е>др н. Кроме того, отмеченные составляющие целесообразно объединить с Д/х, Д/1(, Д/г, юдр х, содР „ также еще и потому, что они не зависят от интегрируемых величин ДУХ, ДУР, ДУ2, ах, av. С учетом сделанных замечаний, приняв во внимание зависимости (3.138) и пренебрегая ошибками второго интегратора бй22, перепишем уравнения ошибок ИС: Дт = дух, Дя (0) — Дж0; Д(/ = ДУу, Ду (0) = Ду0; Дг = ДУ2, Дг (0) = Дг0; ДУх = — 7Г Аух + (ян - “7F + г*) <1х 4- /*Дф 4- Д/х, ДУх(О) = дух0; bVu = - + (#Н - -7Г + '?*) av - 7«Дф + ДДл ДУ„(0) = ДУ „о; 2V* 2К* ДУг “ -^-Д^х + ДУу - jxax - )*ау ч- Д/2, ДУ2(0) - ДУ20; — "^jT ДУх 4" *'^Др х, Их (Ч ~ 0x0' i(/ = pf Д1 у 4- <одр у> ар (^) “ ai/«> Дф = <1)Др х, Дф (0) = Дф0; здесь у*’ = V*' 4- у*’, И* л. V*r* ----^-Дг ! -5-ДГ 4 Д/х, f г* V* ~ У*Й" Д/„ = - Дг 4- Дг 4- Д/р, 7^ Г* Д/г = -----^-]дг 4- Д/г, \ г* г* / г* ®дрх----"ТГ Дг 4- ЫД!> X’ г* у* <одрр ~ Д/Ч' ИДР У
При наличии азимутальных погрешностей гироплатформы действие ускорения /* на канал х и ускорения j* на канал у проявляется так же, как и влияние эквивалентной ошибки акселерометров. Поэтому целесообразно объединить эти два вида воздействий, введя возмущения б/х = 7*Дф + Д/х, = — 7хДф + Д/„. В режиме равномерного горизонтального движения, когда г* = о, j* = = г* = о, происходит дальнейшее упрощение уравнений ошибок ИС: 1 Дж = ДУХ, ДУх = gax + 6/х, Ях = — 7* ДУх+ <Одр х; (3.140) Ду = ДУ„, ДУ„ =-- gav + Д7„+ (Од,, (3.141) 21'* 2V* ЬН = ДУН, ДУН = -^-ДУх +-^ДГр + д/2; (3.142) дифференциальные уравнения (3.140) — (3.142) решаются при начальных условиях Дж (0) = Дх0, ДУХ (0) = ДУх0, ах (0) = ах0; Ду (0) = Ду0, ДУ„ (0) = ДУу0, а„ (0) = = аи0; ДЯ (0) = ДЯ0, ДУ и (0) = ДУНо. При записи уравнений (3.140) — (3.142) произведено переобозначение некоторых величин: Дг заменено на ДЯ, а ДУ2 — на ДУн, где ДЯ и ДУн — ошибки измерения инерциальной системой абсолютной высоты и вертикаль- ной скорости. Кроме того, обозначено g = gn----- Уравнения (3.140) — (3.142), являясь достаточно простыми, сохраняют все существенные черты поведения реальных ошибок ИС. Эти уравнения описывают шулеров-ские движения ошибок ИС. Достоинством уравнений (3.140) — (3.142) является также взаимная независимость горизонтальных каналов. Если в возмущениях 6/х, («др х сохранить только постоянные составляющие 6jx,
шдрж. то решением уравнений (3.140) являются Дх (i) = Дх0 + (1 - cos Ш) + + (Qf _ Sin Qi), (3-143) ДУХ (0 = ДР>cos + 8 х° + ^х siii Lit + + J^E*(1-cosQ0, (3.144) ду Q d7 ax (0 --------- sin Qt + Oxo cos Qi-(1 — cos Qi) 4- sin Qi, (3.145) здесь Q = jX— частота Шулера. Такой же вид имеют и решения для канала у. Формулы (3.143) — (3.145) описывают шулеровские колебания ошибок в ИС. Их анализ позволяет оценить влияние как возмущающих факторов 6/х, ®држ, так и начальных ошибок выставки ИС Да:0, ДУЖО, «л о- Хотя уравнения (3.140) — (3.142) были получены в предположении равномерного горизонтального движения, их можно использовать и в условиях, незначительно отличающихся от указанных. Соотношения (3.140) — (3.142) являются хорошей моделью ошибок ИС при обработке информации в КЭНС для тех типовых длительностей оценивания, которые характерны для КЭНС. При коротких интервалах оценивания, измеряемых несколькими минутами, что также характерно для КЭНС, допустим переход к предельно упрощенным моделям ошибок ИС. В условиях, когда т т j (£а« + 6/х) dt << Vx0, J (ga,, 4- d/„) dt F„o, о 0 вместо уравнений (3.140) — (3.142) можно использовать
170 МАТЕМАТИЧЕСКИЕ МОДЕЛИ ПОЛЕЙ И СИСТЕМ TJI. III соотношения М = ДУЯ, ДУЯ = 0; (3.146) Д$ = ДУ», ДУ» = 0; (3.147) ДЯ = ДУН, ДУН = б/н; (3.148) здесь бу’н обозначает всю правую часть второго уравнения системы (3.142) и рассматривается как случайное возмущение. Углы отклонения гироплатформы от вертикали ая, а» не входят в равенства (3.146) — (3.148) и, следовательно, при использовании этих моделей ошибок ИС вообще не оцениваются. Существующие модели ошибок курсо-допплеровских систем не подчиняются строгим математическим закономерностям, как, например, рассмотренные уравнения ошибок ИС, а носят статистический, эмпирический характер. Они приводятся в последующих главах по мере возникновения необходимости их использования.
ГЛАВА IV БЕСПОИСКОВЫЕ АЛГОРИТМЫ ОЦЕНИВАНИЯ В КОРРЕЛЯЦИОННО-ЭКСТРЕМАЛЬНЫХ НАВИГАЦИОННЫХ СИСТЕМАХ Изложенная выше теория беспоискового оценивания пригодна как для простых, так и сложных моделей оцениваемых процессов и условий наблюдения. Однако сложные условия порождают сложные алгоритмы, проверка работоспособности которых, не говоря даже о выявлении достаточно общих закономерностей, требует трудоемкого математического моделирования. Между тем ряд закономерностей и количественных характеристик может быть изучен на простых моделях оцениваемых процессов, допускающих в ряде случаев аналитические решения. Изучение относительно простых алгоритмов оптимального (субоптимального) беспоискового оценивания составляет основное содержание данной главы. Сначала приводятся аналитические решения для некоторых простейших вариантов. Оказывается, субоптимальные алгоритмы имеют довольно много общего с эвристическими корреляционными алгоритмами, рассматривавшимися в первых КЭНС. Поэтому во втором параграфе данной главы наряду с результатами математического моделирования оптимальных алгоритмов приводятся результаты исследования процессов в КЭНС с эвристически заданной структурой. Специально выделены некоторые простейшие задачи экстремальной навигации при использовании гладких (с большим радиусом корреляции) геофизических полей при низком отношении полезный сигнал/шум (§ 4.3). В заключение главы приводятся некоторые приближенные аналитические оценки точности в установившихся режимах экстремальной навигации при достаточно сложных практических моделях оцениваемых процессов, а также результаты численных экспериментов.
§ 4.1. Синтез и аналитическое исследование простейших беспоисковых алгоритмов КЭНС На основе изложенных в главе I способов декомпозиции и распределения информации синтез алгоритмов и приближенное аналитическое исследование процессов оценивания можно осуществить для многих моделей оцениваемых движений. Рассматриваемые ниже примеры составляют лишь небольшой процент от общего числа подобных задач. а) Одномерное движение. Датчик скорости с постоянной и флуктуационной ошибками. Датчик поля с флуктуационной ошибкой. Допустим, что движение, координаты которого должна оценивать КЭНС, па интервале оценивания является равномерным прямолинейным - Vx = 0, у„ - Vv = О, = О, = 0. (4.1) Скорости Vx, Vv измеряются «грубой» системой (датчиками скорости) с постоянными и флуктуационными ошибками Vxr = Vx + ДИХ + lVx, Vyr = Vv + ДК„ + Д7х=0, ДУ„ = 0, где £ух, £vu — независимые белые шумы со спектральной плотностью 5Ду, ДУх, ДРщ — независимые случайные величины с дисперсией ст®у. Выходная величина датчика поля равна 2д = (*д, уд) ~Ь |д. (4.3) Здесь ha (агд, уд) — интенсивность поля — сложная функция, имеющая характер реализации двумерного случайного поля. Функция ha (ха, уа) заранее известна и хранится в блоке памяти. Флуктуационная ошибка датчика 5Я (t) считается белым шумом со спектральной плотностью 5Д. Если поле изотропно, начальные ошибки задания координат уд независимы, а время оценивания достаточно велико, то согласно § 1.7 достаточно рассмотреть одномерную задачу — х2 = 0, z2 = 0, х3 = 0, Zj — Ад -И £г2, z2 = х2 х3 £г2, ] (4-2)
где •rJ = ^Д. — Kt, = AVxi £zl = 5л? ?Z2 = £vx- В векторной форме i 4- ах = О, z = hz + gx, (4.4) где О ®1 X 2 «3 -1 о о о о о i2 Н- *3 Hzi « = L . II ^*z2 (4.5) а = О о Алгоритмы оценивания (1.40), (1.41) в данном случае имеют вид *) л / 5Л_\т . х 4- 0.x = А 11 —Л I S? (z — hz), (4.6) \ дх } • / \т А — Аа — атА = I | Sz \ дх I (4.7) где *5д, S&V — спектральные плотности шумов датчика поля и датчика скорости соответственно. В раскрытой форме Ч di (1.9) где ем = dhjdxi = dhn/diy — «мгновенный» или «текущий» градиент поля, hn — ha (хл, уп) — интенсивность двумерного поля в точке оценки положения на плоскости ^Гд, Уд- *.) Индекс к у матрицы здесь и далее опускается.
В соответствии с (4.5), (4.9) скалярная форма уравнении (4.7), (4.8) имеет вид е2 Лц = , Лц 4* Лц = 0, Лхз = 0, 1 1-1 Л22 2Л12 — -о—, Лгз + — т-—, "433 = -я— °ду °ду °ду (4.10) л л Лц / 1. \ । Лц 4- Лц > - ~ . — х2 = -тЛ-я-(Z1 — Лп) 4- г (Z2 — *2 — *3). лд dxi дду л Лц I £ \ г Лц 4- Лц f ~ ~ . ®» = -уЛ (Z1— Лп)4- ~у (Z2 — *2 — Х3), 15 д Ьхх дДУ " Лц дЛ.ц 7, \ Лц 4- Лц . ~ 2. \ х3 — -я—-я— (zi — /гп) 4-у----(Z2 — ^2 — ^3)1 15 д дду (4.11) Я 7?ц = А 1(ЛагЛ33 Л23), Я12 ~ А-1 (Л13Л23 Л12Лз3), 7?13 = А-1 (Л12Л23 Л18Л22), ^22 ~ A-1 MiMss ^is)» Л23 = А-1 (Л12Л13 — ЛПЛ33), /?зз = А-1 (Л11Л22 — Лi2), А = ЛцЛ22Л33 4“ 2Л12Л13Л23— AygAgf — Л)2Л33 — -ЛЦИ. 0(4.12) Элементы Ri} ковариационной матрицы могут определяться по формулам обращения (4.12) из решения линейных уравнений (4.10) или путем непосредственного интегрирования уравнения типа Риккати, которые для данного случая имеют вид - 2Я12 + + SZV (Я12 + Л13)Я12 4- 4 5ду (Я12 4- Я13) Я13 = О, Я12 — Rgg + 5д1е^7?11Я12 4- 5ду (Т?12 4- Л13) Я22 + 4- <5ду(Л12 + Я13) Т?28 = О, R13 — R33 "Ь <5д ₽мЯцЯ13 “1“ ^ДУ (-^12 "Ь /?1з) -^23 + Ь *5ду (Я12 4- /?13) Я33 — О, Я22 4- SfrlR^ 4- SiV («22 + Я2з)Я22 + 4- 5ду(Я22 4- Я23) /?2з = О, ^23 ~Ь 5д eM^?J2^13 “I "S'ДУ (^22 “Ь -^2з) ^23 4- S^v(Rg2 4- Я23) 7?33 — О,
я83 + -I Л88)Я28 ч- I- ^(«23 Ь 7?зз) Л8з = О- Г (4.13) Структуру алгоритма (4.11) иллюстрирует рис. 4.1. Здесь 1/р—оператор интегрирования. Для реализации алгоритма необходимо в блоке памяти хранить как функцию Рис. 4.1. Структура основного блока циклического алгоритма оценивания для случая равномерного движения объекта, датчика скорости с постоянной и флуктуационной ошибками и датчика поля с флуктуационной ошибкой. hn (карту поля), так и dhjdxy (карту производной), либо вычислять dhnldxx в процессе функционирования алгоритма. Из выражений (4.11) и структурной схемы рис. 4.1 видно, что в алгоритме используется усредненное по времени значение произведения сигнала датчика на сигнал блока памяти. Таким образом, синтезированный алгоритм является корреляционным. Он имеет много общего с предложенным еще в период зарождения КЭНС эвристическим алгоритмом аналоговой КЭНС с пятью (для
одномерного случая — с тремя) считывающими головками [4.3]. В этой КЭНС (рис. 4.2) блок памяти выполнен на магнитной или иной ленте, скорость перемотки которой пропорциональна оценке скорости Vx. Центральная головка 1 снимает значение ha в точке оценки местонахождения 4Д. Боковые головки 2, 3 смещены на относительно Рис. 4.2. Структура аиалоговой КЭНС с тремя (пятью) считывающими головками. малые расстояния ± 6, меныпие радиуса корреляции записанного поля. Разность сигналов этих головок соответствует численной производной ha по хд. Эта разность перемножается на разность сигнала датчика и сигнала ha (хд) (рис. 4.2). Сигнал произведения пропускается через параллельное соединение усилительного и интегрирующего (для получения астатизма по отношению к ошибке датчика скорости) звеньев. Далее добавляется сигнал датчика скорости («грубой» системы) и суммарная величина подается на привод перемотки, эквивалентный интегрирующему звену. Сопоставляя эвристическую схему рис. 4.2 с оптимальной схемой рис. 4.1, помимо уже упоминавшейся довольно глубокой аналогии следует отметить и значительное различие. Это различие заключается прежде всего в том, что эвристическая схема имеет постоянные передаточные числа, т. е. является стационарной, а синтезированная оптимальная схема циклического оценивания нестационарна,
ее передаточные числа определяются системой уравнений (4.10), (4.12) или (4.13). Обращаясь к уравнениям (4.10), записываем t 1 р о Р» 4ц = Ли (0) —=- \ ем dt = Лц (0) —-я— t, Д „ я где е 1 С 2 J, if у \ вм dt — -г- \ * </ * V о о 2 — I dt - Для стационарного навигационного поля среднеквадратическое значение градиента е при достаточно большом времени оценивания t практически постоянно. При этом условии и диагональной начальной матрице R (0) уравнения (4.10) имеют следующее общее решение: л 1 , в2 t 4ц = —;—h ~ё— t 40 5д Л13 = 0, Л12 = - Л23 =• -я— , Лзз dAV . t eV Д12 ------5------! 25Д 1 t fi eV ;2 + S. + e2 + 36'n vo °xo я 1 , t vo ' (4.14) Здесь ст20 — (0), Ovo — (0), °avo — 7?ss (0) — дисперсии начальных ошибок оценивания координаты хл, скорости Vx и постоянной погрешности грубой системы АУХ соответственно. Подставляя эти выражения в формулы (4.12), находим д/п 1 Г 1 , / 1 . _L_\_L 1 <2 А о2 з® 1я2 "и б2 I -Sv "Г а2 32 |_ °Vo3AVo \ °Vo aAV0/ V 3x03AV0 / e2____l_ 1 I B2 £4*1 + (^д4о + иу) + w]’ + (4.15) i 1 Г 1 , / e2 1 \ e2 »"] CTv (0 = -г- —j—2------Ь I “U—г------1“ ~c---2~ r "b I Д [ 4oelvo ЛдвдУо 5av4o J j, (4.16)
А i 1 4o4vo , 8Ч> h -Vav Vo 9‘ е2<з2 A v XQ С <*2 ,Л eV _______ , e<gX0 &Vav + 12SXve е« 3Mvo eJc;„ ‘W^AV (4.17) Согласно этим выражениям при /—>оо справедливы простые асимптотические формулы (4.18) Дисперсии ошибок оценивания стремятся к нулю при t -> оо. Это является следствием предположения о равномерности оцениваемого движения и характере шумов датчика поля (белый шум). При рассмотрении выражений (4.15) — (4.17), как и всех последующих аналитических (в обычных функциях) решений, следует помнить уже отмечавшееся обстоятельство: эти выражения справедливы при достаточно большом t. Таким образом, выражения (4.15) — (4.17) по существу также являются асимптотическими. Подчеркнем, что большими считаются значения t, во много раз превышающие время прохождения радиуса корреляции навигационного поля, т. е. времени корреляции функции hn (Vx t). Рассмотрим два частных по отношению к изложенному случая: датчик скорости имеет лишь флуктуационную ошибку (Оду = 0) и лишь постоянную ошибку (5ду = 0). Предельными лучаем переходами из формул (4.15) — (4.17) по- °«0 / 1 , < , <» , е2‘3\ = -j- + С-Н~г+тг ’ V1-19) Зхэ / Г , 1 . t* . eV \ ,, ** \3V0 3AVo ахо l,t, ( 1 . t \ , eV , е^о** 1 ~ + ^У + 3V0 + ^у) Г 35д + (4.21)
^2 = —~ "I-----2--------~S~~ ( ~2--1--2--- I + °Vo °AVo “ \ °V0 3AV0 / + + 125* • (4.22) Если шум датчика поля имеет ограниченный, но достаточно широкий спектр, то можно принять 5Д = ОдТд, где о® — дисперсия флуктуационной ошибки датчика, тд — время корреляции этой ошибки. При этом асимптотические выражения (4.18) принимают весьма простой вид стх = Оу ИЦ,/ тд н у t (4.23) Ч На рис. 4.3 изображен график (кривая 1) изменения среднеквадратической ошибки оценивания координаты, Рис. 4.3. Изменение ошибки оценивания координаты во времени для системы рис. 4.1. построенный по формуле (4.15) при следующих значениях параметров: е = 10-2, Од = 10 м2, Тд = 1 с, о20 = 107 м2, 5ду = 102М2 С-1, Оу0 = 102 М2 С-2, Оду0 = 102 м2 с-2. В области малых t кривая продолжена пунктиром, так как используемые формулы здесь, вообще говоря, теряют силу.
Кривая 2 соответствует случаю, когда постоянная ошибка датчика скорости отсутствует (формула (4.19)), а кривая 3 — случаю, когда отсутствует флуктуационная ошибка этого датчика. Из графиков рис. 4.3 видно, что вначале (при малом t) процесс «списания» ошибки при принятых значениях параметров идет весьма интенсивно, а затем — вяло. Если радиус, а значит и временной интервал корреляции поля, достаточно малы, то в рассматриваемом случае длительность цикла оценивания нецелесообразно задавать большей 10 с. При такой длительности цикла Тц и указанных значениях параметров вместо (4.15) можно пользоваться простой формулой Ох (4.24) Длительность оценивания скорости значительно больше. Рис. 4.4. Изменение ошибки оценивания скорости во времени для системы рис. 4.1. Об этом свидетельствует график рис. 4.4, построенный по формулам (4.16), (4.17) при тех же исходных данных. Эти результаты содержатся в статье [4.1], послужившей основой данного направления синтеза беспоисковых оптимальных алгоритмов КЭНС [4.2—4.4, 4.17]. Как уже отмечалось, полученные выражения носят асимптотический характер. В то же время достаточное условие точного оценивания (1.67) в данном случае
выполняется. В самом деле, матрица <1Л, -vi R = дх dxi Н» + dh„ dh„ dxt dxt "13 7? 22 4“ Rt3 “Г 7?33 тождественно равна нулю только при R = 0, точнее, при Кц ~ 0, /?12 = О, R13 — О, /?22 “Ь Кгз = 0, ^?гз п- Кзз= 0. б) Равномерное движение. Датчик поля с постоянной и флуктуационной ошибками. Рассмотрим случай, когда датчик скорости вообще отсутствует, а датчик поля кроме флуктуационной имеет постоянную во времени случайную погрешность. В предположении равномерного одномерного движения это отвечает уравнениям хл — Vx = 0, = 0, Д/гд =0, гд = h„ + Д/гд + £д или х + ах где = 0, z = hz + £г, 1д1 й° -1 0 vx , а = 0 оо да Цо о о (4.25) hz = hn + х3, = |д — скалярные величины. В данном случае ||^п дх | дхг о ,|. о о 1 о о о / dht \т у дх у dh __z_ дх (4.26) (полагаем dh^!din = 0). В соответствии с этим, полагая начальную матрицу R (0) диагональной, находим л 1 . Л Яц = ——h -у—, Ли = °хо Д . I t» е«13 Агз = —j-1-«—г Vc- , 4о схо 31УД 4 1,1 Лзз - -j И -у—, ад/ю я t е212 л л ----2----Тё-’ ^13 “ 0 Зхо 21?Д Л23 = 0, (4-27) где gjj-j — дисперсия постоянной ошибки датчика.
В данном случае ^28 =--------, 7?13 = О, ЛиЛя — Л]2 ЛН.4П—А12 Йм = ---, ^23 = ----------- 7?22, R33 — -7- АаАп—А*2 А33 (4.28) Подставляя выражения (4.27) в (4.28), находим Ох — Ни — Охо 1 Р еП3 4о с*хо 35Д Оу Дп 1 ‘2 avo = /?22 = Оу0----------- 1 3» e2t3 <£ое«1 / 1 ецз \ + а5д+ \40+12М 1 e«t Л,+, еЧ Оу0г**3 /1 чЧ \ + 5_ + ЗУП I + 4S- ) я Д \ ^хо Д / Vy . Г| (4.29) д 1 дл Из этих выражений видно, что постоянная ошибка датчика поля при сделанных предположениях не влияет на точность оценивания других координат. Это согласуется с корреляционным принципом функционирования алгоритма. Корреляционный принцип вытекает как из уравнений основного блока алгоритма, имеющих для данного случая вид Xi — Х2 = х “X— (Зд Ад — ^з)« 1 Д 0*1 I Жг = -у— f /?12 + R23) («д — — ^з)» * (4.30) йд \ 0*1 / Л-З ' “с (®Д ®з)« так и соответствующей структурной схемы, представленной на рис. 4.5. Эта схема еще ближе к эвристической схеме аналоговой КЭНС рис. 4.2, чем ранее рассмотренная схема рис. 4.1. Если не говорить о принципиальном от
личии, связанном с нестационарностыо систем (4.28), (4.30) (зависимость Ri} от времени в каждом цикле оценивания), то различие в схемах рис. 4.2, 4.5 заключается главным образом в наличии в оптимальной схеме цепи Рис. 4.5. Структурная схема, соответствующая оптимальному бес-поисковому алгоритму оценивания для случая датчика поля с постоянной и флуктуационной ошибками и равномерного одномерного движения. с передаточным числом /?23/5Д и цепи с передаточным числом 7?з3/5д (рис. 4.5). Последняя цепь представляет собой обыкновенную интегральную обратную связь, служащую для компенсации постоянной составляющей разности сигнала датчика и сигнала блока памяти. Обращаясь к формулам (4.29), замечаем, что асимптотические формулы точности оценивания координаты и скорости при t оо здесь точно такие же, как и в предыдущих случаях (4.23) (5Д = <тдтд). Таким образом, при достаточно большом времени оценивания точность определения координаты и скорости в системе без датчика скорости получается почти такой же, как в системе с датчиком скорости. Переходные процессы «списания» начальных ошибок несколько отличаются, но при указанных выше значениях параметров это отличие мало заметно. На рис. 4.6 представлены кривые изменения ох/<тх0, °v/oy0, построенные по формулам (4.29) при е = 10~2, 5Д = 10 м2-с, ох0 = 107 м2, оу0 = Ю2 м2-с-2. Кривая изменения относительного значения ах очень близка к представленным на рис. 4.3 (на рис. 4.6 использован полулогарифмический масштаб). Следует отметить,
что оценивание скорости как в данном, так и в ранее рассмотренном случае, происходит значительно позже, чем оценивание координаты, но при достаточно большом времени оценивания точность определения скорости высока. Рис. 4.6. Изменение ошибок оценивания во времени для системы рис. 4.5. Отсутствие дополнительного источника информации в виде датчика скорости влияет на максимальные допустимые начальные ошибки и на допустимую ширину «окон» в используемом навигационном поле. Однако эти вопросы выходят за пределы простейшей аналитической теории и рассматриваются ниже на основе результатов моделирования. Условие точного оценивания (1.67) в данном случае также выполняется. Действительно, матрица dh. II dhn dh„ dh,. || ~dTR = + -^-Яи + Ягз -^Я1з + Язз| тождественно равна нулю только при Иц — 6, Н12 = 0, 7?ls = 0, /?2з = 0, Н88 = 0. в) Произвольное одномерное движение. Сигнал датчика скорости в качестве управляющего воздействия. Датчик поля с флуктуационной ошибкой. Используя принцип перераспределения информации (см. § 1.4), рассмотрим
ту же задачу, что и в первом пункте данного параграфа, но сигнал датчика скорости будем считать не компонентом вектора наблюдения, а управляющим воздействием. Движение будем считать произвольным одномерным. Уравнения оцениваемого процесса и условие наблюдения запишутся в виде = Vx = 7хГ - ДУХ - £Ух, ДГХ = О, 2д = (хд) + £д, где Wx — постоянная ошибка датчика скорости, — флуктуационная ошибка этого датчика со спектральной плотностью 5ду. Используя обозначения *^2 = Ид = Ухг, ёх1 — £vx, Z1 == 2д, ^*1 = Bzl = £д, получаем •Тд. “Ь х2 = Пд ф- £х1, х2 = 0, Zj = hzy (х2) Н- £х1. В данном случае „ _||° ч ч_||^ Цо о|| ’ & || Лсд Уравнение (1.31), или (1.36), и уравнение (1.32) в раскрытой скалярной форме в данном случае имеют вид ail + = Hi e^lZi — hn (zJJ, ^2 = — M*i)L дд e2 /?1Д 27?12 + -7Г- /?ДД = 5ду, лд е2 Ядо /?22 + ~ = О, е2 /?22 + Пи = о, лд (4.31) (4.32) где ем = dh.n (х3)/дх1 — «мгновенный градиент» поля. Ввиду неоднородности (5ду у= 0) уравнений ковариаций (4.32) решить их в общем виде не удается. Однако весьма просто определяется установившееся решение, при
котором — ^11 — const, *^Л2 — — COllSt, /?22 = = const, е£ = в2 = const. Из (4.32) вытекает, что установившееся решение является единственным и равно Я12 ~ Of ^22 ~ О, 7?11 = Ох = У $д8ду. Полагая 8Д ~ ОдТд, S&V = ОдуТду, получаем ____ -2_Wp^, (/,.33) Если в — 10~2, Од = 5 м, оду = 2 м/с, тд = 1 с, тду = 50 с, то ох = 84 м. Структурная схема основного модуля (4.31) алгоритма оценивания достаточно проста и не требует пояснений. Ветвь с передаточным числом (коэффициентом усиления) Н1г служит для оценивания постоянной ошибки датчика скорости. Ее сигнал вычитается из сигнала датчика скорости УхГ- Для приближенной аналитической оценки времени установления стационарного режима применим следующий подход. Допустим, что 5ду = 0, т. е. флуктуационная ошибка датчика скорости отсутствует. В этом случае уравнения ковариаций (4.32) могут быть приближенно аналитически решены тем же способом, что и ранее — путем перехода к элементам обратной матрицы А Я» А - .____________Дц “ RUR„-RV 12 ямям-я?,’ А________ Уравнение (4.7) в раскрытой скалярной форме для данного случая имеют вид е2 Ли — -р—• = 0, Л12 — Лц = 0, Л>2 — 2Л12 = 0. (4.34) лд
Для стационарного поля при достаточно большом времени оценивания t — \ eidt = е2 const t J о и из (4.34) при диагональной начальной матрице R (0) следует в2 4ц = —j—F Лаа = , л t , е2*2 6Д °ХО 46д 1 . Г2 . е.43 „а + „а + 3S„ ’ °AV0 °х0 Л Формула для /?и = а’ получается в виде 1 t* гЧ3 - °’у.+ Vм» „ G“ 1 8>< е2Р е,Ч* ' (4-35) axoalvo ^д3лУо 352аУд Приравнивая это значение дисперсии в переходном режиме при 5ду = 0 установившемуся значению (4.33), можно надеяться приближенно определить время установления (время переходного процесса). Уравнение о* = а» просто решается относительно t для достаточно больших значений времени оценивания, когда вместо (4.35) можно пользоваться асимптотическим выражением = 4 А гЧ В этом случае получаем (4.36) При указанных выше значениях параметров tyCT = 143 с. Этот простой и удобный прием приближенного определения времени установления может давать «сбои». Так, если попытаться определить время установления по дисперсии оценивания постоянной ошибки датчика скорости, то ввиду того, что /?22 ~ 0, получим <уст = оо. Достаточное (в сочетании с малостью R (0)) условие точного оценивания (1.67) выполняется в отношении 7?п. 7 А. А. Красовский
Действительно, матрица II dh иХ Ц 0Х\ дх, R 12 тождественно равна нулю только при /?и = О, В12 = 0. Однако сходимость процесса оценивания при значительных начальных ошибках нуждается в определенном обеспечении. Как правило, возрастание начальных ошибок по координате, по скорости, величине шума датчика и снижение градиента поля влечет к потере устойчивости процесса оценивания. При этом ввиду стохастического характера процессов оценивания и поля (реализация случайной функции) следует различать локальную устойчивость — устойчивость процесса оценивания на определенном участке заданного маршрута и глобальную устойчивость, когда рассматриваются статистические характеристики для целого рцДона. Хотя аналитическое исследование сходимости рассматриваемых процессов оценивания представляет большие трудности, некоторые достаточные условия в простых случаях могут быть получены сравнительно легко. Так, записывая верхнее из уравнений (4.32) в виде Ац = о2= —у- — 2Я12 -f- Зду д и принимая во внимание, что | Я12 [ < /АЖ < /Яи/?и(0) (Т?22 согласно нижнему уравнению (4.32) не возрастает, точнее, при 8М =/= 0 уменьшается), приходим к заключению, что дисперсия оценивания координаты заведомо уменьшается, если е2 ___ ---£ R11 + VВц Одуо -|- S&V 0. Это неравенство не может выполняться все время, так как в отдельные моменты мгновенный градиент е„ обращается в нуль. Однако, если процесс оценивания протекает относительно медленно, то вполне допустимо заменить ем па е и записать условие в виде _ е2 _з ^ДУ ЯдУо < -й- <*х--~ . Лд бХ
Так как ях в сходящемся процессе оценивания убывает, это условие можно заменить более жестким . е* з ®ДУ0 <, “с— ИЛИ „ ^/83хо\2 бхо O\vo< — \ д (4.37) д При в = 10-2, ож0 = 300 м и указанных выше значениях других параметров условие'г(4.37) принимает вид Одуо < Ю8 м/с, т. е. ограничение по допустимой постоянной ошибке датчика скорости является здесь слабым. Приемы и подходы, применяемые в аналитическом исследовании данного весьма простого”случая, будут использованы ниже (§"4.4) для получения приближенных оценок точности в более общих практических задачах. г) Произвольное одномерное движение. Горизонтальный акселерометр и датчик поля с флуктуационными ошибками. Рассмотрим случай, довольно близкий только что рассмотренному. Однако контролируется и используется как управляющее воздействие не горизонтальная скорость, а горизонтальное ускорение. Акселерометр, измеряющий это ускорение, имеет флуктуационную ошибку. Исходные уравнения записываются в виде Хд Vx — 0, Vx = их ?ак, Яд = ha (хд) Ч~ £д. (4.38) Здесь их — сигнал акселерометра, £ак — флуктуационная ошибка акселерометра, имеющая спектральную плотность 5ак — const. Полагая получаем ковариационные уравнения и уравнения
основного модуля фильтра Калмана е2 f2 Rlt-Rn + -^-RnRi2 = 0, лд е2 R22 h -с~ Rjt — ^як, 6д Zi — х2 = е„ [z„ — hn (£1)], *2 = 4^ ₽м [2д — hn (fl)] + их. ТТ (4.39) (4.40) Для установившегося режима _2Я1г + 4-^ = °’ 6д — R22 Н—о— R11R12 = 0, лд gg 'рЗ __ 0 —с— ^42 — Оак-дД Отсюда, полагая 5ак = оактак, 8д = ОдТд, находим <4 = = 2 Оу = Я2, = 2 е3 °^кдд ^тактд е (4.41) Полагая <так = Ю~2 м-с"2, пд = 5 м, так = 1 с, тд = 1 с, 8 = 2-10-2, из формул (4.41) получаем ох = 21,5 м, оу = 0,125 м-с-1. При 5ак = 0 переходные процессы оценивания имеют тот же характер, что и в предыдущем случае (см. (4.35)). В этом можно убедиться, сопоставляя уравнения (4.32), (4.39), которые при = 0, SaK = 0 отличаются только знаком перед Я12. Приравнивая асимптотическое выражение для о» выражению дх из (4.41), находим приближенную формулу для времени установления оценки
координаты ,2 _ О °Д ° ак у так При ад = 5 м, оак = Ю-2 м-с“2, е = 2-10~2, так = тд = = 1 с ^уст = 450 с — довольно большая величина. Следуя уже описанной методике, из первого уравнения (4.39) можно получить приближенное достаточное условие уменьшения 7?п во времени или Т?22<^-^ При ах = 300 м и указанных только что значениях других параметров величина Оу должна быть меньше 216 м/с, т. е. ограничение на начальную ошибку по скорости и здесь’является слабым. Структурная'схема'основного'блока алгоритма оценивания, описываемого уравнениями (4.40), проста. Она Рис. 4.7. Структурная схема, соответствующая^оптимальному бес-поисковому алгоритму оценивания для случая горизонтального акселерометра и датчика поля со стационарными флуктуационными ошибками. представлена на рис. 4.7. В установившемся режиме, наступающем при стационарном’изотропном поле и стационарных шумах, передаточные числа постоянны. Подобная система с постоянными коэффициентами, весьма просто
реализуемая как в аналоговом, так и цифровом вариантах, может применяться и для переходного режима и для нестационарного поля, но в этом случае она уже не является оптимальной. В схеме рис. 4.7 бросается в глаза цепь сигнала акселерометра с двумя последовательными интеграторами, характерная для любой инерциальной системы. Таким образом, здесь синтезирована простейптая инерциальная КЭНС, в которой инерциальная часть корректируется от датчика поля. § 4.2. Некоторые результаты математического моделирования простейших беспоисковых алгоритмов КЭНС Корреляционно-экстремальные навигационные системы представляют собой сложные динамические нелинейные стохастические системы, исчерпывающее аналитическое исследование которых невозможно. Алгоритмы и оценки точности, полученные аналитическим путем, обязательно должны проверяться и уточнятьсяJ путем математического моделирования с использованием карт реальных геофизических полей. Такое моделирование наиболее удобно выполнять на цифровых' ЭВМ. Это согласуется и с реализацией КЭНС, которую в большинстве случаев целесообразно осуществлять также на базе цифровых ЭВМ. Как цифровое моделирование, так и реализация предложенных или синтезированных непрерывных беспоисковых алгоритмов требуют определенной методики преобразования алгоритмов к дискретной форме. Эта методика включает создание или использование цифровой карты поля — некоторой подходящей аппроксимации не-прерывного'Ъоля, характеризуемой конечным множеством чисел. Эта карта закладывается в память ЦВМ. Дискретные аналоги дифференциальных уравнений получаются, как правило, на основе стандартных методов численного интегрирования обыкновенных дифференциальных уравнений, входящих в математическое обеспечение любой универсальной ЭВМ. Методике и результатам моделирования относительно простых КЭНС посвящен настоящий параграф.
В § 4.1 отмечалось, что беспоисковые алгоритмы экстремальной навигации, синтезируемые на основе метода нелинейного оптимального оценивания, ~в некоторой степени схожи с предложенными ранее алгоритмами КЭНС с дифференциальным съемом информации в блоке памяти. Степень схожести и различия можно4 установить после детального исследования с помощью; математического моделирования основных закономерностей, присущих сравниваемым алгоритмам. Поэтому результатам моделирования оптимальных КЭНС предпошлем моделирование простейших алгоритмов КЭНС эвристического происхождения. а) Результаты моделирования эвристического алгоритма КЭНС. На рис. 4.8 изображена структурная схема КЭНС, в которой реализован простейший корреляционный Коррелятор бокового канала, Карта блока памяти V У Датчик паля блок-! считывающих головок Коррелятор продольного канала ^к(Р) '^Р Л Р «Грубая» навигационная система £ Рис. 4.8. Структурная схема КЭНС с дифференциальным съемом рабочей информации в блоке памяти. алгоритм с дифференциальной схемой съема и обработки рабочей информации в блоке памяти [5]. При моделировании дифференциальной КЭНС предполагалось, что продольная Vx и боковая Vv составляющие скорости движения объекта измеряются с постоянными ошибками ДУХ, Д Vv, т. е. Vx = ха + ДУЖ, Vv = </д + ДУу, где хЛ, уа — истинные значения составляющих скорости движения объекта.
Для обеспечения астатизма контура к постоянным ошибкам по скорости цепи коррекции продольного и бокового каналов представлены параллельным соединением усилительного и интегрирующего звеньев И^ос(р) = А1 + -^-. Выборка информации из блока памяти производится в четырех точках, отстоящих от центра считывания на расстояниях ±6. Величина 8 выбирается в соответствии с радиусом корреляции используемого поля. Вычисляются разности = hn (ха 6, рп) ha (хп — 6, Уп), uv = ha (ха, уа + 6) — ha (ха, уп — 6), где ха, уа — координаты центра считывания. Сигналы их, иу умножаются на сигнал датчика поля гд: 2д = hn (хд, Уд) 4~ ДЛд 4~ £д, Айд, £д — постоянная и флуктуационная ошибки датчика поля. Полученные произведения сглаживаются фильтрами с передаточной функцией апериодического звена Значения Тф, кк, к2, к2 выбирались на основе приближенной теории квазистационарного режима (см. ниже) и уточнялись при статистическом моделировании. При моделировании в качестве рабочего поля использовалось поле рельефа со среднеквадратическим значением оп = 20—25 м и радиусом корреляции р = 1100— 1200 м. Среднеквадратический градиент поля составлял е = 0,007. Расстояние между считывающими точками в блоке памяти было принято равным 26 = 500 м. Во всех численных экспериментах, описанных в данном параграфе, рассматривалась локальная сходмиость процессов оценивания (см. § 1.6). Рабочая карта блока памяти КЭНС представляет собой таблицу чисел, отражающих структуру используемого физического поля в условной системе прямоугольных координат хОу, где по оси Ох отсчитывается длина участ
ка коррекции Lx, а по оси Оу — его ширина Lu. Согласно [4.7] процедура’ получения исходной таблицы чисел предусматривает введение определенного шага дискретизации AZX, AZW по координатам х и у с записью в дискретных точках * i = ZA/X, ijj = jMv, i = 0, , j = 0 , -A- значений интенсивности поля. На рис. 4.9 отражена последовательность операций, выполняемых при составлении цифровых карт поля на выбранном участке коррекции. При моделировании КЭНС было принято AZX = = AZ„ = 250 м. Программа моделирования данной КЭНС предусматривала: — определение статических характеристик корреляторов продольного и бокового каналов; — исследование точности КЭНС и оценку влияния различных возмущений, действующих по каналам измерений; — исследование переходных процессов как в условиях действия возмущений, так и при их отсутствии. При снятии статических характеристик продольного и бокового каналов цепи коррекции навигационной системы были отключены и исследовался процесс формирования сигналов vx, vv при различных постоянных рассогласованиях Дх = хп — хд, А у --- уп — уа между координатами центра считывания в блоке памяти и координатами точки, в которой измеряется поле датчиком. Движение объекта моделировалось с постоянной скоростью, равной 200 м/с, ошибки датчиков скорости (грубой навигационной системы) отсутствовали (АКХ = = AVy = 0), т. е. было принято Хд = хп, уа = уп. Интервал накопления информации, характеризуемый величиной ТфУ (V — скорость движения), существенно превышал радиус корреляции. На рис. 4.10 приведены полученные статические характеристики продольного и бокового каналов КЭНС. По оси абсцисс отсчитывается заданное значение ошибки по координате в единицах радиуса корреляции поля
si gn (Д Ji) Бинарная карта
рельефа, а по оси ординат — величина выходного сигнала коррелятора в единицах скорости движения объекта. Как следует из рис. 4.10, в области малых начальных рассогласований наблюдается линейная зависимость между ошибками по координате Д.г, Ау и вырабатываемыми 1’лс. 4.Ь>. Статические характеристики продольного и бокового каналов КЭНС с дифференциальным съемом рабочей информации в блоке памяти. в корреляторе сигналами коррекции vx, vy. При начальных рассогласованиях, лежащих в пределах 0,5р < < А < р, А = (Az)2 + (Ay)2, начинают проявляться нелинейные эффекты [4,6]. Однако знак выходного сигнала коррелятора совпадает со знаком ошибки по координате и работоспособность контура экстремальной коррекции сохраняется. Если начальное рассогласование А превышает радиус корреляции используемого поля, то контур коррекции теряет свою работоспособность. Необходимо указать на наличие внутренних перекрестных связей между каналами управления, которое обусловливается зависимостью статической характеристики продольного канала от рассогласований в боковом канале и наоборот. При малых ошибках по координате действие перекрестных связей незначительно и при приближенном исследовании квазистационарных режимов КЭНС ими можно пренебречь.
Как уже отмечалось, элементарная теория КЭНС в ква-зистациопарных режимах строится на замене корреляторов простыми звеньями с нелинейными (а при малых отклонениях — линейными) характеристиками. В таком приближении она ничем нс отличается от обычной теории следящих систем. Применим подобный подход к рассматриваемой системе, считая режим квазистационарным, а отклонения малыми (в пределах линейных участков статических характеристик корреляторов). Если постоянная времени Т$ фильтра коррелятора существенно меньше длительности переходных процессов в замкнутом контуре, то можно положить Гф ~ 0 и считать коррелятор усилительным звеном с коэффициентом усиления кк. Характеристическое уравнение замкнутого контура в этом случае имеет вид X2 + 2£о<ооХ + <1>о = 0, где ю0 = ^/скЛа — собственная частота контура, 2£0®0 = = к^к}. Таким образом, согласно элементарной теории квази-стационарного режима переходный процесс в замкнутом контуре при отсутствии шумов эквивалентен процессу в колебательном звене. Результаты моделирования (численного эксперимента) иллюстрирует рис. 4.11. Здесь представлены кривые изменения ошибки по координате в продольном канале замкнутой КЭНС при различных значениях (i>0 (Дх(1> соответствует е>0 = 0,002 1/с, Дх<2) — о>0 = 0,005 1/с, Дх(,) — (оо — 0,007 1/с). Видно, что при ш0 = 0,002 1/с в КЭНС существует глубокий квазистационарный режим управления с характерной для него высокой точностью определения координат местоположения в установившемся режиме. Переходные процессы «списания» начальных ошибок Дх, Ду в этом случае плавные с большим временем регулирования. Увеличение собственной частоты контура до (оо = = (5—6) 10~3 с-1 приводит к форсированию процессов и, как следствие, к увеличению дисперсии ошибок по скорости и координате. Процессы «списания» начальных рассогласований по координате протекают достаточно энер
гично. Дальнейшее увеличение собственной частоты <оо вызывает еще более интенсивное «раскачивание» системы. При <оо — 0,01 с’1 контур экстремальной коррекции теряет работоспособность. Обобщающие графики зависимости длительности переходного процесса и установившейся точности определения Рис. 4.11. Влияние собственной частоты контура на качество переходных процессов в КЭНС. координат от собственной частоты контура ю0, полученные в результате обработки результатов моделирования, приведены на рис. 4.12 и рис. 4.13, где Х/р и <зх/р — длительность переходного процесса (в пространстве) и установившаяся ошибка по координате, выраженные в единицах радиуса корреляции поля. В процессе моделирования замкнутых КЭНС определялась граница максимально допустимых начальных рассогласований по координате, в пределах которой сохранялась эффективность контура экстремальной коррекции. Было установлено, что при Д < 1000 м в каналах КЭНС происходит списание начальных ошибок и выход контура в установившийся режим точности. При Д >• 1000 м работоспособность контура коррекции нарушается, что не противоречит результатам, приведенным на рис. 4.10.
Сильное влияние на работоспособность рассматриваемого контура оказывают постоянные составляющие ошибки датчика скорости. Несмотря на астатизм к данному' виду ошибок, нелинейность статических характеристик каналов системы совместно с необходимостью соблюдения в контуре квазистационарного или близкого к нему Рис. 4.12. Зависимость длительности переходного процесса в КЭНС от собственной частоты контура. 0,002 0,004 0,006 0,008 О,О1шо,с-> Рис. 4.13. Зависимость точности КЭНС от собственной частоты контура. режима определяют максимальную допустимую величину ДУХ, ДУЮ при которых сохраняется эффективность КЭНС. Действительно, при малом значении со0 = <в0 (1) за счет преобладания ошибок по скорости над вырабатываемыми в корреляторе сигналами коррекции гх> пи отклонения в системе будут нарастать практически по линейному закону । t t Дх (Z) = j (ДУХ — kiVx — кг J vxdt j dt ~ J O^V^dt, о 0 0 t t t by (0 = J f ДУу —• kjVy — k3§ vydt 1 dt = J bVydt. о L о о В результате наступит момент, когда КЭНС выйдет на нелинейный участок статической характеристики, где коэффициент усиления резко уменьшается (рис. 4.10). Продолжающееся нарастание ошибок Дж, Ду приводит к появлению больших рассогласований в системе, потере однозначности между отклонениями и вырабатываемыми
в корреляторе сигналами коррекции и, как следствие, к потере работоспособности КЭНС в целом. Увеличение собственной частоты контура при том же значении ошибок по скорости обеспечивает функционирование КЭНС с выходом в установившийся режим работы. На рис. 4.14 представлены кривые изменения ошибок по координате Az и скорости ДУХ в продольном канале Рис. 4.14. Изменение ошибок по скорости и координате в продольном канале дифференциальной КЭНС для различных значений собственной частоты контура о>0. системы при различных значениях собственной частоты контура ©о, полученные при моделировании замкнутых дифференциальных КЭНС. Из приведенных графиков следует, что при начальной ошибке по скорости, равной ДУЖ/У =5%, значение (о0 = 2-10-3 с"1 не обеспечивает работоспособность КЭНС в силу рассмотренных выше причин (график Дх(1) на рис. 4.14). Только при coo = 4-10'3 с'1 выполняется условие нахождения КЭНС на линейном участке статической характеристики и обеспечивается выход системы в установившийся режим. Это показывают кривые ошибок Дж(2), ДУХ(2> на рис. 4.14. Дальнейшее увеличение ошибок по скорости потребовало выбора и большого значения коэффициента усиления цепей коррекции. Например, при
&VJV =7% работоспособность рассматриваемой КЭНС сохраняется только при <оо > 0,005 1/с (кривые Дх(3) и ДУ х(з) на рис. 4.14). По результатам моделирования был построен обобщающий график зависимости максимально допустимой ошибки по скорости грубой системы Д У/У от собственной частоты контура управления <о0, приведенный на рис. 4.15. Рис. 4.15. Зависимость максимально допустимой ошибки по скорости от собственной частоты контура управления ш0. При моделировании исследовалось также влияние шумов датчика поля £д на качество процессов управления и достижимую точность рассматриваемой КЭНС. При соотношении оп/Од > (2—3) длительность переходного процесса и установившаяся точность в данной КЭНС определяется в основном выбранным значением собственной частоты контура коррекции <во. Здесь стп — среднеквадратическое значение поля, используемого для навигации, стд — среднеквадратическое значение флуктуационных ошибок воспроизведения поля бортовым датчиком. При оп/ад <Z 1 и неизменном значении <во точность определения координат местоположения ухудшается, а переходные процессы затягиваются. На рис. 4.16 приведен график зависимости точности КЭНС от отношения опМд, построенный по результатам моделирования при соп = = 5-10-3 с-1. Эвристический корреляционный алгоритм моделировался также применительно к КЭНС, в которой в качестве «грубой» навигационной системы используется инерциальная система. Структурная схема одного из кана
лов данной системы (рассматривается одномерная задача) приведена на рис. 4.17, где введены следующие обозначения: ДРо — начальное значение угловой ошибки установ ки гиростабилизированной платформы в плоскости горизонта, <0др — дрейф гироплатформы, Vo — действительное значение скорости летательного аппарата, ДУХ — ошибки инерциальной системы в определении скорости, их — сигнал коррекции, вырабатываемый в корреляторе продольного канала, хп, Рис. 4.16. Зависимость точности КЭНС от соотношения сигнал/ шум при (00 = 0,005 с-1. Vx — скорректированные значения продольной координаты и скорости — выходные параметры КЭНС. Блок формирования сигналов коррекции включает в себя карту поля со считывающими головками, коррелятор и датчик поля. Рис. 4.17. Структурная схема дифференциальной КЭНС с инерциальной навигационной системой в качестве «грубого» измерителя. Характеристическое уравнение для замкнутого контура с учетом принятых ранее допущений для линейного
участка статической характеристики имеет вид X4 + к^кнЮ 4- (fc2%K 4* со*2) X2 + (kakKg -|- /cjfcitco*2) X + 4- ktkKg 4- кгкк(Л*2 = 0, со* = V g/R> — частота Шулера, g — ускорение силы тяжести, /?3 — радиус Земли. Анализ показывает, что хорошее качество переходных процессов получается в случае, когда корни характеристического уравнения выбираются кратными действительными, равными соо. Для обеспечения кратного расположения корнет коэффициенты цепей коррекции кх, к2, ка, kt должны удовлетворять следующей системе уравнений: кгкК = 4 wo, /c2fcH 4- (О*2 = 6 (Do, kakKg 4- к^кцО)*2 — 4(оо, kjtxg /c2fcK(o*2 = coo. Собственная частота контура (оо, как и в случае простейшего варианта построения КЭНС, определяет качест- р 1,0 0,8 0,6 0,4 0,2 0,002 0,004 0,008 0,008 0,01 ы0,с-’ во переходных процессов и установившуюся точность. На рис. 4.18 приведены обобщающие графики зависимости установившейся точности в системе по координате ох/р и вертикали ор от собственной частоты контура (Оо, построенные на основе обработ -ки результатов моделирования. Из данных графиков следует, что при отсутствии Рис. 4.18. Зависимость точно- возмущений выбором малого ста КЭНС от собственной час- значения (Оо можно обеспе-тоты контура w0- чить в контуре глубокий ква-зистационарный режим управления, характеризуемый высокой точностью определения координат местоположения (стх <^0,1 р), скорости (оду 0,2—0,3 м/с) и углового отклонения гиростабилизиро-ванной платформы от местной вертикали (ор 0,1—0,2'). Однако переходные процессы при этом сильно затянуты, а длительность процесса установления гироплатформы по
вертикали достигает (200—220) р, что объясняется наличием в контуре низкочастотного консервативного звена с периодом собственных колебаний 84,4 минуты (периодом Шулера). Влияние шумов датчика поля £д на точность определе ния координат местоположения и вертикали иллюстриру- ет график на рис. 4.19. В области больших значений стп/од > 2—3 установившаяся точность КЭНС с инерциальной навигационной системой определяется принятым значением собственной частоты контура соо, при оп/ал 1 точность КЭНС существенно ухудшается. Остановимся подробнее на рассмотрении влияния дрейфа гироплатформы на работоспособность контура экстремальной коррекции. Постоянная составляющая дрейфа Рис. 4.19. Влияние шумов датчика поля на точность КЭНС. гироплатформы вызывает в некорректируемой навигационной системе появление ошибок по скорости и координа- те, определяемых выражениями AVодр (0 — ^з^др [1 cos [1 t — sin <a*t (4.42) Вертикаль при этом совершает колебания по закону ДРдр = -Э2- sinw*f- Из (4.42) видно, что ошибка в определении скорости инерциальной навигационной системой содержит постоянную составляющую, пропорциональную дрейфу гироплатформы. Ерли коэффициенты усиления цепей коррекции малы, то хотя в корреляторе и вырабатывается сигнал коррекции правильного знака, его величина недостаточна, чтобы скомпенсировать нарастающие ошибки по координате. В результатесистема выходит на нелинейный участок статической характеристики’ с последующей потерей однознач-
пости между сигналом коррекции и ошибкой по координате. КЭНС теряет работоспособность. При увеличении собственной частоты контура управления сигнал коррекции компенсирует действие возмущения и ошибка по координате не нарастает. В качестве иллюстрации на рис. 4.20 приведены графики, отражающие влияние постоянной составляющей дрейфа гироплатформы на работоспособность КЭНС при различных значениях а»0. Как следует из графиков, при дрейфе в продольном и боковом
каналах инерциальной навигационной системы, равном Ыдрх = Ыдр у = 0,6 град/час, малое значение коэффициентов усиления цепей коррекции (w<> = 0,003 с"1) не обеспечивает выход дацной КЭНС в установившийся режим. Поведение вертикали (Д0Л, Др>„) и характер изменения ошибок, по координате (Дх, Дг/) практически совпадают с аналогичными процессами, имеющими место в некорректируемых инерциальных системах. Увеличение собственной частоты до ы0 = 0,005 с'1 при том же значении дрейфа гироплатформы, делает рассматриваемый контур экстремальной коррекции работоспособным. Кривые, приведенные на рис. 4.21, позволяют выяснить, как в сложном контуре КЭНС происходит компенсация постоянной составляющей дрейфа гироплатформы. На zU м 44^4 Ч с1 07 000-600-400- 0.00 о -от 4т 4 3 2 1 о /удр^ = 0.194-1O'SC'1 = МграО/тс , 44»вт -Z -600 -з --4 -000 0,1 о 5 4 3 г 1 о «Л -4 -0,2--5 160 г^ИГуСТ Им - И,„с, ~ 4,5М-С1 ^*2лат ^-гУдрд Рис. 4.21. Запоминание постоянной составляющей дрейфа гироплатформы в КЭНС. рис. 4.21 приняты следующие обозначения: Дхавт, Дравт — ошибки инерциальной системы по координате и вертикали в автономном режиме работы при наличии постоянного дрейфа <одр х — 0,4 град/час, Дх, Дрх — ошибки КЭНС по координате и вертикали соответственно, Uhi, “иг — выходные сигналы интеграторов (к2/р, kjp), включенных в цепи коррекции.
Компенсация дрейфа происходит с помощью интеграторов. Большая часть дрейфа компенсируется интегралом сигнал которого и„2 имеет противоположный знак по сравнению с возмущением содрх и сцставляет примерно 65% от его величины. Установившееся значение сигнала Una» как следует из рис. 4.21, равно 0,124- 10“5 с'1. Следовательно, нескомпенсированным остается сигнал Д(Одр — СОдр х — Пи2уст 0,07-10 ° с \ который в соответствии с формулой (4.42) вызывает появление постоянной составляющей ошибки определения скорости ДУХ = 4,5 м-с’1. Влияние ошибки Д Vx на контур определения координаты местоположения ликвидируется за счет применения интегратора кг1р. Установившееся значение выходного сигнала интегратора u„lycl- = = —4,5 м-с1 противоположно по знаку ошибке ДКж^и полностью ее компенсирует. Таким образом, после окончания переходного процесса влияние постоянной составляющей дрейфа гироплатформы на установившуюся точность данной КЭНС исключается. б) Результаты моделирования оптимальных алгоритмов беспоисковых КЭНС. Первым моделировался алгоритм (4.11), (4.13) для оценивания равномерного движения *). ^Для случая равномерного движения, датчика скорости с постоянной и флуктуационной ошибками и датчика поля с флуктуационной ошибкой в соответствии с (4.1) — (4.3), (4.11), (4.13) была составлена рабочая программа моделирования. Дисперсии начальных ошибок оценивания координаты хд, скорости Vx и постоянной составляющей ошибки по скорости «грубой» навигационной системы Д Vx были приняты равными Охо = 10е М2, ОУхо = 100 М2-С’2, Од Ухо = 100 м2-с'2. Начальные условия для решения системы уравнений (4.11) определялись по показаниям «грубой» навигационной системы, соответствующим моменту включения фильтра 2д (0) = хгнс (^вкл), Vx (0) = Угнс («вил), а для вели • *) Ниже приводятся результаты моделирования продольного канала оптимальной КЭНС, т. е. рассматривается одномерный случай.
чины ДKv(0) в качестве начального условия принималось нулевое значение. Движение датчика поля, т. е. действительное движение, моделировалось с постоянной скоростью, равной = -- 200 м/с. При составлении рабочей карты блока памяти использовалось поле рельефа участка местности, на котором исследовались дифференциальные КЭНС. Дополнительно было принято предположение о линейном характере изменения поля между соседними узловыми точками в блоке памяти, что позволило, используя простые соотношения, рассчитывать значение интенсивности поля в любых промежуточных точках. Естественное стремление при этом увеличить шаг дискретности записи поля с целью сокращения потребного объема памяти ЦВМ приводит к увеличению ошибок линейной аппроксимации поля внутри интервала записи, частичной потере рабочей информации, уменьшению соотношения сигнал/шум в системе и, как следствие, к ухудшению точности КЭНС в целом. Выбор малого значения шага дискретности при достаточно полном отражении структуры используемого физического поля и высоком соотношении сигнал/шум (определяемом в основном ошибками картографирования и ошибками измерения поля бортовым датчиком) приводит к чрезмерному увеличению объема памяти ЦВМ, необходимой для хранения рабочей карты. В процессе моделирования степень приближения дискретной карты с линейной аппроксимацией поля внутри интервала записи к исходной непрерывной карте, для различных значений шага дискретности, определялась по корреляционной функции ошибки аппроксимации поля и точности оценивания координат местоположения. График зависимости дисперсии ошибки линейной аппроксимации поля Од; от шага дискретности, построенный на основе обработки результатов аппроксимации, приведен на рис. 4.22, а изменения ошибок оценивания координаты местоположения Дх = х — хл в процессегмоделирования иллюстрируют графики на рис. 4.23, где х — оценка продольной’координаты — выходная величина КЭНС, х:1 — действительное значение продольной координаты летательного аппарата.
Как следует из данных графиков, при значениях шага дискретности A= 250 м, AZ2 = 500 м в силу невысокого уровня дополнительных шумов (одц = 2 м2, ol/г = 8 м2) Рис. 4.22. Зависимость дисперсии ошибки линейной аппроксимации поля рельефа от шага дискретизации. точность оценивания координат высока. Дальнейшее увеличение шага дискретности приводит к увеличению ошибки аппроксимации поля и значительному ухудшению точности оценивания координат местоположения. Так, например, при Д1 = 1500 м дисперсия ошибки аппроксимации поля составляет Од1 = 68 м2, а процесс оценивания координат носит явно неудовлетворительный характер. На основании данных, приведенных на рис. 4.22. и 4.23, для дальнейшего моделирования значение шага дискретности записи поля AZ было принято равным 500 м. Дх, м Рис. 4.23. Изменение ошибок оценивания координаты в оптимальной КЭНС в зависимости от величины шага дискретизации записи поля в блоке памяти. При моделировании алгоритма оптимальной КЭНС исследовалось влияние флуктуационных ошибок датчика
поля и постоянной составляющей ошибки измерения скорости ДУЖ автономной навигационной системы. Действие флуктуационной составляющей ошибки датчика поля проявляется в «затягивании» переходных процессов и снижении точности. На рис. 4.24 показано изменение дисперсии ошибки оценивания продольной координаты, полученное моделированием, для различных значений Рис. 4.24. Влияние флуктуационной составляющей ошибки датчика поля на переходные процессы. спектральной плотности флуктуационной составляющей ошибки датчика Sa (5, 10, 50, 100 м2-с). Как следует из приведенных графиков, при Sn = 10 м2-с через 10 секунд работы фильтра дисперсия ошибки оценивания координаты составляет о* = 900 м2, в то время как для 5д = = 100 м2-с эта величина равна 10 000 м2. Таким образом, подтверждаются полученные аналитическим путем выводы о малой длительности переходных процессов оценивания при невысоких уровнях шумов. Влияние постоянной составляющей ошибки по скорости автономной навигационной системы иллюстрируют графики, представленные на рис. 4.25 и рис. 4.26, где Д;г(о) отражает процесс изменения ошибки по координате в некорректируемой навигационной системе.
При ДVx = 5 М"С 1 (ДУХ/К = 2,5%) сходимость оценок по координате г и скорости Ёл. к их действительным значе- Рис. 4.25. Изменение ошибок оценивания в оптимальной КЭНС при различном уровне шумов датчика поля. Рис. 4.26. Влияние шумов датчика поля и ошибок по скорости на работоспособность оптимальной КЭНС. ниям хд, Vx обеспечивается при Sa = 10 м2-с (графики Дх<2), ДУЖ(2)) и Яд = 50 ма*с (графики Дхц), Д^х(п), что эквивалентно, с учетом дополнительных ошибок, вносимых
аппроксимацией поля в блоке памяти ЦВМ, соотношению сигнал/шум в системе, равном 3 и 1,5 соответственно. Однако время оценивания во втором случае значительно больше. При увеличении ошибки по скорости до ДКХ = 10 м-с"1 сходимость оценок обеспечивается лишь при = 10 м2-с. При =50м2*с, несмотря на уменьшение во времени элементов' 7?п, /?22, /?зя матрицы R,' наблюдается расходимость”"оценок координаты и скоростей. Таким образом, здесь имеет место описанный в § 1.7 случай, когда оценки дисперсии сходятся, а сами дисперсии ошибок расходятся. Причина этого может быть интерпретирована следующим образом. Линейно нарастающие ошибки по координате, возника-ющие-при~ наличии постоянной составляющей’ошибки по скорости АГ,, в оптимальной беспоисковой КЭНС компенсируются сигналом вида УзсЯп + + (УтГ _ ух _ дут) Оу с преобладающим влиянием первого слагаемого. Априорные сведения об интенсивности шумов датчика поля определяют величину коэффициента усиления к основного канала формирования сигнала коррекции ЭЛ Vx = ^"эГ rz«~ M*)b где к = S71. При малом уровне шумов датчика поля, несмотря на уменьшение во времени коэффициента /?п, сигнал vxRn ограничивает скорость нарастания ошибки по координате, исключая при этом в переходном режиме появление в КЭНС рассогласований, превышающих радиус корреляции р используемого физического поля. В’системе'обеспечивается формирование оценок и выход фильтра в установившийся режим слежения за действительными параметрами движения летательного аппарата. Увеличение интенсивности шумов датчика поля Sa приводит к уменьшению коэффициента усиления к, а следовательно, и к уменьшению сигнала коррекции vx. Если в начальный момент времени в силу большого значения Rn сигнал vx препятствует интенсивному нарастанию ошибки
по координате, то при t > 30—40 с за счет уменьшения величина данного сигнала становится недостаточной, чтобы компенсировать возмущение ДКХ. По мери увеличения рассогласований по координате корреляционная связь между сигналами датчика и блока памяти уменьшается, что сопровождается дополнительным уменьшением vx, а следовательно и vxRu. При Дх > Дхдоп сигналы датчика поля и блока памяти становятся независимыми, сигнал коррекции исчезает (ух ~ 0) и ошибка по координате Дх растет по линейному закону Дх == (Д Vx — ДУХ) t, где Д Vx — оценка ошибки по скорости, соответствующая моменту нарушения условия Дх<1 ДХдоп. Дальнейшее улучшение оценок скорости и ошибки по скорости не происходит, КЭНС теряет свою работоспособность. При исследовании переходных процессов в оптимальной беспоисковой КЭНС была определена область максимально допустимых начальных рассогласований по координате, в пределах которой обеспечивается устойчивая работа фильтра. Моделированием было установлено, что для выбранного участка поля рельефа эта область ограничивается величиной начальной ошибки, не превышающей Дхдоп ~ 1100—1200 метров. При начальных рассогласованиях, больших допустимого значения, т. е. при Дх (0) > Дхдоп, сигнал коррекции не формируется и КЭНС теряет работоспособность. Это подтверждает график 4 на рис. 4.27. При Дх (0) <_ <" Дхдоп в КЭНС обеспечивается быстрое списание начальных ошибок по координате, с окончанием переходного процесса за 2—8 с (графики 1, 2, 3 на рис. 4.27). Кроме того, из данных графиков видно, что при соблюдении условия Дх (0) Дядоп текущее значение ошибки по координате не выходит за пределы области максимальных допустимых ошибок оценивания. Флуктуационная составляющая ошибки датчика поля вызывает «затягивание» процесса списания начальных рассогласований. Так, например, при Дх (0) = 750 м изменение интенсивности шумов датчика в 10 раз увеличивает время переходного процесса примерно в 3 раза: с 2 секунд при 5Я = 10 м2-с до 6—7 секунд при 5Д = 100 м2-с.
Постоянная составляющая ошибки по скорости навигационной системы Д Vx практически не оказывает влияния на начальные участки переходных процессов по координате. В качестве иллюстрации на рис. 4.28 приведены графики,'отражающие характер изменения ошибок оценивания в Дх,м Рис. 4.27. К исследованию переходных процессов в оптимальной КЭНС. оптимальной беспоисковой КЭНС при ненулевых начальных условиях по координате и ошибке по скорости (До: (0) = 750 м, ДУХ = 10 м-с-1) и различной интенсивности шумов датчика поля (5Л = 50 м2-с, 5Д = 10 м2-с). Из данных графиков видно, что начальные этапы переходных процессов по координате в обоих случаях заканчиваются примерно через 3—6 с, что совпадает с длительностью переходного процесса в КЭНС при ДУЖ = 0. Дальнейший же характер изменения ошибок определяется уровнем шумов датчика поля 5Д и величиной постоянной составляющей ошибки по скорости ДУХ. В частности, при AVX — — 10 м-с-1 и 5Д = 50 м2-с (графики Дх(1), 'ДУж(1)' на рис. 4.28) после ликвидации начальных рассогласований
по координате наблюдается расходимость оценок в силу рассмотренных выше причин. При Sa = 10 м2-с и том же значении ошибки по скорости после окончания переходного процесса по координате обеспечивается сходимость оценок и выход фильтра в установившийся режим работы. ЛИ, м/с Область Ла,>Ла,дВП 1200 юоо 800 400 Ж 0 Рис. 4.28. Изменение ошибок оценивания в оптимальной КЭНС ири ненулевых начальных условиях и различной интенсивности • . шумов датчика поля. В процессе моделирования оценивалось влияние факторов, неучтенных при составлении математической модели контролируемого процесса. К числу таких факторов относится, например, постоянная составляющая ошибки измерения поля ДЛд. В отличие от (4.3) при моделировании считалось, что действительное значение выходного сигнала датчика поля наряду с полезным сигналом hn (хя, уя) и флуктуационной составляющей Ед содержит постоянную составляющую ошибки ДЛд, т. е. zn — Ьп (хя, i/д) Д/»д 5Я. Было'установлено, что при соотношении пп/| ДДд । = = 7 постоянная составляющая ошибки датчика ДЛд практически не оказывает влияния'на работоспособность фильтра, а ухудшение точности оценивания выходных координат при этом незначительно. При <тп/| ДЛд | = 3 происходит резкое увеличение дисперсии ошибки по координате, особенно в переходном режиме, ухудшается про
цесс'оценивания’скорости и ошибки по скорости. Точность фильтра в установившемся режиме невелика. При соотношении Оц/ | Д7гд | = 2 ошибка оценивания координаты местоположения в начальный момент времени превышает максимально допустимое значение, сигнал коррекции vx Рис. 4.29. Изменение ^среднеквадратической ошибки оценивания постоянной составляющей ошибки датчика поля АЛД при различном значении 5Д- носит характер белого шума, сходимость оценок в данном случае исключается. Расширение вектора состояния системы за счет введения в его состав постоянной составляющей ошибки датчика поля ДЛд позволяет повысить точность оценивания фазовых координат. Однако уменьшить ее влияние на работоспособность КЭНС в переходных режимах и обеспечить сходимость оценок при малых соотношениях оп/| Д^д I при этом также не удается. В качестве иллюстрации на рис. 4.29 приведены графики изменения среднеквадратической ошибки оценивания постоянной ошибки датчика поля Д/гд при различном уровне флуктуационных шумов 5Д, а на рис. 4.30 — графики изменения ошибок оценивания продольной Дя, боковой Ду координат летательного аппарата и постоянной составляющей ошибки датчика поля ДЛд. Данные графики были получены при моделировании совместной работы продольного и бокового каналов КЭНС, расширенном
векторе состояния и следующих значениях постоянных: O.V0 = = Ю® М2, Ovxo = оV 1/(1 = 100 м2-с'2, olvxo= Одууо = 100 м2-с’2, alho = 25 м2, Sv = ЮО м2-сЛ о! « 6-1СГ5. Как следует из представленных графиков, при малом уровне флуктуационных шумов датчика (5Д = 10 м2-с) Рис. 4.30. Изменение ошибок оценивания в оптимальной КЭНС при наличии постоянной составляющей ошибки датчика ДЛд и расширенном векторе состояния. процессы списания начальных ошибок оценивания протекают весьма интенсивно, точность фильтра в установившемся режиме высокая. Р* Итак, численные эксперименты, с одной стороны, подтверждают результаты приближенной аналитической теории, а с другой стороны, как и следовало ожидать, указывают на сложные закономерности, не охватываемые приближенной теорией. Эти эффекты проявляются при
значительных возмущениях, вызывающих большие отклонения и расходимость процессов оценивания. Что касается сопоставления эвристического дифференциального и оптимального (субоптимального) беспоисковых алгоритмов КЭНС, то очевидным является преимущество оптимального алгоритма по крайней мере в отношении времени оценивания при достаточно низком уровне шумов датчика поля. § 4.3. Алгоритмы и процессы в КЭНС, использующих гладкие поля Пространственные геофизические навигационные поля (аномальное магнитное, аномальное гравитационное) на значительных высотах являются гладкими, точнее, низкочастотными в пространственном смысле (см. главу III). Градиенты таких нолей невелики, а радиусы корреляции значительны. Последние, как правило, превышают высоту над земной поверхностью. Гладкими в некоторых случаях могут быть и поверхностные поля (например, поле рельефа равнинной местности). Малость градиента при заданном уровне шумов датчика поля снижает достижимую точность навигации и увеличивает необходимое время (дальность) оценивания. Однако большой радиус корреляции благоприятствует ликвидации больших отклонений, т. е. в этом смысле является положительным фактором. Вообще говоря, все рассмотренное выше распространяется на гладкие поля, т. е. изложенная теория может быть применена как к мелкоструктурным, так и крупноструктурным (гладким) полям. Однако указанные особенности делают целесообразным специальное рассмотрение хотя бы одной задачи навигации по гладкому геофизическому полю. В качестве подобной задачи рассмотрим в грубом приближении весьма сложную задачу навигации по аномальному гравитационному полю с контролем первой производной гравитационного потенциала (аномалий силы тяжести). Сложность этой задачи в практическом плане обусловлена тем, что уровень гравитационных аномалий по отношению к уровню шумов, создаваемых ускорениями движущегося объекта, чрезвычайно мал. Выделение аномалий гравитационного ускорения на фоне вертикальных ускорений объекта осуществимо лишь при очень точном контроле 8 А. А. Красовский
Рис. 4.31. Система координат. высоты, что возможно главным образом при движении над акваториями или на акваториях. Впрочем, развитие аэро-гравиметрической съемки 14.9—4.10] свидетельствует о разрешимости подобной задачи. в) Алгоритмы гравиинерциальной КЭНС для плоского движения. Рассмотрим движение в плоскости меридиана (рис. 4.31). Земля считается сферической. ОсьОз направлена по вертикали, ось Ох — на север. С гироплатформой, на которой установлены акселерометры, связана система координат, образующая с системой ®Oz малый угол ДО. Сигнал горизонтального (точнее, ориентированного по оси Ох} акселерометра их1 рассматриваем как управление. Сигнал вертикального (ориентированного по оси Oz) акселерометра z2 рассматриваем !как компонент вектора наблюдения и как управление uzl*). Другим компонентом вектора наблюдения считаем сигнал высокоточного высотомера, измеряющего текущую высоту Н над уровнем моря. Уравнения, выписанные с точностью до малых второго порядка относительно ДФ, имеют вид ф — , Ух Я---у? * — Их1 4- иг2ДФ — Sx ак, 8 8 7- Я = Ух, Уг=^, AO+tf-Up. V» 21 = И + ^Д) 2j 7,-+ «Х1ДФ + g (<р) + Sz ан- (4.43) Здесь Ух, Vz — горизонтальная и вертикальная составляющие скорости, Ra — расстояние до центра Земли, ф — широта, Н — высота над уровнем моря, g = g (ср) — ускорение силы тяжести, Бхак, Szaa — шумы акселеромет- ♦) Для того чтобы избежать затруднения, связанные с корре-лированностыо шумов наблюдения и управления, полагаем, что имеется две одинаковых вертикальных акселерометра. Сигнал одного из них есть za, а сигнал другого и21.
ров, принимаемые белыми со спектральной плотностью *$ак, tjz — производная вертикального ускорения, создаваемая, например, воздействием атмосферной турбулентности на летательный аппарат, ВД1, — угловая скорость дрейфа гироплатформы. Случайные функции (t), £др = £др (Z) также считаем белыми шумами со спектральными плотностями Sj, 5ДР. Введем обозначения хг = ф, х2 — Vx, х3 = Я, х4 = Vz, xs — Vz, х6 = && и запишем уравнения (4.43) в векторной форме ж + f (ж, и) = Sx, z = hz (z, u) + S„ где ~R7 f(x,u) = hz (X, u) = *4 -g— — Uzlxe — UX1 3 — «4 . ~«S 0 “ Дз z2 - + “xl«4 + g (*1) Матрицы спектральных плотностей в данном случае равны .Уд о 0 5zaK 0 0 0 0 0 0 о <У ак о о 0 0 0 0 0 0 0 0 0 *^ак 0 0 о о о о 8* о 0 0 0 0 0 *5др 0 Алгоритм оценивания типа (1.31) — (1.33) имеет общий вид а ! dh, \т , X 4- / (х, и) = Я s; [z — hz (x)J, A + (4.44)
где I» V ° ° о _А. л 0 я3 0 О 0 0—! О ООО 0 0 0 0 0 —к0 ’ о о 0 -“а О О — 1 О О О О О di 0 0 10 0 0 9g 2Л* „ „ . di,. ~ R3 и и 1 uxi 8i 2*»ем *^ак “^ак^з 0 2Л18м 4x2 п •^ак^з ^акДз 1 = 0 0-я- ^Д 0 0 0 вм 2i* л *^ак *^ак^з их1ем 2“хЛ п к ^ак “^ак^з и ем цх1ем ^ак *5"ак 2А, 2цхЛ *^ак^з *^ак^з 0 0 0 0 0 0 0 1 “xl 5ак ^ак 0 Цх1 •З'ак •Уак Достаточное (в сочетании с малостью R (0)) условие точного оценивания (1.67) в данном случае выполняется. Действительно, матрица Лм Лаа Л34 Rah Л, Ди— ди +дм+“здЯц Ли — -дг Ли + Rm + "Х1Л16 А_д 2д* -дх1 13 ~ dg 2х« ~dic^ — "Л^ R** R** “х! Д« де 2х« „ ~dx^ — “Л^ ffr> + Л‘> + “х1Я5» Jf RfS + R» + Wxl^SS тождественно равна нулю только при R = 0.
Предполагая, что существует установившийся режим оценивания, записываем -g- /? + /? (-g-)T + Л &Г S? ^-Л-8Х. (4.45) Для равномерного горизонтального полета, стационарного поля при достаточном времени усреднения можно принять Ъ _ П *2 » V2 ’ 4i2 4Р R. и’ ЯЯ’ “ s Я., S R* ~ S Я» ’ 3 3 3 3 акз ака 2^»ем _ 0 1$ак/?э >SaK 5ак1 ’ ЦП ап| fl."' II о, UX18M = о, ^ак 2х2 2V 2“*1*» п “xl f ) X1 Л бх> аК 3 ап 3 ’ ^ак^з ’ *ПК L ’ с **ак 5ак Соответственно этому получаем 1 0 п3 0 0 0 0 V V* 0 0 0 0 я7-г д/ _ di ~ 0 0 0 -1 0 8 0 , (4.46) 0 0 0 0 -1 0 0 0 0 0 0 0 0 1 "Л- 0 0 0 0 I 2 | Q-1 Z ___ \ di ) °* di ~ 8* 5ак 0 0 0 0 0 1 0 4И« 0 1 0 2V 0 5акЯа3 SaKR3 = 0 0 0 0 0 0 0 0 0 0 • (4.47) 0 27 0 0 1 0 1$,акя3 saK 0 0 0 0 0 №U Цп
Матрица (4.47) квазидиагональная, однако матрица (4.46) не квазидиагональная, поэтому декомпозиция здесь не получается. Аналитические оценки получаются в данном случае громоздкими. Иначе обстоит дело, если ввести дополнительно допплеровский контроль горизонтальной скорости, рассматривая соответствующий сигнал МХДОП — Vx “h 1доп как управление. Здесь £Доп — белый шум со спектральной плотностью Saoa. В этом случае первое уравнение (4.43) принимает вид u„ ? к *доп '•доп Ф Я3 “ • Второй член первой строки матрицы (4.46) 1/7?3 исчезает, появляется угловой член S^n/Rl в матрице Sx и декомпозиция уравнения (4.45) дает или °х — й3Оф — 5ак^доп- Полагая 5ак = Оак^ак, 5д0П = Одоп'Гдоп, получаем -2 = ^K5xon/7^. (4.48) При аак = Ю-4 м-с-2, одоп = 1 м-с-1, е=1 Этвеш = = 10-8 с-2, Так = 1 с, Тдоп = 25 с, <зх — 223 м. Однако время установления здесь велико. Для грубой оценки этого времени используем описанный выше прием рассмотрения свободного (при 5Д0П = 0) движения, когда можно принять Яи+Ля:1=о, д„- , . а« --- । --- t „2 ' с- ‘ 6 «о “ак Приравнивая 7?п и о2 и пренебрегая i/oxn, получаем / _ Зак 1 /~ Так ‘уст — —--I/ --- еадоп V тдоп (4.49)
При^ указанных выше значениях параметров получаем iy0T = 2000 с. Хотя установившаяся точность гравиинер-циально-допплеровской КЭНС выражается простой формулой (4.48), сходимость процесса оценивания зависит от многих факторов, в число которых входит и уровень ошибок высотомера и начальные ошибки по всем составляющим вектора состояния. §*4.4. Обобщенные приближенные аналитические оценки точности беспоисковых КЭНС Численное экспериментальное исследование КЭНС весьма трудоемко. Это особенно относится к исследованию глобальной сходимости, глобальной точности, когда экспериментирование производится для большого района (региона или совокупности регионов) и необходим огромный статистический материал. Поэтому аналитические оценки точности, хотя бы приближенные и справедливые лишь для установившегося режима, имеют большое значение. Как можно было убедиться из рассмотренных выше задач и примеров, рекомендуемый метод декомпозиции и другие способы позволяют получать достаточно простые приближенные аналитические оценки установившейся точности оптимальных беспоисковых КЭНС для простых моделей оцениваемого движения. Целью данного параграфа является получение приближенных аналитических выражений для установившейся точности оптимальных беспоисковых КЭНС для упрощенных, но все же практических моделей оцениваемых процессов. а) Установившаяся точность курсо-допплеровских и курсо-воздушных КЭНС. В названии КЭНС будем указывать вид «грубой» навигационной системы, сопрягаемой с КЭНС. Так, например, название «курсо-воздушная КЭНС» означает, что в качестве «грубой» навигационной системы используется курсо-воздушная (или курсо-аэрометрическая) навигационная система, в которой счисление координат осуществляется через курс и истинную воздушную скорость. Рассмотрим такую курсо-воздушную КЭНС, в которой сигналы курсо-воздушной навигационной
системы используются как управления: Uj. = V»r = Vx 4- &VX 4-Щ — Ург = Vv 4- AFV + Jyu. Здесь, как и в выражениях (4.2), Ух, Vv — компоненты путевой скорости в некоторой прямоугольной системе координат, ДУХ, ДУ„ — постоянные ошибки, £ух, — флуктуационные ошибки, создаваемые в курсо-воздушной системе в основном турбулентностью атмосферы. Шумы Sv», tv», как и ранее, будем считать независимыми белыми шумами со спектральной плотностью S&y. Уравнения движения можно записать в виде £д = Vx cos Дф 4 • Vu sin Дф = (it, — Д Vx — £yx)cos Дф 4-+ (м2 — ДVv — tvy) sin Дф, Уд = — Ух sin Дф 4- Vv cos Дф = = — (uA — ДУХ — £vx)sin Дф 4- 4- (м2 — ДУ,/ — £v„) cos Дф, L'1 (4.50) где Дф — ошибка курсовой системы, которая в режиме гирополукомпаса описывается уравнением Дф = £ф. Здесь — угловая скорость дрейфа, которая считается белым шумом со спектральной плотностью 8Д^. Кроме этого курс контролируется дополнительным датчиком, например, посредством измерения магнитного курса. Вектор наблюдения считается состоящим из двух компонент: сигнала датчика магнитного курса (точнее, отклонений магнитного курса) и сигнала датчика поля. В соответствии с этим 21 = hn (хя, уд) 4-z2 = Дф 4- £дф. Флуктуационные ошибки |д, считаются белыми шумами со спектральными плотностями Sa, 8ДФ. Учитывая малость Дф, заменяем cos Дф единицей, sin Дф заменяем Дф и пренебрегаем £у„-Дф, |ух-Дф. Уравнения (4.50) принимают вид £д 4- Д Ух — «1 4- ДУуДф — и2Дф = — fcvx, Уд 4- ДУр — «г + «1Дф — ДУхДф = — ivv, ДУХ = 0, ДР„ = 0, Дф =
Введем обозначения Ду = Хд, х2 = Д7Х, х3 = ул, х4 = AVv, х6 = Д-ф. Получаем *1 + + х4х8 — и2х8 — Uy = — £ух, х2 = О, ^3 + *4 — Я2Х8 + UyX6 — и2 = — £уу, Х4 = О, З'Б = Вф, = Иц (•*•!» ^з) ~Ь ^2 *^Б "Г ^АФ* Таким образом, в данном случае где Ъ. + — “2«s — «1 О *4 — *2*6 + “1*Б — “2 , О О 1 О £s it — u2 ООО О — £6 0 1 — i2-|-u, , ООО О ООО О _ || вм1 <> ем2 <» ’ di ~ 1| О О О О _ Э/г„ Д/г„ М1 д£у ’ Ем2 д£л ‘ Матрицы спектральных плотностей в данном случае равны 5г = ^AV о О О О Далее получаем 6М1 Sn dh \т . dh z I с~1 г _____ dx / °z di ~ Вм1ем2 „ О О 0 0 0 0 0 0 0 0 О s^v о о 0 0 0 0 О 0 о 6^ ем18мг *д О ^2 о О О о о о о о о о -Т-дАМ> /(i,u) = О О О О О О О
Достаточное (в сочетании с малостью R (0)) условие точного оценивания (1.67) здесь выполняется в отношении xs, х6. В самом деле, матрица (dhjdx 7?)т в данном слу чае равна dh„ 4- —2- Я1з /?15 “ ли 4-^-5-Л2з /^“5 dh \т = дх ) dh„ -Х-2-Я13 дхх 3 4- -х— лзз дх3 Я35 ЗЛ дхх 4“ -д -^34 Зх3 /^46 dli 2. /?15 дх. d/i 4- -д-2- Лзз Зх3 Лзз Она обращается тождественно в нуль только при Rn = 0, RS3 = 0, R63 = 0 (а значит, Rlt = 0, R3i = 0, Rti = 0, i = 1, 2.....5). Алгоритм оптимального оценивания типа (1.31) — (1.33) получается в обычной форме (4.44). Для установившегося режима 1- я + я (ЭЕ)1 + я S- п = S,. (4.51) (7Л \ с/л / \ с/л ' с/л Если движение происходит в среднем вдоль оси Ох, то можно принять = Д7„ - Д7„ -Vv- £v„ = ДГ„ - ДЁ„ - V,, == 0, — х-z -|- ui = — ДЕх Vx 4* х 4" £vx = =дух- ^x+Vx^v, где V — средняя скорость движения. При изотропном поле и достаточно большом времени (расстоянии) усреднения 6м1ем2 — 0, 8м1 = 8м2 — 8®. Кроме того, = Дф = 0.
Таким образом, df = di о о о о о 1 о о о о о о о о о е2 о о 1 о о о о о о (4.52) о о о о г di д о о о о о о о о О е2 5д О о о о о о (4.53) О 1 V.. Дф матрица о о (4.53) - Матрица (4.52) квазидиагональная, диагональная и уравнение (4.51) допускает декомпозицию о о 1 о «и «12 «12 «22 + о о о 1 о о V о о ^33 Им «35 «34 «44 «45 «И «12 «35 «45 «55 в «зз «34 «35 «34 «44 «45 «35 «45 «55 «12 В О «22 II 1 «12 II «22 II «33 “Ь «34 «35 О е2 О о е2 5д О «34 «44 «45 о О II «35 «45 «55 «11 «12 «12 «22 о О о ’ о о о о 1 *$дФ скалярной форме 2Я12 -I-1 д -/-«12 “О лд о 1 V о о о о о «33 «34 «35 «34 «44 «45 «35 «45 «55 S\V о о о о о о о л ф «22 4--Г:-«11«12 — О, Д (4.54)
27?з4 + VB3i 4" -я— 7?зз 4- -я— Яй = 8ду, дд 15 дм> Вц + V/?45 4—я— В3зВ3ц 4—я— В33Вц — О, 6д ддм> ^4s + VRt>t> 4—ё— ВЯЯВЯ6 4—я— ВЗЬВ5Ь -- О, лд дДМ> “ф- ^34 + о- ^45 ~ О» ЛД дДФ -я— B3iB35 4—я— В^Вьъ = О, *’д лдм> -^-^ + -Д-Я15 = ^. D (4.55) Из'(4.54) вытекает Йп = 0, Я22 = 0, Яп = -^|/ад?- Из (4.64) следует И Т?34 = О, /?4Б ~ О, /?44 — О, V ВЯЬ 4 ё— R33 Ч-5- ^35 ~ % ЛДф И7?ьб4—?— ВЗЯВЗЯ 4—г—В3ьВьь — О, дд лдч> 4-^4--^-^=^. □ (4.56) •Ч ^Дф Полагая, как обычно, = СТдХ’д- *^ДУ = ^цДуТду, 8д^, = (Тд^Тд^, = Од^Тдф и принимая Од = 5 м, е = 0,02, оиду = 3 м • с-1, Тду = Зс, тя = 1с, V = 500 м-с-1, Од^р = 0,02 рад, Тд-ф = 1с, Од^ = 10-5 рад • с-1, ТДф = 50 С’ находим бж = 36 м, с,, =-= 37 м, Оф 10-3 рад. Решение уравнений (4.56) не удается выразить простыми
аналитическими формулами. Поэтому каждый раз приходится прибегать к численному решению. Если теперь рассматривается курсо-допплеровская КЭНС, то постоянными ошибками измерения скорости часто можно пренебречь. Размерность оцениваемого процесса сокращается до трех: U2X8 Ui = 6vx, ^2 ^2 «1*3 Bvtri *3 ~ где х2 = ха, х2 = уд, х8 = Дф. Проделав стандартные построения при прежних предположениях, убеждаемся, что точность в установившемся режиме выражается теми же формулами, что и в предыдущем случае. Этого и следовало ожидать, так как постоянные ошибки измерения скорости в предыдущем случае для установившегося режима оцениваются абсолютно точно. б) Установившаяся точность инерциальных КЭНС. Относительно полная математическая модель инерциальной системы была рассмотрена выше и будет использована при численных исследованиях. Для получения достаточно простых приближенных аналитических оценок установившейся точности рассмотрим упрощенную модель инерциальной системы. В этой модели сигналы акселерометров рассматриваются как управления, платформа считается строго горизонтальной и учитывается' только азимутальный дрейф платформы. Если к тому же принять во внимание, что кориолисовы и другие составляющие ускорений могут быть при наличии КЭНС с высокой степенью точности вычислены и учтены в сигналах управления, то уравнения оцениваемого процесса можно записать в очень простой форме Хд — «1 — ИгДф = Вак х, Уд — «2 + Ki Дф == — Вак у, Дф = Вф- где Вакх, бак у — флуктуационные ошибки акселерометров (постоянными ошибками акселерометров пренебрегаем). Условия наблюдения те же, что и в предыдущем случае: Zi = hn (тд, уд) + бд, z. = Дф -Ь Вл».
Таким образом, кроме инерциальной системы и датчика поля предполагается грубый датчик курса, например магнитный, имеющий флуктуационную ошибку. Вводя обозначения х± = х„, х2 = хл, Х3 = Уд, xt = Уд, х& = Дф, записываем Xj Х2 — О, Х2 Щ и2Х6 бакх, $3 *^4 О, *4 ~ Ы2 + UXX6 = — Баку, £6 = Ц, = hn (х1т ;гэ) + ёд, Z2 = Хъ + gA,j-. В данном случае df __ dx 0 0 0 0 0 - 1 0 0 0 0 Jn 6Д 0 0 0 0 0 0 0 0 -1 0 0 0 0 0 — <‘2 0 “1 0 eMieM2 *д 0 0 0 0 0 dh е2 1 S’z1 M1M2 0 ЬМ2 0 0 dx / dx ^д 5Д 0 0 0 0 0 0 0 0 0 1 ^ДФ й/i dh Выражения для матриц -д-, -ч- К здесь точно такие же, OI OI как в только что рассмотренном варианте, и достаточные условия точного оценивания (1.67) выполняются в отношении Лд, х3, х6. Для равномерного в среднем движения Uj = й2 — 0 и 0 — 1 0 0 0 0 0 0 О 0 df =: 0 0 0 -1 0 dx 0 О 0 0 0 0 0 0 0 0
Для изотропного ПОЛЯ _______________ о ЭЛ, \т . dh дх } дх О О О о О О 8* 5Д О О о о о о о о 1 ^Дф (4.58) Матрица (4.57) квазидиагональная, матрица (4.58) — диагональная и уравнение (4.51) допускает декомпозицию. Не повторяя более однотипных выкладок, записываем скалярные уравнения (4.59) — 2 Я 34 я— Яда + -5— Яда = О, °д ЛДФ — Я44 + -я— Я33Я34 + -я Яз6Я«| = О, sn л ДФ — Я45 4—=— Я33Я36 4—я— Я35Я36 = О, 15 д дДФ е* 75® [ * ~ё -‘‘34 П ё -“45 — Одк, дд дДФ -я— Я34Я35 4—о— Я45Я55 = О, Лд 15 дф । 1 р2 __ о S3. Л36 ^Дф ~ дд'*’’ Полагаем, как обычно, <^д — ОдТд. Зак — Оактак> ^Дф — <7дфТдф, — °дфтд^>
после преобразования получаем ам> V Итдм>тдф • (4.60) При Од = 5 М, Е = 0,01, Сак = 10~3 М-С~2, Тд = 1 С, Так = 1 с, адф = 0,02, = 10~5 с-1 получаем ох = 22,4 м, oVx = 0,842 • Ю~2 м • с"1, оф<0,45 • 10’3. Инерциальные КЭНС обладают наибольшими возможностями в смысле выдаваемой информации. Для полной схемы помимо координат, скоростей, курса с высокой точностью оценивается вертикаль. § 4.5. Бесплатформенная инерциальная беспоисковая КЭНС [4.6] Допустим, что с антенной (лучом) дальномера жестко связан трехгранник О^у^, ось которого направлена противоположно лучу дальномера (рис. 4.32). Поверхность Земли будем считать строго сферической (движение над акваториями). Использование эллипсоида или какой-либо другой гладкой .фигуры Земли существенных изменений не внесет. Радиус Земли обозначим через Н3, а высоту точки Ог над уровнем моря через у. Начало земной прямоугольной системы координат Oxyz поместим в точку основания Рис. 4.32. Система координат. вертикали, опущенной из OY на земную сферу, ось Ох направим в плоскости меридиана па север, ось Оу — верти- кально. Направляющие косинусы между связанными и земными осями обозначим через е,ц, i, J = 1, 2, 3. Укло
нениями отвеса пренебрегаем, однако учитываем аномалии вертикальной составляющей гравитационного поля Земли. В этом случае эта составляющая является функцией широты, долготы и высоты: g = g (ф, Ь, У)- Уравнения Эйлера для движения твердого тела запишем в виде Ух, 4- t, — <Oz,V и, + ge21 = jXl, У», + ^Ух, — шхУZl 4- ge22 = Vz. + ®хУ,ц — e>uyXl -f- ge23 = jIt, . «x, + Xx(0,„ • (|>Z, = iaxi, ®l/l 4" WZ1 ~ /“i;,’ <*>Z. + Хго>х, • wM, = 74,’ г I (4.61) где jx, (йх, jWi с соответствующими индексами — компоненты в связанных осях скорости, негравитационного ускорения, угловой скорости и углового ускорения соответственно, хх, xw, хг — отношения моментов инерции. Будем полагать, что вторые производные компонент скорости являются случайными функциями времени типа независимых белых шумов Ух, = £1, Уш = &з, V2, = g3. (4.62) Запишем уравнения Пуассона для шести направляющих косинусов, используя также три дополнительных алгебраических соотношения: 812 + — ®х,813 + (й 4- X) sin<peS2 + фе22 = О, 818 4" ®х,822 — 4>у,8ц + (Q 4 М sin ф833 -|- фе28 = О, ё23 4- ®г,е21 — соЯ1е28 — (й 4- X) cos <ре82 — фе12 = О, ё2з 4- о>х,е22 — й>у,е21 — (й 4- X) cos <ре88 — <peI8 = О, ёза 4- <а2,е81 — ci)X1e88 4- (й 4 X) (cos <рв22 — sin фв12) = = О, 83з 4- Ох,8з2 — “|/,831 4- (Q 4- X) (cos <ре28 — sin <ре18) = = О, 8ц — е22е88 828882, e3J = 8д2823 813е22, 82i = 813Р,32 — 8д2833, L (4.63) где й — скорость вращения Земли.
Скорости изменения широты, высоты и долготы имеют выражения ф — (#8 + У)~1(Уxfill + ^ше12 + ^г.е1з), У ~ Vх,®21 + Vу,8м + Vzfi%3i X = ((7?з + у) COS ф) х(^х«е31 + Vi®3i + V«833) — Й• (4.64) Наклонная дальность до сферической земной поверхности в первом приближении равна ye^l- Поправка второго приближения имеет вид Она обычно относительно мала и может быть вычислена с высокой абсолютной точностью. Поэтому в качестве первого компонента вектора наблюдения принимаем сигнал дальномера, выражаемый формулой 21 = Увза + К, (4.65) где — флуктуационная ошибка дальномера — белый шум. Кроме измерения наклонной дальности на борту летательного аппарата предполагается производить контроль линейных] ускорений /Х1, jy„ jz„ угловых ускорений /о, , /®z,’ Угловых скоростей <ох„ <aUt, u>Zl и составляющих путевой скорости VXl, Vv„ VZt. В соответствии со способом перераспределения информации сигналы линейных акселерометров и датчиков угловых скоростей примем в качестве составляющих вектора наблюдения 21 = /х, "I" Bz.’ = /у, -|- Sz,» 24 = ]ZJ -|- Sz*. 2S = <0x, +5z„ 2в=(Иу,+1г„ ZT==ti>z, +l„, где Sz., . . . , Sz, — независимые белые шумы. Сигналы датчиков угловых ускорений и составляющих путевой скорости (знание^которых эквивалентно измерению Ф, X, у) будем рассматривать как управления м1<1 = + Sx,«, un = /<ОУ| + Sx„, W18 = ?Х|«, «i = fp4-Sx„ иг = к -|-]Sx„ из=У-\1х,- (4.67) (4.66)
Шумы £Х1, L.. 6х„» L„, L-,. также считаются белыми некоррелированными. Введем единые обозначения для компонент вектора состояния рассматриваемого процесса Xj = <р, хя = V2l, хг = к, хя = у, хл = VXi, х6 = Vv„ Хч = РХ1, х» = V„„ Xg = X1<t = 812, Хц — e18, x12 — e22, x18 — e28, xlt — e82, ^16 = e3S, Xie = ©X1, Хц = (0W1, X18 = (021. □ (4.68) С учетом принятых обозначений уравнения процесса запишутся в виде — U., *4 — хч = 0, Хч = £х„ х2 = и2 — £х„ i5 — хв = 0, xg = £х,, *з = «3 — *e — хв = 0, £9 = gx„ * 10 + /10 (х, и) = £xio, *13 "I" /13 (х, и) = £Х11, * и + /11 (х, и) = 6Х„, i14 4 /14 (х, и) = $Х14, * 12 ч /12 <х, и) = £Х1„ £1Б 4- /15 (х, и) = £Х1„ * 1« + XxXjjXis = Uj« — £X|,I * 17 4- XyXigXig = Ui4 Sxm * 18 -F XAe*17 = U18 — 6x„. Ci (4.69) Здесь /10 (x, u) = (Xj^u — x19xu) xlt — XnXie + 4 (Q 4 u2) sin X&4 4- uxXi2t /11 (x, u) = ХдоХдо — (xi2Xig — ХхзХц) Хуч 4~ 4- (Q -F u2)sin XiXit 4- UjXjs, /12 (x, u) = (^11^14 — ^lO^ie) ж18 — ^13^16 — - (fi 4 Ug) cos х1хй4 — uxXi0, /13 (x, u) = Xi2Xie — (ХцХц xloxlj) Xt4 — — (Й 4“ w2) COS XiXib — ихХц, /14 (x, u) = (^10^13 XltXi2) xtg ХцХ1в + 4- (Й 4- “г) (cos ^1*12 — sin ^Ло), /15 (x, u) — ХцХуе (x10Xig ХцХ12) Xj7 4" 4- (Q u2)(cos XyXyg — sin XiXn). U (4.70)
Шумы Sx,., . . . , Sx„ имеют выражения Sx» = Sx, sin XjX14 4- Sxi*12’ Sx,, — Sx, COS £j.2j.5 Sx, *11, Sxu = Sx, sin x^ -f" Sxi-Z'is, Sx» ~ Sx, (cos x2Xi2 sin 24*10), Sx« — — Sx, COS X2Xl4 Sx,*10, Sx„ = . = Sx, (cos XXX13 — sin ЯрГц). Компоненты вектора наблюдения согласно (4.65), (4.66), (4.68) и (4.61) имеют вид Hzj — h± (х) 4" Sz, = *3^*12 4- Sz,, z2 = h2 (x) 4- Sz, = — *7 4" *«*17 — X5X18 4" g (x1, X2, xa) (xlxX14 — *10*l&) 4” 4- Sz„ z8 = h3 (x) 4- = xs 4- x4x18 — xex14 4- 4- g (*1, X2, X3) x12 + Sz„ z4 = ht (x) 4- lzt = xa 4- x6xIe — x4x17 4- I g (*1, *2, *3) x13 4- Sz., ze = h6 (x) 4- Sz, = *ie 4- Sz„ z4 = h3 (x) 4- Sz, = X11 4” Sz,, z7 = hi (x) 4- Sz, = *18 4- Sz,. □ (4.71) Шумы дальномера, акселерометров и датчиков угловых скоростей независимы, а следовательно, матрица Sz— диагональная. В данном случае уравнения оцениваемого процесса и условия наблюдения являются сложными многоразмерными и для практической реализуемости следует использовать наиболее экономные в вычислительном отношении алгоритмы оценивания. Такими алгоритмами являются алгоритм с эмпирической ковариационной матрицей (1.48) — (1.50) и алгоритм (1.51) — (1.53), получивший название сокращенного алгоритма. Последний в данном случае имеет вид х 4- / (*, и) = лДх, , (472) \Т 1 74 —Дх । 571 |z — hz (х)], dz /
где X = || Xi, х2.,. х18 ||т, / (х, и) = || — их — и2 — и3 — х7 — х8 — х9 О О О /10/11/12/13/14/15 XxAlT^ie и1в -- ^17 ^2^10*^17 — ^18 /гг = || hxh2 ...h, ||T. Достаточные условия точного оценивания при малом Дх согласно § 1.3 сводятся к линейной независимости столбцов матрицы dhjdx (или dhj&i). Транспонированная матрица (dhjdx)* согласно (4.71) равна 0 9g дх^' 9g дхг Ж1* 9g 9Xi113 0 0 0 9g 9g dg 0 9хг**' dxt x™ 9xtXi3 0 0 0 1 9g 9g 9g ха 9х3^ 9x3 1,2 dx3 *>3 0 0 0 0 0 xm — г17 0 0 0 0 — X1S 0 Xie 0 0 0 0 Х)7 — xin 0 0 0 0 0 1 0 0 0 0 0 <эл \т 0 0 1 0 0 0 0 ~дх~/ = 0 0 0 1 0 0 0 0 - S*is 0 0 0 0 0 0 gxH 0 0 0 0 0 »з хг *12 0 g 0 0 0 0 0 0 0 g 0 0 0 0 0 0 0 0 0 0 — £*10 0 0 0 0 0 0 0 xt *5 1 0 0 0 хв 0 -X, 0 1 0 0 ~хь xi 0 0 0 1 Легко видеть, что строки этой матрицы линейно независимы. Таким образом, достаточное (в сочетании с малостью Дх (0)) условие точного оценивания в данной системе выполняется. Реализация рассматриваемого алгоритма сводится к численному интегрированию уравнений (4.72) с вводом значений сигналов датчиков на каждом шаге.
Оценку точности в установившемся режиме проведем для алгоритма (1.31) — (1.33) на основе изложенного в §1.4 метода усреднения и декомпозиции. Согласно (1.75) + + <4.73) Легко проверить, что матрица имеет квазидиагональную форму, причем блок размера 3 X 3 в верхнем левом углу этой матрицы для изотропного поля, для которого компоненты градиента dgldx^ dgldi^, dgldxa независимы в статистическом смысле, является диагональным и при равных интенсивностях шумов акселерометров (8г, = Sz. = Sz. = SaK) имеет вид Соответствующий блок матрицы df/дф состоит лишь из нулевых элементов, а блок матрицы Sx — диагональный: Кх. 0 0 О «X, о . о о В этих условиях матрица Л также имеет диагональный верхний левый блок Ifin О О Q _0 , о о Яя8
причем согласно (4.73) ^7 (-Цг) = = (4.74) = (4,75) Для изотропного ПОЛЯ Ж-^ «.те) где d — среднеквадратическое значение «горизонтального градиента» гравитационного поля (в единицах ускорения на единицу расстояния). Реальные шумы акселерометров, допплеровской системы и дальномера являются цветными, хотя их воздействие на медленный процесс оценивания практически эквивалентно воздействию белых шумов. Поэтому полагаем д2 <г Д® Т о „2 _ а идоп€доп о uдоп1 доп °ак — оактак» , OXj = ♦ 7?’ 7?|cos’<p Sx. — °доптдоп> Sz, — Пдал^дал, (4.77) где аак, Одоп, адал — среднеквадратические ошибки акселерометров, допплеровской системы и дальномера соответственно, так, тдоп, тЯаЛ — соответствующие времена корреляции. Здесь принято /?3 + </ ~ Ra, т. е. движение летательного аппарата происходит вблизи поверхности Земли. Выражая ошибки оценивания географических координат в единицах расстояния, записываем с£ = ВцН1, Uz = cos2 <р. (4.78) Из (4.74) — (4.78) получаем ~2 °ак3доп У^ак’доп их — иг----------» ~2 _ _________° ДОП ]^ТДОП_________ \/ 1 У , ем Г X \ f д* х иакьак дал*дал
При аак = 10-4М-С-2, Одон = 1 М’с~\ Так = 1 С, Тдоп = — 20 с, d = 1 Этвеш получаем ох = oz = 700 м. Интересно, что установившаяся точность оценивания горизонтальных координат не зависит от ошибок дальномера, датчиков угловых скоростей и угловых ускорений. Это имеет место именно в установившемся режиме при указанных условиях. Длительность переходного режима и сама сходимость процесса оценивания зависят от интенсивностей шумов всех датчиков информации. § 4.6. Алгоритмы оценивания высоты При маневрировании летательного аппарата по высоте при изменении высоты вследствие воздействия турбулентной атмосферы сигнал радиовысотомера помимо составляющей, соответствующей рельефу, содержит составляющую, зависящую от изменения абсолютной высоты (над уровнем моря). При использовании рельефа в качестве навигационного поля необходимо по возможности исключать или учитывать составляющую, вызванную изменением абсолютной высоты. Рассмотрим задачу оценивания при использовании сигналов барометрического высотомера, радиовысотомера и вертикального канала (акселерометра) инерциальной системы. Комплексная система на основе обработки сигналов баровысотомера Heap, радиовысотомера Ярв и акселерометра вертикальных ускорений /нак должна обеспечить оптимальные оценки высоты Н над уровнем моря или аэродрома вылета, некоторой усредненной высоты рельефа НР, усредненной ошибки баровысотомера ДЯб, вертикальной скорости Н и вертикального ускорения Н. В качестве математической модели процесса изменения высоты за время цикла оценивания тц примем движение с постоянным вертикальным ускорением Н = const. Усредненную высоту рельефа Яр и усредненную ошибку барометрического высотомера ДЯб за время тц будем считать постоянными (рис. 4.33). Под усредненной высотой рельефа ЯР понимается среднее значение Нр за время цикла оценивания тц. Введя обозначения Xj = Н, х2 = Н, х3 = Я, = ЯР, х3 = ДЯо,
уравнения Контролируемого процесса в течение цикла наблюдения записываем в виде Ху — х2 = 0, i2 — х3 = 0, т3 = 0, х4 = 0, = О или в векторной форме х ах — 0, (4-79) । 1 && 1 | Ые | ! дне ; 1 I «Вясоконастотная» состомяющаА 1 поля релье/ра. Н О ; ♦'_____i_____г7- д___ -4«—2цикл—4*—Зцикл—Я ••• ---- Дальность полета ---- Рис. 4.33. К задаче построения радиобароинерциального измерителя вертикальных параметров движущегося объекта. где х = || Ху х2х8х4х6||т — вектор состояния, а = О -1 О О о о о о о о о -1 о о о о о о о о о о о о о В качестве составляющих вектора измерений используются показания радиовысотомера (рис. 4.33) Z1 — Нръ ~ Н — Нр = 5г» (4.80) барометрического высотомера z2 = Н$ = Н + + fez, = Ху + х6 fetl (4.81) и вертикального акселерометра инерциальной системы (ИНС) zs = 7нак = Я + fez, = -Ь fez,. (4.82) Здесь fez, — флуктуационная составляющая в сигнале
радиовысотомера, обусловленная как наличием собственных шумов, так и высокочастотной (в пространственном смысле) составляющей рельефа, т. е. составляющей высоты рельефа, интервал пространственной корреляции которой меньше Утц; gz, — шумовая составляющая в сигнале барометрического высотомера, которая может быть обусловлена турбулентностью атмосферы; gz, — шумовая составляющая в сигнале акселерометра. Величины g„, gz,, при синтезе будем считать независимыми гауссовыми белыми шумами со спектральными плотностями Sz, — 5рв! Sz, = 5б» Sz, = SaK. Необходимо отметить, что с целью упрощения алгоритма на этапе синтеза постоянной ошибкой радиовысотомера мы пренебрегаем. Такое допущение вполне естественно, так как постоянная составляющая ошибки радиовысотомера обычно существенно меньше Нр. В соответствии с (4.80) -5- (4.82) можно записать: z = h^x + gz, где Z — || Zx Z2 ZS||T, g2 — || gz, gz, gz, ||T, 1 0 0 1 0 0 0 0 1 hz -1 0 0 1 о 0 Согласно (1.40), (1.41) оптимальная непрерывная система оценивания в данном случае имеет вид i + at = кф (z — hzx), (4.83) кф = А-'КЖ1, (4.84) А - Аа — атА - = 0, (4.85) А-1 = R. Матрица S? в силу независимости компонент вектора gz равна о о 5-1 о о 5;,1 о о (4.86)
Матричное уравнение (4.85) с учетом симметрии матрицы А эквивалентно 15 скалярным уравнениям следующего вида: i 1 • Лц — — 4- -j—, Ai2 Ц- Лц — О, Л13 4“ /412 = О, 4 4 /414 =----т;— , Л15 = -т;— , А22 4" 2Л12 = О, &г, А2з 4- /413 Ф’ -^22 = 0> /424 4" /414 — 0, /425 4" /415 = О, 1 /4зЗ 4- 2Л2з = -т:— , /434 4" /4г4 = 0, /4з5 4" /425 = 0> 1 . -1 Л44 = -у—, Л45 - - О, Л55 = . □ (4.87) 21 2» Выполняя последовательно интегрирование уравнений (4.87) при начальном условии _2 °Но 0 0 0 0 -1 0 S2. но 0 0 0 Ло — Rf)1 — 0 0 0 0 0 0 0 0 0 0 0 0 Збо 22232 где аНо, айэ, айо, ар0, аб0 — дисперсии высоты, верти- кальной скорости, вертикального ускорения, постоянной составляющей высоты рельефа и постоянной обставляющей ошибки барометрического высотомера соответственно, получаем аналитические выражения для определения коэффициентов матрицы А : л —2 । / 1 । 1 \ л —2 Лц = Оно 4- ( --F -£—) Т! Л12 = — ОноТ — / 1 , 1 \ а W, + 2SZt ) т ’ Л13 = -у ОноТ2 4- ( 66\7 + 65^) т3’ ^14 т’ /4» = /412 = + Оно*4 4-4- з^-jТ3, /4гз = — °нот 2~ анот3 — Т*’
2S т2’ Аг& ~ 2S т2’ *1 А»з = а#0 + стй0т2 + Т а««т4 + + Т7 Л84 = — Т», А36 = т\ Аи = Про + -/-Т, •^«s = 0» -4м — °бо Ь ~§— т. □ Zj (4.88) Если умножить (4.83) слева на матрицу А, то после проведения преобразований находим Ai + (Аа + hrzS?h) i = ftX’z. (4.89) В скалярной форме уравнения (4.89) имеют вид Aikzk + —h —j ^i — -411X2 — Л12Ха — 1'1- 1 . 1 - -J- = -J-Z1 4- ^-22. Zt Zt Zi z> 6 A Л — ЛцХ2 — ЛцХз = 0, fc=i s j j 7 . А3кХк — A13X3 + I --413 ) X3 = -t;— 2з, 1 ~ 4 ' Л " . 1 - 1 ЛцХ* j— Xi Л14Х2 Л24Х3 -|- -j £4 — j Zi, У1, ЛзкХ» + "c-- xi — А1ъхг — Аъъхз + ~ё— хь = ~g— z«- □ (4.90) Формулы (4.88) и система уравнений (4.90) по существу составляют полный алгоритм оптимального оценивания рассматриваемых координат при указанных допущениях. Для реализации этого алгоритма с помощью БЦВМ все время полета разбивается на циклы наблюдения, а циклы
для осуществления численного интегрирования уравнений (4.90) разбиваются на шаги интегрирования. На каждом шаге по формулам (4.88) определяются коффициенты матрицы А, после чего по разностным выражениям, соответствующим численному интегрированию (4.90), вычисляются очередные значения оценок. При этом необходимо заметить, что численное интегрирование производится для уравнений, разрешенных относительно производных и нулевых начальных условий. Следовательно, на каждом шаге интегрирования требуется обращение матрицы А размера 5x5. Перед началом очередного цикла система оценивания приводится в исходное (нулевое) состояние. Выходными параметрами системы оценивания являются значения оценок в конце каждого цикла. Диагональные элементы матрицы R — А~1 в конце цикла наблюдения характеризуют точность оценивания. Так, = | А (т„) | ’ где он (т„) — дисперсия ошибки оценивания высоты в конце цикла наблюдения, т. е. при т = тц, | А (тц) | — определитель матрицы А, А11 (тц) — алгебраическое дополнение верхнего левого углового элемента этого определителя в тот же момент времени. Однако в развернутом буквенном виде выражение (4.91) слишком громоздко. Простым является асимптотическое выражение, справедливое при малой спектральной плотности Sz, = Se шума барометрического высотомера и не очень малом тц: о / Д2Т \ о’н(ти)=-М1+(4.92) Было проведено моделирование функционирования алгоритма. При моделировании спектральные плотности шумов радиовысотомера, барометрического высотомера и вертикального акселерометра считались равными SZI = 5рв = 200 ма-с, S,, = = 250 м2-с, 5г, = 5ак = 0,00008 м2-с-3.
Начальные значения среднеквадратических ошибок оценивания высоты, вертикальной скорости и ускорения, усредненной высоты рельефа и постоянной составляющей ошибки барометрического высотомера принимались равными ац0 = 150 м, а^0 = 2 м-с-1, сйо = 0,005 м-с-'2, ор0 — 5 м, Обо = 150 м, длительность цикла составляла тц = 30 с, а шаг численного интегрирования Дти = 0,01 с. Кривые характерного изменения среднеквадратических значений ошибок оценивания внутри каждого цикла, Рис. 4.34. Кривые изменения среднеквадратических ошибок оценивания, полученные при моделировании алгоритма (4.87). полученные при моделировании алгоритма, приведены на рис. 4.34. Из данных графиков видно, что при т = тц = 30 с имеем ад (тц) = 6,5 м, (тц) = 0,23 м-с-1, <тй (та) = = 0,001 м-с-2, Ор (тц) = 4,9 м, аб (тц) = 6,4 м, т. е. к концу цикла наблюдения происходит значительное увеличение точности оценивания высоты, вертикальнойскорости и вертикального ускорения, а также постоянной составляющей ошибки барометрического высотомера.
Увеличение точности оценивания усредненной высоты рельефа практически не наблюдается. В качестве примера на рис. 4.35 представлены графики, иллюстрирующие изменение во времени оценок высоты Н, вертикальной скорости Н и вертикального ускорения Рис. 4.35. Кривые изменения ошибок оценивания радиобароинер-циальным измерителем вертикальных параметров. Н, усредненной высоты рельефа Нр и ошибки барометрического высотомера ДЯб. полученные в одном из циклов наблюдения. Наличие на борту летательного аппарата карты поля рельефа позволяет получить информацию о текущем значении усредненной высоты в координатах, определяемых навигационной системой. Сигнал радиовысотомера в этом случае может быть представлен в виде Zi = zpB = Н — Яр (а-д, Уд) + Яр (яп, уп) + где Яр (хя, уд), Яр (хп, уа) — усредненное значение поля рельефа в координатах действительного местоположения и координатах, определяемых навигационной системой (комплексом) соответственно. При малых*ошибках навигационной системы И (*д — *п)2 + (Уд — Уп)2 < Р. где р — радиус корреляции поля, становится справедливо
равенство •Ир (ХД, Уд) —Яр (л>н, уп) и тогда zx = zPB = Н + £21. Подобный учет усредненной высоты_ рельефа делает возможным исключить составляющую Нр из вектора состояния, что, в свою очередь, уменьшает его размерность и повышает точность оценивания основных параметров движения летательного аппарата в вертикальной плоскости. Это справедливо для районов со слабым и среднепересеченным рельефом. При полетах над районами с гористой местностью резко возрастает дисперсия высокочастотной составляющей поля, которая воспринимается фильтром как помеха. Точность оценивания вектора состояния ухудшается. Поэтому определенный интерес представляют алгоритмы, использующие выборку текущего значения интенсивности поля из блока памяти КЭНС в координатах, определяемых навигационной системой. Вполне очевидно, что чем меньше ошибки навигационной системы в определении горизонтальных координат, тем меньше разница между высотой рельефа, извлекаемого из блока памяти, и высотой рельефа, содержащегося в полном сигнале радиовысотомера, тем выше точность оценивания. Следовательно, синтез алгоритма оценивания вертикальных параметров движения летательного аппарата должен проводиться с учетом его движения в горизонтальной плоскости, т. е. должна рассматриваться совместная работа горизонтальных и вертикального каналов навигационной системы *). Предположим, что на интервале наблюдения движение в горизонтальной плоскости, координаты которого оцениваются КЭНС, прямолинейно и равномерно П 4Д - Vx = О, Vx = 0, уд - Vv = 0, Vv = 0. (4.93) Составляющие скорости движения объекта Vx и Vv Измеряются грубой навигационной системой (ГНС) с флуктуационными ошибками, т. е. Кхг = Vx 4- | ч VWr = Vу 4- £vy, J *) Приводимые далее в этом параграфе результаты получены совместно с А. С. Ермиловым [4.17].
где gv*, ^vv — независимые «белые» шумы со спектральной плотностью Sv. Датчиками вертикальных параметров движения в рассматриваемом случае являются вертикальный канал инерциальной системы и барометрический высотомер, а в качестве датчика поля рельефа — радиовысотомер. Измерения вертикального канала ИНС имеют вид Нлг - Н ДЯИ, /7ИГ = VH + ДИи, (4.95) где Н, Няг и Vu, Няг — соответственно действительные и измеренные значения высоты и вертикальной скорости, ДЯИ, ДРИ — ошибки измерения высоты и вертикальной скорости. В свою очередь, НЯг — Рнг, Рнг = in 4- Д/и, (4.9(5) здесь ]н — вертикальное ускорение, Д/и — ошибка измерения вертикального ускорения. Движение объекта в вертикальной плоскости подчиняется уравнениям Н - VH = 0, Гн - /н = 0. (4.97) Вычитая из (4.96) (4.97), получаем дя'и = ДРИ, ДРи = А/и. (4.98) Выходная величина барометрического высотомера равна Н6 = Н + ДЯб + go, (4.99) где ДЯб — постоянная составляющая ошибки барометрического высотомера ДЯб = 0, (4.100) £б — «белый» шум со спектральной плотностью Sf>. Радиовысотомер измеряет относительную высоту (рис. 4.36) D = Я — hn (хд, уд) + ^д, (4.101) здесь ha (хд, уд) — интенсивность поля рельефа в координатах действительного местонахождения летательного аппарата, £д — «белый» шум со спектральной плотностью 5Д. 9 А. А. Красовский
Выражения для компонент вектора наблюдения получаем вычитанием из первого уравнения системы (4.95) показаний датчиков (4.101), (4.99) — Z) = &Н и -|- hn (хд, уд) — £д, Яиг-Яб-ДЯи-ДЯб-§б. С учетом предположения о пренебрежимой малости ошибки измерения ускорения Д;и уравнения (4.93) — (4.102) Рис. 4.36. Геометрические соотношения, используемые при^построе-нии сигнала радиовысотомера. (4.102) в векторной форме принимают вид £ + ах = 0, (4.103) z = ht (х) + 6г, (4.104) где х = || хл, Vx, ул, Vv, ЛНЯ, bVK, ЬНС О’, 2 = II Vxr, Vvr, Няг - D, Яиг - Но 1Г, || Sv»» Ь 11т, К (х) = II Vx, Vv, + ha (Хд, Уд), ДЯИ - ДЯб И’, Цо -1 0 0 0 0 01 |о 0 0 0 0 0 Oil «0 0 0 -1 0 0 о! а = |о оо 0 о 0 о|. ПО 0 0 0 0 ~1 °| |о 0 0 0 0 0 о] |о 0 0 0 0 0 0] Компоненты вектора шума считаются некоррелиро- ванными и матрица спектральных плотностей этого шума
диагональной 6’у 0 0 0 0 SV 0 0 52 = 0 0 *д 0 0 0 о Матрица «п Я 14 ^я Ч 11 + «15 «15- «17 «2> Я 24 ^Я + «23 «25 — «27 «23 Я 34 -пя Ч 13 + ^Я + ду^ + «35 «35 «37 / dh, \т R hr- = \ Эх j «24 Я 44 ^Ня 11 + ^дДз‘ + «45 «45 — «47 «25 Я 45 ^я Ч 16 4-^Я + 35 + «55 «55- «57 я2в Я 44 — я ^д 16 4-^Я + ^дДзв + «56 «56 «57 «27 Я 47 ^я -4-—- Я + Л/ДЛ” + «57 «57 — «77 тождественно равна нулю при Иц. = = ^33 — ^44 = ^55 = ^77 ’ Точнее, при Ri} = 0, г, / = 1, 2, 3, 4, 5, 7. Таким образом, достаточное условие точного оценивания (1.67) выполняется в отношении почти всех координат (кроме Д7„). Алгоритм оценивания (4.83)—(4.85) в данном случае имеет вид д / dh, \т х + ах = А 1 ("dj-) Szl [z — hz (x)J, (4.105) • I \T 1 A - Aa - a?A = -зг S~zl . (4.106) \ uX / uX Для диагональной начальной матрицы Я(0) = А-1(0)
и стационарного, эргодичного и изотропного поля находим М Лц = ф’ Лхг — °хо<--------------gjr <413 — Л14 = ^415 =; Лю — ^ii в 0, Лаг “ °Vxo 4—4" <*хо*2 + "зу" ^3, Л2з = Л24 = Л26 = Л2в = Л27 = 0, Л33 = ouJ 4—тД" лд 2 3Д -^34 “ —о//0/-----^36 = ^зв = ^37 0’ Л« = <Jv«o 4* + °Wa + "зу- ^3» Л«5 = Л46 = Л47 = 0, Л 56 = Одни0 + Л 66 = — оХп и0« — д I25д + 2S6)1 ’ Л57 = , Л6в = Одуи0 4- Одни./' 4- 4- 3£j7j *3, Лб7 = 2^7 ’ Л” = а^»сю + • □ (4.107) Обращением матрицы Л может быть определена матрица R. Как следует из (1.107), матрица А, а следовательно, и матрица R является квазидиагональной Ян Яц 0 0 0 0 0 Т?21 Яя 0 0 0 0 0 0 0 Язз Я34 0 0 0 R = 0 0 я13 Я44 0 0 0 (4.108) 0 0 0 0 Яи Яи Я6, 0 0 0 0 Я.6 Я.. Я.7 0 0 0 0 Я,6 Яи Я77 Дг3, 'д [ Дг” х____у — Д;. _|_ Д» Х ~ Sv + Sa dit у . = Л». J____R*1 х S- и
,3 Т/ ____ ^34 д_ г Дзз д '/ - vu - Дг2 -Ь -7- Az3, I/ 1_ ^43 А? г» = -37^ АЙЯ — АЙп — -J2- Дг3 4- -=— (f?ss — Я>») 15 д Лб ДГИ = 4й- Дг3 4- 4-(й65 - Лет) Дг4, *’д ° б дяб = 4а. Az3 + 4- - я77) Az4, дб дб □ (4.109) где невязки наблюдений Дг15 Дз2, Дг3, Дз4 равны Azi = КхГ — Vx, Дг2 = Vyr — Vv, Дг3 = //иг — Л — Д//и — hn (х, у), = Няг — Нб -}- + д/7б - дяв. Функции Лп(Хд, Уъ),дЬп/дхя, dh^ldy^ выбираются из блока памяти в оцениваемых координатах in, #д. Структурная схема алгоритма оценивания представлена на рис. 4.37. Здесь 1/р — оператор интегрирования. Легко получить в аналитическом виде выражения для диагональных элементов ковариационной матрицы R. Для горизонтального канала имеем О Ац D "^11 D Ац и Азя йи=ПГГ Лзз=К1’ (4.110) где | Ах\ = ЛПЛ22 — A1Z, | -47/| = A33Ati — А^. Интерес представляют асимптотические оценки точности горизонтальных координат. Согласно (4.107) с учетом 5Д = ОдТд при t —> оо находим /м f/\ Д Д <*х (0 — Оу (0 —5~ , гг2 г? (t\ *2°дтд Ovx(t) = Ovv(i)—*—57- • к* (4.111)
Горизонтальные каналы Вертикальный канал
Аналогично для вертикального канала находим АМА„ — А?7 А^А„ — А%7 /155Лвв — Л2в |Лл| ’ Н*>~ |ЛН| ’ \АН1 здесь | Ац | = Л^Лвв-^;? — -^в?) — -45в(-4б5-477 —А6?Л?6)-|-+ Л87 (Л654 76 — ^4ббА7б). Подстановка соответствующих выражений для элементов матрицы А позволяет получить аналитические зависимости для дисперсий оценивания параметров вертикального канала м 2 //\ 1 Г/ -2 I -2 ±а 1 1 \ - p7i[(4aAVHo + Стдни(/ +зу; + 337) х ( -2 , t \ / «2 \21 х ^Однбо ' 5б ) 2.$’б ] | ’ °А,,б <Z) = j^j [(аД"ио + '^" + (°АУио + , -2 ,2 > /3 , <3 \ I ~2 , , f2 I <2 VI + + 3£д + 3^5 ] ^СТдни(/ ' 25д ' 2А0] ] • I , (4.112) При t оо имеем (45о + 5д)5д 125Л ЛН« ' {S6 + 5Д) t ’ °луи (5С + .уд) /э ’ (4.113) Математическое моделирование синтезированного алгоритма проводилось без учета допущений о стационарности, эргодичности и изотропности поля по реальному участку поля рельефа Земли, имеющему радиус корреляции р = 1,2 км. Уровень шумов датчика поля (радиовысотомера) задавался таким, что соотношение сигнал/шум было равным оп/од = 3. Шаг дискретизации записи поля в блоке памяти равен Ых = Д/„ = 250 м. Частные производные дка!дхл и dha!dy^ рассчитывались в процессе
функционирования алгоритма по стандартным процедурам. При моделировании предполагалось, что движение в горизонтальной плоскости х, у прямолинейно и равномерно со скоростями Vx — 250 м/с, Vv = 50 м/с соответственно. Ошибки ДЯИ, ДКИ, ДЯб на интервале оценивания имитировались случайными величинами. Шумы измерителей £ух, £д, моделировались последовательностями дискретных случайных величин со среднеквадратическими отклонениями стух = оуу = 5 м/с, од = 10 м, Об = Ю м и спектральными плотностями Sv = 250 м2-с-1, Sa = 300 м2-с, 5б = 250 м2-с. Интегрирование уравнений (4.105), (4.106) выполнялось методом Рунге — Кутта с шагом Дти = 0,02 с. При включении фильтра было принято предположение, что в момент времени t — 0 оценки Vx (0) = Vv (0) = ДЯ„ (0) = ДУИ (0) = ДЯб (0) - 0. Результаты моделирования представлены на рис. 4.38— 4.41, где изображены кривые изменения во времени ошибок оценивания параметров движения Дх(0 = жд(0—Жд, ДИх(0 = их(0 — ИХд1_ Ау(0 = Уд(0~ Уп< (0 = Vy (0 - У Уд, ДЯИ (0 = д£„ (0 - дя„, Д7И (0 = ДИи (0 - ДИи, ДЯб (0 = ДЯб (0 - ДЯб при различных начальных отклонениях по координатам х , уя. Номерам кривых I, II, III, IV соответствуют начальные отклонения Axi = Ayi = 1500 м, Дяц = Дуп = = 750м, Дхш = Душ = —750м, Д^у = Ayiv = —1500м. Для удобства сравнения процессов оценивания остальные параметры движения выбирались одинаковыми для всех рассматриваемых вариантов. , Пунктирными кривыми обозначены области, в которых заключены удвоенные среднеквадратические значения ошибок оценивания, определяемые через соответствующие диагональные элементы матрицы Я. Внутренние пунктирные линии соответствуют минимальным среднеквадратическим значениям ошибок, а наружные — максимальным из четырех вариантов оценивания. Эта область получается вследствие того, что
38. Изменение ошибок оценивания координат и в продольном канале КЭНС.
4.39. Изменение ошибок оценивания координаты и скорости в боковом канале КЭНС.
i.40. Кривые оценивания ошибок вертикального канг циальной навигационной системы.
работа фильтра начинается с разных участков рабочей карты блока памяти. Поэтому производные dhn/dx.A и dhjdy^ поля рельефа, входящие в подынтегральные выражения элементов матриц A (t) = Л-1 (£), в оцениваемых точках хд (0> Уп (О для одних и тех же моментов времени различны как по знакам, так и по величинам. Следовательно, Рис. 4.41. Кривые изменения оценки постоянной составляющей ошибки барометрического высотомера. и соответствующие элементы матрицы R также неодинаковы для различных вариантов оценивания. Как следует из приведенных графиков, при начальных отклонениях | Дх0 | — | Ду0 | = 750 м, меньших радиуса корреляции поля рельефа выбранного участка коррекции, сходимость процессов оценивания достаточно хорошая (кривые II и III) и со временем ошибки оценивания входят в область, ограниченную удвоенным значением соответствующих среднеквадратических отклонений. Кривые I, IV, соответствующие начальным отклонениям по координате | Дд:0 | = | Ду0 | = 1500 м, показывают, что при невыполнении условия | Даг0 | — | Ду0 | < р процессы оценивания горизонтальных координат х, у и скоростей Vx, Vv становятся расходящимися.
Вертикальные параметры для вариантов I, IV оцениваются с ошибками меньшими, чем начальные, но превышающими на порядок соответствующие ошибки при | Лх0 | = | Лу0 | = 750 м. § 4.7. Корреляционно-экстремальная система совмещения изображений с конечномерным вектором наблюдения [4.2] В главе I в общем виде получены алгоритмы беспоис ковых корреляционно-экстремальных систем совмещения изображений с бесконечномерным вектором наблюдения. Показано, что для таких систем характерна параллельная обработка больших (теоретически бесконечных) потоков информации и оправдано применение оптических (голографических) систем обработки информации. Однако системы, использующие изображения (КЭНС — III, КЭНС — II), могут строиться и с конечномерным вектором наблю дения, в том числе вектором наблюдения, имеющим не высокую размерность. Беспоисковые алгоритмы таких систем могут синтезироваться в виде, близком к алгоритмам систем с точечным зондированием (КЭНС - I). Рассмотрим соответствующие алгоритмы. Рабочей информацией в КЭНС данного типа являются изображения («кадры») поверхностного поля. Обозначим наблюдаемое поле через hn (х, у), хОу— горизонтальная прямоу Рис. 4.42. Дискретизация изображения. гольная система координат. Вектор наблюдения будем представлять набором дискретных измеренных значений поля zt, i = 1, q (рис. 4.42). Предположим, что продольная ось хй движущегося объекта ориентирована по оси х. Если курсовая ошибка
отсутствует, то Zi = Лп<^Хд -ь (— ЛГ — 1 4- i — N j [ ) Lx, У я + (-М ~ ] -jj- [ ) + Si ), (4.114) гд® -Гд, Уя — координаты той точки земной поверхности, куда направлена ось датчика поверхностного поля; поскольку возможны отклонения A₽x, Д0„ оси датчика поля от вертикали, то координаты ха, уя могут отличаться от координат х0, у0; Lx, L„ — действительные расстояния (масштабы) между элементами изображения; NLX X (2М 4-+ 1) Lu — размеры изображения («кадра»), в общем случае предполагаем кадр несимметричным (N = N' + N* 4-4- 1, TV' у= N", q = N (2М 4- 1)); Si — ошибки измерения поля датчиком поля в i-й точке: Bi = Si<44- (— ЛГ — 1 Ч- г — [ )ЬЖ, ?/д 4- (М - ] -Jv [ ) Lu)>. Элементы изображения пронумерованы так, что первым считается верхний левый элемент. Если теперь рассмотреть постоянную курсовую ошибку У — рассогласование между осями х0 и х, появляющееся вследствие того, что на борту движущегося объекта курс никогда не бывает точно известен,— то выражение для наблюдаемых значений поля примет вид г, = Лп<^Гд 4- (— N' — 1 4- i — Д'] [ ) LxcosT 4- + (-Л7 4- ]4-[) Д,ыпТ, ?/«4-(-/V'-l 4-i-^]4r[)L-sinT '• 4- (д/ — ] _£_ [) ^cos^ 4- + &<*д4- (- N' - 1 4- i - 4г [ ) L*cos т + + (~Л/ 4-]-^[)Ausin Т, *) Знак |а[ в формуле (4.114) обозначает наибольшее целое число, меньшее а; например, ]2,7 1=2,] 4 j = 3.
//д + (- N' - 1 + i - tf] 4 [ ) £*sin Т + + (M-JJ^U^cosTy i = l,2,...,g. □ (4.115) Масштабы изображения Lx, Lv в дальнейшем предполагаются постоянными во времени, но неизвестными на движущемся объекте. Например, в случае использования на летательном аппарате оптических изображений эта неизвестность определяется неточным знанием высоты полета и углами Дрх, ДРИ отклонения оси датчика поля от вертикали, в случае использования радиолокационных изображений местности и при осуществлении развертки по горизонтальной дальности (что обычно оказывается необходимым) неизвестность масштабов также объясняется неточным знанием высоты полета. Исследуем одномерный вариант КЭНС и рассмотрим равномерное перемещение движущегося объекта (и установленного на нем датчика поля) вдоль оси х: = Vxt, ул = 0. На основании сказанного выше уравнения движения в скалярной форме запишутся следующим образом: хл = vx, Vx = 0, Lx = 0, Lu = 0, Т = 0. Если ввести вектор состояния * = II *1 х3 х< х6 ||т, где Xl = хд, х2 = Vx, х3 = Lx, х4 = Lu, х6 = ¥, то уравнения движения примут вид г. + ах == 0. Здесь матрица а равна 0 -1 0 0 0 0 0 0 0 0 а = 0 0 0 0 0 (4.116) 0 0 0 0 0 0 0 0 0 0 Введем также векторное обозначение для вектора шумов L = II ё, • • • ё< ... ё, Нт.
Поскольку курсовая ошибка имеет обычно малые значения, то можно повести линеаризацию по Т, тогда проекции вектора hz (х) примут вид hZi (^) — ha + (— N' — 1 i — Л/ J ) я3 + + (— М -|- ] — [ ) Х1Х6, (— N' — 1 + i — JV ] -±- [j х3х5 -1- + <4Л17) Согласно (4.117) z = hz(x) + Zz. Предположим, что шумов диагональна 8г = матрица спектральных плотностей (4.118) здесь 81? . . ., S;, . . ., SQ — значения спектральных плотностей ошибок измерения поля в различных точках кадра на нулевой частоте. Считаем измерения равноточными (8х = . . . = 8, = = . . . = Sq = 80), тогда Sz = 807, I — единичная матрица размера q X q. Начальное значение 7?0 ковариационной матрицы ошибок оценивания примем таким: Но (4.119) В формуле (4.119) аж!), оуж0, o^0 — дисперсии начальных ошибок оценивания местоположения, скорости и курса движущегося объекта, а®0, пмо — дисперсии начальных относительных ошибок оценивания масштабов Lx, Ly,
Начальное значение обратной матрицы Ло равно (4.120) Алгоритм оценивания в данном случае имеет вид х + ах = кф [z — hz (ж)], (4.121) /сф = /?(^-рД (4.122) А - Аа - а'А = 571 (, (4.123) \ ОХ / \ Ох / А = (4.124) Исследуем достижимую точность оценивания. Матрица, входящая в правую часть уравнения (4.123), равна причем *•'=*2.......5- <412в> Будем рассчитывать производные для действительных значений координатха = Vxt, Lx, Lv, Т — 0, предполагая, что оценки близки действительным значениям. Матрица А симметрична. Скалярные дифференциальные уравнения для элементов матрицы А имеют вид Ац — Ац 4- Ли = Лхз = Лц = S^Cu, Ли = iSj/Cjs, Л22 2Л12 = 5о1Сг2, Л23 + Л13 = Зд^Сгз, Л24 4- Л14 = So1Cl24, Л26 + Ли = 8л1С2ь, Лзз — 5.А зз, Л31 = 5«1Сз|, Л35 = ^о'Сзз, Л44 = S0'C44, Л45 = •So'Cjs, Л55 = S^Ca. (4.127)
Для пояснения промежуточных выкладок вычислим диагональный элемент Согласно (4.127), (4.126), (4.120) Ап = + s;1 (4.128) Здесь dhJdXb — значение частной производной поля в текущий момент времени t в z-й точке кадра, т. е. в точке с координатами Хд = ^ + (- Г - 1 4- i - Л’] ^ [ ) Lx, Будем считать поле ha (х, у) стационарным и эргоди-ческим, тогда средний квадрат градиента поля од равен и не зависит от номера i. По окончании переходного процесса формирования статистических оценок Подставляя (4.129) в (4.128), получим Ац (0 = о«о -j—я— t. (4.130) ° О По такой же методике и при тех же допущениях рассчитываются остальные элементы матрицы А: 2 _ . _-г. ,2 л N" — N' . >112 — — <W ’ ^13----------2-----5—t’ Ап = Лц = 0,
л -г , „-2,2 , ,3 л N* — N' ,, Агг — Ovxo Ч~ Oxat Н—gjr-1 , А23 —--------------- 2S ' Л24 = Л25 = О, Л зз = Lx2oxi + । (N* -JV')« + N' (N' + 1) + N" (N" + 1) 93д 6 Л’о Л — А — О А — /-2п-г-4 ^0'^ + 1) 9°л . -О 34 — /135 — и, л44 . - L,y Оц0 -|--з------—t, ^45 = 0, Л „-2 , ГЛ/(-^+1) Г2 , Ац — °'Го + I------з-----Ьу + , (N"~N') + N'(N' + i) + N"(N" + i) г81 Я°1 Н 6 Lx\ So L □ (4-131) При выводе соотношений (4.131) дополнительно полагалось что эквивалентно предположению об изотропности поля /гп(х, у). Не снижая общности, предположим, что кадр симметричен (fl' = N” = —у—) > тогда Л13 = Л23 = 0, 2-2 , №-1 ?5д t л33 — i-'x <7хо Н---J2----J---г’ А - п-2 -U ГЛ/(М + 1) Г2 ,№-1 Ml '/0А t Аы — Оф-о + I-------з----Ь(/ -|---— Ьж I I, (4.132) и матрица А разбивается на блоки АцАц [ о i Л4 I !__J____ о [лю
Это означает, что оценивание местоположения, масштабов и курса происходит (после окончания переходного процесса формирования статистических оценок поля) автономно. Обращением матрицы A (t) находим ковариационную матрицу R (t). Текущие значения о» (t), <зух (t), а* (Z), а® (<), Оф (0 дисперсий ошибок оценивания координаты хд, скорости масштабов Lx, Ly и курса Т равны cJL + + ЧС & V ХЭ 1 ХЭ 1 ОО Q ,-2,-2 +Г13-« ( + + 3xo* 3Vxo । б'о 3Vxo‘ > 33'0 Зхз[ г |25a " (4.133) ,-2,-2 , 221,-2 / +^3-2/a , 3xo3Vxo + Ao 3Vxor Г 350 W ' -123-2 o’x(0 = О® (0 = , № —1 r2 ?3A , °Xo + 12 Lx So 1 (4.135) (4.136 Л 3-2 , Г , M(M + 1) 1 %)+[ 12 J'x+ 3 LuJ So Асимптотические оценки (при t -> oo) имеют вид </,л38) (4.139) V Я Од ' ' ----7^==--^— V у-< (4.140) . -1/ ТУ8 — 1 V <7 <5д 1 1 I/ 4 0
(4.141) а4, (/) __________1_____________ /уз-! + , 12 * + 3 (4.142) где So = ОдТд, Од — дисперсия ошибок измерения датчика поля, тд — время корреляции этих ошибок. Если Lx = Ly = L, кадр квадратный (2М + 1 — N) и числа N, Л/>» 1, то выражения (4.140), (4.141), (4.142) еще более упрощаются: <4(0 = Ом (0 = У2Ом,(0, (4.143) МО = /б~ Од Я (4.144) Здесь Q ~ N2L2 4Л/2£2 — площадь кадра. При расчете и построении графиков достижимой точности КЭНС было принято, что одномерное сечение корреляционной функции используемого поля hn (т, у) описывается выражением Rh (Д) = Оц ехр (—а2Д2), (4.145) Оп — дисперсия поля h (т, у). Радиус корреляции р такого поля, определяемый известным соотношением СО J ЯЛ (Д) ^Д/ЯЛ (0), равен р = )^л/2а. Корреляционная о функция Яд/, (Д) градиента исходного поля связана с Rh (Д) уравнением R&h (Д) = — d2Rh (Д)/дД2 и, следовательно, Яд„ (Д) = 2а2о„ (1 - 2а2Д2) ехр (-а2Д2), - 2 откуда средний квадрат ад градиента используемого поля равен пг _ я бп д ~ 4 р» (4.14 В)
В КЭПС, использующих изображении местности, главной составляющей ошибки датчика поля часто является ошибка первичного картографирования. Физически эта ошибка является функцией пространственной координаты, поэтому т_________ д ' I- (4.147) где Vx — скорость движения, рд — пространственный радиус корреляции ошибки датчика поля. На основании (4.146), (4.147) 4 л / у So “ 4 \ Зд / Р2?д (4.148) Расстояния Lx, Ly между элементами изображения в силу град м-с^ м 10 -100 -1000 5-50-500 0,5 о,г- 0,1- 5- 50 г - го го - гоо ю - юо 7L 10 0,1 о, г о,5 1 г 5 ю го so 'oot,c г - 1 - Рис. 4.43. Кривые изменения среднеквадратических ошибок оценивания, рассчитанные по формулам (4.133) — (4.137). использовавшегося ранее условия (4.118) связаны с рд. Выберем Lx = Ly = рд. По формулам (4.133) — (4.137) на рис. 4.43 построены в логарифмическом масштабе графики достижимой точности КЭНС, рассчитанные для следующих исходных
данных: <^о = Ю4 м, аГло = Ю м-С"1, 0Хо = амо = 2-Ю-2, а,10 = 0,05 рад, Л-= 4, Р = Рд = 10»м, Vx — 250 м-с"', N = 11 (квадратный кадр размером 20 км х 20 км). Весьма характерно поведение кривой их (t). В первые 5 с за счет использования информации, содержащейся в исходном изображении, начальная ошибка определения местоположения уменьшается в 120 раз. В последующие 95с ошибка ох (t) уменьшается только в 2,35 раза; причина дальнейшего уменьшения ошибки ох (t) состоит в увеличении эквивалентной площади кадра при движении объекта. Улучшения точности оценивания скорости движения, напротив, в первые 10с не наблюдается, поскольку информация о скорости движущегося объекта не содержится в исходном изображении. Лишь по мере движения улучшается точность оценивания скорости. На рис. 4.43 пунктиром показаны асимптотические зависимости, вычисленные по формулам (4.138) — (4.142). Сопоставление точных и асимптотических оценок позволяет установить, через какой интервал времени можно использовать более простые асимптотические зависимости. Полезно заметить, что частным случаем полученных результатов может явиться теория КЭНС — II, в которых информация о поле снимается вдоль некоторых контуров или линий. Теорию таких КЭНС можно вывести из общих результатов, если, например, положить N = 1. Тогда в каждый текущий момент времени информации о поле Лп (х, у) будет сниматься вдоль линии, перпендикулярной ОСИ Хд.
ГЛАВА V ПОИСКОВЫЕ АЛГОРИТМЫ ОЦЕНИВАНИЯ В КОРРЕЛЯЦИОННО-ЭКСТРЕМАЛЬНЫХ НАВИГАЦИОННЫХ СИСТЕМАХ Цель настоящей главы состоит в отыскании оптимальных поисковых алгоритмов КЭНС. При математической формулировке задачи принцип действия КЭНС излагается с некоторыми упрощениями (например, скорость движущегося объекта предполагается постоянной, что вовсе не является обязательным для работоспособности системы). Это, не уменьшая общности конечных результатов, позволяет облегчить математические выкладки. § 5.1. Постановка задачи. Вывод формулы среднего риска. Оптимальные решающие правила а) Принцип действия и математическая формулировка задачи для КЭНС — I [5.1]. КЭНС позволяют определить координаты движения при перемещении движущегося объекта вдоль траектории Тц (/), где Т — точка па плоскости х, у; к — номер траектории (/с = 1, . . ., q). Поле h (х, у), используемое КЭНС, обычно является детерминированным. В теории КЭНС как это уже отмечалось в главе III, весьма удачным является статистический подход, который позволяет вместо отдельных реализаций рассматривать статистические характеристики полей. Вводится статистический подход путем рассмотрения множества траекторий {Tk(t)} и задания вероятностей движения по этим траекториям. Тогда вместо отдельных реализаций h* (х, у), которые часто имеют самую произвольную форму, можно оперировать с математическим
ожиданием </ mh(x,y) = 2, Pkh* (х, у) (5.1) к~1 и корреляционной функцией поля ч Xhi, (Xi, !/Г> *г, //г) = Pkh* (хъ Ук) hk (x2, yt). (5.2) к -1 При такой постановке вопроса получаемые статистические оценки точности КЭНС относятся именно к множеству рассматриваемых траекторий {Тк (t)}. При движении по к-тл траектории датчик поля (ДП) в текущий момент времени t измеряет hk (хд, уа) + 6Л* (хд, уа), где хд, уд — текущие координаты движущегося объекта, Ыгк — шумы ДП, предполагаемые аддитивными. Так как одного замера поля в КЭНС с точечным зондированием полей (КЭНС — 1) недостаточно для определения координат движения, то при принятии решения в текущий момент времени используются еще АГ1 — 1 предыдущих измерений ДП hk [хд — v.L (1 + v?L) cos ф~, уд — V.L (1 + v*) sin ф^] + + 6/ik [хд — v.L (1 + vj.) cos ф^, Уд — (1 + vjL) sin ф^Ь x = 1, . . 1. Написанное выражение предполагает, что происходит движение с постоянной скоростью, ось х направлена вдоль априорного (измеренного на движущемся объекте) направления скорости; ф! — случайная ошибка измерения направления движения, L — априорное (предполагаемое на движущемся объекте) расстояние между последовательными замерами ДП, v*. — случайная относительная ошибка измерения скорости движения, vL и ф~ в дальнейшем предполагаются постоянными во времени. Математическим аппаратом, применяемым для исследования поисковых алгоритмов КЭНС, является теория статистических решений. Введем те математические объекты, которые фигурируют в теории статистических решений (см. § 2.1), в частности, введем пространство входов Г*, сигналов 6к и выходов (гипотез) Gk *). В качестве *) Индекс «/с» везде означает принадлежность к fc-й траектории движения.
входа системы Z* будем рассматривать вектор-строку (zj), элементами которой являются предыдущие и текущее измерения ДП (рис. 5.1): 2х = А* [хд — xL (1 4- v~) cos ф~, уд — kL (1 4- v~) sill ф~] 4* 4- i>hk [хд — xL (1 4- v~) cos ф~, уд — xL (1 - v~) sin ф^], (5.3) x = 0, 1, . .., Nx - 1. Априорная информация о поле заключена в множестве |У' $ •йд Рис. 5.1. Иллюстрация поискового алгоритма оценивания в КЭНС- I. реализаций (или сигналов) {£<*•}, i = —п, . . ., nf, j = = —т, . . ., т, хранимых в памяти решающего устройства; часто априорная информация может быть представлена в виде карты поля. Реализация Si) также представляет собой вектор-строку (s^x), причем 4 = hk [хп 4- И — v.L (1 4- v) cos ф, у» 4- 4- jl — v.L (1 4- v) sin ф]. (5.4) Здесь I — шаг дискретизации по координатам х, у при принятии решения, (2п 4- 1) I, (2т 4- 1) I — размеры доверительного прямоугольника. хи, уа — координаты априорного местоположения.
В настоящем пункте а) рассматривается вариант сложных гипотез, когда производится оценка только местонахождения объекта. В (5.4) i, j — существенные параметры, относительно которых выносится решение, — несущественные параметры, относительно которых решение не принимается, но от которых зависит реализация 5*у, v, ф задаются совместной плотностью распределения р (v, ip). Множество {Sy} будем рассматривать как пространство сигналов 0\ В результате сравнения входа Zk со всеми сигналами Skj из множества 0* решающее устройство принимает некоторую гипотезу Djno действительном местоположении движущегося объекта; |, т] — апостериорные оценки параметров i, /. Пространство гипотез (или пространство выходов) обозначим G*. Апостериорные значения координат хд, уя принимаются равными хп + Ы, уп + Г)/. Это предполагает, что координаты возможного местоположения движущегося объекта обязательно кратны шагу дискретизации I, и игнорирует тот случай, когда хд, ул находятся внутри клетки 1x1. Если I выбрано достаточно малым (а I обычно выбирается именно из этих соображений), то пренебрежение шагом дискретизации не вносит существенной ошибки в оценку местоположения. б) Принцип действия и математическая формулировка задачи для КЭНС — Ш. Рабочей информацией в корреляционно-экстремальных системах типа КЭНС — III (и КЭНС —.11) являются изображения («кадры») случайного поля hk (х, у). Алгоритмы КЭНС — III предусматривают сравнение принятого изображения И„р с априорной информацией hk (х, у), хранящейся в памяти КЭНС. Эта априорная информация может быть задана как множество изображений (Иу), i = —п, . . ., п\ j = —т, . . ,,т. Поисковый алгоритм КЭНС — III сводится к следующему. Вокруг координат хп, уп, представляющих собой априорные значения координат датчика поля хд, уд, строится доверительный прямоугольник размера (2п + + 1) 1х(2т -(- 1) I, где/ — шаг дискретизации по координате. Принятое изображение И£р сравнивается со всеми изображениями Иу, извлекаемыми из памяти КЭНС — III; центр изображения Иу находится в точке хп + И,
уа + jl. В результате такого сравнения находятся относительные значения координат датчика. Сначала предположим, что рассогласование по курсу между принятым изображением и изображениями блока памяти отсутствует. Этот случай иллюстрируется рис. 5.2. Будем считать, что Рис. 5.2. Иллюстрация поискового алгоритма оценивания в КЭНС— III.J изображения представляют собой совокупность изолированных значений поля hk (х, у), отстоящих друг от друга на интервал L, причем вдоль оси х содержится 2N2 4- 1 точек, а вдоль оси у — 2М2 + 1, L — предполагаемое расстояние между замерами. Тогда принятое изображение можно представить в виде матрицы И£р = || аХР ||, х = 1, • • 2М2 + 1; р = 1, . . ., 2N2 + 1, элементы которой равны Охр = hk [хд + (—N2 — 1 + р) L (1 + ул + + (М2 + 1 - х) L (1 + + + 6h* [хд + (-N2 - 1 + р) L (1 + V*.), уд + + (М2 + 1 - х)Ь (1 + р*)1, (5.5) здесь S/i5' — шумы датчика поля, — масштабные
искажения принятого изображения вдоль осей х и у, рассматриваемые далее как случайные величины. Изображения блока памяти И*; также могут быть представлены соответствующими матрицами = || bihp ||, &ijxp = h* [хп + il + (-N2 - 1 + р) L (1 + V), Уп + + jl + (Мг + 1 - х) L (1 + ц)1, (5.6) здесь v, р. — параметры, соответствующие масштабным искажениям принятого изображения. Алгоритм КЭНС — III NzL(1+v~) sin pt +М2ЦЪц~) cos Рис. 5.3. Расположение принятого изображения при наличии рассогласования по курсу. построен таким образом, что параметры v, ц могут принимать дискретный ряд значений с шагом дискретности Av, Ац: vh = AAv, h = —а, . . ., а, цй = gAp, g = —р, . .., р, причем максимальные значения aAv, рДц параметров v, ц должны заведомо превосходить возможные значения масштабных искажений v(^, р,^. Рассмотрим более общий случай, когда имеет место рассогласование по курсу (рис. 5.3). В этом варианте axp = + (—Na — 1 + р) L (1 + v£.) cos ipl, + + (—M2 — 1 + %) L (1 + Hl) sin ФЛ, Уя +
+ (-N2 - 1 + р) L (1 + v!L) sin < + 4- (ЛГ2 4- 1 — х) L (1 4- pl) cos ф£_] 4- 4- 6Л* [хд 4- (—N2 — 1 4- р) L (1 4- v^) cos ф! 4- 4- (—ЛГ2 - 1 4 х) Ь(1 + М sin ф*., уя + + (-N2 - 1 4- р) L (1 + vL) sini|£ 4- 4- (М2 4- 1 — х) L (1 + мА) cos ф?,], (5.7) а изображения блока памяти, получающиеся алгоритмическим путем из карты hk (х, у), содержащейся в блоке памяти, должны в качестве параметра учитывать еще фг = гДф, г — —е, . . ,,е, где Дф — шаг дискретизации по курсу, еДчр — максимальное значение параметра ip, обязательно превосходящее ф((_: 6<,хр = hk [хп 4- il 4- (— N2 — 1 4- p)L (1 4- v) cos ф 4- 4- (—M2 — 1 4- x) Ь(1 4- h) sin -ф, yn 4- jl 4- 4- (—N2 — 1 4- p) L (14- v) sin ф 4- 4- (M2 4- 1 — x) L (i + P) cos Ф1. (5.8) Перейдем к постановке задачи на языке теории решений. Желая получить единую форму уравнений для КЭНС — I и КЭНС — III (КЭНС — II), пространство сигналов 0* = {З^} и совпадающее с ним пространство решений Gk = {Z>£n} образуем построчной разверткой кадров, тогда Stj, D^n представляют собой векторы-строки ^(4)- D|n = (4v), образованные построчной разверткой изображений И*/ х = hk <^хп + М 4- 4- {— N2 — 1 4- X—]~2ДГ^ [(2Мг4-1)}ь(1 + V)cosip + 4-(—^a4-] ajvf-H’fW1 4-H)siniMn 4J* 4- 4- [- - 1 + х -] 2лйгг [ <2Л/г + 1>}Ь<1 4-v)sini|> 4- 4^ (Ма~]'2^4-1 [ )L + ^cos ’ х = 1,2, . Д, (2Nt 4- 1)(2ЛЛ 4- 1). (5.9)
Вход Zk (г*) также получим путем строчной развертки принятого изображения z* — hk <^хд -j- У2 — 1 -|— х—J 2дг'- +1 £(2.^3 + 1)| X X L(1 +vl)cos^+ (- М2+] 2%ix+1 [)Z,(1 + pL) X X sin ф1, !ln -j- {- N2 - 1 + x - ] [(2tf2 + 1)} X X L (1 +vi) sin ф~ + (fl/2 — ] t [) Z,(l +pl) cos i|£^ + + th* <...>; (5.10) в формуле (5.10) аргумент шума 8hk совпадает с аргументом поля h. в) Обобщение математической постановки задачи. Уравнения КЭНС - I и КЭНС - III (КЭНС - II) можно записать единым образом. Будем считать, что для к-й траектории пространства сигналов й1’ = {<£*£} и решений Gk = совпадают. Сигналы имеют вид + И + {- АС - 1 + X - ] [ у} L (1 + V) х X cos ф 4 (— М 4-] [ ) Л(1 4 p)sinxp, уп 4- jl + + {— ЛС — 1 + х — ] [ Ar} Z.(l 4- v) sin ф 4- + (М “] 'ТГ [ ) L (1 + I1)cos ’ x = 1,2, . . ., N = (N' 4- N” + 1) (2M + 1). (5.11) Вход Zk будем представлять в виде zk = hk(xR + {- N' - 1 + X - ] [tf} L (1 + vl) cos 1|Л 4 + (— Л1 +] -J-[)L(1 + p.L)sini|)~, уд4- + {- /V'-l + x-]-^-[jv}L(l + vl)sinipl + 4- (M - ] -J- [ ) L (! + pt) cos -b 6hk <.. .> . (5.12) Вектора Z)^, Zk содержат N — (N' + N" 4- 1) X X (2AZ 4- 1) компонент. В обобщенной постановке рассмат-
риваются несимметричные изображения размером (N' -I + N" + 1) X L (2М + 1) L. КЭНС — I получается из общей постановки, если задать N' = — 1, N” = М = О, N = Nt. КЭНС — III получается из общей постановки при задании N' = N" — N2, М = М2, N = (2N„ + 1) х X (2М2 + 1). г) Вывод формулы среднего риска. Введем вероятностное пространство [5.2]. Множество элементарных исходов Q = (а>) в качестве своих элементов содержит векторы-строки, имеющие по N + 6 проекций (о = (о0, со1, . . . .,<0n+5); <i)0 принимает целочисленные значения от 1 до q, Wj, . . . . . ., (i)jv+5 принимают произвольные значения, о-алгебру событий <5 зададим так: если S — некоторое борелевское множество в N + 5-мерном евклидовом пространстве En+s, то соответствующим событием ЛЕ® является множество таких точек о>, для которых вектор (<olt . ., ош) ЕЕ £ такое задание осуществим для каждого <в0 = 1, ... . . ., q. о-алгебре борелевских множеств в для любого (1>0 соответствует ©^-алгебра событий в <5. Операциями объединения, пересечения и дополнения на основе а-алгебр ©щ, образуем полную о-алгебру событий ®. Распределение вероятностей Р зададим функцией распределения F (х0, х15 . . .,xn, xn+i, . . ., Xn+ь), равной вероятности ТОГО, ЧТО Хо.........(Otf+iC як+б, или плот- ностью распределения р (х0,.. •, xN+i) = 0W48f (х0...xN+5) дзс0 • • • dxN+6 Таким образом, введено вероятностное пространство {Q, S, Р). Определим исходные случайные величины: номер траектории движения к = <о0; вектор шумов датчика поля 6/г = (toj, . . ., <ow); ошибки определения местоположения Дх — ха — хп = = <ow+i, by = Уд — уа = d)W+2; ошибки определения масштабов (относительной скорости) V*. = сом+з, pjL = <вн+*; курсовую ошибку IpL = Зададим вход Z как случайный вектор на {О, ®, Р} следующим образом: по <оо находим к;
по (o.v+i, . . <>>N+6 определяются г, j, h, g, г, как бли- жайшие с точностью до половины шага дискретности значения COJV+1, . . COJV+Б- по номеру к и вычисленным i, г выбирается в со* ответствии с формулой (5.11) сигнал Si,...,r = ^<ilv=hAv, ц=£Дц, ^=гЛЦ-; (5.13) по <i>j, . . ., (&n находится вектор шумов датчика поля dh; вход определяется по формуле Z = + th. Определим интересующие нас в дальнейшем случайные события: Нк = {и : <о0 = к} — событие, состоящее в том, что происходит движение по к-й траектории; \ _ о \ _ г / Др \ ® ’ / Дф \— — событие, состоящее в том, что ошибки определения координат имеют значения Дх = i7, Ду = /7, v = ЛДу, р — #Др, ф = гДф; — событие, состоящее из тех ю, для которых решающее правило в качестве оценок параметров i, j, h, g, г выдало £, т], О, у, Л, т. е. приняло гипотезу Dj...х- Если обозначить через множе- ство тех Z, для которых решающее правило принимает гипотезу Pj...х, то С?,...Л = {«>: Z (ю) (= Q*,.д). Введя дифференциалы dzlt . . ., dz^ и зафиксировав числа Cj, . . ., ей, через .tN обозначим множество *) Знак > а < обозначает целое число, удовлетворяющее условию а — V, < > а < < а + 1/J. Ю А. А. Красовский
тех о, для которых Cj dzx «С zi < (ei + 1) dzv . . Cjv йгк Zn<Z (e^ + 1) dzN. Определим вероятность события A/t, i,..., г, 5.К, e,.eN = flft П Qi.гП ^4.X П^е,,..., eN *)• Используя известные соотношения для условных вероятностей, получим Р (Л) - Р (С I Е П 4>АЯ) Р (Е I Q П Н) Р (Q I Я) Р(Н). (5.14) В (5.14) Р (Я) = pj — вероятность движения по к-й траектории, Р (Q | Я) = Pi,-.-,r — априорные вероятности ошибок при движении по к-й траектории. Так как событие Q П Н означает, что вход — это зашумленный сигнал Si,...,г, то Р (Е | Q П Н) = Р {Z I Si,...,г) dZl . . . dz.v, здесь Р (Z | S?,...r) — функция правдоподобия. Поскольку решающее правило строится так, что выбор гипотезы зависит только от принятого сигнала и номера траектории и не зависит от Qi........г, то Р (С | Е П Q п Н) = Р (С | Е П Я). Будем рассматривать детерминированные решающие правила, в этом случае вероятность Р (С | Е П Я) принимает только значения 0 или 1. Эта вероятность представляет собой решающее правило при движении по к-й траектории. Применяя общепринятое обозначение решающих функций [2.5], запишем Р(С\Е ПЯ) = ^(Я5.......x|Z)l z,=e,dz,, » zN=eNdzv где F? (Pj x. I Z) — решающее правило при движении по к-й траектории. *) В случае, когда это не может привести к неясности, нижние индексы у событий Н*, Q,, . . ., г, С^, . . ., х, Ее„ . , ,, е Л к, • • •, eN для сокращения записи в дальнейшем будут опускаться.
Итак, Р (А) = PliPl.„rP (Z | S* ...,,) fl (D^.J Z)dzx.dz.v. Пусть W};.;;;r* — функция потерь при движении по к-й траектории, т. е. штраф, который назначается, если при действительном значении ошибок i, . . ., г будут приняты оценки £,..., X. Тогда условный риск (риск на событии Ак...eN) равен Wf;В качестве функции риска 7? выберем средние потери при движении по всем траекториям. При различных сочетаниях индексов к, i,... . . ., г, £,..., X, . . ., e.v события А^...eN несов- местимы и, кроме того, при пробегании индексами к, i, . . ., г, |, . . ., X, е,, . . ., eN всех возможных значений события Alt, .... eN образуют полную группу событий. Поэтому по известной формуле, связывающей условные и безусловные математические ожидания случайной величины (в данном случае риска), получим P(F)= 3 Л(Г|А-........'N)P(Ah...eN) = к...'N - 3 (z|st...j х k,...,eN * X .........KlZ)dzlr.. .,dzN, здесь У означает многократную сумму по переменным к........eN к, I, . . ., г, |, . . ,,Х, q, . . ., 6n, причем индексы q, . . . . ... eN пробегают все целочисленные значения от — оо до + оо. Устремляя dzx . . . dz.v к нулю, получим в пределе *(F) = 3 рЛ,........wfc t X к,...А “ ОО 00 х $ ... $ P(Z|St...,r)F?(P5.....K]Z)dz1,...,dzN. —ее —оо ' N ' Если обозначить многократный интеграл \р°к Uh..K\Z)P(Z\Sl..„r)dZ, г
то окончательно получим 2?(F) = = S РкР*...., f р{Z15?„.„ г) (d^ хIZ)dz. к..X р (5.15) д. Оптимальные решающие правила. Случай простых гипотез. В случае простых гипотез перебор вариантов производится (и решение принимается) относительно всех параметров Дх, Ду, v, р, tp. Нужно найти q оптимальных решающих правил Fjf (D^ ..I Z), минимизирующих (5.15); каждое F® (Dt.....х\ Z) выбирается из условия минимума H(Fk) = = . P(Z|4,...,r)^(Du..,K|Z)dz.(5.i6) »..*• г Функция правдоподобия для случая простых гипотез (см. § 2.1) имеет вид Р (Z | S*,..., г) = -7=^=^ X K(2«)NKdet^ X exp {- 4- (Z - ...r) К? (Z - Si*,..., r)’} , где Кк — корреляционная матрица вектора шумов 6/is — = (6/£), 6h* = + {- АГ - 1 + х - ] -J- [А/} £(1 + v!L) х х cos -1 (— Л1 + ] [ ) L (1 - Ь н~)sin 4’~, Уд Г + {_ N' __ 1 4 х - ] -J- [ A(] L(1 + vl)sin+ + (- М + ]-£[) L(1 + |Л)соз<у х = 1, . . ., N. Расстояние в пространстве (на плоскости х, у) между точками, в которых снимаются проекции вектора шумов 67ik, больше или равно (в случае соседних проекций) L (1 + v*). Будем предполагать, что шумы датчика ста
ционарны и корреляционная функция шумов датчика 7? (А) = 0 при | А | > L (1 + v*,). Тогда корреляционная матрица Кц имеет вид det К* = о24 где — среднеквадратическое отклонение шумов датчика при движении по k-й траектории, и функция правдоподобия равна P(Z|Si,.) = 1 ( [|Z—J* rip - , —---ехр )-------------- /(2л)" 2< ~к I к здесь || х || — знак нормы вектора х. Зададим простую функцию потерь тт,н х (°’ при г = 5, J = пЛ = #, g = у, Г = X, ....г* 11, в противном случае. Из § 2.1 известно, что в случае простой функции потерь по оптимальному решающему правилу выбирается та гипотеза D\..х, для которой оказалась наибольшей ве- личина: „ t г f liz-st -IP *...<z I ......> = ------- Если отбросить постоянный множитель (J/r2n)-v5^, то оптимальное решающее правило сводится к расчету по принятому входу Z чисел 4.х = 4 хехр iiz-4..Kip1 2< * и выбору той гипотезы .... х, для которой ЧИСЛО .....X оказалось наибольшим, или, что то же самое, для которой оказалась наибольшей величина «I...к = 2 (ZSf..х) - II Sf.х ||г + 2а\ In .к. (5.17)
В случае стационарного и эргодического поля, достаточно большой длины реализаций, равновероятных гипотез, когда || $|,...д|| = const, .х ~ const для любых £,..., X, по оптимальному решающему правилу рассчитываются и сравниваются между собой числа <4..x=(ZSt..,x)- (5.18) представляющие скалярное произведение векторов Z и ....х, т. е. оптимальным является корреляционный алгоритм [5.5]. е) Оптимальные решающие правила. Случай сложных гипотез. В случае сложных гипотез производится оценивание лишь ошибок местоположения Дх, Ду, параметры v, |л, пр являются несущественными. Функция правдоподобия в отмеченных условиях имеет вид ОО 00 оо P(Z|5t) = -^=-1- - С \‘exp{-4-(Z- — Sij) К^х (Z — Sij)Tj pk (v, p, ip) dv dp dtp, где pk (v, p, np) — совместная плотность распределения случайных величин v, р, пр. Сделав те же допущения относительно шумов датчика и функции потерь что и в пункте д), получим, что по оптимальному решающему правилу выбирается та гипотеза D^, для которой оказывается наибольшим число S i $ exp 2а2 к рк (v, р, np) dv dp dtp. (5.19) § 5.2. Выражение риска через статистические характеристики вектора значений функционала Рассмотрим случай простых гипотез. В этом варианте при движении по к-й траектории в соответствии с оптимальным решающим правилом (5.17) рассчитываются и сравниваются между собой числа ...x = 2(Z>$|...х) + ®|,...,х> (5.20)
где к = - II Sf.х |Р + 2о\ In Pl.х, (5.21) ...к = (4..хх), х = 1,...,АГ, 4...кх = Л*<хп + |/ + {- AT-l + x-]-£-[jvJ х х L (1 + AAv) cos ХДф + (— Л/ + j ) L (1 + уДр) x X sinKAtp, yn + T)Z + {— N' — 1 4- x — ] [/vj X X L(1 + OAv)sinХДф + (M — J x X L (1 + yAp) cos XAi|^>. (5.22) Оперировать с числами uE...x неудобно, так как они не являются случайными величинами на вероятностном пространстве {й, S, Р}, например, и?...х определено толь- ко для тех со, для которых <о0 = к. Рассмотрим случайный вектор U = (их, . . ., uy), его проекции будем обозначать либо и^о^х (5 = —w, • • • , п; q = —т, . . ., т; О = —а, . . ., а; у = —р, . . ., Р; X = = —е, . . е), либо ut, s = 1, . . ., Т\ Т = (2« + !)• .(2m + 1)(2а + 1)(2р + 1)(2е + 1). Соответствие между индексами £,..., X и номером $ можно задать формулой S = (5 + П)(2т + l)(2a + 1)(2р + 1)(2е + 1) + + (q + m)(2a + 1)(2р + 1)(2е + 1) + (О + а)(2р + 1) х X (2е + 1) + (у + Р)(2е + 1) + (1 + е) + 1. (5.23) Проекции иЕ.....х представим как сумму случайных величин ...К = к Числа «^..„х являются случайными величинами па {Q, в, Р}. Как функции элементарного исхода числа й|.....х определяются следующим образом: 1. По (0/V+1, . . ., co/v+5 определяют i, /, h, g, г как ближайшие с точностью до половины шага дискретности
ЗНаЧвНИЯ (Otf+i, • • •> (Ox+j.' . \ ША+1 / . \ ШУ+2 / г, \ / I = >—;—< , ? = >—;—< < я = >—< । / 1 \ / \ / Av \ ®W+4 / _ \ “W+5 / £ = >-дГ <’г = /-дГ< 2. По номеру к = ю0 и вычисленным i, г выбирается в соответствии с (5.22) сигнал <$*,г. 3. По . ., g>n находим вектор шумов датчика поля 6Л = (©j, . . ®,v). 4. Вход Z определяется по формуле Z = Sl„„r+6h. 5. Случайные величины й(...х зададим так: 2 {ZS*'..., г) + .х = “6.х при (Оо = к, О при (оо#=А:. <....х = I Таким образом, вектор U полностью определен на {Q, ®, Р}. Обозначим: U* — вектор с проекциями ...X» а О* — вектор с проекциями й|,х, тогда U*, (Оо = /С, О, <1>о к. U = к Выше была выведена формула среднего риска (5.15). Входящий в нее многократный интеграл получен как предел интегральной суммы /= 3 ... 5 P(C\EQQnH)P(E\Q(-]H). (5.24) •i®»—» <№~со Интеграл получается из интегральной суммы при неограниченном уменьшении^!, . . ., dz^, от которых зависят события Eei"„teN. Помножив и разделив I на Р (Е f) Q f) f) Я), на основании теоремы об условных вероятностях найдем т V V (С n g Г) Q П Я) 1 ~ Zj • • • Zu P(Q АН) оо —00
Используем формулу полной вероятности (по событиям ^е,...е5), ТОГДа /= р-«2ПЯ)'Р(С n Q П Я) = P(C\Q П Я)-Полагая, что априорные распределения и функции потерь не зависят от номера траектории Pi,...,г = Pt.г = р(<?), Н:::::rk - М::.;;г, имеем Я(Р)= s Pi.......г s i...г 5......К к Допустив дополнительно независимость событий Н и Q, согласно формуле полной вероятности (по событиям получим к к = -^-Р(СП0= Р(С|<2). Событие С для фиксированных £,..., X можно определить как множество таких со, для которых .....<4,...,». для любых £*,. . ., 1*. Поэтому, если известно условное распределение Р (U | Qi.г) вектора U при условии Qi..г, то оо «Ч..> и£...>. P(C|0=fdu6 х $ ... $ Р(Я|<?{ r)dU, —ОС —ОС —“ОО Я(Р)= 3 Pi.....г S i..г |..К оо «Ч....’Ч.....I- X J du^.... х $ ... $ P(C/|Ci......)dU. (5.25) — 00 —00 —ос. В формуле (5.25) векторный дифференциал dU содержит все проекции, кроме duj.х. а) Определение условных математического ожидания и корреляционной матрицы вектора U. Все свелось к нахождению условного распределения вектора U. В силу центральной предельной теоремы при достаточно большом значении q условное распределение Р (U | Qi..г)
близко к нормальному, и для определения Р (U | Qi.......г) следует вычислить условное математическое ожидание и корреляционную матрицу вектора U. Найдем сначала условную характеристическую функцию [5.3] / (ilt . . <г) при условии Qi, ..., г- По опреде- лению / (Н....tT) = М £ exp (i У| t,u^ | Qi.J = 8 = 5 еХр [1 У, tsU‘ Р d(0 = 1 r Qi,..., г s = —j- У, S exp p У,(®)] Pd® = ’ Г к QOH s = —)^pk $ ••• $ .'•)exp{f У, ч *x Г к —ос ---------oo x [2(4,..., ,4....x) - II4.x II2 + 2О2^. In Pl..x + N 4-2 p(xi> • • • - xN)dx!,... ,dxN. (5.26) M=1 Считаем шумы датчика независимыми и распределенными нормально, тогда п / ч 1 ( 4 + • • • + 4 \ Pfe - exp------------г----- . ' к \ ~к / Полагаем также, что дисперсии шумов ст2 и априорные вероятности гипотез 4.- А не зависят от номера траектории к (al^ = ol, 4.....х ~ Р1....>•); в этом варианте после интегрирования (5.26) получим / (^i, • • •> tr) = 2j Рк exp/i 2 А. {2 (4,..., r4.— к \ 5...х -II4....х'||2 + 2о1 In Pt..х>- — 2о1 3 S ..............х/ь...х,(4....Х14....*.?>• А.1 fcj,...» Хз /
Известно [5.3], что M(uv..............jx-| г) = ----1 , (5.27) i*..V HJ.....X=° M (ub....x«] Qi,..., r) = Поэтому M (W‘s,....x|<>i....r) - = 3 Pk [2 (S*....St x) - II St XII2 -i- 2ol In Pt x], k M (u£....Xtw6...... I Qi,..., r) = S Pk 0ol ($£,..., X,st,.X,) + к + {2 (S*..., rSt , x.) - || St.x. II2 + 2ol In Pt...xj x X {2 (St..., Л,..., xt) - || St, x, II2 + 2aL In Р1г xj> C. (5.29) и элементы ковариационной матрицы ^:::::t; = 3/(«5......хл,...xj Qi,..., г) - - M (Ut....X, | Qi...r) M (ut...X, I Qi..r) (5.29a) равны x] = (St...x.St,...x.) + к + a Pk [2 (St..., rSt.X.) - || St...X. II2 + 2al In Pu..„ x.J X к x {2 [(St...,rSt,.X.) - SMSL.rSt,..........x,)l - -[Il-St..x, ||2-3 Pa || St....X.H2]}. (5.30) a б) Вид условных статистических характеристик вектора U в случае стационарного эргодического поля. Мы будем использовать условия эргодичности в виде Q Кт 4- У. hk {х + tL, у) Л* (х + Дх + tL, у + Дг/) = Q hi ~ by), (5.31) здесь Uhh (Дх, by) — корреляционная функция поля Л (х, у).
Соотношение (5.31) может быть получено из классических результатов по эргодичности [5.4]. При достаточной длине реализаций (в КЭНС — I) или при достаточных размерах кадров (в КЭНС — III) приближенное условие эргодичности полей можно записать в виде N’ У, <* * * * * * * * * х + tL' и)h* (х + Дх + tL,y + Ду) l=^N' ^Rhh{bx,by) (5.32) для любых к, х, у, Дх, Ду. Рассмотрим теперь выражения скалярных произведений (Sij<$tn) для стационарных эргодических полей; (Sij S|n) — это частный случай скалярных произведений (S*...rS|...х), когда ошибки измерения скорости или искажения масштабов vL, ц~, а также ошибки курса ф! ОТСУТСТВУЮТ, Sij = S* ...1Г|л=г=,.=1), N’ M (S*Xn) = S 2 И-Гп -Ь p£] x ( ~—N‘ p=-M x + У + tL, yn4 T]H- P^b (5.33) На основании условия (5.32) (S*ijS& (N' + N* + 1)(2M + 1) Rhh [(£ - i) I, (t] - /) /]. С другой стороны, согласно определению корреляционной функции поля в корреляционно-экстремальных системах (см. § 3.1) Rhh (*i, Уг, хг> Уг) = pkA* (xj, у2) Л* (х2, ?/2) к и в соответствии с выражением (5.33) для стационарного поля всегда = (Л/' + N” + 1) (2М + 1) Rhh [G - i) I, (Т) - J) Z], т. е. в случае эргодического поля и достаточных длин реализаций, а также при отсутствии ошибок v, р, ф (5?Хч)~ЗрД5Ип) (5.34) к для любых к, i, j, £, Т|.
Если искажения по масштабам, скорости и курсу малы, то Si « г и из (5.34) вытекает (Si,..., rS|.х) ~ Рк (Si,..., rSL... %)• (5.35) к Если продолжить анализ условия (5.35), то на основании (5.22) можно получить N” М II s|.хII2«2Рк IISi......All2 - 2 2 Я,.„(0,0)- =-- (N' + Л'" + 1) (2М -j-1) о2 = Уо2 = const *). В рассматриваемом варианте, если дополнительно предположить априорное распределение вероятностей гипотез равномерным, числа .......х не зависят от индек- сов к, |, ...Двпо оптимальному решающему правилу (5.20) должны рассматриваться величины 4....x = (ZSL..,x). Условные математические ожидания и ковариационная матрица величин .........х могут быть получены тем же спо- собом, что и формулы (5.27), (5.28), и имеют в данном случае вид м («5 х | Qi г) = 3 Рк (SL., Л х)> (5.36) М’.::::: м »<£ S Рк (s|.x.sl х,). (5.37) к Если гДф, ХДф, уДр, #Др, OAv, hAv достаточно малы и (5.22) можно положить cos гДф = cos ХДф = 1, sin гДф = = гДф, sin ХДф = ХДф, #Др-гДф = уДрХДф = А Дуг-• Дф = ОДуХДф = 0, то N" М Е Рк (st..., rsl.х) = S 3 Ям. кв - о i + к t=—N' р=-М + t (•& — h) IAv -|- р (X — г) ЬДф, (л — j)l + — г)£Дф — р(у — g)LAji]. (5.38) Соотношения (5.36), (5.37), (5.38) определяют М {ui...xl Qi....г), xj. После того как найдены услов- *) Далее рассматривается случай центрированного поля, когда = 0.
ные математические ожидания и ковариационная матрица вектора U, можно рассчитать условную плотность вероятности, интересующую нас Р (U | Qi...r). С учетом то- го, что условные распределения вектора U предполагаются нормальными, Р (U I <2i г) = т1/^^ ехр 4-6К7>(Г}, V IV ... ' (V2n)T}/det К,- I 2 где Ь = U - М (U | Qi.......г). Задавая различный вид функции потерь VKjпо формуле (5.25) можно рассчитать среднеквадратическую ошибку определения координат од, среднеквадратическую точность определения скорости (и масштабов^ <jv и среднеквадратическую ошибку определения курса о^: а) при расчете од надо задать = (£ — i)2Z2, тогда R (F) = од; б) при расчете сту надо задать wl; = V2 (•& — Л)2 Av2, тогда R (F) — оу; в) при расчете Стц, надо задать РГ|’;;.”ГК = (К — г)2Аф2, тогда R (F) — (Д. § 5.3. Оптимальные поисковые алгоритмы совместного оценивания местоположения и скорости движущихся объектов [5.5], [5.6] В настоящем параграфе рассматриваются только КЭНС — I. Исследуется одномерный вариант системы, скорость движущегося объекта предполагается постоянной. Это, не ликвидируя общности конечных результатов, позволяет облегчить математические выкладки. Так как одного замера поля в КЭНС с точечным зондированием полей (КЭНС — I) недостаточно для определения координат движения, то при принятии решения в текущий момент времени используются еще N — 1 предыдущих измерений ДП: hk [хд — xL (1 + vj.)] + — xL (1 + v*)], х = 1, . . ., N—l. Написанное выражение предполагает, что происходит движение с постоянной скоростью, ось х направлена вдоль
априорного (измеренного на движущемся объекте) направления скорости V, L — априорное (предполагаемое на движущемся объекте) расстояние между последовательными замерами ДП, vl — случайная относительная ошибка измерения скорости движения; v~ в дальнейшем предполагается постоянной во времени. В качестве входа системы Zk будем рассматривать вектор-строку (zx), элементами которой являются предыдущие и текущие измерения ДП: zx = [хд — v.L (1 + v~)] + [хя — V.L (1 + vj,)], х = 0, 1, . . N — 1. Априорная информация о поле заключена в множестве реализаций {Sy}, i — —п, . . п; j — —т, т, хранимых в памяти решающего устройства. Реализация Sy также представляет собой вектор-строку ($ух), причем $гуи - h* [хп + И — иЬ (1 + jAv)], здесь I, Av — шаги дискретизации по координате х и относительной скорости движения, (2п 4-1) I, (2т + l)Av — доверительные интервалы, ха, Уп — априорные значения местоположения и скорости движения. Множество {Sy} будем рассматривать как пространство сигналов 9*. В результате сравнения входа Z* со всеми сигналами Sy из множества 9* решающее устройство принимает некоторую гипотезу о действительном местоположении и скорости движущегося объекта; J-, т| — апостериорные оценки параметров г, /. В § 5.1 показано, что в случае стационарного эргодического поля и равновероятных гипотез по оптимальному решающему правилу рассчитываются и сравниваются между собой числа 4 представляющие собой скалярное произведение векторов Z* и S-n, и выбирается та гипотеза для которой число uj»,)» оказалось наибольшим. В качестве апостериорных оценок местоположения х и скорости V движущегося объекта принимаются х = ха + V = Уп (1 + n*Av);
это предполагает, что координаты х, V обязательно кратны I и 7nAv. Если Z и Av выбраны достаточно малыми, то пренебрежение шагами дискретизации не вносит существенной ошибки в оценки местоположения и скорости. В § 5.2 показано, что для отмеченных выше условий апостериорные среднеквадратические ошибки определения местоположения Од и скорости <Уу движущегося объекта выражаются через условную плотность распределения Р(V I Qu) вектора U = (и$п), £ = — п,.. ., n; j = — т,... . . ., т следующим образом: * ОО иЬ1 °* = (2л + 1) (2т + 1) У| — r)a 5 duto J • • • i, j fc, И —оо —оо ••• \ P(U\Qi})dU, (5.39) —оо ____________________________ ___________________________ е© иЕТ) а^=_________________________Jdu^ $ ••• i, 3 С> Л — оо —оо ... J P{U\Q^dU. (5.40) —00 В формулах (5.39), (5.40) векторный дифференциал dV содержит все проекции, кроме du^- Часто обоснованным является предположение о нормальном характере распределения Р (U | Qij), когда р (UI Qij) = (ул5й-)(8п+П(4т+1) ехр (- -g- bKu (J ) , (5.41) и = и - miu । (?о1. В § 5.2. найден вид условного математического ожидания М [U | Qij] = (М lug,) | ф^]) и ковариационной матрицы Ки = || II вектора U в случае стационарного и эргодического поля h, (х) и достаточно больших (для проявления эргодичности) длин реализаций NL: N-1 М I s Phh [(£ — i) I — t (n — j) bAv], <=o
N-1 Л = И Xhh IG1 - Ы I -1 (щ - Па) LAV], (=о здесь Rhh (А) — корреляционная функция поля h (х), ot — дисперсия ошибки датчика поля. Исследуем точность КЭНС — I при работе по мелкоструктурному полю. Кроме обозначений проекции вектора U будем обозначать также и,; зададим следующее соответствие между номером s и индексами J и г]: s = (2т + 1)(£ + n) + m + 1 + г], при 5 = —га, Ц — —гаг s = 1, при = га, т| = m s = (2га + + 1) (2т + 1). Матрица Kv является блочной и состоит из матриц Л Л : 4 : : 4 z-н,-п : -п,-п+1 : : -п, п л : А ! : А -п+1, -п : Л-п+1, -п+1 • ’ ‘ ’ j Л-п+1, п Для блочной матрицы числа £х, £2 постоянны, и элементы блочной матрицы равны N-1 at Ц Rhh [(Si — I2) I — t (t)i — г]г) ^Av ]. (5.42) 1=0 Они меняются только в зависимости от Цц т)а, причем в соответствии с (5.42) А^, = Па основании сказанного Ки можно представить в виде Bq 1 Bi । В, ! в; | в,, | в, | BJ I BJ | в0 | Kv В2П ®2п-2 рТ : рТ • рт и2п • "2п-1: "зп-2 • Во
где Bq - ^4-п, -п ’ -^-п+1, —п+1 — . « • — -4ц, п* В\ = ^4-п, -п+1 ~ '4—п+1, -п+2 = . • • — Лп-1, п> Вгп-i = -^-п, п-i = -'4-n+i, п, В$п — -^-п,п И Bl = B-v Элементы матрицы В% = || || равны 2V-1 Ьп,гъ = al S Bhh Ш +1 (Hi — П2) Mv], (=0 а расположение элементов в матрице В* таково: ь* . . -т, -т -т, -ш+1 -ш, т /Л - -m+l,-m -m+1, -m+1 ’ ' -m+1, m />& iJs m, -m m, -m+1 ' • • m, m I Будем рассматривать лишь такие значения ошибки по скорости, для которых 2mLAv {N — 1) = kl, здесь к — некоторое целое число, удовлетворяющее условиям, о которых говорится далее. Тогда х-i = ot У, Bhh {[2m (W — 1) g 4- kt (щ — ц2)1 2ro(7V~-l) } ‘ (=0 Рассмотрим мелкоструктурное поле, корреляционная функция которого подчиняется соотношению («• ври |Д|< ЛмДД) = t 1° П₽И 1Д1> 2m(N=iT- Радиус корреляции р такого поля равен 1 Р = 2т (N — 1)
N-1 t>w, = о! 2 Rhh {[2т (N — 1) | + kt (т)х — г)2)] р). (5.43) 1=0 В квадратных скобках формулы (5.43) стоит целое число, поэтому Rhh {[2т (N — 1)? + kt (гц — т]2)1 р) отличается от нуля лишь при условии 2zn {N — 1)| = kt (ц2 — pj). (5.44) Для вычисления Kt достаточно так как В_% == В|- Если | = 0, то определить В% для £ > 0, Во = о2о1_ N 1 1 .. . 1 1 N 1 . .. 1 1 1 N ... i 111 ... N Дополнительно предположим, что числа т, N — 1, п и к — простые, причем к не совпадает пи с т, ни с п, ни с N - 1. Рассмотрим высокий уровень ошибок по скорости, когда к > 2п. Тогда левая часть (5.44) не содержит число к в качестве элементарного делителя и условие (5.44) выполняться не может. Следовательно, В^ = 0 при 0 < £ 2п, о Во1 Простой проверкой можно убедиться, что - . — (TV — 1) (N + 2т) б2з^ W + 2т - 1 -1 -1 -1 -1 2V + 2m-l -1 ... -1 -1 -1 TV-Ь 2т -1 ... -1 - 1 Л + 2т — 1
Теперь нетрудно показать, что М [u6n | <?ij] = Wo2 при £ = i, т] = j, о2 при £ = i, г] у= j, 0 при |=/=i, (5.45) __________1___________ 2(N -l)(/V + 2m) б*з! £ [(/V !-2,и) £ й|п-п t]=—т т - (Е М2] ’(5-/,6> 1=-т detKu = (о2о1)<а"+1)«’«+1) (N — l)«m(®n+i) (N 4. 2m)2n+i. (5.47) В результате проведенных преобразований в соответствии с формулой (5.41) может быть найдена условная плотность распределения Р (U | Qi}). Выясним зависимость среднеквадратической ошибки Од от <т/а~, N, т, п, I. Согласно (5.39), (5.41), приняв во внимание (5.45) — (5.47), после необходимых выкладок получим n т п т <*-?£ Ё Ё i=—n j=—m £=—п т]——m где = оо “Ет) иЕч _____ = с . с ?_________________(у уу — i )2n+1________ J “И|п J ’ J (/2л)г(зз )T(VN^A)T(VN + 2m)an+1 —00 —00 —00 I 1 X ехр /-------------------— х I 2(N — 1) (.V + 2m)a232 n m m X У, [(# + 2/71) y< ulK — ( ] + 0=—n X=—m x=—m «5*4
тп + {(У + 2т) [ У, (ил - ст2)® 4- (ui} - JVo’)’] -Х==—т т — [ У, (щк — °2) + («и — /Vof2)]2}/>) dU' Л=—т Т = (2n + l)(2m + 1). Рассмотрим случай i ф сделав замену “£П з<з~ ’ найдем РхМ = j/ ’ ^Zo' Х io 2m 2т ..-4= jj еХр|_4-[£21-^±^(£гх)2]}&гт^го —оо Х==о Х=0 Здесь обозначено S dXo-'- —оо z 2т 2пг •••/W Sехр Г'НЁ4 - лн^(£4\]рХ2т’ —оо Х=() Х=0 NfJ о 2- • -- 2— .......—-- / N-1 <з~ V N~i а~ /л-1 1 с ,1 с , -V + 2т у2л J У° /2^ J У1 ’ ' ' —оо —оо У N-1 2т 2 т ...7W S ехрЬ-г[£^- л^(£^)2]Н2"* Г -оо К=0 Х.=0
Поскольку Pij-ч = Р (I £), не зависит от индексов i, j, Т], то п п ol= Л.р(2т + 1)2 £ £(£-i)2 = i= —п £=—71 = -B-n(n + l)(2n + l)(2m 4-1)2 Pl2. <J Ho n (n + 1) Za/3 равно среднему квадрату о*2 априорной ошибки определения местоположения и . 00 = 2 (2m + I)2 (2n + 1) /J < J2"’1 (zn, т) х G (z0, N, т, ——I ( dzt... ( /2л J /2л — ®0 г» 2m х J ехр{-4-[£)4 — оо Х=о 1 A’ -j- 2т 2тп dz0. (5.48) Если т = 0 (ошибки измерения скорости отсутствуют), то J(z, N, 0) = ф(]/^-2), G (z, У, 0, £) = Ф z - \^~N £) , 2 г_________ <» , г----- . ^=2(2„+1)/V^d*,,M(/‘W< аД Г -оо Хф(]/'^-дДг- / Л' T^jexp [ —4-(z2 — 4‘z2)]dz=" = 2(2« + 1)?= J е г Ф2"-1 (z) ф[х-У N dx, — ОС Z где Ф (z) = - 1— ехр (--dt — интеграл вероятности. —оо Это совпадает с ранее полученным результатом [5.7].
Аналогичным путем на основе соотношения (5.40) можно W о 2 наити зависимость, определяющую средний квадрат оу ошибки вычисления скорости движения КЭНС — I. Рис. 5.4. Графики достижимой точности поисковых алгоритмов оценивания, рассчитанные по формуле (5.48). На рис. 5.4, 5.5 приведены графики достижимой точности при наличии ошибок по скорости, рассчитанные на ЦВМ в соответствии с формулой (5.48) А. А. Аветисо-
вым. Анализ зависимостей рис. 5.4 показывает, что при низких соотношениях сигнал/шум (о/о~<^1) апостериорная среднеквадратическая ошибка определения местоположения превышает априорную. Происходит это вследствие того, что при выбранной простой функции потерь Рис. 5.5. Области повышенной точности оценивания. (2.28) оптимальное решающее правило максимизирует апостериорную вероятность правильного определения координат (см. § 2.1, в) и не обеспечивает минимума среднеквадратической ошибки. Использование функции потерь вида (2.28) позволяет получить простые в расчетном отношении алгоритмы. В то же время при достаточной длительности наблюдения (большие N), при реальных соотношениях сигнал/шум (о/о~ 0,5—2) оптимальные поисковые алгоритмы позволяют значительно (на порядок и более) увеличить точность определения местоположения движущихся объектов. Зависимости рис. 5.5 характеризуют область повышенной достижимой точности. § 5.4. Оптимальные поисковые алгоритмы корреляционно-экстремальных навигационных систем, использующих одновременно несколько полей [5.8] Рассмотрим одномерный вариант корреляционно-экстремальной навигационной системы I класса, когда на движущемся объекте одновременно измеряется А различных
полей fcx (х), X = 1, . . .,Л. Поскольку план доказательства окончательных соотношений совпадает с применявшимся в §§ 5.1, 5.3, то изложение в настоящем параграфе ведется конспективно с опусканием многих промежуточных выкладок. Пространство сигналов 6* при движении по fc-й траектории состоит из множества векторов S*/. 0* = {£<*}, i = —п, . . ., и; / — — т, . . ., т. Каждый сигнал S*j, в свою очередь, представляет собой совокупность векторов 4=(5i\) = (St\,Si\, ...,S?,A). Здесь множества {5*?к} практически реализуются в виде карт полей h* (х), имеющихся на борту движущегося объекта. Каждая вектор-строка S*^ содержит N проекций соответствующих N последовательным замерам поля hl (х), используемым в обработке. Согласно § 5.3 stjXK = hl [хп + И — v.L (1 + /Av)], х = 0,1, . . . .... N - 1. Сами входы Z* — это совокупность векторов Zl: 7* = (Z£), X = 1.......Л, причем Z* соответствует измерениям поля (я)- Вход содержит аддитивную помеху 6Л*, и проекции вектора Zl записываются следующим образом: zL = h£ [хд — xL (1 + vt)l + bhl [хд — xL (1 + vl)l- Вектор шумов Shk понимается как совокупность векторов шумов 6Л* измерителей каждого поля h* (х): бЛ* = (6Л£), X = 1, . . ., Л, здесь = (б^х), х = 0,1, . . ., ЛГ — 1, = bhl [хд - xL (1 + vt)].
Уравнение байесова риска R в соответствии с (5.15) q п т щ R{F) = 3 р* 5 3 Pl % 3 И£х fc=l i=s—n j——m £»—n T)=—m oo co x J ... J P(Z\Sl)F°k(D^\Z)dZ. NA Будем считать, что шумы всех датчиков распределены нормально, являются белыми и шумы отдельных датчиков не коррелированы друг с другом. Тогда P(Z|S£) 1 - - A------------ех₽----------2 L--------7---------- * _ Art — среднеквадратическое отклонение ошибки измерения поля hk (х) при движении по к-й траектории. Зададим простую функцию потер / 1 при g = i, Г) = /, | 0 в противном случае, и предположим, что гипотезы равновероятны (Pt* = const). Нетрудно убедиться самостоятельно, что в этом случае по оптимальному решающему правилу выбирается та гипотеза для которой оказалась меньшей величина = 2j—7-- (5.49) Рассмотрим случай стационарных и эргодических полей и будем считать, что длина обрабатываемых реализаций NL достаточна для проявления свойств эргодичности всех полей. В этом варианте оптимальный алгоритм (5.49) упрощается: вместо чисел по принятому входу рассчитываются и сравниваются между собой числа = 2j —7— - 5 = - n> • • -га; n = - m................. X=1 ~Mt
и выбирается такая гипотеза для которой число максимально. Риск согласно (5.25) может быть выражен через характеристики условного распределения вектора U = (и^): ОО Чп "ел F(F) = 2 f du^ f ... J P(U\Qi})dU, к l, j J, Л —ОС —ос —ОС (5.50) Qij — событие, состоящее в том, что хд = хп + И, v~ = = y'Av. Вполне обоснованно предполагать распределение Р (U | Qu) нормальным, когда - (7гя'>- е11р Р.М) где Т — (2n + l)(2m + 1). Зависимость (5.51) будет полностью определена, если найти Кг и М (U | Qij). Для этого сначала вычислим условную характеристическую функцию / (ir, . . ., tr) при условии Qij. По определению (см. [5.3, 5.9)) /(«х, ..., tT) = М [ехр (i |<?d- При принятых ранее допущениях /(ti, ..., 1т) = N л П (/к* , н=1 JJ *—1 / х ] -j- х* \ х ехр I------— ----— I dxn ... dx1Ndx2i... dxA1... dxAN. I 2з^ J \ ~Mc / (5.52) 1 I Xkl + • • • + XKN \ здесь---------от- exp----------------I — плотность рас- пределения шумов Л-го датчика, Ptj = Р (Qij).
Считаем дисперсии шумов ности Pij не зависящими от после интегрирования (5.52) и априорные вероят-номера траектории, тогда находим _____________ Л г- ______ (ск ок \ /«,...М-У.Р.Пехр к Х-1 - Т31 5~Х v v t , 2j 2j Zbn.£bn. 2з2 £1, Th Tfa '“’‘X, (5.53) Согласно (5.27), (5.28) вычислим первые два момента случайных величин = (5.54) от6*п* 1Чп=0 M£u6,n^bn.l<?v) = —|( (5’55) Чнъ I'sn- ’ Осуществляя дифференцирование (5.53) и подставляя значения соответствующих производных в (5.54) и (5.55), получим _ ___ 5а к X ~Х КП VI ^01 ^1п1? М («БХI Qii) = £ Рк £ \ - (5.56) к И (“м."е.Ч11 <?<>) = У, р« У, к X X ~к К ~к 'К сК \ - Иа . (5 57) В соответствии с уравнениями (5.29а), (5.56), (5.57) элементы ковариационной матрицы равны к X 1 —I <з‘ Если, как это уже предполагалось ранее, все поля стационарные и эргодические и длина реализаций достаточна
для выполнения условий эргодичности по отношению к каждому полю, то, как и в § 5.2, (‘^‘А'^ЕЧ),) ~ 3 Рк Л. = 1,..., А, и, следовательно, к X °~Х Уравнение (5.38) применительно к рассматриваемому варианту принимает вид ЛГ-1 5 Рк ($М= *3 1(51 — 51) I — X-LAv (т)з — TJ1)], (5.59) где Rhhx (А) — автокорреляционная функция поля h\ (х). Поэтому N-1 М («5л I Qij) = 2 3 - 1)1 ~ - Т])Ь (5.60) X х=о N—1 = 3 3 1(52 - 51) I - xLAv (n, - Th)]. X х=0 (5.61) Соотношения (5.50), (5.51), (5.60), (5.61) позволяют оценить точность определения местоположения и скорости движущихся объектов КЭНС — I, использующими одновременно несколько полей. Далее рассматривается один практически интересный частный случай, когда КЭНС применяется только для измерения местоположения, а все используемые поля являются мелкоструктурными, т. е. их корреляционные функции подчиняются соотношениям р /АХ Нири Д-0, Л^(Д) = 10 при Д=£0, и отсутствуют априорные ошибки измерения скорости движения. При исследовании этого варианта у переменных опускаются вторые индексы и в соответствующих формулах
не осуществляется суммирование по опускаемым индексам. Средний квадрат Од апостериорной ошибки оценива ния местоположения может быть рассчитан по формуле (5.50). Если в ней положить = (£ — i)2Z2, то R (F) = = Од: П П « «5 ч °’ = 2ггг Е ЕSdu£ $ ••• S p(u\^du’ i—^n £=—n —oo —oo —oo (5.62) p(U ।<?-> = ' (5'63) При выводе (5.62) использованы сделанные ранее допу- щения (например, = Wt)’ учтено’ равновероятность всех гипотез: Рг = что выражение, стоящее под знаком ^)рк(...) в (5.50), не зависит от номера траектории к, и к использовано условие — 1. Равенства (5.60), (5.61) для мелкоструктурных полей принимают вид Wj|Ci) = N S при i = £, к _ j N 3 при & = Ь, I 0 при Sji#42, (5.64) (5.65) О при i =£ т. е. ковариационная матрица Кц становится диагональ ной: KL = N^o^lE, к Е — единичная матрица. Подставляя (5.63), (5.64), (5.65) в (5.62) и проведя необходимые преобразования, получаем = 2 n(n+1)(2n + l)Z2 1 X и у е~ 2ф2п-1(з)ф(г- n Е )dz-
здесь Ф (z) — интеграл вероятности. Поскольку средний квадрат о*’ априорной ошибки равен а*2 = 2 1/2 + <2/>2 + • • • + W = ”(Пз+1) I ' X О то выигрыш в точности оценивания местоположения, получаемый от использования КЭНС, определяется уравнением 4г = 2(2п + 1)-4= I з* У2я __________ X Ф / г — 1 / N у1| dz. (5.66) \ V к / Графики этой зависимости показаны на рис. 5.6. Рис. 5.6. Графики достижимой точности КЭНС — I, использующей одновременно несколько полей. Сравнение результатов этого параграфа с полученными ранее (см., например, [5.7], где рассмотрена аналогичная задача при работе КЭНС по одному полю) показывает, что для получения такой же точности КЭНС, использующая одно поле, должна иметь более высокое отношение сигнал/шум, чем КЭНС, использующая много полей. Эквивалентное отношение сигнал/шум (для КЭНС,
работающей по одному полю) равно '°~*энв Таким образом, использование в КЭНС нескольких полей позволяет существенно улучшить точность определения координат движущихся объектов при прочих равных условиях.
ГЛАВА VI РЕКУРРЕНТНО-ПОИСКОВЫЕ АЛГОРИТМЫ ОЦЕНИВАНИЯ В КОРРЕЛЯЦИОННО. ЭКСТРЕМАЛЬНЫХ НАВИГАЦИОННЫХ СИСТЕМАХ § 6.1* Рекуррентно-поисковое оценивание ошибок инерциальной системы при наличии вертикальных маневров [6.1] Рассмотренные в предыдущей главе поисковые методы оценивания предполагают, что датчиком поля (ДП) непосредственно измеряются те значения (с точностью до шумов измерения и картографирования), которые в качестве априорной информации записаны в памяти БЦВМ в виде карты используемого навигационного поля. Однако такая ситуация, строго говоря, имеет место лишь при полете на постоянной высоте. В условиях интенсивного вертикального маневрирования рабочая информация, поставляемая ДП, не совпадает с априорной. Это объясняется, как отмечалось выше, различными причинами. Применительно к пространственным полям — зависимостью этих полей от высоты; по отношению к полю рельефа — самим способом определения рельефа на борту летательного аппарата (ЛА) путем вычитания из абсолютной высоты полета Н (фиксируемой вертикальным каналом инерциальной системы (ИС) или барометрическим высотомером) относительной высоты Нот, измеряемой, например, радиовысотомером; по отношению ко всем остальным поверхностным полям — зависимостью степени сглаживания поверхностного поля от высоты полета из-за влияния угла раскрыва диаграммы направленности датчика поверхностного поля. Однако при незначительных колебаниях абсолютной высоты полета допустимо пренебрежение отмеченными И А. А. Красовский
искажениями и возможно использование поисковых алгоритмов оценивания. В условиях же интенсивного вертикального маневрирования пренебрежение переменностью абсолютной высоты полета недопустимо, так как это может привести к потере точности и даже работоспособности КЭНС. Оптимальные алгоритмы оценивания в условиях вертикального маневрирования могут быть получены на основе использования идей РПО. Исследованию алгоритмов РПО в данном применении посвящена настоящая глава. С технической точки зрения применение РПО связано с комплексной обработкой информации от различных подсистем навигационного комплекса при точном учете дифференциальных и алгебраических зависимостей в показаниях различных датчиков. Крайней и наиболее последовательной формой такого комплексирования является совместная обработка показаний возможно наибольшего количества измерителей, входящих в навигационный комплекс. Например, таких как акселерометры всех трех каналов ИС, инерциальные измерители углов тангажа О, крена у и рыскания ф, система воздушных сигналов, измерители различных навигационных полей (радиовысотомер, магнитометр и др.), курсовая система, допплеровский измеритель скорости и угла сноса, различные корректирующие устройства (радиолокационные станции, радиосистемы дальней и ближней навигации, астроориентаторы) и пр. Такой подход при правильной его интерпретации обеспечивает высокую точность и надежность всего навигационного комплекса. Его можно считать логическим завершением идеи комплексной обработки информации на борту ЛА, но одновременно он требует БЦВМ повышенной мощности. Наряду с этим возможен другой крайний подход, заключающийся в выделении минимально необходимого состава подсистем, в который входят либо три канала ИС, баровысотомер и датчик поля — в случае инерциальной основы счисления координат (рис. 6.1), либо курсоверти-каль, допплеровский измеритель скорости и угла сноса (ДИСС), баровысотомер и датчик навигационного поля — в случае курсо-допплеровского счисления координат, и рассмотрении вопросов комплексирования при таком минимальном наборе датчиков. Последний вариант предъ
являет существенно меньшие требования к БЦВМ и в то же время обеспечивает достаточно высокую точность и надежность всего навигационного комплекса. Именно этот вариант рассматривается в настоящей главе. Введем обобщенную модель датчика поля. Из третьей главы известно, что пространственные поля, например магнитное поле Земли, являются потенциальными и их потенциал подчиняется уравнению Лапласа. Различные Рис. 6.1. Блок-схема навигационного комплекса, основанного на инерциальном счислении координат. составляющие пространственных полей, определяемые как частные производные от потенциала, также подчиняются уравнению Лапласа. На этом основаны существующие методики пересчета распределения пространственного поля hn (|, т|) у поверхности Земли на произвольную высоты Н (см. § 3.2). Для высот порядка десятка километров удовлетворительные результаты пересчета достигаются использованием формулы h(x,y,H) + <%dx], (6.1) 2я ДД к2+п’+^т„),л где х, у -— координаты горизонтального местоположения движущегося объекта. Предел интегрирования а должен выбираться не менее 10 Нтн [3.16]. Кроме того, в первом приближении можно считать, что и модуль напряженности пространственных полей удовлетворяет равенству (6.1). Будем предполагать, что датчики навигационных полей измеряют эти поля с аддитивной ошибкой 6/г, тогда уравнения датчиков пространственных полой можно записать в виде h* (х, у, Н) = h (х, у, Н) + Ыг. (6.2)
В (6.2) и далее звездочкой «*» обозначаются измеренные значения величин. Датчики поверхностных полей измеряют эти поля в той точке земной поверхности (с координатами хд, ?/д), Рис. 6.2. Иллюстрация уравнения (6.4). куда направлена ось диаграммы направленности датчика поля (рис. 6.2). В связи с пространственным рассеянием мощности сигнала, отраженного от земной поверхности (или сигнала, излученного элементом земной поверхности), значение любого (кроме поля рельефа) поверхностного поля h* (х, у, Н), измеренное на высоте Н1т, связано с распределением поля на поверхности Земли равенством h* (х, у, Н) — к (Яотн) ha{x + D cos е, у -f- D cos б) + 6Л, (6.3) здесь к (Яотн) — коэффициент, учитывающий рассеяние в пространстве мощности отраженного сигнала поверхностных полей, е, б — углы между осью'диаграммы направленности и земными осями х и у соответственно, D — дальность от измерительного устройств до той точки земной поверхности, в которой производится измерение поля. Формула (6.3) соответствует случаю, когда диаграмма направленности приемного устройста является игольчатой. При необходимости можно использовать более полные модели датчиков поверхностных полей. Найдем зависимости, связывающие координаты хд, ул с координатами пространственного местоположения движущегося объекта х, у, Н, а также с углами тангажа, крена и рыскания О, у, ф, определяющими его угловую ориентацию (предполагается, что оси диаграммы направленности совпадает с осью ух связанной самолетной системы координат хъ уг, zt). Из рис. 6.2 получаем Дхд — D cos е, Дуд = D cos б, D cos # cos у — Н (х, у) — Яр (х + Дхд, у + Дуд),
причем известно [6.2], что cos е — cos яр sin б cos у — sin яр sin у, cos 6 = cos яр sin у + sin # sin яр cos у, поэтому // (х, у) - Н (х + D cos е, у + D cos б) D - ——---------------------—---------- , (6.4) cos О cos у ' ' здесь Нр (х, у) — рельеф земной поверхности. В первом приближении при движении на небольших высотах в уравнении (6.4) можно считать Нр (х + D cos е, у + D cos 6) ж Яр (z, у), тогда согласно (6.3), (6.4) модель датчика поверхностного поля примет вид Л* (.г, у, //) = = к (Яотн) Ло Гх + ^отн —- У + ^отн — 1 + \ vth / „ I отн cos# cos у ’ а 1 ° "cos# cosy J 1 + 6Л, (6.5) где Яотн = Я (х, у) — Нр (х, у). Измерители рельефа земной поверхности обычно создаются на основе использования радиодальномеров. Поэтому согласно (6.4) выходной сигнал такого измерителя равен Н («. У) — Пр (х 4- D сов е, у + D cos б) cos# сое у Уравнения ошибок ГНС (инерциальной системы) запишем в виде (3.146) — (3.148): М = ДУХ, Д£ = ДУ„, ДЯ = ДУн, j ДУХ = О, ДУ, = 0, ДУН = 6/н, / (6,7) где 6/н — суммарная ошибка измерения вертикального ускорения, рассматриваемая далее как случайное возмущение типа «белого» шума. Необходимость введения 6/н объясняется тем, что в КЭНС, использующих поле рельефа и инерциальные системы в качестве ГНС, влияние флуктуационных ошибок вертикального акселерометра выше, чем горизонтальных акселерометров. Так как вертикальный канал ИС без принятия специальных мер является неустойчивым, обычно для его кор
рекции используется сигнал барометрического высотомера. Примем следующую модель баровысотомера: Н* = Н + ЬНК - 6Нг„ (6.8) где Н* — сигнал баровысотомера (измеренная величина), ДЯб и 6Яб — постоянная и флуктуационная составляющие ошибки баровысотомера. В силу постоянства ДЯБ ДЯб = 0. (6.9) Перейдем к рекуррентным соотношениям. Будем считать, что датчик навигационного поля производит изме-рения в дискретные моменты времени i, = iT (Т — интервал дискретности, 0,1, . . .) и что к текущему моменту времени t, когда необходимо произвести оценку координат движения, проведено N + 1 измерение, т. е. t = NT. Запишем уравнения движения (6.7), (6.9) в рекуррентном виде ДЯ^-,.! = ДЯи4 -j- TNVni + Вн, ДБ hi и = NV Hi + ДЯ Б(+1 = ДЯ б», Да+Н = Nxi + TNVXi, AFxi+i = Д Бх4, Д1А+1 — Nyi -f- Т ДБ ui, ДБ vi4-i = ДБ у,, где Ч+i > 'i+i lii = J dl J 6/н(т)</т, £2i = J 6yH(f)di, (6.10) 'i 4 4 и, введя обозначения хи = ДЯИ<, x2i — ДБнь xsi = ДЯб,-. X/ = (х14, Xei, Xjj)T, Zi — (Zli, ?2i> 0)T> Ylt = Д®»» = = ДБЯ(, Y3i = byt, У4< = ДБИ, Yt = (YU) У2Ь Y3i, У4гу, II Т 01 0 1 о|, ф = 0 0 Ч 1 T о 0 0100 /Р 44\ 0 0 1 T ’ (6.11) 0 0 0 1 сведем их к канонической форме (2.99), (2.100) Xi+1 = AXt + Zi, Y^ = ФУ(, i = бГЯ. (6.12) Начальное распределение р (Хо) вектора Xt считаем
нормальным, р (Хо) S N (т, G), и будем предполагать 0 0 II З’но 0 . 0 3М здесь они0, онб0 — дисперсии начальных ошибок измерения высоты ИС и баровысотомером, оуЯо — дисперсия начальной ошибки измерения вертикальной скорости. Возмущение считаем дискретным белым шумом с ковариационной матрицей вн^. О о 0 0 О 0 0 Q = ступ~ — дисперсия случайных составляющих ошибки измерения высоты и вертикальной скорости ИС, которые при необходимости с помощью соотношений (6.10) могут быть выражены через статистические характеристики ошибки 6/н. Определим множество В CZ R*" возможных значений вектора Yn. Считаем, что позиционные ошибки Дх^, Дрд, могут измеряться только с дискретностью 2, а максимальные значения позиционных ошибок равны nl (рис. 6.3, а). Скоростные ошибки AVXN, AVvn будем проверять с дискретностью v, предполагая максимальные значения скоростных ошибок равными mv (рис. 6.3, 6). Перейдем от употреблявшегося во второй главе обозначения и нумерации гипотез DjK новым обозначениям и нумерации Гипотеза предполагает, что в момент времени t = = NT, когда производится оценка, позиционные и скоростные ошибки навигационной системы равны Дхд, = ц.1, AyN = XI, ДУЖл, = vv, AVVN = (6.13) т. е. Dgvx; = (ц1, vv, XI, £и)т. Индексы р, X могут принимать значения — п, . . ., п — 1, п, а индексы v, £ пробегают значения —т, . . ., пг — 1, пг. Определим дискретную фундаментальную матрицу решений W (i, q). Как частный случай (2.104) получим
(ц q) = ф* ’, что с учетом (6.11) и правила умножения квазидиаговальных матриц [6.3] дает (6-14) Представим уравнения наблюдения (6.2), (6.5), (6.6) в отклонениях, как и уравнения процесса. С точки зрения Рис. 6.3. Дискретизация ошибок Дх, Ду, ДУХ, ДУ(/ при образовании гипотез коррекции ошибок ИС мы располагаем лишь двумя наблюдениями: наблюдением zx навигационного поля и наблюдением z2 разности высот движения, определенных инерциальным и барометрическим путем z2i = Я* — Яга, что с учетом соотношения (6.8) эквивалентно равенству z2i — AHui — ЛНгл + 6Я|.,1. При использовании пространственных и поверхностных (кроме рельефа) полей в качестве наблюдения z, примем результат непосредственного измерения этих полей zxi = = h* (xt, yit Hi). В случае использования рельефа местности наблюдение zt будем формировать следующим образом: Zi = Нц — Я* cos cos у*,
что эквивалентно равенству zt = Н 4- Д//„ — cos О* cos у* х //(х, у) — Н (x + Pcose, y + z>cosd) X ------------!---х--------------------cos V* cos у* on. cos v cos y ' (6.15) Тогда на основании соотношений (6.2), (6.5), (6.15), переходя к дискретному времени ti и заменяя под знаком аргумента поля действительные значения относительной высоты Ногп и углов е, 6, А, у, ф на их измеренные значения Нот, е*, 6*, О*, у*, -ф* (что вполне обосновано ввиду высокой точности измерения этих величин), запишем уравнения наблюдения в единой для всех навигационных нолей форме «и = Х*п + <Р< (Уц, У«) + (6.16) z2i = — x3t + 6ЯГ1{. (6.17) В (6.16) надо положить: при использовании пространственных полей — х ~ О, Х( — 1, <Н(Д.г{, Ду<) = С С !**<«*) + *-^4. У* («a + n-Aj/il » . ‘ А Д d£d,,i при использовании поверхностных полей (кроме рельефе) — X = 0, х, = 1, (р< (Дть Ду<) * Г * cos 8* (1Л = * I //о™ (Л)] Ло р* (ti) + Н0ТИ (ti) с09 ф* cos — - Дхъ у* (ti) + н'от (ti) - Ду<]; при использовании рельефа местности — х = 1, = = COS О* (ti) COS у* (ti), <Pi (Дхг, Ayf) = Яр [яг* (ti) 4- Я* (ti) cos e* (tt)— Axt, У* (ti) 4- D* (ti) cos 6* (ti) - byt], (6.18) здесь tp (Дт, Ay) — пересчитанное на высоту H*m значение навигационного поля в точке с координатами х
= х* — Ах, у = у* — Ау (иначе, <р (Ах, Ау) — это высотная карта поля): cos е* (t^ = cos -ф* (tt) sin 0* (tt) cos y* (tt) — —sini|>* (tt) sin y* (tt), cos 6* (ti) = sin ip* (ti) sin 0* (tt) cos y* (t,) + (6.19) + cos ip* (ti) sin y* (t-,). Входящие в уравнения наблюдения функции Я*тц (ti), D* (tt), х* (tt), у* (ti), Ф* (tt), y* (ti), Ф* (ti) представляют собой измерения различных подсистем навигационного комплекса, используемые в рекуррентно-поисковом алгоритме оценивания ошибок ИС. Обозначив ц1( = nfiht, t]2J = 6Явь ф = Glm WS — (zli, z2i)T’ = 2 -?|’ F*<r0=fi(ro’rsi)|, (0-20) можно на основании (6.16), (6.17) записать Zi = HXi + Fi(Yi) + Л|. (6.21) Ковариационная матрица шумов наблюдения имеет вид гдест1,0б~ — дисперсии случайных составляющих ошибок датчика навигационного поля и баровысотомера. Таким образом, уравнения движения (6.12) и наблюдения (6.21) являются частным случаем канонических уравнений (2.99) (2.101), когда матрицы At(Yt) и Hi(Yt) стационарны и не зависят от вектора координат свободного движения Yi. Поэтому алгоритм оценивания в рассматриваемом классе КЭНС определяется соотношениями (2.107) — (2.110). Еще одной особенностью сформулированной задачи является вырожденность ковариационной матрицы Qi, вследствие чего последние два уравнения системы (2.107) теряют смысл. Нетрудно показать, что в случае вырожденности матрицы Qt эти уравнения заменяются соответственно соотношениями Мя+1 = Qi + (6.23) ед = In | Гд’Лтл QiA}i + А^Ап |. (6.24)
Приведем результаты моделирования для случая, когда параметры % и х, в формулах (6.20), (6.22) задаются ранными 1 *). Навигационное поле моделировалось стационарным случайным полем со статистическими характеристиками: о — 15а, р = 2 км, здесь о — среднеквадра-тическое отклонение поля, р — радиус корреляции поля, а — некоторая условная единица измерения. Одно из сечений поля показано на рис. 6.4. Элементы матриц G, Рис. 6.4. Одно из сечений ноля, использовавшегося при моделировании. Q, Hi принимались следующими: =1,5 км, оуНв — = 5 М’С"1, <тнС|) = 0,5 км, он- » 0, сгуя_ = 0, о- = 7а, Об- Ю м. Шаги дискретности при задании множества возможных значений В выбирались такими: I = 0,25 км, v "• 5м>с“*. Размеры доверительных квадратов задавались рапными и - 24, т = 1, общее число проверяемых гипотез составляло q = (2т + I)2 (2п + I)2 = 21 609, а все гипотезы считались равновероятными (Р^ш = const). Углы тангажа, крена и рыскания предполагались нулевыми О* (<) = -у* (t) = ф* (t) = 0. Измеряемые ПС координаты движущегося объекта формировались в ЦВМ по формулам ж* (t) = х (t) -f- Дж (f), У* (0 = У (0 + Ду (<)» Н* (t) = Н (t) + ДЯИ Ц), причем координаты действительного местоположения и ошибки *) Моделирование выполнено А. С. Ермиловым.
навигационной системы задавались соотношениями x(t) = 1,05 + 0,260 у (0 = 10,05 +|О,О50 Н (I) = 10, Дх (0 = 5 + 0,0026t, Ду (0 = — 5 — 0,00050 Д//и (0 = = 2 + 0,00750 . (6.25) где все координаты вычисляются в км, а время — в секундах. Моделировались следующие начальные ошибки подсистем навигационного комплекса: ДЯио — 2 км, ДУно = = 7,5 м-с-1, ДЯбэ = 0,75 км, Дх# = 5 км, ДУХ = = 2,6 м-с-1, Дро = —5 км, ДУи = —0,5 м-с-1. Результаты моделирования представлены на рис. 6.5— 6.8, где для перекрытия большого диапазона изменения величин принят логарифмический масштаб по оси ординат и введены обозначения ошибок оценивания 6х = х — х, бу = У — У> 6ЯИ = ДЯи — ДЯИ, 6Уи — Д-Vu — ДУн, ЬНц = ДЯб — ДЯб. На рис. 6.5 — 6.7 пунктиром показаны также удвоенные среднеквадратические значения 2однн, 2одун, 2<Тднб ошибок оценивания высоты и вертикальной скорости инерциальной системы и ошибок оценивания погрешности баровысотомера, которые рассчитываются по диагональным элементам ковариационной матрицы Г|. На рис. 6.5 — 6.7 принята следующая нумерация кривых: номер I соответствует гипотезе Я2),о,-2>,о, определяемой индексами р = 20, v = 0, А, = —20, t, = 0; номер II соответствует гипотезе Я1в,0_2),о, определяемой индексами р = 19, v = 0, А, = 20, j = 0; номер III соответствует гипотезе определяемой индексами р = —20, v = —1, А. = 20, £ = 1. Первый поиск экстремума функционала и первое определение координат горизонтального местоположения производились на 80 секунде, когда уже было получено Nq = 21 измерение датчика поля (интервал между измерениями выбирался равным Т = 4 с, скорость движения задавалась V = = 0,25 км-с-1). В диапазоне 80с ^tClOOc минимум функционалу доставлялся гипотезой Ягв.о-го.о- При этом ошибки оценивания горизонтального местоположения не превышали 0,25 км, т. е. не превосходили дискретности записи поля I (сравните значения ошибок Дх, Ду и их оценок
Рис. 6.5. Графики ошибок оценивания вертикального положения для верной и неверных гипотез о горизонтальном местоположении. Рис. 6.6. Графики ошибок оценивания вертикальной скорости для верной и неверных гипотез о горизонтальном местоположении»
Рис. 6.7. Графики ошибок оценивания погрешности баровысотомера для верной и неверных гипотез о горизонтальном местоположении. Рис. 6.8. Графики ошибок оценивания горизонтального местоположения.
Дх, Д£, рассчитываемые по формулам (6.25) и (6.13) соответственно). В диапазоне 100с •< f 200с функционал /iivxti минимизируется гипотезой £19,0-20,0, точность оценивания горизонтальных координат также не хуже 0,25 км. Несмотря на большие начальные ошибки вертикального и горизонтальных каналов ИС, достигается высокая точность оценивания параметров вертикального движения (рис. 6.5—6.7). Кривые с номером/// соответствуют фильтру Калмана, синтезированному для гипотезы £-20,-1,20,1, на которой значение функционала /pvAg далеко от минимума, т. е. для варианта, когда предполагаемые координаты горизонтального местоположения сильно отличаются от действительных. Видно, что и оценки вертикальных параметров в этом случае оказались явно неудовлетворительными. Можно показать, что при х = 0 рекуррентно-поисковое оценивание вырождается в независимое оценивание вертикальных и горизонтальных координат движущегося объекта: вертикальные параметры определяются путем калмановской фильтрации, а координаты горизонтального местоположения оцениваются чисто поисковым алгоритмом. § 6.2. О возможности сокращения традиционного состава датчиков при использовании рекуррентно-поискового оценивания [6.4] Для определения вертикальных координат движущихся объектов обычно используется вертикальный канал ИС. Однако в силу его неустойчивости необходимо принятие специальных мер, например, коррекция по показаниям датчиков абсолютной высоты или вертикальной скорости движения. Применение РПО открывает новый подход к решепию задачи. В частности, оказывается возможным исключить из минимально необходимого состава подсистем некоторые традиционные подсистемы. Например, при использовании поля рельефа возможна выставка вертикального канала ИС только по показаниям радиовысотомера без использования барометрического высотомера. Рассмотрению и обоснованию такой возможности и посвящен настоящий параграф.
Известно, что при полете над морем выставка вертикального канала ИС осуществляется по данным радиовысотомера, что и понятно, так как в этом случае радиовысотомер становится измерителем абсолютной высоты полета. Однако при полете над сушей с ярко выраженным рельефом такая возможность в традиционном варианте исключается, так как радиовысотомер как измеритель абсолютной высоты в этих условиях оказывается весьма неточным, поскольку рельеф пролетаемой местности играет роль помехи. Если же на борту ЛА иметь карту рельефа и точно знать горизонтальные проекции траектории движения, то, извлекая из блока памяти рельеф Яр (t) вдоль траектории движения и суммируя его с измерениями относительной высоты, выдаваемыми радиовысотомером, можно было бы получить точные измерения абсолютной высоты и свести, таким образом, задачу фильтрации вертикальных параметров движения к ситуации полета над морем. На первый взгляд может показаться, что образовался порочный круг в рассуждениях: с одной стороны, чтобы с помощью КЭНС хорошо оценить горизонтальные координаты х, у, надо измерять рельеф местности, для чего необходимо точное зна- Рис. 6.9. Обмен информацией между подсистемами навигационного комплекса. ние вертикального положения Н центра масс ЛА; с другой стороны, чтобы точно оценить абсолютную высоту полета, надо знать проекции траектории движения на горизонтальную плоскость. Более Подробное исследование вопроса показывает, что никакого порочного круга в рассуждениях нет и совершенно строгое решение этой задачи достигается использованием идеи рекуррент-ногпоискового оценивания. I Рассмотрим навигационный комплекс (рис. 6.9), в состав которого входят все три канала ИС, измеряющие координаты пространственного х, у, Н и углового О, у, ф положения ЛА, радиовысотомер и БЦВМ с записанной
и ее памяти картой рельефа Hv (х, у). Совместная обработка перечисленной входной информации производится с целью определения ошибок ИС в измерении координат (Лх, Ду, ДЯ) и скоростей (ДУХ, ДУу, ДУн) движения. Барометрические измерители в состав рассматриваемого навигационного комплекса не входят.} Сначала проведем формальный синтез алгоритма оценивания. Уравнения движения согласно § 6.1 имеют вид Д//и!+1 = ДЯи4 + T&VHi + -- ДХ1 + T&Y х(, Д.'/i+l — Д?/г + T&Vvi, ДУ Ж+1 = ДУ Hi + ?2it ДУ xi+1 ~ ДУ xii ДУ t/i+i ~ ДУ i/Ь (6.26) адесь 5^ определяются равенствами (6.10). Если ввести обозначения Xt = (ЛНщ, ДУяОт, Yt = (Дх,, ДУХ,, Ду|, ДУ„,)Т, fci = (5н, B2i)T, то соотношения (6.26) приведутся к каноническому виду (2.99), (2.100): + 5i, (6.27) YM = Ф(У(, (6.28) причем в рассматриваемом варианте 17 0 0 а параметры т, G начального распределения вектора Хо и ковариационная матрица Q шума равны 0 0 0 1 Наблюдение в данном случае является скалярным Zi = = (zu), оно образуется согласно § 6.1 как разность между измерениями вертикального канала ИС и радиовысотомера Zi = Я* — О* cos fl1* cos у* и может быть представлено в соответствии с (6.15), (6.18) в
форме Zf = HXt + Ft(Yt) + (6.30) если положить Н = II1, о II, (6.31) Ft(Yi) = = //„ [х* (tt) + D* (ti) cos е* (ti) — Дхь p* (tt) + + D* (ti) cos 6* (ti) — AyJ. (6.32) Дисперсия шума наблюдения равна Hi = || || = cos20* (tj) cos2y* (ti)a\ Равенства (6.27), (6.28), (6.30) являются исходной математической постановкой частного случая III рекуррентнопоискового оценивания (см. § 2.3). Чтобы воспользоваться алгоритмом оценивания (2.107) — (2.110), необходимо ввести в рассмотрение гипотезы о возможном значении вектора Yy и фундаментальную матрицу решений уравнения свободного движения (6.28). Как и в §6.1, гипотеза означает, что Yy = (р/, vv, KI, £р)г. Фундаментальная матрица решений W (I, q) задается прежним соотношением (6.14). Определим априорные вероятности гипотез Рцух?- Их можно вычислить по известному начальному распределению вектора Уо, которое предполагаем нормальным с математическим ожиданием ту и ковариационной матрицей Gy. Поскольку в соответствии с (2.102) Yy = W (N, 0) Уо, то распределение вектора У;\ также нормальное и плотность этого распределения р (Yy) выражается формулой P(YN) = = exp ~^г [Fw - W (TV, 0) rnyHW' (АГ, 0) GYWr (N, 0)p у X [Vjv - W (N, 0) mr]}/2n’ Vdet[PF(TV, 0)GyWrT(TV, 0)]. (6.33) Вероятность гипотезы определим как вероятность
нахождения вектора Yв следующих пределах: (н — 4")1 < (н + 4~)1' (b-^l<byN<^+±-}l, (v _-1.)у<ДУхЛГ<(т +4“) р’ (£-4><д^<(г|-4-) v, т. е. (“+4-Р (^v)‘ .("+!)’ = J d&xN j d&yN j dbVxN X (—г)' (*-vP ('-rP (W-l-p X J p(YN)dbVvN. (6.34) -H V В процессе интегрирования соотношения (6.34) при подстановке вектора Kn в формулу (6.33) необходимо задавать Yn в виде Yn = (&xN, ДУхл, Ai/n, AVW1'. Конкретизируем вид оптимального алгоритма оценивания (2.107) — (2.110) применительно к рассматриваемому варианту. Исследуем сначала уравнения для ковариационной матрицы Гд. Поскольку At, Ht, а также начальное условие G не зависят от гипотез, то и решения также не зависят от проверяемых гипотез Поэтому уравнения для Г, имеют вид 1ж = ^i+1 = Q~l - e-un^Q-1, п;1 = ГГ1 + A'Q-'A, i = о, 1,..., N, г;1 = G-1 + H'R^H. Скалярные уравнения дискретного фильтра Калмана, оценивающего параметры вертикального движения в предположении, что на участке наблюдения выполняется
(6.35) (6.36) гипотеза PMVxc, согласно (2.107), (6.31), (6.32) таковы: = Д^щпКЦ + 4* Др= ДРНЦ\->Х4 4” ^V<+1 *н<+1 = Tni+1o~ cos’20*(/i+1)cos-2 Y*(/i+i), fcvi+i == Vi2i+1o~ cos-2 0* (fi+1) cos-2 v* (ti+i), причем невязка наблюдений, соответствующая гипотезе Ppvxt> определяется соотношением ^vAtj+1 = Н* (A+i) — D* Oi+i) cos О* (ti+1) cos у* (Zi+1) — Д^npvXtj TДУhhvAXj — Hp {X* (Zi+i) + D* (i<4-i) X X cos e* (ti+1) — [р/ - (ZV — i — 1) Tvv], y* (Zi+1) + + P* (ii+i)cos6*(/i+1) - (X/ - (N - i - 1) Tty]}, (6.37) так как вектор W (i 4- 1, N) YiN = W (i 4- 1, N) РИтьс, входящий в уравнение невязки наблюдений (см. формулу (2.107)), равен (pZ — (N — i — 1) Tvv, vv, M. — (N — - i - 1) Tty, £i>)T. Предположим для упрощения (хотя это необязательное допущение) малость углов крена и тангажа О* ж у* я? 0, тогда с учетом (6.19) cos е* л cosS* я; 0. Введя обозначения ДЯицг^^ = Д^ицтХ5; 4~ ^Д^ндуХСр (6.38) “ ЯИ Pi4-1) — Д#иц*хс1+1» (6.39) ^vxti+. = х* (/i+i) — pZ + (N — i — 1) Tvv, ] } (6.40) 2/pvxti+1 = y* (Zi+1) — XZ + (W — i — 1) T^v, j = ?/nvxji+1)> (6.41) перепишем (6.37) следующим образом: Др*>£4+1 = S'nvfctj-I-J — Р* (Z»+1) — Нp|ivX£j+1> (6.42) здесь — экстраполированные на мо- мент времени tt+i (на основе наблюдений Я*> Р*, проведенных в предыдущие моменты времени to, tt, . . ., tt) оценки ошибки вертикального канала ДЯ„ и высоты полета Я; — горизонтальные проекции тра-
ектории движения, построенные в соответствии с гипотезой по измерениям] х* (io), У* (io), . . ., х* (t?v), у* (In); Нр (хр^щ, j/pvx^) — рельеф местности, соответствующий траектории Xgvxt., У^Щ- Остановимся теперь на уравнении функционалов (2.109). Так как Пд не зависит от проверяемой гипотезы, то в (2.109) слагаемое In | II;i | можно опустить и записать Aivxti+j ~ Aivxi; Н °—(1 — Tni_|_1<T~) (6.43) поскольку матрица S,-i+1 превращается в данном случае в скаляр, равный о~2 (1 — Tni+1 <г?). Уравнение (6.43) решается при начальном условии ~ (1 — Уп.ст~) — 2 In Р|lv^. (6.44) Полное значение минимизируемого функционала можно найти, просуммировав (6.43) по i от 0 до /V — 1 п учтя (6.44). В результате такого суммирования получим N И — YiijCT~) Ajivxtj — 2 In Р(6.45) , На рис. 6.10 изображена развернутая структурная схема блока оценивания горизонтальных и вертикальных координат, составленная по уравнениям (6.35) — (6.43); на ней элемент | т | обозначает блок единичного запаздывания (сдвига) на время х = ti+1 — tt = Т. Входной информацией блока оценивания служат измерения х*, у*, Н*, О*, у*, ф*, D* подсистем навигационного комплекса (ИС и радиовысотомера). . Выходными сигналами являются оценки ошибок ИС.) Рис. 6.11 поясняет сущность процесса оценивания. Tlo измерениям ж* (if), у* (it) (а в случае, когда О* =/= 0, у* 0 — и на основе измерения углового положения <►*, У*, ф*) определяется проекция траектории на горизонтальную плоскость (если О'* 0, у* 0, то опреде- ляется траектория следа оси диаграммы направленности радиовысотомера на горизонтальной плоскости). Вокруг точки х* (t.\), у* (t.\), как и в поисковых методах оценивания, строится доверительный квадрат возможного местоположения ЛА в момент времени ijv. Для каждой из проверяемых гипотез Dp'M* по траектории х* (ti), у* (if) и по
Рис. 6.10. Структурная схема блока оценивания горизонтальных и вертикальных координат, составленная по уравнениям (6.35) —(6.43). 342 РЕКУРРЕНТНО-ПОИСКОВЫЕ АЛГОРИТМЫ ОЦЕНИВАНИЯ [ГЛ. VI
предполагаемым этой гипотезой ошибкам ИС строится в соответствии с равенствами (6.40) гипотетическая траектория Xputp Уулщ- Из блока памяти БЦВМ извлекается сечение рельефа вдоль траектории Pnvxtp определяемое уравнением (6.41). Путем суммирования сечения Н1Ц1хщ с измеренными значениями относительной дальности D* Цг) синтезируется гипотетическая высота полета которую можно трактовать Рис. 6.11. Иллюстрация рекуррентно-поискового оценивания. как измеренную с помощью радиовысотомера абсолютную высоту движения при условии, что выполняется гипотеза Оцхц. Фильтрацией ошибок вертикального канала ИС фильтром Калмана, соответствующим гипотезе (этот фильтр также испольаует реализацию оцениваются значения ДЯИцгНр а затем по формулам (6.38), (6.39) рассчитываются величины &Нп11хщ и Я(пгщ. Сопоставление отфильтрованной и синтезированной высот полета и соответствующих гипотезе производится путем рекуррентного вы-
числения функционала по формуле (6.43). Значение функционала /цтЧдг как это следует из (6.45), представляет собой квадратичную форму от невязок = = “ всех проведенных наблюдений, при- чем учитываются и априорные вероятности гипотез. Если гипотеза предполагает значения ошибок горизонтальных каналов ИС существенно отличающимися от реальных, то траектория соответствующий ей рельеф Нррлщ и синтезированная высота полета также сильно отличаются от действительных. Поэтому значение функционала, соответствующего такой гипотезе, велико. А для гипотезы, предполагающей истинные (или весьма близкие к ним) значения ошибок Дху, Лук, отфильтрованная и синтезированная высоты полета почти совпадают (с точностью до шумов радиовысотомера). Поэтому величина функционала, соответствующего истинной гипотезе, мала. На этой основе после проведения минимизации функционала п0 всем возможным гипотезам Рцу-хс выбирается гипотеза, дающая весьма точную оценку горизонтальных координат. Вертикальные координаты ЛА также фильтруются фильтром Калмана, соответствующим истинной гипотезе, с высокой точностью, так как в этом случае синтезированная высота полета Нцхщ с точностью до шумов радиовысотомера совпадает с действительной^ На рис. 6.12—6.14 представлены результаты моделирования алгоритма (6.35) — 6.44) *). Задавались следующие значения элементов матриц G, Q, R и начальных ошибок навигационного комплекса: Они, = 1,5 км, <Tvin = 5 м/с, он- = 0, оуя~ ~ 0, = 10 м, АЯ|П = 2 км, ДЙ„о — 7,5 м-с-1, Дх# = —5 км, ДРхо ~ —3 м-с-1, Ду о = 5 км, ДУ „о =1,5 м-с-1. Размеры доверительных квадратов предполагались равными п — 24, т = 0; общее число проверяемых гипотез составляло q — = (2т 4- I)2 X (2п + I)2 = 2401. На рис. 6.12—6.14 принята такая же нумерация гипотез, как ив § 6.1. Первый поиск экстремума функционала 7(lvxt,y и первое оценивание координат производились на 60 секунде, когда уже ♦) Моделирование проведено А. С. Ермиловым.
было набрано Л' = 16 измерений датчика поля и инерциальной системы. Фильтры Калмана работали с дискрет- Рис. 6.13. Графики ошибок оценивания вертикальной скорости. через каждые 4с. В диапазоне 60с t < 124с функционал минимизировался гипотезой Z)-2i>,n, 2>,о, а в диапазоне 124с < 200с минимум функционалу Ai'Xn доставлялся гипотезой D_2I,0,2>,0. Ошибки оценивания
горизонтальных координат не превышали 320 м. Кривые 'с номером III соответствуют гипотезе Z?2>,o,-2j,o, предполагающей существенно неверные значения координат горизонтального местоположения. Из рис. 6.12, 6.13 вид-но> что и оценки вертикальных параметрокв этом случае оказались явно неудовлетворительными.) Моделирование Рис. 6.14. Графики ошибок оценивания горизонтальных координат. показало эффективность коррекции вертикального канала ИС по показаниям радиовысотомера при наличии карты поля рельефа на борту ЛА с помощью рассмотренного рекуррентно-поискового алгоритма. Несмотря на большие начальные ошибки навигационной системы была достигнута высокая точность оценивания пространственного положения движущегося объекта. I § 6.3. Рекуррентно-поисковое оценивание ошибок инерциальной системы в режиме полета на малой высоте и облета препятствий [Наряду с очевидными преимуществами полет на малой высоте имеет ряд недостатков, сводящихся к существенному сокращению дальности полета и усложнению навигации. Низковысотный полет накладывает также тяжелые условия на работу летчика и таит в себе большую опасность столк
новения с Землей. Такой полет характеризуется непрерывным изменением действующих на ЛА вертикальных перегрузок. Величина этих перегрузок должна быть ограничена как соображениями прочности, так и возможностью длительного пилотирования ЛА летчиком без заметного ухудшения его работоспособности, j Все вышеизложенное показывает важность создания оптимальных систем маловысотного полета. Выбор критерия оптимальности, учитывающего все существенные стороны рассматриваемой проблемы, сам по себе является сложной задачей. Часто наилучшей траекторией полета считают такую, которая наиболее близко лежит к земной поверхности и движение по которой удовлетворяет всем физическим и тактическим ограничениям, наложенным на ЛА. Общий критерий близости траектории полета к линии, описывающей сечение рельефа, может быть выражен математически с использованием переменной, отображающей превышение текущего расстояния до земной поверхности над заданным минимальным значением ДЯт|П: = ае2 -г be^ ds + •ч0 с max е, fs0, SfJ (6.46) здесь е = Н — Нр — ДЯШ1п, s — длина проекции траектории на горизонтальную плоскость, ls0, s*] — интервал значений s, рассматриваемых при оптимизации, а, Ь, с — коэффициенты квадратичного, линейного и максимального членов в функционале (6.46). | Из (6.46) как частные случаи получаются квадратичный, линейный или минимаксный критерий оценки качества маловысотного полета. Критерий качества должен минимизироваться с учетом естественных ограничений, накладываемых на движение ЛА; таких, как ограниченность располагаемой перегрузки, существование недопустимых' критических режимов полета, положительность рассогласования е. Задача оптимального управления состоит в отыскании такого заданного значения вертикальной перегрузки, которое обращает в минимум функционал качества. В силу известной теоремы разделения (см. § 1.1) формирование оптимального управления в качестве необходимого предварительного условия содержит требование
оптимального оценивания вектора состояния, в который входят и горизонтальные, и вертикальные координаты ЛА. Из структуры функционала качества (6.46) вытекает также, что оптимальное текущее управляющее воздействие должно зависеть от рельефа впереди лежащей местности и предполагает его знание на борту ЛА. Источником информации о рельефе местности, над которым будет пролетать ЛА, может служить карта местности, хранящаяся Рис. 6.15. Структурная схема системы управления: 1 — блок выбора опорной траектории; 2 — система управления маловысотным полетом; 3 — ЛА как объект управления; 4 — датчики пилотажно-навигационного комплекса; 5 — пилотажно-навигационный комплекс; 6 — радиолокатор переднего обзора; 7 — карты и планы местности по маршруту полета. в запоминающем устройстве БЦВМ [6.5, 6.6], пли данные, поступающие от радиолокатора переднего обзора [6.7—6.9]. Структурная схема полной системы -управления продольным движением ЛА на пре дельно малых высотах над пересеченной местностью приведена на рис. 6.15. При современном уровне развития БЦВМ достаточно легко организовать получение и обработку данных о рельефе местности в реальном масштабе времени. На основе этих данных с необходимой частотой вычисляются отрезки оптимальной^ опорной траектории. По информации об опорной траектории и фактической траектории полета вырабатывается сигнал ошибки, являющийся управляющим. Система управле- ния маловысотным полетом стремится свести этот сигнал к нулю. Аналогичный подход может быть с успехом применен и для построения системы управления боковым движением ЛА для обхода препятствий. Одним из основных датчиков информации в системе маловысотного полета является радиолокационная стан-циаЛРЛС) переднего обзора. /Специфика маловысотного полета предъявляет к радиолокатору переднего обзора противоречивые требования. С одной стороны, для расчета оптимальной опорной траектории желательно сканирование по углу места и изме
рение реализации впереди лежащего рельефа. С другой стороны, для обеспечения высокой безопасности полета целесообразно слежение за ближайшей вершиной или препятствием в процессе их облета. При наличии на борту карты рельефа появляется возможность возложить на РЛС главным образом задачу облета препятствий и обеспечения безопасности полета, а опорную траекторию формировать по информации содержащейся в бортовой карте рельефа местности. Это тем более целесообразно, что определение впереди лежащего рельефа путем сканирования РЛС не может быть полным из-за наличия значительных областей радиотеней- I Перейдем к математической постановке задачи рекуррентно-поискового оценивания координат ЛА в режиме полета на малой высоте. Будем считать, что совместной обработке подвергаются измерения ИС, барометрического высотомера, радиовысотомера и радиолокатора переднего обзора. Для простоты рассмотрим лишь один из горизонтальных каналов ИС — канал ортодромической долготы. Уравнения ошибок вертикального и горизонтального каналов ИС в соответствии с предыдущим таковы: Д//иШ = ДЯщ+ТДУ*-]-^, 1 ДУнт = ДУИ1J ( ° Дх(+1 = Да?! + ГД7Ж„ ДРх|+1 = ДУЯ|. (6.48) Запишем уравнения датчиков информации: барометрического высотомера Н* = Н + ДЯВ - 6ЯВ, радиовысотомера (рис. 6.16) ф _ Н - //р (х + DB sin О) ” ~~ cos О РЛС переднего обзора п* Я--Нр(ж + Ллсов<р) //_ - здесь Яр (х) — рельеф местности, смысл величин 6, <р, DB, Da поясняет рис. 6.16, D*, D* — измеренные значения величин D„, Dn, а 6РВ,‘ 6ЯЛ — флуктуационные ошибки этих измерений, Я* — измерение барометриче-
ческого высотомера, ДЯв и 6Яв — постоянная и шумовая составляющие ошибки баровысотомера, т. е. ДЯ1и+1 = ДЯш. (6.49) С точки зрения оценивания параметров движения необходимо различать два варианта: — режим, работы РЛС, когда мы располагаем измерениями радиолокатора; в этом режиме гр* (t) является известной (измеряемой на ЛА)1функцией времени; — режим выключенной^РЛС. Рис. 6.16. Обозначения углов и дальностей. При использовании рекуррентно-поискового оценивания под наблюдениями будем понимать разности между показаниями вертикального канала ИС и измерениями баровысотомера, радиовысотомера и РЛС: Zj = Н* — Н*>, z2 = Ни — Яв cos ft*, z3=Hu — D*4 sin ср*, гда ft* и <р* — измеренные на борту ЛА значения углов О и <р. Переходя к дискретному времени, с учетом уравнений датчиков информации и в предположении малости D:i — — D*, Db—Db, ft — ft*, <р — <р* можно записать 2ц = ДЯИ; — ДЯ Bi + nxi’ Zji = ДЯИ{ 4- Яр [х* (ti) + D* (ti) sin ft* (ti) — Дх{] + T]2i, z3i = ДЯИ, + Яр [z* (Ц) + D* (ti) cos <p* (ti) — Ar,] -I- (6.50) здесь r]i; = dH5i, T|2/ = cos ft* (ti) SDbi, П si = sin <p* (ti) &Dni.
Соотношения (6.50) показывают, что рассматривается режим работающей РЛС. В режиме отключенной РЛС уравнения наблюдения сокращаются на последнее равенство системы (6.50). Таким образом, в режиме полета на малой высоте структура контура оценивания циклически меняется. Сигнал на изменение структуры поступает от блока управления включением и выключением РЛС. Если финн < <р* < Фшах, то РЛС включена. В противном случае РЛС отключена. Уравнения движения (6.47) — (6.49) и наблюдения (6.50) позволяют получить структуру блокаРПО. Особенностью оценивания является необходимость «склеивания» (согласования конечных и начальных условий соседних этапов) оценок и гипотез в момент изменения структуры контура оценивания. § 6.4. Рекуррентно-поисковое оценивание ошибок курсо-допплеровских систем В этом параграфе исследуется КЭНС, ядром которой является курсо-допплеровская система. Блок-схема подобного навигационного комплекса изображена на рис. 6.17. В него входят ДИСС, курсовертикаль, измеряющая Рис. 6.17. Блок-схема навигационного комплекса, основанного на курсо-допплеровском счислении координат. курс ф, крен у и 'тангаж О, барометрический и радиотехнический высотомеры, причем последний служит датчиком поля рельефа. Кроме того, на борту движущегося объекта хранится априорная информация у) о навигационном поле. Комплексная обработка информа-
ции^от всех перечисленных датчиков позволяет оценить позиционные ошибки Дх, Ду, ДЯд навигационного комплекса, а также погрешность измерения курса Дф и постоянную составляющую ошибки барометрического высотомера ДЯб- ДИСС определяет составляющие скорости движения У£, У*о У* вдоль осей связанной с движущимся объ- ектом системы координат xn ylt zt. Использование информации €►*, у*, ф* об угловом поло- Рис. 6.18. Система координат. жении связанной системы координат хй, г/д, Ид, поставляемой курсовертикалью, позволяет пересчитать V*i, У*, У* в проекции скорости V*, У«» Ун на земную систему отсчета. Кроме того, можно рассчитать путевую скорость W* и угол сноса р*. Между физическими величинами W, Р и Vx, Vy существует! взаимосвязь (рис. 6.18) Vx = W cos (ф + р), Уу = W sin (ф + р). (6.51) Введем в рассмотрение ошибки ДИСС ДУХ, ДУЮ ДРУ, ДР в измерении составляющих скорости и угла сноса ДУХ = V* - Vx, ДУ„ = У* - yv, ДРУ = РУ* - W, др = р* - р (6.52) и ошибку курсовой системы Дф = ф* — ф. (6.53) Совместное рассмотрение уравнений (6.51) — (6.53) в предположений малости ошибок ДУХ, ДУИ, ДРУ, ДР, Дф приводит к приближенным (с точностью до малых величин второго порядка) соотношениям ДУХ = ДРУ cos (Ф* -ь Р*) - (Дф + др) W* sin (ф* + р*), | ДУ„ = ДРУ sin (ф* + р*) + (Дф + ДР) РУ* cos (ф* + р*). J (6.54) (^Допплеровский измеритель является относительно точным прибором. Большинство современных ДИСС измеряет путевую скорость с точностью до десятых долей
процента, а угол сноса — с точностью до нескольких угловых минут [6.10, 6.11]. Поэтому доминирующей в равенствах (6.54) является ошибка курсовой системы. ;На этой основе возможно упрощение модели ДИСС. Полагая AW 0, Др Д1р, получим AVX ~ —ДфИ7* sin (ip* -[- р*), 1 ДУ„ да Дг|4У* cos (ip* + р*). J (6,55) Позиционные ошибки курсо-допплеровской системы связаны со скоростными обычными интегральными равенствами Дх (0 = Дх (0) + J AVX (т) dr, (6.56) О t Ду (0 = Ду (0) + J Д7„ (г) dr, (6.57) О i АНЛ (0 = ДЯд0 + J Д7Н (г) dr. о Современные курсовертикали в основе своей содержат инерциальные определения (или, точнее говоря, хранение) курса. Поэтому ошибка Дяр весьма низкочастотная. На тех небольших интервалах оценивания, которые используются в КЭНС, ее можно считать постоянной, полагая Д1р = 0. (6.58) Перейдем к дискретному времени tt. Интегрируя (6.56), (6.57) в пределах от t , до ij+1 с учетом равенств (6.55), (6.58) находим 4+1 Дх (/i+1) = Дх (ti) — Дф (ti) J VF* (т) sin [ф* (г) + 0* (т)] dr, Ч (6.59) (h+i) Ay (ti) + (Ц) f W* (т) cos [ip* (r) + P* (t)] dr. 4 (6.60) 12 А. А. Красовский
В дискретной форме уравнение (6.58) перепишется так: Дф (*i+i) = Дф (ti)- (6.61) Обозначая Дхг = Дх (if), &yt = Ду (tt), Дф,- = Дф (i»), Yt = (Дх,, Ду», ДфОт, запишем равенства (6.59)—(6.61) в матричном обозначении У4+1 = Ф,У(. (6.62) Матрица Ф4 нестационарна и в силу уравнений (6.59) — (6.62) имеет вид I1 ° °ч Ф{ = I 0 1 a23j | > |о 0 1 I где а1з4 = — W* (т) sin [ф* (т) + 0* (т)1 dt. Ч+i «234= J И7* (т) cos [ф* (т) 4- p*(T)]dt. ‘i Уравнения остальных датчиков информации (барометрического и радиотехнического высотомеров) примем в прежнем виде (6.8), (6.6): Я£ = Я + ДЯЁ - 6Я’Б, (6.63) Н — Нр (х + D сое е, у + D cos б) D cos О cos у Измерения zn z2, которые будут использоваться в РПО, образуем следующим образом. Сначала путем интегрирования вертикальной составляющей скорости, вычисляемой на основании показаний ДИСС и курсовертикали, ГТ* рассчитывается допплеровская высота полета лд: t я; = Я? + J Ун (Г) dT, о что при переходе к ошибкам измерения дает следующую - 6ОВ. (6.64)
модель: #£(0 = #(0 + ДЯд(0. t М1Я (t) = ДЯя (0) + j ДУн (Г) dr, о или в дискретной форме Д^д<-|-1 = А^д» + 'i+i 6н= J ДУн(т)сГт. Ч (6.65) Погрешность измерения вертикальной скорости ДУд(0 определяется ошибками ДИСС, а также ошибками определения вертикали курсовертикалыо. При рассмотрении горизонтальных каналов этим мы пренебрегали по сравнению с неточностью курсовой системы. Однако при составлении модели вертикального канала ввиду тех особых требований, которые предъявляются к нему в КЭНС, использующих поле рельефа, целесообразно сохранить возмущение Измерения zlh z2i формируются как разности допплеровской высоты и показаний барометрического и радиотехнического высотомеров «и = Н* (ti) — D* (ti) cos Ф* (ti) cos у* (ti), Zu = H* (ti) - Hl (ti). В предположении малости ошибок измерения вертикали и с учетом равенств (6.63), (6.64) получим следующую модель канала наблюдения: «I/ = + 4-Яр(х* (ti) + D* (ti) cose* (tt) — Дхь у* (i,) + + D* (ti) cos 6* (tt) — Ду4] + cos 6* (ti) cos y* (tt) bD„, (6.66) z2l = \НЯ1 — &Ны + 6Явь (6.67) В этих соотношениях углы е* и 6* определяются уравнениями, приведенными в § 6.1. При осуществлении РПО они рассчитываются по показаниям курсовертикали и
затем используются в алгоритме оценивания. Обозначая X, = (&HRi, bH3i)', It = (glf, or, Zt = (zu, z2i)T, = (nib n2i)T, Пн = cos O* (tf) cos Y* (ti) 6DB, t)2j = 6ЯБ| и воспользовавшись условием постоянства ошибки &H3i: Нб1+1 = #вь (6.68) в соответствии с (6.65) — (6.68) получим Х(+1 = AXt + (6.69) Zt =HtXt + Fl(Yi) + r]i, (6.70) где н: :i- Нр Iх (£<) + D* (#i)'cos е* (ti) — Дт{, у* (k) + D* (Ц) cos 6* (Ц) — Ду{] О Уравнения (6.69), (6.62), (6.70) представляют собой исходную постановку задачи третьего частного случая РПО, рассмотренного в § 2.3. Формульная схема оптимального алгоритма оценивания может быть получена на основании использования результатов этого параграфа. Проверяемыми гипотезами являются возможные значения ошибок определения горизонтального местоположения Дх, Ду и курсовая погрешность Дф. С помощью калмановской фильтрации оцениваются погрешности допплеровского измерения высоты и постоянная составляющая ошибки баровысотомера. Особенностью РПО в курсо-допплеровской системе является то, что в число оцениваемых параметров не вошли скоростные ошибки ДИСС.
ГЛАВА VII СИНТЕЗ КОНТУРОВ И ВЫБОР ОПТИМАЛЬНЫХ РЕЖИМОВ КОРРЕКЦИИ КОРРЕЛЯЦИОН Н О-ЭКСТРЕМ АЛЬНЫХ ИНЕРЦИАЛЬНЫХ СИСТЕМ § 7.1. Синтез контура коррекции корреляционно-экстремальной инерциальной системы при беспоисковом оценивании вектора состояния В предыдущих трех главах исследовались различные возможные подходы к задаче оценивания ошибок навигационных систем по наблюдениям геофизических полей. В настоящей главе рассматривается вопрос о том, как использовать результаты оценивания. Возможны по крайней мере два варианта. Первый из них предполагает непосредственное использование результатов оценивания для целей управления и не касается вопроса внутренней коррекции навигационных систем. В этом случае решение задачи оценивания полностью исчерпывает проблему оптимального использования информации о геофизических полях для целей навигации. Существует и другое, альтернативное, решение (исследованию которого и посвящена эта глава), предусматривающее использование результатов оценивания для образования сигналов коррекции и замыкания, таким образом, цепи обратной связи [7.1]. Подобный подход.может оказаться актуальным, например, применительно к ИС длительного действия, поскольку качество оценивания на больших интервалах ухудшается из-за неточности априорной информации. В этих условиях может оказаться целесообразным использование относительно коротких ин-ервалов оценивания для выделения сигналов рассогласо-
вания и коррекция ИС по принципу обратной связи, что позволяет осуществить полную выставку ИС. Широко распространенной является так называемая трехточечная схема коррекции (рис. 7.1), когда сигнал обратной связи поступает на входы первого и второго интеграторов, а также на коррекционные моторы ИС Инерциальная система. Цепи коррекции Рис. 7.1. Трехточечная схема коррекции инерциальной системы. [7.2], причем для придания ИС астатизма по отношению к постоянной составляющей дрейфа гироплатформы на коррекционные моторы подается как сигнал, пропорциональный позиционной ошибке, так и интеграл от этой ошибки. Вид оптимального алгоритма коррекции зависит от величины начальных ошибок ИС. Если эти ошибки превосходят радиус корреляции используемого навигационного поля, то оптимальный алгоритм коррекции основывается на нелинейном поисковом или рекуррентно-поисковом оценивании. В настоящем параграфе рассматривается случай небольших начальных ошибок ИС и оптимальный алгоритм коррекции [7.3] выводится на базе использования теоремы разделения, обсуждавшейся в § 1.1 и предполагающей предварительное осуществление калмановской фильтрации. Для упрощения изложения анализируется лишь случай горизонтального маршрутного полета, что избавляет нас от необходимости
совместного рассмотрения вертикального и горизонтальных каналов ИС. Рассмотрим один канал ИС. Уравнения (3.140) ошибок ИС в случае, когда удаление движущегося объекта от поверхности Земли пренебрежимо мало по сравнению с радиусом Земли Л, имеют вид Дх = ДУ 4- Hi, ДУ = ga 4- dj 4- «2. а = — -|- + шдр 4- и3 4- и, (7.1) где Дх, ДУ — ошибки измерения местоположения и скорости движения, а — угол отклонения платформы от местной вертикали, g — ускорение силы тяжести, й)др — угловая скорость ухода гироплатформы, бу — ошибки намерения ускорения, v — интегральный член коррекции v м4, (7.2) w2, us, — позиционные корректирующие члены. Задача синтеза состоит в формировании сигналов коррекции . . ., п4. При решении этой задачи будем считать скорость дрейфа постоянной “др = 0, (7.3) а ошибками измерения ускорения б/ в первом приближении пренебрежем, что, существенно упрощая задачу синтеза, приводит лишь к незначительному отличию синтезированной системы от оптимальной. Введем в рассмотрение вектор состояния X = (Дх, ДУ, а, Одр, v)T и вектор управления U = (ult и2, и3, п4)т. Тогда уравнения движения и наблюдения можно записать п матричной форме X 4- аХ = bv, (7.4) z = h (X, t) 4- dh. Матрицы а и 6 определяются уравнениями (7.1) — (7.3): 0—1 000 0 0 —g 0 0 |1 0 0 0 1 0 10 0 a = 0 -Б- 0-1-1 ft or II 0 0 10 0 0 0 0 0 о о о о 0 0 0 0 0 |0 0 0 1
а матрица наблюдения равна h {X, t) = h [х* (t) + Дх], здесь х* (t) — значение координаты местоположения, измеренное ИС, h — используемое навигационное поле, 6Л. — ошибка измерения поля. Проведем синтез контура коррекции ИС по квадратичному критерию обобщенной работы 11.1], при котором минимизируется следующий функционал Г. т I = м [4-Х’(Т’)рХ(Т’) +-LJxt(W(0^ + О т т + (ит (/) K~\i (0 dt + 4- J -X* (О Л’ (О ЬКЬ^А (0 X (0 , () О (7.5) где М — знак математического ожидания, р = || ри ||, 0 = || 0О || — заданные симметричные положительно определенные матрицы, К — диагональная матрица заданных коэффициентов, Т — фиксированный момент времени, а матрица А определяется дифференциальным уравнением (1.14): А — Аа - а’Л = — 0, (7.6) при граничном условии А (Т) = р. Согласно теореме разделения, справедливой и при оптимизации по критерию обобщенной работы (см. главу I), оптимальная система состоит из блока оптимального оценивания вектора состояния и оптимального регулятора, причем оптимальное управление имеет вид Мопт = _ КЪ? АХ, (7.7) где X — оптимальная оценка вектора состояния. Далее исследуем важный частный случай, когда наблюдение h (X) производится на конечном интервале времени (О, Т) и требуется обеспечить наибольшую точность определения координаты местоположения к концу интервала наблюдения. Поэтому в функционале (7.5) положим 0 = 0, pu = 1, остальные р(; = 0. Решение уравнения (7.6) можно выразить через фундаментальную матрицу решений w (t, t') уравнения объекта (7.4).
w (t, t') — это решение однородного уравнения w (Z, t') 4- aw (t, t') = О, удовлетворяющее условию w (t’, ?') = Е, где Е — единичная матрица. В рассматриваемом случае A (i) связано с w (t, t') зависимостью j А (0 = wT (Т, t) pw(T, t), (7.8) причем элементы фундаментальной матрицы решений равны wn = w4i = w6S =1, w12 = g-1w2S = —gQ-zwS2 = — w3i = w3b = S2-1 sin Q (t — t'), irJ3 = w2i = w26 = gQ“2 [1 — cos Q (t — t')], w14 — wn = g&~2 It — t’ — Й-1 sin Q (t — £')], ^21 ~ ^31 ~ ^41 ~ ^42 ~ ^43 = ^45 = ^61 = WS2 = = wi3 = w6i = 0, W22 = W33 = cos & (t — t'), □ (7.9) Q = Уg/R = 1,24> 10-s с-1 — шулеровская частота. На основании (7.7) и (7.8) u((0 = — ktwlt (T,t)e (0, i = 1, . . ., 4, здесь klf . . kt — элементы матрицы К, e (0 = wu (T, 0 Д2 (0 + wn (T, 0 дГ-Ь ... ... +ш18 (T, 0 v (0. (7.10) Из равенств (7.9) — (7.10) вытекает, что при приближении к терминальной точке t = Т в суммарном сигнале коррекции в (0 остается только позиционный сигнал Ах (0, а из цепей коррекции сохраняется лишь цепь позиционной коррекции (обратная связь на вход первого интегратора ИС). Это прямое следствие выбранного критерия оптимизации и вида матрицы р. Будем предполагать, что оптимальное оценивание’про-изводится нелинейным фильтром Калмана [1.13]. Уравнения этого фильтра в рассматриваемом случае имеют вид Ц X -f- аХ = Ъи 4- С [z — h (X, 0], (0) = т0, С = R (dh/dXyS;1,
Л + а Л + Ла* + Л (dh/dXy S? (dh/dX) Л == О, Л (0) = Л„, □ (7.11) где (dh/dX)T — вектор частных производных, рассчитываемый в оцененных значениях координат, Sz — спектральная плотность шума 8h, предполагаемого «белым», Л — ковариационная матрица ошибок оценивания вектора X, т0 и Л о — начальные значения математического ожидания и ковариационной матрицы ошибок оценивания. t Поскольку v = J u^dt, то и (0) = 0 и ошибка оценивания о координаты v в начальный момент времени всегда равна нулю. Поэтому при t = 0 элементы Я16, . . ., Л66 матрицы Л также равны нулю. Скалярные дифференциальные уравнения для элементов Л1&, . . ., Лъ6 записываются на основании (7.11) следующим образом: Я15 — Т?25 — ^^ЛцЛ^к 2 = 0, Я25 — ёЛ9б — - 8?ЛпЛик'9 =- 0, Лзь + Q2g ^Лц — Я45 — Я55 — Л^ЛгзЛ^як 2 = 0, Я45 - 5?ЛиЛ15к'г = 0, Льъ - = 0. (7-12) При нулевых начальных условиях решение системы уравнений (7.12) также является нулевым. Поэтому в дальнейшем будем рассматривать только верхний диагональный 4 х 4-блок Л* (Z) ковариационной матрицы Л (£) и, кроме того, перейдем к обратной матрице A* (t) = = IR* (t)]-1. Дифференциальное уравнение для A* (t) на основании (7.11) имеет вид А* - А* а* - а*ТА* = (dh/dX^S^dh/dX)*, Л* - (Я?)-1, (7-13) где a*, (dh/dX)*, Я* — соответствующие верхние блоки матриц a, (dh/dX), Ло. Матрицу Я* зададим диагональной; диагональные 2 2 2 2 « элементы о ко» <*ао» Ошо этой матрицы равны диспер- сиям начальных ошибок оценивания местоположения, скорости, вертикали и постоянной составляющей скорости
дрейфа ИС. Уравнение (7.13) похоже на уравнение (7.6) и решение А* (4) также может быть выражено через верхний диагональный 4 X 4-блок w* (t, t') фундаментальной матрицы решений w (t, 4'): Л* (4) = w*T (0, t) Л*ш* (0, 4) 4- J ш*т(4', 4) (dh/d^S;1 (dh/dX)*w* (4', t) dt'. (7.14) О В корреляционно-экстремальных системах h (х) и hx являются случайными функциями. Предполагая центрированность и эргодичность производной hx, можем записать л lim-^-(*x(?)dg = Одл, Т—*00 Т V О здесь о!л — дисперсия градиента поля h (х). Из этого соотношения вытекает приближенное равенство । (7-15) о которое выполняется тем точнее, чем больше t. Именно в возможности использования соотношения (7.15) и состоит учет специфики корреляционно-экстремальных систем в рассматриваемой задаче. Интегрируя (7.14) с учетом (7.15), найдем элементы матрицы А* (4): Ли (О- cos^z)< <3 (0 = "V (1 -cos № -sin °Х0 0~Т 4*4 (0 = Ч—Йг (- М + sin Hi) + °хО Я (J6 X \ Z /
4*2(i) = 75Fsin2 Ч----5— COS2Qt 4- °«о °Vo + 4 « + Т -57 V(2Q1 - si“2Я,). 4*3 (0 =-5“ -5- -Дг (2 sin Qi — sin 2Qt) — z <%> - T 4-Tsi” 201 +14- 7- =“ 20' -°vo °ao ° 2 4*4 (0 = -4— sin Qi (Qi — sin Qi) 4- °xo 4- -|— -fir cos Qi (1 — cos Qt)-1—^-sin2Qt 4- 6 vo aao g 4- (4sin Qi — 4Qt cos Qi — 2Qt 4- sin 2Qt), A*3 (0 = -4” “S' “ cos Qz)2 + ~T~ sin2 Qt + °XO avo 4--cos2Qt 4- 4 £r(6Qt— 8sin Qi 4- sin2Qi), 4 O^T Qs ' > Am (i) =--j—g- (Qi — sin Qi) (1 — cos Qt) — °XO ----3 Й- sin Qi (1 — cos Qt)-----1—5—5- sin 2Qt — 4o 2 £2 2 -4^-S<Q<-sinQo2. A«(i) - 4- -W (Qz - sin Q') + °xo +4-4 <l -cos a,>’+si“’ “++ °vo °«o <°o +12 + 4Q3f3 ~ 24 Sin Q< “ — 3 sin 2Qt 4- 24Qt cos Qt). □ (7.16)
Обращая матрицу А* (/), можно вычислить ковариационную матрицу В* (t). Диагональные элементы этой патрицы /?п (Г), . . Т?44 (/) равны соответственно дис- 0 Рис. 7.2. Графики точности беспоискового оценивания в корреляционно-экстремальной инерциальной системе. персиям ошибок оценивания местоположения о®, ско рости оу, вертикали о’ и постоянной составляюще дрейфа гироплатформы Ощ. Элементы первой строк

Rn (0, • • •> (0 являются коэффициентами усиления различных цепей фильтра Калмана. На рис. 7.2 в логарифмическом масштабе приведены зависимости ах, оу, оа и от безразмерного времени £lt, рассчитанные для следующих данных: ах0 = 2000 м, оу0 = 10 м-с'1, аао = 10'2, аио = 0,5 град/ч. При интегрировании уравнения (7.14) и проведении расчетов полагалось Sz = о!л, где oL — дисперсия, ат — время корреляции ошибок измерения 6h. Вариант а) соответствует сгдп/о- = 0,5-10“8 м-1, вариант б) рассчитан для адн/<т~ = 2-10“’ м"1; т задавалось равным 10 с. На рис. 7.3 приведена структура оптимальной замкнутой КЭНС. Как и следовало ожидать в соответствии с теоремой разделения, оптимальный контур коррекции ИС представляет собой последовательное соединение блока оптимального оценивания, вычисляющего ®яр, Да, ДУ, Д£, и оптимального регулятора. В оптимальном регуляторе корректирующий сигнал е образуется как взвешенная с переменными коэффициентами сумма всех оцененных погрешностей. Коэффициенты цепей обратной связи изменяются во времени и, следовательно, контур коррекции ИС нестационарен. § 7.2. Синтез контура коррекции корреляционно-экстремальной инерциальной системы при поисковом оценивании вектора состояния Рассмотрим вопросы коррекции ИС по геофизическому полю при больших начальных ошибках оценивания. Как отмечалось в пятой и шестой главах, в этом случае оптимальное оценивание координат должно осуществляться поисковыми или рекуррентно-поисковыми алгоритмами. Справедливость теоремы разделения в этих условиях не доказана, вследствие чего найти строго оптимальные управления U], u2, u3, и4 не представляется возможным. Поэтому структура контура коррекции и значения его параметров по необходимости будут субоптимальными. Но мы воспользуемся некоторыми наводящими соображениями, вытекающими из анализа линейного случая. В первой главе показано, что и при нелинейных наблюдениях для малых начальных ошибок оценивания
оптимальная система должна содержать блок оптимального оценивания. В соответствии с этой рекомендацией введем в контур коррекции операцию оптимального поискового оценивания. Исследуем вариант циклического поискового оценивания, когда оценивание вектора состояния осуществляется при поступлении каждого нового наблюдения и все время обрабатывается выборка фиксированной длины N. Для упрощения как математического анализа, так и структуры контура коррекции остановимся лишь на случае, когда ошибки ИС в измерении скорости движения невелики и блок оптимального нелинейного оценивания определяет лишь ошибку местоположения Дх с погрешностью бх, присущей поисковому оцениванию. Дисперсия о* этой погрешности может быть найдена, если воспользоваться результатами § 5.4. Так же как и в этом параграфе, предположим, что навигация осуществляется по мелкоструктурному полю. Но в отличие от § 5.4 будем считать, что используется всего одно геофизическое поле. Тогда Од определяется формулой (5.66), в которой надо положить 1 = 1. Это приводит к зависимости -А^2(2п + 1)А- $ Д (7.17) Графики этой зависимости совпадают с изображенными на рис. 5.6, если считать, что по оси абсцисс отложена величина о/<т~. Сигнал коррекции 8 будем формировать пропорциональным оценке ошибки местоположения Ахи рассмотрим стационарный контур коррекции, когда коэффициенты цепей обратной связи к2, к3, к4 выбираются неизменными во времени. Отмеченные два допущения и приводят к той субоптимальности контура коррекции, о которой упоминалось выше. Теперь задача синтеза состоит в оптимизации коэффициентов к2, кг, к3, к4. Полная структурная схема одного из каналов (для определенности будем называть этот канал продольным) корреляционно-экстремальной инерциальной системы (КЭИС) по ошибке Д = х* — х, составленная в соответ
ствии с уравнениями (7.1), функциональной схемой рис. 7.1 и сделанными выше замечаниями, показана на рис. 7.4, где учтены основные возмущающие воздействия: (Одр — дрейф гироплатформы, 6; = Дф/У — действие боковых ускорений ;’у при наличии азимутальной Рис. 7.4. Структурная схема импульсной корреляционно-экстремальной инерциальной системы. погрешности гироплатформы Дф, = х — х — ошибка поискового оценивания координаты х. Другие возмущающие воздействия, такие как ошибки акселерометров и интеграторов, хреновые и тангажные погрешности, наличие диаграммы направленности у приемников поверхностных полей, играют второстепенную роль по сравнению с <йдр, Дф/У и 6г и поэтому не указаны на структурной схеме. Импульсный элемент, осуществляющий амплитудную модуляцию поступающего на его вход сигнала и выдающий прямоугольные импульсы единичной скважности и дискретности Т, учитывает дискретный характер управления вследствие наличия в контуре регулирования БЦВМ. Обратная связь i/R учитывает медленные шулеровские колебания в ИС. На статистическую динамику эта связь практически никакого влияния не оказывает и для сокращения выкладок множитель 1/R в дальнейшем полагается равным нулю. Структурными преобразованиями можно получить структурную схему, оценивающую влияние возмущения
бх и показанную на рис. 7.5. Согласно известным правилам определения дискретных передаточных функций [7.4, 7.5J непрерывной части разомкнутой системы W - у-+ -^+ $ + $ схемы рис. 7.5 соответствует дискретная передаточная Рис. 7.5. Структурная схема, оценивающая влияние возмущения бх. функция разомкнутой системы W* (z) = (z- I)-4 [(ах + а2 + а3 + а4) z3 + + (—За! — а2 + За3 + 11а4) z2 + (Зах — а2 — За3 + lla4)z+ + (—«1 + а2 — а3 + а4)], где , Т _ , Т3 _ gk3T3 _ gkj’i ai — -ур, а2 — /с2 , а3 — щ , а4 — Дискретная передаточная функция Ф*(г) = A*(z)/ /6х* (z) замкнутой системы равна Ф1 (z) - f + Wt (з) = Л-1 (z) [(ai + a2 + a3 + a4) z3 + (— 3ai — a2 + 3a3 + 1 la4)z2-j--|- (Заг — a3 — 3a3 -|- lla4)z (— a± -[- a3 — a3 a4)], здесь A (z) = z4 + (a2 + a2 + a3 + a4 — 4)z3 + + (—ЗаА — a2 4- 3a3 + lla4 + 6) z2 + (Заг — a2 — За3 -I-+ lla4 — 4) z + (1 — + a2 — a3 + a4) = 0. Осуществим выбор параметров kx, кг, ks, Zc4, исходя из требования, чтобы все корни характеристического уравнения ' системы A (z) - - 0 были действительными кратными, равными X, и лежали рнутри единичного круга устойчивости (рис. 7.6). Длц
этого коэффициенты обратных связей klt к2, ks, kt необходимо выбирать из условий: т ТЪ Т* Т1 ^ХТГ ^2"2Г ^3 ~3!~ "4Г = (1 — М’ т Т2 ТЗ 7’4 — 3&i -j-j-к3 + З^/гз -gj- + iigkt = — 6 (1 — X2), 3^1 - кг 7~ - З^з + 11^4 ^- = 4 (1 - X3), Т Т* Т8 Т4 .. . — ^i-jp + ^« "21---ЗГ "4Г ~ _ □ (7-18) Система (7.18) при любом Т =# 0 имеет единствен- ное решение, так как ее определитель в этом случае от- личен от нуля. При выполнении (7.18) Ф/* (z) принимает вид Ф?(г) = (г~У£^~ ~ • (7Л9) \г Л/ Переходная функция h (п), соответствующая (7.19), может быть определена по формуле обращения [7.6] А (я) =2^7 Ф Я* (я) ««-*<&, 1'НСТ Рис. 7.6. Расположение корней характеристического уравнения импульсной КЭИС. где Я* (z) — z-преобразование Л(п). Поскольку единичная функция 1 (п) имеет z-преобразование z/(z—1),то Я* (z) =Ф* (z).z/(z —1)и |Z|=.CT Используя правило вычетов [7.7], получим h(п) = 1 - 4- [(н + 3){п + 2)(п + 1) - 3<« + 2)-<"+!)я_|_ ! 3 (п + 1) п (п — 1) п (п — 1) (п — 2) 1 - п X» JЛ • На рис. 7.7 построены переходные функции 1 — h (п) для различных значений!. Рис. 7.7 показывает, что в слу
чае кратного расположения корней достигается хорошее качество регулирования, а длительность переходных процессов определяется величиной 1 — X, играющей в данном случае роль степени устойчивости (7.5]. S) Рис. 7.7. Переходные функции импульсной КЭИС. Переходный процесс в замкнутой корреляционноэкстремальной инерциальной системе (КЭИС) распадается на два участка (рис. 7.8). На первом участке (назовем его участком предварительного наблюдения) коррекция ИС еще не осуществляется, а производится лишь набор реализации датчиком поля. Пространственная длительность этого участка £рег (ей соответствует временная длитель-
кость Грег = ЬрегУ-1, где V — скорость движения) равна длине NL реализаций, используемой в поисковом оценивании. На втором участке БЦВМ производит минимизацию функционалов, вычисляет оценки ошибки ИС и осуществляет коррекцию. Начальная ошибка ИС Ад списывается. Длительность этого участка обозначим 7^Рег Рис. 7.8. Разбиение переходного Рис. 7.9. Зависимость процесса импульсной КЭИС на времени регулирования участке предварительного наб- от величины корня X. людения и коррекции. (соответственно временная длительность обозначается 7’рег). Полная длина переходного, процесса £рег равна Lper + Lper. На рис. 7.9 показана зависимость относительного времени регулирования от величины корня X. Рассмотрим теперь статистическую динамику КЭИС. а) Влияние ошибки оценивания бас. Зависимость дисперсии этой ошибки от относительной длительности поискового оценивания N и от соотношения сигнал/шум б/<т~ определяется графиками рис. 5.4—5.6. Если величина VT превосходит радиус корреляции навигационного поля, то в первом приближении возмущение бх можно полагать дискретным «белым» шумом, что подтверждается также данными цифрового моделирования. На этом основании дискретную спектральную плотность S* (z) возмущения 8х будем считать равной S* (z) = б1, 2 здесь Од — дисперсия поискового оценивания местоположения.
Составляющая стдб полной дисперсии ошибки скорректированной замкнутой ИС о** от влияния возмущения дх определяется известной формулой [7.6] I<*>?<*>I’-S*<*>-V-• 1*1=1 Квадрат модуля | Ф* (г) [2 на единичной окружности, | z | = 1 равен |Ф:^1и1=1=ФГ(2)ф;(|)|121=1 = = [(* - к)* — (z —— 1)«] [(1 - Xz)» - (1 - z)*]j I (z-X)»(l-Xzp ||*|=1» поэтому 2 4 1 A К* — Х)«—(* —1)«]Д(1 — Xz)* —(1 — *)*] dz Одб = °д 2л/ Y (z-X)‘(l-X2p z • м=1 (7.20) Чтобы вычислить (7.20), сделаем подстановку z = (1 + + /о) (1 — jv)'1, преобразующую внутренность единич- ного круга | z | = 1 в левую полуплоскость комплексной плоскости; при этом интеграл (7.20) примет вид „2 _ 9„2 J_ С (О - X) + (1 + Х) (/»>)]«-16 (/V)* Ч д2лД [(1 - X)•+ (1 + X) (ЛОР (1 + jv) „ [(1 - X) - (1 + X) (Л)Р -16 (jv)* , х [(1-Х)-Н1 + >.)(-/1')Р(1-/«') Сделаем новую замену переменных © = (1 + 1) (1 — X)-1i> и примем обозначения а = (1 + к) (1 — X)-1, b = 16 (1 + -f- X)-4, тогда П2 _ 1 ? К1 + /“)4 ~ ь О'<»)41 К1 - / <fl)t ~ b д 2л J (1 4-/<о)* (а-I-7<о) (1 —/<о)« (а —/со) (7.21) Входящий в формулу (7.21) интеграл является (см. [7.51, стр. 642) табличным интегралом типа т_____1_ С _____Gn 0м) j п~ 2я ) Я„(/Ш)Яп(-/<о)
Для использования приведенных в [7.5] таблиц следует положить Я6(х) = (1 + х)* (а + х), G6 (х) — [(1 + х)* — — Ьх4] [(1— х)4 — Ьх4]. После необходимых вычислений получим -ГТ2И ,Дв + 8^ + 29^ + 64Х’ + 97Х« + 1О41 + 69 , 7 99 °дв-ад^ Л) (1+Х)7 б) Влияние дрейфа гироплатформы. Реальный дрейф гироплатформы (одр содержит как постоянную во времени, так и флуктуационную составляющие. По отношению к постоянной составляющей <одр обеспечивается астатизм за счет интегрального члена коррекции kjp. Корреляционная функция флуктуационной составляющей обычно описывается выражением (т) = o®e-vN, где Ощ и у-1 — дисперсия и радиус корреляции флуктуационной составляющей дрейфа. Действительная структурная схема от шдр к Л показана на рис. 7.10. Провести анализ такой импульсной Рис. 7.10. Структурная схема, оценивающая влияние возмущения ыдр. системы не представляется возможным, так как сигнал 5 на входе замкнутой импульсной системы является нестационарным. Возникающая здесь нестационарность является фиктивной, так как влияние трех интегрирующих звеньев на входе замкнутой импульсной системы, приводящее к нестационарности сигнала £, компенсируется соответствующими дифференцирующими звеньями замкнутой импульсной системы. Чтобы избежать отмеченной фиктивной нестационарности вместо действительной структурной схемы рис. 7.10, рассмотрим некоторую вспомогательную искусственную структурную схему, полу
чающуюся из исходной заменой интегрирующих звеньев на инерционные звенья (р + в)-1 (рис. 7.11). Проведя статистический расчет вспомогательной схемы и устремив в конечных результатах е к нулю, оценим, таким образом, действительное влияние дрейфа гироплатформы на КЭИС. Рас. 7.11. Вспомогательная структурная схема, оценивающая влияние возмущения юдр. Известными разработанными методами 17.4, 7.6] можно получить дискретную передаточную функцию W* (z) разомкнутой импульсной системы рис. 7.11, соответствующую W (п\ = 1 I I р + е Г(/, + е)3 -Г(/, + в), t-(p+e), • После необходимых преобразований находим W* (z) = (z~ с)~* [(в! + а2 + я3 + а4) (1 — с) (z — с)3 — — (а2 + а3 + я4) ст (z — 1) (z — с)2 — — (аз + ««)-^- (z — 1) (z2 — с2) — а4 (z — 1) (z2 + 4cz 4- с2)1, О I где ау = kje., а2 = Л:2/е2, а3 — к31г3, ai = /с4/е4, с = = е-ЕГ, т = еТ. Передаточная функция замкнутой системы Ф*е (z) равна (г) _ ф* (~\ __________(г с)4__________ 5* (г) 26 ' Аз3 4- Л2г2 -f- Axz + Ао ’ Л3 = — 4с 4" (oi Ц- я2 -у- я3 4_ я4) (1 — с) — т т® т3 — + ®з + я<)с -----(®з + fl«)с -gj-aic -3Г > Л2 — 6с2 — Зс (1 — с) (яг д2 -|- а3 ц4) 4" (1 -|- 2с) (я2 4-я34- 4-«♦) с-ц-4-(а3 ’Га4)с-^- 4- (1 — 4с) сцс
Ai = — 4с8 Зе2 (1 — с) (t?i 4~ я3 4- яз 4~ я*) — (2 4~ с) (я3 4* + аз + ai) с2 fj- 4~ (°з + а<) с3 ~2i~ + °* —с)с? "3f 1 Ло = с4 —с8 (1 — с) (ai + а2 4- а3 + а4) 4- + («2 +йз+«4)с3-^- — (йз +й4)С3 -gf + °4С3-^-. Будем считать, что для любого е козффициенты аъ а2, я3, а4 выбираются таким образом, что характеристическое уравнение A (z) = z4 + Л8г3 + Л2г2 4- Axz 4- Ao = 0 имеет действительные кратные корни, равные Л; тогда <т>* i„\ - (2 с)4 ~ (z-A>)‘ ' Определим дискретную спектральную плотность (z) дискретного сигнала £е. Спектральная плотность Sge (о>) сигнала £ь>, рассматриваемого как непрерывный, равна _____________________________2?Ч>у W — (ш2 + V2) (й)2 е2)3 и может быть разложена на элементарные множители S’ - 2gta^ Г_________1__и 1 _ У3-82 4- (У2-е*П Vй; - (72 _ е2)3 [ ша + Т щ2 + ft (<02 + е2)2 -Г (Ш2 + е2)3J • По таблице соответствия согласно правилам, сформулированным в [7.4], находим с* / ч 2*2Ф zshyr_______1 z sh т_________ *Se'Z' (у2 — е8)3 \ у гг—2гсЬуГ4-1 е *2 —2zchT-]-l •у2 — е2 Г ctz 2z sh т cxz "1 4es L(cz—I)2 2s — 2zchr-|-l ' (z — c)2 J (У2 ~ e*>2 JT2 ГC2 <cz 4- 1) _ cz (z 4- c) I _ 16e5 I L (cz—I)3 ^(z — c)3 J - [^ + - ^)}> • Составляющая <тда дисперсии полной ошибки} од2, обусловленная дрейфом гироплатформы, определяется
соотношением = Иш^- (£ / - 5? (z) —. (7.23) e-~o 2л/ ^(z-^'fl-lz)4 z Проведя интегрирование (7.23) и перейдя к пределу при 0 ♦), получим < = (TW7 {“ -e-vr) С1 - ^?т)4 х X [16(1 — e-vr)3(l +1)3-|~ +29 (1 - e-vT)2 (j + g-vT) (1 + (1 _ 1) + + 20 (1 — e-vT) (1 + е~Ут)2 (1 + 1)(1 — X)2 + + 5(1 + e-vT)3 (1 _ K)8J + 40 _ (уТ)3. 16 (21« — 1+2) (уТ)5 80 (211 + 1» + 61» + 1 + 2) ] 31 (1 — X)’ + 51 (1 -1)5 J • (7.24) Величина уТ является малой для всех возможных реальных значений периода выработки команд Т. Разлагая квадратную скобку выражения (7.24) в ряд по у и ограничиваясь малыми величинами до седьмого порядка, найдем 4 , 2 Г7 = g^Y^^^y X ч, 3021е + 11911s + 301814 — 132213 + 301812 + 11911 + 302 Х 315(l-f-l)7 (7-25) в) Влияние боковых ускорений jv при наличии азимутальной погрешности гироплатформы Дф. Структурная схема, связывающая возмущение Дф/у с Д, показана па рис. 7.12. Здесь, как и при расчете <4Ш, имеет место фиктивная нестационарность случайного процесса q(t). Вместо структурной схемы рис. 7.12 рассмотрим вспомогатель- •) При осуществлении этих операций приходится проводить громоздкие математические выкладки; в частности, необходимо выделить бесконечно малые пятого порядка по е.
ную искусственную структурную схему рис. 7.13, получающуюся заменой интегрирующих звеньев на звенья Рис. 7.12. Структурная схема, оценивающая влияние возмущения Лф/у. Рис. 7.13. Вспомогательная структурная схема, оценивающая влияние возмущения (р + е)-1. Воздействие Дф/У можно считать «белым» шумом со спектральной плотностью 5дФ7 (со) = (0), где Оф — дисперсия азимутальных ошибок гироплатформы, Sj(O) — значение спектральной плотности боковых ускорений на нулевой частоте. Корреляционная функция сигнала qt (t) равна Л«е(т) = ^^-(1+е|т|)е-«М. Ей соответствует спектральная плотность S*e (z) дискретного сигнала дв (п): < (г) = X v с Р2 (1 + т)-(1 -т)1 Z» 4- (1 -4r*r-c>) z + С Р (1 4-т)-(1-т)) (Z — с)’ (!-«)« здесь, как и ранее, т = еГ, с = е~еТ.
Составляющая Од^ дисперсии полной ошибки определения координат, обусловленная действием боковых ускорений /у (при наличии азимутальной погрешности Дф), равна d. = lim * ф | Ф* (z) |2 S* (z) 4- = е-ю )2f=1 1 • 1 X (z — с)4 (1 — сз)4 с* , . <2г " 1™ W , (z-X)4(l-Xz)4 ® — Выполняя интегрирование и переходя к пределу, получим 4^Sj (0) Гз 2Х«- Х + 2 R = 3j (1-Х)’ (14-Х)’ ’ Возмущения 6х, содр, Дф/у статистически независимы, поэтому дисперсия о*’ полной ошибки определения координат в скорректированной КЭИС равна а*’ = < + < + (7.27) Подставляя в (7.27) значения Одв, адш, <Тд’ и о® из (7.22), (7.25), (7.26), (7.17), найдем величину а**: Од = 1 — ф1п, — X » Xе + 8Х6 + 29Х4 + 64Х’ + 97Х« + 104Х + 69 ,, 1-1 X (1-1-Х)’ Х ’ k&Sj (0) г’ 2Х2 - X + 2 , „2 Т’ Х[ 3 i(l—X)’ (1 + Х)7 ~l'g (1—X)’ Х 302Х» 4- 1191 Xs 4- 3018Х4 — 1322Х’ 4- 3018Х’ 4-1191X 4- 302 7 Х 315 (1 4-X)’ J’ здесь ф (п, = Од/^д* определяется выражением (7.17). Если зафиксировать <тш, у, Щ|>, Sj (0), п, N, о, о~, Т, то существует такое значение lmin, при котором достигается минимум полной ошибки а*. Найти аналитическое выражение для Xmin трудно. Поэтому для значений <тш = — 0,5 град/ч, Оф = 1 град, Sj (0) = 50 м2.с~3 были про-
ведены численные расчеты а*, результаты которых представлены на рис. 7.14—7.19. На рис. 7.14 приведены зависимости о* и Грег от X, рассчитанные для Т = 10с и различных значений <р. Кривая 1 соответствует ф = 0,01, кривая 2 — ф = 0,02, кривая 3 — ф = 0,5 и кривая 4 — Ф = 1,2. Грег (рис. 7.9) определяется исключительно величиной корня X и не зависит от качества поискового Рис. 7.14. Графики, поясняющие существование оптимального расположения корней. Рис. 7.15. Зависимость оптимального значения Xmin от качества поискового оценивания. оценивания, характеризуемого значением ф. Минимальное среднеквадратическое значение a*mln полной ошибки определения координат скорректированной КЭИС зависит от качества поискового оценивания ф. При хороших условиях оценивания (ф = 0,01) о* как функция X имеет пологий минимум, равный 5 м. Хтщ для выбранных значений ош, <Тф, S} (0) практически не зависит от периода дискретности выдачи команд коррекции Т и определяется только величиной ф, что подтверждается графиком рис. 7.15. На рис. 7.16 показана зависимость от качества поискового оценивания и периода Т. На рис. 7.17 изображена зависимость Трег от Т для различных ф, рас
считанная в предположении, что X выбирается оптимальным в соответствии с графиком рис. 7.15. Рассмотрим достижимую точность коррекции КЭИС при работе по мелкоструктурному полю. Само качество поискового оценивания, как это следует из рис. 5.6, в Рис. 7.16. Зависимость точности замкнутой КЭИС от качества поискового оценивания. Рис. 7.17. Влияние качества поискового оценивания на длительность переходного процесса в замкнутой КЭИС при оптимальном выборе л. этом случае зависит от длины реализаций NL, участвующих в поисковом оценивании, и от соотношения среднеквадратической ошибки датчика поля <г~ и среднеквадратического отклонения самого навигационного поля о. При проведении расчетов радиус корреляции навигационного поля будем считать равным р = 1,5 км. Замеры, отстоящие друг от друга на 2р, можно считать статистически независимыми. Поэтому, например, длительности предварительного наблюдения Lper = 30 км соответствует N = 10 (десять статистически независимых замеров датчика поля). Совместный расчет с использованием зависимостей рис. 5.6 и рис. 7.16 позволяет найти связь достижимой точности коррекции o*mJn с о, о~, £рег и Т. a*min как функция о/о_, рассчитанная для различных Т, показана на рис. 7.18 (АреГ ~ 30 км) и рис. 7.19 (Lper = = 75 км).
В проведенных расчетах предполагалось, что величина клетки I выбирается настолько малой, что достижимая Рис. 7.18. Зависимость точности замкнутой КЭИС от соотношения сигнал/шум при Чег = 30 км‘ Рис. 7.19. Зависимость точности замкнутой КЭИС от соотношения сигнал/шум при Чег = 75 Км- точность коррекции и* п1п зависит только от влияния различных возмущений. В случае, когда это условие не выполняется, o*m)n определяется зоной нечувствительности Z/2 статической характеристики КЭИС. § 7.3. Выбор оптимальных режимов коррекции корреляционно-экстремальных инерциальных систем При формулировании требований к подсистемам, входящим в пилотажно-навигационные комплексы, основанные на коррекции ИС по физическим полям Земли, необходимо быть уверенным, что как алгоритмы комплек-сирования подсистем при движении над участком коррекции, так и сам режим коррекции (длительности участков автономного движения и коррекции, общее число и размеры участков коррекции, величины шагов дискретизации и пр.) выбраны оптимальными. Если первая из этих задач достаточно полно исследована в предыдущих главах, то вопрос о выборе оптимальных режимов коррекции еще не ставился. Рассмотрению этого вопроса и посвящен настоящий параграф.
а) Параметры режима коррекции. Будем считать, что условия коррекции ИС по геофизическому полю заданы. Под условиями коррекции понимаются: — качество ИС, определяемое среднеквадратическими ошибками ох0, Оу01 а«о> °Чо начальной выставки по координате, скорости, вертикали, курсу и среднеквадратическими значениями постоянных составляющих дрейфа гироплатформы и ошибки акселерометра су, — качество датчика поля и навигационных карт, определяемое среднеквадратическими значениями флуктуационных составляющих ошибок датчика од и картографии Ок» — характеристики используемого навигационного поля, определяемые среднеквадратическим значением <т и радиусом корреляции поля р: — общая длина маршрута D и скорость движения V, которая для простоты предполагается постоянной (это Рис. 7.20. К определению параметров участка'коррекции, непринципиальное ограничение при необходимости может быть без труда ликвидировано). Имеется лишь возможность выбора числа участков коррекции, длин интервалов автономного движения и коррекции на различных участках, шагов дискретизации при составлении бортовой карты навигационного поля и других параметров режима коррекции. Необходимо выбрать режим коррекции ИС наилучшим в каком-то смысле. Будем считать, что оценивание координат ИС на некотором произвольном к-м участке коррекции производится с использованием поисковых алгоритмов. Для их реализации необходимо задать (рис. 7.20) число замеров
датчика поля А'*, используемых в обработке, расстояние Lk между последовательными замерами, шаги дискретизации 1хк, 1ук по координатам х, у при составлении бортовой карты навигационного поля, число клеток доверительного квадрата 2пхк + l,2nv* + 1 вдоль осей х, у, шаги дискретизации vxk, vyk и число градаций 2тхк + 1, 2mvk + 1, составляющих ошибки измерения скорости, времена автономного движения Тк и коррекции tk. Рассматриваемая схема коррекции состоит из ряда последовательных участков автономной работы и коррекций, причем предполагается, что завершается движение участком коррекции. Режим коррекции ИС па маршруте полностью определяется вектором Р*, проекциями которого являются параметры отдельных участков коррекции и общее число участков коррекции М-. ft* = (М', Ny, Lk, пх1, пу1, Ixi, lyi,mxl, niyL, vxl, Vyi, Ту, . ., A^, А*, 71,*, Tly*, lxk) lykt ^xki TTlyA» ^,*, Vyk i 7**, Nm, Lm, nxM,. . .,VyM, Tih tu) Если фиксированы условия коррекции ИС и задан вектор режима коррекции Р*, то это однозначно определяет среднеквадратические значения ошибок ИС в любой момент времени. б) У равнения ошибок инерциальной системы в автономном режиме. Мгновенные значения ошибок продольного канала ИС по координате, скорости и вертикали на к-м автономном участке обозначим fak (0, Д?хА (/), ахк (t). Для простоты продольный и боковой каналы ИС будем считать независимыми. Тогда уравнения шулеровского движения (3.140) — (3.141) примут вид Дг* = ДГ,*, ДР,* = gaxk + б/,*, । а,* = - 4 к = 2.......М- | (7’28) В (7.28)6;,*, <5,* — постоянные составляющие ошибки акселерометра и дрейфа гироплатформы. Подобные уравнения могут быть записаны и для бокового канала ИС *). *) Предположение о независимости продольного и бокового каналов ИС, существенно облегчая расчеты, не позволяет строго учесть перекрестные связи между каналами, которые проявляются через влияние курсовой ошибки ИС. Однако приближенно влияние курсовой ошибки может быть учтено при задании статистических характеристик возмущений 6/,*, 6/w*. 13 А. А. Красовский
Уравнения (7.28) решаются при начальных условиях Дз^-о, ДУх)1о, эти решения имеют вид Д^. (i) = Да>о -I- ДГхао5-^- + 8ахк°^ 6--* (1 - cos Qi) + + -^г- (fiz -sin Q0, ДГХ, (i) = ДГхк0 cos Qi + ga^'°+ Ь'хк sin Qi + + -§41-cos Qi), — AV — “xk (0 =~--(,}R° sin Qi + «xio cos Qi — ---^gk (1 — cos sin Qt> где Q = У g/R — частота Шулера. _ Предполагая начальные ошибки Дз^о, Д^хм, ®хм> и погрешности б/хк, ®хк взаимно некоррелированными, получим следующие уравнения для дисперсий ошибок (i), Д7х|ь. (i), ах^ (i): ~2 "2 . "2 Sin2 Qf . (0 = °Чо °VXfcO Q2 Ь e2s2 -4- з2 e3? + g%4 Jxk (1 - COS Qi)2 + (Qi - sin Qi)2, p252 Д- 6? (0 = c°s2 Qt + a%, 3xk Sin2 Qi + Я2б^ + —^(i-cos Qi)2, <у“хк (д) = “да" sin2 Qt + a^k0 cos2 Qi + 3® 32 + -^(1 - cos Qi)2-sin2 Qi, □ (7.29)
здесь о^п, Стуя)го, <т/я|г, О^,хк — дисперсии величин Ai'kOi fyxfr. ®хк- Аналогичный вид имеют уравнения среднеквадратических ошибок бокового канала. в) Уравнения ошибок инерциальной системы на участке коррекции. При рассмотрении вопросов коррекции будем употреблять термины потенциальной, алгоритмической и результирующей точности (или просто точности) коррекции. Потенциальная точность определяется влиянием различных возмущающих воздействий. Она может быть достигнута в том случае, когда ограничения, связанные с возможностью реализации, еще не проявляются. Алгоритмическая точность, напротив, определяется именно возможностью реализации, она зависит, например, от разрядности БЦВМ, дискретности записи поля, шагов дискретизации vv* и т. п. Вопросы алгоритмической точности еще полностью не изучены. В первом приближении эмпирически установлено, что среднеквадратические алгоритмические ошибки определения местоположения и скорости Qvxk в разомкнутой КЭНС в случае, когда не производится интерполяция внутри шагов дискретизации, можно считать равными _А _А Vxk пл. %=—’ °^ = —• <7-30) Вопросы потенциальной точности КЭНС исследованы в предыдущих главах, а также в §§ 7.1, 7.2 настоящей главы. Оценки достижимой точности определения ошибок ИС с помощью нелинейного варианта фильтра Калмана, найденные в § 7.1, можно рассматривать как верхние границы точности поисковых оптимальных нелинейных алгоритмов оценивания. Воспользуемся результатами § 7.1, где показано, что если известны среднеквадратические значения о <TaxJf0, &<»хк„ ошибок измерения местоположения, скорости, вертикали и постоянной составляющей дречфа гироплатформы к моменту начала к-го цикла оценивания ошибок ИС, то потенциальная точность выставки ИС по всем координатам, характеризуемая среднеквадратическими ошибками а?.. (0, aV „ (0, о„ (0. определяется диагональными элементами
(0> (0. (0, Т?44к (0 ковариационной матрицы (0 = VonVxk (0 = /я^ДТ), | <С* (о - <Яхк (о - /ВДГ),) (7 которая, в свою очередь, получается путем обращения матрицы А* (0, элементы которой имеют вид (7.16). Результирующие среднеквадратические ошибки коррекции ИС aXfcp, vvxkp, °Озс.£р, » конце к-го участка будем определять по формулам “ max (°S»P« <Р)’ °vxfrp = тах (<^Р. °LP)’ °ахкр = тах (°“xfrp’ °“xfrp)’ °®х*р = П1ах (СТ®х»р’ <,р) > . (7.32 здесь индексом «р» отмечены значения потенциальных и алгоритмических ошибок в конце к-го участка коррекции, в частности, потенциальная точность в конце к-го участка может быть рассчитана по формулам (7.31), (7.16), в которые вместо текущего момента времени t надо подставить длительность к-го участка коррекции tk. Поскольку участки автономного движения и коррекции чередуются, то конечная точность (к — 1)-го участка коррекции является начальным условием к-го участка автономного движения: д**о = Р’ = °vx, fc-1, р’ ®®х(гэ »-1,р’ Ч» — ^®х, к-1,р, к = 2,3......М, и, наоборот, конечная (результирующая) точность к-го участка автономного движения является начальной для fc-го участка коррекции: O.vfro = oxjfp, 0Vxk} = Ovx»p’ °axlf0 = 5axJfp< ~ 5®xltp’ 4=1, 2,. . .,M, причем OX10 = Ox0, Ovxl0 = Oy0, °axl0 = °ao, °b>xi0== а с реднеквадратическое значение ox конечной ошибки навигации на маршруте равно == ОхМр. (7.33)
г) Требования к бортовой цифровой вычислительной машине. Э. С. Моисеевым рассмотрены вопросы реализации цифровых КЭНС и составлена программа Б ЦВМ, решающей задачу оптимального нелинейного оценивания координат по геофизическому полю. Сформулированы требования к емкости оперативного запоминающего устройства (ОЗУ) Ск и быстродействию одноадресной, однопроцессорной БЦВМ, которые необходимо выполнить для реализации оптимального поискового алгоритма коррекции ИС на к-м участке: Вк С» — Qk —, Qk = i^tnxinllt:nixkm,jk, (7.34) (7.35) здесь Qk — число элементарных операций, необходимых для реализации алгоритма коррекции; — допустимое время расчета сигнала коррекции; q — число двоичных разрядов, с помощью которых в памяти БЦВМ записывается одно значение навигационного поля; \к — число элементарных операций, которые необходимо выполнить БЦВМ, чтобы проверить одну гипотезу. Требования к БЦВМ в целом определяются как наиболее трудные из требований, необходимых для обеспечения отдельных этапов коррекции: В - тахВк, С = гоахб\. (7.36) к к Емкость внешнего запоминающего устройства Е, потребная для записи информации о навигационном поле на всех участках коррекции, равна Е = (7.37) к д) Математическая постановка задачи оптимизации режимов коррекции. Если фиксированы протяженность маршрута D и скорость движения V, известен вектор е точности начальной выставки и инструментальных погрешностей ИС е = (<7хо, <7уо, Щхо» Oj. <7ш)» (7.38) известны точность датчика навигационного поля оя и картографии а также интенсивность и радиус кор
реляции навигационного поля о и р, то задание вектора Р* полностью определяет режим коррекции. Это означает, что такое задание позволяет согласно соотношениям (7.29), (7.30), (7.16), (7.32) рассчитать точность ИС в любой точке маршрута и одновременно позволяет на осповапии уравнений (7.33) — (7.37) сформулировать требования к БЦВМ. Указанное обусловливает возможность выбора наилучшего (в определенном смысле) режима коррекции, что математически сводится к поиску оптимального значения вектора 0*. В качестве критериев оптимизации можно предложить целый ряд показателей. Точностные критерии, например, критерий min ох (7. при заданном соотношении а/о~ и при соблюдении условий В < йд, С < Ся, Е< Ея, (7.40) где 5Д, Сд, Ея — допустимые значения В, С и Е. Эти критерии обеспечивают наивысшую конечную точность определения местоположения при заданных параметрах БЦВМ, заданной точности датчика поля и картографии и заданной интенсивности поля о. Критерий min а/о~ (7.41) при соблюдении дополнительных условий ах < В < Вя, С < Сд, Е <. Ея. Этот критерий обеспечивает заданную точность навигации при заданных параметрах БЦВМ и при использовании наихудших датчиков, наихудшей картографии или наиболее слабых навигационных полей. Критерии min В, min С. (7.42) ₽• ₽♦ Это машинные критерии. Они позволяют получать потребную точность навигации при заданном соотношении а/а~ и при наиболее простых БЦВМ. Можно уменьшить размерность вектора режима коррекции на том основании, что его проекции подчиняются
некоторым уравнениям связи. В частности, должны выполняться соотношения rexk^xk — ^Йх^р» пук^ук — mxkVXk = 2оух)[р, Шук^ук = 25VwJtp, к = 1.....................М, (7.43) означающие, что максимальные ошибки принимаются равными удвоенным значениям среднеквадратических. В силу (7.43) переменные пхк, пук, тхк, тук можно исключить из вектора |3* и перейти к новому вектору режима коррекции Р = (М; Nj, Lk, lxii lyi, Vxj., Vyk, Tlt . .; Nk, Lk, Ixki lyk, vxki vyk, Tk, ifc> • •• j N M, Lm, IxM, lyM, »xM, VVM, Тщ, tub При решении задачи оптимизации вектор р может изменяться в некоторой конечной области возможных значений G, которая определяется ограничениями, накладываемыми на каждую из проекций вектора Р: 1 .И < Л/щах, М>П1|11 < ^к < ^ктах» k*min ^max’ ^*mln lvk < ^к1Пах’ p«kIIlln vxk yxk,nax’ yv*min vvk vukmax' T'kmln T'k 7 »max, ^kmjn ^k ^kmax> а также интервалами дискретности SM, 8Nk, 6Lk, 6lXk, dlyk, bvxk, 6vw>,, &Tk, 6tk, к = 1,. . ., M, с которыми эти возмоя{ные значения просматриваются при нахождении оптимального значения вектора р. Из принципа действия КЭНС известно, что ^xkmax> Zj,j-max не Должны превышать некоторой величины, определяемой пространственной структурой навигационного поля; приближенно можно считать kkmax’ ^Vkmax^2p. (7.44) а При поиске экстремума выбранного критерия возможно применение самых разнообразных методов оптимизации; в частности, в определенных условиях могут оказаться полезными методы приближенного целочисленного про
граммирования (7.8]. Реальное множество R возможных значений вектора 0 является подмножеством G, так как должны еще выполняться очевидные (ограничивающие область G) соотношения м V 2 + tk) = D, Vx/t Lt. (7.45) (7.46) Неравенство (7.46) является выражением требования, чтобы к моменту получения нового замера датчика поля все расчеты, связанные с предыдущими измерениями, были завершены. При практическом решении задач оптимизации режимов коррекции стремятся резко сократить размерность вектора 0 исходя из физических соображений. В частности, в силу идентичности уравнений ошибок ИС в продольном и боковом каналах и равенства ошибок начальной выставки в обоих каналах предполагается Ixk — lyk ~ Ik, Vxk = I’t/t — Vk- Кроме того, используется почерпнутое из опыта решения задач оптимизации свойство оптимальных режимов коррекции, заключающееся в близости параметров всех промежуточных участков коррекции. На этом основании вводятся три типа участков коррекции (первый, промежуточные и последний) и вектор 0 задается в виде 0 = (Л/j Л\, Ly, If, Pj, ТI, ZjJ TVj, L%, ^2» ^2» ^*2» ^2> Nm, Lm, Im, »m, Tm, <m)» причем условие (7.45) превращается в равенство Т’г = д; _ 2 (~р-— Тм — — М — <2- Выделение первого участка коррекции обусловливается возможным длительным автономным движением, предшествующим первой коррекции; выделение последнего участка коррекции вызывается необходимостью получения повышенной точности коррекции на этом участке (и, следовательно, малыми интервалами дискретности 1м, vm).
ГЛАВА VIII АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ НАВИГАЦИОННЫХ КОМПЛЕКСОВ Современный этап развития навигационных комплексов характеризуется автоматическим решением навигационных задач, комплексной обработкой информации в БЦВМ, использованием информации разнообразных подсистем и датчиков. Однако состав используемых средств, способы решения навигационных задач, алгоритмическое обеспечение навигационных комплексов (НК) имеют различные уровни и претерпевают быстрое развитие. Здесь рассмотрим некоторые вопросы алгоритмического обеспечения НК на основе оптимального оценивания, идентификации и управления в их совокупности, т. е. рассмотрим возможную систему алгоритмических модулей НК. Методы навигации и алгоритмические модули рассматриваются применительно к летательным аппаратам. § 8.1. Методы навигации и критерии оптимизации В современных НК широко применяется программный метод навигации. Согласно этому методу назначается программа движения в той или иной системе координат и задача пилотажно-навигационного комплекса (ПНК) заключается в выполнении этой программы. Для определенности будем говорить о географических координатах: 1 (долгота), <р (широта) и высота полета Н. Если все три координаты назначаются как заданные функции текущего времени Хз = (t), ф8 = Фэ (О, Я8 =-- Hz (t), то говорят о четырехмерной навигации. Если назначается
траектория движения в трехмерном пространстве / (Ха, фз, Я8) = О, где f — некоторая заданная функция, то навигацию называют трехмерной. Если в задачу навигации входит обеспечение лишь горизонтальной заданной проекции траектории F (Х8, ф8) = О, то навигацию называют двумерной. Программный метод двумерной навигации называется также маршрутным методом. В принципе программные траектории могут оптимизироваться на основе строгих критериев. Это требует применения наземных ЭВМ на этапе прокладки маршрута и профиля полета (инженерно-штурманского расчета). Здесь с успехом может быть использован алгоритм прогнозирующей модели, описанный в главе I. Для этого необходимо, чтобы требования к программной траектории были сформулированы в виде критерия обобщенной работы типа (1.2), а математическая модель оптимизируемого движения — в виде (1.1). Следует иметь в виду, что оптимальные траектории могут быть сложными. Введение их в БЦВМ потребует оперативного обмена информацией между наземной ЭВМ и БЦВМ и соответствующего объема памяти последней. Однако главные трудности строгой оптимизации программных траекторий связаны с формализацией требований и математическими моделями процессов при решении разнообразных задач в различных ситуациях. Программные траектории в большинстве случаев назначаются в простейшей форме [8.1]. Так, при маршрутном методе навигации программная траектория задается координатами промежуточных пунктов маршрута (ППМ), основного и запасных аэродромов (А), соединенных частными ортодромиями (рис. 8.1). Вблизи ППМ ортодромии сопрягаются дугами окружностей, радиусы которых соответствуют радиусам разворотов (виражей) летательного аппарата. Программный метод навигации можно рассматривать как программное управление траекторным движением, при котором отслеживается известное детерминированное задающее воздействие. Так, при четырехмерной программ-
noii навигации задача заключается в отслеживании векторной функции времени хл (/) = (А3 (<), <р3 («), Н3 (<)). Мели вектор действительного местонахождения в трехмерном пространстве обозначить X (0 = (X (0, <р (0, н (/)), то задача программной четырехмерной навигации сводится Рис. 8.1. Схема задания траектории при маршрутном методе навигации. к минимизации некоторой нормы или функционала вектора отклонения аз (г) — х (1). Для трехмерной и двумерной навигации норма отклонения должна выбираться так, чтобы отсутствовала явная зависимость от времени. Обычно в качестве такой нормы при двумерной маршрутной навигации принимают расстояние до заданной траектории, т. е. длину нормали Az, проведенной из точки местонахождения летательного аппарата к программной траектории. При трехмерной навигации испо^зуются горизонтальная и вертикальная проекции нормали (Az в этом случае рассматривается как двумерный вектор).
Общеизвестная закономерность траекторного управления заключается в том, что устойчивость обеспечивается, если кроме отклонения Дг используется производная этого отклонения по времени Az или рассогласование по курсу. Формирование соответствующих сигналов входит в задачи НК при маршрутном методе навигации. Кроме этого экипажу обычно выдается текущая дальность до очередного ППМ. Задача оптимизации траекторного управления при программном, в частности, маршрутном методе навигации может ставиться обычным образом. При составлении математической модели для цели оптимизации траекторного управления самой тонкой частью задачи является разделение траекторного движения и движения углового. Конечно, наиболее строгое решение задачи получается при использовании полных нелинейных моделей пространственного движения летательного аппарата. Однако при этом пилотажный и навигационный комплексы становятся неразделимыми, в огромной мере возрастает необходимая производительность ЭВМ, возникает проблема многопараметрической текущей идентификации и целый ряд других трудностей. В обозримой перспективе сохраняется целесообразность существования навигационных и пилотажных комплексов. Это согласуется с иерархическим принципом управления, при котором навигационный комплекс является старшим уровнем по отношению к пилотажному комплексу, выполняющему функции исполнения. Навигационный комплекс в своей управляющей части должен формировать задающие воздействия для пилотажного комплекса в виде заданного угла крена, заданной скорости, заданной нормальной перегрузки и так далее. Он выполняет функции, которые в настоящее время еще часто выполняются аналоговыми вычислителями, именуемыми блоками траекторного управления и входящими в комплект системы автоматического управления — САУ (пилотажного комплекса) [8.2—8.5]. Именно эти задающие воздействия целесообразно рассматривать как управления при решении задачи оптимизации. При программном методе навигации математическая модель траекторного движения состав^ется в отклонениях от заданной траектории. После разработки математической модели траекторного движения задается критерий
оптимизации. Он может быть терминальным и нетерминальным. Как уже отмечалось в главе I, для таких этапов полета, как посадка, выход на цель и другое, целесообразны терминальные постановки задачи оптимизации. Для маршрутного полета, многих видов маневрирования допустима нетерминальная оптимизация. Как всегда, в интересах простоты решения задачи оптимизации выгодным является применение критерия оптимизации в форме функционала обобщенной работы и соответствующей теоремы (1.1) — (1.4). Например, для канала боковых отклонений на этапе посадки функционал может задаваться в виде I ~ РцЛ^) + р^Дф2 (Г) |-т т + J (PiiAz2 + 022Дф2 . <?шт (у)) dt + J у2 dt. (8.1) Здесь Az — боковое отклонение от оси взлетно-посадочной полосы, Дф — отклонение по курсу, у — угол крена, который считается управляющим воздействием, (?шт == = @шт (у) — функция штрафа, введенная с целью обеспечения ограничения по углу крена. Оптимизация может осуществляться на стадии проектирования (аналитическое конструирование). Полученный таким путем «закон управления» в виде крена как функции других компонент вектора состояния реализуется в БЦВМ или аналоговом бортовом вычислителе. Другой путь заключается в оптимизации в процессе функционирования системы (совмещающий синтез, алгоритм прогнозирующей модели, см. главу I). Этот путь предпочтителен при нелинейной модели траекторного движения и неквадратичном функционале. Оп дает в принципе точное решение задачи оптимизации, в то время как аналитическим путем в этих условиях задача решается лишь приближенно. Программный, в частности, маршрутный метод навигации в ряде применений обладает недостатком, связанным с чрезмерной жесткостью траектории. Для смягчения этого недостатка предусматривают возможность свободного «схода» с программной траектории и возвращения на нее, возможность выхода па любой из запрограммиро
ванных аэродромов и на любой (а не только очередной) ППМ. Однако полностью преодолеть этот недостаток в рамках программного метода навигации нельзя. Другим распространенным методом навигации является так называемый курсовой метод. Для управления здесь выдается курс на очередной ППМ, цель или аэродром и дальность до этой точки. При курсовом методе траектория менее жесткая, чем при маршрутном методе навигации. IV числу недостатков курсового метода относится увеличение ошибок в определении курса на очередной ППМ или другую точку при сокращении расстояния до этой точки (ошибки определения географических координат считаются неизменными). Вблизи ППМ метод как бы теряет устойчивость. В целом следует заметить, что как маршрутный, так и курсовой методы навигации имеют эвристическое происхождение. Можно, однако, синтезировать методы навигации формальным путем минимизации заданных функционалов. При этом метод навигации и алгоритм траекторного управления становятся по существу неразличимыми. Допустим, например, что ставится задача прибытия в заданный ППМ на заданной высоте в заданное время, т. е. задача четырехмерной навигации. Очевидно, что в функционал (критерий оптимизации) необходимо ввести вектор отклонения, характеризующий расстояние до назначенного ППМ: zT = ( X (/) — Х3, ф (£) — фа, Н (t) — Н3 ), где Х8, фа, Н8 — координаты ППМ и высота. Навигация (траекторное управление) может считаться оптимальной, если поставленная задача решается при минимуме расхода топлива, минимуме перегрузки, минимальном крене и т. д. Вектор координат (параметров), выражающих эти показатели, обозначим Х01(. Как будет показано ниже, в качестве управлений при оптимизации траекторного управления выгодно рассматривать перегрузки в инерциальной системе координат и угловые координаты, точнее, производные перегрузок и направляющих косинусов. Обозначим вектор этих управлений, как обычно, через и. Тогда терминальный функционал обобщенной работы (1.2) применительно к данной задаче
будет иметь вид 'л J = v3 [.rT(fk), Х<>„ (/к)] |- Q (хтЦ), Хо„ (<)] dt 4- t I- 4" (uTA:~2u -I- w’dA:“2h1,ii) dt. (8.2) t где tk — заданный момент прибытия в ППМ, V3, Q — заданные положительно определенные функции. Имея критерий оптимизации и математическую модель траекторного движения, можно или синтезировать «закон оптимальной навигации» на стадии проектирования НК, или применить алгоритм прогнозирующей модели и реализовать его в БЦВМ. В следующем параграфе показано, что при определенной форме модели траекторного движения оба пути достаточно просто осуществляются и не требуют высокой производительности БЦВМ. После прибытия в ППМ происходит переключение алгоритма на очередной ППМ или любую другую точку, выбранную экипажем из числа запрограммированных. Данный алгоритм навигации обладает высокой гибкостью, в нем путем изменений функционала (8.2) можно учесть самые разные требования. Он выгодно отличается от предыдущих тем, что здесь на каждом этапе полета задача навигации решается в определенном смысле оптимально. Нетрудно получить аналогичным путем алгоритмы для трехмерной и двумерной задач навигации. Для определенности данный алгоритм навигации будем называть алгоритмом гибких оптимальных траекторий. Его конкретная форма рассматривается в следующем параграфе. § 8.2. Алгоритмы навигационных комплексов Навигационные комплексы в историческом плане явились развитием неавтоматизированного навигационного оборудования и на первых порах во многом унаследовали простые алгоритмы аналоговых вычислителей. В дальнейшем появилось алгоритмическое обеспечение, более полно отвечающее возможностям БЦВМ, а в перспективе можно
ожидать впедрепия высокосовершенного оптимального алгоритмического обеспечения, ориентированного на бортовые вычислительные системы высокой производительности. а) Алгоритмы НК традиционной структуры. На рис. 8.2 представлена структура ПК, в котором осуществляется преобразование координат к единой системе, простейшая Рис. 8.2. Структура НК с преобразованием координат и счислением пути. фильтрация (оценивание) компонент скорости и счисление пути с коррекцией по радионавигационным системам или видимым ориентирам. Эта структура является типичной для первого поколения навигационных комплексов с БЦВМ. В качестве подсистем на рис. 8.2 указаны: инерциальная система (ИС), допплеровский измеритель путевой скорости и угла сноса (ДИСС), курсовая система (КС), система воздушных сигналов (СВС), радионавигационная система того или иного вида (радиосистемы ближней и дальней навигации РСБН, РСДН и т. д.). Этот состав подсистем обозначен условно. Для НК разного назначения он существенно различен. Сигналы различных подсистем соответствуют различным системам координат и различным элементам в этих системах. Для приведения сигналов к единой системе координат служат алгоритмы
преобразования координат. В достаточно общем виде преобразование координат сводится к решению векторного алгебраического уравнения ф (х, у) = 0. (8.3) Здесь Ф — векторная нелинейная функция, у — вектор сигналов подсистем (без учета шумов), х — вектор состояния. Компактная форма записи (8.3) не означает, что преобразование координат не является трудоемкой операцией. Решение с необходимой частотой повторения системы сложных алгебраических уравнений требует значительной производительности БЦВМ. В форме (8.3) можно представить также описание обмена информацией между подсистемами, осуществляющегося непосредственно через БЦВМ. Это весьма развитая у современных НК операция предназначена для уменьшения методических ошибок и обеспечения самой работоспособности подсистем за счет двусторонних или односторонних связей между составными частями комплекса. При описании обмена информацией в форме (8.3) к кинематическим и геометрическим соотношениям, выражающим связи координат, добавляются соотношения, описывающие сами подсистемы, и векторная функция Ф в общем случае уступает место оператору. Это же имеет место тогда, когда учитывается инерционность подсистем в обычной задаче приведения к единой системе координат. Приведенные к единой системе координат сигналы подвергаются простейшей обработке (фильтрации). В частности, если имеются несколько сигналов измерения одной и той же величины, то используются субоптимальные фильтры, выделяющие из этой совокупности сигналов один сигнал повышенной точности. Такие сигналыформируются для компонент путевой скорости в выбранной системе координат Хфу = Рф [жу], (8.4) где ху — вектор сигналов путевой скорости в единой системе координат до фильтра, x$v — вектор сигналов путевой скорости после фильтра, />ф — оператор фильтра. Далее следует собственно счисление координат, под которым понимается интегрирование компонент путевой
скорости ^-a = J З’ФУ dt. (8.5) В режиме радиокоррекции или коррекции по видимым ориентирам ошибки, накопленные при автономном счислении пути, списываются до уровня ошибок радионавигационной системы или ошибок «привязки по ориентиру». В НК применяется маршрутный или курсовой метод навигации с программированием определенного числа ППМ, аэродромов и других точек. Навигационная информация выдается в систему индикации, блок траекторного управления САУ и другим потребителям. Такова в общих чертах структура и алгоритмы НК «первого поколения». Нетрудно усмотреть недостатки подобной структуры и алгоритмического обеспечения НК. Оптимальное оценивание, идентификация и управление здесь по существу не применяются. Это приводит к потерям в точности и недостаточно совершенной структуре ПК в целом. Возможно, конечно, усовершенствование комплекса путем введения, например, оптимального оценивания для той или иной группы координат. Уже богатый опыт применения калмановской фильтрации в навигационных целях показывает плодотворность этого направления усовершенствования НК. Главное здесь заключается в том, что удается использовать информацию высокоточных, но косвенных измерений, таких как непрерывные или дискретные дальности до какой-либо точки. В предшествующем изложении показано и проиллюстрировано на многих примерах, что при выполнении определенных условий прецизионные измерения одной или нескольких величин позволяет оценить с высокой точностью все компоненты вектора состояния. Хотя оценивание предшествует управлению, мы начнем рассмотрение с оптимального траекторного управления. Это позволяет сделать теорема разделения, изложенная в главе I. б) Алгоритмы оптимального траекторного управления. Формирование оптимальных управлений траекторией в виде заданных перегрузок, заданных угловых координат целесообразно выполнять в навигационном комплексе, располагающем необходимой информацией и вычисли
тельными возможностями (БЦВМ). Отработка задающих воздействий производится пилотажным комплексом. •Формирование оптимальных траекторных управлений в реальном времени в ряде случаев требует умеренной производительности БЦВМ. Это имеет место, в частности, тогда, когда уравнения траекторного движения при постоянных управляющих воздействиях допускают интегрирование в общем виде, а критерием оптимизации служит функционал обобщенной работы. Действительно, обратимся к случаю управления скоростью изменения задающих воздействий (1.99), (1.104). Допустим, что векторное дифференциальное уравнение «свободного» движения х + / (х, у) = 0, у -= 0 имеет общее решение х = X (х0, у0, t), у = у0, где х0, у0 — начальные значения х, у. Иа свободном движении I ’ (x«, Уо) = Va [х (<2), у (<2)] J Q (х, у) dt = io f. = Va [X (x0, у, /2), у] 4- j Q [X (x0, у, Г), у] dt. to Заменяя t0 на t, x0 на я, получаем t. v (X, у) = Va [X (х, у, t2), у] ь J Q [X (х, у, t), у] dt. t Принимая во внимание, что оптимальное управление равпо 7 2 дУ Ноп = у = — /г -д— , “ J fry получаем окончательно ti у - — кI 2 * * * * 7 Va [X (х, у, /2), у] А (2 )Х (г, у, /), у] d/j . (8.6) Поскольку функции X, как и Va, Q, по предположению
известны в аналитической форме, постольку правая часть выражения (8.6) также может быть получена в аналитической форме. Таким образом, в данном случае алгоритм оптимального управления доводится до явной функциональной зависимости (закона управления), что, конечно, резко сокращает необходимую производительность ЭВМ в сравнении, например, с общей формой алгоритма прогнозирующей модели, когда требуется моделирование свободного движения в ускоренном времени. Закон управления типа (8.6) может быть применен во многих задачах навигации. Рассмотрим характерную задачу приведения летательного аппарата в заданную точку (очередной ППМ) в за- данное время. Кроме связанной с летательным аппаратом системы координат Ox^Zy будем рассматривать географические координаты — широту ф и долготу X, высоту над уровнем моря Н, считая Землю сферической. Введем также прямоугольную правую систему координат Oxyz, ось Oz которой направим вертикально вверх, ось Ох в плоскости меридиана (рис. 8.3). Можно предполагать, что система координат Oxyz Рис. 8.3. Система координат. материализуется посредством горизонтальной гироплатформы, ориентированной в азимуте на север. Если рассматривать компоненты /я, jv, jz активного ускорения (т. е. создаваемого не гравитационными и не инерционными силами) в системе Oxyz, то справедливы следую щие уравнения: ♦+ ~$ТГ + 4-<й + М’»1п 2.Р - -т^тг. Х + 2(О+Ч-я-£-г7--2(П-: + Я - [(Q + X)2 cos2 ф -|- Ф2] (7?з //) \g = jz, (8.7)
где /?з — радиус Земли, g — гравитационное ускорение, Й — скорость вращения Земли. Эти уравнения могут быть получены, в частности, из уравнений инерциальной системы (3.81) — (3.88) в предположении (ориентированная по географической системе координат платформа) с учетом следующего соответствия обозначений: г = Н + /?3, г = Н, <1>3 -- й, ix = а? + gt, /„ = а* + g*, h — g а? + gz, tp = q>*, х = 1*. В самом деле, дважды дифференцируя уравнения (3.86), (3.87) и используя однократные производные (3.81) — (3.83) с учетом (3.85) и указанных только что соотношений, получаем (8.7). В принципе ускорения /х, у„, /2 в геоцентрической системе координат можно было бы принять за упавляю-щие воздействия, однако это неудобно, так как расход топлива, лобовое сопротивление и другие факторы, по которым должен прежде всего оптимизироваться полет, зависит от перегрузок в связанных осях. Ускорения jx, jv, jz выражаются через ускорения в связанной системе координат и направляющие косинусы jx ~ 7х1Е11 4" 7zlE12 "Ь 7|/1Е13, 7v = Лае21 “Ь 7ziF22 7щ823> jz = 7xxe3i + 7zie32 "Ь 7и1езз> еи = cos cos Ф, ei2 ~ —sin ехз = sin Ф cos Ф, е21 — sin О cos у cos ф — sin у sin ф, е22 = cos О cos у, e2S = sin О cos у sin ф -|- sin у cos ф, е31 -- —cos у sin ф — sin О sin у cos ф, е32 — —sin у cos Ф, е33 = cos у cos ф — — sin О sin у sin ф, Г (8.8) где ф, й, у — угол рысканья, угол тангажа и угол крена соответственно. Индексы у и z в формулах (8.8) как бы поменялись местами. Это произошло потому, что в обще
принятой связанной с летательным аппаратом системе координат ось Оух нормальная, а ось Ozx — поперечная оси самолета. Обозначим xi ~ <Р, хг = Ф> хз = К xt~ К хь = Н, хе = xi = М, х9 = jzl, х9 = хй0 = у, хп ft, х12 = гр и примем в качестве управляющих воздействий скорости изменения ускорений и угловых координат d . d . d . Uj ~~ dt ,xl' Us “ dt lzl' Uf> ~~ ~dt 7,/1’ Ню = Y, их1 = ft, Уравнения (8.7), (8.8) представляем в виде хх — х2 = О, *2 + •+ 4-(П + A)2 Sin 2X1-^lld^Lh^= о, ^8 "Г *5 * лэ “Г *5 х8 — xt- О, х* + 2 (Q х4) ^_х— 2 (Q + Хд) х2 tg хх — _ Ч~ x8et2 4~ Xjfys __ Q (Яа + Жб) 008 xi xt — xt = О, хв — [(П + Хд)2 cos2x1 + х2] (Я, + х6) + g — х7е81 — ----------------------------------- -^8^32 - ^9833 = •^7 ’ W7, Xg = Ид, Хд Ид, Хю = Ию, Хц = Мц, Х12 = U12, ец = cos xu cos xJ2, 8J2 = —sin xlx, e18 = sin x12 cos xu, e21 = sin xn cos xJ0 cos x12 — sin x10 sin x12, e22 —- cos Xj^ cos х^д, ejg = sin xu cos xJ0 sin x12 + sin xi0 cos xJ2, e31 = —cos x10 sin xJ2 — sin x10 sin xn cos x12, e82 = — sin x10 cos xu, 833 = cos x10 cos xJ2 — sin xu sin x10 sin x12. □; (8.9) Общее решение уравнения (8.9) при нулевых управлениях Ui — 0 (свободное движение) найти затруднительно
или невозможно, хотя для частного случая = х3 = = ха = 0 такое решение известно в виде эллиптических траекторий. Однако редко когда интервал оптимизации бывает столь велик, что следует отличать эллиптические траектории от параболических, а последние получаются, если в уравнениях (8.9) пренебречь ускорениями, создаваемыми поворотом вертикали, а также широту в четвертом уравнении считать неизменной. Тогда получаем 4. ~ П л 2'?8ц 4- «в6!» 4- ЯаВи п м Ti — Х3 — V, Хз---------р ,-------- — V, 7?а + хь ~ т + 1,621 + 19622 +19621 — Л гз-т4-и, xt у__ и, х6 — Хв = О, Хя + g — x^eЗJ — хвг32 — Хве38 О, J (8.10) и для «свободного» движения ,77 = 0, Т8 = 0, .7 g = 0, 7ц) = 0, 7ц — 0, .712 — 0. Эти уравнения интегрируются в общем виде т (х’)о (8н)о 4- (xe)o (eia)o 4* (®9)о (е1з)о " (*2)о Z +---------2(Я34-К)о)---------- ’ \ I (х7)о (е11)о 4“ (гв)о (812)0 4~ (гв)о (е1в)о , .т2 = (£2)0 4----------/р 1 \ \--------- (•^в 4" (Xs)o) (а7)о (ег1)о 4~ (гв)о (еи)о 4~ (да)о (егз)о р Хз (Хз)о + (Х4)°t+ 2 (Я„ + («»)») cos (*,)„ r ___ (r \ I (x7)d (e21)o + (lg)o (e»)o 4* (х9)о (е2з)о f (/?3 + (*5)o)cos(xi)0 = (^ь)о + (x»)o t-----2~ gt2 4* 4—2” К'Г7)° (e3i)o 4" (^8)0 (832)0 + (J»)o (833)0] t2i r(i = (^e)o — gt 4" K^o (831)0 + (^e)o (832)0 4" (#9)0 (833)0] t, X? = (x7)o, X3 = (78)0, x9 = (xe)o, Хю = (^10)0, ^11 = (^u)o> *12 = (x12)0. □ (8.11) Зададим теперь функционал обобщенной работы — критерий оптимизации. Так как ставится задача вывода (приведения) летательного аппарата в заданную точку в заданное время, то естественно терминальную часть функционала задать в виде положительно определенной функции
отклонений по географическим координатам и высоте в заданный момент времени V3 [ф (<2) — фз, х (t2) — Х3, II (t2) — Н3] = = V3r*rx (t2) — <рз,-г3 (<2) — ^з, xs (t2) — Н3]. (8.12) При квадратичном критерии V3 -- pu [Лд (t2) — ((’:,12 + рзз [Т (t2) — %з]2 + ! Pss F*s (t2) - ЯзР, (8.13), гДе Pu> Рзз, Pss — заданные положительные коэффициенты. В интегральную часть функционала можно включить функцию, зависящую от перегрузок в связанных осях Q = Q {хт, х2, х9). (8.14) Вообще говоря, такой показатель, как расход топлива, зависит от многих параметров и при строгом учете его функция Q зависит от большего числа аргументов. Кроме того, могут вводиться различного рода ограничения на угловые координаты. Это может осуществляться или путем введения функции штрафа @шт, суммируемой с функцией Q и «возникающей» только на границе области ограничений, или путем видоизменения самой функции Q через введение новых аргументов. Рассмотрим подробнее лишь вариант (8.14). Для случая квадратичного критерия Q — “Ь Ре»Х2, где Р77, р88, Р#9 — заданные положительные коэффициенты. Итак, все подготовительные операции проведены и можно обратиться непосредственно к алгоритму (8.6). В данном случае при квадратичном критерии V3 X (г, //, <2), у] = । _ । ®?ен ; *88р ’“ ®»«i3 ti "12 । — P1I |ф -Г Х2 (Z2 — t) ---2 (Я + 15)---- ^2 I' ~ Фз | + + Р„[ха г X, (/, - О Ь «. - О’ - ф + Pss £х5 + Xg (t2 — t)-2“ £ — О2 "b “I--2“ (•Г7831 "Ь ^я832 -1- #3833) (t2 — t)2 • T/gJ , Q [X (z, t), y| — P77Z7 I Pse^2 + P»8*e, Ci (8.15)
причем вектор у составляют компоненты х7, xf, хй, х10, хц, х12- Направляющие косинусы выражаются через х10, xu, х12 согласно формулам (8.9). Компоненты второго члена в фигурных скобках алгоритма (8.6) в данном случае равны 2077^7 (ti — t), 208яЛ*8 (t2 — t), 2099Х9 (t2 — t). (8.16) Раскрывая (8.6) в соответствии с (8.15), (8.16) и принимая во внимание, что 37— (х?£11 + ^«12 + хве1з) -- 0, Vi10 д (з:78ц + ^8®12 + ^8е1з) = = — (х7 sin Хц cos Т12 хя cos хп • x.sin.TjSinTn), (t7e11 -|- Яв₽12 4“ т»е1з) — — Xj COS Xn si n Xlt 4- X9 COS Хц cos Xn, -Д-— (3'7621 4* Х9Ъц 4- Х982з) = X763i + x8?-32 4' 3:9833 ~ jzt uxlt> ’ffx (х1^21 + хяе22 4 3:9623) ~ COS Хц) (х78ц 4- 3"я612 4" Vis) = - COS Xlajx, K— (x7821 -I" 3:9822 4- 3'9823) -- — x7623 + 3:9821, 0X12 д-— (3:7831 4- xge32 4- 3:9833) =- — (3:7821 4- 3:9892 4- 3:9823) — — ]v, (3:7831 4" x8e32 4" 3:9833) = — sin З10 (х7бц 4- з:в8124- 3:9813)=- = — sinxio/х, (3:7831 4* 3:9832 4- 3:9833) = = x7 (sin Хю sin xn sin Хц — cos Хц cos x12) 4- 4- xe (— sin Хц sin Хц, cos xn — cos x10 sin хц), а также переходя обратно к исходным обозначениям, получаем ~ir = ~к7 [яв₽+я (фпр ~ фа) н + (я,4-я)^ов<р7(Хп'’ ~ + Р86®31 ~ ,/я> + "йг I ’
+ (Да^Гсозф0 (*°Р-Ч + . Z U rr \ I + (>66832 {И пр — На) + -----------------Г- tn ”“’ t I /и I/ \ I ^Poe/ui + рБ6езз (Нпр — На) Н--------1 __ t —- ЬР.ЗЗ /1/1 (//пр -- //в) j 1 Hir = ~ [ Я„ + Я (фпР “ Х X (/х1 sin Ф cos ф — 1Л cos & — /и1 sin & simp) — — p56siny/xl (Я — Нв = — /с*2 (Фпр — Фз) (— 7x1 sin i|> 4- /Н1 cos ip) + + (Я3 + Я)со8<р0 (Хпр “ Хз) (7р1Ег1 ~ 7ж1егз) + + Рбб (Нпр — яз) [уж1 (sin т sin 0 sin ф — cos О cos ф) + + y’vi (— sin О sin у cos ф — cos у sin ф)]}. □ (8.17) Здесь , , /Х(<2—О2 Фпр = Ф + Ф (<2 — 0 + = = ф + Ф («2 — 0 + —Ф («2 — 0а
— «прогнозируемое» значение широты, X -х + v/ п ’ 5(<а~°а -ли1, - к + к Ц2 - t) -г _ = X -|- X (<2 — t) i—2~ — О* — «прогнозируемое» значение долготы, /7П1) - II -ь II (t2-t)~-L-g - О2 + 4- h Цг —t)2 = = Н ^II(t2-t) -r±-H(t2-t)* — «прогнозируемое» значение высоты, к* 3 kj (G — <), 7 — 7,8,. . ., 12. Систему обыкновенных дифференциальных уравнений (8.17) можно рассматривать как алгоритм оптимального траекторного управления — алгоритм вычисления задающих воздействий в виде активных ускорений jxl, jvl, jzl и координат углового положения у, ф, О. Эти шесть величин должны определяться путем численного интегрирования уравнений (8.17) с введением сигналов от информационной части НК — системы оценивания. От информационной системы должны подаваться текущие значения географических координат и скоростей <р, ф, X, X, Н, Н для вычисления «прогнозируемых» значений <рПр, Хпр, Нпр. Что касается ускорений в геоцентрической системе координат jx, ju, j2, также необходимых для вычисления «прогнозируемых» значений, то при наличии инерциальной системы они измеряются акселерометрами, расположенными на горизонтальной платформе. Если платформенная инерциальная система отсутствует, то в принципе jx, jy, jz могут вычисляться по формулам (8.8). Направляющие косинусы, входящие в уравнения (8.17), также вычисляются по формулам (8.8). Общее число элементарных операций на один шаг численного интегрирования уравнений (8.1 ), не считая числа операций для нахождения синусов и косинусов, при четырехточечном методе интегрирования составляет примерно 600. При шаге 0,05 с, что для задающих воздействий траекторного управления может оказаться вполне достаточным, необходимая производительность составит всего порядка
15 000 элементарных операций в секунду. Таким образом, алгоритмы оптимального траекторного управления вида (8.17) вполне осуществимы. Это касается и случая более сложных задач, когда летательный аппарат приводится в заданную точку в заданном направлении и заданном угловом положении (посадка) и учитываются ограничения типа неравенств. Действительно, если оставить прежние обозначения координат, то задаче вывода в заданную точку в заданном направлении с заданными скоростью и угловым положением соответствует терминальная часть функционала вида (для квадратичного случая) — Рд [Xj (f2) фэР “1“ р22 1^2 (^г) — ФзР 4” 4” раз fx3 (Z2) 4~ Р44 [^4 (^2) ^эР 4* + Р55 [*а (М — #зР + Pee t^e (М — #зР + 4" Р1010 (^2) ТзР 4* Риц I-^ii(^a) 0зР 4" 4- Р1212 (^2) Фа12- Вся процедура получения алгоритма оптимального траекторного управления остается прежней, а необходимая производительность ЦВМ возрастает не более чем в 2— 2,5 раза. в) Алгоритмы оптимального оценивания. Хотя формирование оптимальных задающих воздействий траекторного управления может явиться важной функцией НК, основное назначение НК заключается в измерении и оценивании навигационных параметров. Системам оценивания навигационных координат с использованием информации о геофизических полях посвящены почти все предшествующие главы данной книги. Поэтому здесь ограничимся сравнительно краткими замечаниями. Выбор модели в значительной мере зависит от состава измерительных систем, точнее, от совокупности сигналов, которые принимаются в качестве компонент вектора управления и вектора наблюдения в информационной части НК. Кроме того, модель, конечно, зависит от принятой основной системы координат. Если имеется платформенная инерциальная система с платформой, ориентированной по географическим осям, то в качестве математической модели навигационных процессов можно принять уравнения (8.7), где ускорения /ж» /». hi точнее, соответствующие величины, выдавав-
мые акселерометрами инерциальной системы, следует принять за управления. С учетом малых ошибок в угловом положении гироплатформы и флуктуационных шумов акселерометров их сигналы можно представить в виде /анх = /х Д^г/г Дфг/м 4' £икж, 7аКм = hi 4~ AYi'7z "I" Дфг/х “I" Вак», /акг = jz 4" Д^г/х 'Ь Дуг/ц 4' Вакг- Ввиду малости ошибок 7акх 7х, 7аку 7у, 7aKz — Jz можно также принять 7акх = lx &&rjauz Дфг/аку 4" Вакх, 1 /акм = 7м “1“ ДУг/акг 4~ Дфг/акх 4“ Вак», ( (8.18) 7акг jz I" Д^г/акх I' ДУг/акм Н Вакг- J Время оценивания или время переходного режима процесса оценивания обычно много меньше (на один-два порядка) периода Шулера — характерной постоянной времени инерциальной системы с горизонтальной платформой. Исключение могут составлять лишь КЭНС, работающие в условиях гладких полей при высоком уровне шума датчика поля (см. главу IV). Полагая, что время переходных процессов значительно меньше периода Шулера, считаем угловые ошибки инерциальной системы постоянными: Дуг = const, даг = const, Дфг — const. Используя прежние обозначения хл = <р, х2 = ф, х3 = %, Хц = X, хъ = Н, х8 = Н и вводя новые х7 = Дуг, х8 = Дб'р, х9 = Дфг, w2 = 7акх, ^4 — ]акц1 = ]якг, уравнения (8.7) и уравнения угловых координат представляем в виде +2 «ffi; + 4-<Д + r,>‘3h' ~ л,+Х',“ -_ Вакх 4" хъ ’
Г3 — Хц — О, -I- 2 (Q х4) д f<1-----2 (□ + х4) Хч t g — и4 — Xzu$ XgUg ^а|<р (/?3 + Х5) COS Xi (Z?3 I - X„) COS Xi ’ f 5 — X„ = 0, t6 - [(Q ; xty cos2 I (7?3 I z5) b g - U6 -f- X3U2 “Г XfU^ f7 = 0, fg = 0, f9 = 0. Г (8.19) В качестве компонент вектора наблюдения примем сигналы датчиков z15 z2 двух различных полей (навигация по двум геофизическим полям), а также сигнал грубого измерителя курса (например, магнитного компаса) z3 и высотомера z4: И zi = ^ni (^ii *з) 4" Z2 -= Лп2 ^з) ~Ь ?Z2> Z:t — Хд + Cz3, z4 - х5 !- Е24. [ (8.20) Заметим, что при наличии в памяти БЦВМ карты рельефа высота пад уровнем моря хъ может определяться посредством радиовысотомера. Если одним из навигационных полей является рельеф, то датчиком поля и датчиком высоты может в принципе служить один высотомер. Однако в дальнейшем будем считать шумы белыми независимыми, т. е. в любом случае будем полагать, что для контроля высоты х5 применяется специальный высотомер, а поправка вносится па основе карты рельефа. Остальные шумы £21, £г2, £z3 также считаются белыми со спектральными плотностями Szl, Sz2, Sz3. Математическая модель (8.19), (8.20) может рассматриваться как практическая и для нее в следующем параграфе рассматривается алгоритм оптимального оценивания. Эта модель может быть усовершенствована за счет усложнения. В частности, можно отказаться от гипотезы постоянства ошибок инерциальной системы за время оценивания, введя ту или иную математическую модель ошибок инерциальной системы (глава III). Более строгая модель дает большую точность оптимального оценивания, однако увеличивает потреб
ное быстродействие БЦВМ. Выбор разумного компромисса между противоречивыми факторами — прерогатива конструктора. Полная формализация процесса подобного выбора невозможна. § 8.3. КЭНС, оптимальное траекторное управление и структура навигационных комплексов Оптимальное оценивание и оптимальное траекторное управление, использование в интересах навигации геофизических полей, т. е. применение КЭНС, способны резко изменить облик навигационных комплексов. Прежде всего заметим, что оптимальное (субоптимальное) нелинейное оценивание в той форме, которая изложена в главе I, позволяет избавиться от преобразования сигналов датчиков к единой системе координат, т. е. позволяет устранить операцию (8.3). Назовем основной для каждого режима или этапа полета ту систему координат, в которой осуществляется управление (и индикация) на этом этапе. Пусть уравнения движения, записанные в основной системе координат, имеют вид i + / (х, и) = £х. (8.21) Вектор наблюдения представляется в форме z — hz (х, и) 4- %г. (8.22) Он наблюдается в течение всего времени оценивания. Такое представление оцениваемого процесса и условий наблюдения уже достаточно для получения алгоритма оптимального (субоптимального) оценивания вектора состояния х. Здесь нет преобразования координат и не требуется разрешимость уравнения hz (х, й) — z = О (при заданных z, и) относительно х, в то время как для преобразования координат необходима разрешимость уравнения (8.3) Ф (х, у) = О относительно х. Главное достоинство рассматриваемых алгоритмов оценивания как раз и заключается в том, что за счет привлечения математической модели оцениваемого
процесса при соблюдении условий точного оценивания удается использовать сугубо косвенные измерения. Применение подобных алгоритмов оценивания позво-ляет использовать информацию, которая при традиционном подходе считалась неприменимой. G другой стороны, оптимальное оценивание позволяет исключить сигналы, которые при традиционном способе являлись необходимыми. Использование сигналов датчиков геофизических полей (оптимальных КЭНС) является достаточно ярким примером этого. Применение принципов КЭНС позволит существенно сократить число необходимых измерительных подсистем и их точность и обусловит кардинальные изменения традиционных структур НК. Сходное воздействие может иметь и оптимальное траекторное управление, возлагаемое на НК. Однако возможен постепенный переход к новому алгоритмическому обеспечению и новой структуре НК, т. е. возможны различные варианты, в той или иной мере сохраняющие традиционную структуру. Ряд вариантов уже описан в главах IV, VII. В качестве примеров рассмотрим два в некотором смысле крайних варианта. Экстремальная коррекция НК со счислением координат. Рассмотрим вариант НК, в котором почти полностью сохраняется структура традиционного комплекса со счислением пути и вводится дополнительно беспоисковая экстремальная коррекция по одному из геофизических полей. Структура такого НК представлена на рис. 8.4. Часть, осуществляющая счисления координат, мало отличается от традиционной структуры, приведенной на рис. 8.2. С целью повышения надежности здесь имеется функциональная избыточность и контроль работоспособности подсистем. Счисление координат может производится в режимах: инерциальном, инерциально-допплеровском, курсо-допплеровском и курсо-воздушном (аэрометрическом). В любом случае производится определение компонент скорости в выбранной главной системе координат и счисление координат. Строго говоря, точное «счисление» координат здесь производится алгоритмом экстремальной коррекции (алгоримом КЭНС) и обычное счисление (выходные величины хг, уг) не является необходимым. В схеме рис. 8.4 оно предусмотрено как резервное.
Компоненты скорости, выдаваемые данной «грубой» навигационной системой, поступают в систему (алгоритм) экстремальной коррекции, куда подается также сигнал датчика поля ДП и сигналы цифровой карты поля. Алгоритм КЭНС, так же как остальные алгоритмы, мола : быть реализован в БЦВМ, цифровая карта хранится во внешней памяти и переписывается в долговременную i: Рис. 8.4. Структура НК со счислением пути и экстремальной коррекцией. оперативную память по мере необходимости. Поэтомуциф-ровая карта на рис. 8.4 представлена лишь частично принадлежащей БЦВМ. Для осуществления высокоточного оценивания курса в КЭНС кроме компонент скорости подается сигнал курса от курсовой системы (КС). В интересах обеспечения минимальных дополнительных требований к БЦВМ желательно в данной системе применить алгоритм экстремальной навигации, наиболее экономный в смысле необходимой производительности ЭВМ. К таким алгоритмам относится беспоисковый алгоритм курсо-; опплеровских и курсо-воздушных КЭНС. рассмотренный в § 4.4. В нем сигналы компонент горизоп- 14 А. А. Красовский
тального вектора скорости, поступающие от «грубой» навигационной системы (ГНС), используются как управления u2, а сигнал датчика поля и сигнал курсовой системы — как компоненты вектора наблюдения zA, z2. С учетом постоянных и флуктуационных ошибок ГНС и дрейфа КС уравнения и условия наблюдения согласно § 4.4 записываются в виде Xj “Ь Х2 Х8Х8 ^2^*5 * = £vx, ^2 = ^8 + *4 ~ + UXX8 — U2 = — £vv, *^4 = О, z2 = hn (#i, х2) “I- £д, z2 = x8 -f- £дф, где x2 = хд, xs = уд — истинные координаты, х2 = АУХ, xt = AV„ — постоянные ошибки ГНС по скорости, Дф = xs — ошибка курсовой системы (азимутальная ошибка). Основной модуль алгоритма оценивания в соответствии с этим будет иметь вид Xi + + *4*6 — М2Х5 — Uj = = -у + ^1з“(zi — Лп (ii, is)l + — is)» is = (^12 _y^'4' 2 'j (Z1 — ^n(ii, is)] 4- TT^-(Z2 — Xj), \ лд лд / лдп> *^3 "Ь ?4 —" ^2^6 “F —•142 = = f-^is -a-r i?33 -y^ lzi — ha (ii> is)) + y^* (z« — is)» \ Д Д I лдч> i« = (i?14 “У" + ^34 ~yMlzl — ha (ij, is)] -=-^" (z2 - is)» is = f^15~y^ "b lZ1 — ^s)] + y^" (z2 — is)- □ (8.23) Здесь, как всегда, 5Д, 5д^ — спектральные плотности белых шумов £д, |Дф, еМ1 = dhjdiy, еМ2 = dhjdi^ — «градиенты» поля. Что касается модуля ковариаций, то здесь могут быть по крайней мере два варианта, соответствующих описанному выше вычислительному и «эмпирическому» определению ковариационной матрицы R (см. главу I).
В первом случае совместно с уравнениями (8.2В) интегрируются уравнения ковариаций, которые в матричной форме имеют вид R -i- -g- R + R «)’ 4- R (-»T S71 * -g-R - s*- <8-24)- Учитывая структуру (количество нулевых элементов) матриц df t dh c-i dh di ’ \ di / г di ’ представленную в § 4.4, нетрудно подсчитать, что количество элементарных операций для одного шага численного интегрирования уравнений ковариаций при четырехточечном методе интегрирования не превышает 800. Численное интегрирование в основном модуле (8.23), которое должно осуществляться одновременно с интегрированием в модуле ковариаций, требует существенно меньшего числа операций. При четырехточечном методе это число составляет примерно 200 на один шаг. Если шаг численного интегрирования дифференциальных уравнений выбрать равным 0,02 с, то осуществление данного алгоритма отнимет у БЦВМ примерно 50 тысяч элементарных операций в секунду. Наиболее экономный в вычислительном отношении алгоритм в данном случае имеет вид + Хг 4- Х4Х6 — U2X8 — Uj = лДХ1, х2 = лДх2, Хз х4 — х2х8 4" ^1Х4 — и2 = лДх3, х4 = лДх4, х8 = лДх5, ДХ1 4- Дх2 Г ?4Д*8 + #вД*4 — и2Дх8 = лДх2 -- Дх2 = лДт2, Дх3 4- Дх4 — х5Дх2 — х2Дх8 4- и2Дх5 = лДх3 + Дх4 = лДх4, Дх8 = лДх8 4- £*, 1 / dhn dh„ \ я I- Д*зj [Z1 — ha (х2, хз)1 + 1 4- -п— Дх5 (z2 — х6). с (8.25)
При тех же условиях для этого алгоритма необходимое быстродействие составит всего 13—14 тысяч операций и секунду. Однако у беспоисковых алгоритмов КЭНС имеется принципиальный недостаток, о котором неоднократно говорилось выше. Этот недостаток заключается в потере работоспособности при больших начальных отклонениях. Переход же к поисковым или гибридным алгоритмам влечет увеличение требуемой производительности ЦВМ. Для преодоления указанного затруднения можно использовать несколько способов. Прежде всего можно так выбирать маршрут полета, чтобы экстремальная коррекция осуществлялась непрерывно, а включение КЭНС производилось достаточно быстро после взлета, когда еще не успели накопиться большие ошибки в координатах местонахождения. Другой способ, о котором уже говорилось в главе I, заключается в специальном выборе места включения КЭНС. Достаточное условие точного оценивания для алгоритма (8.25) принимает вид 1 / d/с, \ 1 > — i3) — -Arj,>0 при Ax = const 0. Для этого, в свою очередь, достаточно: I dli dh \ ( ал Ап + ал ДХз ) [*п (^1, *3) - (ХЬ Х3)] 0 (8.26) при Дх = const У= 0. Достаточное условие точного оценивания (8.26), являющееся в то же время (при достаточно низком уровне шумов) достаточным условием сходимости алгоритма, может быть интерпретировано следующим образом. Проекция вектора градиента поля на вектор отклонения (компоненты Axj = Xj — хх, Ах2 = х2 — х2) должна иметь тот же знак, что и приращение поля (xt, х3) — ha (хх, х3) вдоль вектора отклонения. Это иллюстрирует рис. 8.5. Если линии равного уровня поля ha -•= с( — const представляют собой замкнутые выпуклые кривые, как на рис. 8.5, а, то локальное достаточное условие (8.26) выполняется в пределах фигуры, отмеченной штриховкой.
Ига фигура соответствует линии ha = const, проходящей через точку оценки и содержит все точки истинного положения ж,, в которых выполняется условие (8.26). Для невыпуклых кривых hn (xlt х3) — htl (жд) = const (рис. 8.5, б) область сходимости получает прямолинейную границу. Следует иметь в виду, что достаточное условие (8.26) является локальным условием, которое в динамике может нарушаться. С другой стороны, выполнение условия (8.26) гарантирует (при достаточно низком уровне шумов) одновременное Рис. 8.5. Геометрическая интерпретация достаточных условии сходимости беспоисковых алгоритмов. уменьшение (списание) ошибок по всем координатам. Между тем на практике может оказаться приемлемым и тот случай, когда начальные ошибки списываются последовательно. Путем специального выбора места включения КЭНС в цтом случае можно существенно расширить область сходимости оценок, рассматриваемую в пространстве начальных отклонений по координатам. На рис. 8.6 приведены примеры структур аномалий поля (для рельефа — характер возвышенностей или впадин), благоприятствующих сходимости процесса оценивания в КЭНС при больших отклонениях.
Первый пример (рис. 8.6, а) соответствует случаю, когда летательный аппарат сначала пересекает аномалию (возвышенность, овраг), сильно вытянутую в направлении, перпендикулярном направлению полета, а затем движется' над «склоном», параллельным направлению полета. Второй пример (рис. 8.6, б) соответствует случаю, когда ППМ выбирается так, что на двух соседних частных Рис. 8.6. Примеры выбора мест включения КЭНС с целью ликвидации больших отклонений. ортодромиях, образующих значительный угол, летательный аппарат проходит аномалии, сильно вытянутые в перпендикулярном направлении. Для того чтобы показать, что такой выбор места, точнее, района включения КЭНС при использовании алгоритма (8.23), (8.24), способствует сходимости процесса оценивания, обратим внимание на то, что пересечение сильно вытянутой по нормали к траектории аномалии соответствует малости второй компоненты градиента поля Р'м2 - д£3 ’ Поэтому можно положить
Тогда матрица dhz di становится диагональной (см. § 4.4): ООО о ООО о ООО о ООО о Если ошибки но курсу и по скорости достаточно малы, то элементы ^4» ^4 —' Zs “Ь W1 матрицы dfldi (§ 4.4) можно положить равными нулю и эта матрица становится квазидиагональной: 0 1 0 0 0 0 0 0 0 di ’ 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 При этом уравнение (8.24) допускает декомпозицию. Верхний левый блок имеет вид *н М +11° MIK МШР» МИ0 °ll r„ м 1° °1ПК МИК Mh oil Отсюда следует е* Ян+ 2Я12+-£-/& = д е» + Ям + g- Я12 Яц = О, е* Ям + ^- Я?2 = 0.
Видно, что при еМ1 0 < 0, т. е. процесс оценивапия скорости сходится. Далее I ^12 I ^11^22 У#11^22» где Л22 — начальное значение Ям. Поэтому, если е2 _______ + 2 И RA (8.27) д то Лц < 0, т. е. дисперсия ошибки оценивания координаты уменьшается с течением времени. Условие (8.27) может выполняться при больших 7?и = Л3п, т. е. при больших начальных отклонениях. Правда, все соотношения данного алгоритма основаны на линеаризации функции Ьа, справедливой лишь при условии, что отклонения меньше размеров аномалий. Таким образом, можно ожидать, что при пересечении аномалии, вытянутой в направлении нормали к траектории и имеющей достаточно большие размеры, будут ликвидироваться ошибки в продольной координате, имеющие порядок протяженности аномалии в направлении полета. Обратное положение имеет место при движении над склопом аномалии, вытянутой в направлении полета. Здесь оценивается боковая координата. Доказательство сходимости такое же, как в первом случае. Пересечение двух вытянутых аномалий, расположенных под значительным углом (рис. 8.6, б), позволяет последовательно ликвидировать ошибки в географической системе координат. Итак, беспоисковые КЭНСмогут сочетаться с НК обычной структуры, иметь самостоятельное применение и реализоваться при сравнительно невысокой дополнительной загрузке БЦВМ. г) Оптимальное алгоритмическое обеспечение НК. Согласно изложенному алгоритмы оптимального оценивания и траекторного управления могут быть получены в значительной мере формальным путем. Достаточно задать модель оцениваемого процесса и условия наблюдения (включая распределение сигналов датчиков между вектором управления и вектором наблюдения), а также критерии оптимизации.
Рассмотрим совокупность алгоритмов оптимального оценивания и траекторного управления для модели движения типа (8.19), условий наблюдения (8.20) и критерия оптимизации (8.15). Как указывалось, модель (8.19) соответствует географической системе координат и платформенной инерциальной системе, ориентированной по географической сетке, сигналы акслерометров которой рассматриваются как управления. Вектор наблюдения помимо сигналов датчиков двух геофизических полей включает сигналы курса и высоты над уровнем моря. В соответствии с выражениями (8.19), (8.20) основной модуль беспоискового алгоритма оценивания вида (1.51) будет иметь форму: fr Zi — = лДхь Дх4 — Дх2 =- лДх1? хг + 2 + “Г(П+sin2f* ~ = лД*2’ х3 — х4 = лДх3, Дх3 — Дх4 — лД.г3, Z4 + 2 (Q + 34) — 2 (Q + i4) Хг tg — (Я3 + Л,) cos xs — = лДх8, Дх5 — Дхе = лДх6, х6 — [(Q 4-.#4)Jcos2ii + xf] (Ня + х5) + g — — ue + i8M2 + -- лДхв, x7 = лД,г7, ДА, = лДх7, х8 — лДх8, Дх8 = лДх8, x9 — лДх8, Д.тв лДхв, Д^2 + (й ^*)"tos 2£1ДХ1 2 _ * . Дгг + пэ Т + (О + f4) sin 2х1Дт4 - 2^4- ug-- xgu,,r^4 д + д Г" *5/ + /?3 + д r,i “ Дх’- Яа + i, д'г’“ яДхг + Л3 + *5 ’ Дх4 - 2 (Q + f4) х2 - 2 (й + i4) tg +
к (и< — i,u, - COS-lfj — 2 (й + i4) i. А_ , -f- (Я8 + «ь)’ ДХв + । о 4^4 л„ । + «1Д«» + (Яз + ^сов*! “« — *7цв ~ *»ц» ein т Лт - пАт J__________^ак у (Яз + ^сов»^ Sln ?1Дж» “ ЛДх‘ + (Яз + ^cosf! Дхв + (Q + х4)2 sin 2$i (Я8 + хь) Да-i + 2х2 (7?3 + хв) Дх2 — — 2 (Q + i4) cos2 £1(Я3+ i») Дх4— [(Q 4- х4)2 cos2 А1+^]Дх6+ + и4Дх, + и2Дх, — яДхв + &,- □ (8.28) Здесь 1 / 9h„. дЛ_. \ я = Ьх]. -)—gj— Дх3 j [zi — hai ($>, i3)] -j- + 3^7 ДХ1 + Als) “ An2 *’B + + -Д- Д^8 (23 — X») + -г— Дг5 (z4 — i6). ° л-ф ддн Несмотря на громоздкость системы дифференциальных уравнений (8.28), их численное интегрирование в реальном времени вполне осуществимо в современных БЦВМ. Обратимся теперь к алгоритмическому модулю оптимального траекторного управления. При данной модели движения и алгоритме оценивания, а также критерии оптимизации типа (8.15) (обозначения, начиная с х7, не совпадают с принятыми в алгоритме оценивания) естественно использовать полученный выше алгоритм (8.17). Согласно теореме разделения входные сигналы для алгоритма оптимального траекторного управления должны выдаваться алгоритмом оптимального оценивания, а именно: ФВр = ф + Ф(/2-0 + 2'^+™ = = А + ^2 (<а - 0 + 27я^4- 1в) ’
U4 (<2 — <)2 Mlp = (<2 — 0 + -77г-----7"---— — 2 (Я3 + Н) cos ср х3 + («2 - 0 + 2^ + ^) cos ж, ’ //П|1 = н + н (<2 - о - 4- g («2 - О2 + 4~ & - О2 = = z6 + ze (Z2 — t)---^-g (t2 — О2 + Ц- “в (<2— 02. На выходе алгоритма (8.17) получаются задающие воздействия по перегрузкам («активным» ускорениям в связанной системе координат) и углам крена, тангажа и рысканья. Структура рассмотренного НК с оптимальным алгоритмическим обеспечением представлена на рис. 8.7. Рз ^3 *3 Рис. 8.7. Структура НК с оптимальным алгоритмическим обеспечением. Здесь ИС — платформенная инерциальная система, ДПП ДП2 — датчики навигационных геофизических полей, ДВ — датчик высоты над уровнем моря (может быть за-
428 АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ КОМПЛЕКСОВ (ГЛ. VIII менен радиовысотомером с внесением поправок за счет карты поля рельефа), ДК — датчик магнитного курса. Оценки отклонений гироплатформы Дфг, Д?г» могут использоваться не только в самом алгоритме (аналитический вариант), но и для реальной коррекции положения платформы («физический» вариант). Звездочками отмечены выходные величины НК, поступающие в пилотажную систему. Что касается величин, поступающих на систему индикации, то они па рис. 8.7 не обозначены. Как следует из изложенного, реализация подобного высокосовершенного алгоритмического обеспечения навигационных комплексов находится в пределах современных возможностей.
ПРИЛОЖЕНИЕ Беспоисковые алгоритмы КЭНС, использующие линейные ориентиры. КЭНС, использующие ориентиры в виде линий, представляют значительный практический интерес. Это видно, в частности, из того, что в традиционной неавтоматизированной навигации линейные ориентиры широко используются для решения различных навигационных задач. В общей классификации КЭНС (см. введение) этот вид навигационных систем следует отнести к классу КЭНС-П — системам, в которых рабочая информация практически мгновенно снимается с линейного множества точек навигационного ноля (точек, расположенных вдоль линии). Здесь синтезируется алгоритм КЭНС-П для случая измерения горизонтальной относительной дальности и азимута точек линейного ориентира в прямоугольной системе координат. Координаты линейного ориентира в прямоугольной горизонтальной земной системе координат обозначим хор (ф), 20р (ф), где Ф — параметр (азимут). Соответствующие координаты подвижного объекта (самолета) будут обозначаться через х(, — zc Компоненты путевой скорости измеряются с помощью тех или иных бортовых средств, у которых в первом варианте предполагаются лишь флуктуационные ошибки *1 = »х + Sxi, = ui Н" 5х»> где их, uz — точно известные сигналы измерителей, 5x1, 5x2 — некоррелированные белые шумы с интенсивностями Л'х1, Дж2. Измеряется горизонтальная дальность с флуктуационной ошибкой _____________________________ Ч == Ai + 5:1 = V 7*1 - *ор (Ф))2 + (*• ~ zoP (ф))2 + и текущий азимут с постоянной и флуктуационной ошибками __ х% — Z (ф) __ г2 = Л2 + 5г2 = <р0 (/) + Дф + 5.2 = arctg X1_XqV (у) + Дф + 52г> гДе фо (/) — заданная функция (программа сканирования но азимуту); 5:1» 5:2 — некоррелированные белые шумы с интенсивностями *^:i, *У:»; Дф — постоянная азимутальная ошибка. Принимая эту ошибку в качестве третьего компонента вектора состояния х3 = — Дф, записываем #=« + 5х, г = Л(х, *ор) + 5г, (1)
где xi X z, С Д<р и UZ • О V <1> — хор (<Р))2 + (*» — гоР (Ч>))2 *2-*Ор(<₽) . «гс1« X,-хор(ф) +*з (2) Матрица Якоби dhfdx, как легко проверить, имеет здесь вид д., дх — cos ср sin ф Р — sin ф cos ф — Р а®оР . а;ор cos(f~^T 8,,,<₽-7)ф_ sin ф ^рр : cos ф дгор р дф 1 р <Эф где р = V(хх — хор (Ф))2 + (хг — Zop (ф))2. Линейная независимость столбцов матрицы dh/dx способствует сходимости процессов оценивания для нелинейного фильтра Калмана и других субоптимальных алгоритмов. В данном случае такая линейная независимость имеет место, так как равенства — Aj cos ф — Aj sin ф + Xs (cos ф дхОр/дф + sin ф йгор/йф) =0, Aj sin ф — Aj cos ф + A3 (p — sin ф дхор/дф + cos ф dz /0ф) — 0 не могут удовлетворяться тождественно при постоянных A],A2,Ari, отличных от нуля. Субоптпмальный алгоритм оценивания типа нелинейного фильтра Калмана (первого приближения) имеет вид R + R ^[•Z —4 (£, xop)J, . dh dx (4) Матрица R, имеющая, строго говоря, случайные элементы (в силу нелинейности функции А), приближенно равна ковариационной (дисперсионной) матрице ошибок оценивания. Матрица dh \т dh ~ / dh \т dh di ) 2 di ~ ' dx ) dx согласно (3) равна а11 «12 «13 a12 n22 a23 > «IS «23 «S3
sin <p cos ф, где cos2 ф , sin2 ф au = 5 £ о2” zl oz«P 1 1 5zl “ ^р2 ( cos2<p ! sin2q> \ Эх0|, ‘ + V ) а<₽ “ /1 1 \ sin 2ф d*op sintp ~ ~ *Sz8P2 / 2 Эф + р5й sin2 ф cos2 <р а2* = _^Г"+^рг’ ( 1 1 \ sin2<p дхор “м= ~'ЛГ~^РГ/ 2 Эф / sin2<p cos2<p \ Эзор совф ~ \ &Z1 + ^гаР’ J P^rf Л sa " . „ a*op Чр Хв1п2ф-^--- 81П2ф СО82ф \/ 5гор У / 1 1 \ ’ "^"Д Эф ) -Ц szl - Sziffl I х 2 ( ^2ор . длор \ + ’^Р\СО8ф_аф-------------8,п<Р-Э^-р z2 Азимутальное сканирование, характеризуемое функцией ф0 (t), может выполняться весьма быстро, практически мгновенно (малое время цикла сканирования). Предполагая, что время оценивания существенно превышает время цикла сканирования, к ковариационному уравнению (5) с полным основанием можно применить метод усреднения, при котором I dh \т dh п R + Н НН Л7* Н = (6) \ дх / дх где чертой обозначено среднее по циклу азимутального сканирования. Допустим, что ось « земной системы координат ориентирована по заданному направлению полета (местная прямоугольная орто-дромическая система координат) и азимутальное сканирование выполняется в симметричном секторе ± Фт е равномерной скоростью ф0 = const в прямом и обратном направлениях. Тогда с учетом высокой скорости сканирования „ - „ - COS Ф an~0, O>s~0. «23 =~ ос >
При рассмотрении этих выражений следует иметь в виду, что величины sin <р cos <р з!пф зависят от формы линейного ориентира и, вообще говоря, но равны нулю. Однако, как видно из дальнейшего, их вес в общих результатах мал и ими можно пренебречь. Эти величины строго равны нулю для ориентиров, симметричных относительно оси х. В соответствии с указанным dh \т дх / dh дх СОЬаф В1П2ф ^'zl 1 z2‘jS о о в!паф cos2 ф cos<p ~ P5z2 О Итак, данная матрица ири указанных условиях имеет квази-диагональную структуру. Начальная матрица R (0) обычно задается диагональной, а матрица по условию диагональная. В соответствии с общим приемом декомпозиции матрица R ищется в квазидиагона льной форме: II «п 0 0 II R = 0 R%2 Rzz | • II 0 Rtl ^33 И Скалярная форма уравнения (6) приобретает вид . ( COS2 ф "П “Г I с \ Sin2<V _ Л’г2р2
Я23 sin3 ф cos* ф \ СОЗф „ 75^7) -^(^зз-Л|э) + / 1 / dp \« 1 \ + ( $л \ дф ) + Sti ) Я»3”38 ~ °’ Йя.,^+|^^2^ЛИДМ.(. + ('3^’('дф’) +6^)Л»з = 0, '•-* (7) Если можно принять СО8ф с- — О Р4 5г4 (») (в последней формуле, как и выше, черта обозначает усредненное значение всего выражения, над которым она поставлена), то существует решение Я23 (() = 0 и уравнения для дисперсий ошибок оценивания при этом решении становятся независимыми: Г 1 ( dp 1 1 , Дзз+|^гШ ’ ^]л»=°- <И) Решения уравнений (9), (10) имеют вид a 1/~ сгехр(2У~«А<)- 1 Здх V ft, С1еХр (2/JhM) 4-1 ’ 4 _ 1/ZZI с»ехР (SH’tM)"1 аД* F Ъг с, ехр (2 «,Ь2 Z)-| 1 где “1 = ^x1. "3 = ^x2, сов2ф з!п*ф _ sin3 ф соз3ф i', = '^r + 'V'’ bi=z~S^~ + ^~?~
— величины, принимаемые за время оценивания постоянными, _ Уъ + Уь^г (0) f‘“ y^-yb^iO) * Время t здесь отсчитывается от начала процесса оценивания; оДх (0), <тДг (0) — начальные среднеквадратические значения ошибок местоположения. Из формул (12) видно, что времена переходных процессов оценивания координат хг = хс, ха — zc имеют порядок соответственно _ 3 3 ‘ощ- 2/а^ ’ <оц2 ~ 2 Уа^2 ‘ Установившиеся значения дисперсий ошибок оценивания согласно (12) равны бдх^ощ) ~ Здх <°°)= ~ь^ ’ °Д? ^оца) ~ 3Дг (°°) = ~Ь^ • Предполагая теперь шумы £х1, £ж2, £2), £г2 не чисто белыми, а широкополосными, с конечными дисперсиями °6Vx =- °6V- °6Р’ °fl4 и достаточно малыми, но также конечными временами корреляции T4Vx = xt>Vz ~ X6V’ хбр’ тйч’ записываем al — aS = 3dVTdV' сов2ф sin2 <р Звртвр 56<pT6<(/J" sin2 <p t cos2 ф ^3 "= <> Л a • бдРТвр 3д<рТв<рР Полагая 66V = 10m/c, t6v = 0,4c, б6р = 30м, тбр = °>1с) 3д<р = 0,02, твф = 0,05с, р = 70 км, зш2ф — сов2ф -^0,5, находим аДх — 0Дг м> *ощ *ОЦ2 3’2 с’ Решение уравнения (И) имеет вид
Как видно из этой формулы, ошибка оценивания постоянной азимутальной погрешности сильно зависит от степени волнистости, «из-резанности» линейного ориентира, характеризуемой величиной (йр.'дф)2. Так, при ps \ дф / ^1, что соответствует сильно волнистому ориентиру, и указанных выше других параметрах ____ Даже при что отвечает сравнительно гладкому линейному ориентиру, n\q <zu) ~ 1,24-10‘3. Таким образом, КЭНС, использующие линейные ориентиры, могут обеспечивать высокую точность оценивания азимута, что является важным в ряде практических приложений (например, при заходе на посадку на стационарный аэродром, выставке инерциальных систем по азимуту в полете и др.). Структура основного блока. Основной блок (модуль) алгоритма оценивания (4) в полураскрытой непрерывной форме имеет вид — сое ф sin <р ' Р — sin<p - OP , . - op . cos <p - + sin <p x- 1 дф дф cos Ф P sintp 5acop , cos$ - -3 + — p a<p p 4p дф 5^- К - /(*c - *op (ф))* 4- (ге - *0|) (ф))2) 1 -ё—(Ч-Ф) ° rt , (13) где Ф = arctg *с-*ор (Ф) ^c-’opW Дф.
Соответствующая система обыкновенных дифференциальных уравнений третьего порядка численно интегрируется совместно с ковариационным уравнением (5) в БЦВМ в реальном времени. В качестве метода численного интегрирования может использоваться сиособ Рунге — Кутта или другой типовой метод. Однако реализация данного алгоритма в БЦВМ имеет ряд особенностей. В памяти БЦВМ должна храниться информация о линейном ориентире (ориентирах) в виде достаточно плотного ряда пар чисел хор, zop. Записать параметрическое представление ориентира хор (<р), zop (ф) заранее не представляется возможным, так как оно зависит от маршрута движения объекта и момента начала оценивания. Однако перед самым началом оценивания такое параметрическое представление производится (т. е. каждой паре чисел х0,(, zop приписывается третье число <р) на основе измерения zc, zc ф «грубой» навигационной системой. Далее на основе итерационного решения уравнения (13) зна- чение и параметрическое представление ориентира уточняются. Влияние постоянных ошибок измерения компонент путевой скорости. В предыдущем рассмотрении не учитывались постоянные ошибки Дих, Диг измерения составляющих путевой скорости. При наличии этих ошибок можно использовать по крайней мере два варианта учета. Первый из них заключается в синтезе нового алгоритма оценивания на основе расширения вектора состояния (включения в него Дих, Ди7) и, как правило, расширения вектора наблюдения. Последнее обычно оказывается необходимым для обеспечения линейной независимости новой матрицы dhjdx. Второй путь, ориентированный на заведомый отход от строгой оптимальности (которая, кстати сказать, все равно недостижима вследствие нелинейности задачи оценивания), заключается в применении прежнего алгоритма, синтезированного без учета постоянных ошибок. Если при этом влияние постоянных ошибок Дих, Дн7 находится в допустимых пределах, то такой вариант практически вполне приемлем. Рассмотрим этот вариант. Опуская флуктуационные ошибки, матрицу рассогласования представляем в форме “3^- [z, - |/ (£с — Хор (Ф))2 + (Zc — Zop (<p))2] 1 -С— («а - <Г) °z2 cosф sin® , / - ^®ор —с---Д*1 4- —?----— cos ф —— Дг1 Д21 \ <?ф sin ф . - —-----ДХ| + „ P‘?z2 P^zi , . - д“ор -|- sin ф —-7-d<f COS ф -------Д*« + sin ф diop Р ^ф СОЗф 5гор \ , ~ а' ) &хз р дф / (14)
где Дхх = Х1 — xt, Дх2 = х2 — х2, Дх3 = ф — ф — Дф - Дф. Вычитывая из (13) уравнение и2 + Д“г О *з п принимая во внимание (14), получаем Ail Дх2 - Л“х — д»2 -It Я12 7**22 7?1з 7*23 Дх, 0 b?3l 7<12 /<33 аИ 4" ОцД^2 “I" «13^3 «л Axj + «2аДх2 + о23Дх3 а, । Дх] -| а32Дх2 + а33Дх3 При изложенном выше предположении относительно быстрого азимутального сканирования применяем к этому уравнению метод усреднения: Дхх Дх2 Дх3 Ди2 О 7?и Т?]2 /f13 Л21 Я22 7/23 7?31 R31 7#м ajjAx] -’ п12Дх2 ' (ij Ах3 п12ДГ] | п22Дз2 |-а23^х., а1зА;Г1 I <12зД;г2 । н31Дх3 При прежних предположениях <Xj2 — 0, сцз — 0, сх23 — О, Т?]2 — 0, 7?j3 ~ О, Я23 —— О и для установившегося режима (приближенно) Дих. Ди2 ДХ1 = - - -- , Дх2, Дх3 = О, 77ц“п RnPn Эти формулы выражают установившиеся ошибки оценивания местоположения и азимута, вызванные постоянными ошибками измерения компонентов путевой скорости. В соответствии с выражениями (9), (10) и ранее использованными обозначениями эти формулы могут быть записаны в виде 57ХЯН ^х'Лх Axj — — —г-------= — —5------- Ж1 cavxTfiVx При указанных выше параметрах CfiVx — 6bVz = 10 М/С* x6Vx = X6Vz — с> бДх = бд2 = 9,2 м. Дих = Диг = 10 м/с, Axj = Дх2 = — 21 м.
Таким образом, постоянные ошибки измерения путевой скорости при данных условиях вызывают небольшие ошибки оценивания местоположения. Быстрое оценивание местоположения. В предшествующем аналитическом исследовании использовался метод усреднения, который основывается на предположении, что сканирование линейного ориентира осуществляется быстро в сравнении с общим процессом оценивания и поэтому используется несколько циклов сканирования. Хотя общее время оценивания при этом все же получается невысоким (выше было получено значение 3,2 с), в некоторых случаях желательно осуществлять оценивание местоположения за один цикл сканирования. Покажем, что это вполне возможно. Допустим, что флуктуационные ошибки измерения путевой скорости пренебрежимо малы (Sx = 0). Тогда уравнение (5) принимает вид Л- = 0. дх Это уравнение имеет решение „Г С I dh \т dh , I я«) = Я-’(0) + \ НН dt L J \ дх I дх J о Полагая, как и ранее, матрицу В (0) диагональной, получаем Ж0 = t °д! (°) + j* “nrf* *0 t о t J* CLl3,dt 0 t 0 t °Дг (°) “И J 0 t о j al3df о о *3^ (°) + f «W* 0 Как и ранее, будем предполагать быстрое сканирование с постоянной угловой скоростью в пределах угла + Фт, состоящее из двух полуциклов — прямого и обратного. Тогда sin*<p \ *ii ,(. , sin2q)»>\ •SrtP* ~ 4 2%п )’
aiSdt — 'n a^dt = о dtssO, sin (p P5Z2 cos* <p sin 2q>m ч 2<Pm ) ’ 'ц 1ч a^dt = — ^ 0 0 dt ss 0, COS ф P*^Z2 В соответствии с этим г / sin 2<pm \ t -i Здх <‘ц) ~ |_3дх (0) *Ь + 2<pm j 26'г1 J ’ г I sin 2<pm \ t -!-*/ 3az (*ц) ~ [3az (°) + (^ — 2<pm ] 2Stl ] ’ „ !« °Д«> (‘ц) ~ 3Д<р (°) + + ~s^ } (Эф ) л L о J Полагая «Ц = 1 с. <Fm “ л/4, Здх<°) = Зд2<°) = 3 000м, Зд<р(°)= 0.04, S,. = 302-0,1 м2-с, S,„ = (0,02)2-0,05с, --^ = 0,1, р = 70.10’м, р дф » » г » находим аДх = 10'5 м> адг «ц) = 23 М- °дф('ц) = 1>35-10-8- Итак, достаточно высокая точность обеспечивается и при «одноцикловом оценивании». Как видно из указанных предположений, аналитические оценки носят приближенный характер. Более точные результаты могут быть получены лишь путем численного моделирования.
ЛИТЕРАТУРА К введению 1. Медведев Г. А., Тарасенко В. П. Вероятностные методы исследования экстремальных систем.— М.: Наука, 1967. 2. Т а р а с е и к о В. П., Р а в о д и н О. М. Корреляционно-экстремальный координатор для речных и морских судов.— В кн.: Поиск экстремума.— Томск: Изд. ТГУ, 1969. 3. Тарасенко В.П. Проблемы синтеза и анализа корреляционно-экстремальных систем. I.— В кн.: Адаптивные автоматические системы.— М.: Сов. радио, 1972. 'ь Тарасенко В. П. Экстремальная система управления движением объекта по заданному курсу.— Труды III Всесоюзного совещания по автоматическому управлению (технической кибернетике).— В кн.: Оптимальные системы, статистические методы.— М.: Паука, 1967. 5. Белоглазов И. II., Тарасенко В. П. Корреляционно-экстремальные системы.— М.: Сов. радио, 1974. 6. Б е л о г л а з о в И. Н. Нелинейные эффекты в экстремальных корреляционных системах.— В кн.: Поиск экстремума.— Томск: Изд. ТГУ, 1969. 7. Beloglazov I.N. Syntheisis and Analysis of Correlative Extremum Systems. II.— Journal of Cybernetics, 1974, v. 4, pp. 92—117. 8. Белоглазов И. H. Ликвидация больших начальных отклонений в экстремальных корреляционных системах. Доклад на III Всесоюзном симпозиуме по экстремальным задачам.— Томск, 1967. 9. Б е л о г л а з о в И. Н., Вершинский А. В. Корреляционно-экстремальные и бесплатформенные системы навигации КЛА. — В кн.: Исследование космического пространства, т. 3,— М.: ВИНИТИ, 1972. 10. А л е к с о о в В. И., Кориков А. М., Половников Р. И., Тарасенко В. П. Экстремальная радионавигация.— М.: Паука, 1978. К главе I 1.1. Красовский А. А. Системы автоматического управления 'полетом и их аналитическое конструирование.— М.: Наука, 1973.
1.2. Красовским A. A. A New Solution to the Problem of a Control System Analytical Design.— Automatic.), 1971, № 1. 1.3. Коробков С. H. Некоторые вопросы аналитического конструирования управлении нелинейным объектом по критерию обобщенной работы.— Автоматика и телемеханика, 1974, № 4. 1.4. Вуков В. 11. Усовершенствованный алгоритм аналитического конструирования по критерию обобщенной работы.— Автоматика и телемеханика, 1974, № 4. 1.5. К а з а к о в И. Е. Статисти ескнй синтез управлений по квадратическому критерию обобщенной работы.— Автоматика и телемеханика, 1974, № 10. 1.6. К о ч е т к о в Ю. А. Об оптимальном управлении детерминированными системами.— Изв. АН СССР. Техническая кибернетика, 1976, № 1. 1.7. К р а с о в с к и й А. А. Об одном обобщении задачи аналитического конструирования систем управления.- В кп.: Проблемы управления и теории информации, 1976, № 5 (1). 1.8. Красовский А. А., Б у к о в В. Н., Ш о и др и к В. С. Универсальные алгоритмы оптимального управления непрерывными процессами.— М.: Паука, 1977. 1.9. К р а с о в с к и й А. А. Аналитическое конструирование контуров управления летательными аппаратами.— М.: Машиностроение, 1969. 1.10. Бонда рос Ю. Г., Ш а б лове кий В. К. Аналитическое конструирование контуров управления для дискретных систем с линейно-кусочными характеристиками.— Изв. АН СССР. Техническая кибернетика, 1974, № 1. 1.11. Бондарос Ю. Г. Аналитическое конструирование контуров управления для дискретных систем с полиномиальными характеристиками.— Изв. АН СССР. Техническая кибернетика, 1975, № 3. 1.12. Квакернаак X., С и в а н Р. Линейные оптимальные системы управления.— М.: Мир, 1977. 1.13. Брайсон А., Хо Ю-Ш и. Прикладная теория оптимального управления.— М.: Мир, 1972. 1.14. Казаков И. Е. Статистическая теория систем управления в пространстве состояний.— М.: Паука, 1975. 1.15. К а л и а и Р. Е., Б ь ю с и Р. С. Новые результаты в линейной фильтрации и теории предсказания. — В кв.: Техническая механика, 1961, Серия «Д», т. 83, № 1. 1.16. Медич Дж. Статистически оптимальные линейные оценки и управление.— М.: Энергия, 1973. 1.17. Острем К. Введение в стохастическую теорию управления.— М. :Мир, 1973. 1.18. Мерриам К. Теория оптимизации и расчет систем управления с обратной связью.— М.: Мир, 1967. 1.19. Красовский А. А. Адаптивный алгоритм субоптимального оценивания.— ДАН, 1976, т. 230, № 3. 1.20. Белгородский С. Л. Автоматизация управления посадкой самолета.— М.: Транспорт, 1972.
1.21. Красовский А. А. Субоптимальный алгоритм оценивания и идентификации непрерывных процессов.— ДАН, 1976, т. 231, № 4. 1.22. Красовский А. А. Нелинейная идентификация жестких подвижных объектов.— Труды VII Международного Конгресса ИФАК, Хельсинки, 1978. 1.23. Карапетян Р. М. О численном решении уравнений оптимальных коэффициентов в задачах аналитического | конструирования регуляторов.— Автоматика и телемеханика, 1971, № 12. 1.24. Коробков С. Н. Рационализация процедуры аналитического конструирования управлений для нелинейных объектов.— Автоматика и телемеханика, 1975, № 2. 1.25. Шендрик В. С. Синтез оптимальных управлений методом прогнозирующей модели,— ДАН, 1975, т. 224, Кг 3. 1.26. Красовский А. А., Шендрик В. С. Универсальный алгоритм оптимального управления непрерывными процессами.— Автоматика и телемеханика, 1977, № 2. 1.27. Красовский А. А. Динамика непрерывных самонастраивающихся систем.— М.: Физматгиз, 1963. 1.28. Кочетков Ю. А., Т о м ш и в В. К. Оптимальное управление детерминированными системами, описываемыми интегро-дифференциальными уравнениями.— Автоматика и телемеханика, 1978, К: 1. 1.29. Боголюбов Н. Н., Зубарев Д. Н. Метод асимптотического приближения для систем с вращающейся фазой и его применение к движению заряженных частиц в магнитном поле.— Укр. мат. журн., 1955, № 7. 1.30. Боголюбов Н. Н., Митропольский Ю. А. Асимптотические методы в теории нелинейных колебаний:— М.; Физматгиз, третье издание, 1963. 1.31. Крылов Н. М., Боголюбов Н. Н. Введение в нелинейную механику.— Киев.: Изд-во АН УССР, 1937. 1.32. Митропольский Ю. А. Метод усреднения в нелинейной механике.— Киев: Наукова думка, 1971. 1.33. Волосов В. М. Усреднение в системах обыкновенных дифференциальных уравнений.— УМН, 1962, 19, т. 6. 1.34. Волосов В. М. Некоторые виды расчетов в теории нелинейных колебаний, связанные с усреднением.— Журнал, вычисл. мат. и мат. физики, 1963, 3, т. 1. 1.35. Геращенко Е. Н., Геращенко С. М. Метод разделения движений и оптимизация нелинейных систем.— М.: Наука, 1975. 1.36. Винокуров В. И., В а к к е р Р. А. Вопросы обработки сложных сигналов в корреляционных системах,— М.: Сов. радио, 1972. 1.37. ТарасенкоВ. П. Применение оптических функциональных преобразователей для целей опознавания двумерных геометрических образов,— В кн. Труды СФТИ, вып. 44. Томск: Изд-во Томского ун-та, 1964. 1.38. К р а с о в с к и й А. А., П о с п е л о в. Г. С. Основы автоматики и технической кибернетики,— М.: Госэнергоиздат, 1962.
1.39. Б а к л и ц к и й В. К. Оптимальное измерение параметров оптического сигнала на фоне пространственно-временной помехи.— М.: Изв. вузов СССР. Радиоэлектроника, 1977, т. XX, № 9. 1.40. Василенко Г. И. Голографическое опознавание образов.— М.: Сов. радио, 1977. К главе II 2.1. Wald A. Statistical decision functions.—New Jork, 1950. 2.2. Миддлтон Д. Введение в статистическую теорию связи.— М.: Сов. радио, 1961—1962. 2.3. Ф е л ь д б а у м А. А. Теория дуального управления.— Автоматика и телемеханика, 1960, т. 21, № 9, № 11; 1961, т. 22, № 1, № 2. 2.4. А о к и М. Оптимизация стохастических систем.— М.: Наука, 1971. 2.5. Амиантов И. Н. Применение теории решений к задачам обнаружения сигналов и выделения сигналов из шумов.— М.: Изд. ВВИА им. Н. Е. Жуковского, 1958. 2.6. Фихтенгольц Г. М. Основы математического анализа, т. II.— М.: Гостехиздат, 1956. 2.7. Колмогоров А. Н. Основные понятия теории вероятностей,— М.: Наука, 1974. 2.8. Белоглазов И. Н. Рекуррентно-поисковые алгоритмы оценивания.— ДАН, 1977, т. 236, № 2. 2.9. Красовский Н. Н. Теория управления движением.— М.: Наука, 1971. 2.10. К а 1 m a n R. Е. New Methods in Wiener Filtering Theory. Proceedings of the First Symposium on Engineering Applications of Random Function Theory and Probability.— New Jork, John Wiley and Sons, Inc., 1963. 2.11. Me ditch J. S. Optimal Fixed-Point Continuous Linear Smoothing.—Proc. 1967 Joint Automatic Control Conf. University of Pensylvania, Philadelphia, June, 1967, p. 249. К главе III 3.1. Луговенко В. H. Статистический анализ аномального магнитного поля,— М.: Наука, 1974. 3.2. Шрейбман В. И., Жданов М. С., В и т в и ц-к и й О. В. Корреляционные методы преобразования и интерпретации геофизических аномалий.— М.: Недра, 1977. 3.3. Солодовников В. В. Введение в статистическую динамику систем автоматического управления.— М.— Л.: Гостехиздат, 1952. 3.4. Б е н д а т Дж. Основы теории случайных шумов и ее приложения,— М.: Наука, 1965. 3.5. Мещеряков Ю. А, Рельеф СССР.— М.: Мысль, 1972. 3.6. К о с о в Б. Ф., Константинова Г. С. Составление карты овражности СССР.— Вестник МГУ, сер. «Географи-ческая», 1970, № 2.
3.7. Николаевская Е. М. Морфометрический анализ За падно-Сибирской равнины. Геоморфология, 1970, № 4. 3.8. Я н о в с к и й Б. М. Земной магнетизм, ч. 1, Морфология и теория магнитного поля Земли и его вариации.— Л.: Изд. ЛГУ, 1964. 3.9. Г р у ш и н с к и й Н. П. Теория фигуры Земли.— М.: Физматгиз, 1963. 3.10. НдельсопН. И. Теория потенциала и ее приложения к вопросам геофизики.— М.— Л.: ГТТИ, 1932. 3.11. Веселов К. Е., Сагитов М. У. Гравиметрическая разведка.— М.: Недра, 1968. 3.12. Груш и и с к и й П. П., С а ж и н а Н. Б. Гравитационная разведка.— М.: Недра, 1972. 3.13. Михлин Б. 3., Селезнев В. П., Селезнев А. В. Геомагнитная навигация.— М.: Машиностроение, 1976. 3.14. Д у б о ш и н Г. И. Небесная механика. Основные задачи и методы.— М.: Паука, 1968. 3.15. Петровский И. Г. Лекции об уравнениях с частными производными.— М.: Гостехиздат, 1953. 3.16. Винц Б. Д., Почтарев В. И., Рахмату-л и н Р. Ш. Методика расчета магнитного поля Земли вверх в приземном пространстве.— Геомагнетизм и аэрономия, 1970, т. X. 3.17. Адам И. В., Б е п ь к о в а II. П., Орлов В. П. и др,— Геомагнетизм и аэрономия, 1963, т. III, с. 336. 3.18. Cain J. С., II е n d г i с k s I., Lange 1 В. А., Н u risen W. V.— Geomagn. and Geoelectr., 1967, т. 19, № 3. 3.19. Снеддон II. Преобразования Фурье.—М.: ИЛ, 1955. 3.20. Гладки й К. В. Гравиразведка и магниторазведка.— М.: Недра, 1967. 3.21. Андреев В. Д., Теория инерциальной навигации. Авто-[номные системы.— М.: Наука, 1966. 3.22. Инерциальные системы уиравления/Под редакцией Д. Питтмана.— М.: Воениздат, 1964. К главе IV 4.1. К р а с о в с к и й А. А. Оптимальная фильтрация в теории корреляционно-экстремальных систем.— Изв. АН СССР. Техническая кибернетика, 1976, № 3. 4.2. Белоглазов И. II. Оптимальная фильтрация в корреляционно-экстремальных системах, использующих изображения местности.— Изв. АП СССР. Техническая кибернетика, 1977, № 2. 4.3. Ч и г и н Г. П. Моделирование оптимальной корреляционноэкстремальной системы. — Изв. АН СССР. Техническая кибернетика, 1978, № 2. 4.4. Красовский А.А., Чигин Г. П. Об одном алгоритме оптимального оценивания.— В кн.: Научно-методические материал!! по исследованию алгоритмов корреляционно-экстремальных систем.— М.: Изд. ВВИА нм. Н. Е. Жуковского, 1975.
4.5. Красовский А. А., Д ж а и д ж г а в а Г. И., Ч it-ги и Г. П. Синтез комплексных систем оценивания высоты.— В кн.: Научно-методические материалы по исследованию алгоритмов корреляционно-экстремальных систем.— М.: Изд. ВВИА им. Н. Е. Жуковского,1975. 4.6. К р а с о в с к и й А. А. Субоптимальный алгоритм оценивания координат подвижного] объекта.— Изв. ЛИ СССР. Техническая кибернетика, 1978, № 4. 4.7. Klass Ph. J. New Guidance Technique Being Tested.— Aviation Week, 25/11, 1974, v. 100, № 8, p. 48—51. 4.8. Джанджгава Г. И., Ягупов Ю. Д. Рекурсивное оценивание местоположения подвижного объекта в физическом поле,— В кн.:Научно-методические материалы по исследованию алгоритмов корреляционно-экстремальных систем.— М.: Изд. ВВИА им. Жуковского, 1975. 4.9. Попов Е. И. Измерение силы тяжести на подвижном основании.— М.: Наука, 1968. 4.10. Лозинская А. М. Наставление по гравиметрической съемке с борта самолета.— М.: ВНИИГеофизика, 1973. 4.11. Иванов М. М. Магнитные съемки океанов.— М.: Наука, 1966. 4.12. Сейдж Э.,Мелс Дж. Теория оценивания нее применение в связи и управлении.— М.: Связь, 1976. 4.13. Инерциальная навигация/Под редакцией К. Ф. О’Доннела.— М.: Наука, 1969. 4.14. Андреев В. Д. Теория инерциальной навигации (Корректируемые системы).— М.: Наука, 1967. 4.15. Moritz Н. Kinematical Geodesy.— Munchen, 1968. 4.16. Дмитриев С. П., Ш и м е л о в и ч Л. И. Обобщенный фильтр Калмана с многократной линеаризацией.— Автоматика и телемеханика, 1978, № 1. 4.17. Белоглазов И. Н., Ермилов А. С. Оценивание пространственного) положения движущегося объекта в беспоисковых корреляционно-экстремальных навигационных системах.— В кн.: Системы управления.— Томск, 1978. К главе V 5.1. Белоглазов И. Н. Оптимальные алгоритмы и достижимая точность корреляционно-экстремальных систем.— В кн.: Научно-методические материалы по исследованию алгоритмов корреляционно-экстремальных систем,—М.: Изд. ВВИА им. Н. Е. Жуковского, 1975. 5.2. Г и х м а н И. II., Скороход А. В. Введение в теорию случайных процессов.— М.: Наука, М., 1965. 5.3. Пугачев В. С. Теория случайных функций и ее применение к задачам автоматического управления.—М.: Гостех-издат, 1957. 5.4. Халмош П. Р. Лекции по эргодической теории.— М.: ИЛ, 1959. 5.5. Белоглазов И.Н. Оптимальные алгоритмы оценивания местоположения и скорости движущихся объектов в
корреляционно-экстремальных системах.— Вкн.: Научно-методические материалы „о исследованию алгоритмов корреляционно-экстремальных систем.—М.: Изд. ВВИА]им. Н. Е. Жуковского, 1975. 5.6. Белоглазов И. Н. Оценка .точности корреляционноэкстремальных систем в некоторых частных случаях.— В кн.: Корреляционно-экстремальные системы обработки информации и управления,— Томск: Изд. ТГУ, 1975. 5.7. Белоглазов И. II. Проблемы синтеза и анализа корреляционно-экстремальных систем.— В кн.:; Адаптивные автоматические системы. Под редакцией Г. А. Медведева.— М.: Сов. радио, 1972. 5.8. Белоглазов И.Н. Оптимальные алгоритмы корреляционно-экстремальных систем, использующих одновременно несколько полей.— В кн.: Научно-методические материалы ио исследованию алгоритмов корреляционно-экстремальных систем.— М.: Изд. ВВИА им. Н. Е. Жуковского, 1975. 5.9. Лоэв М. Теория вероятностей.— М.: ИЛ, 1962. К главе VI Белоглазов И. Н., Ермилов А. С., Карпен-6.1. к о Г. И. Рекуррентно-поисковое оценивание и синтез алгоритмов корреляционно-экстремальных навигационных систем.— Автоматика и телемеханика, 1979, № 7. 6.2. О с т о с л а в с к и й И. В., Отражена И. В. Динамика полета.— М.: Оборонгиз, 1969. 6.3. Г а и т м а х ер Ф. Р. Теория матриц.— М.: Наука, 1970. 6.4. Белоглазов И.Н., Ермилов А. С. О возможности использования рекуррентно-поискового оценивания для коррекции инерциальных систем по полю рельефа.— Приборостроение, 1979, № 12. 6.5. Система управления для полета на предельно малых высотах с отслеживанием рельефа местности.— Экспресс-информация, Авиастроение, 1977, № 40. 6.6. Funk James Е. Optimal-path precision terrain following system. Proc. AIAA Guidance and Contr. Conf., San Diego, Calif., 1976, S. I. 1976, 383-390. 6.7. Родс Д. P. Введение в моноимпульсную радиолокацию.— М.: Сов. радио, 1960. 6.8. Бородин В. Т., Рыльский Г. И. Управление полетом самолетов и вертолетов.— М.: Машиностроение, 1972. 6.9. Исследование законов управления объединенной двухканальной системы отслеживания рельефа местности.— Экспресс-информация, Авиастроение, 1976, № 6. 6.10. Селезнев В. П. Навигационные устройства.— М.: Машиностроение, 1974. 6.11. Колчинский В. Е., Мандуровский И. А^, Константиновский М. И. Допплеровские устройства и системы радионавигации.— М.: Сов. радио, 1975.
К главе VII 7.1. Я м а м ото Дж., Браун Дж. Расчет, моделирование и оценка фильтра Калмана, используемого для начальной выставки инерциальной системы ракеты SRAM. AIAA Guidance, Control and Flight Mechanics Conference, New York, 16—18 Aug. 1971. AIAA Paper, № 71-948, p. 1—9. 7.2. Байбородин Ю. В., Драпкин В. В., Сиенко вс к и и Е. Г., У н г у р я н С. Г. Бортовые системы управления полетом.— М.: Транспорт, 1975. 7.3. Белоглазов И. Н. Синтез корреляционно-экстремальной инерциальной системы по критерию обобщенной работы.— ДАН, 1976, т. 231, № 2. 7.4. Цыпкин Я. 3. Теория линейных импульсных систем.— М.: Физматгиз, 1963. 7.5. Теория автоматического регулирования/Под редакцией В. В. Солодовникова. Книга 2. Анализ и синтез линейных непрерывных и дискретных систем автоматического регулирования.— М.: Машиностроение, 1967. 7.6. Солодов н^и ков В. В. Статистическая динамика линейных систем автоматического управления.— М.: Физматгиз, 1960. 7.7. Маркушевич А. И. Теория аналитических функций.— М.: Гостехиздат, 1950. 7.8. Бахшиян Б. Ц. Метод решения комбинаторных задач космической навигации.— М.: ИКИ АН СССР, Пр.-227, 1975. К главе VIII 8.1. Справочник летчика и штурмана,— М.: Воениздат, 1974. 8.2. Василинин В. Н. Автоматизированное вождение тяжелых самолетов,— М.: Воениздат, 1973. 8.3. Петров Б. Н., Красовский А. А., Попов 3. П., Раушенбах Б. В. Научные проблемы управления летательными аппаратами, Вестник АН СССР, 1970, № 1. 8.4. Михалев И. А., О к о е м о в Б. Н. и др. Системы автоматического и директорного управления самолетами.— М.: Машиностроение, 1974. 8.5. Ф е д о р ов С. М., Драбкин В. В. и др. Автоматизированное управление самолетами и вертолетами.— М.: Транспорт, 1977. 8.6. К и р с т М. А. Навигационная кибернетика полета.— М.: Воениздат, 1971.