/
Текст
В. Н. Буков
Адаптивные
прогнозирующие
системы
управления
полетом
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1987
ББК 32.965.5
Б 90
УДК 629.7.05
Буков В.Н. Адаптивные прогнозирующие системы управления
полетом. — М.: Наука. Гл. ред. физ.-мат. лит., 1987. — 232 с.
Рассматриваются алгоритмы адаптивного управления динамическими про-
цессами, основанные на сочетании синтеза оптимального управления с исполь-
зованием прогнозирующих моделей и оценивания в реальном масштабе време-
ни параметров управляемого процесса. Они позволяют в наиболее полном
объеме и в естественной форме учесть при синтезе управления как априорную,
так и получаемую в процессе функционирования системы информацию о
динамических свойствах объекта. Управление существенно нелинейным про-
цессом осуществляется без обязательных упрощений их моделей. Возможный
круг использования предлагаемых адаптивных прогнозирующих систем
значительно шире рассматриваемых задач управления полетом и охватывает
абсолютное большинство технологических процессов, задач управления под-
вижными объектами и пр.
Для специалистов в области управления допетом и общей теории управ-
ления.
Табл. 3. Ил. 47. Библиогр. 137 назв.
Рецензент
член-корреспондент АН СССР А. А. Красовский
1502000000-018
Б--------------г146-87
053 (02)-87
© Издательство "Наука”.
Главная редакция
физико-математической
литературы, 1987
ОГЛАВЛЕНИЕ
Предисловие........................................................... 5
Глава!
Развитие техники управления летательными аппаратами................... 8
§ 1.1. Перспективы и проблемы развития техники управления летательными
аппаратами............................................................ 8
§ 1.2. Концепция адаптивного управления полетом...................... 13
§ 1.3- Облик многопараметрических адаптивных оптимальных систем управ-
ления полетом....................................................... 17
Г л ав а2
Математические модели движения жесткого самолета..................... 24
§ 2.1. Рулевые органы самолета и системы координат................... 24
§ 2.2. Полная нелинейная модель пространственного д вижения самолета .... 29
§ 2.3. Упрощенные нелинейные модели движения самолета................ 38
§ 2.4. Линейные модели движения самолета .......................... 45
§ 2.5. Модели пилотажных датчиков и рулевых приводов................. 53
Глава 3
Аналитическое конструирование оптимальных регуляторов.................56
§ 3.1. Критерии оптимальности управления............................. 56
§ 3.2. Методы аналитического конструирования......................... 60
§ 3.3. Алгоритмы с прогнозированием при управлении положением рулевых
органов.............................................................. 66
§ 3.4. Алгоритмы с прогнозированием при управлении скоростью перемеще-
,ния рулевых органов................................................. 71
§ 3.5. Дискретное управление непрерывными процессами................. 77
§ 3.6. Асимптотический метод аналитического конструирования.......... 81
Гл ав а4
Некоторые свойства управления, оптимального по критерию А.А. Красовского 84
§ 4.1. Общее решение задачи управления линейным процессом при квадратич-
ном функционале...................................................... 84
§ 4.2. качество управляемого движения................................ 88
§ 4.3. Статические свойства управляемого движения.................... 91
§ 4.4. Статистические свойства управляемого движения ................ 96
Гл ав а5
Алгоритмическое обеспечение оптимизации управления с использованием
прогнозирующей модели . ............................................ 104
§ 5.1. Декомпозиция процессов управления............................ 104
§ 5.2. Непрерывное управление на пилотажном уровне.................. 113
§5.3 Релейное управление на пилотажном уровне...................... 122
§ 5.4. Траекторное управление с локальной оптимизацией.............. 127
1* 3
§ 5.5. Траекторное управление с оптимизируемой протраммой.......... 134
§ 5.6. Траекторное управление с контрольными сечениями............ 141
§ 5.7. Автоматы ограничений с прогнозированием..................... 145
§ 5.8. Управление с линейной прогнозирующей моделью................. 152
Главаб
Конкретные применения алгоритмов управления с прогнозированием..... 155
§ 6.1. Управление продольным короткопериодическим движением на основе
алгоритма с численным дифференцированием............................ 155
§ 6.2. Управление продольным короткопериодическим движением на основе
алгоритма с аналитическим решением.................................. 163
§ 6.3. Управление пространственным движением летательного аппарата. 167
§ 6.4. Обеспечение поперечной управляемости самолета на больших углах
атаки. . ........................................................... 173
§ 6.5. Автоматизация выдерживания ограничений....................' 179
§ 6.6. Обеспечение устойчивости самолета на больших углах атаки..... 184
§ 6.7. Двухуровневое управление геометрической высотой полета....... 185
§ 6.8. Управление разгоном и подъемом самолета...................... 190
Глава?
Параметрическая идентификация и адаптивное управление с прогнозирова-
нием ............................................................. 193
§ 7.1. Теорема разделения для задачи адаптивного управления......... 193
§ 7.2. Идентификация при точном измерении компонент состояния объекта . . 197
§ 7.3. Текущая идентификация в адаптивной системе управления.. . 202
Приложение!
Операции матричного дифференцирования............................... 211
Приложение II
Формулы частных производных закона управления с прогнозированием... 214
П р и л о ж «Гн и е III
Аэродинамические характеристики гипотетического самолета............ 219
Основные обозначения.............................................. 220
Аббревиатуры........................................................ 221
Список литературы................................................... 222
Предметный указатель................................................ 229
ПРЕДИСЛОВИЕ
Интенсивное развитие и широкое внедрение микропроцессорной вычи-
слительной техники открывают новые, недоступные ранее перспективы
создания авиационной техники в целом и систем управления полетом в
частности. При этом возрастает значение средств автоматизации управления
полетом в достижении требуемых свойств летательных аппаратов, эффек-
тивности их использования и безопасности выполнения полетов. Все настоя-
тельнее перед авиационными специалистами встает вопрос создания много-
функциональных оптимальных систем управления движением летательного
аппарата, обладающих развитыми свойствами адаптации к изменяющимся
в широких диапазонах условиям полета, возникновению непредвиденных
или маловероятных ситуаций.
В книге рассматриваются принципы построения и прикладная теория
адаптивных систем управления, основанных на сочетании процедур оптималь-
ного оценивания параметров (идентификации) и состояния (фильтрации)
управляемого процесса с процедурами оптимизации управления с использо-
ванием прогнозирующих моделей. Такие системы именуются адаптивными
прогнозирующими системами (АПС). И хотя область возможного приме-
нения АПС значительно шире представленной в книге, здесь речь идет
только о системах автоматического (автоматизированного) управления
полетом.
Сама идея сочетания в адаптивной системе оптимального (субоптималь-
ного) оценивания и оптимального управления известна достаточно давно
и получила широкое распространение среди исследователей. Основной
отличительной особенностью рассматриваемых здесь алгоритмов является
использование прогнозирующих моделей, которые предназначены для
воспроизведения ’’возможного будущего” движения управляемого объекта
при фиксированных управляющих и возмущающих сигналах. Сразу же
оговоримся, что такое прогнозирование является условным и не преследует
цель ’’точного предвидения” будущих состояний, а лишь обеспечивает
численное получение требуемого решения оптимизационной задачи.
Рассматриваемый здесь метод прогнозирующей модели является одним
из вариантов оптимизации управления динамическими объектами по пред-
ложенному А.А. Красовским критерию обобщенной работы. И хотя этот
метод сравнительно молод (первая публикация относится к 1975 году),
он уже завоевал внимание широкого круга специалистов и продемонстри-
ровал работоспособность и эффективность при решении различных доста-
точно сложных задач управления движущимися объектами и технологичес-
кими процессами. Это связано с уникальной возможностью управления
существенно нелинейными процессами, когда для формирования управле-
5
ния не требуются какие-либо принципиальные упрощения и аппроксимации
характеристик объекта. Конечно, имеются еще вопросы, требующие даль-
нейшего исследования. Прежде всего к ним относятся вопросы текущей
идентификации, вопросы использования неквадратичных функционалов
и пр.
Данная книга представляет собой некоторое обобщение результатов
исследований в области создания прикладной теории адаптивных прогно-
зирующих систем и их использования в задачах управления движением
летательных аппаратов.
Первая глава посвящена обоснованию перспективности адаптивного
управления полетом. Здесь содержится краткий анализ основных современ-
ных проблем развития техники управления летательными аппаратами,
излагаются существо и цели адаптивного управления полетом, приводятся
некоторые обобщения распространенных в публикациях подходов к пост-
роению адаптивных систем управления. Глава заканчивается описанием
облика многопараметрических адаптивных оптимальных систем с иденти-
фикацией и оптимизацией.
Во второй главе излагаются математические модели движения жесткого
самолета, рассматриваемого как объект управления. Изучаются модели
различной сложности: от полной нелинейной (различные варианты) до
простейшей линейной второго порядка. Значительное внимание уделяется
моделированию пространственного движения самолета.
Третья глава содержит основные теоретические результаты аналитическо-
го конструирования регуляторов в формулировке А.А.Красовского. Для
сравнения приводятся некоторые положения метода аналитического конст-
руирования регуляторов в формулировке Летова — Каймана. Подробно
излагаются различные варианты алгоритмов с прогнозирующими моделя-
ми, обсуждаются вопросы, связанные с квантованием и запаздыванием
сигнала управления, а также с обобщением на задачи с функционалом,
отличающимся от критерия обобщенной работы.
В четвертой главе аналитически рассматриваются некоторые характер-
ные свойства оптимального управления, сформированного на основе
предлагаемых алгоритмов. Анализ проводится на примере управления
линейным объектом при квадратичном функционале. Хотя круг рассматри-
ваемых здесь объектов существенно ^же области возможного применения
алгоритмов управления, результаты анализа позволяют оценить ряд их
важных свойств.
Пятая глава книги содержите основном оригинальный материал, связан-
ный с разработкой алгоритмического обеспечения различных подсистем
управления полетом. Здесь в широкой постановке обсуждаются вопросы
декомпозиции процесса управления для данного класса алгоритмов. Для
пилотажного уровня, т.е. для наиболее низкого уровня в рассматриваемых
задачах, предлагаются алгоритмы непрерывного и релейного оптимального
управления с прогнозированием. Для траекторного уровня, представляю-
щего собой более высокий уровень в иерархии управления полетом, предла-
гаются алгоритмы двух типов: с локальной оптимизацией, когда оптими-
зируется траектория в сравнительно небольшой окрестности текущего
состояния летательного аппарата, и с оптимизируемой программой, когда
оптимизируется траектория, описываемая предварительно с помощью
6
специально выбранных функций. Отдельно рассматриваются задачи траек-
торного управления, для которых характерны так называемые контроль-
ные сечения, т.е. некоторые области пространства (или различных подпрост-
ранств), прохождение через которые траекторий движения летательного
аппарата регламентируется особо. Глава завершается рассмотрением авто-
матов выдерживания заданных ограничений на движение летательного
аппарата и способа упрощения алгоритмического обеспечения АПС за счет
использования линейных прогнозирующих моделей.
В шестой главе приводятся некоторые результаты численного исследова-
ния АПС в различных задачах управления полетом.
Седьмая глава посвящена изложению отдельных вопросов идентифика-
ции в АПС. С помощью теоремы предельного разделения обосновывается
допустимость автономного синтеза процедур оценивания и управления.
Излагаются алгоритмы оптимального (в смысле минимальных ковариаций
ошибок) оценивания параметров объекта управления при различном уров-
не учета особенностей его модели.
Книга имеет прикладную направленность и рассчитана на инженеров,
научных работников и студентов, специализирующихся в области автома-
тического управления.
Глава 1
РАЗВИТИЕ ТЕХНИКИ УПРАВЛЕНИЯ
ЛЕТАТЕЛЬНЫМИ АППАРАТАМИ
Глава содержит краткий анализ некоторых перспектив развития борто-
вых систем управления летательными аппаратами, основанный на работах
отечественных и зарубежных специалистов. Освещается проблема адаптив-
ного управления движением летательных аппаратов и приводится общая
структура адаптивной оптимальной системы управления полетом, исполь-
зующей текущую идентификацию динамических характеристик управляе-
мого процесса.
§1.1. Перспективы и проблемы развития техники управления
летательными аппаратами
Всякий летательный аппарат (ЛА) может быть охарактеризован по край-
ней мере с двух сторон. С одной стороны, о нем можно говорить как о
средстве транспортирования различных грузов. В этом случае внимание
сосредоточивается на таких данных ЛА, как дальность полета, платная
нагрузка, маневренность, ресурс, комфорт и т.д. Эти данные представляют
собой летно-технические характеристики ЛА [1.1]. С другой стороны, ЛА
можно рассматривать как объект управления. При этом для пилотируемых
ЛА определяются простота и удобство пилотирования или управления
движением, возможность эффективного выполнения полетного задания,
безопасность полета и т.д. Указанные свойства суть пилотажные характери-
стики ЛА [1.2, 1.3]. Естественно, что улучшение летно-технических и
пилотажных характеристик ЛА тесно связано с прогрессом авиационной
техники.
На первых этапах развития авиации достижение требуемого уровня
названных характеристик обеспечивалось улучшением двигателей, аэроди-
намики, конструкции и материалов ЛА. Но уже в 30-х годах появляются
и быстро распространяются бортовые средства автоматики [1.3 — 1.5],
на которые возлагается задача улучшения пилотажных характеристик
самолетов. При этом круг функций, выполняемых средствами автоматики,
постоянно расширяется. В результате существенно облегчается пилотирова-
ние самолета на маршруте, автоматизируется управление движением ЛА
на различных этапах полета.
В то же время стремление достичь наиболее высоких летно-технических
характеристик заставляет изыскивать все новые возможности комплексно-
го совершенствования ЛА. Быстрое развитие авиационного электронного
оборудования привело к тому, что начиная с 70-х годов перспективы
значительного улучшения летно-технических характеристик стали связы-
ваться с более рациональным распределением различных функций между
8
Рис. 1.1. Расширение эксплуатационных
областей легких самолетов: I, П, Ш —
условные номера поколений
аэродинамикой, конструкцией, дви-
гателем и техническими средства-
ми управления полетом. При этом
за счет расширения функции бор-
товых средств удается существенно
снизить веса и габариты силовых
элементов конструкции ЛА, умень-
шить энергетические потери, связан-
ные с выполнением полета, что в
свою очередь позволяет повысить
дальность полета, платную нагрузку
и другие летно-технические характе-
ристики ЛА. Соответствующая идеология известна как идеология активно-
го управления ЛА и получила распространение в литературе [1.6—1.8]. Учет
возможностей управления на ранних стадиях проектирования ЛА приводит
к концепции, согласно которой аэродинамическая компоновка определя-
ется требованиями и возможностями управления [1.7].
Эволюция летно-технических характеристик ЛА, прогресс авиационной
техники можно интерпретировать как расширение эксплуатационных
областей в пространствах состояний (в общем случае многомерных) с
одновременным повышением надежности, точности и безопасности выпол-
нения полетных заданий.
Эксплуатационные области пространства состояний ЛА назначаются
из соображений сохранения высокой эффективности ЛА в решении постав-
ленных задач и обеспечения необходимого уровня безопасности полета.
Некоторые сечения пространства состояний являются общепринятыми для
задания и иллюстрации наиболее важных летных ограничений. К ним отно-
сится показанная на рис. 1.1 плоскость ’’высота — число Маха” (отношение
воздушной скорости полета ЛА к скорости звука на данной высоте полета).
Переход от одного поколения ЛА к другому и даже эволюция одного поко-
ления в процессе модификаций, как правило, сопровождаются расширени-
ем эксплуатационных областей. Это иллюстрируют (чисто качественно)
области I—III. Здесь же показаны значения скоростного напора q (давления,
создаваемого набегающим воздушным потоком), широкий диапазон
изменения которого в значительной степени определяет широкие диапазоны
изменения динамических свойств ЛА.
Расширение эксплуатационных областей может быть достигнуто, в част-
ности, применением средств адаптации (т.е. приспособления к условиям
полета) аэродинамических форм ЛА и силовой установки: развитием
механизации крыла, применением крыла изменяемой стреловидности,
выпускаемых органов управления, органов непосредственного управления
аэродинамическими силами, разработкой адаптивного крыла, применением
управления входными и выходными устройствами силовой установки.
Эволюцию средств адаптации конструкции самолета и его силовой установ-
ки иллюстрирует рис. 1.2, содержащий далеко не полный перечень техни-
9
гоняемый вектор тяги
непосредственное
управление силами
ХАдаптивное крыло
I выпускаемые органы управления
Крыло изменяемой стреловидности
Механизация входных и выходных устройств
[уддраемые шасси
I Щитки-закрылки
----fJ---,-----1 |-----1-----|-----1--------'-------------
1930 1950 1970 1990 Годы
Рис. 1.2. Эволюция средств адаптации конструкции ЛА и его двигателя
ческих решений, способствовавших достижению высоких летно-техни-
ческих характеристик [1.9].
В то же время эти средства и органы адаптации управляются пока в
основном вручную или автоматически по жестко заданным программам
в зависимости от времени или параметров полета. Ручное управление резко
ограничено психофизиологическими возможностями человека, а автомати-
ческое управление по заданной жесткой программе не реализует обширных
возможностей адаптации и автоматизации.
Таким образом, эволюция средств адаптации ЛА и силовых установок
вступает в противоречие с методами управления. Эксплуатационные диапа-
зоны изменения характеристик современных и особенно перспективных ЛА
настолько широки, что неадаптивное или ограниченно адаптивное (с само-
настройкой небольшого числа передаточных чисел) управление становится
все более затруднительным.
Когда говорят о широте эксплуатационных областей ЛА, обычно в
основном имеют в виду [1.1] широкие диапазоны изменения высот, чисел
Маха, скоростного напора (см. рис. 1.1). Однако надо отметить, что сопро-
вождающие расширение этих областей адаптация конфигурации ЛА, стати-
ческие упругие деформации крыла и других элементов конструкции
в свою очередь вызывают изменения свойств ЛА как объектов управления,
усиливая потребность в адалтативном управлении. Чрезвычайное разнообра-
зие и сильное влияние внешних подвесок, необходимость обеспечения
управления в условиях отказов части агрегатов управления и повреждений
ЛА требуют адаптации и даже самоорганизации системы управления. Хотя
учет всех факторов (кроме, вероятно, повреждений) может осуществлять-
ся путем контроля происходящих изменений в компоновке планера и
контроля режима полета с последующей корректировкой передаточных
чисел системы управления, трудно ожидать достаточно полной реализации
такого решения. Это объясняется как необходимостью контроля и учета
большого числа факторов, так и исключительно высокой потребной
памятью БЦВМ.
В связи с указанными выше факторами увеличивается разнообразие
характеристик ЛА как объекта управления. Даже для жесткого маневрен-
ного самолета минимальное число параметров нелинейной математической
модели пространственного движения составляет десятки, а с учетом аэро-
10
автоупругости — сотни [1.10]. Для систем автоматического управления
с ограниченными функциями управления полетом, заведомо не включаю-
щими задачи активного управления, число режимов работы, количество
контролируемых передаточных чисел и общее число контролируемых
параметров неуклонно увеличиваются. Возрастание сложности типовых
(1-6) систем автоматического управления самолетов II и III поколений
иллюстрирует рис. 1.3. Проектирование и испытание неадаптивных САУ
в этих условиях недопустимо затягиваются (даже с внедрением систем
автоматизированного проектирования — САПР), а номенклатура неадап-
тивных САУ увеличивается.
Обеспечение многомерных ограничений вырастает в самостоятельную
острую проблему, которая не может быть решена без адаптации. Дело
в том, что ’’точные” и ’’истинные” ограничения существуют в многомерном
пространстве сЬстояний, имеют сложную форму и изменяются при смене
подвесок, конфигурации, повреждениях. От того, насколько полно исполь-
зуются разрешенные или допустимые области, непосредственно зависят
летно-тактические возможности ЛА. С другой стороны, приближение к
границам областей, вообще говоря, связано с ростом вероятности воз-
никновения опасных ситуаций. В то же время реальные возможности
летчика уверено контролировать и выдерживать различные ограничения
существенно ограничены. Для известных неадаптивных автоматов безопа-
сности (средств предотвращения нарушения границ эксплуатационных
диапазонов параметров полета) характерны, во-первых, небольшое число
ограничиваемых параметров, а во-вторых, жесткость программ работы,
что снижает достигаемый эффект автоматизации выдерживания ограниче-
ний. Противоречие между полнотой использования возможностей техники
и безопасностью полета .может быть решено только на основе высокосовер-
шеиных адаптивных многопараметрических автоматов ограничений.
Принципиально новые возможности открываются перед системами
управления полетом с внедрением достаточно развитых бортовых цифро-
вых вычислительных систем (БЦВС). Использование БЦВС [1.11—1.13] для
обработки информации, управления и контроля имеет целый ряд преиму-
ществ по сравнению с аналоговой техникой:
— уменьшение числа элементов оборудования (одна или несколько
однотипных электронных вычислительных машин могут обеспечить реше-
ние всех задач управления движением ЛА);
Рис. 1.3. Сравнение сложности неадаптивных САУ
11
— гибкость использования (изменение алгоритмов управления и настрой-
ка коэффициентов системы могут быть осуществлены путем изменения
программ);
— применение более совершенных алгоритмов управления, позволяющих
оптимизировать движение ЛА;
— ограничение точности вычислений только длиной слов;
— широкие возможности самоконтроля работы системы и контроля
различных параметров в процессе полета и при техническом обслужива-
нии ЛА.
Освоение высокоразвитых БЦВС является основой для глубокой инте-
грации бортового оборудования и для создания интегрированного бортово-
го комплекса (ИБК), с которым связываются перспективные поколения
ЛА. Вообще говоря, понятие ИБК пока не является общепринятым. Неко-
торые специалисты под ИБК понимают все бортовые комплексы с распре-
деленными вычислительными системами. В ряде работ [1,14—1.16] интегра-
ция бортовых систем связывается с объединением осуществляемых функ-
ций управления. Здесь ИБК понимается в самом широком смысле в соот-
ветствии с [1.17] (направление всех ресурсов на решение главной задачи;
резкое повышение автоматизации управления; строго обоснованная мини-
мальная информационная избыточность; автоматическая оптимальная
реконфигурация; адаптивное оптимальное управление; распределённая
мультиплексная БЦВС). В ИБК с высоким уровнем интеграции предусмат-
ривается комплексирование на уровне простых первичных измерителей.
При этом почти вся обработка информации осуществляется в БЦВС. Это
облегчает использование новых принципов построения систем управления
полетом ЛА и, кроме того, создает возможность значительного сокращения
объема, массы, стоимости ИБК с одновременным резким повышением
точности, контролеспособности, надежности, эксплуатационной технологи-
чности бортовых комплексов ЛА в целом.
В то же время с переходом к интегрированным комплексам возрастает
роль математического обеспечения, которое, по существу, и определяет
облик ИБК. Технические и эксплуатационные характеристики БЦВС
(а следовательно, и всего комплекса) все в большей степени становятся
зависимыми от свойств соответствующего математического обеспечения.
Особую окраску приобретают мероприятия по обеспечению надежности
ИБК. При достаточной избыточности источников информации (простых
измерителей) и исполнительных агрегатов (приводов) Практически все
меры обеспечения надежности (кроме, возможно, обеспечения энергопита-
нием) сосредоточиваются в БЦВС и отражаются в аппаратурной реализации
и математическом обеспечении [1.8, 1.18]. При этом следует ожидать, что
развитие идеологии многопараметрических адаптивных систем управления,
предусматривающей оперативное приспособление к изменению состава
источников информации и исполнительных агрегатов, а также обеспечиваю-
щей унифицированность математического обеспечения как различных задач
управления, так и различных классов ЛА, является благоприятной почвой
для построения высоконадежных перспективных систем управления по-
летом.
Почти все сказанное относится не только к пилотируемым ЛА, но и к
беспилотным. Можно утверждать, что, с одной стороны, весь комплекс
12
задач, поставленных перед перспективными поколениями ЛА, не может
быть решен посредством традиционных методов управления и, с другой сто-
роны, имеются и быстро расширяются принципиальные возможности пост-
роения высокоразвитых систем управления полетом. У адаптивных методов
управления, по существу, нет альтернативы.
§ 1.2. Концепция адаптивного управления полетом
Возникновение теории адаптивных систем относят ко второй половине
5 0-х годов [1.19,1.20], хотя отдельные адаптивные системы и посвященные
им теоретические разработки появились значительно раньше.
Область адаптивного управления и предмет теории адаптивных систем
могут быть определены на основе следующего анализа. Процесс проектиро-
вания системы управления всегда предполагает наличие, во-первых, четко
сформулированной цели управления, а во-вторых, априорной информации
об объекте управления и о характере действующих на него возмущений.
Объем априорной информации при этом может быть различным и, за ред-
ким исключением, не является исчерпывающим. Однако в данном случае
принципиальным является вопрос о достаточности или недостаточности
располагаемой априорной информации об объекте для достижения сформу-
лированной цели управления.
Все системы управления, построенные с использованием априорной
информации, достаточной для достижения цели управления, относятся
к неадаптивным, или традиционным, системам управления независимо от
реализуемого принципа управления, наличия обратной связи, случайности
или детерминированности возмущений, используемых вычислительных
средств и т.д. Если же объем располагаемой априорной информации о
свойствах объекта не может обеспечить достижения сформулированной
цели управления, то речь должна идти об адаптивных системах управления.
Таким образом, к адаптивным следует относить лишь такие системы управ-
ления, которые предназначены для функционирования в условиях априор-
ной неопределенности и которые в процессе функционирования автомати-
чески приспосабливаются к непредвиденным изменениям свойств объекта
управления и внешней среды.
Современный период развития теории и практики адаптивного управле-
ния тесно связан с быстро развивающимися средствами вычислений, в том
числе и с БЦВС, способными решать достаточно сложные задачи в реальном
масштабе времени. Для этого периода характерны интенсивное увеличение
количества публикаций по адаптивному управлению, быстрое развитие
теоретических основ адаптации и возрастание числа попыток решения
прикладных задач управления полетом на основе принципов адаптивных
систем [121—1.35].
Не углубляясь в проблему классификации развиваемых в настоящее
время подходов к построению адаптивных систем, укажем здесь только
некоторые наиболее существенные признаки деления принципов адаптации.
По уровню формализации априорной неопределенности известные подхо-
ды делятся на:
— параметрическую адаптацию, при которой априорная неопределенность
заключается в недостаточном знании параметров (коэффициентов) управ-
ляемого объекта;
13
- непараметрическую адаптацию, при которой априорная неопределен-
ность не связана непосредственно с какими-либо параметрами.
В обоих случаях неопределенность уменьшается на основе последователь-
ных наблюдений входных и выходных сигналов в процессе управления.
Для задач управления полетом ближе по постановке стоят задачи параме-
трической адаптации, так как управляемые процессы изучены настолько,
что позволяют априорно получить структуру уравнений движения.
По организации процесса адаптации используемые методы делятся на:
— поисковые, для которых характерны процессы итеративного движения
к достижению требуемого качества управления;
- беспоисковые, основанные на использовании некоторых необходимых
(достаточных) условий требуемого качества управления.
У систем поисковой адаптации формируются специальными устройства-
ми детерминированные или случайные пробные сигналы или создаются
условия для возбуждения в объекте незатухающих колебаний, используе-
мых как поисковые. Наличие пробных движений является основным
недостатком поисковой адаптации, так как они не всегда допустимы по
условиям функционирования объекта. Это относится и к САУ ЛА.
По целям организации адаптации можно выделить:
— системы со специальными свойствами, в результате функционирования
которых управляемый процесс приобретает некоторые обязательные свой-
ства, в число которых могут быть включены устойчивость, чувствительность
к каким-либо возмущениям или ошибкам априорной информации, задан-
ное расположение корней характеристического уравнения и т.д.;
— оптимальные системы, обеспечивающие минимизацию некоторых
функционалов, отражающих качество управляемого движения.
Более перспективным для управления полетом ЛА представляется
использование беспоисковых систем с параметрической адаптацией. В [1.9]
показано, что простейшие формы адаптации, получившие распространение
в серийных САУ [1.36, 1.37], и конкурирующие с ними формы стабилиза-
ции динамических свойств, сыгравшие и до сих пор играющие видную роль
в САУ некоторых классов [1.5,1.38,1.39], не решают перечисленных выше
современных проблем управления ЛА. В некоторой мере это иллюстрирует
рис. 1.4. Здесь перечислен ряд принципов адаптации и стабилизации динами-
ческих свойств, а также некоторые показатели в смысле возможности
достижения различных эффектов.
Концепция создания адаптивных систем управления, основанных на
сочетании устройств (алгоритмов) идентификации динамических харак-
теристик управляемого объекта и оценивания его состояния с регуля-
тором, впервые сформулированная, наверное, в [1.40,1.41], получила
дальнейшее развитие [1.42, 1.43] и является основной в современных
исследованиях адаптивного управления полетом. Системы, построенные
на основе этой концепции, позволяют максимально использовать априор-
ную и получаемую в процессе управления информацию о структуре и пара-
метрах ЛА.
При этом богатый опыт авиастроения и современные методы анализа
характеристик ЛА представляют возможность в значительной степени
облегчить проблему адаптивного управления полетом путем использования
априорной информации о характеристиках ЛА. Как подчеркнуто в [ 1.44],
14
Отсутствие специальных
дополнительных движений
Небольшое число контролирце-
мых факторов и
настраиваемых параметров
Оптимизация качества
процессов и расхода энергии
на управление
большое число контролируемых
факторов и настраиваемых
параметров
Работоспособность 8 условиях
случайных помех
широкого спектра
возможность противодействия
структурным изменениям
| в
g§|
ИВ
§ §
G §
141
ад
в
«й§*
»!§
вй
В
Принципы адаптации и стабилизации
динамических свойств
Рис. 1.4. Сравнение различных принципов адаптации (или снижения чувствительности
к изменению параметров объекта) САУ
лучше всего процесс идентификации строить в виде отыскания поправок
к теоретическим значениям всех аэродинамических характеристик.
Наиболее развитым видом адаптивных систем управления являются,
очевидно* адаптивные оптимальные системы управления (АдОСУ), которые
сочетают высокую приспосабливаемое™ к условиям функционирования
с оптимизацией управления движением и расхода энергии на управление
в смысле заданного критерия. Такие системы по целям и результатам
функционирования приближаются к системам дуального управления
[1.45], выигрывая у них в вопросах реализуемости и уступая им разве .что
в организации взаимодействия процессов оценивания параметров и состоя-
ния с процессом управления. Если в системах дуального управления эта
связь является логическим следствием постановки задачи, то в АдОСУ
.форма этой связи, как правило, является изобретением автора.
Ожидается, что реализация систем адаптивного оптимального управления
полетом даст возможность успешно решить многие проблемы создания
и освоения новых поколений ЛА, так как эти системы позволяют:
— существенно расширить диапазоны условий применения ЛА;
— обеспечить комплексную оптимизацию выполнения возлагаемых на
систему функций;
— повысить безопасность полета ЛА, в том числе и на предельных режи-
мах (вблизи границ эксплуатационных областей режимов);
— в значительной степени снизить временные и материальные затраты
на разработку и освоение отдельных образцов техники как за счет высоко-
го, недоступного ранее уровня унификации элементной базы систем управ-
ления, так и за счет снижения требований к натурным испытаниям ЛА на
начальных стадиях их освоения;
15
— сократить сроки отработки навыков пилотирования у летного состава
благодаря возможности реализации оптимальных с точки зрения эргоно-
мики характеристик управляемости ЛА.
Достижение этих результатов требует решения ряда теоретических, и
прикладных проблем.
Среди современных подходов к построению адаптивных систем управле-
ния полетом самолетов встречаются самые разнообразные теоретические
посылки и технические приемы. Анализ публикаций [1.28—1.35] позволя-
ет сделать некоторые выводы о современном состоянии и исследуемых
путях построения адаптивных систем управления полетом ЛА.
1. Концепция построения адаптивных систем управления полетом на
основе соединения процессов идентификации и собственно управления
является доминирующей.
2. Во всех известных исследованиях в качестве моделей управляемого
процесса принимаются линеаризованные математические Модели изолиро-
ванных продольного и бокового движений.
3. Оценивание состояния управляемого, процесса осуществляется на
основе фильтра Каймана (либо вопросы оценивания состояния не обсужда-
ются — надо полагать, что в этих случаях точность измерения переменных
движения ЛА предполагается приемлемой для решения задачи).
4. Наиболее распространена идентификация параметров выбранной
модели движения ЛА с помощью алгоритмов, реализующих метод наимень-
ших квадратов (МНК). В то же время исследуются и такие методы, как
обобщенный метод наименьших квадратов; метод максимального правдо-
подобия; метод, основанный на калмановской фильтрации; . методы,
использующие предельные циклы; метод следящей модели и др.
5. В число измеряемых сигналов включаются практически все пилотаж-
ные переменные, традиционно измеряемые на самолете, с тенденцией
исключения сигналов аэрометрических датчиков (при измерениях такие
датчики используют набегающий поток воздуха).
6. Требования к желаемому движению ЛА формулируются либо
заданием эталонных моделей с фиксированными или меняющимися
в зависимости от скоростного напора параметрами, либо назначением
квадратичных функционалов с соответствующим выбором весовых
коэффициентов.
7. В формировании законов управления движением ЛА наблюдается
наибольшее разнообразие подходов. К числу идей, влияющих на выбор
законов управления и схем их адаптации, относятся:
— использование аналитических связей реального процесса и его эталон-
ных (желаемых) моделей, приводящее к ’’прямому” учету желаемых
свойств настройки соответствующих обратных связей;
— аналитическое конструирование регуляторов, позволяющее опреде-
лить для линейных объектов линейные обратные связи, оптимальные в
смысле квадратичных критериев; .
— выбор опорных (базовых) настроек коэффициентов обратных
связей, удовлетворяющих ’’ослабленным” требованиям к управляемому
полету, но в достаточно широком диапазоне режимов полета (с организа-
цией адаптации в относительно небольших окрестностях этих опорных
настроек);
16
— построение й использование логических схем переключения обратных
связей адаптивной системы управления полетом, основанных на обработке
получаемой (путем непосредственного измерения или идентификации)
информации о режимах полета.
Заслуживают внимания идеи комбинации различных принципов автомати-
ческой настройки систем управления полетом. Так, объединение настройки
по параметрам среды с параметрической адаптацией [1.46] позволяет соче-
тать преимущества этих подходов при исключении недостатков, присущих
в отдельности каждому из них. Программная настройка по параметрам сре-
ды обеспечивает высокое быстродействие приспособления системы управле-
ния полетом к изменяющимся условиям и упрощает возникающие проблемы
устойчивости, а самонастройка обеспечивает высокую точность управления
и оптимизации динамических характеристик в реальных условиях полета.
Таким образом, в современных условиях использование адаптивных
систем для управления полетом ЛА представляется весьма перспективным.
Исследования в этом направлении, развернутые в различных странах,
охватывают достаточно широкое число подходов к построению параметри-
чески адаптивных систем управления полетом. В отдельных аспектах
идеологии таких систем, в частности в вопросах использования фильтра
Калмана для оценивания состояния ЛА, наблюдается совпадение взглядов
различных исследователей. В целом же проблема адаптивного управления
полетом еще далека от исчерпывающего решения, что обусловливает акту-
альность исследований в этой области.
В книге будут рассматриваться только адаптивные оптимальные системы
управления полетом, воплощающие один из возможных путей реализации
адаптации на основе идентификации и оптимизации. Эти системы относятся
к системам с совмещенным синтезом оптимального управления, иначе
именуемым универсальными системами автоматического управления
[1.43]. По нашему убеждению, именно на этот класс адаптивных систем
целесообразно ориентироваться при разработке перспективных цифровых
САУ. Они представляются наиболее эффективными при управлении поле-
том, переходные процессы которого, как правило, характеризуются высо-
кой динамической напряженностью, а энергетические ресурсы управления
весьма ограничены.
§ 1.3. Облик многопараметрических адаптивных
оптимальных систем управления попетом
Адаптивная система управления рассматриваемого типа предполагает
выполнение трех (в общем случае взаимосвязанных) процедур:
— определение динамических характеристик управляемого объекта в
процессе его функционирования;
— оценивание состояния управляемого объекта;
— формирование управляющих сигналов с использованием информации,
получаемой с помощью первых двух процедур.
В отличие от систем дуального управления [1.45], как отмечалось в
§ 1.2, в системах адаптивного управления осуществление этих процедур
и организация их взаимодействия в общем £Дкыае*яцляются предметом
2.В.Н. Буков 17
Рис. 1.5. Структурная схема адаптивной оптимальной системы управления
творчества авторов. В достаточно общем виде структура многопараметри-
ческой АдОСУ представлена на рис. 1.5.
Объект управления, динамические характеристики которого известны
с точностью до r-мерного вектора параметров а, подвержен воздействию
как неконтролируемых возмущений, так и формируемых управлений.
Будем полагать, что движение объекта описывается дифференциальным
уравнением
x = F(jc,fl,M,r) + k> (11)
где х — и-мерный вектор состояния объекта, определенный в пространстве
Xп; а — r-мерный вектор параметров, принимающий значения из множест-
ва Ат и определяемый свойствами среды; и — m-мерный вектор управляю-
щих воздействий, формируемый системой управления и принадлежащий
множеству Um-, t— текущее время, принадлежащее отрезку [Го» fKL на
котором определено уравнение (1.1); %х — и-мерный вектор неконтроли-
руемых возмущений с неоговариваемыми пока свойствами; F — и-мерная
векторная функция указанных аргументов, известная, по предположению,
на основе теоретических и экспериментальных исследований объекта.
Уравнение (1.1) является самой распространенной формой описания движе-
ния жесткого ЛА. К этому же уравнению можно привести описание движе-
ния упругого ЛА [1.10].
18
Наблюдение за движением объекта осуществляется с помощью комп-
лекса датчиков, измеряющих компоненты состояния объекта и управле-
ния, поступающие на объект или известные в общем случае с точностью
до параметров функции
г = Л(х,с, u. 0 + $z- (1-2)
Здесь z - /-мерный вектор наблюдений в пространстве Z1; %г _ /-мерный
вектор аддитивных шумов, искажающих показания датчиков; h — 1-ыерная
векторная функция указанных аргументов, известная на основе теорети-
ческих и экспериментальных исследований датчиков информации [1.47—
1.49]. Заметим, что функции типа (1.2) могут иметь достаточно сложную
структуру (и даже заменяться операторами) или вырождаться в соотноше-
ния вида
z = x+^z. (1.3)
Идеология построения интегрированных комплексов предполагает комп-
лексирование на уровне чувствительных элементов. В этом случае уравне-
ние (1.2) описывает преобразование информации чувствительными элемен-
тами.
Результаты измерений поступают в адаптивную оптимальную систему
управления, где используются для определения динамических характери-
стик объекта и оптимального (субоптимального) оценивания его состоя-
ния. Рассматриваемая структура предусматривает два типа процессов
определения характеристик объекта. Первый из них является в значитель-
ной степени традиционным для авиации и реализует программное восста-
новление основных характеристик объекта непосредственно по сигналам
датчиков. В общем случае программа описывается векторной функцией
a(O=n(z,r), (1-4)
где а — r-мерный вектор из области программных значений параметров ЛдР
пространства Аг. Функция (1.4) может быть непрерывной или дискретной.
При построении этой программы может использоваться вся располагаемая
информация о динамических свойствах объекта и законах изменения его
параметров.
Анализ такого способа восстановления параметров объекта (для ЛА —
это аэродинамические коэффициенты, инерционно-массовые характеристи-
ки или коэффициенты уравнений динамики) показывает, что к его достоин-
ствам относятся:
— относительно высокое быстродействие, позволяющее увеличить ско-
рость адаптации системы управления;
— возможность хранения информации о редких, но крайне'важных ситуа-
циях, своевременная идентификация которых маловероятна.
Оба эти достоинства повышают безопасность полетов с адаптивной
системой управления. Кроме вектора а, программа может восстанавливать
дополнительную информацию: доверительный интервал программных
параметров или среднее квадратическое отклонение истинных параметров
от программных, статистические характеристики шумов и т.д. Среди труд-
ностей этого способа можно указать на сложность учета большого числа
факторов, влияющих на функцию (1.4), и потребность значительного
2* 19
объема памяти. Поэтому реализуемый объем программы является компро-
миссом между располагаемой информацией об объекте, аппаратурными
возможностями системы управленцд и достигаемым эффектом.
Другой процесс определения динамических характеристик объекта
представляет собой параметрическую идентификацию, использующую вход-
ные и выходные сигналы объекта [1.50]. От идентификации требуется
достижение необходимой для решения поставленной задачи управленйя
объектом точности восстановления параметров объекта. При этом исполь-
зование информации блока программ в значительной степени упрощает
проведение идентификации. Так, в качестве начальных оценок вектора
параметров могут использоваться значения, определяемые (1.4). Дополни-
тельная программная информация предназначена для обеспечения устойчи-
вости и высокой скорости сходимости процессов идентификации (если
в этом есть необходимость).
В общем виде процесс идентификации описывается оператором
a(t) = H(z, a, (1.5)
где а - r-мерный вектор оценок компонент вектора а.
Таким образом, в рассматриваемой структуре полагается, что идентифи-
кация осуществляется в некоторой окрестности программного значения
вектора параметров. В процессе идентификации система управления учиты-
вает факторы, влияющие на динамические свойства объекта и не включен-
ные в программу (1.4) либо ввиду своей априорной неопределенности,
либо в силу нецелесообразности. Облик этой части системы может в значи-
тельной степени изменяться в зависимости от соотношений ролей, отводи-
мых указанным способам восстановления параметров объекта.
На основе сигналов датчиков и оценок параметров объекта осуществля-
ется оптимальное (или субоптимальное) оценивание состояния объекта,
позволяющее в значительной степени повысить точность информации о
векторе х. Оператор, описывающий оценивание, в общем случае имеет вид
х(г) = 4>(z, a, t0, t), (1.6)
где х - n-мерный вектор оценок компонент вектора х. Как и при иденти-
фикации, при оценивании состояния может использоваться дополнительная
информация, восстанавливаемая программно. Это относится, например,
к статистическим характеристикам шумов (1.2) и средним квадратическим
отклонениям начальных оценок х от истинных значений х. Получаемые
оценки вектора состояния могут использоваться при идентификации пара-
метров. Такая ситуация, например, возникает при использовании алгорит-
мов одновременного оценивания параметров и состояния [1.43]. Допуска-
ется и отсутствие оценивания состояния в тех случаях, когда точность
измерения компонент вектора состояния (1.3) достаточна для решения
задач управления, стоящих перед системой.
Итоговой процедурой многопараметрической адаптивной оптимальной
системы управления является оптимизация управляющих сигналов на
основе задаваемых цели управления и критериев оптимизации. Оператор,
формально описывающий формирование вектора оптимальных управлений,
имеет вид
и = £2(х, a, t, tK).
(1.7)
20
Цель управления представляется заданным состоянием объекта хзад вХп,
которое определяется ’’верхним уровнем” иерархии управления объектом.
Это заданное состояние может, например, выбираться экипажем, пилоти-
рующим ЛА, или формироваться автоматически в навигационном комп-
лексе ЛА.
Критерии оптимальности, сформированные заблаговременно, определя-
ют меру, опираясь на которую алгоритм управления выбирает наиболее
благоприятный путь достижения объектом заданного состояния хзад.
Структура оператора fi(-) зависит от способа задания цели управления,
минимизируемых критериев и выбора метода оптимизации. Входной
информацией для оператора являются оценки состояния объекта х, его
параметров айв общем случае время t. Для увеличения оперативности
адаптации управления может быть предусмотрено использование в (1.7)
программного вектора параметров (1.4). Полученный вектор управления
используется для воздействия на объект и контролируется системой дат-
чиков.
Описанная структура адаптивной системы управления носит достаточно
общий характер. Ниже разрабатываются и исследуются конкретные алго-
ритмы, реализующие процедуры адаптивного управления.
Остановимся на некоторых важных особенностях рассматриваемых
многопараметрических адаптивных систем управления движением.
Наиболее универсальным способом реализации оптимизации управляю-
щих сигналов в системе управления, структура которой представлена на
рис. 1.5, является способ, основанный на так называемом совмещенном
синтезе управления.
Путь создания адаптивной оптимальной системы управления, характер-
ный для большинства публикуемых в настоящее время работ, содержит
в укрупненном плане следующие этапы:
1) формулирование критериев оптимальности;
2) разработка математической модели объекта;
3) синтез законов оптимального управления;
4) разработка алгоритмов адаптации (настройки) законов управления
по режимам функционирования объекта;
5) осуществление полученных законов с помощью управляющих ЦВМ
или АВМ.
Такой подход позволяет достичь относительно невысокого объема
вычислений, выполняемых в процессе управления (этап 5), но приводит
к существенному сужению возможностей управляющих алгоритмов, так
как структура и значительная часть параметров алгоритмов выбираются
для конкретных условий.
Объединение трех последних этапов позволяет создать на базе ЭВМ
управляющую систему, осуществляющую синтез оптимальных управлений
и само управление практически одновременно в процессе функционирова-
ния объекта. Приспосабливаемость системы управления при этом обеспе-
чивается непосредственным решением полной задачи оптимизации.
Очевидно, что реализуемость такой системы на основе управляющей
ЭВМ обусловливается трудоемкостью вычислений совмещенного синтеза.
В случае достаточно невысокой трудоемкости предлагаемый подход поэво-
21
ляет унифицировать алгоритмы управления объектами с различной струк-
турой, разными характеристиками и при различных критериях оптимиза-
ции. Эти достоинства являются существенными при решении многофунк-
циональных задач управления полетом перспективных ЛА.
Реализация совмещенного синтеза законов управления приводит к тому,
что практически единственным управляющим входом адаптивной опти-
мальной системы управления является задание конкретной формы крите-
риев оптимальности. Этими критериями определяются цель и качество
управления движением. Гибкость и взаимосвязанность выбранных кри-
териев позволяют осуществить управление многофункциональными объек-
тами при решении различных задач и оптимальном сочетании одновремен-
но реализуемых функций.
Разработка математической модели объекта управления является вто-
рым из перечисленных выше этапов и последним ’’предварительным”
этапом для системы совмещенного синтеза законов управления. Матема-
тическая модель, описывающая движение объекта управления и положен-
ная в основу разрабатываемого алгоритмического обеспечения системы
управления, определяет ’’глубину” управляемых и, следовательно, опти-
мизируемых процессов. Полнота отражения моделью динамических свойств
объекта влияет на эффективность и трудоемкость как процессов иденти-
фикации и оценивания, так и процессов оптимизации.
Выполнение идентификации в процессе функционирования объекта
управления позволяет организовать обновление информации в программе
(1.4). Действительно, при значительных (превышающих некоторый уро-
вень) отличиях оценок а от программных значений а можно (разумеется,
при достаточной уверенности в достоверности оценок 2) корректировать
хранящиеся в программе (1.4) значения параметров,- соответствующие
реализуемому режиму полета. Так, могут'учитываться, например, неконт-
ролируемые изменения внешних подвесок, нештатные изменения конструк-
ции и т.д. 'Этим же путем решается проблема учета в программе индиви-
дуальных характеристик планера, неизбежных при серийном производстве
ЛА, и умеренных изменений компоновок ЛА в ходе его доработок.
Следующая особенность адаптивного управления с совмещенным
синтезом законов заключается в цикличности процедуры формирования
управляющих сигналов. Это связано с тем, что выполнение вычислений,
необходимых при решении задачи оптимизации на основе известной модели
объекта управления и заданных критериев оптимальности, на ЦВМ реальной
ограниченной производительности требует определенного времени. Момен-
ты формирования управляющих сигналов будем обозначать t!u, где / —
порядковый номер момента времени. Длительность цикла = t’u—
называемого далее циклом формирования управления, определяется, с
одной стороны, динамическими свойствами объекта, а с другой — объемом
выполняемых вычислений и производительностью ЦВМ.
Если /-му циклу формирования управления ставить в соответствие рас-
полагаемые для вычислений оценки x(t£) и £(?{,)» то оптимальное управ-
ление, воздействующее на объект в течение (/ + 1)-го цикла, определяется
дискретным по времени аналогом выражения (1.7)
М(Т/+1) = £2[^(Т/),^(Г/),Г/]. (1.8)
22
Управление (1.8) воздействует на объект до следующего момента времени
t'*2, когда будет получено новое значение оптимального управления.
Алгоритмы идентификации в реальном масштабе времени, используемые
в адаптивных системах управления, строятся, как правило, на основе
гипотезы квазистационарности характеристик объекта управления. В соот-
ветствии с этой гипотезой оцениваемые параметры при выбранной структу-
ре модели объекта (1.1) или постоянны во времени, или изменяются с
незначительной скоростью, пренебрежение которой практически не ухудша-
ет оценок, получаемых на ограниченном временном интервале наблюдения.
В силу нестрогости гипотезы (параметры реального объекта изменяются
во времени) и в связи с неизбежными ошибками в используемой априор-
ной статистической информации процесс идентификации может сопро-
вождаться накоплением ошибок, приводящих к снижению эффективности
алгоритма. Поэтому оценивание параметров (идентификацию) целесообраз-
но осуществлять тоже циклически, когда периодически в начале каждого
нового цикла идентификации задача оценивания решается заново, или
вводить функции ’’забывания” ранней информации [1.29] .
В любом случае будем полагать, что оценки параметров формируются
в моменты времени ta, которые совпадают с некоторыми из рассмотренных
ранее моментов времени tu. Естественно, длительность цикла оценивания
параметров Дга, под которой здесь понимается интервал времени между
соседними моментами ta, не меньше длительности цикла формирования
управления Д/и, а в общем случае превышает последнюю в целое число
раз (Д^а — ^Д^к).
В заключение заметим, что при разработке и исследовании предлагаемых
ниже алгоритмов предполагалась разделимость процессов идентификации
и синтеза управлений. Это предположение опирается главным образом на
эвристические соображения и является широко распространенным. Обосно-
ванность этого предположения подтверждается предельной теоремой разде-
ления, справедливой при неограниченно высокой точности оценок [1.43].
Глава 2
МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДВИЖЕНИЯ
ЖЕСТКОГО САМОЛЕТА
Разработка математической модели движения ЛА, как отмечено в § 1.3,
относится к одному из первых этапов процесса создания адаптивной опти-
мальной системы управления полетом. От назначения разрабатываемых
моделей зависят их полнота и точность. Характеризуя ту или иную модель
ЛА, говорят об адекватности этой модели решаемой задаче.
В данной работе ЛА рассматривается как динамический объект, непре-
рывное во времени изменение состояния которого описывается дифферен-
циальными уравнениями. Речь здесь будет идти лишь о жестких ЛА само-
летного типа, хотя приводимые в последующих главах результаты могут
быть получены и для более широкого класса ЛА. В качестве исследуемого
ЛА взят некоторый гипотетический самолет современной компоновки.
Процесс разработки и исследования алгоритмического обеспечения
адаптивной оптимальной системы управления полетом подразумевает
наличие двух математических моделей ЛА. Первая из них используется
для синтеза законов управления и выбора алгоритмов формирования
сигналов управления разрабатываемой системы. В дальнейшем такую
модель будем называть моделью объекта. Вторая модель необходима
для проведения исследований и отладки разработанного алгоритмического
обеспечения. системы управления в период вычислительных эксперимен-
тов. Для краткости эту модель будем называть просто объектом. При
этом совпадение структур (вида дифференциальных уравнений) объекта
и модели объекта в общем случае не является обязательным.
§ 2.1. Рулевые органы самолета и системы координат
Прежде чем записать уравнения движения жесткого самолета в форме
(1.1), определим физическое содержание вектора управления и некото-
рых компонент вектора состояния х.
Реализация требуемого движения ЛА основана на возможности созда-
ния управляемых по величине и направлению сил и моментов, действую-
щих на ЛА. Будем полагать, что рассматриваемый гипотетический самолет
наряду с органом управления тягой двигателя имеет аэродинамические
рулевые органы, расположение которых показано на рис. 2.1 [1.10]. Прин-
цип действия показанных органов различен, но все они при изменении
своего положения так или иначе изменяют направление воздушного’ пото-
ка, что приводит к появлению дополнительных аэродинамических сил.
Элероны 3, руль направления 5 и руль высоты 7 относятся к традицион-
ным рулевым органам самолета и предназначены для создания управляю-
щих моментов вокруг трех ортогональных осей самолета. Современные
24
Рис. 2.1. Возможное расположение руле-
вых органов на гипотетическом самоле-
те: 1 — продольное переднее оперение;
2 — горизонтальное переднее оперение;
3 - элероны; 4 - закрылки; 5 — руль
направления; б— тормозные щитки; 7 —
руль высоты
концепции построения ЛА и систем управления их полетом [1.6, 1.7]
привели к разработке и внедрению существенно большего числа рулевых
органов. Так, дополнительные рулевые поверхности 1 и 2 при одновремен-
ном использовании с рулем направления и рулём высоты позволяют обеспе-
чить непосредственное управление боковой и подъемной аэродинамически-
ми силами, что открывает возможность реализации новых форм движения
самолета [1.7, 2.1], основанных на раздельном управлении угловым поло-
жением ЛА и положением его центра масс.
В табл. 2.1 приведены обозначения, применяемые в дальнейшем для
описания положения рулевых органов рассматриваемого самолета.
При практическом использовании уравнений движения ЛА их запи-
сывают в проекциях на оси выбранных систем координат (СК). В дина-
мике полета получили распространение следующие правые прямоугольные
системы координат (СК) [2.1, 2.2].
1. Нормальная земная система координат. Начало
находится на поверхности Земли: в определенной точке взлетно-посадоч-
ной полосы (ВПП), в точке расположения ориентира, в центре наземной
цели и т.д. Оси OoXg YL>OoZg расположены в горизонтальной плоскости,
а ось 0<>Yg направлена вверх (вдоль местной вертикали). Ориентация
Таблица 2.1
Рулевые органы гипотетического самолета
Название руле- вого органа Обозна- чение Единицы из- мерения пере- мещений Название руле- вого органа Обозна- чение Единицы изме- рения переме- щений
Продольное пе- реднее оперение 8п.о градусы Руль направле- ния ®р.И градусы
Г оризонтальное переднее опере- ние ®г.о градусы Тормозные щитки 6т.щ доли диапазона
Элероны 6Э градусы Руль высоты 8р.в градусы
Закрылки 63 градусы Ручка управле- ния двигателем 6р.у доли диапазона
25
Рис. 2.2. Нормальная земная и нормальная системы координат
Рис. 2.3. Нормальная и связанная системы координат
осей OQXg и O6Zg зависит от решаемой задачи и полагается неизменной
(вращением Земли здесь будем пренебрегать).
2. Нормальная система координат. Начало находится в
центре масс ЛА, оси OXg и OZg расположены в горизонтальной плоскости,
а ось О Yg направлена вверх. В дальнейшем будем полагать, что оси нор-
мальной и нормальной земной СК параллельны. Относительное положение
этих СК определяется вектором г между их началами, как это показано на
рис. 2.2. Проекция вектора г на ось OYg называется геометрической высо-
той полета ЛА.
3. Связанная система координат. Начало находится в цент-
ре масс ЛА. Ось ОХ направлена вдоль ЛА вперед (см. рис. 2.1) и называет-
ся продольной осью. Ось OY лежит в плоскости симметрии самолета,
направлена вверх (при нормальном полете) и называется нормальной осью.
Ось OZ направлена вправо по ходу самолета и называется поперечной осью.
Относительное положение связанной и нормальной СК определяется в
общем случае девятью направляющими косинусами, т.е. косинусами девяти
Таблица 2.2
Связь направляющих косинусов с углами Эйлера
Оси нор- МОЛЬНОЙ СК Оси связанной СК
ОХ OY OZ
ехх ~ cosoxx = = COSliz COSd exy - cosaxy = sin-y sin ф - - cosycos^ and exz - cnsaxz - ~ cosy sin ф + + sinycosij; sind
еух - cosayX = sind €yy = COSO^ = COSy COS d e COSGy-r = -sinycosd
ozg = COSd ~ COS OZy ~~ ~ siny СО5ф + + cosy simp and ezz = COSO^z ~ = cosy cos^ - - siny sinф sind
26
углов между соответствующими осями связанной и нормальной СК. Эти
углы показаны на рис. 2.3.
Часто для определения относительного положения связанной и нормаль-
ной СК пользуются углами Эйлера (в динамике ЛА эти углы называются
углами тангажа, крена и рыскания), связь которых с направляющими
косинусами показана в табл. 2.2. В этом случае для перехода от нормаль-
ной к связанной СК общепринятой является такая последовательность
поворотов: на угол рыскания ф вокруг оси OYg; на угол тангажа д вокруг
нового положения оси OZ; на угол крена у вокруг оси ОХ. Эти повороты
показаны на рис. 2.4. Здесь же показаны векторы соответствующих угло-
вых скоростей. Использование углов Эйлера опирается на предположение,
что д ¥= 7г/2. В противном случае векторы ф и у ’’складываются” и описан-
ный способ определения относительного углового положения теряет смысл.
Направляющие косинусы удобно представлять в виде матрицы
£хх ^ху
еуу
fzx ezy
€хг
eXz
ezz
(2.1)
которую будем называть матрицей перехода и использовать для перехода
от связанной СК к нормальной СК. Здесь и далее верхний индекс матрицы
перехода соответствует названию СК, от которой осуществляется переход,
а нижний индекс соответствует СК, к которой осуществляется переход.
Переход осуществляется умножением матрицы-столбца, содержащей проек-
ции соответствующего вектора на оси связанной СК, на матрицу Р™ слева.
Рис. 2.4. Нормальная и связан-
ная системы координат (углы
Эйлера)
Рис. 2.5. Связанная и скоростная
системы координат
Рис. 2.6. Нормальная и траектор-
ная системы координат
27
Матрица перехода является ортогональной. Отметим некоторые ее
фундаментальные свойства:
— обращение матрицы перехода эквивалентно транспонированию (для
обратного перехода необходимо воспользоваться транспонированной
матрицей
— все строки и столбцы матрицы перехода нормированы, т.е. суммы
квадратов элементов строк (столбцов) равны единице;
— каждый элемент матрицы перехода равен своему алгебраическому
дополнению, т.е. для (2.1) справедливо выражение
€хх ~ €yy€zz~ ezyeyz (2.2)
ИТ.Д.
4. Скоростная система координат. Начало находится в
центре масс ЛА. Ось ОХа направлена вдоль скорости ЛА (F) относи-
тельно воздушной среды и называется скоростной осью. Ось OYa лежит
в плоскости симметрии, направлена вверх (при нормальном полете) и
называется осью подъемной силы. Ось OZa направлена вправо и называ-
ется боковой осью.
Относительное угловое положение связанной и скоростной СК опреде-
ляется углами атаки а и скольжения /3, показанными на рис. 2.5. Углом
скольжения называется угол между осью ОХа (вектором воздушной
скорости) и плоскостью симметрии ЛА. Углом атаки называется угол
между проекцией оси ОХа (вектора воздушной скорости) на плоскость
симметрии и осью ОХ ЛА. Матрица перехода от связанной к скоростной
СК имеет вид
cosacos/3
sin а
cosa sin/3
—sinacos/3
cosa
sina sin/3
sin/3
0
cos/3
(2.3)
5. Траекторная система координат. Начало находится
в центре масс ЛА. Ось ОХк направлена вдоль вектора земной скорости
ЛА (т.е. вдоль вектора скорости ЛА относительно Земли). Ось OZk лежит
в горизонтальной плоскости. Ось О Yk направлена вверх. Оси этой системы
координат специальных названий не имеют.
Относительное положение траекторной и нормальной СК показано
на рис. 2.6. Угол между осью OXg и вертикальной плоскостью, проходя-
щей через ось ОХк, называется углом пути Ф. Угол между осью ОХк и
горизонтальной плоскостью называется углом наклона траектории в.
Матрица перехода от траекторной к нормальной СК имеет вид
COS0 созФ
sin 0
—cos0 sin4>
—sin0 совФ sin 'Р'
cos 6 О
sin# sinty cos^ _
(2.4)
Относительное положение векторов земной Vk и воздушной V скорос-
тей ЛА определяется скоростью воздушной массы относительно поверх-
ности Земли, т.е. скоростью ветра W. Естественной формой задания векто-
28
ра скорости ветра является задание его проекций на оси нормальной СК*):
~ 1^х.н WyiI WZ1I ] .
Этот же вектор в траекторной СК определяется соотношением
^Т=£>?И/Н, (2.5)
где переход от нормальной к траекторной СК осуществляется матрицей
перехода (2.4).
Заметим, что введенные матрицы перехода осуществляют все возмож-
ные переходы от одной из перечисленных СК к другой. Так, переход от
траекторной к скоростной СК осуществляется матрицей
£>т (2.6)
£ V VIS П \ У
Элементы этой матрицы образуются по правилу перемножения указанных
матриц перехода.
§ 2.2. Полная нелинейная модель
пространственного движения самолета
Известно, что одним из основных моментов в составлении или разработ-
ке математической модели ЛА является принятие различных допущений,
упрощающих, схематизирующих реальный процесс. Принятие допущений —
это инженерная задача, от правильности решения которой зависит адекват-
ность полученной модели решаемой проблеме в целом.
Примем ряд основных допущений при моделировнии движения легких
ЛА на небольших интервалах времени:
— конструкция самолета считается жесткой;
— масса самолета в процессе моделирования постоянна и отсутствует
жидкое наполнение;
— главные оси инерции ЛА совпадают с осями связанной СК;
— сила тяги двигателя лежит в плоскости симметрии ЛА и направлена
вдоль вектора, проходящего через центр масс ЛА и составляющего с осью
ОХ угол у;
— аэродинамика ЛА нелинейная по углам атаки и скольжения, обтека-
ние ЛА квазистационарное;
— атмосфера является стандартной по ГОСТ 4401—81;
— вектор суммарного кинетического момента вращающихся частей
двигателя ЛА направлен вдоль оси ОХ связанной СК.
Уравнения динамики ЛА как твердого тела постоянной массы в про-
извольной СК, вращающейся с абсолютной угловой скоростью £2, записы-
ваются в виде
tnVk X Vk =F, Ь + £Ш = М, (2.7)
где первое уравнение соответствует поступательному движению, а второе —
*) Здесь и дальше при необходимости подчеркнуть в какой СК заданы проекции
того или иного вектора, буДем пользоваться следующими индексами: н - нормальная,
св - связанная, с — скоростная, т - траекторная; штрихом обозначена операция
транспонирования.
29
вращательному движению вокруг центра масс. Здесь т — масса ЛА; —
вектор земной скорости центра масс ЛА; F — равнодействующий или
главный вектор всех внешних сил, действующих на ЛА; L — вектор мо-
мента количества движения ЛА; М — главный вектор моментов, действую-
щих на ЛА; точкой обозначена операция дифференцирования по времени
в выбранной СК; знаком X обозначена операция векторного умножения.
При описании поступательного движения ЛА будем использовать траек-
торную или связанную СК.
Если пренебречь вращением Земли и кривизной ее поверхности, то
нормальная СК будет иметь неизменное направление осей, а вектор угло-
вой скорости траекторной СК, как следует из рис. 2.6, будет иметь проек-
ции на оси траекторной СК1)
Пт = [Фяп0 Ф cos6 0]'. (2.8)
Вектор скорости центра масс имеет вид
r*T»(Kfc 0 0].
В этом случае уравнение сил приводится к матричному уравнению
м
Kfc4'cos0
(2.9)
(2.Ю)
где FT — главный вектор сил, представленный в проекциях на оси траек-
торной СК.
В связанной СК это же уравнение примет вид
(2.Н)
где FCB — главный вектор сил, представленный в проекциях на оси связан-
ной СК; Ц]’ ~ вектор угловой скорости вращения связан-
ной СК.
Дальнейшая детализация уравнений (2.10) и (2.11) требует раскрытия
главного вектора сил. В достаточно общем случае
Г = С + Р + Л, (2.12)
где G — вектор силы тяжести ЛА; Р — вектор силы тяги двигателя; R —
равнодействующий вектор аэродинамических сил.
Силу тяжести удобно задавать в нормальной СК, в которой по опре-
делению
GH = [0 -gm 0]'. (2.13)
Используя матрицы перехода, эту силу можно представить в любой другой
СК. Так, в связанной СК
Ссъ - GH = [—gm sind -gm cosy cosd gm sin7cosd]'. (2.14)
Аналогично сила тяжести приводится к проекциям на оси траекторной СК
Далее вектором будет называться матрица-столбец, элементами которой явля-
ются соответствующие проекции на оси СК.
30
для использования в (2.10) :
GT = D*GH - [—gm sin 0 -gmcos0 0]'.
(2-15)
Сила тяги двигателя плоскосимметричного одномоторного ЛА действует
в плоскости симметрии и в связанной СК имеет составляющие
РСв=Л6р.у» К #)[cos<p sin<p 0]',
(2.16)
где <р — угол между осью ОХ связанной СК и вектором тяги, постоянный
по величине или изменяемый в некотором диапазоне в случае реализации
на ЛА управления направлением вектора тяги. Величина тяги двйгателя
/’(бр.у, V, Н) зависит от положения ручки управления двигателем, ско-
рости, высоты полета [2.3, 2.4] и в общем случае от времени. Для исполь-
зования (2.10) вектор (2.16) пересчитывается в траекторную СК по фор-
муле
Рт =/?тн^вРсв. (2.17)
Аэродинамические силы, действующие на ЛА, определяются конфигу-
рацией ЛА и характером обтекания его воздушным потоком [1.1, 1.2].
Описание аэродинамических сил осуществляется в различных СК, в том
числе в связанной и скоростной:
Лев — 'X' Y = QS сх ' СУ , Лс = 1 11 1 1 = 9$ Ска суа (2.18)
Z . -cz - - za J -cza -
где q — скоростной напор, определяемый формулой q = р Г2/2; р — плот-
ность воздуха, зависящая от высоты полета и устанавливаемая для стан-
дартной атмосферы по ГОСТ 4401—81; S — характерная площадь
ЛА (площадь крыла самолета); X, Y, Z н -Ха, Ya, Za — проекции век-
тора R на оси связанной и скоростной СК соответственно; cf и cia — без-
размерные коэффициенты аэродинамических сил.
Важным и часто используемым понятием в динамике поступательного
движения ЛА является перегрузка. Она представляет собой векторную ве-
личину, определяемую как отношение разности главного вектора сил, дей-
ствующих на ЛА, и силы тяжести ЛА к модулю силы тяжести:
п =
(2-19)
Вектор перегрузки можно представить проекциями на любую из рассмот-
ренных СК. Так, проекции на оси связанной СК имеют вид
(2.20)
Тогда в соответствии с (2.11), (2.14) и табл. 2.2
'Vkx ‘ VkZ<^y ~ V/cyt^Z пх
vky + V/CX^Z ~ Y/(Z(VX = g Пу ~g
LKfcz J - УкуШХ ~ Vfcx^y - -nz _
еуу
- €yz -
(2.21)
31
Аналогично для проекций сил на оси траекторной СК можно получить
КЛФсО80-
Пхт
пут
-nZT .
sinO
ч2.22)
При описании вращательного движения ЛА будем пользоваться связан-
ной СК. При этом вектор момента количества движения в проекциях
на оси связанной СК определится соотношением
£ = Jot. (2.23)
где £ = [£х Ly Lz]' — матрица-столбец составляющих момента количест-
ва движения; <*> = [<*>х ыу oazJ* — матрица-столбец проекций угловой
скорости вращения ЛА на оси связанной СК;
Лс ~Jxy Jxz
~Jxy Jy —Jyz (2.24)
- ~Jxz ~~jyz Jz -
— матрица моментов инерции ЛА, по главной диагонали которой располо-
жены моменты инерции ЛА относительно осей выбранной СК, а остальные
элементы представляют собой центробежные моменты инерции [2.5].
Принятое предположение о совмещении осей связанной СК и главных
осей инерции позволяет записать
J=diag(Jx, Jy, Jz). (2.25)
Полагая J - const, из второго уравнения (2.7) получаем
(JZ —Jy)h)y<jJz
Ux ~Jz}^x^z
- (Jy —Jx^^x^y
(2.26)
Действующий на ЛА главный вектор моментов в предположении отсут-
ствия момента, создаваемого тягой двигателя, представляет собой сумму
вектора аэродинамического момента, который можно представить в виде
Гтх
МЛ'СЪ = qSB
ту
(2.27)
L mz
и гироскопического момента двигателя
(2.28)
L CJy J
где В - diag(Z, I, ba) — диагональная матрица характерных линейных
размеров ЛА (размаха крыла I и. средней аэродинамической хорды кры-
ла Ьа); пц — безразмерные коэффициенты аэродинамических моментов;
Кдв — суммарный момент количества движения вращающихся частей
двигателя (традиционно для авиации Адв < 0).
32
Коэффициенты аэродинамических сил и моментов в (2.18) и (2.27) в
общем случае являются сложными функциями конфигурации ЛА (ком-
поновки ЛА, положения средств механизации и рулевых органов) и усло-
вий полета [2.6]:
cf. cia или m,=/(a,0,d,P,cox, wz, 8П.О, 5Г_О>---.М, Re). (2.29)
Здесь М = V/a — число Маха; а — скорость звука на высоте полета по
ГОСТ 4401—8Г, Re - Vba/v — число Рейнольдса; v — кинетический коэф-
фициент вязкости воздуха.
Исследование зависимостей (2.29) является содержанием аэродинамики
самолета. Для получения конкретных зависимостей используются сле-
дующие пути:
— экспериментальное исследование физических моделей ЛА в аэродина-
мических трубах [1.2, 2.7];
— математические расчеты аэродинамических характеристик на основе
теории движения тела в среде [1.10, 2.8, 2.9];
— идентификация аэродинамических характеристик по результатам лет-
ных экспериментов [2.10—2.12].
На основе результатов исследований общие зависимости (2.29) заме-
няются более простыми вариантами — аппроксимируются. Примером
аэродинамической модели самолета, отражающей его свойства в широком
диапазоне углов атаки и скольжения на дозвуковых скоростях полета,
является модель вида
=Сх(а) + 4рв(а)$р.в. +4тщ(а)8т.ш +43(а)5з,
= су(а) + 4р в(а)6р.в + Су3 (а) 83 +г£г-°(а)8гх>,
Сг = <*f(or)0 + czpH(or)8p.H +СгПЛ(а)8п.о,
тх ~ тх (а, ₽) + Х (<*)^х + т^У («)“> + »»х’(ог) 8Э +
+ ™хр“ (°) 5Р.Н + тх п ° (а)8П.о. (2.30)
тпу = тпу[а, 0) + т^х (а)cJx + in°y(a) йу + тпу3(а)8Э +
+ mJp-H(e)8р.н + П1уз6 р в (о) 8э8р в + т6уп ° (а) 8П О,
mz = т2(а)+m?z(a)&2 р в(а)6р „ + /н^3(а)83 + mzro(or)8r о.
Здесь верхними индексами отмечены соответствующие производные аэро-
динамических коэффициентов, знаком ’’тильда” - обобщенные производ-
ные аэродинамических коэффициентов [2.6]
= m?z (а) + т2 Jot),
т£х (а) ~ т?х (а) + тх (or) sin а,
тхУ(а) ~ f,lxy (а)+f»x (a)cosa, (2 31)
т$х (or) = т^х (а) + ту (а) sin а,
т£у (а) = т^у (а) + ту (а) cosor,
З.В.Н. Буков
33
чертой отмечены безразмерные угловые скорости
=
1ь>х
2V '
iCJy
2V ’
К
0=-~- (2.32)
u>v =
a =---,
V
В Приложении HI приводятся полученные расчетным путем по методи-
кам [2.8, 2.9] некоторые аэродинамические характеристики гипотетическо-
го самолета нормальной компоновки.
Уравнения кинематики связывают пространственное положение ЛА со
скоростями его.движения. Продолжая рассматривать ЛА как твердое тело,
кинематику его пространственного движения можно разделить на кине-
матику вращательного движения вокруг центра масс и поступательного
движения центра масс.
При описании поступательного движения требуется определить измене-
ние относительного положения нормальной земной и нормальной СК, ко-
торое в условиях пренебрежения вращения Земли запишется в виде
г = Vk. (2.33)
В проекциях на оси нормальной земной СК это уравнение принимает вид
' ^kxg
^kyg
V/czg -
(2.34)
(часто вместо у для обозначения высоты полета мы будем использо-
вать Я). Если вектор земной скорости Vk определен в траекторной СК
(интегрированием (2.10)), то вместо (2.34) следует записать
-г*-
0
.0 .
Г COS0 cos'Г -
sinO
—cos0 sin^
(2.35)
Если же вектор земной скорости определен в связанной СК (интегриро-
ванием (2.11)), то
Kjtx
Vky
-Vk:
(2.36)
Описание пространственного вращательного движения ЛА как твердого
тела вокруг центра масс может иметь по крайней мере три различные фор-
мы. Первая из них связана с углами Эйлера (см. рис. 2.4), вторая — с на-
правляющими косинусами углов, показанных на рис. 2.3, а третья — с
кватернионами (параметрами Родрига - Гамильтона).
Рассмотрим первые две формы подробнее. Относительно третьей формы
заметим лишь, что она весьма эффективна при моделировании простран-
ственных движений ЛА в полунатурных моделирующих комплексах [2.!].
Для того чтобы получить кинематические уравнения, описывающие из-
менение утлов Эйлера, достаточно н^йти проекции вектора угловой ско-
рости ЛА на непрямоугольную систему осей ОХ (совпадает с у), OYg (сов-
34
падает с ф) и промежуточной оси между OZ и OZg на рис. 2.4 (совпадает
с &). Полагая, что проекции вектора угловой скорости ЛА на оси связанной
СК известны, получим
Ь - Шу sin? + шг cosy,
i - tg $(а>,, cosy - coz siny), (2.37)
1
у -------(шу cosy — со. siny).
cos#
Такая форма описания кинематики углового движения традиционна, одна-
ко ее существенным недостатком является наличие особых точек прост-
ранственных поворотов (# = ±90°), в которых уравнения (2.37) терпят
разрыв.
Кинематические уравнения в направляющих косинусах (уравнения
Пуассона) можно получить дифференцированием в связанной СК единич-
ных векторов (ортов) нормальной СК. Так, для вертикального орта,
направленного вдоль оси OYg, справедливо
*yg + ^Ч«=0-
Принимая во внимание, что проекции единичного вектора eyg на оси свя-
занной СК суть соответствующие направляющие косинусы, можно запи-
сать
€ух = Ш:€уу — Шу€у2,
€уу = Шхеу2 - со.е,.х» (2.38)
€yZ — Шу€ух —
Аналогично получаются уравнения для остальных шести направляющих
косинусов.
Для матричной записи уравнений Пуассона используют следующий
прием: из компонент угловой скорости формируют квадратную косо-
симметрическую матрицу
- 0 -шу
[П] = — 0 ых • (2.39)
- «у 0 _
В этом случае матрица направляющих косинусов (2.1) удовлетворяет
уравнению
(2.40)
Среди достоинств такой формы описания кинематики углового движения
можно отметить отсутствие особых точек, т.е. моделируемые угловые
движения не имеют ограничений. Избыточность вычисляемых параметров
(девять вместо трех) частично компенсируется, если одну из строк матри-
цы £>вв определять через алгебраические дополнения.
Объединяя изложенные выше результаты и вводя дополнительные
соотношения для углов атаки, скольжения и пр., можно записать в матрич-
ной форме уравнения пространственного движения ЛА (вертикальной чер-
той разделены возможные варианты уравнений).
3
35
Динамика поступательного движения:
-vK
-Fje'i'cose.
т
Р
-тВЧ
~cos^ *
sin<p
_0 .
-g
0_
+qS
т
УкХ-
Vky +т
Vkz-
сх
cy
- cz
=/je; ♦)•
Динамика вращательного движения:
УШУ
‘Z
-(Jz-Jy}^y^z '
+ (JX—JZ')<43X(jiZ
-(Jy—Jxy^ix<^y -
дв
0
Г on
-g
~“>z
<jjy.
' Vkzu>y — Vky^z
Укхшг ~~ Укг<*Ъс
- Укушх ~ Укх^у-
(2-41)
~сх'
~ COSV
sin<p
. 0 _
+ qS
СУ
+ qSB
- mx-
tny
_ ?nz_
(2.42)
Кинематика поступательного движения:
Кинематика вращательного движения:
(2.43)
“arsin'? + oncost
— tg d(a>y cosy — a>2 sin y)
1
------ (wy cosy - a>z siny)
_costf
(2.44)
D? *h(P, 7, 0)-
Доподнительные вычисления:
V.
= ^B^H
VZA
vk-
0
Lo _
-£»cb
^XH
Wyn
. W-..
ZH J
Г
-И2 J
-vkx
Vky
-Vkz-
_n«
"св
^XH
WyH
_ Wr-
ZH J
, (2.45)
r= (V2X + V2 + И)1/2,
(2.46)
a = —arctg ——
0 - arcsin
z
Р--Ш, a=f4(H),
M = ~—
a
V'
/7'урГ2, Р = А(5р.у.Г,Я), (2.47)
36
'Сх~
СУ
-Cz _
= /в(а,Д ..., М, Re),
-?их
Шу
L mz J
=fi(a, М, Re).
Введенные здесь функции // (i = 1,2,..., 7) соответствуют:
матричная функция /t — формуле (2.4);
матричная функция /2 — таблице 2.2;
скалярные функции /3 и /4 — стандартной атмосфере;
векторная функция /5 — формуле (2.16);
векторные функции f6 и /7 — формулам (2.30).
Положения всех рулевых органов являются входными управляющими
сигналами данной модели. Скорость и направление ветра, как и неучтенные
моменты и силы, связанные со сбросом груза, изменением центровки и т.д.,
являются возмущающими факторами.
Запишем (2.41)—(2.47) в скалярном виде, используя варианты уравне-
ний, расположенные справа от вертикальной черты:
. COStp
Vkx .= Vkywz - VkzGjy -geyx + -----Р(6р.у, V, H) +
qS
+ ’" СХ(О, ^р.в > ^т.щ> ^з> М),
т
. sin р
t'ky ~ ^kz^x ~ P/cx^z ~ 8еуу "* ~^°(^р.у> Н") +
т
qS
+ —• су(а, SpB> 83, 8ГО, М),
т
. qS
Vkz ~ Vkx^y ~ ^ку^х ~ S^yz + cz (а> ^р.н> ^п.о> М),
, Jy - Jz qSi
^х ~ ojyCoz + тх(а, (3, u)x, cjy, 8э,6р.н, ^п.о, М),
•/ж **х
• _ Jz . ^ДВ
^y ' - " ^x^z Jy Jy
qSl + my(a, P, wx, <x>v, Jy ^э> ^р.н> ^р.в> ^П.О» M), (2.48)
• _ Jx Jy ^дв
Z +—— “>у + —------mz(a, a>z, 6р в,83,8Г о, М),
jz jz Jz
^хх Vkx *" еху Vky *" exz ^kzt
~ ^yx ^kx *" ?yy Pky *" £’yz Vkz,
z (.^xy^yz ~ £yyexz)Vkx + (tyx^xz ~ Cxx^yz^Vky +(8xxeyy —^yx^xy^^kz ,
^xx ~ ^z^xy ^y^xzi £yx ~ ^z^yy ^y^yzt
€Xy ~ ^x^xz ~ ^z^xxt ^yy — OJx€yg U)z€y'x,
exz ~ ^yexx ~ ^x€xy> eyz ~ ^y^yx — ^xeyy-
37
Эти дифференциальные уравнения дополняются алгебраическими соотно-
шениями, вытекающими из (2.45) —(2.47):
^Х = ^кх ~ СХХ^ХН — еху ^уя ~ eXZ^ZH>
*у ~ Ку — еух И'хн — еуу Wytt — eyz WZK,
Vz — Vkz ~ (€ху£уг ~ еуу ~ ехг)^хн ~
~(eyxexz ~ ^xx^yz'i^yu ~ (еххеуу ~ €xyeyx)WZH.
Все дополнительные алгебраические соотношения (2.49) могут быть
включены соответствующими подстановками в правые части дифферен-
циальных уравнений (2.48). В результате модель (2.48), (2.49) приводит-
ся (с учетом задания соответствующих начальных условий ) к форме Коши
х = F(x, 6, W, 0 + £х, х(Т0) = х(0), (2.50)
где х— 15-мерный1) вектор состояния модели ЛА; б — вектор управле-
ния; W — вектор скорости ветра; £х — аддитивные возмущения в виде
неучтенных моментов и сил.
Полные уравнения пространственного движения жесткого самолета
в форме (2.48), (249) обладают высокой универсальностью и при доста-
точно полном описании коэффициентов аэродинамических сил и момен-
тов (2.30), (2.31) позволяют исследовать динамику движения самолета
на предельных режимах, включая режимы сваливания на больших углах
атаки [2.13]. Однако для многих режимов полета такая модель обладает
чрезмерными сложностью и трудоемкостью.
§ 2.3. Упрощенные нелинейные модели движения самолета.
Решение частных задач управления полетом допускает применение су-
щественно более простых моделей движения ЛА. Рассмотрим несколько
вариантов моделей жесткого самолета, получаемых из (2.41)—(2.47)
путем введения дополнительных упрощающих предположений. Некоторые
иэ этих моделей получили достаточно широкое распространение.
Будем полагать, что от математической модели требуется воспроизве-
дение пространственного движения жесткого самолета при следующих
условиях:
— диапазоны изменения углов атаки и скольжения настолько невелики,
что для аппроксимации коэффициентов аэродинамических сил и моментов
можно воспользоваться линейным приближением (2.30);
— изменение высоты полета на рассматриваемом временном интервале
незначительно и влиянием изменения плотности воздуха и скорости звука
на аэродинамику самолета можно пренебречь;
— по содержанию решаемой задачи интерес представляет только ориента-
ция самолета относительно местной вертик^ги;
— ветер отсутствует.
1) Завышенная размерность вектора состояния (для движущегося в пространстве
твердого тела размерность вектора состояния равна 12) обусловлена особенностями
направляющих косинусов.
38
Первое условие позволяет упростить соотношения для коэффициентов
аэродинамических сил и моментов (2.30). Дополнительное упрощение свя-
зано с переходом от угловых величин а и Р к отношениям Уу/Ух и
К2/К соответственно. Если (FJ,/Fx)on и (Kz/F)on - опорные (средние
для рассматриваемого диапазона изменения) значения, а МУу/ Vx) и
Д(Иг/Г) — приращения этих отношений, то, применяя известные правила
линеаризации [1.38, 2.1], можно записать вместо (2.30):
сх = СХО + cxyfVx Д(^/Гх) + 4₽-в Д6р.в + ... ,
су = су0 + Cyy/Vx Д(^,/Гх) + с>в Д8р в + .. .,
cz = cVzz/V Д(Ег/Ю + cz Р’н Дбр.н + . ..,
Vz!V Л717 U7X Ых . - (2-51)
тх = тх ^Vz/V) + тх Дых + ...,
V rr f V А хТЛ /ТХ\ Y * ——
ту-ту k(Vz/V) + my ксох + ...,
= шГ>'/ГхД(Г>,/Гх) + +. ..
Введенные здесь производные коэффициентов по соотношениям Vy/Vx и
Vz/V могут быть связаны с производными этих же коэффициентов по
углам а и р. Для этого достаточно воспользоваться правилом дифферен-
цирования сложных функций. Так,
1
l+C^/^x)2 ’
57,3
1+<Уу/УХ)2 ’
(2.52)
V !V
ГУ' Х ~ а __________„ а
У У Wy/Vx) у
если производная су не имеет размерности (угол а выражен в радиаль-
ной мере), и
Vy/VX = _ а
Су Су
если производная су имеет размерность град"1. Аналогично можно полу-
чить
Vz/V_ в W ' в___________Щ________
Э(Гг/Г) Cz Vl - (Hz/K)2 (2‘53)
VV!Vx Vz!v Vzlv
и соотношения для остальных производных сх , тх , ту ,
V IV
mzy х. Напомним, что все эти производные коэффициенты должны опре-
деляться для опорных значений соотношений vy/Vx, Уг/У
Используя (2.51), а также сокращая число уравнений на основании
остальных сформированных условий, вместо (2.48) и (2.49) можно за-
писать:
cos qS I Vv )
^x ~ Vy^z ~ Hz coy — geyx + P 4 cx I , Sp B, 5тлц, S3'
m m \ Vx )
r‘r sin^ QS ( Vv \
~ wx ~ VX wz ~ seyy + P + Су I — , 6p.B , 63,5r o j,
m m\Vx /
Kz УхШу - УуС^х-geyz + Cz ( —5 8n o
m \ v
(2.54)
39
qSl
coycoz +------
Лс
™x
<^x^z ~
*дв qSl • lVz
—-—a>z+---- mv\---,Wv,w
Jy jy V
• ~ У ^д» qSba / X XX
j)z = -----CJX <*>v + ' COV + ------------ mz I >^Z> Op.B.j °3 > °r.o
Jz y Jz y Jz \ Vx
€yx OJz€yy — COy€yz, ^yy ^X^yz £yz ^y^yx ^x^yy •
Уравнения (2.54) позволяют моделировать пространственные маневры
ЛА без ограничений при выполнении перечисленных выше условий.
Изменим теперь требования, предъявляемые к модели ЛА. В ряде задач
необходимо получить процессы изменения во времени углов атаки и сколь-
жения. Эти процессы можно восстановить в модели (2.54) по отношениям
Vy/Vx и VzfV. Однако возможно и непосредственное вычисление этих
углов.
Будем полагать также, что от математической модели требуется вос-
произведение пространственного движения жесткого самолета при следую-
щих условиях:
— изменения скорости и высоты полета на рассматриваемом временном
интервале незначительны;
— по содержанию решаемой задачи интерес представляет только ориента-
ция самолета относительно местной вертикали;
— ветер отсутствует.
Углы атаки и скольжения определяют относительное положение осей
связанной у скоростной СК. Изменение этих углов во времени вызвано
пространственным вращением как связанной, так и скоростной СК. Враще-
ние связанной СК характеризуется вектором угловой скорости со =
= [сох соу coz]', определяемым из уравнений динамики вращательного
движения ЛА (2.42).
Вращение скоростной СК представляет собой сумму двух вращений.
Одно иэ них осуществляется вокруг осей OYa и OZa (см. рис. 2.5) и свя-
зано с изменением направления воздушной скорости ЛА, другое связано с
поворотом скоростной СК вокруг оси ОХа. При отсутствии ветра направле-
ние воздушной скорости совпадает с направлением земной скорости. Вве-
дем обозначение: S2C — вектор угловой скорости вращения скоростной
СК, представленный в проекциях на оси этой СК. Тогда первое уравнение
динамики центра масс ЛА (2.7) можно, пользуясь введенными ранее
обозначениями, записать в проекциях на оси скоростной СК:
(2.55)
Отсюда могут быть определены компоненты £2га и £1уа угловой ско-
рости Пс. Третья компонента Г2Л0 связана с вращением скоростной СК
вокруг вектора воздушной скорости, которое обусловлено непременным
40
расположением оси OYa в плоскости симметрии ЛА. Зная компоненты
скорости вращения плоскости симметрии и <л>у, можно определить
скорость вращения скоростной СК вокруг оси ОХа'.
cos a sin а
= со„ ---- — cov-------.
cos 0 у cos 0
При этом полагается, что 0 < л/2.
Используя (2.55) и (2.56), запишем
f2ya
^zo -
cos a sin a
----~~ — ---------
cos0 y COS0
- — (cos a sin0 sin $ — sina sin 0 cos? cos $ + cos0 siny cos t?) +
P . qS
+ — cos(a +^) sin0— —— c
m V mV
- — (sin a sin # + cos a cosy cos $) + - sin (a + <^) + -cvo
V mV mV л _
(2.57)
Тогда вектор угловой скорости относительного вращения связанной и
скоростной СК в проекциях на оси этих СК будет иметь вид
ДЯс.= 4е Xе 1 JO >3 ft ft 4 . дяс=РсВ 3* зч __ ,S xS ft ft 1 (2.58)
wz L L CO2 - L«=fl-
Учитывая, что третья компонента ДЯСВ совпадает с вектором а, а вторая
компонента ДЯС совпадаете вектором $ (см. рис. 2.5), из (2.57), (2.58)
получаем
a = со, — sin 0 - Я,„ cos 0,
(2.59)
0 = cov sin a + aiy cos a - SlYa.
Уравнения (2.59) описывают изменение углов атаки и скольжения в
произвольном пространственном положении самолета. Объединяя уравне-
ния (2.59), (2.42) и (2.37), получим модель
g
а = со, — сох cosa tg0 + cov,sina tg0 +—(sina sin $ + cosa cosy cos t?) cos 0 —
P qS
--------sin (a + <p) cos 0 — -c, cos 0.
m V mV
41
• 8
0-a> sina + u>, cosa + —(cosa sin/3 sin $ — sina sin 0 cosy cos# +
u x У рл
P qS
+ cos 0 sin у cos i?) - -cos (a + y>) sin 0 + ——- cza,
mV mV
qSl
W + “Г- mx ft шу> 5э» 5р.н » 5п.о )>
Jx
Адв
oj со. ------------ со, +
X Z т *
(2.60)
ту(а,0,(^х,с^у,Ьэ,Ьри . 8рв »^п.о ),
— Jy ^-дв qsia
"- = ------- Чх"у + ~~ ~7~ w;’5p.B>Mr.o,а),
J- J - Jу
у = сод. — tg $ (cov cos у — сог sin у),
«9 = соу sin у + сог cos у.
Эти уравнения описывают пространственное движение ЛА при ограни-
чениях
V= const, 0<ir/2, «9 =# я/2. (2.61)
Довольно распространенным является использование моделей изолиро-
ванных продольного и бокового движений ЛА. Кратко продольное движе-
ние ЛА можно охарактеризовать как симметричное движение (относитель-
но аэродинамической компоновки ЛА и ускорения силы тяжести), несим-
метричное движение ЛА относится к его боковому движению. Формально
такое разделение основано на приведении уравнений (2.41)—(2.46) к виду,
позволяющему автономно решать уравнения для компонент вектора сос-
тояния, соответствующих продольному движению, и для компонент, соот-
ветствующих боковому движению. Разделение базируется на различных
допущениях и включает три основных момента.
1. Обеспечение несущественности аэродинамических связей, обусловлен-
ных зависимостью аэродинамических коэффициентов (2.29) от пространст-
венного обтекания ЛА. При малых угловых скоростях вращения ЛА можно
полагать, что аэродинамические коэффициенты, относящиеся к движе-
нию ЛА в плоскости симметрии, и аэродинамические коэффициенты, отно-
сящиеся к его движению вне плоскости симметрии, автономны, т.е.
Сд., т. - /прод (pt, u>2, Sp_Bj ^г.о> ^3, 5т.щ),
тх. ту (0, wv, 8п о, 8Э, 8р и).
2. Обеспечение несущественности инерционных связей движений,, когда
элементы матрицы
[(J.-Jy) a>ra>z (Jx -Jz) ыхы. (Jy -J,)
в (2.26) принимают достаточно малые значения, которыми можно пре-
42
небречь. В связи с тем что моменты, инерции самолета, как правило, су-
щественно различны, выполнение этого условия может быть основано толь-
ко на ’’вялости маневрирования” (а>х «О, соу ~0, =*0). Если значения
Jz и Jy близки, то достаточно потребовать сох ~0. К инерционному взаимо-
действию относится и гироскопическое взаимодействие, которое в боль-
шинстве случаев играет не очень значительную роль в динамике ЛА.
3. Обеспечение несущественности кинематических связей движений.
Часто в литературе кинематическое взаимодействие продольного и боково-
го движений трактуется только как взаимное перераспределение углов
атаки и скольжения при вращении ЛА вокруг оси ОХ [1,2]. Этот эффект
связан с наличием слагаемых с ых в (2.59). Здесь речь идет о более широ-
ком содержании этого термина. Под кинематическим взаимодействием
будем понимать все связи продольного и бокового движений, обусловлен-
ные относительными поворотами различных используемых СК. Сюда вой-
дет, например, зависимость а от ыу, проявляющаяся при одновременном
наличии достаточно больших значений углов а и 0 [см. (2.59) ], и пр.
Будем рассматривать уравнения (2.41), (2.42) и (2.44), выбирая ва-
рианты, расположенные слева от вертикальной черты. Непосредственными
вычислениями можно убедиться, что
sinC sine +
+со«(ф—Ф) cos 0 cost?
cosOsine —
—cosGJ'—Ф)$тО cost?
— sin (^-Ф) cosd
sin® cosy cose +
+sin(t^— Ф)соз0 siny —
—cos(i^ —Ф) cos0 cos у sin в
cosO COS у cose —
—5т(|^-Ф)81п05т7 +
+со$(^-Ф)5те cosysine
sin(^~ Ф) cos 1 sine +
+ cos(4»— Ф)$т7
-sin® sin 7 cose +
+ sin(^— Ф)со$6 C0S7 +
+cos —Ф) cos® sin 7 sin e
— cos 6 sin 7 cose —
—sin(^— Ф)8шв cos 7 —
— cos(^ — Ф) sin e sin у sin e
cos(^ — ф)со$7 -
—sin(^—Ф)$ту sine «
(2.63)
Используя (2.63), можно из (2.45)—(2.47) найти формулы для углов атаки
и скольжения. Если предполагать отсутствие ветра (И* = 0), то получим
-vx-
Vy =
- sind sind + cos($ —Ф)cosd cosd
= Vk sinO cosy cosd+ sin(^ — Ф)сов0 siny—cos($ — Ф)со80 cosysind
.—sin 0 sin у cos d +sin (^ — Ф) cos в cosy + cos(^—Ф) cos Osin у sin d
A TZ IZ (2.64)
А так как = V, то можно записать
a _ sin 0 cosy cos d + sin (^ — Ф) cos 0 siny — cos (ф —Ф) cosd cosy sin d
sih 0 sin d + cos (ф — Ф) cos 0 cos d
(2-65)
sin 0 = — sin О sin у cos d + sin (^ —Ф) cos в cosy + cos (ф —Ф) cosd siny sin d.
При наличии ветра формулы (2.65) существенно усложнятся.
43
Теперь рассмотрим раздельно продольное и боковое движения. Авто-
номные уравнения продольного движения можно получитьиз (2.41)—(2.44),
полагая 7 = 0, ф — Ф = 0.
Действительно, в этом случае уравнения движения в продольной верти-
кальной плоскости дают
(2.66)
Р QS
Vk = -gsin0 + — cosfa+tf — в) + --[c cos(tf-0)-c sin(i?-0)],
m m
g P
6------cos0 + -------sin (</> + $ — 0) +
** mV*
qS
+ -----• [cx sin($ —в) + cy cos(«5 — 0)],
QSba
co, = ----- x= К cos 0 cos Ф,
Z r Z’ К ’
Jz
H=Vk$ine, i5 = coz,
где Ф - текущее значение угла пути.
При этих же предположениях первое уравнение. (2.65) приводится к
виду
а = -д—0. (2.67)
Отметим, что для учета ветра в этой модели требуют уточнения соотноше-
ние (2.67) и формулы для скоростного напора q и числа Маха М, в которых
фигурирует воздушная скорость ЛА.
Уравнения бокового движения получим для произвольного пространст-
венного положения ЛА, полагая, что углы тангажа и наклона траектории
имеют некоторые постоянные во времени значения Фоп и 0ОП. Не анализи-
руя способы удовлетворения этого условия, внесем необходимые измене-
ния в кинематические уравнения (2.37). При условии Фоп = 0 из первого
уравнения следует
^z = -%,tg7-
Тогда вместо (2.37) можно записать
tg ^оп . 1
7 = <ох-со ------, Ф = <о ----------------
cos 7 у cosi?oncos7
Таким образом, при указанных условиях из (2.41)—(2.44) можно вы-
делить уравнения бокового движения
. Pcos^ + gSc*
Ф = ------------- sin(^ — ф) cosi?„„ —
шГксо80оп
Р sin у? + qSCy
-------Тг--7----- lsin - 'Ю cos7 sin ^пп + cos (ф—Ф) sin 7] +
cos0ОП
+ ~Т, [cos(^— Ф) cosy— sin (ф—Ф)вШ7 sin d_„],
mVk cos0on onJ
(2.68)
(2.69)
(2.70)
44
qSl Vz-Jy) _
= ---mx + ---------- <*£tg 7,
x J J y
Jx x
qSl Qx~^z)
%, = —~— my + --------- wx«y tgT,
Jy Jy
# tg 1?on
z = — К cos0-n sin Ф, у = u>_. - cov —
1
Ф = CO ' —.
y cos$on cosy
Для вычисления угла скольжения при отсутствии ветра необходимо исполь-
зовать соотношение
sin/3 =—sin0ОП sinycos$on +sin($— Ф)со80оп cosy +
+ сов(ф -Ф) cos6on siny sintfon. (2.71)
В случае наличия ветра это соотношение следует заменить более полным,
получаемым из (2.45)—(2.47).
Уравнения (2.70) и (2.71) несколько упрощаются при #оп = 0оп=О, в
частности (2.71) приводится к виду
sin /3 = sin (ф — Ф) cosy. (2.72)
Одно из дальнейших упрощений связано с предположением малости углов
крена.
Модель (2.70), (2.71) описывает боковое движение жесткого ЛА при
ограничении у < it/2 весьма условно, так как в уравнение для Ф входят
коэффициенты аэродинамических сил продольного движения. Однако
более глубокой проработкой модели этот дефект можно устранить, если
ввести условие, что управляемые продольные и нормальные силы ЛА ис-
пользуются для обеспечения &оп = const, воп = const и, следовательно,
являются функциями компонент вектора состояния бокового движения.
Можно поступать и иначе: пренебрегать влиянием соответствующих сла-
гаемых в уравнении для угла пути, что может быть вполне оправдано при
достаточно малых значениях ф — Ф и у.
§ 2.4. Линейные модели движения самолета
Значительным упрощением математической модели ЛА является ее
линеаризация. Методика линеаризации уравнений движения широко из-
вестна и включает:
— выбор опорного движения ЛА;
— разложение уравнений возмущенного движения ЛА и других соотно-
шений в окрестности этого опорного движения в ряды Тейлора;
— удержание в рядах Тейлора только линейных членов (на основании
предположения о малости отклонений возмущенного движения от опор-
ного);
— вычитание из уравнений и соотношений возмущенного движения
соответствующих уравнений н соотношений опорного движения.
В результате применения этой методики все рассмотренные выше мо-
дели движения ЛА могут быть приведены к моделям в малых прираще-
45
ниях относительно произвольного опорного движения ЛА. В форме Коши
эти модели имеют вид
Дх = АДх+ЯД8 + Д£, (2.73)
где Дх — вектор приращений вектора состояний в исходной модели; Д6—
вектор приращений вектора управлений в исходной модели; А и В — соот-
ветственно квадратная и прямоугольная матрицы коэффициентов, завися-
щих от параметров опорного движения; Д£ — суммарный вектор прираще-
ний возмущений.
Рассмотрим процесс линеаризации в общем виде. Пусть движение ЛА
описывается дифференциальным уравнением
x = F(x,a,b,t), (2.74)
где х — п-мерный вектор состояния; а — r-мерйый вектор параметров,
определяемых свойствами среды; 5 — m-мерный вектор положения руле-
вых органов; t — текущее время.
Введем в рассмотрение произвольно изменяющиеся во времени вектор
состояния ЛА хоп (О и вектор положения рулевых органов 6ОП (т) (для
этихвек'торов удовлетворение уравнения (2.74) необязательно).
Разложим теперь уравнение (2.74) в окрестности хоп и боп в ряды
Тейлора, полагая, что эти векторы соответствуют опорному движению. В
результате получим
9F 3F
хоп + Дх = F(xon, а, 8ОП, 0 + -- Дх + — Д6 + О2, (2.75)
Эхоп Э6ОП
где Дх = х — хоп, Д5 = 5 — 6ОП — приращения вектора состояния и вектора
положения рулевых органов по отношению к векторам хоп и 5ОП соответст-
венно; 3F/3xon и 3F/36on — матрицы частных производных векторной
функции F по компонентам векторов х и 6, вычисленные при значениях
х-хоп и 6 = 8ОП; О2 — малые величины более высокого порядка.
Из (2.75) следует общий цид уравнения дня приращений
3F 3F
Дх= --------Дх + -------ДЗ+F -х +О2. (2.67)
Э5оп
При достаточно малых отклонениях х и S от опорных значений хоп и 8ОП
малыми величинами более высокого порядка в (2.76) можно пренебречь.
Конкретный вид линеаризованной модели зависит от выбора опорного'
движения хоп (t), 5ОП (г) ЛА. Большой интерес представляют два частных
случая:
а) в качестве опорного движения выбирается некоторое ’’невозмущен-
ное” движение ЛА, когда хоп (О И ^ОП (г) удовлетворяют исходному урав-
нению (2.74), при этом линеаризованная модель имеет вид
Дх =
3F
Эхоп
Дх +
3F
Э«оп
Д6;
(2.77)
б) в качестве опорного движения выбираются неизменные во времени
состояние ЛА и положение рулевых органов, т.е. хоп = 0 и 5ОП = 0, при
46
этом линеаризованная модель имеет вид
bF bF
Дх- ~ Дх + ~ Д6 +F(xon, а, 6ОП, t).
°хоп ®°оп
(2.78)
В данном параграфе речь идет только о моделях типа (2.77), а модели
типа (2.78) будут использоваться в последующих главах.
Рассмотрим некоторые линейные модели движения самолета, получен-
ные линеаризацией относительно невозмущенного движения ЛА приве-
денных в § 2.3 моделей.
В результате линеаризации (2.60), пренебрегая приращениями сил, выз-
ванными отклонениями рулевых органов, получим
•— *
Да aa а^х аыУ 1 ay Да
a а a a a a
Д0 al ae 0 •; ДР
Дс5„ aa а“х CiJ а у a z 0 0 Да>х
mx mx mx mx mx
ДсЬ,, aa ^x a x а"У a z 0 0 Дсо,, . +
У my my my my my У
ДсЬ, aa a? a x а^У a z 0 0 Деи,
z mz mz mz mz mz z
Ad 0 0 0 а у 0 ^z % 0 ДР
_д7 . _0 0 1 CJ а У У a^z У a* У ay T-J Ду
0 0 о
о о о
+ 6э а 9 тх а6- ту /ри тх а6Р-" ту 0 0 "AS, - Д«р.н (2.79)
0 0 д6Р-в mz - Д«Р.в_
0 0 0
0 0 о
Коэффициенты для этой модели определяются соотношениями
= “’хоп sin“on tgflon + %'оп ««“on tgPon + “ (««“on Sinton -
~sm“on cos7on cos^on)cos₽on------ sin(a + <^)cos0on +
p mV °"
+ cos(aon+^)Cos0on -
Л = {wxonC0S“on “ -} + Wyon sin«on ---- -
008 ^ОП J cos20on
47
g
- — (s«aon sin,5on +cosaoncosToncosi5on)sin/3on +
P д qS
+ 77 (a°" мл'’°" - 77 c>°mf>°"+ 77" •
aaX = < “ COS“on *8Pon h °«У = tg ^on-
fla = - -f <S4« cos *o« - COsaon C0S 'Von sin U C05 ₽on >
у g .
aa у COSaon sm'Von «Чп cos^on>
ae = < Шхоп COSQon ) - %ои Sinaon ~ “ (sinaon sin0on s4n +
pa
+ cos aon sin0on cos Toh cos tfon) - —— cos(aon + sm 0on +
Л>п qS
+------sin (a„„ + <z?) sin fl „ +-c ,
mV V on Pon my za’
“• (COSO£on COS0on Sin,5on - Sin0£on C(4n COS'l'on COS^on -
^on ( qS „ \
- Sin0on Sinion cos0ОП)- —у cos(aon +^)cos0on + ( |,
= {sinaon}, fl“> = _{costton), (2.80)
‘v (cosa°n sin0°"cos ’3°n + sina°n sin /3°n cos ?on sin ^on ~
-cos ^onsin>Onsin^on).
g
aj = ~ Фпаоп sin|3on sin?on cosflon + { cos0on cosion cos 0on
}),
mx
qSl
qSi <jjv
------ tn y
zon
48
а^У = sin уоп, а“г = { cos уоп },
а1 = ^-оп c°STon - wzon sinyon, а“у = -tg«?on cosyon,
<г = teAm sinTOn> < =--------— (%,on cosyon - согоп sinyon),
cos4>n
ay = tg ’’on Hon cos yon - wyon sin yon).
Здесь в фигурные скобки заключены слагаемые, оказывающие наибольшее
влияние на характер динамических процессов в модели в условиях полета,
близких к горизонтальному прямолинейному полету (аоп О, «5ОП ~ О,
уоп * О, 0ОП *0). Как показывают результаты моделирования, при анализе
только ’’быстрых” движений самолета в уравнениях (2.79) для Да и Д$
можно пренебречь составляющими, обусловленными- силой тяжести ЛА
и тягой двигателя. Это позволяет сократить общее число уравнений модели,
исключив уравнения для Д 6 и Ду (последние два уравнения).
Таким образом» для моделирования взаимосвязанного движения само-
лета по тангажу и рысканию в ряде задач может использоваться упрощен-
сол. «а 0 1
ар ае 0
Ь>х “у
атх атх атх
^х ату “ту ату
tnz LJ -V а * “z amz
Д6Э
Д8р.н
Д^р.В
“Да
Д<Оу
(2-81)
На рис. 2.7 приводятся переходные функции пространственного движе-
ния самолета, полученные с использованием моделей (2.60) и (2.79).
При этом последняя из них была дополнена слагаемыми, отражающими
инерционное взаимодействие (см. п. 2 в § 2.3). Анализ этих функций по-
казывает, что при отклонении элеронов или руля направления на 10°
(такие отклонения можно полагать ’’большими”) движения моделей в
течение первой секунды мало различаются. В дальнейшем возникают су-
щественные различия (см. д на рис. 2.7, а).
4.В.И. Буков
4?
О 0,5 1,0 1,5 Zfl if 0 Ofi 1,0 1,5 гр t,c
Рис. 2.7. Сравнение переходных функций нелинейной (сплошные линии) и линейной
с добавлением инерционных связей (штриховые линии) моделей самолета: а ~ реак-
ция на отклонение элеронов бэ = -10°; б - реакция на отклонение руля направления
бри = -10е
Проведем линеаризацию уравнении изолированного продольного движе-
ния самолета (2.66) с учетом (2.67) и (2.30). Применение описанной выше
методики при дополнительном предположении Ф = 0 дает [1.2, 1.5,
1.38,2.1]
дг/ Г V ~ах е . а- -ах +ах 0 0 H ~ax 1 Cl X c ДК/
Д0 V ~аУ 0 Ct ~аУ+аУ 0 0 -aH У 1 Д0
До>г — V атг W2 — a* mz 0 H &mz ~amz Д<иг +
Дх COS0on' - Fksinflon о ♦ 0 0 0 Дх
ДЯ sin $оп K*cosflon 0 0 0 0 ДЯ
.д*. 0 0 1 0 0 0 да _
50
•о -a?’” «и «3
+ 8Р-У аУ 6Р.У umz 0 0 а*рв -д8рв umz 0 0 6Э аУ. 6Э -amz 0 0 Afip.y Д5Р.в _Д6Э
.0 0 0
(2.82)
Выражения для коэффициентов (2.82) могут быть получены дифферен-
цированием правых частей уравнении (2.66) и здесь не приводятся.
Отрицательные знаки перед коэффициентами в (2.82) расставлены
таким образом, чтобы сами коэффициенты в случае статической устойчи-
вости самолета с компоновкой, показанной на рис. 2.1, являлись поло-
жительными.
Уравнение (2.82) часто упрощается отбрасыванием’’свободных” компо-
нент вектора состояния, не образующих внутренних обратных связей в
модели, и пренебрежением наиболее слабыми связями. К ’’свободным”
компонентам в (2.82) относится Дэе (соответствующий столбец матрицы
Э//Эхоп содержит только нулевые элементы). К слабым связям относят
связи по высоте полета, которая в режимах полета, близких к горизон-
тальному, меняется относительно медленно. Полученные таким упро-
щением уравнения частд называют [1.38] полными линейными уравнения-
Дальнейшее упрощение (2.83) связано с тем, что продольное движение
ЛА представляет собой совокупность двух колебательных процессов.
Один из них имеет'относительно высокую частоту и протекает практически
при достоянной скорости полета, а второй имеет относительно низкую
частоту и сопровождается гармоническим изменением скорости полета.
Эти процессы получили соответственно названия короткопериодического
движения и длиннопериодического движения.
Матричное уравнение короткопериодического движения можно получить
из (2.83), принимая скорость ЛА постоянной и исключая из вектора со-
4* 51
стояния первую компоненту. В результате [2.1] имеем
де “ - 0 Q ~ аУ +ау 0 -а* 1 У де бр-В ау
Д<Ьг = amz т z amz — аи mi Да>г + бр.В ~ amz
Д£ _ 0 1 0 _Д£ 0
бз
ау.
а*3
о
ГД«р.в
1Д53
(2-84)
Аналогично из (2.70) и (2.71) можно получить линейные модели боко-
вого движения самолета. При этом в случае произвольных значений аоп и
$оп связь между Д£Ги Де,Ду, Дф,ДФ следует определить линеаризацией
(2.71). Другой путь получения линейных уравнений бокового движения
самолета связан с соответствующими упрощениями (2.79). Полагая а и д
неизменными, на основании (2.79) можно записать (дополнительно учи-
тывая приращения сил, вызванные отклонением рулевых органов)
“-с/ sin аоп COS Ооп у~1 -Д0 '
Д6Х атх „шх атх Шу атх 0 Дюх
ДсЬу ату Шу ату шу ату 0 Д<оу
_Ду 0 1 -tgi?oncosyOII 0 _Ду.
"щпо
бп.о
атх
®П.О
^ту
о
0 0
где az = -ар,
0
бэ
атх
“ту
о
„У -У
Матричное уравнение
бр.н
атх
«р.н
атпу
о
~Д5п.о’
Дбэ
-Д^р.н-
(2.85)
(2.85) упрощается разделением его на уравнения
изолированных движений по крену и рысканию [1.38, 2.1]. В целях полу-
чения уравнения изолированного движения по крену предполагается, что
угловая скорость рыскания соу настолько мала, что ее влиянием на враще-
ние ЛА вокруг оси ОХ можно пренебречь. Кроме того, угол скольжения
принимается равным нулю (условие координированного разворота ЛА),
т.е. коэффициенты аг, afnx и at„y без ущерба можно исключить. Тогда
имеет место уравнение
Д6И = [ °НДаЧ +
Ду J L — 1 0 J . Ду L0
(2.86)
которое описывает изменение крена ЛА при указанных выше предполо-
жениях.
52
§ 2.5. Модели пилотажных датчиков и рулевых приводов
Неотъемлемой частью систем автоматического (автоматизированного)
управления движением ЛА являются исполнительные устройства, откло-
няющие рулевые органы ЛА в соответствии с реализуемыми законами
управления, и различные первичные измерительные преобразователи (дат-
чики) информации, используемой для формирования управления.
Естественным и широко распространенным способом учета при модели-
ровании динамических и статических свойств исполнительных устройств
(приводов) и измерителей (датчиков), а также их случайных ошибок
является включение математических моделей этих устройств в модель
обобщенного объекта управления. В этом случае следует полагать, что
уравнение (1.1) описывает:
— движение собственно объекта управления;
— процессы, протекающие в приводах, реализующих сигналы управ-
ления;
— процессы, протекающие в датчиках, используемых для получения ин-
формации о состоянии ЛА.
Управление и в (1.1) представляет собой сигнал управления рулевым
органом. Уравнения (1.2) и (1.3) отражают преобразование выходных
сигналов соответствующих датчиков.
Вопросы построения математических моделей авиационных датчиков и
приводов широко рассматриваются в литературе. Так, детально ознако-
миться с моделями разнообразных датчиков и измерительных систем мож-
но, например, в [1.49, 1.10]. В более простом виде эти модели изложены
в [1.50, 2.14]. Моделированию приводов, используемых в авиации, посвя-
щены работы [1.10, 2.15—2.17].
Здесь ограничимся лишь тем, что приведем уравнения упрощенных ма-
тематических моделей этих устройств, используемых в дальнейшем.
В большинстве случаев датчики, предназначенные для измерения угло-
вых скоростей, угловых ускорений, линейных ускорений (перегрузок),
углов атаки и скольжения в линейной зоне их характеристик могут быть
представлены математическими моделями динамической системы второго
порядка (колебательного звена) с генераторами (источниками) погреш-
ностей в виде
У1 =У2,
У2=~ (^1у 1 - 2$д + c^nXf + т?д, (2.87)
г = *дУ1 + L,
где yt — вспомогательные переменные; X/ — полезные измеряемые вход-
ные сигналы (компоненты вектора состояния ЛА); сод — частота собствен-
ных недемпфированных колебаний измерительного элемента датчика;
£д — относительный коэффициент затухания колебаний измерительного
элемента датчика; пд — помехи на входе датчика (методические ошибки,
связанные с измерением других компонент вектора состояния, наличием
высокочастотных составляющих, вызванных, например, механическим
раскачиванием измерительного элемента датчика из-за вибрации конструк-
ции ЛА, и т.д.); ка — коэффициент передачи датчика; £- — ошибки дат-
чика, возникающие при съеме сигнала.
53
Часто ошибки £z представляют суммой медленно изменяющихся или
постоянных ошибок (неточная юстировка) и изменяющихся случайных
ошибок, для которых оговариваются статистические характеристики. Если
случайные ошибки можно полагать стационарным процессом, то эти ошиб-
ки определяют как выходной сигнал формирующего фильтра, на вход ко-
торого подается белый шум [1.10].
Другие датчики, такие как баровысотомеры, радиовысотомеры, измери-
тели воздушной скорости и пр., принято представлять [1.50] динамически-
ми системами первого порядка (инерционными звеньями) с источниками
погрешностей:
У = ~ J + — Х/ + Чд, z = kay + j-g, (2.88)
где Тл — постоянная времени датчика.
Надо заметить, что при исследовании процессов управления движением
ЛА* первого уровня приближения динамические ошибки датчиков, как
правило, не учитываются и в (2.87), (2.88) полагаются ух =Xj v\y-Xj со-
ответственно.
Исполнительные приводы рулевых органов выбираются из условия,
чтобы их нагрузочные характеристики обеспечивали необходимую динами-
ку процессов управления, другими словами, от них требуется обеспечение
перемещения с заданной скоростью рулевого органа, нагруженного внеш-
ними силами или внешними (шарнирными) моментами.
По принципу построения и характеру используемой энергии авиацион-
ные приводы рулевых органов делятся на электромеханические, электро-
гидравлические и электропневматические. Каждый из этих типов приво-
дов обладает динамическими особенностями, и, кроме того, встречаются
различные количества каскадов преобразования энергии в приводах. Все
это обусловливает различие математических моделей этих приводов.
В упрощенной постановке можно полагать, что электромеханические и
электропневматические приводы при наличии обратной связи по положе-
нию рулевого органа описываются моделью вида
£1 =1 h, th. ~ -Л45 - Л 3 sign 6 - Л28 + Л1М,
^тах при М2 >8тах»
6 = Д2 при ^min < М2 < ^тах.
^min при ^2 <8min, (2.89)
^тах при Ml >Smax,
8 = Ml при ^min <М1 <8тах,
• ^min при Ml ^^min.
где Ду - вспомогательные переменные; At — параметры модели привода;
^тах» ® min» ®шах» ° min — предельные технически реализуемые отклонения
и скорости отклонения рулевых органов. Здесь составляющую А 25 следует
рассматривать в общем случае как суммарный эффект жесткой обратной
связи, предусмотренной конструкцией привода, и шарнирного момента, дей-
ствующего на руль (в последнем случае проявляется существенная зависи-
54
мость этой составляющей от режима полета, т.е. скорости и высоты полета,
угла атаки и пр.). Аналогично составляющую А 45 следует рассматривать как
суммарный эффект скоростной обратной связи привода и вязкого трения
(обусловленного воздушной средой и конструкцией). Составляющая А 3 sign S
обеспечивает моделирование зоны нечувствительности, интерпретируемой
как следствие действия сухого трения.
Для описания электрогидравлического привода, полагая, что его дина-
мические свойства определяются только характеристиками выходного
каскада преобразования энергии, можно воспользоваться более простой
моделью (в силу слабой сжимаемости гидросмеси)
А = ~ ЛзЯёп 5 — Ai 5 +AiU,
^тах при А ^maxi
5 = А при ^inin < А < ®тах,
при А ^min, (2.90)
^тах при Р т а х >
5 = Р при ^min Р < ®тах-
‘ ^min при Р ^min>
где все обозначения соответствуют (2.89).
Приведенные модели приводов могут упрощаться в еще большей степе-
ни исключением различных составляющих в правых частях дифференциаль-
ных уравнений (2.89), (2.90).
Глава 3
АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ
ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ
Рассматриваемые в данной книге алгоритмы оптимального управления
с прогнозирующими моделями являются одним из вариантов решения за-
дачи аналитического конструирования оптимальных регуляторов (АКОР) в
формулировке АА. Красовского. В последнее время отмечается возраста-
ние интереса именно к этому варианту АКОР, что, очевидно, обусловлено
принципиальной возможностью решения с его помощью достаточно слож-
ных задач оптимизации управления нелинейным объектом при неквадратич-
ном функционале. Некоторое недоверие исследователей, связанное с осо-
бенностями используемого критерия обобщенной работы, быстро преодо-
левается, так как ’’полуопределенность” этого критерия не влияет на
конструктивные стороны синтеза управления.
§ 3.1. Критерии оптимальности управления
Свойства адаптивного оптимального управления в значительной мере
определяются выбранным критерием оптимизации. Это должен быть техни-
ческий или тактико-технический критерий, выраженный функцией или
функционалом компонент состояния и управления объектом. Выбор
критерия оптимальности — это инженерная задача, решаемая на основе глу-
бокого изучения управляемого процесса. Трудности установления крите-
рия связаны с тем, что требования к системе очень часто оказываются про-
тиворечивыми. Сделать систему оптимальной одновременно по всем проти-
воречивым критериям невозможно. Возникает проблема формулировки
некоторого единого критерия, который давал бы компромиссное решение
задачи [3.1, 3.2].
Эта проблема еще более усложняется при построении многофункцио-
нальных систем управления. Так, предположительно адаптивная оптималь-
ная система управления полетом перспективного ЛА должна одновременно
или в управляемой последовательности решать большинство или даже все
возникающие задачи управления полетом. В связи с этим выбранная форма
критерия должна предусматривать возможность отражения компромис-
сных для одновременно решаемых задач требований к управляемому поле-
ту и перестраивание параметров критерия с изменением режима или этапа
полета.
При системном подходе к решению задачи оптимизации управления
полетом целесообразно, очевидно, использовать в качестве критериев опти-
мальности выражения для таких обобщенных показателей, как вероятность
выполнения полетного задания, сохранение или достижение определенного
уровня полной или кинетической энергии полета, обеспечение определен-
56
кого экономического эффекта. В то же время методика работы с подоб-
ными критериями в задачах формирования сигналов управления пока еще
разработана недостаточно.
С инженерных позиций представляется естественным построение крите-
риев оптимальности, непосредственно учитывающих частные прямые пока-
затели качества процесса управления [3.2]. Эти показатели (установившие-
ся ошибки, время регулирования, перерегулирование, величина колебатель-
ности, период колебаний и т.д.) физически наиболее ясны и имеют четкие
границы допустимых значений, основанные на богатом опыте конструиро-
вания систем.
Однако более широкое распространение в методах проектирования
систем управления получили косвенные показатели качества, которые,
как правило, проще вычисляются и более удобны в аналитических иссле-
дованиях. К ним относятся корневые, частотные и интегральные показате-
ли. Косвенные показатели, как известно [3.2], связаны с прямыми, но ха-
рактер зависимостей в большинстве случаев еще не раскрыт, что снижает
’’прозрачность” формулируемых с их помощью требований.
Каждая из названных групп косвенных показателей качества адекватна
различным методам синтеза оптимальных систем управления, обеспечиваю-
щих наилучшие значения выбранных показателей. Для методов синтеза
управлений объектами, динамические свойства которых заданы в простран-
стве состояний, наиболее удобными являются интегральные показатели
качества [1.45, 3.2].
Конкретная форма выбранного интегрального показателя качества
управляемого движения тесно связана с методом синтеза. В достаточно
общем случае такие показатели описываются функционалами вида
'к гк
/•= И3ад [x(rK), ZK] + f Q(x, t}dt + J L(u, t)dt, (3.1)
f 0 ^0
определенными на всех возможных траекториях x(t) в Хп для V/ G
G ['о, Гк] • Здесь Изад, Q и L — заданные функции указанных аргументов,
удовлетворяющие некоторым условиям. Первое слагаемое в (3.1) часто
называют терминальным членом функционала. Оно определяет вклад в
функционал конечного (в момент времени Гк) состояния объекта. Речь,
естественно, идет о задачах со свободным правым концом, когда отсутству-
ет требование непременного прохождения вектора состояния через задан-
ную точку в момент tK. Второе слагаемое в (3.1) представляет собой ин-
тегральную оценку качества переходного процесса объекта управления на
интервале [r0, fKJ- Третье слагаемое — это интегральная оценка ’’расходов”
сигналов управления на интервале [r0. fK] •
Если функции Езад, Q и L функционала (3.1) являются положительно-
определенными в Хп и Um, а их единственные нулевые значения соответ-
ствуют состоянию объекта, требуемому по условию решаемой задачи, то
оптимальность синтезируемого управления можно понимать в смысле
достижения минимума функционала (3.1).
Задачи оптимизации движения по постановке делятся на терминальные
и нетерминальные [1.5]. В терминальных задачах формулируются требова-
ния к движению объекта в конкретный (конечный) момент времени tK,
57
который имеет физический смысл и назначается из условий прикладной
задачи. Удовлетворение этих требований является принципиальным для-
рассматриваемого этапа полета. К таким задачам относятся, например,
посадка самолета, вывод ЛА в заданную точку пространства в заданное
время и т.д.
Нетерминальная постановка задачи характерна для режимов типа демп-
фирования угловых колебаний, стабилизации заданной перегрузки, задан-
ного углового положения ЛА и т.д. При этом особые требования к состоя-
нию управляемого объекта в конечный момент времени не формулируют-
ся, а оценивается лишь качество движения на всем рассматриваемом
интервале [?о> /к] Часто в таких задачах момент окончания процесса tK не
назначается заранее. В этом случае при решении нетерминальных задач
удобно пользоваться скользящим интервалом оптимизации [1.5]
1Т = Изад[х(г + Т), t + 7] + J Т Q(x, T)dr + t+fT L(u, r)dT. (3.2)
t t
Здесь t — текущий момент времени; T — заданная длительность интервала
времени, для которого осуществляется оптимизация управляемого движе-
ния объекта.
Типичным для задачи управления полетом с математической точки зре-
ния является требование достижения объектом (1.1) некоторого заданно-
го состояния хЭад с последующим удержанием состояния объекта в малой
окрестности х3ад- При этом на всем интервале [f0, tK] состояние х(т) не
должно выходить за границы заданной в Хп области 0, необязательно со-
держащей как начальное 1) состояние х 0b ) > так и хзад. Такая формулиров-
ка требований к управляемому движению ЛА, в отличие от широко рас-
пространенных в литературе по адаптивному управлению полетом (см.
гл. 1), отражает не только стремление к высокому (в смысле интегрально-
го критерия) качеству управления, но и необходимость выдерживания
пилотажных ограничений (максимальной перегрузки, максимального угла
атаки, максимальной скорости полета и т.д.). Область 0 называется
эксплуатационной и выбирается из условий достижения высокой эффектив-
ности и обеспечения безопасности функционирования объекта управления.
Следовательно, в общем случае выбранный критерий оптимальности
адаптивного управления может (и должен по физическому содержанию
прикладной задачи) объединять требования двух важных взаимосвязанных
функциональных задач: управления (стабилизации) полетом и выдержи-
вания пилотажных ограничений, до сих пор решаемых автономно.
Положительная определенность подынтегральных функций функциона-
лов (3.1) и (3.2) допускает использование для разработки конкретных
критериев оптимизации широкого класса функций Q и L. Соответствую-
щий выбор этих функций может обеспечить физическое содержание мини-
мизируемому функционалу (потери кинетической, потенциальной или пол-
ной энергии, расходы ограниченных ресурсов и т.д.).
1) Имеется в виду, что по каким-либо причинам меры по выдерживанию границ
области 0 могут приниматься после того, как нарушение границ произошло.
58
В то же время опыт решения задач управления динамическими объекта-
ми показывает, что в большинстве случаев требования к качеству переход-
ного процесса могут быть приведены к квадратичной форме функ-
ции Q(x, г):
1
<2кач(*. 0 = — О - *зад) 0(0 (* - *зад), (3-3)
где 0(t) — положительно-определенная матрица в общем случае нестацио-
нарных коэффициентов. При этом указанная ранее проблема выбора крите-
риев сводится к выбору элементов матрицы (3.
Если границы области 0 не являются абсолютно строгими, т.е. допусти-
мо кратковременное пребывание х(г) в малой окрестности вне области 0,
то для формализации установленных ограничений можно воспользоваться
штрафными функциями, значения которых тождественно равны нулю в
области 0 и положительны вне этой области:
{О при х е 0,
ш(х)>о при хфе. <3‘4)
Если 0 является многогранником, то функцию(3.4) можно записать в виде
{О при xG'0,
а,'(О* + Т/ при х^0, (3‘5)
где а} (г) — вектор достаточно больших коэффициентов, соответствующих
компонентам вектора состояния и характеризующих ’’строгость” границ.
Матричное уравнение
а,'х + yt = 0 (3.6)
в этом случае представляет собой уравнение гиперплоскости соответствую-
щей грани 0 (/ — номер грани). Принятием специальных условий (таких,
как замкнутость области 0) может быть обеспечена односторонняя диффе-
ренцируемость функции Сш на границе 0.
В общем случае будем полагать
Q ~ Скач + Ош • (3-7)
Правильный выбор векторов а(т) в (3.6) обеспечивает необходимое соче-
тание составляющих в (3.7). Полагается, что вне области 0 функция
в (3.7) должна доминировать.
Возвращаясь к структурной схеме адаптивной оптимальной системы
управления, приведенной на рис. 1.5, можно отметить, что среди информа-
ции, поступающей в блок оптимизации управляющих сигналов извне, долж-
ны быть заданное состояние хзад, параметры минимизируемого функцио-
нала (коэффициенты функций (3.3), (3.4) и длительность интервала опти-
мизации rK — t), а также описание границ области 0 допустимых состояний
в Хп. Описание границ области 0 может быть выполнено один раз на этапе
проектирования и сохраняться при всех последующих использованиях ЛА.
Остальная информация может изменяться в процессе полета в зависимости
от цели использования ЛА, решаемых задач и этапа полета.
Заданное состояние хзад для ЛА может отражать заданное положение
центра масс ЛА в пространстве, заданные значения перегрузок или компо-
59
нент, характеризующих угловое положение ЛА, и пр. При автоматическом
управлении полетом этот вектор определяется старшим уровнем иерархии
бортового комплекса на основе, например, решения навигационной задачи.
При автоматизации ручного управления самолетом вектор формируется
на основе создаваемых летчиком отклонений органов управления.
В любом из этих случаев имеются, вообще говоря, две возможности фор-
мализации требований к динамике переходных процессов управляемого
движения. Первая из них сводится к тому, что хзад формируется практи-
чески мгновенно по результатам анализа решения навигационной задачи или
положения органов управления. Все требования сосредоточиваются в соот-
ветствующем подборе параметров функционала. Вторая возможность
заключается в использовании эталонной модели движения ЛА, возбуждае-
мой сигналами навигационного вычислителя или датчиков органов управ-
ления. Параметры функционала подбираются из условия обеспечения наи-
лучшего слежения ЛА за эталоном.
Первый способ представляется менее обременительным, но указанное
выше отсутствие непосредственной ясной связи прямых и косвенных
показателей качества движения может создать трудности на этапе формули-
рования критериев, особенно для задач автоматизации ручного управления.
Второй способ опирается на уже достигнутые результаты в области проекти-
рования систем управления ЛА [3.3]. Оба эти способа при автоматизации
ручного управления полетом требуют продолжения исследований человеко-
машинных систем.
Ниже основное внимание уделяется путям реализации адаптивного опти-
мального управления при заданных хзад и подынтегральных функциях
(3.3) критерия оптимальности управляемого движения.
§ 3.2. Методы аналитического конструирования
Для последнего десятилетия характерно бурное развитие общей теории
оптимального управления, базирующейся на рассмотрении пространства
состояний и функционалов качества управления. Методы этой теории все
в большей мере конкурируют с классическими методами анализа и синтеза
систем регулирования как при решении традиционных задач, так и при
реализации новых принципов управления динамическими объектами.
К числу таких методов относится аналитическое конструирование регу-
ляторов. Наиболее полное решение задачи оптимизации в общем виде,
характерное для аналитического конструирования, обусловливает интерес
к этому методу с точки зрения осуществления совмещенного синтеза опти-
мальных управлений в адаптивной системе управления.
За полноту общего решения аналитическое конструирование расплачи-
вается условиями, накладываемыми на динамические свойства управляемо-
го объекта и на структуру критерия, отражающего предъявляемые к управ-
лению требования. Укажем эти условия.
1. Уравнение (1.1), описывающее движение объекта, линейно относи-
тельно вектора управляющих воздействий, т.е. вместо (1.1) можно поль-
зоваться записью
х = f(x, a, t) + <р(х, a, t)u, (3.81
60
где f и i(> — известные с точностью до вектора параметров векторная и
матричная функции указанных аргументов.
2. Область возможных значений управляющих воздействий в Um являет-
ся незамкнутой.
3. Все возможные переходные функции объекта (3.8) непрерывно диф-
ференцируемы в Хп.
4. Минимизируемый функционал (3.1) или (3.2) является квадратич-
ным относительно вектора управления и, т.е. подынтегральная функция
последнего члена в каждом из этих функционалов имеет вид
1 ,
L(u, t) = ~u(t)K Wutf, (3.9)
где K(t) — некоторая положительно-определенная невырожденная матрица,
характеризующая ’’свободу” выбора управлений в Um.
Перечисленным условиям может быть дана физическая интерпретация.
В большинстве случаев зти условия приводят к несильным ограничениям
в практических задачах. Так, удовлетворение условия 2 при ограниченных
управляющих воздействиях в реальной системе может быть обеспечено
соответствующим выбором K(t) в (3.9). Как показано в [3.4—3.7], усло-
вия 1, 2 и 4 в определенном смысле могут быть ослаблены.
В настоящее время известны две формулировки метода аналитического
конструирования: Летова — Каймана [1.5,3.8] и А.А.Красовского [1.5, 3.9].
Формулировка, данная АА. Красовским, отличается включением в мини-
мизируемый функционал дополнительно интегрального члена с положитель-
но-определенной подынтегральной функцией вектора состояния и в общем
случае времени. Структурно этот член для (3.1) может быть представлен
в виде
1 *к ,
~ / иоптК ноптс?т, (3.10)
2 t0
где иопт — ж-мерныи вектор неизвестных пока оптимальных управляющих
воздействий. Так как в предположении существования решения задачи
управления вектор иопт является функцией вектора состояния и времени,
то подынтегральная функция в (3.10) действительно является функ-
цией X и t.
Таким образом, при оптимизации управления объектом (3.8) на интер-
вале [f0, fK] по Летову — Калману минимизируется функционал
Лт-к = 'к] + f Q(x, t)dt + 7 J u'K~l(f)udt, (3.11)
ro 2 t0
а по A.A.Красовскому — функционал
гк 1 гк
Лер = ^задМ^к).^] + f Q(x, t)dt + — f (u'K^u + u^K^u^dt.
(3.12)
При выполнении условий 1, 2 и 4 гамильтониан системы, т.е. веществен-
ная скалярная функция вида
( дУ \ дУ „
К [л,-----,u,t] = Q+L +-----F, (3.13)
\ дх / дх
61
где V — некоторая вещественная дифференцируемая функция, определен-
ная в Хп X (Го, rK j, а 3 V/dx — матрица-строка, элементами которой являют-
ся частные производные V(x, t) по компонентам вектора состояния х(/),
регулярен относительно Хп. Другими словами, существует единственный
абсолютный min ЗС в Хп.
Действительно, в силу (3.8) и (3.9) слагаемые гамильтониана (3.13),
зависящие явно от управления и, принимают внд
1 , . ЭК
— и К и + —• <ри-
2 Эх
Воспользовавшись тем, что эта сумма является скаляром, ее можно при-
вести к виду
1 , 1 ЭК I , , ЭК'
— и К 1 и +------<ри + —и ------+
2 2 Эх 2 Эх
1 ЭК , W 1 ЭК , ЭК'
Н - — — —— фКф ----- ,
2 Эх Эх 2 Эх Эх
что эквивалентно выражению
1 / ЭК'\' , / , дУ \ 1 ЭК , ЭК'
-(н+Я/---------IK"* и+А/--------I--------. (3.14)
2 \ Эх / \ Эх / 2 Эх Эх
Отсюда следует, что при положительной определенности матрицы К в
открытом множестве Um гамильтониан имеет единственный минимум при
. , dV<
ыопт Kfp "Г •
(3.15)
Регулярность гамильтониана ЗС, выполнение условия 3 и существование в
ХпХ |/0, гк] такого непрерывного дифференцируемого решения К(х, /)
уравнения Гамильтона — Якоби
ЭК Г dV / ЭК \ 1
+Jf|x, , «опт! х> Л|,/|=0, (3.16)
Э/-----------------------------------------------------L Эх-опт\ Эх-/ J
которое при t = tK принимает значение К[х(/к), гк] = Узяд (x(tK), tKJ, в
соответствии с теорией Гамильтона — Якоби [1.20, 3.4] обеспечивают не-
обходимость и достаточность управления (3.15) как решения задачи опти-
мизации (33), (3.1).
Соответствующими подстановками из (3.11) или (3.12) в (3.13) и (3.15)
с учетом того, что при оптимальном управлении первое слагаемое в (3.14)
обратится в нуль, можно убедиться, что уравнение Гамильтона — Якоби в
постановке Летова — Калмана принимает вид
а в постановке А.А. Красовского — вид уравнения Ляпунова
ЭК ЭК
--+ ----
(3.18)
Граничные условия для этих уравнений одинаковы и определятся соот-
ношением
И(Гк)=Рзад[х('к)Лк]. (3.19)
Содержание метода аналитического конструирования сводится к реали-
зации (3.15) с использованием решения (3.17) или (3.18).
Сопоставление (3.17) и (3.18) показывает, что в вычислительном отно-
шении аналитическое конструирование в формулировке А.А. Красовско-
го имеет определенные преимущества. Во-первых, уравнение (3.18) имеет
меньшее число вычислительных операций, а во-вторых, оно линейно отно-
сительно частных производных искомой функции (функции Ляпунова)
К(х, t). Как показано в (1.43), линейность (3.18) не только упрощает
процедуры поиска решения, но и обеспечивает автономность задач достиже-
ния высокого качества управления по (3.3) и выдерживания заданных
ограничений (3.4).
Указанные обстоятельства определяют выбор метода аналитического
конструирования в формулировке А.А. Красовского как основного метода
совмещенного синтеза управлений в многопараметрической адаптивной
системе управления.
Использованию и анализу этого метода как в детерминированных, так
и в стохастических задачах посвящена, например, работа- [3.10]. Большой
вклад в его развитие и исследование приложений внесли ученики А.А. Кра-
совского: Р.М. Карапетян, В.В. Невструев, С.Н. Коробков, Е.П. Решетник,
А.С. Федосеев и многие другие. В [3.11] показано, что системы управления,
спроектированные при условии минимизации критерия обобщенной рабо-
ты, при управлении линейными объектами обладают запасом устойчивости
по фазе, равным тг/2.
Вопросам использования аналитического конструирования в формули-
ровке АА. Красовского для совмещенного синтеза управлений в адаптив-
ной системе управления посвящены работы [1.10,1.43, 3.12].
Получили распространение различные варианты алгоритмов аналити-
ческого конструирования по критерию обобщенной работы.
1.По особенностям задания функционала (3.12) различают терминаль-
ные и нетерминальные задачи. К терминальным относят задачи управления
полетом, когда из физического содержания задачи назначен некоторый
конкретный момент времени окончания процесса управления. В этот мо-
мент к движению ЛА предъявляются особые требования. К таким задачам
относятся прицеливание, посадка, выход в заданный район в заданное вре-
мя и т.д. Соответствующие требования отражаются в Гзад(х, tK).
К нетерминальным относят задачи, для которых не назначается заранее
момент окончания процесса управления. Это задачи типа стабилизации
заданного состояния. В этом случае поступают следующим образом [1.5]:
— задают Гзад(/К) в виде вынужденного решения уравнения (3.18) и
ищут установившееся решение;
— назначают скользящий интервал оптимизации некоторой Постоянной
длительности Т, т.е. вместо (3.1) используют функционал вида (3.2).
2. По особенностям представления объекта управления задачи делятся
на управление положением рулевых органов объекта, когда уравнения
объекта имеют вид (3.8), и на управление скоростью перемещения руле-
63
вых органов, когда объект представляется в виде
х - F(x, a, S, t), 5 = и, (3.20)
где 5 — w-мерный вектор положения рулевых органов объекта, принадле-
жащий Д'”, а остальные обозначения соответствуют (1.1). Формально
уравнения (3.20) могут быть приведены к форме (3.8) переходом к расши-
ренному вектору состояния. Применительно к (3.20) соотношение (3.15)
принимает вид
ЭГ'
«опт*-*—. (3.21)
оо
Исследования показали, что в прикладных задачах подход, основанный на
представлении объекта в форме (3.20), дает лучшие результаты.
3. По способу реализации процесса оптимизации управления различают
предварительное решение оптимизационной задачи (3.8), (3.12), (3.18),
когда при проектировании системы управления на этап функционирования
этой системы возлагается, как отмечалось в § 1.3, только реализация зако-
на (3.15), а точнее, его аппроксимации в пространстве состояний объек-
та (3.8), и совмещенный синтез управления. В последнем случае вся опти-
мизационная задача решается непосредственно в процессе функциониро-
вания системы управления.
4. По основам алгоритмического обеспечения варианты делятся на:
- алгоритмы с матричным уравнением Ляпунова (область применения
этих алгоритмов ограничена линейными объектами и квадратичными
функционалами) [ 1.5 ];
— алгоритмы с фундаментальными матрицами (область применения этих
алгоритмов ограничена линейными объектами и квадратичными функцио-
налами или случаем степенных разложений соответствующих функций в
(3.8) и (3.12)) [1.5];
— операционные алгоритмы (область применения ограничена задачами
с небольшой длительностью интервалов оптимизации tK — t) [1.43, 3.12];
— алгоритмы с прогнозирующими моделями (можно полагать, что это
наиболее универсальный вариант алгоритмического обеспечения).
В данной работе обобщаются основные результаты исследований
метода синтеза управлений с прогнозирующей моделью и рассматри-
ваются вопросы построения на его основе адаптивной системы управ-
ления полетом. В дальнейшем в качестве названия такой системы автор
использует термин адаптивная прогнозирующая система (АПС), предло-
женный Г.И. Авруцким.
В заключение параграфа рассмотрим метод аналитического конструиро-
вания в формулировке А.А. Красовского применительно к стохастическим
объектам [3.13].
Пусть объект подвержен действию случайных возмущений типа белого
• шума, т.е. вместо (3.8) имеет место уравнение
х = f(x, a, f) + <р(х, a, t) и + , (3.22)
где — белый шум с нулевым средним и известной матрицей интенсив-
ности Sx. Минимизируемый функционал (3.12) заменим математическим
64
ожиданием
частных
Z= М[/Кр] = М Изая(гк) + f Qdt + (и'К~1и+UpnrK~iuonr)dl I .
fo 2 r0 J
(3.23)
В этом случае оптимальное управление определяется формулой (3.15),
где функция V(x, f) представляет собой решение уравнения в
производных второго порядка
ЭИ ЭИ 1 Э2И
---+-----/+ —tr-------= ~Q
bt Эх 2 Эх Эх
(3.24)
с граничным условием (3.19), где Э2И/ЭхЭх’ — матрица вторых частных
производных функции И(х, 0.
Доказательство оптимальности (3.15), (3.24) можно провести следую-
щим образом. Запишем полную производную по времени функции И(х, t),
которая по правилу дифференцирования Ито определится соотношени-
ем [3.14]
. ЭИ ЭИ 1 Э2К
К=----+----х + — tr------~ Sx.
bt Эх 2 Эх Эх
С учетом (3.22) ее можно записать в виде
. ЭК ЭИ
И= — + —
bt Эх
ЭИ ЭИ
— он +----
Эх Эх
1
— tr
2
Э2И
-----Г5Х-
ЭхЭх
Э2И
7 Sx.
Ст*’
Воспользуемся (3.15) и запишем
. ЭИ ЭИ , , ЭИ 1
К=----ч----/_ м' к-ги +-----$ + _
bt Эх опт Эх 2 Эх Эх
Если функция И(х, t) удовлетворяет уравнению (3.24), то
ЭИ
И “С-«ОПТ* и _ %х-
Эх
Проинтегрируем это соотношение по t от /0 до tK и получим
fK 'к гкЭИ
FUK) - ^о) = - f Qdt - / «Ст*"’udt + f ~ £xdt,
to to t0 Эх
понимая последний интеграл как интеграл Ито [3.14].
Теперь воспользуемся полученным соотношением и граничным услови-
ем (3.19) для записи минимизируемого функционала (3.23) в виде
[1 'к ЭИ 1
Г('о) + Т /(«“«опт)'* *(«-«опт)Л + / •
2 to to Эх J
Для интегралов Ито можно изменять последовательность операций интегри-
рования и определения математического ожидания. Если при этом полагать,
что Э И/Эх и независимы, то последнее слагаемое обращается в нуль.
5.В.Н. Буков
65
В результате получим
Г 1 гк 1
/ = М|К(ГО)+ - / Копт)'*’1 (и - uont)dt . (3.25)
L 2 J
Так как математическое ожидание функции И(Г0) не зависит от выбора
управления, то в силу положительной определенности К"1 функционал
(3.25) достигает минимума при и = иопТ, 410 и требовалось доказать.
Необходимость решения уравнения второго порядка (3.24) в значитель-
ной степени усложняет задачу аналитического конструирования в стохасти-
ческой постановке. В некоторых частных случаях удается упростить это
уравнение. В [1.5] А.А. Красовским формулируется специальная модель
случайных возмущений которая представляется последовательностью
достаточно редких импульсов. В этом случае в (3.24) можно положить
Sx = 0, что позволяет, по существу, вернуться к детерминированной поста-
новке.
Основные результаты, излагаемые ниже, относятся к детерминирован-
ным объектам.
§ 3.3. Алгоритмы с прогнозированием
при управлении положением рулевых органов
Применять прогнозирующую модель для решения задачи аналитическо-
го конструирования в формулировке А.А.Красовского (3.8), (3.12),
(3.15), (3.18), (3.19) впервые предложил В.С. Шендрик [3.15]. Хотя
аналогичный эвристический подход к построению систем автоматического
управления был известен раньше [3.16], развитие излагаемых ниже алго-
ритмов оптимального управления с прогнозирующими моделями нача-
лось с [3.15]. Этому направлению оптимизации управления посвящены,
например, работы [1.34, 3.17—3.21], а различные приложения алгоритмов
с прогнозирующими моделями рассматриваются в [1.10]. В [3.22] пред-
лагается способ использования оптимального по критерию обобщенной
работы алгоритма с прогнозирующей моделью для минимизации функ-
ционала типа функционала Летова — Каймана.
Независимо от этих результатов идея прогнозирования движения управ-
ляемого объекта нашла отражение и при решении иначе сформулированных
задач [1.10, 1.42, 3.23, 3.24]. Однако в силу отмеченной выше относитель-
ной простоты уравнения (3.18) алгоритмы с прогнозирующей моделью,
минимизирующие критерий обобщенной работы (3.12), характеризуются
существенно меньшей трудоемкостью вычислений, особенно для много-
мерных нелинейных объектов типа (3.8).
В целом использование прогнозирующей модели в задаче (3.8), (3.12),
(3.15), (3.18), (3.19) позволяет:
— сохранить универсальность комплекса алгоритмов системы,обеспечи-
ваемую непосредственным решением задачи оптимизации управления в
процессе функционирования системы (совмещенный 'синтез оптимального
управления);
— достичь значительной простоты в организации адаптивности синтези-
руемого управления путем соответствующих настроек прогнозирующей
66
модели по результатам идентификации динамических характеристик управ-
ляемого объекта;
— избежать локальности во времени синтезируемого оптимального уп-
равления, свойственной операционным алгоритмам [1.43];
— углубить исследования свойств движения объекта, управляемого на
основе минимизации критерия обобщенной работы.
В основе рассматриваемых здесь алгоритмов с прогнозирующей моделью
лежит применение для решения уравнения (3.18) с граничным условием
(3.19) метода характеристик, называемого также методом Коши или (при-
менительно к уравнениям вида (3.16)) первым методом Якоби. Так, извест-
но [1.10, 3.25], что искомая интегральная поверхность уравнения в част-
ных производных (3.16) может быть образована из характеристик, т.е.
из интегральных кривых, удовлетворяющих уравнениям
ЙЗГ , Э-К'
х =----. р =--------
др дх
где р = (й V/dx)’ — вектор частных производных искомой функции V(x, f)
по компонентам вектора х(т) в Хп. При этом полная производная функции
V(x, t) на характеристиках определяется [3.25] следующим образом:
Г _ ...» п —
Йр
Граничные условия для (3.26) и (3.27) формируются из начальных усло-
вий для (3.8) и граничных условий (3.19).
Формальное применение к уравнению (3.18)
(3.27), где
ЙГ
Х = f+Q=p'f+Qt
дх
дает
х = fix, a, t),
df dQ'
Р = ~ -г-Р - --->
дх дх
Полагая известными текущее состояние x(tu) и
объекта управления на интервале [7М, Тк], можно
ходимые граничные условия для (3.29) —(3.31). Действительно, при из-
вестном x(tu) детерминированное уравнение (3.29) однозначно опреде-
ляет состояние объекта в момент tK. Подстановка х(гк) и tK в (3.19)
дает граничное условие для скалярного уравнения (3.31), а предваритель-
ное дифференцирование (3.19) по компонентам х с последующей подста-
новкой x(tK) и tK дает граничное условие для (3.30).
Особенностью уравнений (3.29) — (3.31) является то, что они связаны
со ’’свободным” движением (3.8), т.е. движением объекта, описываемым
уравнением (3.8) при и = 0. Название рассматриваемых алгоритмов об-
условлено необходимостью ’’прогнозировать” движение объекта управле-
(3.26)
(3.27)
выражений (3.26) и
(3.28)
(3.29)
(3.30)
(3.31)
вектор параметров а
определить все необ-
5
67
ния на интервале [тм, Гк] с помощью (3.29). Условность такого прогноза
вполне очевидна, так как на всем интервале [Ги,/К] вопреки реальному
движению полагается н = 0.
В настоящее время известны и исследуются четыре 1) редакции алгорит-
мов с прогнозированием, которые здесь рассматриваются применительно
к (3.8).
Первая редакция (алгоритм с численным дифференцированием) предло-
жена В.С. Шендриком в [3.15] и заключается в вычислении tu)
интегрированием (3.31) при условии (3.19) на моделируемом в ускорен-
ном времени т = т/к (к — масштаб ускорения времени) движения объекта
в Хп в соответствии с (3.29) и последующим численным дифференциро-
ванием этой функции.
Таким образом, для определения оптимального в смысле (3.12) управ-
ления объектом (3.8) в текущий момент времени (реально — на очередной
цикл формирования управления Д/м) в управляющей ЭВМ осуществляется
как. минимум тп + 1 прогнозов движения объекта интегрированием урав-
нений модели
d
— к/м(хм, т) (3.32)
dr
в ускоренном времени т с различными начальными условиями x'M(tu)
(j = 1,2, ..., tn + 1) .лежащими в окрестности текущего состояния объек-
та x(fM). На основе этих прогнозов вычисляются скалярные функции
тк
V(tu) = V(tu) = Изад [хм(т^]. + к / Q[х^т), г] dr, (3.33)
Ти
где ти = tu/ic и тк = tк/х — пределы интегрирования в ускоренном време-
ни, соответствующие моменту определения управляющих сигналов tu
и моменту окончания интервала оптимизации /к; хм(т) — прогнозиру-
емый в ускоренном времени вектор состояния управляемого объекта
(3.8); /м — векторная функция, представляющая в модели (3.32) соответ-
ствующую функцию объекта (3.20) и в общем случае не равная ей (в пред-
положении точно известной структуры / эта функция может отличаться
вектором параметров ам).
Вычисленные значения (3.33) используются для аппроксимации раз-
ностным аналогом [3.26] частных производных в соотношении
, эг'
«оптСи) = -- К* ~- = —K\pp(tu). (3.34)
Эх
Аналог строится на tn + 1 значениях функции V(tu), вычисленных на
m + 1 линейно независимых решениях (3.32). Поэтому выбор начальных
условий х^Ом) в окрестности х(/м) должен обеспечивать их линейную
независимость.
•) К моменту выхода книга число редакций увеличилось до шести, включая алго-
ритм с физической прогнозирующей моделью и алгоритм с синхронным детек-
тированием.
68
В [1.43] показано, что в общем случае минимально необходимое число
независимых решений (3.32) должно на единицу превышать ранг мат-
рицы
Вторая редакция (алгоритм модифицированный) предложена А.А. Кра-
совским в [3.18] и, независимо, Ю.А. Кочетковым в [3.27], а также рас-
сматривается в [3.28] и в других работах. Она предполагает дифферен-
цируемость по x(t) функций Изади Q функционала (3.12) вГ'Х [т0,^к1
и связана с решением в ускоренном ’’обратном” времени
<?=—!----- RM(7K-T) + dK(7-rM)], (3.35)
7к- 7W
изменяющемся от $к до ди($к~ тк,ди = ти), уравнений (3.30) с ’’на-
чальными” условиями
Р($к) ~ Р(тк) ~ ^^зад 1-*м(7к)» 7к] 1^ХМ(ТК). (3.36)
Вычисление этих условий предполагает знание состояния (3.32) в конце
интервала оптимизации, получаемого предварительным моделированием
(3.32) в ускоренном времени т с начальными условиями
*м(7«) = (3-37)
Необходимость вычисления вдоль прогнозируемой траектории объекта
функций df/dx и dQfdx приводит либо к запоминанию в управляющей
ЭВМ траектории (3.32). пройденной при предварительном моделировании,
либо к совместному решению в обратном времени х) уравнений
d
-*м $)>
d 'df ЭО'
•— р - к ---р + к-----• .
дхм дхм
(3.38)
Полученные компоненты вектора р (ди) = р(ти) = p(tu) определяют опти-
мальное управление (3.34).
Алгоритм (3.32), (3.34), (3.36) — (3.38) не требует численного диф-
ференцирования и поэтому потенциально обладает более высокой точ-
ностью.
Третья редакция (рлгоритм с матрицей чувствительности) предложена
А.С. Федосеевым [3.17], а затем автором данной книги в более частном
виде для адаптивного управления в [3.19]. Рассмотрим здесь этот алго-
ритм применительно к объекту (3.8). Он сводится к вычислению и исполь-
зованию вдоль прогнозируемого движения (3.32) чувствительности прог-
нозируемого состояния лм (т) к вариациям компонент вектора началь-
ного состояния хм (тм) = х(гм). Алгоритм может быть получен из (3.29) —
(3.31) следующим образом.
Если функция / в (3.8) и, следовательно, в (3.32) непрерывна вместе
со своими частными производными по .г в Хп X (г г+), где (г_, /,) -
открытая временная область, содержащая отрезок [т0, гк], то в соответ-
ствии с теоремой Пеано [3.25] решение уравнения (3.29), которое обоз-
начим Xf(t), принадлежит классу С1 в открытой области его определения.
69
При этом матрица У (г) = Элу (г)/Элу (г(/) частных производных этого
решения по вектору начальных значений лу(/м) удовлетворяет уравнению
Э/
У(/) = — У(0 (3.39)
Элу
с начальным условием
>’(/„) = £. (3.40)
где dfldXf - матрица Якоби,вычисляемая налу (/); Е — единичная матрица.
Введем обозначение частной производной [Э V (г )/Эх(гм) ]’ = p(t),
которая вычисляется дифференцированием V (х, t) как сложной функции
вектора текущего состояния x(tu) и которую мы будем отличать от явных
производных в р(г). Продифференцируем (3.31) по x(tu) по правилу
дифференцирования сложной функции. С использованием введенного
обозначения и матрицы У (О результат дифференцирования можно запи-
сать в виде
Д(О=-У'(/)-^. (3.41)
дх/г)
Аналогично из (3.19) можно получить для (3.41) граничное условие
, ЭК'ап(тк)
р0к)= Y'(rK) - а-за^ у- . (3.42)
dXf(tK)
Обратим внимание на то, что в момент tu имеет место равенство
= (3.43)
Действительно, для функции V (х, г) очевидно соотношение
Д(О=У'(т)р(О. (3.44)
но при t = iu из (3.40) и (3.44) следует (3.43). А раз так, то в (3.34)
вместо р (г„) можно использовать р (fu).
Таким образом, при реализации этой редакции алгоритма оптималь-
ного управления положением рулевых органов должно моделироваться
движение (3.32) с начальным условием (3.37). На прогнозируемом дви-
жении следует интегрировать (3.41) в форме записи с ускоренным време-
нем т или, что то же самое, вычислять
P(Iu)=Y'(tk)
ЭУэ'ад^к)
ЭХм(Тк)
+ к J У’(7)
эе'(т)
Эхм(т)
dr.
(3-45)
Используемая при этом матрица У(т) определяется интегрированием в
ускоренном времени т уравнения
d df
—-Y(t) = k~- У(7) (3.46)
dr Эхм
с начальным условием (3.40). В отличие от предыдущего варианта алго-
ритм (3.32), (3.34), (3.40), (3.45), (3.46) не имеет интегрирования в об-
ратном времени.
Четвертая редакция (алгоритм с аналитическим решением) в частных
задачах использовалась В.Г. Чудиновой, а позже в варианте приближенных
70
решений была предложена А.А. Красовским в [1.9, 3.29]. Эта редакция
алгоритма основана на аналитическом решении уравнения (3.8). Полное
решение уравнения (3.29) при произвольных начальных условиях х (Z0) в
Хп можно записать в виде
X[x(Zq), t, Joi ~ Х(х, z, Zq).
Тогда для любого текущего момента времени можно записать прогно-
зируемое на интервале [z„, zK] состояние
^м(^) = X[x(z„),г, z„], те [z„, zK]. (3.47)
Интегрируя (3.31) в обратном времени на (3.47), можно получить ана-
литическое выражение для функции V (х, г) на прогнозируемых траек-
ториях
ГК
Г(х, z„) = Гэад [ Х(х, tK . ru), zK] + f Q[X(x. т, tu), т] dr. (3.48)
'и
Воспользовавшись формулой (3.36) и предварительно продифференци-
ровав (3.48) по вектору x(zM), получим окончательную формулу для
оптимального управления
моптСи)
ЭХ'(х, /к, ZM)
Эх(г„)
дК)ад(*» Ак)
Эх(гк)
+ у ЭХ'(х> т'дв'<х> т>
гм Эх(г„) Эх(т)
(3-49)
Решение (3.47) может быть получено только для некоторых весьма
простых объектов управления. В более общем случае может использо-
ваться приближенное реше!«ие, представляемое, например [3.29], степен-
ными рядами
т -1 (т —z)2 Э/ (т -г)3 Э / bf \ .
-----f + ------ —f +-----------1 —/)/ +...
1! 2! Эх 3! Эх \Эх / (3 50)
г] — аналитическое выражение для соответствую-
Х(х(г), т,г) = х(г) +
Здесь f = / [x(z), дм,
щей функции уравнения (3.8). Практическое ограничение числа слагае-
мых в (3.50) обусловливает приближенность получаемого управления
(3.34).
§ 3.4. Алгоритмы с прогнозированием при управлении
скоростью перемещения рулевых органов
В процессе исследования алгоритмов с прогнозированием было уста-
новлено, что для широкого класса объектов моделирование (3.8) при и =
= 0 на интервале [zM, zK] сопряжено с трудностями главным образом
вычислительного характера. Так, окрестность текущего состояния объек-
та, содержащая прогнозируемые на [zM, zK] траектории, может либо зна-
чительно превышать по размеру область допустимых состояний 0 в X,
либо совсем не пересекаться с ней. Кроме того, для нелинейных объек-
тов возможно существенное изменение динамических свойств при замене
текущего вектора управления (лежащего в окрестности некоторого ба-
лансировочного управления) нулевым вектором.
71
Поэтому наряду с объектом типа (3.8) при разработке и исследова-
нии конкретных алгоритмов с прогнозированием используются объекты
управления, приведенные к виду (3.20). В общем случае вектор б может
быть включен в Г38д и Q функционала. Заметим, что (3.20) хорошо
согласуется с физическим содержанием задачи управления динамичес-
кими объектами с разомкнутыми (интегрирующими) рулевыми привода-
ми [2.15-2.17].
Переходя в решаемой задаче аналитического конструирования от объ-
екта (3.8) к объекту (3.20) и вводя обозначения рх = (ЭК/Эх)',рб =
= (ЭК/Э 5)', вместо (3.28) следует записать
ЭГ ЭИ
0 + Q=p*f + Q- (3-51)
дх д8
Уравнения (3.29) — (3.31) уступят место уравнениям
x = F(x,a,8, г), 5=0, (3.52)
dF' dQ' dF' dQ'
Px =------Px-------> Ps~-------Px-------. (3.53)
Эх Эх 6 Эб Э5
V=-Q(x,t), (3.54)
определяющим характеристики (3.16) при описании движения объекта
уравнениями (3.20).
Алгоритмы, вытекающие из (3.52) — (3.54), можно рассматривать как
частные случаи алгоритмов, приведенных в § 3.3. Соответствующие пре-
образования обеспечиваются введением новых обозначений. Однако
ввиду большого самостоятельного значения алгоритмов оптимального уп-
равления скоростью перемещения рулевых органов объекта рассмотрим
эти алгоритмы подробнее.
Первая редакция (алгоритм с численным дифференцированием) заклю-
чается в интегрировании (3.54) при условии (3.19) на моделируемом в
ускоренном времени г = z/к движении объекта в Хп X Д'” в соответст-
вии с (3.52).
Для определения оптимального в смысле (3.12) управления объектом
(3.20) в текущий момент времени в управляющей ЭВМ осуществляет-
ся не менее m + 1 прогнозов движения объекта интегрированием урав-
нений модели
d d
~~Г" -*М ~ kFM (.ХМу^Му ~ 0
dr dT
(3.55)
в ускоренном времени т. Различные (линейно независимые) начальные
условия 5^(ги) (/ = 1, 2, ..., m + 1) задаются в окрестности текущего
положения рулевых органов 5 (tu). Начальные условия для первого урав-
нения (3.55) имеют вид
Лм(7и) = л:(Ги). (3.56)
На основе полученных прогнозов вычисляются скалярные функции (3.33).
Функция FM в (3.55) представляет в модели соответствующую функцию
объекта (3.20) (с точностью до параметров ам).
72
Вычисленные значения (3.33) используются для аппроксимации раз-
ностным аналогом частных производных в соотношении
ЭК'
МОПт(^м) Е ~ ~~Kpt> Gu)< (3-57)
00
заменяющем (3.34) для объекта (3.20). Так, если пользоваться цент-
ральными первыми разностями, то
wonr(G<)
2Д;-
(3.58)
где К) (tu), Vf (tu) — значения функций (3.33), вычисленные при смещен-
ной /-Й компоненте вектора 8 (ги) соответственно вправо и влево на посто-
янную величину Д/, т.е.
тк
Р*('|/)= гзад [л-*(Тк)] +к f Q[x*(t),t] (It,
J J (3-59)
"j"” Хм~ К^ м(Л’м. 5M 5M = O’>
ат dr
l/Vu)= ^зад [хм(тк)] +« f Q[x~(t),t] dr,
Tu
d
XM ~ к^м(хм> ~ Д/, T)> *~5M = 0-
dr ™ dr
(3.60)
Вторая редакция (алгоритм модифицированный) в данном случае,
как и в § 3.3, предполагает дифференцируемость по x(t) и 8 (г) функций
Кзад и Q функционала (3.12) в X” X Д'" X [г0, гк1- На первом шаге ал-
горитма осуществляется прогнозирование состояния объекта на интер-
вале [г, fK] с помощью модели (3.55) при начальных условиях (3.56) и
8м(тм) = «(гм). (3.61)
На втором шаге на основе полученных значений х(тк) и предварительно
продифференцированной по х и 8 функции Кззд определяются значения
Рх(<?к) “ Рх (Тк) ~ ^зад [Л'м('гкХ тк] / Зхм(тк),
Рб(М = Р5(тк) = ЭК'ад [хм(тк),тк] /Э8м(тк), (3 62)
которые используются как начальные при интегрировании в ускоренном
обратном времени д уравнений
d
“Т“ хм К/'м(хм, 5М, *^)>
dd
d bF' bQ'
PX=K ---r-D„ + К-----
dd Эхм ’ 3xM
Здесь bF/bxM, bF/bb^, bQ/bxM и bQ/bbM - матрицы частных производ-
ных векторной F и скалярной Q функций по компонентам векторов хм и
8м, вычисленные на прогнозируемой с помощью (3.55) траектории. Первые
два уравнения в (3.36) обеспечивают получение значений компонент век-
d
— 5м =0,
dd
d bF' bQ'
, — Рб - к рх + к---------
dd Э8хл Э8М
(3.63)
73
торов хм и 6М при ’’обратном” интегрировании. В случае наличия доста-
точной памяти ЦВМ эти значения могут запоминаться при ’’прямом” прог-
нозировании с помощью (3.55) и затем в нужном темпе извлекаться из
памяти.
Полученные в результате решения (3.63) компоненты вектора($„) =
= Рб (ты) = Рб Си) определяют оптимальное управление (3.57). Алгоритм
(3.55) — (3.57), (3.61) — (3.63) не требует численного дифференцирова-
ния, что обеспечивает ему более высокую точность по сравнению с пре-
дыдущим.
Третья редакция (алгоритм с матрицей чувствительности} сводится к
вычислению и использованию вдоль прогнозируемого движения (3.55)
чувствительности прогнозируемого состояния хм (т) к вариациям компо-
нент вектора 5м(тм) = S(tu). Алгоритм может быть получен из (3.52)
и (3.54) следующим образом.
Если функция F в (3.20) и, следовательно, в (3.52) непрерывна вместе
со своими частными производными по х и 6 в Хп X Дт X (f_, 7+), где
(C,f+) — открытая временная область, содержащая отрезок [/0. Gj>
то в соответствии с теоремой Пеано [3.25] решение уравнений (3.52),
которое обозначим Xf(t}, принадлежит классу С1 В открытой области
его определения. При этом матрица Z (г) = Эху(Г)/Эб(ги) частных произ-
водных этого решения по вектору параметров 6(/м) удовлетворяет
уравнению
. dF dF
Z(t) = — (3.64)
dxj do
с начальным условием
Z(tu) = 0,
(3.65)
где матрица Якоби dFjdXf и матрица dF/db вычисляются вху(г).
Введем обозначение частной производной 'рь (г) = (dV(t)/d6(tu))',
которая вычисляется дифференцированием V(x, 6, t) как сложной функ-
ции 8(тм) и которую мы будем отличать от явных производных в р6 (f).
Продифференцируем (3.54) по 5(г„) по правилу дифференцирования
сложной функции. С использованием введенного обозначения и матри-
цы Z (t) результат дифференцирования можно записать в виде
р6(0 = -z'(t)
dQ'(t)
dxf(i)
dQ'(t)
Эб(Тм) ’
(3.66)
Аналогично из (3.19) можно получить для (3.66) граничное условие
ЭКэад(/к) Э ^зад Пк)
3xz(TK) dS(tu)
Обратим внимание на то, что в момент ru
имеет место равенство
Pb(tu) = p6(tu).
(3-67)
(3.68)
Действительно, для функции V(x, 8, г) очевидно соотношение
РЬ(Ъ = Z'(t)px(t}+pb(f), (3.69)
но из (3.65) следует (3.68). А раз так, то в (3.57) вместо рь (гм) можно
использовать Pb(tu) Заметим, что вторая и третья редакции алгоритма
74
с прогнозированием в принципе эквивалентны, а соответствующие урав-
нения, несмотря на внешнюю несхожесть, преобразуются от одного вида
к другому дифференцированием (3.69) по t и соответствующими под-
становками (3.53), (3.64) и (3.66).
Таким образом, при реализации этой редакции алгоритма оптималь-
ного управления с прогнозирующей моделью и управляющей ЭВМ должно
моделироваться движение (3.55) с начальными условиями (3.56) и (3.61).
На прогнозируемом движении следует интегрировать (3.66) в форме
записи с ускоренным временем т или, что то же самое, вычислять
, ЭКзая(тк)
Р6(/м) - Р6(тм) = z'(7K) +
Зхм(тк)
д^задОк)
7К
+ к /
ги
ax„(r) 8SM(r)
dr.
(3.70)
Используемая при этом матрица Z(r) определяется интегрированием
в ускоренном времени т уравнения
d
— = к
dr
dF
“---Z(t) + k
dF
Э5М
(3.71)
с начальным условием (3.65). В отличие от предыдущего варианта ал-
горитм (3.55), (3.56), (3.61), (3.70), (3.71), (3,65) не имеет интегри-
рования в ускоренном обратном времени.
Четвертая редакция (алгоритм с аналитическим решением) основана
на аналитическом решении уравнения (1.1). В этом случае полное реше-
ние уравнений (3.52) при произвольных начальных условиях х(г0),
5 (/о) в Xй X Ди имеет вид
Х[х(г0),5(г0),Л М = Х(х. л, л0), S(z0) = const.
Тогда для любого текущего момента времени можно записать прогнозируе-
мое на интервале состояние
хм(т) = Х[х(г„), 8(гм), т, tu], тЕ [ги, гк]. (3.72)
Интегрируя (3.54) в обратном времени на (3.72), можно получить аналити-
ческое выражение для функции V(x, tu) на прогнозируемых траекториях
V(x, tu) = Гзад [Х(х, гк, tu), zK] + f Q[X(x, r, fu), T]dr. (3.73)
fu
Воспользовавшись формулой (3.57) и предварительно продифференци-
ровав (3.73) по вектору 8(ГМ), получим окончательную формулу для
оптимального управления
»опЖ) - -к [ &FЭад(Л' ^к) Эх(Гк) д^звдС*. Лс) Э8(/и)
+ Г* Г ЭХ (Х> т’ 3б'(Х 7) гм [ db([u) Эх(т) dQ'(x, т) 1 д5(г„) ] dr (3.74)
75
Область применения (3.74) весьма ограничена из-за того, что реше-
ние (3.72) может быть получено только для некоторых весьма простых
объектов управления. В более общем случае может использоваться при-
ближенное решение, представляемое, например [3.29], степенным рядом
т - t (г - г)2 3F
X[x(f), S(O,r; d = x(t) + — F + — F +
1! 2! Эх
+ О--о3
3!
(3.75)
где F = F [х(г), дм, 5 (г), /] - аналитическое выражение для правой части
уравнения (1.1). Практическое ограничение числа слагаемых в (3.75)
обусловливает приближенность получаемого управления (3.74).
Все четыре рассмотренные редакции алгоритма с прогнозированием
приводят, по существу, к одному решению (при предельной точности
аппроксимации производных в (3.57) и решения (3.75)) и отличаются
только вычислительными процедурами. При этом первые три редакции
являются алгоритмами численного решения задачи, а последняя — аналити-
ческого решения задачи. Очевидно, что последняя из них требует высокой
квалификации разработчиков и большой трудоемкости при предвари-
тельной подготовке алгоритма управления,' но характеризуется самым
низким уровнем трудоемкости на
формирование управления в процес-
се функционирования системы.
Остальные же редакции практи-
чески всю трудоемкость синтеза уп-
равления сосредоточивают на эта-
пе формирования управления в про-
цессе функционирования системы
управления.
Сравним трудоемкости соответ-
ствующих процедур. Принимая во
внимание только операции вычис-
ления pg (tu), будем полагать, что
объем вычислений, связанных с
интегрированием каждого скаляр-
ного уравнения (кроме тривиаль-
ных^ (3.54), (3.33), (3.63),(3.70)
и (3.71), одинаков и составляет 7ИНТ -
При этом предположении трудоем-
че. 3.1. Области вычислительных преи-
муществ различных вариантов алгорит-
ма с прогнозирующей моделью: / — с
численным дифференцированием; II -
модифицированный; III - с матрицей
чувствительности; а — вычисление произ-
водной по правой (левой) разности;
б — вычисление производной по цент-
ральной разности
76
кости первых трех редакций алгоритма оценятся соответственно
П = Whht. Гц = (Зп+т)тинт, Гш = [«О + 1) + п?]уинт> (3.76)
где N — число дискретных' значений функции V, необходимое для реализа-
ции разностного аналога (3.57); п — размерность вектора состояния;
т — размерность вектора управления.
На рис. 3.1 приводятся построенные по (3.76) на плоскости ’’размер-
ность вектора состояния — размерность вектора управления” границы
областей, в которых каждая из редакций алгоритмов с прогнозировани-
ем имеет относительное преимущество по минимальной трудоемкости.
Рассмотрены два случая. В первом из них (см. рис. 3.1, a) N имеет мини-
мальное значение, равное т + 1 и соответствующее первым правым или
левым разностям в аналоге (3.57). Во втором случае (см. рис. 3.1,6)
N = 2т, что соответствует первым центральным разностям [3.26], обеспе-
чивающим более высокую точность аппроксимации dV/d8(tu). По мере
дальнейшего усложнения разностного аналога область I сокращается
стягиванием к осям п и т.
Таким образом, для многомерных объектов с большим числом входов
при невозможности аналитического решения задачи наиболее предпочти-
тельной с точки зрения трудоемкости является вторая редакция алгоритма
с прогнозирующей моделью — модифицированный алгоритм.
§3.5. Дискретное управление непрерывными процессами
Рассмотренные выше алгоритмы предназначены для реализации, как
отмечалось в §1.3, совмещенного синтеза оптимального в смысле задан-
ного критерия управления. Сложность оптимизационной задачи, которую
следует решать непосредственно в процессе функционирования системы
управления, обусловливает применение БЦВС.
Однако применение БЦВС неизбежно создает особые условия реализа-
ции управления. К числу основных особенностей относятся:
— дискретность формируемого управления по уровню и по времени;
— запаздывание между опросом датчиков (измерительных систем) и
подачей управляющего сигнала на приводы рулевых органов.
Рассмотрим здесь вопросы, связанные с учетом при формировании
управления ’’чистого” запаздывания [3.30, 3.31] и квантования во време-
ни [3.32,3.33] сигналов управления.
Остановимся сначала на задаче управления с запаздыванием, которую
сформулируем и решим по аналогии с (3.8), (3.12), (3.15) и (3.18).
Рассмотрим наиболее простой случай, когда в системе действует одинако-
вое для всех входов запаздывание.
Пусть управляемый процесс описывается уравнением
х = f (х, t) + [x(f - s), t — s\u(t — s) (3.77)
на отрезке [г0, 7K], где s — единое для правой части уравнения (3.77)
запаздывание во времени, а остальные используемые обозначения имеют
указанный выше смысл.
Пусть также на интервале [r0, + s] уравнение (3.77) имеет некото-
рое непротиворечащее дальнейшему изложению решение в Хп. Мини-
77
мизируемый функционал представим в виде
Л<р = Над lx(Gc)’+
гк 1 *к
+ / Q(x,t)dt+— f [u'(t - s)K~lu(f - $) +
r0 + J 2 r0 + s
+ «опт(* - «Ж-1 Ыопт(* - 0ИЛ (3.78)
Обратим внимание на то, что здесь1) качество процесса (второе слагав-
мое) оценивается на интервале [f0 + s, fK], а управление (третье слагае-
мое) — на интервале [г0, tK — s], что, на наш взгляд, соответствует физи-
ческому содержанию задачи.
Тогда оптимальное в смысле минимума (3.78) управление в незамкну-
том множестве Um определится соотношением
, ЭК’(х(г + О)
«опт(0 = (О — . (3.79)
3x(/+s)
где F(x, г) — скалярная дифференцируемая по Г и х функция, удовлет-
воряющая на интервале [/0 + s, fK] уравнению (3.18) при том же гранич-
ном условии. Заметим, что на практике строгое осуществление (3.79)
невозможно, так как при действии неконтролируемых возмущений не-
определимо точное значение х (t + s).
Доказательство оптимальности (3.79) строится по аналогии с доказа-
тельством (3.22)-(3.24), (3.15) и сводится к следующему. Полная про-
изводная искомой функции К(х, г) имеет вид
ИО =
ЭНО
Э/
ЭГ(О
Эх(0
х(Г).
С учетом (3.77) она может быть записана таким образом:
а ио
ИО = “Т2
bt
ЭНО
Эх(О
/(О +
ЭНО
Эх(О
Ф(Г - s)u(t- s).
Используя (3.79), запишем •
bV(t) Э ИО
ио + т-7т^(г)-мопт(^-о^_,«а-о.
bt ox(t)
Но если функция У(х, t) удовлетворяет уравнению (3.18), то
но = -е(о-^пТ(г-о^’*«а-о.
Интегрируя это соотношение по t от t0 + s до tK, получаем
нгк)-иго+о»-/ еюл- 7 «^(r-o^-’ua-o^.
г0 + S t0 + S
О В [3.30] рассматривается более общий случай для линейных объектов с ком-
бинацией наличия и отсутствия запаздывания по состоянию и управлению, а также
при прежних пределах интегрирования в функционале.
78
Теперь воспользовавшись последней формулой и граничным условием
(3.19), можно записать выражение для минимизируемого функционала
1
/к₽ = ИА) + 0 + “ / [к'(/ - s)K *u(f-s) +
2 t9 + s
'к
+ Ыопт(' - - 01Л - / Иопт(* - s)dt
t0 + s
или в окончательном виде
I *к
Лер = ИА) + s) + *~ / [w(r - s) - Ыопт(' - s)] ("О - s) -
2 t0+ s
- uonT(t-s)]dt. (3.80)
Так как функция V(x(t0 + $)) не зависит от управления на интервале
[го + s, тк], то функционал (3.80) достигает минимума при и = иопт, что
и требовалось доказать.
Таким образом, реализация описанного алгоритма управления процес-
сом (3.77) сводится к вычислению функции V(x, t), удовлетворяющей
(3.18) с граничным условием (3.19), и использованию упреждающих
значений производных bV/bx,, вычисленных для будущих моментов време-
ни, сдвинутых относительно настоящих моментов времени на время s,
для определения сигналов управления в соответствии с (3.15).
Сдвиг во времени между текущим состоянием процесса и используе-
мыми для управления частными производными функции V(x, г) при-
водит к особенностям прогнозирующей модели в рассматриваемой задаче.
Теперь прогнозирование должно осуществляться в два этапа. Первый
предназначен для прогноза (с доступной в реальных условиях точностью)
состояния объекта в момент t + s, а второй — для вычисления значения
функции F(x, t) в момент времени t + s. Если при этом используется
первая редакция алгоритма с прогнозирующей моделью (3.32) —(3.34),
то вариации непосредственно управляемых координат (для объекта
(3.20) — компоненты вектора ’’положения рулевых органов” 5) должны
осуществляться в момент t + s. Так, при использовании первой правой
разности [3.26] для аппроксимации (3,34) следует воспользоваться фор-
мулой
V{(x(t + s) + Axf, t + s) - F(x(z + s), t + s)} j ,
— • J ’
(3.81)
где в квадратных скобках приведена матрица-строка с указанным пра-
вилом формирования элементов.
Теперь перейдем к проблеме квантования по времени формируемого
управления. Традиционными являются два пути построения дискретного
управления. Первый из них предполагает решение оптимизационной зада-
чи в непрерывном виде. Затем непрерывное оптимальное управление
квантуется по времени. Второй путь основан на предварительной замене
исходного непрерывного объекта и соответствующего непрерывного функ-
79
ционала их дискретными аналогами. Оптимизационная же задача решает-.
ся в дискретном виде. Каждый из этих путей имеет свои недостатки, при-
водящие в общем случае к ухудшению качества управления и увеличению
требуемой производительности БЦВС. ’’Квантование в конце” приводит
к приближенности решения задачи либо к завышенным требованиям к
БЦВС. ’’Квантование в начале” для нелинейных объектов вносит погреш-
ности в решение задачи в связи с невозможностью построения точного
дискретного аналога исходной непрерывной по физическому содержа-
нию задачи.
Будем полагать, что для управления непрерывным объектом (3.8)
используется система, формирующая вектор управления и в виде кусочно-
постоянной функции
ия(0 = ид(Й, (3.82)
где t1 — момент формирования управляющих сигналов на /-м цикле, дли-
тельность которого составляет Д/м-
Продолжая рассматривать объект управления как непрерывный объект
и в качестве минимизируемого функционала используя функционал (3.12),
можно по аналогии с выкладками для доказательства (3.22)—(3.24)
получить выражение для минимизируемого функционала
1 гк
/кр = К'о) + ~ f М0-«опт(0№">(0-«опт(0]Л, (3.83)
. 2 t„
где мопт(0 определяется формулой (3.15) при условии, что V(x, t) явля-
ется решением (3.18), (3.19).
Из (3.83) видно, что в силу положительной определенности подын-
тегрального выражения функционал оптимальности управления дости-
гает минимума при
«(О = «о.пт(0. . (3.84)
Однако реализация (3.84) требует нецрерывности формируемого управ-
ления.
В случае дискретного во времени управления минимум (3.83) должен
достигаться на кусочно-постоянной функции (382). Тогда вместо (3.84)
запишем N f/ + i
/д= г(г0) + ~ s г / [ыд
2 '-° / (3.85)
где г° = г0 ; + 1 = гк. Судя по (3.85), на каждом цикле формирования
управления постоянный вектор управления мя(^) должен выбираться
из условия минимизации выражения
г/ + 1
/ [нда/)-«опТ(ог^’1[мйа/)-«0пт(0]л. (з.8б)
Учитывая, что мд(/у) выбирается из незамкнутого множества, восполь-
зуемся условием экстремума (3.86) на интервале k7,r/ + 1]
. d ti+l .
ттзг / = о,
dun(t') j
80
которое приводится к виду
,' + 1
f [пд(гО-Нопт(')]'*_1<Л = 0.
Принимая во внимание постоянство ик на интервале [т7, t7 +1 ], получаем
г/ + Дг"
/ «опт(0К-‘(Г)Л
г7
= —тщ---------------------• (3-87)
/ K~l(t)dt
Для случая К = const формула (3.87) упрощается:
1 г7**'”
ыд(г/) = — J иопт(Г)Л. (3-88)
ti
Таким образом, при квантованном по времени управлении объектом
(3.8) оптимальным в смысле функционала (3.12) является выбор вектора
управления ия для каждого цикла формирования управления по форму-
ле (3.87). В случае постоянной матрицы коэффициентов К в функциона-
ле (3.12) оптимальные дискретные значения вектора управления соот-
ветствуют средним за цикл значениям оптимального непрерывного
управления.
Обратим внимание на то, что при неограниченном уменьшении Дг„
вектор ид(Т7) приближается к вектору иОпт(0> в чем можно убедиться,
раскрывая предел выражения (3.87) по правилу Лопиталя. Кроме того,
переход к дискретному управлению неизбежно ухудшает качество управ-
ления, что подтверждается тем, что при (3.87) выражение (3.86) отлича-
ется от нуля, в то время как (3.84) обеспечивает (3.86) нулевое значение.
В заключение заметим, что формулы (3.87) и (3'.88) при использо-
вании алгоритмов с прогнозирующей моделью не имеют практического
значения.
§3.6. Асимптотический метод аналитического конструирования
А.Г. Хромовым в [3.34] предложен метод, основанный на использова-
нии основных соотношений аналитического конструирования в постановке
А.А. Красовского для решения задачи аналитического конструирования в
постановке Летова - Калмана.
' Пусть для объекта
А- = F(x, и, 0 (3.89)
с произвольными начальными условиями х(т0) требуется решить задачу
синтеза управлений и, оптимальных в смысле минимума функционала
I = РзздМ'к)- 'к1 + / GOV. ». t)dt, (3.90)
to
6.В.Н. Буков
Bl
где Изад и Q — положительно-определенные функции указанных аргу-
ментов. Очевидно, что (3.89), (3.90) является обобщением (3.8), (3.11).
Вместо непосредственного решения этой задачи формулируется вспомо-
гательная задача следующего содержания. Для объекта
х = F(x, uv, t), tiv = (3.91)
с начальными условиями x (t0) следует определить управление, оптималь
ное в смысле функционала
А ~ ^зад к0к)> 'J + / Q(x, uv, t)dt +
i Гк
+ f (jivK.viuv+uvo1xtK.v t/„onT)<Zf. (3,92)
2 r.
Объект (3.91) отличается от (3.89) переходом от исходных сигналов
управления и к некоторым другим сигналам управления uv, скорость
изменения которых требуется определить. Функционал (3.92) получен
из (3.90) добавлением слагаемых с вновь введенными сигналами управле-
ния uv в соответствии с методом аналитического конструирования в по-
становке А.А.Красовского (3.12). Диагональная матрица Kv выбирается с
произвольными ненулевыми элементами на главной диагонали.
Решение задачи (3.91), (3.92) дано в §3.2 и в случае управления скоро-
стью перемещения рулевых органов (см. §3.4) имеет вид
эк;
й,опт = -Kv—, (3.93)
ouv
где Vv (х, т) — скалярная положительно-определенная функция, удовлет-
воряющая следующим уравнению в частных производных и граничному
условию:
bVv
_— + -— F(x, Uvt ty = Uv> yv(tK) = Узад. (3.94)
at ox
Пусть теперь индекс v представляет собой порядковый номер последо-
вательности задач (3.91), (3.92) и их решений (3.93), (3.94). Кроме
того, с ростом номера v пусть неограниченно возрастают диагональные
элементы матрицы Kv. Если при этом выполняется достаточное условие
гк
lim J" uvomK.v Иропт^ ~ (3.95)
то последовательность функционалов (3.92) при оптимальном управле-
нии йи = й„опт имеет предел в виде функционала (3.90), а предел последо-
вательности (3.93)
^опт ~ uv опт (3.96)
> со
представляет собой оптимальное в смысле предельного функционала
(3.90) управление объектом (3.89), уравнение которого можно рассмат-
82
ривать как предел последовательности уравнений типа первого уравне-
ния в (3.91).
Таким образом, для объекта (3.89) оптимальным в смысле минимума
функционала (3.90) является управление
эк;
«опт ~ ~~ (3.97)
v -* т oUv
при следующих условиях:
— функции Vv удовлетворяют уравнению и граничному условию (3.94);
— элементы диагональной матрицы Kv неограниченно возрастают;
— условие (3.95) выполняется, откуда следует, что при возрастании
элементов К„ компоненты вектора (3.93) могут возрастать на всем ин-
тервале (Го, ^к] в темпе, заведомо меньшем, чем возрастание квадрат-
ных корней из соответствующих элементов Kv.
Воспользоваться данным подходом при разработке алгоритмического
обеспечения систем совмещенного синтеза управления можно только в
варианте аналитического решения, когда на стадии проектирования могут
быть определены предельные функции (3.97) и предельные уравне-
ния (3.94) или их аппроксимации.
Глава 4
НЕКОТОРЫЕ СВОЙСТВА УПРАВЛЕНИЯ,
ОПТИМАЛЬНОГО ПО КРИТЕРИЮ А А. КРАСОВСКОГО
Эффективность алгоритмов управления в прикладных задачах в значи-
тельной степени зависит от понимания и правильного использования раз-
личных свойств предлагаемых алгоритмов: устойчивость работы, нечувст-
вительность к различным помехам, возможность парирования различно-
го рода возмущений, достижимая точность управления и т.д. Получение
ответа на эти вопросы для относительно сложных алгоритмов представля-
ет собой трудноразрешимую задачу. В инженерной практике в таких слу-
чаях анализ многих свойств алгоритмов управления базируется на экспе-
риментальных данных.
В настоящей главе приводятся результаты аналитического исследо-
вания некоторых свойств алгоритма с прогнозирующей моделью. При
этом рассматриваемые свойства обусловлены как принципом оптимиза-
ции по критерию обобщенной работы, так и особенностями прогнозиро-
вания. Все аналитические исследования проводятся на примере управле-
ния линеаризованным объектом при квадратичном функционале оптими-
зации.
§4.1. Общее решение задачи управления линейным процессом
при квадратичном функционале
Линеаризуем (3.20) относительно всех входящих в F аргументов,
используя известную методику (см. § 2.4) :
9F ЭГ 9F 9F
Дх =----Дх + ----- Д5 +-----Да + ----Дг, Д5 = Ди, (4.1)
Эх Э5 да dt
где Дх, Д5, Да, Ди — приращения соответствующих векторов относитель-
но их опорных значений; Дг — изменение времени относительно момента,
соответствующего опорному состоянию объекта; dF/d • — матрицы част-
ных производных вектор-функции F, вычисленных при опорном состоя-
нии объекта.
Вводя новые обозначения, уравнения (4.1) можно записать в виде
х = ax + bb+q, 6 = и, (4.2)
где символ приращения Д опущен для сокращения записи; а = bF/дх
и b = dF/db — матрицы соответствующих размеров, зависящие от оцени-
ваемых системой идентификации параметров (такими параметрами могут
dF dF
быть Элементы матриц); q =------Да + ------Дг — и-мерный вектор
да dt
84
постоянных или медленно меняющихся возмущений. Заметим, что в
(4.1) и (4.2) а имеет различный смысл, но поскольку в дальнейшем
изложении вектор параметров а из (4.1) и матрица коэффициентов а
из (4.2) не будут использоваться одновременно, то путаницы не должно
возникнуть.
Подынтегральную функцию (3.3) будем полагать содержащей стацио-
нарные коэффициенты (3. Функцию Кзад, как отмечалось в § 3.3, примем
равной нулю. Функцию штрафа QUI здесь тоже будем полагать нулевой.
Воспользуемся третьей редакцией алгоритма с прогнозирующей мо-
делью. При указанных условиях алгоритм (3.57), (3.70), (3.55), (3.71)
уступит место алгоритму
тк
“опт = 5 = —кК f Z’(T)p[xM(T)-x3aa(r)]dT, (4.3)
Tu
d d
хм = камхм + кЬм8м, — 5М = 0, (4.4)
dr dr
d
r—‘Z = KaMZ + кЬм, (4.5)
dr
уравнения (4.4) и (4.5) которого решаются с начальными условиями
(3.56), (3.61) и (3.65). Здесь ам и Ьм — матрицы, представляющие в
прогнозирующей модели соответствующие матрицы а и Ь объекта (4.2)
и в общем случае не равные им.
Известно [4.1], что решение уравнений (4.4) при заданных в момент ти
начальных условиях (3.56) и (3.61) имеет вид
* м(7) = ехр[дмк(т- 7и)]л-(т„) +
+ к / ехр[амк(7- tf)]6M6Mt/«9. (4.6)
Интегрирование матричной функции в (4,6) предполагает поэлементное
интегрирование подынтегральной матрицы и в общем случае не раскры-
вается. Однако для отдельных классов объектов типа (4.4) решение (4.6)
приводится к виду, не содержащему интегралов. К таким объектам, на-
пример, относятся рассматриваемые ниже объекты с невырожденной
матрицей ам. Полученные здесь результаты могут быть обобщены на
объекты с вырожденной матрицей ам, но представляемые в блочном воде
* (1) = + М.
* (/ + 1) = ЦХц) + df 5 (»=1,2....TV), (4.7)
6 = u
с невырожденной матрицей и типичные для задач управления подвиж-
ными объектами.
Для случая невырожденной матрицы ам решение (4.6) эквивалентно
формуле
*м(О = ехр[дмк(7 - 7U)].VM(7M) - ехр[Амк(7 - 7M)]}Z>M6M(7,J.
(4-8)
85
Аналогично для уравнения (4.5) можно записать
Z(O = ~*м <£ - ехр[амк(т - тм)]}Ь„, (4.9)
где Е — единичная матрица.
Заметим, что для случая (4.7) блоки Хц + общего решения опре-
деляются последовательным интегрированием предшествующих блоков,
первый из которых * (i) имеет вид, аналогичный (4.8).
Подставив в (4.3) функции (4.8) и (4.9), с учетом коммутативности
матриц ам’ и ехр(амк(т — тм)) получим
^опт ~ ) [адДм ~ &Вх(Ти)
+ / Л(т-тм)хзад(т)Л-], (4.10)
ти
где
тк
ад = f й(т-ти){£-ехр[дмк(т-ти)]> dr, (4.11)
тк
ав = f h(T~Tu)exp[aMK(r-Tu)]dT, (4.12)
ти
h(r ~ ти) = к{Е- еу.р[амк(т - тм)])0. (4.13)
Интегралы (4.11) и (4.12) могут быть вычислены в общем виде:
ад = к/?(тк - т) + 0a~l{Е - ехр[дмк(тк - ти)]) +
+ { Е - ехр[Дм к(тк т тм)]} (ай1 )'0 - р +
+ exp[fl>(rK - ти)] р ехр[амк(тк - т„)], (4.14)
“в = ехр[дмк(тк -ти)])+р -
- ехр[а'мк(тк - ти)]р ехр[амк(тк - ти)], (4.15)
где р — матрица размера л X и, удовлетворяющая условию
(а*1 )’р +ра~* - 0. (4.16)
В случае, если интервал оптимизации [т, Тк] в (3.12) будет скользящим
с постоянной длительностью Т (см. §3.1), что рекомендуется применять
при решении нетерминальных задач типа стабилизации заданного движения
объекта, формулы (4.14) и (4.15) примут вид
Од = 0Т + йм [£ “ ехР(дм Л1 +
+ [£-ехр(д^7)](д~’ /|3-р + ехр(амГ)рехр(ам7), (4.17)
ад = -0а~1[Е-ехр(ам7)] +р - ехр(амТ)р ехр(ам7). (4.18)
Определение нопт в соответствии с (4.10) требует знания заданного
состояния хзад(т) на интервале [тм, тк] в будущем. Для некоторых
задач это осуществимо, но для ряда задач может быть связано только с
приближенным прогнозированием. Если же полагать, что хзвд(т) =
86
— ^зад (^”м) >
тк
f А (т - ты)Хзад Q)dт = асхзаа (ти), (4.19)
ГМ
где
«С = К0(гк ~ г«) + < Е - ехр[ДмК(тк - ти)]} (а"1)^. (4.20)
Для постоянной длительности интервала [f, гк] имеем
ас = 0Г+ [£- ехр(амГ)]«)’0. (4.21)
Непосредственно из формул (4.11)-(4.13) и (4.19) видно, что
ал ч- ав = ас.
Используя второе уравнение (4.2) и формулы (4.10), (4.13), (4.17)-
(4.20), а также отождествляя момент формирования управляющих сигна-
лов (момент начала прогноза) tu = кти с произвольным моментом време-
ни t, можно записать для произвольного заданного состояния хзад
тк
6 (г) = АЬ(г) + Bx(f) + КЬ^а'1 )’ / h(T - 7и)хзад(r)dr, (4.22)
ти
для постоянного на интервале прогноза [г, тк1 заданного состояния хэад
6(f) = /46(f) + Bx(t) + Cx3aa(f), (4.23)
где
А = КЬ’М(л"1 )’аА а6М, В = ~КЬ’м(ам' )Ч, С = Kb'M(а“1 )ас . (4.24)
Таким образом, при неограниченной производительности вычислитель-
ных средств, когда можно полагать формирование оптимального управле-
ния непрерывным во времени, движение объекта (4.2), управляемое на
основе использования алгоритма (4.3) —(4.5) при невырожденной матри-
це ам, описывается в общем случае интегро-дифференциальным матрич-
ным уравнением
гк
у = Dy + Gj f h(r - 7u)x3aa(r)dT + Qo, (4.25)
а в случае достаточно медленного изменения заданного состояния — диффе-
ренциальным матричным уравнением
г = Dy + Схзад + Qo , (4.26)
где
[х ] rail Г 0 г 01 г q
6 г -1я лг ‘ ~ ’ G I СТ Go ~ .0. ’
Начальное условие для этого уравнения имеет вцц j’Co)= [*’ Qo) 5*(zo)l *•
87
Матрицы А, В, С и соответствующие блоки матриц D и G являются функ-
циями длительности интервала оптимизации Т, элементов матриц К и 0,
а также параметров модели (4,4) и (4.5), входящих в матрицы ам и Ьм.
В дальнейшем сосредоточим внимание только на уравнении (4.26),
решение которого записывается в виде
t
y(t) = exp[D(t - ro)l>’0o) + / exp[D(r - tf)]Gx3aHdtf.
Предполагая невырожденность матрицы D (из дальнейшего изложения бу-
дет ясно, что именно этот случай представляет интерес), можно для задан-
ного состояния хзад = const вместо (4,26) записать
у(г) = ехр[П(г - г0)1 У(*о) + Е - exp[D(T - ^о)]}(6хзад + Со)- (4.27)
Итак, решение (4.27), описывающее управляемое движение, получено
в предположении:
- линейности и стационарности объекта управления (4.2);
— квадратичности и стационарности функции Скач (3.3);
- нулевых функций Кзад и Сш;
- постоянства длительности интервала оптимизации Т в (3.2);
— постоянства заданного состояния хзад;
— неограниченности вычислительных возможностей (мгновенности фор-
мирования оптимального управления).
Применение в аналоп шых условиях других известных способов опреде-
ления оптимального в указанном смысле управления для объекта (4.2)
дает результаты, совпадающие с (4,10), Достаточно громоздкие выкладки
для общего случая здесь не приводятся. Ниже, при рассмотрении автоматов
ограничений (см. § 5,7), будет показано, что получаемое на основе прогно-
зирования управление в соответствующих условиях совпадает с управле-
нием, получаемым другими способами.
§ 4.2. Качество управляемого движения
Матричная функция (4.27) является решением уравнения (4.26) и
описывает оптимальное движение управляемого объекта (4.2), достав-
ляющее минимум критерию обобщенной работы вида (3.12), который при
принятых допущениях выражается функционалом
Г + Т J t + т
I f (-Х—Хзад) 0(х —Хзад) + / (ll К U+uowtK UonT)(lt.
' ' (4.28)
Отсутствие ’’прозрачных” связей этого функционала с доступными в инже-
нерной практике показателями качества управляемого движения (см.
§ 5.1), с одной стороны, затрудняет анализ полученного решения (4.27)
в общем виде, а с другой — приводит к итерационной процедуре подбора
элементов матриц 0 и К в процессе отладки алгоритма управления.
Чтобы выявить некоторые характерные свойства разрабатываемых
здесь алгоритмов, преобразуем функционал (4.28) к интегральной оценке
88
качества управляемого движения х(Г) объекта (4.2), Из (4.3) и (4.22) сле-
дует, что при точной и полной реализации алгоритма
«опт - Ав + Вх + Схзап. (4.29)
Принимая во внимание, что на оптимальном движении объекта имеет место
« ~ «опт > подстановкой (4.29) в (4.28) получаем
-|(х-х3ад)'Р(х-хзад)+(Л5+5х+Схзад)’А'1(/15 +i?x+Cx3an)jc?r.
(4.30)
Будем для простоты полагать в (4,2) <7 = 0. Тогда, воспользовавшись
формулой (4.23) и первым уравнением (4.2), приведем (4.30) к виду
+ («сДх - аАа^х)’а^bMKb'M(a^)'(ac^x - аЛАмХ)|Л, (4.31)
где ДХ=Х —хзад-
В силу положительной определенности 0 и К подынтегральное выраже-
ние в (4.31) является положительно-определенным для всех Дх и х,
а (4.31) — интегральной квадратической оценкой качества процесса х(т).
Эта оценка при точной реализации рассматриваемых алгоритмов достигает
минимума. Заметим, что в общем случае оценка (4.31) зависит от вектора
состояния объекта x(z) и скорости его изменения во времени x(t). В зна-
чительной степени это объясняется формой представления объекта (4.2),
и здесь анализируется только вектор х, входящий в полный вектор со-
стояния объекта (4.2).
Очевидно, что оценка (4.31) к квадратичным интегральным оценкам
. г + т
Г = ~ f bxpbxdt (4.32)
t
не приводится.
Проанализируем предельные случаи для (4.31). В первом из них будем
полагать, что длительность интервала оптимизации Т такова, что при разло-
жении матриц , а в и ас в ряды Тейлора достаточно ограничиться члена-
ми не старше Т2. Тогда, как следует из (4.17), (4.18) и (4.21),
т2
аА = + «м $ ~(«м) ~'ам$ам1 ’
, . т2
аВ — (3—£?м^«м)Т’+ ~(йм) Рам ~ - (4.33)
; Т2
ас = -ам0~ •
Подстановка (4.33) в (4.31) при сохранении только линейных но Т членов
дает интегральную оценку вида
1 г+т
/•* =—/ (Дх'рДх +x'px)dt, (4.34)
2 г
где
Р=/3,
Р = 2Г2(^-‘ --а'ы Р). (4.35)
Оценка (4.34) приводится к (4.32) только в частных случаях, когда д =0.
Так, для произвольных ЬтК э-.о условие эквивалентно условию
0ам ~ амРаЫ =0»
которое заведомо выпор .яется, например, припм =Е. Удовлетворить оцен-
ку (4.34) при заданной матрице д можно в случае, если существуют К и Т,
удовлетворяющие (4.35).
Во втором предельном случае будем считать, что длительность интервала
оптимизации (интервала прогнозирования) возрастает неограниченно.
Тогда для устойчивой модели (4.4), (4.5) в соответствии с (4.17), (4.18) и
(4.21) можно полагать
«л = РТ, ав= Ра^ + р, ас = РТ. (4.36)
Подставляя выражения для ад и «с в (4.31), получаем
г + т
= Т2 J (Ом(’м6 +хзад) ^м^м^м(вм) Р(а*л +x3an)dr. (4.37)
t
Проведем анализ подынтегрального выражения (4.37). Согласно (4.4)
вектор — а^Ьм8 определяет по текущему значению вектора 6 установив-
шееся состояние прогнозирующей модели в случае ее устойчивости и
/ d \
положение неустойчивого равновесия I—хм = 0 )модели в случае ее не-
\d т /
устойчивости. Такое состояние модели будем называть балансировочным.
В скобках подынтегрального выражения (4.37) стоят невязки между
балансировочным состоянием модели (4.4), соответствующим текущему
положению рулевых органов 5, и заданным состоянием хзад объекта.
А в целом подынтегральное выражение представляет собой положительно-
определенную форму этих невязок (в силу положительной определен-
ности К ).
Следовательно, при неограниченно больших интервалах оптимизации рас-
сматриваемые здесь алгоритмы минимизируют интегральную квадратичную
оценку (4.37), вычисляемую на разностях между заданным состоянием
объекта и некоторыми балансировочными состояниями прогнозирующей
модели, соответствующими текущему положению рулевых органов
объекта. При этом никак не учитывается текущее состояние объекта управ-
ления. Этот вывод указывает на нецелесообразность назначения в практиче-
ских задачах достаточно больших длительностей интервала оптимизации
(и, следовательно, интервала прогнозирования).
90
§ 4.3. Статические свойства управляемого движения
Рассмотрим некоторые свойства оптимального в смысле критерия
обобщенной работы управления, определяемые соотношением
Л’уст — D (Схзад + Qo), (4.38)
которое вытекает из (4.27) для асимптотически устойчивого решения
при г -> оо и хзад = const. Речь идет о статической точности управления,
т.е. о соответствии установившегося состояния управляемого объекта
хуст = lim х (О заданному состоянию хзад.
f -too
Анализируя точность управления при точном моде-
лировании объекта, будем полагать, что в уравнениях (4.4) и
(4.5) точно воспроизводятся матрицы объекта а и b, а в (4.2) имеет место
<7 = 0. Воспользовавшись формулой Фробениуса [4.1], запишем матрицу,
обратную матрице D:
а~1 +а~1ЬН~1Ва~1
-Н~1Ва~х
~а~хЬН~1~
Н~1
(4.39)
где Н = А — Ва~1Ъ — невырожденная матрица, так как detD = det a det Н.
Непосредственной подстановкой (4.24), (4.17), (4.18) и (4.21) с учетом
коммутативности матриц а и ехр (аТ) можно убедиться в справедливости
равенств
А=(В + С)а~хЬ. (4.40)
Используя второе из этих равенств, получим Н = Са~’Ь.
Раскроем соотношение (4.38), воспользовавшись последовательно мат-
рицей (4.39), формулой для Н и соотношениями (4.24):
xVCT = a~xbH~lCx3aa - а~х Ь[/>(д-1 )'асд-1 Z>]-1Z>'(awl )’ас*зад , (4.41)
- 5уст =-Я_1Схзад = -[fe'(a“1)'aca-1fe]’,fe'(awl)'o!Cx3an. (4.42)
Первое обстоятельство, на которое следует обратить внимание, заключается
в том, что установившиеся значения вектора состояния хусз. и вектора
положения рулевых органов 5уст в оптимальной системе не зависят от
элементов матрицы К функционала (при неограниченном сокращении
длительности цикла формирования управления).
Рассмотрим два возможных случая задачи.
1. Существует такое значение буст, что хзад = —д-1Ь8уст. Это воз-
можно либо при специальном подборе хзад , либо при обратимости матри-
цы Ь. Тогда, подставляя хзад в (4.41), получаем
хуст ~—а -1 b[b,(a~l)'aca~1 й]-1 Ь’(а~х )'аса~1 Ь8уст = —д-1Лбуст.
В силу единственности преобразования а -1 b имеем ху ст = хзад.
2. Не существует такого значения 6уст при котором выполнялось бы
равенство хзад = — а~1Ь8уст, тогда хуст ¥= хзад. При этом установив-
91
шееся значение вектора 6 определяется формулой (4.42). Нетрудно пока-
зать, что она соответствует методу наименьших квадратов [4.2] при
неравноточных наблюдениях с матрицей весовых коэффициентов ас-
Минимизируемый функционал имеет вид
~ (хуст Хзад) асС*уст -*эад)» (4-43)
а аппроксимирующая функция определяется соотношением х = —д-165.
Несимметричность матрицы ас в (4.43) не создает каких-либо затрудне-
ний, так как квадратичная форма (4.43) приводится к форме с симметри-
ческой матрицей по аналогии с (П.12) и (П,14).
Заметим, что при неограниченном увеличении длительности прогноза Т
в соответствии с (4.36) функционал (4.43) и формула (4.42) принимают
вид
J ~ О^уст “ -*зад) /И^уст — -*зад)>
(4.44)
«уст = -[Ь'^Ура-ЧУЬ^^х^.
Таким образом, в общем случае рассматриваемые здесь алгоритмы обес-
печивают (при устойчивости (4.26)) стабилизацию состояния, минимизи-
рующего (4,43) с матрицей весовых коэффициентов ас, определяемой
параметрами Т, 0 функционала и матрицами а, Ь объекта управления.
В предельном случае при Т -* °° матрица весовых коэффициентов в (4.43)
совпадает с матрицей коэффициентов квадратичной формы (3.3) функцио-
нала (3,12).
Исследуем точность управления при наличии невос-
производимых постоянных возмущений объекта. Если в (4.2) q ¥= О,
причем в модели (4.4) этот вектор не воспроизводится (в противном слу-
чае повторяется уже рассмотренная выше задача), то вместо (4.41) и (4.42)
следует записать
хуст = —д-1(66уст +</)> йуст = — Я-1(Схзад - Bcr'q) (4.45)
или, подробнее для 6уст,
буст = — [b' (а'1}' aca~l b]~l b' (a'1)’ (dcx3aa + a{ta"iq). (4.46)
При неограниченном возрастании длительности интервала оптимизации
(длительности прогнозирования движения объекта) и устойчивости моде-
ли (4.4), имея в виду соотношения (4.36), можно убедиться, что из (4.46)
вытекает
lim 5ycr = -[6'(6r-,)'/3fl-1fe]-16'(fl-1)^A.jan. (4.47)
т -* <»
Следовательно, при возрастании Т установившееся положение рулевых
органов для рассматриваемого случая стремится к положению, опреде-
ляемому (4.42) и не учитывающему наличие у объекта ненулевого векто-
ра q- При этом, как следует из (4.45),
Дх — ХуСТ — хзад — в q. (4.48)
92
В более общем случае формула (4.46) как и (4.42), определяет проце-
дуру метода наименьших квадратов, но с введением поправки в заданный
вектор состояния хзаи, ’’компенсирующей” влияние на движение объекта
(4.2) невоспроизводимых в модели пбстоянных возмущений. Формулу
(4.46) можно записать в виде
^уст b] ~lь'(а~1)'[ас(хзаа+ a~lq) -аАа~гq]. (4.49)
Подстановкой в (4.45) можно убедиться, что в случае а ”* <7 0 и сущест-
вования такого вектора й0, для которого справедливо равенство q = -£>60,
управление (4.49) полностью исключает влияние вектора q на управляемое
движение.
Из (4.33) видно, что при малых Т элементы аА пропорциональны Т,
а элементы ас пропорциональны Т2. В этом случае последнее слагаемое
в (4.49) пропорционально Г-1, а остальные не зависят от Т. Следователь-
но, неограниченно уменьшать Т нецелесообразно.
Проанализируем влияние ошибок идентификации па-
раметров объекта на точность у п ра вл ен и я. Предвари-
тельно заметим, что если частота обновления в модели (4.4), (4.5) значений
идентифицируемых параметров, входящих в матрицы а и Ь, существенно
меньше частоты формирования управляющих сигналов (4.3), то между мо-
ментами коррекции параметров матрицы дм и Ьм можно полагать детер-
минированными.
Сравним установившиеся значения вектора x(t) системы (4.26), соот-
ветствующие двум случаям. В одном из них матрицы а и b объекта (4.2)
отличаются от соответствующих матриц модели (4.4), (4.5), в другом эти
матрицы совпадают с матрицами дм и Ьы. В обоих случаях матри-
цы (4.24) вычисляются на основе дм и Ьм. При этом вектор q в (4.2)
полагаем нулевым.
В соответствии с (4.41) эти установившиеся значения определяются
соотношениями
^уст ® ЬН СхЗЛд, Хуст.м ^-"-^зад» (4-50)
где Нм = А — Ва^1Ьм - невырожденная матрица блочной матрицы (4.39),
вычисляемая для случая
А .
Разность соотношений (4.50) определяет ошибку вьщерж шания систе-
мой (4.26) заданного состояния:
~-VyCT — ^уст.м ЬН )^-'^зад- (4-51)
Введем матрицу
Д(в-‘&) = а~1Ь - а^Ьм, (4.52)
которая представляет собой обобщенную ошибку воспроизведения мат-
93
риц а и b объекта в прогнозирующей модели. Тогда условие Дх - 0 при
произвольном хэад и ненулевой матрице С запишется в виде
а-'Ь(Н~х - + й(а-1Ь)Н'1 = 0. (4.53)
Сравнивая формулы для Н в (4.39) иЯм в (4.50), можно убедиться, что
Н = Нм - ВД(а-1д).
Подставляя это соотношение в (4.53) и проводя соответствующие преобра-
зования, можно получить
км + ЦГ'ЩЕ - [Е - } - Ь(а~'Ь) = О,
или, раскрывая Нм и В,
+ ДОГЕЛИ — [Е —
-(^/«с^ЛмГ’Ьм^* )'авД(я-,/’)Г1} -Д(в-’Ь)»О. (4.54)
Таким образом, если обобщенная ошибка Д(д-1/?) представления мат-
риц а и b управляемого объекта в прогнозирующей модели удовлетворяет
матричному алгебраическому уравнению (4.54), то соответствующие
ошибки идентификации параметров управляемого объекта не влияют на
статические свойства управляемого движения.
В частном случае, если обобщенная ошибка такова, что имеет место
равенство Д(а-1&) = а^Ьм€, где е— некоторая невырожденная матрица
размера тХт, уравнение (4.54) с учетом первого равенства (4.40) при-
водится к виду ам1 bM [Z>'M (а'1)' aAaJ Z>M] *м (см )«с^м = 0- Заме-
тим, что при достаточно малых Т все ошибки, приводимые к матрице е , не
вызывают статических ошибок стабилизации заданного состояния.
Полезным для практики построения адаптивных систем с прогнозирова-
нием является следствие из последнего рассмотренного случая для объек-
тов с одним управляющим входом. Так как для таких объектов матрица е
вырождается в скаляр, а произведение а~1Ь определяет вектор статических
коэффициентов передачи от входа объекта к его выходам (компонентам
вектора состояния), то при достаточно малых Т без ущерба для точности
выдерживания системой заданного состояния хзад коэффициенты передачи
объекта могут идентифицироваться с точностью до общего множителя.
Другими словами, с точки зрения статической точности общий коэффи-
циент передачи объекта управления для систем рассматриваемого типа
может не идентифицироваться.
Пример. Рассмотрим управляемое короткопериодическое движение
самолета (2.84). Сокращая количество переменных на основе использова-
ния соотношения (2.67) и исключая уравнения для «3, получаем
(4.55)
(здесь опущен символ Д и учитывается только отклонение руля
высоты). Используя для управления алгоритм с прогнозирующей мо-
94
делью (4.3)—(4.5), будем полагать, что оптимизируется скорость откло-
нения руля высоты
«₽.. = и. (456)
При записи (4.55) и (4.56) в виде (4.2) введем обозначения
а
_ — атг ~~Отг _
гдедля устойчивого самолета det а # 0.
Прежде всего проанализируем, к чему приводит произвольное задание
хзад ~ 1азад wz зад]** Так как преобразование а~1Ь в соответствии.с
(4.57) в общем случае необратимо, то не всякое состояние [азад о>г зад] ’
может быть установившимся при использовании единственного рулевого
органа 5р.в* В этом случае, как утверждалось выше, минимизируется
квадратичная форма (4.43), а именно
7 = а" (а- азад)2 +(а*? + )(“-азад)((о2 -со2 зад)+с£2(^ - ы, зад)2,
где — элементы матрицы ас, определяемой соотношением (4.21).
Используя (4,57).можноубедиться,что
а"1Ь =
г wz бр.в 6р.Вх</ « «
(~amz ~ amz ) / (~&mz ~ ау amz )
, а 6р.в а » a a <*>z.
(атгау ~~ ayamz ) I \~^mz ~ ayamz)
(4.58)
(4.59)
“зад,
Отсюда следует, что если при азад и согзад соблюдается пропорцио-
нальность
ft ®р.в ft ®р.в
• у mz
wz зад — ,. д д
wz 6р.в 6р,в
~^mzay amz
то каждому такому состоянию [“зад “’гзад]* соответствует определен-
ное положение руля высоты
ft ft иг ft ft wz
к - ~amz~ayamz ~amz ~ ayamz
Op B — .д д 1 “зад ~ д д W2зад (4.60)
w2 bp.B o».B a t>p B a <>p.B **
~^mz^y ~~^mz aniz^y ^^y^mz
При выполнении условия (4.60) имеет место ayCT=азад, wz у ст = сог зад.
В случае нарушения моментной балансировки самолета (например, из-за
перемещения грузов внутри фюзеляжа) уравнение (4.55) следует допол-
нить слагаемым <7 = [0 /пгр.в]г. Нетрудно убедиться, что для объек-
та (4.55) не существует "компенсирующего” положения руля, при котором
q = —ЬЬр,в. В этом случае установившееся положение руля 6р.в.уст
будет определяться соотношением (4.49). Если подъемной силой руля
95
высоты в уравнении сил пренебречь (в^Р-в = 0), то все равно влияние q не
устраняется полностью.
Проанализируем требования к идентификации коэффициентов (4.55).
Рассмотрим частный случай, когда Д(д“’Ь) = а~'be, где е — произвольная
скалярная величина. Используя (4.58), запишем это соотношение в скаляр-
ном виде
. 6р.в fip.B wz . . . О a wz
(— атгм ~ ауы атгм' ' \~~атгтл ~ ауматгм'
$ «а 5 «а СО J а а 2
= (1 tex-,,// _«;1 »„,/),
. « 6.рл *р.в « ... “ « CJ= . _ (4.61)
(ауматгм ~ аум атгм' ' \атгм ~ ауматгм' ~
. 4Z а {р.в fip.B a v ,, а а “ц
— (1 + е)(д^,си1г — ву omz) / ( Д,пг — Оу omz),
где индексом ”м” отмечены коэффициенты прогнозирующей модели.
Переходя к отношениям правых и левых частей равенств, получаем
бр.в ®р.в wz х I f а бр.в 8р.в а ч_
(~^тгм ~~ аум ' ^уматгм~ аум атггл'~
, 6р.в *>р.в а ^р.в ^р.в о V
~{'~amz ~ау amz^ I (ayamz ~ау атг)‘ (4.6^)
При су₽,В = ау р,в = 0 равенство (4.62) приводится к виду ауъл = ау.
Таким образом, для обеспечения статической точности стабилизации за-
данного состояния объекта (4.55) в данном случае требуется толь-
ко точное воспроизведение коэффициента ау в прогнозирующей модели.
Ошибки воспроизведения других коэффициентов при принятых предполо-
жениях не влияют на статические свойства управления объектом (4.55).
§ 4.4. Статистические свойства управляемого движения
Алгоритмы оптимального управления с прогнозирующей моделью полу-
чены на основе метода аналитического конструирования, который в § 3.2
сформулирован применительно к детерминированной задаче. Все приведен-
ные выше результаты и относятся к детерминированным условиям приме-
нения алгоритмов. В то же время реальные условия функционирования
алгоритмов с прогнозирующей моделью могут носить случайный характер.
В этих условиях для анализа свойств контура ’’объект — регулятор”
требуются методы статистической теории [3.10, 4.3].
Прежде всего проанализируем влияние случайных возму-
щений и помех на объект, управляемый регулятором с прогнозиро-
ванием. Как указывалось в § 3.3, начальными условиями для прогнози-
рующих моделей (любой редакции) должны быть текущие (соответствую-
щие моменту времени Тм) значения вектора состояния х и вектора положе-
ния рулевых органов 6, Однако реально используемые сигналы для задания
96
начальных условий, например в (3.55), содержат неизбежные погрешности.
В достаточно общем случае вместо (3.56) и (3.61) можно использовать
следующие соотношения:
^м(7м) %Х » ®м(Ти)= 8(fu) +^6 , (4.63)
где и — векторные аддитивные помехи соответствующих размерно-
стей с указанными ниже свойствами.
При проведении статистического анализа ограничимся линейным прибли-
жением объекта управления (4,1) и квадратичным функционалом (4.28).
Уравнения, описывающие движение управляемого объекта, запишем в виде
х = ах + Ь8 +• 5 = и, (4.64)
где - л-мерный вектор случайных возмущений, а остальные обозначения
соответствуют (4.2).
Рассмотрим наиболее простой случай, когда случайные векторы %ч,
и £6 можно полагать некоррелированными между собой белыми шумами
с нулевыми средними значениями. Соответствующие ковариационные
матрицы этих шумов Rq8 (г-11), Ях5 (г— t-i) и R&8 (г-1j), где 8 (t-11) —
дельта-функция, полагаются известными.
Замена соотношений (3.56) и (3.61) соотношениями (4.63), по сущест-
ву, не влияет на формулы (4.24), (4.17), (4.18) и (4.21), а вместо (4.23)
следует записать
6=Л6+Ях + Схзвд+Л& + В£Х. (4.65)
В этом случае уравнение (4.26) примет вид
У = Dy + 6хзад + 2, (4.66)
где 2=[^ (Л^+5М']'.
Уравнение (4.66) является широко применяемым линейным уравнением
стохастического процесса с аддитивным шумом в форме Ланжевена. Из-
вестно [4.4], что для линейных, систем типа (4.66), подверженных воз-
действию гауссовых белых шумов с нулевым средним, вектор средних
значений ту и ковариационная матрица Ру вектора состояния у удовлетво-
ряют уравнениям
ту = Dmy ♦ Gx3aa, (4.67)
Ру ~DPy + PyD' +RS,
(4.68)
где Rs8(t — fj) — ковариационная матрица белого шума 2. В силу приня-
того в (4.66) обозначения и взаимной независимости %х и имеем
О
ARSA' + BRXB'
(4-69)
Уравнение (4.67) повторяет, по существу, уравнение детерминированного
процесса (4.26) и поэтому здесь не анализируется. Вводя обозначения для
ковариационных матриц вектора состояния управляемого объекта Рхх,
вектора положения рулевых органов Pgg и взаимной ковариации этих
7.В.Н. Буков
97
векторов Рх&, Перепишем (4.68) в виде
Ах ~а^хх +?хха +ЬР$х+РхъЬ + Rq,
Рх6 = аРх(> *Px6A‘ + bP6b + РХХВ', (4.70)
Аб ~АРбб + Рб6А' + ВРх6 +Р6хВ'+ЛЛвЛ'+Р/?хР'.
Решение этих матричных уравнений определяет эволюцию введенных
ковариационных матриц. В установившемся режиме, соответствующем
стабилизации некоторого состояния стационарного объекта, уравнения
(4.70) примут вид
аВхх +Рхха ЬР6х-Рх*Ь —Rq,
аРх6 +РхьА' = -ЬР66 -РХХВ', (4.71)
АРы +Р6ЬА, = -ВРх6 - РКхВ' -ARbA' -BRXB'.
Проанализируем некоторые предельные случаи. Пусть длительность
интервала оптимизации Т безгранично велика. Тогда, как следует из (4.36),
для устойчивого объекта (4.64) элементы матрицы аА тоже неограниченно
возрастают (пропорционально Т), в то время как для элементов матрицы
ав существует предел (4.36). Поэтому для достаточно-больших значений Т
два последних уравнения (4.71) примут вид
0 = Рх6Л', ЛР{6+Р66Л' = -ЛЯ6Л'. (4.72)
Из первого соотношения (4.72) следует Рх6 = 0, а второе определяет зави-
симость ковариаций вектора положений рулевых органов от интенсивности
шумов измерения его компонент. При тривиальном значении матрицы Рх&
установившаяся ковариационная матрица состояния объекта удовлетворяет
уравнению
aPxx+Pxxa=-Rq, (4.73)
т.е. зависит только от интенсивности случайных возмущений и, по
существу», отражает в стохастическом смысле неуправляемое движение
объекта.
Если длительность интервала оптимизации Т выбрать настолько малой,
что при разложении матричных функций (4.17), (4.18) и (4.21) в ряды
Тейлора по Т можно ограничиться членами, содержащими Т, то имеют
место соотношения Л = Ра-16,С=0 и из (4.71) следуют уравнения
а(.Вхх +Ц lbPgx) +(РХХ + и ЬР&х)а Rq,
а(Рх6 +в-1дР66) = -(/’х6й'(а-1)' + РХХ)В', (4.74)
В(Рхд + а’16Р{6) + (Рх6 +a-ibPSh)'B' = -B(a-ibR6b,(a-ty+Rx)B.
Если ввести балансировочное состояние объекта, определяемое соотноше-
нием Хбал ~ — а~1 ЪЬ, то сумма х +а’1 b 5 будет отклонением действитель-
ного состояния от балансировочного. Статистические свойства этого откло-
нения вытекают из (4.74).
Будем теперь полагать, что элементы матрицы К в (4.28) неограничен-
но возрастают, т.е. штраф, накладываемый на ’’расходы энергии на управ-
ление”, пренебрежительно мал. Возможность использования почти неогра-
ниченных сигналов управления определяет характер ’’оптимистичес-
кой” оценки ковариаций вектора состояний.
98
Принятое предположение позволяет в качестве первогр шага упроще-
ния (4.71) пренебречь во втором уравнении членом Действительно,
сравнивая этот член с членом РхьА, можно отметить, что матричный коэф-
фициент при множителе Pxg во втором из них, в отличие от первого, в
силу (4.24) возрастает пропорционально К. О поведении других членов
судить преждевременно. Тогда, предполагая обратимость матрицы А (что
является несильным предположением), получаем
РХ6 =~ЬР,6 (Л"1)' -Р^РЧЛ"1)'. (4.75)
Используя это соотношение, можно третье уравнение (4.71) записать в виде
ЛР{6 +РЬ6А'-ВЬР66(А^У-А'1Р66Ь'В' =
= ВРХХВ'(А~1У +Л’1 ВРХХВ' -ARhA' -BRXB'. (4.76)
Здесь можно пренебречь третьим и четвертым членами выражения, стояще-
го в левой части равенства. Это объясняется тем, что матричные коэффи-
циенты при P6g в первых двух членах согласно (4.24) возрастают про-
порционально К, в то время как в третьем и четвертом они остаются на
прежнем уровне. Следовательно, при достаточно больших значениях К
вместо (4.76) можно использовать соотношение
ЛРгв + Р&&А' = ВРХХВ'(А'1)' +А'1 ВРХХВ‘ —AR6A' — BRXB'. (4.77)
Теперь, подставив (4.75) в первое уравнение (4.71), получим
(а - ЬА'1 В) Рхх + Рхх (а - ЬА ЬРь 6 (Л'1)'b' + ЬА'1Pssb' -Rq. (4.78)
Умножая (4.77) слева на ЬА"1, а справа на (Л-1),Ь* и заменяя на основе
полученного равенства первые два слагаемых правой части соотношения
(4.78), а также пренебрегая по аналогии с изложенным выше членами
типа ЬА~1 ВРХХВ’{А 2)'Ь', приведем (4.78) к виду
(а - ЬА"1 В) Рхх + Рхх (а - ЬА"1 В) =
= ~Rq - bRb b' - bA~1BRxB'(A~l),b'. (4.79)
Решение этого уравнения дает оптимистическую в указанном смысле
оценку ковариационной матрицы вектора состояния объекта Рхх при
воздействии на объект случайных возмущений %q и при наличии помех
измерения вектора состояния %х и вектора положения рулевых органов
%у в виде белых шумов с заданными интенсивностями.
Обратим внимание на то обстоятельство, что в (4.79) фигурирует про-
изведение А"1 В и, следовательно, решение (4.79) не зависит от выбора
элементов матрицы К. Свойства решения определяются параметрами
объекта и выбором Т и /3 в минимизируемом функционале.
Воспользовавшись методикой [4.5], проанализируем влияние слу-
чайных изменений параметров на управляемое движение
объекта. Эта ситуация может иметь две интерпретации. Во-первых, объект
может иметь такой характер, что его матрицы а и b (в линеаризованном
варианте) меняются во времени в некотором смысле случайным образом,
в то время как прогнозирующая модель имеет на интервале [fo,ra + ДГа]
фиксированные параметры. Во-вторых, при детерминированном измерении
матриц объекта оценки их элементов, полученные в условиях шумов
7
99
наблюдений на ограниченных по продолжительности движениях объекта
и используемые для настроек модели, носят случайный характер. Хотя
здесь источники случайности и особенности ее проявления различны, огра-
ничимся рассмотрением лишь управления объектом
х = (а + |в)х + (Ь+Ь)«+^, 5=«, (4.80)
где и — матрицы случайных составляющих элементов соответствую-
щих матриц объекта.
Будем полагать, что матрицы дм и Ьы прогнозирующей модели являются
детерминированными. Тогда вместо (4.66) запишем
5'в(£> + Ь)У + ^звд+2» (4-81)
где
а остальные обозначения соответствуют введенным в (4.26) и (4.66). Для
простоты в дальнейшем будем полагать хзад = 0.
Наличие в (4.81) матричного шума создает дополнительные труднос-
ти, связанные с компактным представлением результатов.
Пусть элементы матриц и S порождаются белыми гауссовыми шу-
мами с ненулевыми средними (т.е. Др = М{} = 0, д2 = М{2 ) = 0) и извест-
ными ковариациями
%Dki) =R-Dlj11 )>
cov^/j/y.Zjt) = 5(r -Zi), (4.82)
cov(Sjt, S,) = । sz S (t — G) •
Первое соотношение (4.82) определяет элемент некоторой четырехмерной
матрицы (индексы /, /, к, Г), второе соотношение — трехмерной матрицы
(индексы I, /, к), а третье — обычной двухмерной матрицы (индексы к, I).
Поскольку общепринятых форм записи многомерных матриц и операций
над ними пока нет, будем их обозначать так: Rd о — четырехмерная, -
трехмерная и Д22 — двухмерная матрицы интенсивностей соответствую-
щих шумов. Кроме того, введем операции
л+л»
R-DD L ~ RDik\DjlLki>
Rd’S. - N- Е RDik\Zi^k>
fc = 1 (4.83)
n+m
RdD= S Roik\Dkj>
к = 1
л+гл
^£>* = 2} RDik^ki
fc=l
где L — квадратная матрица, a N— матрица-строка. Заметим, что результа-
том последней из введенных операций является матрица-столбец, а преды-
100
дущих — квадратные матрицы с элементами, размещенными в Лй строке
и/-м столбце. При этом если матрица RDD симметрическая, то первая опера-
ция дает симметрическую матрицу.
В [4.5] предлагается методика получения уравнений для моментов ком-
понент полного вектора состояний объекта, основанная на использовании
одномерного закона распределения вероятностей компонент состояния.
Пользуясь введенными выше обозначениями и операциями, запишем
уравнения для первых (теу) и вторых (0у) моментов объекта (4.81) в
компактном виде:
/ 1 _ \
ту =1 D + yD - — RoDjmy + Ms
1 _
/ 1 _ ' 6У =1 D + д/j — — Rud \ 2 t / 1 2 - V + бу\D + jiD — Rdd) + (4.84)
/ 1 _ +1 Me — — Rd's. - Rdг \ / 1 _ \ ' : )т'у + Rdv — Rda ' J +.
+ Rdd @y +jRes •
Получим из (4;84) уравнение для ковариационной матрицы
. / 1 _ \ / 1 - V
Ру =(£> + Md - - Rdd \Ру +py(D + Vd - — RddI ~
-RDZ:m'y ~ ™y -Rbz +.Rdd (Py + my m'y) + . (4.85)
Уравнение (4.85) является обобщением уравнения (4.68).
Для упрощения дальнейших записей будем вместо обозначения, введен-
ного в (4.66), использовать обозначение Z = [t-'q %'о]', где %о =А£6+В1-Х.
Тогда непосредственными вычислениями по (4.83) можно убедиться, что
для блочных матриц справедливы соотношения
—_ I Raa Rab I I Raq + RbO 1
Rao"lo 0 1’ Rcs = lo ]>
„ „ _ Г Raa -Pxx + Rab -Pxb + Rba -Pbx + Rbb -P66 0 1
w'=[o oJ’
, Г mx Raq Rbq "]
L mx-Rao +ть -RbO J
Используя эти формулы и пренебрегая для простоты корреляцией и
раскроем уравнения для ту и Ру. Из первого уравнения (4.84) имеем
=
1 - \ / 1 _
"’’До "—Raq l^x + Pb —' R,
2 / \ 2
т5 = Втх +Ат6 + до,
где до — математическое ожидание .
101
т6 +Цд-----(Raq +Rbo)>
2 ‘
(4.86)
Уравнения (4.86) являются детерминированными и описывают система-
тическое смещение управляемого процесса (напомним, что здесь хзад = 0).
Статические свойства этих уравнений могут быть оценены на основе мето-
дики, изложенной в § 4.3, путем введения формальных обозначений
1 _ 1 _
а* ~ а + ~~ В-аа> Ь» ~ Ь + ЦЬ ——Rab, (4.87)
1 _
4» ~ — ~ (Raq (£-*зад)»
Проведем здесь упрощенный анализ установившегося смещения, предпола-
гая матрицу А невырожденной. Тогда для устойчивого процесса из (4.86)
имеем
"гхуст = (в* -&.Л-,Я)_,£дд — Ь»А~1ЦО -—(Raq +jRfto)j. (4.88)
Анализируя это соотношение, обратим прежде всего внимание на то,
что смещение не зависит от выбора матрицы К функционала (в силу (4.24)
и особенности формирования Среди основных факторов, вызываю-
щих смещение (при х38Д = 0), необходимо отметить средние значения воз-
мущений, средние значения обобщенных ошибок выставки начальных
условий прогнозирующей модели (до) и ’’усредненные” отдельно для
каждого скалярного уравнения объекта (4.81) взаимные интенсивности
случайных составляющих коэффициентов объекта и случайных возмуще-
ний и помех. Здесь следует указать на то, что если в практических задачах
величина Raq неуправляема и часто (если случайные возмущения пара-
метров суть следствие ошибок идентификации) близка к нулю, то Rbo
определяется в этом случае уровнем корреляции ошибок оценивания
эффективности рулевых органов объекта и ошибок оценивания состояния
объекта х и положения его рулевых органов 6.
Из уравнения (4.84) получаем
Асх ~ а»РХх + ^хха* + +-^хб Ъ, ~Raq тх
-Rbq :m'b -тх: R'aq - т6 : Rbq + Raa : (Рхх + тх т'х) + (4.89)
+ Rab (Рхд + тх т’ь)+Rba : (Рцх + т'х) + Rbb : (Р66 + ms т'6)+Rq,
Рхб =а»рх6 +Рх6А' + Ь,Рьь +Рххв'— RaO :т'х ~RbO :т'о,
Аб ~ АР&Ь + 7>ббЛ'+ ВРхь + Р6хв' + Rq.
Уравнения (4.89) являются обобщением уравнений (4.70). Они опреде-
ляют эволюцию ковариационных матриц Рхх,Рхь иРьь при одновременном
действии всех указанных выше возмущений. Провести анализ этих уравне-
ний в общем виде весьма сложно. Предполагая же,например,отсутствие
шумов выставки начальных условий прогнозирующей модели, т.е. = 0>
можно описанным выше способом получить оптимистическую (при доста-
точно больших элементах матрицы К) оценку установившейся ковариа-
102
ционной матрицы Рхх:
/ 1 \ / 1
(в, -Ь,А 'В ——Raa'jPxx +jPxx(a* —Ь»А 1 В — —Raa '
-Rab :РХХВ\А~У-А ' ВРХХ :R’ab =
Rq Raq * ^х Rbq • ^6 • Raq ^6 • Rbq
Rao • mx ™x Rab • ™x Rba • Rbb ‘ ff1b.
(4.90)
Это уравнение в определенном смысле является обобщением уравнения
(4.79). Характерным является то, что на ковариации управляемого про-
цесса нелинейно влияют математические ожидания векторов .гиб, Вводя
упрощающие предположения, (4.89) и (4.90) можно привести к различным
частным случаям. Напомним, что правила выполнения введенных в этом
параграфе операций R : N даны в (4.83).
Глава 5
АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ
ОПТИМИЗАЦИИ УПРАВЛЕНИЯ
С ИСПОЛЬЗОВАНИЕМ ПРОГНОЗИРУЮЩЕЙ МОДЕЛИ
В основной постановке задача оптимизации управления движением ЛА
предполагает решение оптимизационной задачи в полном ее объеме. Весь
т-мерный вектор управляющих воздействий ищется на основе анализа
и-мерного объекта управления и единого, объединяющего все частные
задачи управления критерия оптимальности. Однако такой подход, являясь
верным по существу, может не принести ожидаемого успеха. Это объясняет-
ся рядом причин, к которым прежде всего относятся:
— чрезвычайная сложность или даже невозможность на современном
этапе решения многомерной оптимизационной задачи;
— трудность (возможно, из-за отсутствия необходимого опыта) форми-
рования единого критерия оптимальности, в котором бы с достаточной
степенью были учтены многие частные требования к процессу управления.
В то же время общая задача управления движением ЛА традиционно
подвергается декомпозиции (разделению) на различные подзадачи или
частные задачи. Эти задачи по своему физическому содержанию могут
либо соотноситься как соподчиненные, либо носить автономный характер.
Каждая из таких частных задач требует проработки специфических вопро-
сов построения и функционирования алгоритмов управления. В данной
главе все рассматриваемые алгоритмы строятся на основе прогнозирующей
модели.
§ 5.1. Декомпозиция процессов управления
В первой главе отмечено, что одной из характерных черт современного
уровня развития теории управления движением ЛА является стремление
к интеграции систем управления, решающих частные задачи. Предполагает-
ся, что интеграция этих систем даст потенциальные возможности улучше-
ния характеристик всей системы управления ЛА [ 1.15, 5.1,5.2].
В интегрированных системах управления широко используются датчики
с цифровым выходом, цифровые исполнительные устройства, схемы с вы-
соким уровнем интеграции, мультипроцессорная архитектура системы,
ЦВМ на оптоэлектронных элементах, волоконно-оптические линии связи,
мультиплексные шины передачи данных, методы параллельной обработки
информации, параллельные алгоритмы вычисления управляющих воздей-
ствий, методы аналитической избыточности и реконфигурации системы,
отказоустойчивое математическое обеспечение и т.д.
Задача интегрированного управления движением ЛА неизбежно сталки-
вается с проблемой управления многомерными, в общем случае взаимо-
связанными процессами. Высокие порядки уравнений движения ЛА (с уче-
104
том, например, упругих деформаций) и уравнений его отдельных систем,
учитываемых при управлении (двигательные установки, приводы и т.д.),
могут явиться серьезным препятствием на пути практической реализации
разрабатываемых алгоритмов управления.
Методы распределенной обработки информации могут снизить необхо-
димость в передаче всех данных в один процессор и могут позволить рас-
пределить вычислительную загрузку по формированию управления между
несколькими процессорами. Известны [1.15] два основных варианта
декомпозиции управления:
— иерархическое управление, в котором процессоры объединены в
функциональную иерархию;
— децентрализованное управление, в котором процессоры взаимодей-
ствуют на одинаковом уровне.
Возможны также различные комбинации этих вариантов. В целом же
организация обмена информацией и вычислений в процессорной управляю-
щей системе тесно связана с особенностями алгоритмического обеспечения
управления. Создание распределенной системы. управления ЛА требует
разработки специальных алгоритмов, ориентированных на решение этой
задачи [5.3, 5.4].
Рассмотрим декомпозицию процесса управления объектом вида (3.20)
при использовании алгоритмов оптимального управления с прогнозирую-
щей моделью. Пусть движение управляемого объекта описывается урав-
нениями
х = F(x, 8, О, 8-и, (5.1)
где обозначения соответствуют принятым в (1.1) и (3.20). Минимизируе-
мый функционал имеет вид (3.12) . Тогда, как показано в § 3.2, оптималь-
ное управление определяется формулой
ЭГ'
«опт К » (5-2)
оо
где V = V(x, t) — скалярная функция, удовлетворяющая уравнению в част-
ных производных
bV bV
+ F=_Q Г[х(тк),тк]=Г38д. (5.3)
bt Эх
Воспользуемся алгоритмом с прогнозирующей моделью и матрицей
чувствительности. В этом случае вместо (5.2) и (5.3) можно записать на
основании (3.57) и (3.70)
ИОПТ(0 F
д ^эад (^к) * д ^задОк)
®*м(^к) ®5М(/)
dQ'fr) | bQ'(r) 1
ЭХмО) Э5М(Г) J
(5-4)
Здесь и в дальнейшем для упрощения записи осуществлен переход от уско-
ренного к обычному времени. Предполагается, что остается в силе требо-
вание выполнения соответствующих вычислений в ускоренном времени.
105
Вычисление (5.4) осуществляется на решениях уравнений прогнозирующей
модели
d d
“7"хм "^м (-'•м> 5М> г)> ^м-0,
dr dr
(5-5)
d dFM 9FM
— 2 — Z +_________——
dr Эхм(т) Э8м(0
с начальными условиями
хм(о=х(о, «м(0=«(а z(o=o.
(5-6)
(5-7)
Во многих прикладных задачах уравнения (5.1) допускают разбиение
их на блоки с тем или иным уровнем перекрестных связей. Такое разбие-
ние, как правило, должно базироваться на анализе содержательной поста-
новки задачи, на опыте построения систем управления для рассматривае-
мого класса объектов. Однако для общности будем пока полагать, что
разбиение уравнений (5.1) на блоки осуществляется произвольно.
Введем следующие обозначения: х7 — вектор состояния i-ro блока
объекта (подвектор состояния); Ft — вектор правых частей уравнений
i-ro блока объекта; — вектор положения рулевых органов i-ro блока
объекта; щ — искомое управление скоростью перемещения рулевых ор-
ганов i-ro блока объекта. Полагая далее, что мы имеем дело только с дву-
мя блоками (соответственно индексы i и /), уравнения (5.1) перепишем
в виде
х, = Ft (х„ X/, 8h 8f, 0, 5/ = u„
(5.8)
Ху — Fj (xt, Xj, 81,8f, t), 8j ~Uj.
Заметим, что обобщение на большее число блоков получается без особых
затруднений.
В рассматриваемом случае, если К = diag (к1г... ,кт), имеем
и,(г) = -^
ЗКзВД(Гк) , ЗР^Вд(Тк) Э1зад(Гк)
"1 1 - 1 н* J -f- п •
Э^(гк) 7 Эх7(Тк) Э8,(0
+ J
t
Zi'i
ЭС’(г)
ЭХ,(7) 7
ЭбЧт) dQ'(f)
bxj (т) дб/ (т)
dr
(5-9)
где Ztt - dxj/d8j — матрица чувствительности состояния i-ro блока объек-
та к положению рулевых органов этого же блока; Ztj = bXf/bSj — матрица
чувствительности состояния i-ro блока к положению рулевых органов
7-го блока. Кроме того, для краткости в (5.9) опущены индексы им”,
отражающие тот факт, что используются состояния и управления моделей
блоков объекта. Надеемся, что данная оговорка исключит путаницу.
Итак, (5.9) вычисляется на состояниях, моделируемых на интервале
[г, tK ] с помощью уравнений
d d d d
—~xi = Fi(xi,Xj,8l,8j), —8/=0, •^-~'Xj~Fj(xi,Xj,8i,8j), — 8f = 0
dr dr dr ar
106
Рис. $.1. Структура разделенного на каналы алгоритма оптимального управления в
общем случае
при начальных условиях, соответствующих текущему состоянию объекта.
Матрицы чувствительности определяются на этих же моделируемых состоя-
ниях интегрированием уравнении
d dFj bFt bFi
dr bxj bxs ’ bit
(5.11)
d „ bFj bF.- bFj *
—Zjt = —i- Z„ + — Zji +
dr 1 bXj bXj 1 bbt
с начальными условиями Zit = 0, Zjt = 0, где bFtlbxt — матрица Якоби
i-го блока объекта; bF{/bXj — матрица, определяющая влияние состоя-
ния/-го блока на процессы f-го блока; матрицы bFjb 8г и bFjfbb{ опреде-
ляют влияние положения рулевых органов /-го блока на процессы соот-
ветственно /-го и/-го блоков.
Аналогично можно расписать соотношение (5.8) для управления /-м
блоком объекта. На рис. 5.1 показана структура алгоритма (5.9)—(5.11)
для общего случая при Узад = О. Здесь четко выражены два канала. Связь
каналов проявляется, во-первых, в обмене прогнозируемыми состояния-
ми х{(т) и ху(г), а во-вторых, в одновременном вычислении частных
производных функции Q. В конкретном случае последняя связь может
быть несущественной. Если общее число блоков больше двух, то в (5.9),
(5.11) и на рис. 5.1 следует предусмотреть суммирование составляющих,
связанных с изменением состояния всех ’’внешних” блоков.
Алгоритм (5.9)—(5.11) соответствует общему случаю и сводится к ин-
тегрированию всех исходных дифференциальных уравнений алгоритма
(5.4)—(5.7). Выигрыш в вычислительных затратах может быть обусловлен
только ’’распараллеливанием” вычислений по блокам с перекрестным об-
меном информацией. Возможности дальнейшего упрощения алгоритма
107
связаны с соответствующим разбиением исходного объекта на блоки.
Рассмотрим важные частные случаи.
1. Автономное управление. Любой из каналов (например, i -й)
алгоритма (5.9)—(5.11) является автономным при формировании управ-
ления в двух случаях:
— векторные функции Fj других блоков объекта (5.8) не зависят от
состояния и положения рулевых органов i-го блока;
— векторная функция F; данного блока и скалярные функции V33a и Q
функционала не зависят от состояния Xj других блоков.
В первом случае bFjfbbi = 0, bFj]bxt - 0 и, как видно из (5.11), урав-
нение для Zjt имеет нулевое решение, а алгоритм управления записывает-
ся в виде
z, ЭСд^к) , ЭКДд(Гк)
" ax,(rK) bbt(t)
*к
Щ (0 = -А,
bQ' bQ'
----+-------
ЙХ/ 36;
d d d d
^-x/ = Fi(xl,xi,8l,b/). — 6i = 0, — Xj = Fj(Xj,bj), =
(5-13)
</т I ,
(5.12)
d bF: bF.
—L,t + —
dr bXj bbf
(5-14)
Здесь (5.12) и (5.14) с точностью до обозначений совпадают с (5.4) и (5.6),
т.е.определяют управление изолированного объекта (блока). Уравнения
(5.13) учитывают влияние на состояние управляемого блока других бло-
ков как источников возмущений.
Во втором случае bFflbXj = 0, bQJbXj = 0, b V33fjbxj = 0, в результате
чего первое уравнение (5.11) не зависит от решения второго уравнения и
соотношение (5.9) не содержит слагаемых с матрицей Zjt. Алгоритм состав-
ляют формула (5.12), уравнения
d d
— Xi = Fi (xh 6Д 5t = 0 (5.15)
dr dr
и уравнение (5.14). Уравнение (5.15) учитывает влияние на состояние уп-
равляемого блока положения рулевых органов других блоков.
2. Иерархическое управление (управление блоком, не име-
ющим собственных рулевых органов). Будем полагать, что в результате
декомпозиции уравнения объекта приведены к виду
х( = Ff (xh «,-), 6f = u{i х, = Fj (xb Xj). (5.16)
Тогда bFj/bbj - 0, bFtlbbj = 0. В этом случае управление i-м блоком будет
определяться по формуле (5.9), при вычислении которой используются
решения уравнений
d d
-—Xi = Ft (xh 8i), S,- = 0,
dr dr
d
—X/ = Fj (xb Xj), (5.17)
dr
108
d bFi bFj
—Zjj — Zjj + —— Zjf.
dr 1 bxt Ьх, ’
Решение последнего уравнения (5.17) в случае зависимости функций Кэад
и Q от состояния /-го блока обеспечивает учет в (5.9) требований, предъяв-
ляемых к движению этого блока, при формировании управления f-м блоком.
В работе [3.29] предложен вариант построения иерархического управле-
ния объектом (5.16), основанный на разделении задач. Пояснить такой
подход можно следующим образом.
Введем дополнительный вектор состояния xf., который будет отра-
жать некоторое задаваемое состояние i-го блока. При этом х/ф не обяза-
тельно точно совпадает с х,, однако в число задач управления будет входить
приведение X/ к xt, с достаточными точностью и качеством. Можно пола-
гать, что xt. удовлетворяет уравнению
(5.18)
где и{, — вектор дополнительных фиктивных управлений (псевдоуправле-
нии), размерность которого совпадает с размерностью вектора xt,. Для
обеспечения слежения xt за х,« в минимизируемый функционал введем
дополнительно положительноопределенные функции K3Bn,(xf - х, ,) и
Q, (х/ - Xj,), которые суммируются с соответствующими Изад и Q. Кроме
того, в этот же функционал вводятся соответствующие составляющие
с векторами и,,, и/.Опт и матрицей К/,.
Далее будем полагать, что в уравнении /-го блока (5.16) фигурирует
не истинный, а введенный вектор состояния. Тогда, решая задачу управле-
ния объектом, следует рассматривать уравнения
X/ - Fj (Xj, bj), 5/ - и,-,
(5-19)
Ху — /*у (Xj,, Xj), Xj, — Uj,.
Формально блоки такого объекта являются взаимно независимыми. Связь
между ними существует только через минимизируемый функционал.
Если для объекта (5.19) с учетом изменения обозначений и наличия в
функционале дополнительных членов применить алгоритм (5.9)—(5.11),
то получим:
для i-го блока
A г f 7'ft а^э«д(*к) Э^зад» (Gc) 1 дЕ,ад(Тк)
6,- = U; = -Kj { Z./Gk) I ------+----------- I + ---------+
'I '““'L Эх,(Гк) bXj(tK) J bb{(t)
(5.20)
d d
— Xj = Fj (Xj, 6,), —bt = 0,
dr dr
d bFj bFj
-—гц = ~ги + —\
dr Ьх, bbj
109
для /-го блока
xi» ~ “ &/•
ЭИэ;д(Гк) , ЭГ3,аде(гк)|
Эх;(,к) • Эх1Ф(О
z'3G'
z«^
(5.21)
~-xf = Ff (JQ. , Xj), —~Xi, = 0,
ат ат
а or; or;
—Zjj * —2 Zu + —i- .
dr bxj 1 dxlt
Таким образом, алгоритм управления представляет собой двухуровне*
вый алгоритм. На верхнем уровне осуществляется псевдоуправление
состоянием /-го блока/ т.е. формируется скорость изменения вектора
заданного состояния i-ro блока (5.21). Вектор xlt интерпретируется как
вектор положения "рулевых органов" верхнего уровня. На нижнем уровне
осуществляется слежение вектором состояния /-го блока за вектором
его заданного состояния и формируется скорость изменения положения
рулевых органов Структура алгоритма субоптимального управления
при использовании (5.18) представлена на рис. 5.2. Внутренняя обратная
связь между каналами, обусловленная передачей в /41 канал значений
соответствующим выбором параметров функционала может
быть существенным образом ослаблена.
Особенностью описанного способа является отсутствие обшей методики
введения дополнительного вектора х1л и функций Гзад» и 2.. В [5.5]
Рис. 5.2. Структура разделенного на каналы алгоритма субоптимального управления
при использовании (5.18)
110
предложено вместо (5.18) вводить для х,. уравнение вида
х/. =//• (х,.. 0 + Л. (х/„ О и,., (5.22)
где //, й — векторная и матричная функции, отражающие основные
динамические свойства '’внутреннего контура управления” или нижнего
уровня многоуровневой системы. Выбор этих функций основывается
на опыте создания систем управления для объектов рассматриваемого
типа. Уравнение (5.22) представляет собой упрощенную модель процессов
в блоке нижнего уровня иерархии. Наличие такой модели позволяет при
синтезе управлений верхнего уровня учесть динамические возможности
нижнего уровня.
Чтобы полупить алгоритм управления блоком
X/» = //, (Х/е, о + Л. (Xf„ Г)«Ь,
(5.23)
*/"Fy(xb,Xy),
необходимо эти уравнения представить в виде (3.8), а затем воспользовать-
ся соотношениями (3.15) и (3.29)-(3.31). Введем обозначения
Воспользовавшись, например, выражениями (3.32), (3.40), (3.45) и (3.46),
получим
Эх/Ф(т) Эх/.(т) 0
У(т) = ^Х/а0и) Эху(ти) ¥ дх,.
ахДт) дху(т) 8хм
. 9х/.(тм) Эху(ты) dxt. Эху
и, вводя обозначение У(т) = [У/у], найдем
и1»ОПТ Kity»
dxj(r)
3FVu) , „ , и, эг;ад.(7К)
axf.(7„) Эх,.(тк)
T*FV, ЭС'.(7) + . эе'(7)1. |
+ к J Yii --------- + Ya --------I dr I
TU L dJQ.(7) Эху(т) J J
(5.25)
Здесь матрицы Ytl(f) и Уу,(т) удовлетворяют уравнениям
d d dF; dF.
— Yit = Yu,. — Yjt = ---------- Yu + —~Yfi
dr dX{9 dr dxf, bxj
(5.26)
с начальными условиями Ya=E, Yjt^O. Уравнения (5.25) и (5.26) вычисляются на решениях уравнений (5.27)
d d ~ = Л.(х,., г), —-Ху = Fj(Xi„хЛ dr dr 1 (5.28)
111
с начальными условиями
хи(ти) = х,-(гы), Xj(ru)=Xj(tu). (5.29)
Алгоритм (5.25)—(5.29) является обобщением алгоритма (5.21) для
объекта (5.23). Действительно, объект (5.23) приводится к последним
двум уравнениям (5.19) выполнением условий = 0и -Е. Но эта же
условия приводят с учетом переобозначения Z7-7- = к алгоритму (5.21).
Для задачи управления движением ЛА существует традиционное разде-
ление на ряд подзадач различного уровня. В качестве таких уровней можно
указать:
— уровень выбора и расчета маршрута движения ЛА, на котором по це-
левой установке использования ЛА определяется оптимальная или пред-
почтительная траектория движения ЛА от начального пункта к конечному
или формируются условия текущего формирования такой траектории
(программирование полетного задания);
— уровень траекторного управления, на котором ЛА, как правило, по-
лагается материальной точкой и определяется отклонение действительной
траектории движения ЛА от заданной или формируемой по установленным
правилам, а также синтезируются команды сокращения этого отклонения;
— уровень пилотирования, для которого характерно управление дви-
жением ЛА как твердым телом с целью реализации команд траекторного
уровня.
На рис. 5.3 схематически показано установившееся на практике взаимо-
действие различных уровней управления полетом (ПрНК — прицельно-
навигационный комплекс, предназначенный для решения задач уровня
траекторного управления; ПК — пилотажный комплекс, осуществляющий
непосредственное управление движением ЛА). Такое разделение существен-
Старший командный уровень
(метасистемы)
Рис. 5.3. Взаимодействие различных уровней управления полетом
112
но упрощает решение многих практических задач управления, хотя, с од-
ной стороны, является условным, а с другой стороны, не исчерпывает все
возможные уровни. Так, могут рассматриваться, например, уровни управ-
ления групповым полетом ЛА и уровни управления функционированием
различных авиационных систем (силовой установкой, вооружением и пр.).
Автоматизация и оптимизация заданных уровней управлений возможны
на основе алгоритмов с прогнозирующими моделями.
§ 5.2. Непрерывное управление на пилотажном уровне
Предполагается, что в пилотажный комплекс из более высокого уровня
иерархии управления поступает командный сигнал. Если этим более высо-
ким уровнем является прицельно-навигационный комплекс, то командный
сигнал может поступать в виде, например, заданных перегрузок (2.19)
вдоль осей какой-либо выбранной системы координат или в виде заданного
углового положения ЛА. Если же роль старшего уровня иерархии в рас-
сматриваемом режиме играет экипаж, то в пилотажный комплекс посту-
пают сигналы, соответствующие перемещениям органов управления в ка-
бине экипажа. В этом случае заданные перегрузки или заданное угловое
положение ЛА может формироваться с помощью эталонной модели (или
совокупности эталонных моделей). Эталонные модели представляют собой
математические (часто упрощенные) модели движения ЛА, отвечающие
наиболее высоким оценкам его пилотажных свойств. Принципы формиро-
вания этих моделей опираются на особенности ощущений летчика и его
возможности работы в контуре управления движением ЛА [5.6, 5.7].
Задачей системы управления иа пилотажном уровне является формиро-
вание управляющих сигналов для рулевых органов ЛА, обеспечивающее
достижение и выдерживание заданных перегрузок или заданного углового
положения. Критерии оптимизации управляющих сигналов пилотажного
комплекса' формируются в отклонениях действительного состояния ЛА
от заданного (эталонного). Пилотажной комплекс, построенный по изло-
женным выше принципам, обеспечивает оптимальное в смысле этого кри-
терия слежение управляемым ЛА за заданным состоянием или за состоя-
нием эталонной модели.
Будем рассматривать задачи, в которых используемые рулевые органы
характеризуются непрерывным во времени изменением положения. В число
таких рулевых органов, как правило, входит большинство аэродинами-
ческих рулей (см. табл. 2.1).
Применительно к задаче улучшения устойчивости и управляемости ЛА
общая схема многопараметрической адаптивной оптимальной системы
(см. рис. 15) с прогнозирующей и эталонной моделями при управлении
скоростью перемещения рулевых органов принимает вид, показанный
на рис. 5.4. Здесь используются обозначения: хм(т) - прогнозируемое
в ускоренном времени г состояние ЛА; х38д (т) — заданное состояние,
формируемое в том же ускоренном времени эталонной моделью; 5ПК
и 8” - отклонения рулевых органов, создаваемые соответственно ПК и
летчиком; хл и и11 — информация, воспринимаемая летчиком, и управляю-
щие воздействия летчика.
8.В.Н. Буков 113
fit)
Самолет
Сервопри-
воды
»(t)
Дат-
чики
Неинструмен- И----
тальная информация
f'CO
it)
летчик
lit)
Датчики
u™it)
Система
отобра-
жения
инфор-
мации
Иреаны
управ-
ления
||/ГПК(Т9
Интеери-
риющце
приводы
Проенозирую
'ЛнТО
__________I
Проврамна
и иденти-
фикация
{Адаптивная.системауправления
Рис, 5.4. Структура адаптивной прогнозирующей системы управления самолетом
Управляющее воздействие летчика ил поступает непосредственно на
входы сервоприводов (бл) и на вход эталонной модели. Разность значе-
ний компонент состояний эталонной и прогнозирующей моделей исполь-
зуется для формирования управления ипк(Г) интегрирующими приво-
дами (возможно интегрирование сигнала ипк(Г) программными сред-,
ствами на выходе управляющей БЦВС). Алгоритмическое и программное
обеспечения соответствующего блока системы определяются выбором
варианта алгоритма оптимизации (см. § 3.4). В случае управления поло-
жением рулевых органов, а не скоростью их перемещения на
рис. 5.4 следует исключить блок ’’интегрирующие приводы”.
Непосредственное управление 6Л при ’’длинноходовых” интегрирующих
приводах имеет значение лишь в начальной фазе отработки управляющих
воздействий ил летчика. Поскольку система управления использует ин-
формацию о суммарном положении рулевых органов ЛА S(f) и мини-
мизирует интегральную оценку невязки х38Д(т) и хм(т), то с течением
времени, каково бы ни было 6Л, формируется 6ПК так, что реальное по-
ложение рулевых органов оптимизирует в смысле (3.12) движение ЛА.
114
С конкретной постановкой задачи управления тесно связан вопрос о
выборе адекватной модели движения объекта. Для пилотажных - задач,
как отмечалось ранее, характерна концентрация внимания на наиболее
сильных связях динамической модели ЛА. С необходимой степенью де-
тальности воспроизводятся процессы создания силовых и моментных
воздействий на ЛА. Так, при решении задач пилотирования на установив-
шихся или почти установившихся режимах полета, когда управляемое
движение осуществляется в некоторой малой окрестности установившегося
режима полета, можно воспользоваться линеаризованными моделями изо-
лированных движений ЛА. К таким моделям, например, относятся (2.83)
или (2.84), (2.85) или (2.86).
Если же пилотирование осуществляется в условиях интенсивного ма-
неврирования, изменения в широких диапазонах скорости, высоты полета
и углового положения ЛА, то достаточную степень точности моделирова-
ния могут обеспечить только нелинейные модели его пространственного
движения. В качестве таких моделей можно использовать (2.54) или (2.60).
Каждая из этих моделей описывает формирование сил и моментов, дей-
ствующих на жесткий ЛА при произвольном пространственном движении
(модель (2.60) не учитывает изменение скорости полета, что можно испра-
вить добавлением соответствующего уравнения), и является исчерпываю-
щей для исследования пилотажных задач. Входом этих моделей является
совокупность положений всех рулевых органов, значение и относительное
направление тяги двигателя. Векторы же состояния либо непосредствен-
но связаны, либо однозначно пересчитываются в компоненты перегрузки
или в параметры, характеризующие угловое положени** -ши скорость вра-
щения ЛА. При необходимости рассмотренные модели могут быть допол-
нены моделями работы двигателей.ЛА [2.4,5.8].
Перейдем теперь к прогнозирующим моделям. Более полное и точ-
ное воспроизведение различных эффектов прогнозирующей моделью позво-
ляет более полно осуществить оптимизацию управления движением ЛА,
достовернее предвидеть и парировать явления, снижающие безопасность
или эффективность ЛА. Поэтому в соответствии с решаемой задачей в
качестве прогнозирующей модели целесообразно использовать те же мо-
дели (2.83)—(2.86) или (254), (2.60). Кроме того, эти модели следует
дополнить по крайней мере моделями исполнительных приводов (2.89)
или (2.90) в случаях, когда динамические характеристики приводов су-
щественно влияют на процессы управления (значительные нелинейности,
сопоставимость полосы пропускания привода и объекта и т.д.). Од-
нако для прогнозирования возможно использование и упрощенных
моделей. В этом случае значительно снижается трудоемкость алгорит-
мов управления. В [5.9] показано, что в практических задачах соответ-
ствующий подбор коэффициентов функционала позволяет получить высо-
кое качество управления при использовании упрощенных прогнозирующих
моделей.
При решении пилотажных задач подынтегральная функция качества
процесса управления £?кач в функционале (3.12) и (3.7) (как и терми-
нальная функция Гзад) может назначаться в виде квадратичной формы
компонент вектора состояния (см. § 3.1). Применительно к модели (2.54)
8
115
такая функция может быть записана в виде
Ская = ~ ~ Ккзад)2 + ” Руу(Уу ~ ^узад)2 +
1 , 1 , 1
+ « &Vz(V* ~ ^хзад) + _ ~ ^хзад) + “ РыуС^У •~£^узадУ+
£ £ £t
1 1 1-
+ 2 ^wz(w2 ~ ^хзвд) + 2 ^ех(еух ~еухзад) +
1 2 1 .2
+ о (€УУ ~ еУУ3*я) + 9 ^ez (€У2 ~ ^угзад) +
Хг X
1 , 1 ,1
+ 0 @пх(пх ~ ялсзад) + _ 0пу(пУ ~ лузад) + 0nz(nz ~ игзад) •
2 2 (5.30)
Здесь — неотрицательные весовые коэффициенты; индексом ”зад”
отмечены заданные значения соответствующих величин, поступающие
из старшего уровня иерархии или формируемые на выходе эталонной
модели. Входяши» в (5.30) значения перегрузок вдоль осей связанной СК
(см. § 2.2) ие являются компонентами вектора состояния модели (2.54),
но могут вычисляться по формулам, вытекающим из (2.21):
— €ух + (Укх Vkz^y ~~ Уку^г)!^
пу~€уу+(Уку + Укхw2 - Укг b}x)/g, (5.31)
»z = €yz + (Vkz + Vky^x - Vkx^>y)lg-
Угловое положение ЛА в (5.30) задается значениями направляющих коси-
нусов между осями связанной СК и местной вертикалью. Эти косинусы
однозначно определяются по заданным значениям углов тангажа и крена
(см. табл. 2.2). Если необходимо обеспечивать также заданный угол рыска-
ния ЛА, то уравнения (2.54) следует дополнить уравнениями Пуассона
еще для трех направляющих косинусов, например для ехх ,еху, exz.
По таким же принципам формируется функция Ская при использовании
мЬдели (2.60). При использовании моделей (2.83)— (2.86) функции Ская
и ^зад записываются соответствующим образом.
Подбор весовых коэффициентов в (5.30) позволяет осуществить раз-
дельно или согласованно любую из перечисленных ниже вытекающих из
(5.30) ’’простейших” пилотажных функций.
При поперечном управлении:
— управление скоростью вращения самолета
— управление угловым положением самолета у (через еуу и еуг);
— выдерживание заданного угла скольжения & (через Уг) или попереч-
ной перегрузки nz.
При продольном управлении:
— управление скоростью вращения самолета coz;
- управление нормальной перегрузкой пу;
— управление углом атаки а (через Уу и Ух);
— управление угловым положением $ (через еух, еуу, eyz).
При управлении скоростью полета:
— выдерживание заданной скорости V (через Vx, Vy, Vz).
Заметим,, что использование перечисленных в табл. 2.1 рулевых орга-
нов обеспечит при пилотировании реализацию принципов непосредствен-
ного управления аэродинамическими силами.
Строгая реализация алгоритмов с прогнозированием требует прогнози-
рования или предсказания изменения во времени не только ’’свободного”
движения управляемого объекта, но и заданного его состояния. Другими
словами, требуется определение в ускоренном времени входящих в (5.30)
компонент Е^зад, ^\зад> ^гзад» ^*зад> ^узад> • • •, ^хзад- Очевидно, что
в общем виде это неосуществимо. В ряде конкретных задач можно обеспе-
чить такой прогноз с той или иной степенью точности.
Если вектор заданного состояния формируется в верхних автомати-
ческих уровнях управления, а возможность определить будущие управляю-
щие команды отсутствует, то наиболее простой и достаточно эффективный
прием основан на предположении о постоянстве заданного состояния эсзад.
При этом значение этого вектора в будущем на интервале [f, ?к] прини-
мается равным текущему значению эсзад (г). Если же из общей постановки
задачи известна тенденция развития процессов управления или известно,
хотя бы в среднем, изменение на рассматриваемом временном интервале
командных сигналов, поступающих в пилотажный комплекс, то исполь-
зование соответствующих формирующих фильтров или программ изме-
нения *зад(т) позволит существенно повысить эффективность разраба-
тываемого управления. В качестве примера можно привести автомати-
ческое формирование управления на пилотажном уровне при полете на
малой высоте и огибании рельефа местности. Если рельеф по маршруту
полета известен (находится в памяти БЦВС), то предсказание сигналов,
поступающих из уровня траекторного управления, при пренебрежимых
внешних возмущениях не представляет принципиальных трудностей.
При автоматизированном пилотировании, когда основным источником
управляющих сигналов, поступающих в пилотажный комплекс, является
экипаж, удобно пользоваться эталонной моделью ЛА. В этом случае
хзад(т) формируется этой моделью в ускоренном времени. Однако про-
блема задания входного сигнала эталонной модели на интервале [г, гк]
остается прежней. Могут также использоваться усредненные программы
действий летчиков в конкретных условиях полета, но это обеспечит улуч-
шение пилотирования только в случае, если экипаж будет действовать
’’стандартно”, в соответствии с запрограммированной манерой пилотиро-
вания. В противном случае могут возникнуть осложнения. В этих усло-
виях наиболее эффективной представляется гипотеза о постоянстве сигна-
лов ил (т) на интервале [z, tK ].
Приведем некоторые общие соображения по поводу эталонных моде-
лей. Их выбор может осуществляться двумя путями. Прежде всего с этой
целью можно использовать богатый опыт проектирования, создания, испы-
тания и эксплуатации ЛА различных классов. Другой путь основан на ме-
тодах инженерной психологии, на согласовании характеристик объекта
управления с психофизиологическими характеристиками человека-опе-
117
ратора. При этом, на наш взгляд, эталонные модели могут быть доста-
точно простыми, отражать изолированные движения ЛА в- разных плос-
костях или учитывать их минимально необходимое взаимодействие. Глав-
ное — переходные процессы в эталонных моделях и соотношение вход-
ных и выходных переменных должны соответствовать наилучшим (или
достаточно хорошим) оценкам пилотажных свойств ЛА [1.2, 5ДО]..Фор-
мирование эталонных моделей, определение обоснованного изменен^ этих
моделей от режима к режиму полета представляется отдельной и, доста-
точно сложной проблемой.
Если продолжить изложение алгоритма пилотажного комплекса приме-
нительно к модели (254), Дополненной уравнениями интегрирующих при-
водов рулевых органов (см. табл. 2.1)
^п.о = «П.о. ^г.о = “г.о, 6, = “э» • • »^р.у — ир.у» (5.32)
то, учитывая рекомендации § 3.4, в условиях высокой размерности век-
тора состояния и вектора управления выберем модифицированный алго-
ритм (3.55) -(3.57), (3.61) —(3.63). Тогда прогнозирование движения ЛА
на интервале [г, гк] должно осуществляться с помощью следующей мо-
дели:
d Г cos^>
Кем ~ к I Уум^гм ~ Угм^ум ~ £€ухм + —— Рм(6р.у.м» Кх) +
ОТ L глм
\1
+ с«м1 ’ °р.в.м» °з.м 11»
' •'дем /J
d Г sin</>
Т” ^ум — К I ~ КхМ^ЧхМ ~~S^yyM + м(^р.у.м> Кх)
dr L
+ QmS с ( S 8 8 Y1
+ /йм УМ\ГЛМ ’8Р в М’бз.м,«г.о.мД .
(5.33)
~~ Сухм ~ к(а}гм£уум ~’ а>умеугм) >
ат
£уум к(^хм^угм ^гм^ухм)'
ат
d
еугм ~ ^(^ум^ухм
dT
^хм€уум\
d _ d
“^П.О.М-0’ , ^Г.О.М=0»
dT dr
d d
“Г"^э.м = 0,..., “ йр.у.м = 0.
dT dr
Здесь KM = (Ухм + VyM + Vzm)1!2 - прогнозируемый модуль скорости
полета (как и в (2.54), предполагается отсутствие ветра); qM = рКД/2 —
прогнозируемое значение скоростного напора; с()м и Л”()м — моде-
лируемые в прогнозирующей модели аэродинамические характеристики
ЛА; тм и J(.jM — моделируемые значения массы и моментов инерции
ЛА и тд. Начальными условиями для (5.32) и (5.33) являются значения
соответствующих компонент вектора состояния объекта управления,
определяемые в момент начала прогнозирования, т.е.
^JCm(Tu) = KxGm)» ^ум^и) = - • • • ^р.у .м(Тм) ~ ^р.у (?М) • (5-34)
Оптимальное управление определяется формулами
Ип.о.оптОи) ^Ч1.оРп.о(^ы)>
^т.щ.оптОм) ^т.щРт.щ^и) >
(5.35)
Мэ.опт(^и) —АЭ/?Э(ГН),
ир.у.опт(Р«) ~Ар уРр у(/м) ,
где (гм) - значения частных производных функции (3.33)
вычисленные для момента времени /м интегрированием в обратном вре-
119
мени i? уравнений (5.32), (533) и уравнений
d
d$Pno~
= ( — cz™pVz + ~ т^рых + ту%°Р„у + ,
\™м JxM ^ум Одп .о /
d / 1 5 bQ \
JO Pt .щ ~ кЯм$ I ~ ^ТЛ^РУх + Z7 ) ’
UV \ fflM ®®Т.Щ '
d ' «, .. «Л (5;3<
Т7'₽э=««м^( — тХм₽^+ 7—тумРиу+ 77~
uu \ JXM JyM д5э/
d
dd Р™=К
^/р.у₽/ + ^/р.у
гм Рух Гм ,
Используемые здесь значения PVx, pVy, Pyz,... представляют собой
частные производные функции (333) по компонентам вектора состоя-
ния (2.54) и определяются интегрированием в обратном времени форми-
руемых по (3.63) уравнений
cos'°. Л +
*М *-ЛСМ
тм тм
sin^ у q S у \
-^)Руу +
ты
<7M*S ух \
1м +^ум)Ргх +
тм
<l„SI
JCM
QMS1
тхм Ршх + ~7
JyM
мух Vx
ГПумРыу . mZM Pu>Z
•'ZM
Э<2
(5.37)
d I bQ \
Pez “ K I ~ £Pvt ~ ^умРех + ^хмРеу + » I '
d&\ O€yz /
В уравнениях (536) и (5.37) введены обозначения с2по = Ьсг/Ьдпл,
П1®п-о = Э?лх/д6п.о и тд. Начальные условия для (5.36) и (537) в момент
t?K определяются вычислением частных производных функции Кзад ми-
нимизируемого функционала (3.12) по соответствующим компонентам
векторов положения рулевых органов и состояния (2.54). В пилотажных
задачах можно полагать Изад = 0, тогда начальные условия для (5.36) и
(5.37) будут нулевыми.
Частные производные функции Q в правых частях уравнений (5.36)
и (5.37) определяются заданием конкретной подынтегральной функции
минимизируемого функционала. Если полагать, что рассматривается толь-
ко функция качества вида (5.30), (5.31). то частные производные функ-
ции Q в (5.36) равны нулю. С учетом того, что соотношения (5.31) при-
120
водятся к виду
1 1
лх= ----(Pc<3S'f + qScx), пу= •—(Psitiv + qScy),
gm gm
n.‘—qSc„
gm
частные производные функции Q в (5.37) имеют вид
Т77” ~ &Vx (VXM - Рдсзад) + @пх (ПХМ ~ «хзад) (-Схм + -V ) +
°ух \^м тм /
„ , х sinu> V \
+ @пу(пум ~иузад)( сум + --------А/) +
\gmM тм/
+ в (п -п Z* <539>
х Hnzv4zM “хзад/ .... с2м »
- ~ Ае»(е>»2м “ €угзад) •
Таким образом, в пилотажном комплексе, реализующем данный алго-
ритм, на каждом цикле формирования оптимального управления ско-
ростью перемещения рулевых органов выполняется следующая последо-
вательность операций:
1) по результатам измерения (оценивания) состояния ЛА и положения
его рулевых органов к началу цикла формируются начальные условия
прогнозирующей модели (5.33);
2) в ускоренном темпе моделируется движение ЛА на интервале оптими-
зации [/м, fj<] при неизменных положениях рулевых органов;
3) полученные конечные значения компонент вектора состояния модели
(5.33) Используются как начальные Для интегрирования этой же модели
в обратном времени;
4) в ускоренном темпе интегрируются от tK до уравнения (5.33) (с
учетом обращения направления течения времени), (5.37) н (5.39);
5) по полученным для момента tu решениям уравнении (5.36) опреде-
ляются с использованием формул (5.35) сигналы оптимального управле-
ния, которые на очередном цикле формирования управления полагаются
постоянными.
При необходимости учета динамики силовой установки или исполни-
тельных приводов следует уравнения прогнозирования (5.33), (5.37) и
(5.39) дополнить уравнениями, описывающими процессы, протекающие в
силовой установке и приводах. Например, для описания приводов можно
использовать уравнения вида (2.89) или (2.90).
Реализация (5.33) — (5.37) и (5.39) требует высокой вычислительной
производительности, но она обеспечивает оптимальное пространственное
пилотирование ЛА. Более простые постановки задачи потребуют прогнози-
рования движения ЛА с помощью, например, линеаризованных уравнений
типа (2.83) — (2.86). Упростятся и уравнения (3.63). Это обеспечит ослабле-
ние требовании к вычислительным средствам.
121
§ 5.3. Релейное управление на пилотажном уровне
Специфической особенностью некоторых рулевых органов, используе-
мых в авиации, является релейный характер их функционирования. Так,
тормозные щитки и закрылки традиционно имеют два рабочих положения:
убранное и выпущенное. Хотя перевод этих органов из одного положения
в другое осуществляется с небольшой скоростью, иногда удобно пренебре-
гать конечностью времени работы механизмов. Можно воспользоваться и
другим приемом: рассматривать в виде релейной управляющей функции
скорость перемещения тех же тормозных щитков или закрылков, что в
большей степени соответствует физической картине. Еще одним примером
релейного управления являются газодинамические рули, используемые на
некоторых ЛА [1.8] и представляющие собой небольшие реактивные двига-
тели с постоянной по величине тягой.
Рассмотренные выше алгоритмы ориентированы на определение в каж-
дый текущий момент времени совокупности частных производных некото-
рой функции V(x, Г), отражающей качество управления, по компонентам
положения рулевых органов. Непосредственно эти алгоритмы для форми-
рования релейного управления неприемлемы. Этот недостаток можно
устранить соответствующими видоизменениями предлагаемых алгоритмов.
Будем рассматривать движение объекта
х = f(x, t) + </> (х, г)5 р (5.40)
с релейными рулевыми органами, положение которых характеризует век-
тор 6р. Ставится задача распространения изложенного выше подхода, осно-
ванного на прогнозирующих моделях, на синтез управления движением
объекта (5.40). Пусть каждая компонента вектора 5р может принимать
только два значения, т.е. речь идет о бинарных управляющих входах. При
необходимости полученные ниже результаты могут быть распространены
на случаи с тремя и более фиксированными уровнями компонент 5.
Для представления компонент 6р/ вектора 6р функциями времени могут
быть использованы функции вйда
Spi(t, tl, tl.$ = 5pZ0 - Др/ S (-1Г W ~ i), (5.41)
p=i
где 5p/0 — одно из значений компоненты 6р/, принимаемое за исходное,
т.е. это такое значение, которое соответствует положению i-ro релейного
рулевого органа в начальный момент времени; Др/ — приращение скачко-
образного изменения ьй компоненты с учетом знака изменения; 1/(Г— ф —
единичная ступенчатая функция, соответствующая д-му по порядку изме-
нению компоненты 5р/; — число рассматриваемых скачкообразных
изменений функции (5.41). Функцию (5.41) можно рассматривать как пре-
дельную последовательности функций
Mi Г 1 1 1
dpi (0 = 6 pio - A pi £ j (“1 + “ arct8 * <r - Ф j (5 -42>
при неограниченном возрастании к.
В (5.41) и (5.42) варьируемыми параметрами являются число переклю-
чений М( и моменты переключения . Число учитываемых переключений
122
будем полагать априорно выбираемым параметром алгоритма (наряду с
параметрами минимизируемого функционала). Моменты переключения
функций (5.41) будем рассматривать в качестве’’непосредственно .управля-
емых” компонент обобщенного объекта управления, полученного объеди-
нением (5.40) и уравнений вида
(5.43)
Уравнение (5.43) описывает перестройку момента д-го переключения
/-й компоненты вектора 5р. Если т — размерность вектора 5р, то следует
т
записать L Mt уравнений (5.43). Размерность обобщенного объекта управ-
z=i
т
пения в этом случае составит п + S Mt. Если через Г_ обозначить вектор,
/=1
компонентами которого являются параметры , то для обобщенного
объекта (5.40), (5.43) можно записать
х=Гр(х,Гр,0> Гр=м, (5.44)
где
Л>=Л^0 + ^(*.05ра.7’Р). (5.45)
Таким образом, рассматриваемый случай формально сведен . управлению
объектом (3.20), однако следует иметь в виду, что дифференцирование
Fp по Тр требует (в силу (5.41)) специальных приемов.
Минимизируемый функционал будем задавать в прежней форме (3.12),
полагая, что в функции Кзад и Q в общем случае могут входить как компо-
ненты вектора х, так и компоненты векторов 6р и Гр.
Воспользуемся вначале алгоритмом с матрицей чувствительности (3.55),
(3.56), (3.61), (3.70), (3.71), (3.65), полученным для управления ско-
ростью перемещения рулевых органов объекта (3.20). Принимая в качестве
’’рулевых органов” моменты tp переключения функций (5.41), запишем
уравнения прогнозирующей модели
d d _
—хы = к/(хм,7) + к^(хм, т)брм (г, Т ), — Т =0, (5.46)
dr dr v
где Тр = Тр/к — вектор, компонентами которого являются значения момен-
тов переключения функций (5.41) в ускоренном времени на интервале
прогнозирования (оптимизации) [ты, тк]. Начальные условия первого
уравнения определяются в соответствии с (3.56). Для второго уравнения
требуются некоторые фиксированные значения , полагаемые на всем
интервале прогнозирования постоянными. Будем считать, что из соображе-
ний инженерного характера можно указать исходную расстановку этих мо-
ментов времени.
В соответствии с алгоритмом вместе с (5.46) в том же темпе интегри-
руется матричное уравнение чувствительности (3.71), для записи которого
уравнение (5.46) следует представить в форме .
^(*м-7)брм(7,Тр)= i <^(хм,т)бр,м(т,Тр), (5.47)
/ = 1
где^- - i-й столбец матрицы у. Тогда уравнение для матрицы чувствитель-
на
мости примет вид
d Г Э/ т Э</>. _ 1 35DM
-Z(O-« — !-*• 6р(м('.Тр)р(гИ^-=Р . (5.48)
ат LoxM i-i dxM J dip
Дифференцирование функций (5.41) по любому из моментов как
параметру дает функцию вида
-^-=Др/(-1Л(Г-^), (5.49)
%
где S(t - Тд) — дельта-функция. Тогда частная производная вектора брм
по вектору Тр представляет собой матричную функцию, у которой (5.49)
определяет элемент ьй строки и д-го столбца. Такую матрицу обозначим
Д(т,Тр)= [Д(М] = (M-im-'tf)]. (5.50)
Следовательно, вместо (5.48) можно записать
d ГЗ/ m Э^; _ 1 _
5rZ(r) = kM-+^ -т2- бры(7,Тр) р(7) + м>Д(т,Тр). (5.51)
ат i = 1 Эхм J
Обратим внимание на два обстоятельства. Во-первых, матрица Якоби
8F/dxM в (5.51) в моменты /^/к скачкообразно меняет свои элементы.
Это приводит к необходимости как бы ’’сшивать” движения различных
по параметрам, но одинаковых по структуре систем. Особых мер здесь
не требуется, и трудности интегрирования не должны возникнуть. Во-вто-
рых, в эти же моменты времени fj/к на уравнение (5.51) действуют
возмущения типа дельта-функции. При интегрировании это эквивалентно
скачкообразному изменению соответствующих элементов матрицы Z(r).
Для величины скачкообразных изменений Z(r) в некоторый момент
можно воспользоваться следующим формальным правилом. В матрице
Д(т, Тр) присвоить значения Др|- и — Др/ в соответствии с (5.50) тем эле-
ментам, у которых дельта-функции для данного момента времени не
равны нулю, а остальным элементам присвоить нулевые значения. Обозна-
чим такую матрицу Д(т, Тр). Произведение <рД(т, Тр) определит матрицу,
которую следует складывать с матрицей Z(t) в момент
Полученные решения уравнений (5.46) и (5.51) в соответствии с (3.57)
m
и (3.70) используются для определения S М, управлений по формуле
i = 1
^^зад(гк) +
этр
{ , ЭГ' (тк)
I Эхм
+ к f IZ (т)-------+ —=— I dr} .
Если функции Кзад и Q в явном виде содержат бр(т), то дифференциро-
вание по Тр в (5.52) следует осуществлять по правилу дифференцирования
сложной функции с учетом (5.49) и пояснений к уравнению (5.51). При
этом наличие дельта-функций в 9Q/9Tp приводит к скачкообразному
изменению иопт в процессе интегрирования на интервале [тм, тк], а наличие
124
дельта-функции в ЭИзад/ЭТр приводит к скачкообразному изменению
компонент вектора Тр в (5.44).
Таким образом, при управлении (5.40) с использованием релейных
рулевых органов 5р последовательно выполняются в каждом цикле форми- .
рования управления следующие операции:
1) по результату измерения (оценивания) состояния объекта управления
и его рулевых органов формируются начальные условия для уравнения
прогнозирующей модели (5.46) и начальные значения вектора 5р(гм, Тр) =
= Яро- Одновременно по априорным данным (если это первый цикл) и по
результатам интегрирования второго уравнения (5.44) на предыдущем
цикле (для всех последующих циклов) задаются начальные условия для
вектора Тр, компонентами которого являются фиксированные моменты
переключения релейного управления;
2) в ускоренном темпе моделируется движение объекта с помощью
уравнений (5.46),где 6рм — моделируемая импульсная векторная функция,
компоненты которой в фиксированные моменты времени из Тр претерпе-
вают скачкообразные изменения;
3) в том же ускоренном темпе одновременно с (5.46) интегрируется
матричное уравнение чувствительности (5.51) с нулевым начальным усло-
вием, где 5р/м — компоненты векторной функции 5рм; Д(т, Тр) — матрица
с элементами в виде дельта-функций, определяющая скачкообразные
изменения в процессе интегрирования элементов матрицы Z(r);
4) по результатам интегрирования (5.46) и (5.51) вычисляется управле-
ние (5.52), где Кзад и Q — функции заданного критерия оптимальности
(3.12);
5) сформированное управление иопт(гм) используется как постоянное
для объекта (5.44) на протяжении очередного цикла формирования управ-
ления вплоть до получения новых значений иОпт0к) Изменение во времени
компонент вектора Тр соответствует смещению моментов переключения
импульсных функций (5.41) в сторону отдаления (?д > 0) или приближе-
ния (/р < 0) соответствующих срабатываний;
6) при достижении текущим временем формирования управления tu
очередного момента срабатывания z'-ro рулевого органа (при приближении
t - к нулю или к достаточно малой величине) производится действитель-
ное (а не моделируемое) срабатывание z-ro релейного рулевого органа.
Соответствующим образом меняется и значение вектора бр0, используемо-
го на первом шаге алгоритма.
Перейдем теперь к модифицированному алгоритму (3.55)-(3.57),
(3.61)-(3.63). Использование этого алгоритма для объекта (5.44) при
учете особенности (5.41) в (5.45) дает прогнозирующую модель (5.46)
с начальными условиями (3.56) и (3.61), формулу для формирования
управления (3.57) и записанные по аналогии с (5.51) уравнения для векто-
ров рх и р6:
d . I
---Рх=К|-----+ 2
Э/ т
э*. - г эе
1 Эхм
Эхм «— 1 Эхм
d . - , эе'
—-р6=кД(^,Тр)^рх + к^=-.
(5.53)
125
Начальные условия для этих уравнений (для момента тк) определяются
при известных (вычисленных предварительным интегрированием (5.46),
(3.56) и (3.61)) значенияххм(тк) по формулам (3.62). Частная производ-
ная Э(2/дТр в (5.53) и частная производная ЭКзад/ЭТр, входящая в неяв-
ном виде в (3.62), должны определяться с учетом пояснений, приведенных
к формуле (5.52), а также обсуждаемых ниже.
Интегрирование первого уравнения (5.53) не вызывает затруднений.
Наличие здесь импульсных функций 6р1М прокомментировано при обсужде-
нии (5.51). Интегрирование второго уравнения (5.53) эквивалентно вычи-
слению интеграла
Рб(тм) =
Э^ад
ЭТр
+ К J
«к
Г , _ , dQ' 1
Д'(0, Тр)Л +
L О 1 р J
(5-54)
Будем пока полагать, что 9Q/9T р = 0. Тогда в силу особенности матри-
цы (5.50) компоненты вектора р6(«7), являющегося решением второго
уравнения (5.53), в процессе интегрирования почти все время сохраняют
постоянные значения и только в моменты Гр совершают скачкообразные
изменения на величины, определяемые произведением (/рх-Если восполь-
зоваться описанным выше приемом и вместо Д($, Тр) записать матрицу
Д(»?,Тр) (см.пояснения к (5.51)), то произведение Д'(<?, Тр)^’р^ опреде-
лит приращение вектора рЁ в моменты
Если функция Q минимизируемого функционала в явном виде зависит
от вектора 6р, то р6 (<?) претерпевает дополнительные изменения в процессе
вычисления (5.54). Эта зависимость может носить различный характер
(в том числе и квадратичный), но наиболее распространенным, наверное,
является случай, когда каждому из фиксированных значений компонент
(5.41) ставится в соответствие числовое значение аддитивной составляю-
щей Q, т.е. в частном случае, когда (5.41) может принимать только два
значения, имеем
при 6р/ = 6р,о,
при бр/=6р|0+Д
(5.55)
причем функции Qpi суммируются по i в Q. Тогда при изменении 6р|-(г)
во времени в соответствии с функцией (5.41) получим
м,
Op/ = <7i/-(<?2/-4?i/) 2 (-1)м 1/(Г-<), (5-56)
~ t m
а дифференцирование Q по вектору Тр дает матрицу-строку Е УИ,- эле-
ментов 1=1
dQ
=[..-(<72,-9iI)(-l)p5(r-r;)...], (5.57)
и 1 р
интегрирование которых в (5.54) приводит к дополнительным скачко-
образным изменениям pg(i?) в моменты гр. Величины скачков здесь состав-
126
ляют ±(^2» 9i/)- Так как моменты для каждого из слагаемых подын-
тегрального выражения (5.54) одни и те же, то результирующие скачкооб-
разные изменения р^ (#) представляют собой суммарный эффект действия
слагаемых А'(Я, Тр)ip'рх и SQ'/^Tp. _
Вычисление частной производной ЭИзад/ЭТр должно выполняться для
момента времени тк. Если Кзад задается в форме (5.55) и тк совпадает
с каким-либо моментом то в ЭКзад/ЭТр будут содержаться соответ-
ствующие дельта-функции. Это в свою очередь потребует скачкообразного
изменения компонент вектораТр во втором уравнении (5.44). Ранее отме-
чалось, что в пилотажных задачах во многих случаях можно полагать
Изав = 0.
В заключение заметим, что при решении практических задач с успехом
можно ограничиваться рассмотрением только одного момента переключе-
ния в функциях вида (5.41), когда Л/,- = 1. Тогда размерность вектора Тр
соответствует размерности вектора 6р. После каждого свершившегося
переключения 5р|- в интервал прогнозирования следует вводить новый
управляемый момент переключения f.
§ 5.4. Траекторное управление с локальной оптимизацией
Уровень траекторного управления движением ЛА в иерархической
структуре, представленной на рис. 5.3, показан над уровнем пилотажного
управления. В прицельно-навигационном комплексе, предназначенном для
осуществления функций этого уровня, формируются команды для пилотаж-
ного комплекса в виде заданных компонент перегрузки или в виде заданно-
го углового положения ЛА. В процессе функционирования прицельно-нави-
гационный комплекс использует как текущую информацию о траектории
движения ЛА, так и информацию о требованиях, предъявляемых к траекто-
рии. Эти требования, в зависимости от постановки задачи и этапа полета,
могут быть сформулированы либо предварительно (программа изменения
высоты полета, координаты промежуточных пунктов маршрута полета ЛА
и т.д.), либо во время полета (поиск или преследование маневрирующей
целиит.д.).
Задачей системы управления на траекторном уровне является форми-
рование заданных перегрузок или заданного углового положения ЛА,
обеспечивающих движение ЛА вдоль заданной (или формируемой) прост-
ранственной траектории. Критерии оптимизации выходных (управляющих)
сигналов прицельно-навигационного комплекса формируются как в откло-
нениях заданной и действительной траекторий, так и в виде выражений для
минимизируемых на заданной траектории показателей (кинетической
энергии, массы расходуемого топлива, критериев безопасности полета и
др.). Прицельно-навигационный комплекс, построенный по изложенным
в гл. 3 принципам, обеспечивает оптимальное в смысле сформулированного
критерия отслеживание летательным аппаратом заданной траектории полета.
Предлагаемые ниже алгоритмы оптимизации управления на траекторном
уровне, как и алгоритмы пилотажного уровня, основаны на методе анали-
тического конструирования в формулировке А.А. Красовского (см. § 3.2).
Прежде чем приступить к изложению алгоритмов траекторного управле-
ния, проведем предварительный анализ. Начнем с того, что функция V(x, t),
127
определяющая оптимальное управление (3.15) для объекта (3.8) или опти-
мальное управление (3.21) для объекта (3.20), ищется как решение урав-
нения Ляпунова в форме (3.18) или
ЭК ЗГ
— + F(x, а, 8,1) = - Q(x, t) (5.58)
dt дх
при граничном условии (3.19). Алгоритмы с прогнозирующими моделями,
изложенные в § 3.3 и 3.4, определяют для момента формирования управ-
ления ги частные производные dV(tu")/dx(tu) или ЭК(ги)/Э5(ги). Следует
обратить внимание на то, что формируемое таким образом оптимальное
управление строится на анализе вариаций управляемых компонент только
в начальный момент интервала оптимизации. Это хорошо видно на примере
алгоритмов с численным дифференцированием, когда в (3.58) искомые
частные производные аппроксимируются отношениями приращений функ-
ции V к приращениям компонент 8,- в моменты времени tu.
Данное обстоятельство проявляется в разной степени в зависимости от
длительности интервала оптимизации. Как показывает опыт численного
моделирования алгоритмов с прогнозированием, целесообразно различать
два случая:
— длительность интервала оптимизации соизмерима с длительностью
переходных процессов оптимизируемого движения;
— длительность интервала оптимизации значительно превышает длитель-
ность переходных процессов.
Первый случай характерен практически для всех задач пилотажного
уровня и для некоторых задач .траекторного уровня (для задач типа стаби-
лизации высоты полета или линии заданного пути, огибания рельефа мест-
ности с незначительными перепадами высот и тд.). В таких задачах функ-
ции Кзад и Q функционала задаются, как правило, на основе относительно
простых физических представлений. Это могут быть, например, квадратич-
ные формы отклонений действительной траектории от заданной типа (3.3).
При этом использование описанных выше алгоритмов достаточно быстро
(после отладки вычислительных программ и уточнения элементов матрицы
0(г) в (3.3), элементов матрицы К"1 и момента гк в (3.12)) приводит к
качеству управляемых процессов, которое отвечает требованиям практи-
ки, вытекающим из физического содержания задачи. В дальнейшем задачи
траекторного управления, в которых длительность интервала оптимизации
соизмерима с длительностью переходных процессов, будем называть зада-
чами с локальной оптимизацией (подчеркивая тем самым оптимизацию
движения объекта в пределах одного переходного процесса).
Несколько иначе обстоит дело в задачах траекторного управления, отно-
симых ко второму случаю (т.е. при значительных длительностях интервала
оптимизации), но этому вопросу посвящен следующий параграф, а здесь
мы будем рассматривать только формирование локального в указанном
смысле траекторного управления.
Воспользуемся моделью (2.48). Пусть на пилотажном уровне осущест-
вляется управление объектом (2.54) с минимизацией функционала типа
(3.12) с подынтегральной функцией (5.30), где компоненты перегрузок
пока не будем принимать во внимание. Тогда, в соответствии с рекоменда-
циями § 5.1 записывая обобщенную модель управляемого процесса в
128
форме (5.19), для траекторного уровня следует записать
X = Схх Укх ь + €Ху Уку , + exz Vkz9 >
Н = СуХ • ^кх • еуу * ^ку • "* Cyz • Vkz •»
Z ~ (.CxyCyz* ~ eyy9exz)^kx9 (.eyx9exz ~ Cxx€yZ9) Vky* +
+ (.еххеуу* ~~ Сух»еху) Vkztr
&ХХ = ^9еху ^yt^xzt (5-59)
сху ~ <*>х *exz
exz ~ ^у *ехх
УкХ9~иУх> ~ Uvy> ^kZ9~uVz>
^х * ~ иых • <^у» ~ иыуг ^z • ~ ^wz»
Сух * ~ иех» еУУ*~иеУ> Cyz» ~ uez-
Здесь звездочкой отмечены компоненты дополнительного вектора состоя-
ния, отражающего заданное состояние для модели (2.54) пилотажного
уровня и состояние непосредственно управляемого блока в (5.59). Разделе-
ние уравнений (2.48) между (2.54) и (5.59) может быть изменено перено-
сом, например, в уравнения пилотажного уровня уравнений Пуассона для
ехх, еху> exz- Последние девять уравнений (5.59) могут быть заменены
уравнениями типа (5.22), описывающими изменение во времени компонент
с индексом * с учетом динамических свойств ’’внутреннего контура”.
При необходимости также уравнения (5.59) дополняются уравнениями
движения цели, уравнениями расхода топлива и т.д. Направляющие косину-
сы еух,, суу, и eyZ9 могут быть исключены из уравнений (5.59) в соответ-
ствии с табл. 2.2, в этом случае вместо последних трех уравнений (5.59)
следует записать
(5.60)
Количество уравнений может быть сокращено переходом от направляю-
щих косинусов к углам Эйлера. Так, вместо уравнений (5.59) можно,
используя табл. 2.2, соотношения (2.37) и полагая = 0, записать
х = Vkx .cos ф cos .(sin 7.sin ф — cos 7.cos ф sin»?,),
Я= Укх, sin 1?, + Уку9 cos 7, cos
i = - Vkx. sin ф cos + Уку .(sin 7, cos ф + cos 7, sin ф sin»?,), (5.61)
1
ф =--------(coy, cos 7. — wz» sin ?•)>
cos
UVy> tyt~UUy,
<^Z9=UWZ, У,=иу, d,=U-&.
В данном случае предполагается, что из траекторного уровня в пилотажный
9-В.Н. Буков
129
передаются заданные значения КЛхзад = KfcXe, Укузап~ У*у> Чззад =
= ыг„,... и дзад = (9,, которые дополняются значением КЛгзад = 0.
При оптимизации движения ЛА на заданной траектории предполагается,
что в траекторный уровень управления (в прицельно-навигационный комп-
лекс) из более высокого уровня (уровня программирования полетного
задания) поступает программа полета
x(t) = хзад(0, Н(0 = ^зад W, И (0 = 2зая(0 - (5.62)
Программа может быть задана и в неявном виде посредством задания
маршрута полета и графика прохождения промежуточных пунктов этого
маршрута. Функция может задаваться как эквидистанта рельефа
местности или как поверхность равных барометрических высот (равных
барометрических давлений). Вместо хзад и гзад может задаваться програм-
ма изменения угла рыскания (курсовой метод)
W)=W). (5.63)
В общем случае функция Q минимизируемого функционала (как и функ-
ция Изад) для таких задач может задаваться в виде
1 ,1,1
Скач ~ ~ 0х(х ~ хзад) + ~Г' Py(fl ~ -^зад) + - fizt? — 2зад) +
2 2 2
+ ~^(^-^зад)2. (5-64)
При необходимости эта функция дополняется слагаемыми, отражающими
темп расхода топлива, интенсивность изменения уровня опасности полета
(вероятность столкновения с препятствиями) и т.д.
Задача (5.61), (5.64) может быть сформулирована в другом виде.
С этой целью воспользуемся уравнениями (2.41) и (2.43), записанными
слева от вертикальной черты. Тогда с учетом (2.22) получаем
Ук ~ g(nXT. — sin 0), х = Ук cos в cos
• g
6 = — (nVT, — sin 6),
Ук y
• g
Ф =-------------nZT»,
Vk cos в
H=Vk sine,
i- — Vk. cos 6 sin Ф,
(5.65)
• _ * — •
^x > ^уть ^y> ZT • ^z >
где непосредственно управляемыми компонентами вектора состояния
являются только компоненты перегрузки в траекторной СК нхт,, пут», /iZT,.
На пилотажном уровне ранее рассматривались компоненты перегрузки
вдоль осей связанной СК (см. (5.31)). Переход от траекторной СК к
связанной осуществляется с помощью матрицы получаемой тран-
спонированием (2.63). Однако этот путь не очень удобен ввиду того, что
элементы матрицы (2.63) зависят как от компонент вектора состояния
модели(5.65),т.е. от углов 0 и Ф, так и от элементов матрицы £>“в, вклю-
130
чающей-направляющие косинусы модели (2.54), используемой на пилотаж-
ном уровне. Наиболее удобным с точки зрения разделения уровней управ-
ления в случае использования (5.65) представляется передача из прицельно-
навигационного комплекса в пилотажный комплекс заданных значений
перегрузок в проекциях на оси нормальной СК, т.е.
«хн.
пун»
Игн»
пут»
^7.ТЛ
(5.66)
н
где£>* вычисляется по формуле (2.4). В пилотажном комплексе (при реше*
нии задачи пилотажного уровня) компоненты заданной перегрузки пересчи-
тываются из нормальной СК в связанную
пх зад
пу зад
Hz зад
= D«
СВ
Пхн*
пун*
(5.67)
с использованием направляющих косинусов еху,... ,eyz, вычисляемых
в (5.33) с добавлением трех уравнений Пуассона для €хх, еху, е„. Подын-
тегральную функцию минимизируемого функционала можно задавать в
виде
Сдач Глзад)2 + Рб & - «зад)2 +^/М*~*зад)2 +
X XX
+ 7 Px (X - Хзад)2 +“^(Я-Язад)2 + (z - Z3aд)2.
X X 'X
(5.68)
(5.69)
Уравнения управляемого процесса для уровня траекторного управления
могут быть записаны в еще более простой форме. Для этого следует пред-
ставить уравнения поступательного движения ЛА в проекциях на оси
нормальной СК. Тогда, используя (2.19), получаем
^ХН ~£ПХН»> X — Г’хн ,
Уун =S(nyH* ~’ 1)»
^хн»~их> ЙуКл—иу,
На пилотажном уровне при определении заданных перегрузок исполь-
зуется преобразование (5.67). Функции функционала могут записывать-
ся как в виде (5.68) с вычислением необходимых компонент по значениям
Рхн> Уу«> так и В виде
1 , 1
вкач — _ PvxC^xk ~ ^хнзад) + _ РууС^ун ~~ ^унзад) +
X X
1 , 1
"* ~ Pvz(Vzm ~ ^гнзад) - Рх (х — Хзад) +
X X °
1 , 1
"* 2 Ру № ~~ ^зад) 2 (2 — 2зад) •
(5.70)
9
131
Достоинством (5.69) является возможность получения аналитических
решений для интервалов прогнозирования, когда их = иу = и2 - 0. Такими
решениями являются функции
Кхн (0 ~gnxn0»(t ~ tu) ^хн0>
Рун (f) ~g(.nyu0» — 1) (f — tu) + РунО»
^zh (0 ~ gnzuO»^t~ tu) "* КгнО»
x(t) = ~gnXHo»(t ~tu)2+ KxHofr ~ tu) *’jco>
H(t) — ~ g(nylto» О Ct ~ tu)2 ^уно(^ tu)
%Ct) gttznO»Ct tu) + Vzuo(t tu) +Zq,
где индексом О отмечены значения перегрузок, скоростей и координат
ЛА в момент, соответствующий началу прогнозирования. Располагая реше-
нием (5.71), можно воспользоваться вариантом алгоритма, основанным
на аналитическом решении (3.74). Запишем матрицу частных производных '
ЭХ/dS, используя обозначение [WXH nyu «zh]’ = n:
g(t - tu) 0 0
0 g(t - tu) 0
3X(x, t, tu) bn 0 ~g(t - tu)2 0 0 g(t - tu) 0 (5-72)
0 (t - tu)2 0
0 0 ^g(t~tu)2 * 4*
Если Кзад - 0, а подынтегральная функция функционала задана в виде
(5.70), то из (3.74), (5.71) и (5.72) для одного из управлений следует
гк ’
^хн»0и) %х f ' S(t — tu)f}yx [£ИхнО»(^ ~ tu) + ^хнО — ^хнэад(01
ги
+ 2 ~— tu) + ^хноО ~ tu) ‘*’*0 ~ -^зад(0^ | t^t ~
( Г g 1 1
I @Vx I “ ихнО*0к ~ tu)3 + “ ^хно(^к ~ tu)2 I +
о Г g , ,1 л 1 ,1
+ ^Х I 20 ”хн0*^к ~ tu) + g *хио(бс - tu) ♦ ~*о0к - fu) J —
Т*Г i 11
~ / I 0Vx(t — fu) Кхнзад(0 + ~ @x() — tu)2X3aa(t) I dt | . (5.73)
tu L 2 J 1
132
Аналогично могут быть получены оптимальные скорости изменения пе-
регрузок пуи,илгн.в момент tu.
Программа полета входите (5.73) в виде функций Ихнзад(7) ихзад(г).
В общем случае эти функции связаны между собой соотношением хзад (г) -
= Ихнзад^). Совместно с функциями Кгнзад(г) и гзад(г) они опреде-
ляют маршрут движения ЛА в проекции на горизонтальную плоскость.
При полете на постоянной геометрической высоте функции Ру н зад (О и
Язад(г) либо снимаются с карты впереди лежащей местности, либо опре-
деляются по реальному рельефу с помощью локаторов переднего обзора.
В частном случае при полете на постоянной геометрической высоте
(без учета изменения высоты рельефа), когда Ру н зад - 0, Язад = const,
при квадратичной функции (5.70) имеем линейный закон управления
• (Г S 8 1
иун*(^ы) = ~ку8 I РКгу (^к — ^ы)3 + ^у 20^к — КиуиО* — О "*
+ |0Ру _ (*к tu) + Ру Ок — ^и)4
L Z о
Руно
1 I
+ Ру , Ок ~ tu) (Яд — Язад) J
о
или, вводя обозначения для коэффициентов
fcj = kyg^Pyy ~ Ок ~ tu)3 +Ру 2q^k —
Г 1 , 1 , 1
^2 у “ kytl I Pvy Ок ~ tu) - Ок ~ tu) |>
L Z о J
(5.74)
(5-75)
^зу ~kygpy Ок ~ tu)3 >
о
получим традиционный по структуре (если предположить лут«лун) за-
кон стабилизации высоты с контуром перегрузки
ИуН*0н) Kiy [ЛуНФОи) 1] ^2 у JynrOu)
-k3y[H(tu)-H3aa]. (5.76)
Здесь луи.Ou), >уИ0и)> H(tu) — значения вертикальной перегрузки, вер-
тикальной скорости и высоты полета, измеренные (оцененные) в мо-
мент формирования управления tu.
При стабилизации постоянной горизонтальной скорости палета Ихзад ~
= const с использованием квадратичной функции (5.70) в условиях,
когда предполагается, что в начальный момент прогноза x(tu) =хэад,из
(5.73)- следует линейный закон управления
Лхн*(^и) = ~^1хпхн*(/и) ~ I ^хнОи) ~ Рхзад]» (5-77)
где kix, к2х, к3х — коэффициенты, отличающиеся от (5.75) индексами
при к и р. Для стабилизации нулевого бокового отклонения от линии
133
заданного пути имеем
^ZH»0u) z^zh*0u) ^Jz^zhOm) ^3z ^(^ы). (5-78)
Переход к неквадратичным функционалам приводит к нелинейным зако-
нам управления, которые заменяют (5.76) — (5.78).
§ 5.5. Траекторное управление с оптимизируемой программой
Перейдем к рассмотрению задач, соответствующих случаю значитель-
ных по продолжительности интервалов оптимизации движения объекта
-(длительность интервала оптимизации значительно превышает длитель-
ность переходных процессов). Внимание автора на особенность таких
задач впервые обратил А.В. Лебедев. Так, ’’классическая” задача облета
в вертикальной плоскости типового препятствия [1.48], показанного на
рис. 5.5, имеет известное эвристическое решение. Если задана минималь-
но допустимая высота над рельефом Язад и требуется проходить вершины
сопок с нулевым наклоном траектории (6 == 0), то маневр состоит из
двух этапов. В условиях постоянства скорости полета на первом этапе
ЛА движется по окружности с минимально допустимым радиусом 7?+.п
при положительной перегрузке (ограничение по максимальной нормаль-
ной перегрузке путах > 0), а затем движется по окружности с минимально
допустимым радиусом 7? min ПРИ отрицательной перегрузке (ограничение
по минимальной нормальной перегрузке пу min < 0). Однако, если полагать
это эвристическое решение отвечающим требованиям физического содер-
жания задачи (при необходимости можно развить постановку задачи),
получить близкое к нему решение методами, описанными в § 5.4, не так
просто. Оптимизация маневра с помощью изложенных вариантов алгорит-
мов с заданием функций Изад и б в виде (3.8) приводит к тому, что ал-
горитм стремится подобрать такое управляющее воздействие в начале
маневра, чтобы оптимизировать все последующее движение на прогнози-
руемом интервале. При этом использование ’’длинных” прогнозов сглажи-
вает формируемую траекторию движения, а ’’короткие” прогнозы повы-
шают опасность того, что маневр будет начат поздно и ЛА ”не впишется”
в требуемый профиль полета.
Отметим, что возможности алгоритмов, вытекающие из минимизации
(3.12), достаточно широки, а описанная выше ситуация возникает в резуль-
тате упрощенного подхода к задаче. Возможны по крайней мере два под-
хода к формированию на траекторном уровне ’’сложных” управлений,
Рис. 5.5. Облет в вертикальной плоскости препятствия типа ’’сопка”
134
обеспечивающих выдерживание различных условий, накладываемых на
траекторию (в том числе на начальном, промежуточном и конечном участ-
ках):
а) более полный учет всех требований к траектории (в том числе и
’’второстепенных”) путем соответствующего задания функционалов на
каждом этапе или участке траектории;
б) учет ряда специфических требований путем формирования оптими-
зируемой в дальнейшем программы траекторного управления.
Первый подход является, наверное, более перспективным, но не доведен
пока до общих методик и приемов. Второй подход заключается в забла-
говременном задании некоторой программы отклонения рулевых орга-
нов или законов их отклонения. Эти программа или закон должны содер-
жать достаточное число варьируемых параметров, чтобы можно было
охватить весь класс возможных, допустимых или желаемых программ и
законов управления. Воспользуемся общим обозначением' для такой про-
граммы или закона
6 = G(x, s, 0, (5.79)
где 5 — m-мерный вектор положения рулевых органов (в задачах траек-
торного управления в качестве этого вектора может приниматься вектор
с компонентами перегрузок и (или) заданных параметров углового поло-
жения ЛА по аналогии с х( . в (5.19)); s — d-мерный вектор параметров
программы (коэффициентов, моментов переключения, уровней ограни-
чения сигналов и т.д.). Очевидно, что функции типа (5.41) являются част-
ным случаем (5.79). Во всех случаях будем полагать функцию G дифферен-
цируемой по х и s. Если объект управления представлен в форме (3.8),
то программа (5.79) подставляется в (3.8) при условии и = б и в качестве
новых ’’управлений” принимаются параметры s.
В этом случае преобразованный объект управления описывается урав-
нениями
x = F(x, s, г)» s = и, (5.80)
где
F=f(x, f) + <р(х, t)G(x, s, t). (5.81)
Здесь и - d-мерный вектор искомых скоростей ’’настройки” параметров
выбранной программы (5.79). В целом методика получения оптималь-
ного управления для (5.80), (5.81) аналогична описанной в § 5.3. Только
на уровне траекторного управления в качестве 6 в (5.79), как правило,
фигурируют перегрузка или компоненты, характеризующие угловое поло-
жение или вращение ЛА (см. § 5.4). Хотя формально для объекта (5.80),
(5.81) будет определяться локальное1) по моменту формирования управ-
ление, для Исходного объекта (3.8) синтезируется необходимой слож-
ности программа изменения управляющих воздействий на весь интервал
оптимизации [ru, гк ].
Рассмотрим подробнее два варианта программы (5.79) и соответствен-
но алгоритмов траекторного управления с прогнозированием. Первый из
1) Понятие локальности сформулировано в § 5.4.
135
них предполагает гладкость G по х и s. Типичными примерами таких про-
грамм являются полиномы времени и компонент вектора состояния с на-
страиваемыми коэффициентами. Если по физическому содержанию задачи
можно указать некоторую среднюю или желаемую траекторию (например,
траекторию захода самолета на посадку), то от (5.79) требуется описание
изменения перегрузок (положения рулевых органов 8) в окрестности этой
траектории. Если же такую траекторию заранее указать нельзя (наведение
на подвижную цель), то от (5.79) требуется обобщение реально возмож-
ных зависимостей перегрузок (положения рулевых органов 8) от х и t.
Формирование функций Иэад и Q функционала (3.12) должно осу-
ществляться на основе содержательной постановки задачи. Так, для задач
наведения на цель функция Изад может представлять собой квадратичную
оценку отклонения ЛА от цели в некоторый заданный заранее (возможно,
корректируемый в полете) момент времени или минимального прогнози-
руемого расстояния между ЛА и целью (в этом случае tK заранее не зада-
ется и соответствует минимальному рассстояния между ЛА и целью при
прогнозировании движения ЛА с постоянными значениями параметров s).
При оптимизации посадки ЛА функция Изад может отражать положительно-
определенную (квадратичную) оценку отклонения прогнозируемой траек-
тории от заданной (по каким-либо соображениям) точки касания ЛА
взлетно-посадочной полосы.
Подынтегральная функция СКач задается в зависимости от предъявля-
емых к движению ЛА требований. Сюда могут входить слагаемые, отра-
жающие колебательность состояния ЛА на интервале прогнозирования
(например, квадратичные формы скоростей поступательного движения
ЛА в плоскости, нормальной к направлению на цель). Сюда же могут быть
включены слагаемые, отражающие взвешенную оценку потенциальной в
гравитационном поле (mgH) и кинетической (mV2/2) энергии ЛА (в за-
дачах оптимизации профиля траектории), взвешенный объем или взве-
шенную массу расходуемого топлива (в задачах оптимизации расхода топ-
лива и выполнения полета на максимальных дальностях).
Применение первой редакции алгоритма с прогнозированием (с числен-
ным дифференцированием) для задачи (5.80), (5.81), (3.12) приводит
к моделированию в ускоренном времени т движения объекта (5.80) при
нескольких постоянных значениях вектора настраиваемых параметров
$ с помощью прогнозирующей модели
“ т) + т> С г>« Т" < = °’ (5-82)
которая заменяет в данном случае (3.55). Начальные условия Хм(ги)
определяются формулой (3.56), a s^(ru) выбираются в окрестности либо
ожидаемого по априорным данным вектора настроек $апр, либо вектора
s(r), полученного в результате функционирования алгоритма на преды-
дущих циклах формирования управления.
На прогнозируемых траекториях вычисляются функции
тк
’/‘Ю=^эадК(Тк),Тк1 +к f Q(x^T)dT. (5.83)
Tw
(5.84)
(5.85)
(5.86)
(5.87)
\Эхм / = i Эхм /=1 Эхм / д& , bQ’ <РмРх +к • OQ' Рх +к Эхм
3sM bsM
(5.88)
Gj — элементы векторной функции
(5.89)
Значения Vv(tu) функции V (х, г), общее число которых зависит от выб-
ранного аналога частной производной и в простейшем случае составляет
d + 1, используются для вычисления
ноптОи)»*(... s мнч)...].
vy ешу
В формуле (5.84), являющейся обобщением (3.58), ty(v у) — постоянные
коэффициенты, связанные с выбором разностного аналога производной;
Шу - совокупность значений sv , входящих в аналог /-й компоненты част-
ной производной Э Vfbs.
При использовании второй редакции алгоритма (модифицированного
алгоритма) следует в прямом времени интегрировать
d d
, *м ~ ^) н^рм(хм, r) G (xm, sm, t), — sm ~ 0
dr dr
с начальными условиями (3.56), а также
$мОы) — $апр ИЛИ SmGm) “ ®(^и).
Затем по формулам
Рх(^к) = д^зад
— ^^зад Тк1 /^мОк)
определяются начальные (для обратного времени $) условия для двух
последних уравнений (3.63), которые в данном случае имеют вид
d
~Рх =*
d&
d
---Ps ~ К-
d$
Здесь tpf - столбцы матрицы
(программы) (5.79). Интегрирование (5.88) в обратном времени сов-
местно с
d d
, Q -*M к/м(-*-м> ’-0 ~ к*Рм(хм> ^) *^)> "7а Sm ~ О
d& d&
позволяет определить значение вектора ps (&и) - ps (ти) = ps (гм), которое
используется для закона настройки программы (5.79)
иоптОи)— «('«) KPsf/u)- (5.90)
Третья редакция алгоритма (алгоритм с матрицей чувствительности)
сводится к вычислению (5.90) с использованием вектора
, х_71, ч дИзад(тк) экзад(тк)
Ps(tu) = Z (тк) —------ + —-------- +
Эхм 3sM
И A 3G'(r) x ^'(0
+ K f \z'(r)—------+ ------
Tu L dXM
где Z(t) = dxM(T)/3sM(Tu) - матрица чувствительности, удовлетворяю-
rfr,
(5.91)
137
щая уравнению
d / 3/м „ д<Р/ ™ 9G* \ 9G
Т2(т) = к(—*-+ Г ~-G,+ S ' ад + К(/>м-_ (5.92)
\ Эхм j = 1 Эхм j «= 1 Эхм/ dsM
с нулевым условием Z (ти~) = 0. Все функции, входящие в (5.91) и (5.92),
вычисляются на состояниях хм(т), прогнозируемых с помощью (5.85)
в ускоренном времени т = t/к при начальных условиях (3.56), (5.86).
Другой вариант программы (5.79), исследованный А.И. Шуровым,
представляет собой кусочно-постоянную функцию времени
6(f) = s° + s (s«-s«-»)l(r-r,), (5.93)
i~l
заданную на интервале прогнозирования. Здесь Г/ — фиксированные мо-
менты квантования программы во времени; s* — m-мерный вектор, опре-
деляющий постоянное значение 6(f) на i-м шаге программы. Предполага-
ется, что правило квантования интервала прогнозирования определено
заранее и остается неизменным в процессе функционирования прицельно-
навигационного комплекса. Так, программа (5.93) может содержать
L + 1 участков интервала прогнозирования независимо от его общей про-
должительности. Может быть заранее обусловлена и равномерность на-
значения моментов Г/ € [fu, Гк]. Предполагается также, что из физи-
ческих соображений или на основе опыта решения подобных задач может
быть назначено первое приближение программы (5.93). Таким первым
приближением иногда может являться функция (5.93) с нулевыми зна-
чениями s1.
Использование программы (5.93) в основном аналогично использо-
ванию (5.79), но сопряжено с некоторыми особенностями, обусловлен-
ными структурой программы, дискретной во времени. Подстановка (5.93)
в (3.8) дает новую форму объекта управления:
X = f(x, t) + </>(х, r)[s° + 2 (s'- ? - *) 1 (t-Zf)] >
i~1 (5.94)
?=t? (/ = 0, !,...,£).
Общая размерность вектора управления и в (5.94) составляет m(L + 1).
Заметим, что каждый вектор параметров s* в (5.94) может настраивать-
ся иа всем временном интервале функционирования объекта (5.94), хотя
на x(f) они влияют поочередно, ’’включаясь” на соответствующем участке
[Г/, tt + !] (здесь следует иметь в виду, что tL + j = tK).
Если минимизируемый функционал задан в виде (3.12), то первая редак-
ция алгоритма приводит к семейству прогнозирующих моделей типа (5.82):
~ Хм = О + ^м(*м> T)[s° • ”+ S (?• v - S«~ 1)-,')1 (7 - 7/)]},
dr 1=1
d ( - (S-S5)
— ?'= 0 (i = 0,l........L).
dr
Каждая модель с номером v отличается от остальных хотя бы одной ком-
понентой любого из векторов s1. Общее количество моделей (речь может
138
идти о многократном повторении прогнозирования с помощью одной
модели, но с изменением компонент s') зависит от выбора разностного
аналога частной производной функции V(x, f) по компонентам s' век-
торов s' [3.26]. При использовании правых или левых первых разностей
для аппроксимации производных требуется не менее (т + 1) (L + 1)
прогнозирующих моделей (5.95). Начальные условия xv (ги) определяют-
ся формулой (3.56), а 5^и(Ти) выбираются в окрестности предыдущего
приближения программы (5.93). На прогнозируемых траекториях вы-
числяются (5.83),. (5.84). Настройка параметров s( осуществляется в
соответствии со вторым уравнением (5.94).
Прежде чем перейти к рассмотрению второй редакции алгоритма с
прогнозированием, следует условиться, как будет записываться програм-
ма (5.93), реализуемая в обратном времени. Пусть это будет программа
«(«?) = sL + S ОЛ-'-5£-'+1)10?ь_/_1 -Я), (5.96)
i = 1
где д — обратное время, текущее от t?K и &и, и в первые моменты време-
ни < О < дк; 1 — единичная ступенчатая функция, равная нулю при
отрицательных аргументах. Вторая редакция алгоритма с прогнозирова-
нием сводится к прогнозированию в прямом ускоренном времени движе-
ния объекта с помощью модели типа (5.85)
d
dr
d
dr
с начальными условиями (3.56) -и (5.86). Дополнительна-'' уравнения,
решаемые в обратном времени, с учетом (5.88) и (5.96) имг.^т вид
d (э/;
----рх ~ к<----- +
d& ( Эхм
ли L О Ф;
+ S [sf + S(sl-'-s,2'-/+1)1(i?l-,+1-i?)]'-t-L
/= 1 1 i= 1 1 ' Эхм
хм - к{/м(*м>г) + ^м(хм>0[5° + (3*-3* ^Цт-Т,)]),
(5.97)
s' = 0 (i = О, !,...,£)
у; +
L
bQ
Э*м
(5.98)
d ZQ'
—p‘s = к/т+1 -д)-1(^-д)]рх +К —г (/ = 0, !,...,£).
Здесь полагается, что d0 - &и, i9/, + i - &к- Уравнения (5.98) решаются
совместно с уравнениями
уг *м = -к{/м(*м> tfWM(*M>,3)Is£
dv
+ S (sL~''-sL~i+t)l(dL_i+l -<?)]).
i = 1
— s' = 0 0 = 0,
d&
(5.99)
139
Начальные условия для (5.99) представляют собой конечное состояние
моделей (5.97) в момент тк, а начальные условия для (5.98) вычисляют*
ся по формулам (5.87).
Второе уравнение (5.98) представляет собой группу уравнений, описы-
вающих изменение частных производных д V/ds*. При этом в каждом из
этих уравнений первое слагаемое с множителем рх ’’включается” только
на i-м шаге программы (5.93). На остальных шагах, не соответствую-
щих /-му номеру уравнения, это слагаемое равно нулю. Если sl непо-
средственно входит в функции Изад и Q, то производные bV3ABjbsl и
bQ/btf в (5.87) и (5.98) вычисляются по известным правилам. Если
в функцию Q непосредственно входит 6 (О, то в результате дифференциро-
вания получим
3Q Э6
bs* ~ ЬЬ bs1
— [l(r-ti)-l(r-f,+1)].
(5.100)
Для уравнения (5.98), решаемого в обратном времени, с учетом (5.96)
имеет место соотношение
dg' bS' bQ’ bQ'
тт чг= - *)- *)] * <5101)
bs bs Эб до
Видно, что слагаемые (5.101) в (5.98) тоже ’’включаются” только на
’’своем” шаге программ. По найденным для момента tu (для момента
значениям векторов pls определяются оптимальные сигналы настройки
программы (5.93), используемой в (5.94):
иопт(^и) ~ ~Кр’з(?и) 0" — 0, !,...,£>). (5.102)
Для третьей редакции алгоритма следует (5.91) заменить семейством
формул
pjaj = [^(тк)]'
^зад Ок ) , Изад (тк )
1 ..........-г *1
Эхм ^хм
т«<( , , ьо'(т) эо'(т)]
+ к f 1^(Т)]' -~т- О’ = 0, !,...,£), (5.103)
ти I 0Хм OS >
где матрицы Z'(r) = dxM(r)/bsl (ти) удовлетворяют уравнениям
</ ( Э /м m Ьф; L 1
57z (т)=4кг +л, <<-
rl>-'(г-г(.,)] О' = 0, (5.104)
с нулевыми начальными условиями Z'(rM) = 0. Все функции, входящие в
(5.103) и (5.104)’, вычисляются на прогнозируемом движении (5.97),
(3.56), (5.86). Количество уравнений чувствительности (5.104) соответ-
ствует количеству участков программы (5.93) с постоянным значением
6(f). Как следует из (5.104), для всех э’их уравнений матрица Якоби
dFjbx^ одинакова и содержит в общем случае программу (5.93) с пере-
ключениями в моменты Tf. Отличие заключается во втором слагаемом
140
правой части уравнения (5.104). Для определения каждой матрицы Z/(t)
это слагаемое ’’включается”, т.е. становится отличным от нуля, только
на шаге программы (5.93) с аналогичным номером i. Здесь полагается,
что т0 = тм, тЛ+1 = тк. Значения р\ (tu) используются в (5.102) для опре-
деления оптимальной скорости настройки параметров /.
Напомним, что в задачах траекторного управления под вектором 6
в (5.79), (5.93) и (5.96) можно понимать дополнительный вектор состоя-
ния х,с компонентами в виде перегрузок ЛА в какой-либо СК и в виде
величин, характеризующих угловое положение ЛА. Этот дополнитель-
ный вектор х. передается на пилотажный уровень управления движением
ЛА как заданное состояние.
§5.6. Траекторное управление с контрольными сечениями
Иногда требования к траектории движения ЛА формулируются для
так называемых контрольных сечений, когда нормы отклонения от номи-
нальной траектории формулируются для определенных моментов времени
или для определенных дальностей до цели полета. Рис. 5.6 иллюстрирует
такие сечения для захода на посадку.
Запишем уравнение гиперповерхности каждого д-го сечения произве-
дения Хп X [fo Лк] в виде
Рд(х, Г) = 0, (5.105)
где р — дифференцируемая функция указанных аргументов ;Хп - «-мерное
пространство вектора х; [г0, гк] —рассматриваемый интервал времени.
В частных случаях (5.105) может представлять собой фиксированные
дальности Иц до цели
(х-хц)2 + (Я-ЯЦ)2 + (z-zu)2-D2 = 0, (5.106)
фиксированные значения отдельных компонент вектора состояния ЛА
в задаче траекторного управления
х = хфм, Я = Яфя,..., (5.107)
фиксированные моменты времени полета /фЯ и т.д.
В функцию Q функционала (3.12) включим в качестве слагаемого
функцию
м
Скач.сеч ~ S Кд(х,/)5[ря(хл)]. (5.108)
я = 1
где М — общее число сечений в Хп X [Zo Лк11 Рд(*» О — положительно-
определенные скалярные функции (характеризующие уровень выполне-
ния требований к состоянию ЛА в каждом д-м сечении) типа, например,
квадратичных функций
1
ГДх.г) — ~ (к — хномру/?сеЧд(х — хномд);
(5.109)
8(рд) — дельта-функция, ненулевое значение которой соответствует мо-
менту прохождения траектории сквозь гиперповерхность д-го сечения
141
Рис. 5.6. Контрольные сечения и .границы допустимых отклонений от номинальной
траектории посадки
(предполагается, что траектория не лежит на гиперповерхности (5.105),
а имеет с ней только конечное число общих точек, т.е. несколько раз пере-
секает ее). Интегрирование в (3.12) функции (5.108) эквивалентно при
указанном предположении введению в минимизируемый функционал
дополнительных членов
м
Е (хсеч д, гсеч д), (5.110)
я = 1
где хсеЧд и ГсеЧд — вектор состояния и время, соответствующие прохожде-
нию траектории сквозь гиперповерхность д-го сечения в Хп X [г0, fK].
Следовательно, функционал может быть записан в виде
м
Л<р ~ ^зад[*0к)> + 2? Кд(хсечд, Гсечд) +
м= 1
+ f Q(x,T)dT + — f (и'К^и+u'onjK~1uonT)dT. (5.111)
h 2 te
Значения хсеЧд и tce4fi для (5.108) определяются в моменты выполнения
условий (5.105) —(5.107) или в момент t = 7фя на траектории движе-
ния ЛА.
При использовании первой редакции алгоритма с прогнозированием
(см. §3.4) в задаче траекторного управления с оптимизацией программы
типа (5.79) и наличием контрольных сечений (с функциями (5:108) функ-
ционала (3.12)) следует прогнозировать движение ЛА в ускоренном време-
ни с помощью модели (5.82). На получаемых траекториях вычисляются
функции
м
VV(tu) = Кзад[х^(7к),7к] + S Кд^ечр.^сечд) +
Я = 1
тк
+ * f Qlx^rydr, (5.112)
где Хсечд и Тсечр соответствуют пересечению гиперповерхностей (5.105)
с прогнозируемыми траекториями движения ЛА в ускоренном времени.
Полученные значения И" (tu) функции V(x, t) используются в (5.84).
Использование второй редакции алгоритма с прогнозированием в задаче
с контрольными сечениями связано с решением вопроса о дифференци-
142
ровании (5.108) по вектору х. С этой целью представим единичную ступен-
чатую функцию, аргументом которой является р, в виде предельной функ-
ции последовательности
1 1
d(k, р) = — + — arctg кр
2 7Т
(5.113)
при к -> полагая для определенности, что при к -* °° и р = 0 имеет место
кр ~ 0. Тогда дельта-функция б(р) может интерпретироваться как пре-
дельная функция последовательности
bd _ к
Эр 1 + fc2p2
(5.114)
Действительно, при к •+ °° и р =# 0 имеем d^ = 0, а при р = 0 имеем
j(i) _>оо Вторая производная функции d(к, р) пор имеет вид
b2d _ к3р
Ьр2 (1 +Л2р2)2
(5.115)
Будем полагать, что у последовательности таких функций при к -*• °° су-
ществует предельная функция, которая при р =# 0 имеет нулевые значения,
а при р = 0 имеет два неограниченно больших по величине и бесконечно
малых по ширине импульса. При этом в случае положительности этой
функции слева расположен положительный импульс, а справа — отрица-
тельный. Будем обозначать такую функцию б2. Важно отметить, что ин-
тегрирование этой функции по р дает в момент р = 0 обычную дельта-
функцию с аргументом р. Заметим, что в случае скалярных d и р функ-
ции (5.114) и (5.115) тоже скалярны, а если р является функцией х, то
при дифференцировании d по х как сложной функции структура функ-
ций d^1) и d^ не изменяется, а следовательно, не изменяется характер
функций 8 и 82; они лишь умножаются на матричные функции bpfbx
и Э2 р/Эх2.
Принимая сказанное во внимание, запишем уравнение (5.88) для случая
наличия контрольных сечений и задания в (3.12) дополнительных функ-
ций (5.108):
d
--- Рх ~ к
d&
*Q'
— т 2а Ui ----------
i = i Эхм
bV'
—— +
к Эхм
м
+ Е б(ря)
р = 1
« bG, Д
+ Е +
/= 1 Эхм /
м ~ дРи 1
s ‘Wr-L
р= 1 Эхм J
(5.116)
+ к
bG
d
---Ps ~ К
d&
эе'
V’mP.v "* К
Эхм
Прокомментируем особенности интегрирования уравнений (5.116).
Если условия (5.105) на прогнозируемом в обратном времени движе-
нии (5.89) не выполняются, т.е. прогнозируемое состояние находится
вне контрольных сечений, то б = б2 = 0 и уравнения (5.116) не отличают-
ся от уравнений (5.88). В моменты пересечения прогнозируемой траекто-
143
рии с очередной гиперповерхностью (5.105), т.е. в случае, когда на прогно-
зируемом состоянии хм(т) выполняется условие (5.105), в правой части
первого уравнения (5.116) одновременно возникают два дополнительных
слагаемых
»./ \ ^^ц(хсечц, ^сечд) -,2.
к6(рд) -----------------, кб (Рр)Им(хсечр> гсечм)-Л. (5.117)
Напомним, что траектория только пронизывает гиперповерхность сечения
и не имеет с ней общих участков конечной протяженности. Поэтому ин-
тегрирование по времени функций 5 (р) и 62 (р) эквивалентно их интегри-
рованию по р. Первое слагаемое (5.117) в силу свойств дельта-функций
приводит к тому, что в момент пересечения гиперповерхности прогнозируе-
мой траекторией вектор рх претерпевает скачкообразное изменение на
величину ЭКд(хсечя, тсеч|1)/дхм. Заметим, что компоненты рх, соответ-
ствующие компонентам х (по определению рх - ЪУ/Ъх), от которых
Уц не зависит, не изменяются. Второе слагаемое по аналогичным соображе-
ниям приводит к появлению в векторе рх в момент пересечения гипер-
Рис. 5.7. Структура модифицированного алгоритма в задаче траекторного управления
с контрольными сечениями (штриховыми стрелками показаны каналы периодической
передачи информации)
144
поверхности дельта-функции с матрицей-столбцом коэффициентов
Им(хсвчд, тсечд)Эр^/Эхм. Дельта-функции возникают лишь в компо-
нентах вектора рх, соответствующих компонентам вектора х, которые
в явном виде входят в уравнение (5.105).
Интегрирование второго уравнения (5.116) в моменты пересечения
гиперповерхности траекторией ЛА из-за наличия у некоторых компонент
вектора ря целыа-функций приводит к скачкообразному изменению век-
тора ря на величину
bG‘ . dp«
Г- -Г--
Э sM Зхм
(5.118)
Остальные операции выполняются аналогично алгоритму (5 £5)—(5.90).
Структура модифицированного алгоритма в задаче траекторного управ-
ления с контрольными сечениями показана на рис. 5.7. Входной информа-
цией здесь (наряду с заданием функций Кзвд, Q, ри G) является теку-
щее состояние управляемого объекта x(tu). Алгоритм формирует опти-
мальную скорость изменения вектора параметров s (tu).
§ 5.7. Автоматы ограничений с прогнозированием
Наличие в минимизируемом функционале (3.12) функции штрафа
(например, типа (3.4)), как отмечено в §3.1, позволяет органически
сочетать оптимизацию выдерживания ограничений, накладываемых на
состояния объекта, с решением других задач оптимального управления.
Получаемое при этом единство алгоритмической основы средств решения
всех зад ач'управления движением объекта (в том числе и предотвращения
нарушения ограничений) предоставляет разрабатываемым системам ряд
достоинств.
В [1.43] показано, что использование для оптимизации управления
метода аналитического конструирования в формулировке А .А. Красов-
ского обеспечивает аддитивность управлений, соответствующих различным
составляющим подынтегральной функции Q(x, т) минимизируемого
функционала (3.12). Действительно, в силу линейности уравнения (3.18)
и соотношения (3.15) можно утверждать, что сумме составляющих функ-
ции С, указанных в (3.7), соответствует сумма управляющих сигналов
^опт.кач и «опт.огр. каждый из которых определяется своим
слагаемым в Q.
Аддитивность получаемых оптимальных управлений позволяет раз-
дельно синтезировать законы автоматов ограничений, обеспечивающих
условие х £ 0 ,и систем управления, реализующих другие функции. При
этом совмещение работы синтезированных таким образом автоматов и
других управляющих систем, оптимальных в смысле минимума (3.12),
предполагает суммирование формируемых ими сигналов управления.
Выдерживание заданных ограничений может осуществляться на любом
из уровней управления в объеме, соответствующем решаемым на этом
уровне задач. Так, на траекторном уровне могут формироваться такие
заданные перегрузки, которые обеспечивают оптимальное в некотором
смысле траекторное движение с предотвращением нарушения ограниче-
10. В.Н. Буков
145
ний на параметры траектории (высоту, кривизну, близость к зонам по-
вышенной опасности и пр.).
Предлагаемые в [1.431 алгоритмы автоматов ограничений получены
на основе операционных алгоритмов, предложенных для совмещенного
оптимального управления (3.12). В общем случае такие алгоритмы для
ограничения состояния объекта (3.8) при заданной длительности интер-
вала оптимизации Т имеют вид
, Г 1 Т д
«опт.огр - q — — + ~ ~ (LQm) +
г2 а , Г
+ ~ — (£2Сш) + , (5.119)
3! ox J
" Э
где£ = S ft — — линейный дифференциальный оператор, ставящий
i=i дх/
в соответствие дифференцируемой по х скалярной функции новую скаляр-
ную функцию. Для линейного объекта, когда f = ах и ф = С, при кусочно-
линейной функции штрафа (3.5) соотношение (5.119) приводится к виду
Иопт.огр/ = -М’тЪ - L а' + L (5.120)
L £ •
Управление (5.120) является функцией длительности интервала оптими-
зации и в случае его постоянства и стационарности объекта и функции (3.5)
тоже постоянно вне области ограничений. В противном случае это управле-
ние вне области ограничений является функцией времени (некоторой
программой), зависящей от номера I пересекаемой грани многогранника,
ограничивающего область 0. Внутри этой области, па определению (3.5),
имеет место равенство и0пт.огр = 0- Таким образом, оптимальное ограни-
чивающее управление в случае (5,120) заведомо является релейным.
В литературе приводится условие строгой ограниченности алгоритмом
(5.119) области 0, основанное на анализе скорости проникновения вектора
состояния сквозь границы области 0. В общем случае для выполнения
строгой ограниченности требуется выполнение неравенства
Т SQui , д(2ш
“ (/ + 1РНОпт. кач) + , _ № ~
ох 1! дх дх
+
Т1 д , , дбш
+ - — (£Сш)^2^ ——+••> 0,
2! дх дх
(5.121)
где «опт.кач — оптимальный сигнал управления, формируемый другими
системами.
Реализация алгоритма (5.119) или (5.120), как правило, предполагает
вычисление ограниченного числа членов соответствующих рядов. Назначе-
ние относительно малой длительности интервала оптимизации Т (при
предположении кратковременности возможных нарушений ограничений)
благоприятствует сходимости операционных алгоритмов (5.119) и (5.120).
Заметим, что использование операционных алгоритмов ограничений
основано на фиксировании с помощью датчиков или системы оценивания
146
произошедшего нарушения ограничений. Релейное срабатывание (включе-
ние) сигналов иопт. отр возвращает состояние объекта в эксплуатацион-
ную область. Для объектов типа (3.20) сказанное относится к формиро-
ванию скорости отклонения рулевых органов. При необходимости грани-
цы области © могут выбираться с учетом возникающих ’’динамических”
нарушений ограничений (упреждающие границы).
Рассмотрим оптимальные и квазиоптимальные алгоритмы многопарамет-
рических ограничений состояния управляемого объекта с использованием
прогнозирующей модели [3.20]. Хотя эти алгоритмы, как и (5.119), получены
на основе метода аналитического конструирования по критерию обобщен-
ной работы, они отличаются от приведенных выше как структурой вычисле-
ний, так и свойствами. Предлагаемые алгоритмы достаточно просты, уни-
версальны и применимы для создания адаптивных автоматов ограниче-
ний, использующих результаты текущей идентификации, динамических
свойств объекта.
Приведенные в §3.3 и 3.4 алгоритмы с прогнозирующими моделями
предполагают достаточно широкий круг функций Q. Перейти к задаче
ограничения состояний можно введением в рассмотрение функции Qm,
заданной в виде (3.4). Будем полагать, что в задаче ограничений И,вд = 0.
Кроме того, пусть управляемый объект приведен к (3.20). Для упроще-
ния выкладок будем считать, что не зависит явно от 6. В противном
случае можно, как отмечалось в §3.4, расширить соответствующим
образом Z (г).
Воспользуемся третьей редакцией алгоритма с прогнозированием. Тогда
для рассматриваемой задачи ограничений
я - - v дСш(*м>т) . (е.
®огр ^опт.огр —К.К J Z (г) dt, (5.122)
ти °хм
где функция штрафа Qm вычисляется на прогнозируемом в ускоренном
времени т движении объекта. Прогноз осуществляется с помощью модели
(3.55), (3.56), (3.61), а матричная функция Z(r) вычисляется интегри-
рованием тоже в ускоренном времени уравнения (3.71) с нулевым на-
чальным условием (3.65).
Для функции штрафа вида (3.5) соотношение (5.122) принимает вид
(здесь полагается, что область в является замкнутой, т.е. на поверхности
переключений функция Qw имеет одностороннюю производную)
N твх
*огр ~ S f 2'(т)аф)(т)б?т, (5.123)
гвых
где .У — количество выходов прогнозируемого движения (3.55) из эксплуа-
тационной области 0; т^ых и Твх — моменты /-го выхода из эксплуата-
ционной области и возврата в нее, определяемые прогнозированием
объекта; /(/) — номер нарушаемой грани области 0 при/'-м выходе из нее.
Алгоритм (5.123), (3.55), (3.56), (3.61)-, (3.71), (3.44) является
наиболее общим при функции штрафа (3.5). Этот алгоритм при реализа-
ции не требует предположения малости длительности интервала оптимиза-
ции, как это делается для алгоритмов (5.119) и (5.120).
10
147
Для упрощения дальнейших результатов будем полагать, что за период
прогнозирования [т„, тк] вектор хм(т) только один раз нарушает не-
которую границу I и до момента окончания прогнозирования тк не воз-
вращается в область в. Тогда вместо (5.123) следует использовать со-
отношение
5огР=-^ 7 Z*(7)«/(7)dT. (5.124)
’’вых
Заметим, что при непродолжительном прогнозировании, когда при первых
же ’’нащупываниях” границы принимаются меры для предотвращения
ее нарушения, такой подход физически оправдан.
Таким образом, формирование оптимального ограничивающего управле-
ния, по существу, сводится к двум практическим проблемам. Первой
является математическое описание движения объектов вблизи границы
области в. На основе этого описания составляются прогнозирующая мо-
дель (3.55) и уравнение для матрицы чувствительности (3.71). Вторая
проблема связана с описанием границ области в с заданием коэффи-
циентов строгости O-i.
Рассмотрим управление стационарным линейным объектом (4.2), по-
лагая q = 0, при стационарной функции штрафа (3.4). В этом случае урав-
нение (3.71) уступит место уравнению (4.5), решаемому, как и (3.71),
с нулевыми начальными условиями. Уравнения прогнозирующей модели
примут вид (4.4), а (5.124) приводится к виду
«огр = fK Z,(7)d7]al. (5.125)
твых
Решение уравнения (4.5) при нулевых начальных условиях и невы-
рожденной матрице ам, воспроизводящей в модели матрицу объекта,
представляется матричной функцией (4.9). Заметим, что в случае нулевой
матрицы ам модели вместо (4.9) слецует использовать соотношение
z(7) = = *ьм(7-7и). (5.126)
Подставляя последовательно (4.9) и (5.126) в (5.125) и вычисляя
интеграл на интервале [твых, тк], получаем конечные формулы для опти-
мальных в смысле (3.12) скоростей перемещения управляющих органов,
необходимых для предотвращения нарушения объектом (4.2) /-й грани,
ограничивающей область в:
а) при ам = 0 ' ;
^огр ~ ~ XbMOi( [(7К — тм)2 — (твых — tu) 2]; (5.127)
б) при detaM¥=O
^огр ~ —ХЪМ {(тк — твых)Е +
+ ~ (Е- ехр[-ка^(тк - твыХ)1) ехр [к«тк - т^)]^"1)'}^'1 )'at.
(5.128)
148
При известных динамических свойствах управляемого, объекта (матрицы
ам и 6М), параметрах ограничивающих эксплуатационную область 0
граней (вектор а<) и заданном интервале прогнозирования [тм, тк]
управляющий сигнал является функцией времени нарушения границы
области 0.
Сравним полученные здесь законы формирования ограничивающих
управлений с законами, предложенными в [1.43]. Отчасти имеющиеся
отличия соотношений (5.128) и (5.120) обусловлены различными при-
нятыми моделями управляемого объекта. В первом случае сигнал управ-
ления соответствует скорости отклонения рулевых органов (объект
типа (3.20)), а во втором — отклонению рулевых органов (объект типа
(3,8)). Поэтому предварительно получим оптимальный сигнал управле-
ния типа (5.128) для объекта, описываемого уравнением (3.8) при
f - ах и <р = Ь.
В этом случае, формально объединяя компоненты векторов х и <5 в
обцдей вектор х (обозначение вектора состояния сохраняется без опасе-
ния возникновения путаницы), уравнения (4.2) при q = 0 можно привести
к интересующему нас виду. Принимая во внимание, что компоненты 6,
вошедшие в хм, постоянны во время прогнозирования и равны тем зна-
чениям, которые имели место в момент начала прогнозирования, дифферен-
цирование по 5 формально можно заменить дифференцированием
по хм (ти). Тогда вместо (5.122) для объектов с управлением положением
рулевых органов следует использовать соотношение
^огр ~ ^опт.огр = К<р j Y (г) ----------dr, (5.129)
ти dXM
где — матрица, обусловленная структурой закона (3.15); У(т) — квад-
ратная матрица, удовлетворяющая матричному уравнению (3.46) с на-
чальным условием (3.40) и представляющая собой матрицу частных про-
изводных компонент прогнозируемого движения объекта хм (т) по ком-
понентам состояния прогнозирующей модели в момент ти, т.е. хм(тм).
Для линейного объекта решение уравнения (3.46) имеет вид
Г(т) = ехр[пмк(т-тм)]. (5.130)
При невырожденной матрице агм и сделанных ранее предположениях об
условиях нарушения границ области 0 оптимальный закон отклонения
рулевых органов определяется соотношением
^огр = —^м((^~ ехр[~— 7вых)])ехрКк(тк — ти)](йм )
(5.131)
В то же время при вычислении в (5.120) неограниченного числа членов
ряда, заключенного в квадратные скобки, закон (5.120) сходится к вы-
ражению
йогР = «опт.огр = КЬ'[(Е-expfc'T) (а-1 )']<*/. (5,132)
Закон же (5.131) может быть преобразован к виду
ыопт.огр ~ Kb { (Е — ехр[дмк(тк — твых)]) X
X ехр[амк(тВЫх ~~ Л,)1 (Рм ) У&ь (5.133)
149
Теперь нетрудно установить, что законы (5.132) и (5.133) идентичны
(при ам = в) в случае, когда
У в х(тк — твых), твых = Гц- (5.134)
Таким образом, предложенные в (1.43] законы автоматов ограничений
предусматривают только ситуацию, когда вектор состояния уже находит-
ся на границе области 0, а Т — длительность интервала оптимизации. По-
лученные здесь алгоритмы являются более гибкими и начинают осущест-
влять парирование нарушения границы на этапе приближения к ней.
Другим обстоятельством, отличающим алгоритмы (1.43] от получен-
ных здесь, является вычисление матричных рядов. Это, с одной стороны,
не требует обратимости матрицы дм, а с другой — при плохой сходимости
ряда приводит к высокой трудоемкости. Заметим, что в алгоритмах
(5.131) и (5.133) при необходимости матричные экспоненты тоже могут
вычисляться рядами. При этом отпадает необходимость обращения матри-
цы^.
Наличие в (5.127), (5.128) и (5.131), как и в (5.120), в явном виде
вектора О/ создает благоприятные условия для реализации многопара-
метрических ограничений, когда область 0 ограничена более чем одной
гиперплоскостью. Линейность этих законов относительно at позволяет
при одновременном пересечении вектором хм(т) двух и более граней 0
для определения оптимальных сигналов управления суммировать соот-
ветствующие векторы О/, т.е. вычислять
os- = S а/, (5.135)
/ел
где Л — совокупность номеров граней области 0, за которые вышло
прогнозируемое движение хм (т) в момент твых (в принципе каждый
из векторов at может включаться в (5.135) в соответствующий ему мо-
мент твых /). Здесь следует указать на проблему ’’совместимости” сосед-
них граней области 0, заключающуюся в том, что сумма векторов at не
должна принимать нулевых значений. Суммарный вектор преобразу-
ется в вектор управления матрицей нестационарных коэффициентов (за-
висящих от твых). Естественно, предполагается управляемость объекта.
Наличие информации об изменении динамических свойств управляемо-
го объекта позволяет путем соответствующего учета ее в прогнозирую-
щей модели (3.55) и законах (5.127), (5.128) и (5.131) осуществить
адаптацию автомата ограничений к условиям функционирования.
Приведем некоторые упрощения алгоритмов ограничений. С практи-
ческой точки зрения алгоритм (5.128) представляет больший интерес,
чем алгоритм (5.127). Однако реализация его может натолкнуться на
трудности, связанные главным образом с вычислением матричной
функции ехр [<,к (тк — 7ВЫХ)]. Поэтому представляет интерес рассмотре-
ние упрощенных вариантов этого алгоритма. С этой целью рассмотрим
частные случаи.
1. Если движение объекта устойчиво, а интервал (тм, тк] достаточно
велик, чтобы пренебречь переходными процессами управляемого движе-
ния на интервале (твых/тк], то в силу того, что
ехр(вмК(тк - т„)] -* 0,
формула (5.128) преобразуется к виду
8Огр = )а,(тк-тВЬ1Х). (5.136)
Необходимая скорость отклонения управляющих органов объекта для
выдерживания ограничений становится линейной функцией относительного
времени тк — твь1х.
2. Если относительное время тк — твЬ1Х достаточно мало, чтобы в раз-
ложении по степеням матричной функции ехр[а^к(тк — твь1х)] с при-
емлемой точностью можно было ограничиться линейными членами, то
вместо формулы (5.128) можно воспользоваться формулой
^orp ~ {Е — ехр[вмк(тк — тм)])(вм )а/(.тк -твых)- (5.137)
В этом случае искомое управление также является линейной функцией
относительного времени тк — твых.
Последний из рассмотренных частных случаев соответствует ситуации,
в которой объект управления постепенно приближается к границе обла-
сти О и нарушение границ прогнозируемым движением начинается с малых
значений тк — твЫх. При достаточно эффективном ограничивающем управ-
лении алгоритм (5.137) может охватить широкий круг задач ограничения
состояний динамических объектов.
Другим направлением упрощения алгоритмов автоматов ограничений
является упрощение процедуры прогнозирования движения объекта.
Наиболее удачным является прогноз, получаемый путем интегрирова-
ния уравнений (3.55) или (4.4). Но при малых длительностях интервалов
[тм, ’’к] ДЛЯ прогнозирования движения объекта может с успехом исполь-
зоваться линейная экстраполяция вида
М') = Лм(тм) + кхм(тм)(т- гм), (5.138)
где хм (гм) и хм (тм) - векторы состояния и скорости изменения состоя-
ния объекта, измеренные (или в общем случае оцененные) в момент
ти ~ в этом случае в силу линейности изменения х(т) во времени
момент твых, соответствующий нарушению некоторой границы обла-
сти 0, может быть определен вычислением удаления прогнозируемого
состояния хм (тк) от области 0.
Действительно, удаление й/ вектора хм от /-й гиперплоскости (3.6)
в момент тк определяется соотношением
а)х(тк)+Т/ = hi
или в развернутом виде
«/' м (тм) + кхм (ти)(тк - тм)| = Л/. (5.139)
Разбивая отрезок времени [ти, тк ] на две части и учитывая, что в момент
’’вых выполняется равенство
*м (Ти) + (Ти) (твых - Ти) = о,
получаем
Тк ~~ твых ~
hi
к,а’хк, (ти)
(5.140)
151
Заметим, что по физическому смыслу тк — твых может принимать значения
отОдотк - ти.
Таким образом, при линейной экстраполяции движения объекта вместо
алгоритма (5.137) можно использовать алгоритм
. тк~ти ht
5ОГр = кь' { Е - ехр [ам к(тк- тм)]} (см* )'«/ Г —Г.' > Т ’ (5141)
о *«/*м(тм)
где ht - вычисленное на основе (5.139) удаление вектора хм от заданной
гиперплоскости в момент тк = гк/к; J — символ ограничения значений стоя-
щего справа выражения с указанием границ диапазона.
Заметим, что при решении практических задач ограничения состояния
удобно задавать постоянный по длительности интервал [ти, тк], где тк =
= ти + Т/к , а Т - постоянное время прогноза.
§ 5.8. Управление с линейной прогнозирующей моделью
Алгоритмы § 3.3 и 3.4 не имеют принципиальных ограничений, наклады-
ваемых на функции f и F объекта, однако реализация этих алгоритмов в
реальном времени наталкивается на ряд трудностей вычислительного харак-
тера (особенно в тех случаях, когда вектор состояния объекта изменяется в
большом диапазоне). В то же время цикличность данных алгоритмов, т.е.
повторяемость прогнозирования в процессе движения объекта, и относи-
тельно небольшие длительности интервалов оптимизации [fM, /к] в задачах
типа стабилизации заданного состояния позволяют использовать некоторые
упрощения процедуры синтеза оптимального управления.
Рассмотрим модификацию алгоритма с прогнозирующей моделью, свя-
занную с переходом от прогнозирования вектора состояния к прогнозиро-
ванию приращения вектора состояния объекта.
Вернемся к вопросу линеаризации динамических моделей объекта управ-
ления, обсужденному в § 2.4. Если в качестве опорного движения выбрать
неизменное во времени состояние ЛА (и неизменное положение рулевых
органов), то в некоторой малой окрестности этого состояния движение ЛА
с достаточной степенью точности описывается уравнением (2.78). Пусть
опорное состояние совпадает с состоянием ЛА в момент, соответствующий
началу интервала прогнозирования, т.е. хоп = х(гы), 8ОП= Тогда из
(2.78) с учетом линеаризации по времени t получаем
dF
Дх = —
Эх
dF
Дх + —
г 36
1и
dF
дб+ Дт+Г[х(гы),д,8(гы),гм], (5.142)
ot
tu tu
где Дх(г) =x(i) — х(гм); Д6(г) =5 (г) — 8(гм); частные произ-
водные ЪР1Ъх, dF/дб и dF/dt вычисляются при значениях х (ги) и 6(ГМ).
Так как компоненты вектора состояния x(tu) и вектора положения руле-
вых органов 6(гм) удовлетворяют первому уравнению (3.20) в момент tu,
то вместо (5.142) можно записать
ЭГ I dF I dF
Дх= — I Дх +------- Д6 +— Дт+х(ги). (5.143)
Эх I Э6 Эг
* и 1 ‘ и ги
152
Примем уравнение (5.143), дополнив его уравнением для положения ру-
левых органов, в качестве приближенной модели движения управляемого
объекта (3.20) на интервале [ти, гк]. Тогда для реализаций-алгоритмов с
прогнозированием, принимая во внимание, что 8м(т) = 8 (Ги), следует
использовать прогнозирующую модель
d
^ДХм(7) = К
(/и)
Дхм (т) +
(?и)>а> ^м (^u)> .
+ К----------:------------Д/ + ЧХЫ (tu). (5.144)
dtu
К особенностям этой прогнозирующей модели относятся:
- наличие дополнительного возмущения в виде скорости изменения
вектора состояния объекта в момент, соответствующий началу цикла фор-
мирования управления;
— отсутствие в явном виде вектора положений рулевых органов 8(гы),
так как он вошел составной частью в х (tu);
— необходимость для формирования управления только информации
о линейных членах характеристик объекта управления, соответствующих
начальному моменту цикла формирования управления, что в значительной
степени упрощает идентификацию характеристик объекта.
Начальными условиями для уравнений (5.144) являются нулевые зна-
чения вектора Дх(Гм), что следует из определения этого вектора. Таким
образом, прогнозирование состояния объекта может быть осуществлено с
помощью линейной модели (5.144). При этом полный вектор состоя-
ния, фигурирующий в функциях Гзад и Q, определяется соотношением
Рис. 5.8. Структура алгоритма прогнозирования с линейной прогнозирующей моделью
хм(т) а х(Л0 + Дхм(г)- Рис. 5.8 иллюстрирует прогнозирование состоя-
ния в предлагаемом алгоритме.
Для первой редакции алгоритма в (5.144) требуется ввести варьируемые
значения положения рулевых органов. Это обеспечивается в силу (5.143)
добавлением к правой части (5.144) слагаемого вида (dF/d6)tuA6>’, где
Д6*' — p-я вариация вектора положения рулевых органов, связанная с
построением аналога частной производной. Далее реализуется алгоритм
(5.83), (5.84).
153
Для второй редакции алгоритма в рассматриваемом случае следует на
основании уравнения (5.143) вместо (3.63) воспользоваться уравнениями
d d& = - dF к dF Дх - к — t Tu tu
d Px -tc dF' 9G'(«9) Px + * >
dd ^XM t u 9xM (d)
d Рь=к dF' dQ' (0) Pr + к .
dd 3SM tl Э5М(Й )
Дг - кх (tu),
(5.145)
В прямом времени прогноз осуществляется с помощью модели (5.144),
а правило формирования начальных условий для (5.145) остается прежним.
Для третьей редакции алгоритма в формуле (3.70) вместо (3.71) ис-
пользуется уравнение
d dF
— Z(r) = к -----
Эл-м
dF
Z(t) + k --
, Э6м
гм М
(5.146)
и
а вместо (3.55) — уравнение (5.144).
Глав а 6
КОНКРЕТНЫЕ ПРИМЕНЕНИЯ
АЛГОРИТМОВ УПРАВЛЕНИЯ С ПРОГНОЗИРОВАНИЕМ
В этой главе представлены некоторые результаты исследования алго-
ритмов с прогнозирующими моделями в задачах управления движени-
ем ЛА, полученные различными авторами. В большинстве проведенных
исследований замечается преемственность, обусловленная передачей инфор-
мации как посредством публикации, так и в личных контактах исследо-
вателей.
Все приведенные ниже результаты относятся к гипотетическому само-
лету, характеристики которого либо соответствуют приведенным в Прило-
жении III, либо в какой-то мере близки к ним.
Основным назначением главы является иллюстрация возможностей
алгоритмов рассматриваемого типа. Однако зДесь же содержатся и некото-
рые общие результаты, отражаюпЫе характерные свойства алгоритмов
с прогнозированием, полученные и многократно подтвержденные только
путем численного моделирования.
§ 6.1. Управление продольным короткопериодическим движением
на основе алгоритма с численным дифференцированием 1)
Будем рассматривать движение ЛА, описываемое уравнением (2.84)
(это уравнение линеаризовано относительно некоторого опорного (невоз-
мущенного) движения ЛА).. Напомним, что в уравнении (2.84) приняты
следующие обозначения: Д0 — приращение угла наклона траектории
(см. рис. 2.6); До>2 — приращение ’’угловой скорости тангажа”, а точнее,
угловой скорости ЛА в плоскости симметрии; Д$ — приращение угла
тангажа (см. рис. 2.4); Д6р.в и Д63 — приращения углов отклонения
руля высоты и закрылков (см. pic. 2.1). В скалярной форме с учетом
только руля высоты и при пренебрежимо малых а® (горизонтальный
полет) имеем
Д0-ау Да + а*р-вД6р.в,
Awz =-л" гДа-аХгД<^ ~<4ж,вД5р.в, • (6.1)
Д$ = Дсо2, Да = Д$ - Д0,
где Да — приращение угла атаки (см. рис. 2.5). Будем полагать, .что управ-
ляющим входом рассматриваемого процесса является скорость отклоне-
*) Параграф написан по публикациям и материалам В.Г. Чудиновой
155
ния руля высоты, т.е.
Дбр.в =«• (6.2)
Задача управления формулируется как задача формирования таких сиг*
налов и (6.2) на входе идеального интегрирующего привода, что обеспе-
чиваются достижение и стабилизация заданной нормальной скоростной
перегрузки 1) [2.2] с качеством, удовлетворяющим совокупности ’’инже-
нерных” критериев (прямых показателей качества):
а) время срабатывания гср (время первого достижения уровня 0,95 от
установившегося значения перегрузки);
б) время регулирования Грег (время окончательного достижения уров-
ня 0,95 или 1,05 от установившегося значения перегрузки);
в) перерегулирование h„ (отношение максимального превышения пере-
грузкой установившегося значения к установившемуся значению);
г) статическая ошибка Д„ (установившаяся ошибка воспроизведения за-
данной перегрузки).
Рассмотрим применение для решения данной задачи алгоритма с прогно-
зированием и с численным дифференцированием (3.55)—(3.60).
Для использования алгоритмов с прогнозированием, рассматриваемых
в данной работе, прежде всего следует перейти к формализации требований
к качеству процесса управления в виде функционала обобщенной рабо-
ты (3.12). Общие рекомендации по этому вопросу можно найти в [1.5].
Здесь лишь отметим, что от разработчика требуется назначение структуры
и параметров функций Кзад и Q (например,в виде (3.3), где /3(г) — назна-
чаемые коэффициенты), элементов матрицы К и длительности интервала
оптимизации Т в случае скользящего интервала оптимизации (3.2) или ко-
нечного момента tK в случае задания функционала в форме (3.1). Решение
этих вопросов в значительной степени остается искусством и опирается на
опыт решения аналогичных задач.
Для решения данной задачи будем использовать функционал
t+T 1 t+T
1—00 f (Диут — ДЛуТ.зад)2 dr + ~ f (и2 + Ц^пт) dr, (6.3)
t 2 t
где назначаемыми (или выбираемыми в процессе исследований) парамет-
рами являются 0о и Т. Кстати, исследования показали, что практически
аналогичные результаты можно получить при задании функционала в виде
t+T 1 t+T
/ш=0ш f ШкачЛ- + - f (и2 +u2m) dr, (6.4)
t 2 t
где
0
Шкач ~
| ДПу£ I ®
с выбираемыми параметрами 0Ш.
1) При отсутствии ветра она совпадает с
при | Дпут - Ди^т.зад I < е,
(6.5)
ЛрИ | ДЛут ДИут.зад I > €,
е, Т. Здесь Диут — приращение
Тут в (2.22).
156
перегрузки пуг в (2.22), т. е.
Vk •
Диут = — Д6 + sin0on Д0.
g
(6.6)
Очевидно, что в режимах попета, близких к горизонтальным, можно
полагать
. Vk к
Дпут = —Д6 = —(ау Да+аур,вДБрл).
g g
(6.7)
Если в качестве аналога частной производной (3.57) использовать пер*
вую центральную разность (3.58), то с учетом К = 1 получим (6.1]
Uom\*u) ~~ „ .
(6.8)
где Д — вариация положения руля высоты при прогнозировании; К* (tI{)
и V~ (tu) — значения функции
ты+Т/к
V (tu)~Kft> f (Диут — Диут.эад)2 dr,
ги+Т/к
V (Ги) = кРо f (Лпут — Диут.эад)2 dr, (6-9)
вычисляемые на прогнозируемых движениях объекта (6.1) с положитель-
ной и отрицательной вариациями положений руля высоты. Начальными ус-
ловиями при прогнозировании являются значения компонент состояния
объекта (6.1) в момент начала цикла формирования управления tu. Таким
образом, для К1, (fM)
—Д6+ = кау Да+ + кдур,в [ Д5р.в (гм) + Д],
dr
— До£ = -к-a'mx Д«+ - кдХг [д5р.в (*м) + д]> (6.10).
dr
— Д«9+ = кД<4, Да+ = Д0+ -Д0+, Ди* » — — Д0*
dr ng dr
и для V~(tu)
—Д0" = кау Да"+кдур,в [Д6р.в (Л<) - Д],
dr
— = -ка^г Да" - ка„г Да?г - KamP/" [д6р.в Gw) - д]> (6Л
dr
d Vk d
—Дд = кДсоГ, Да“ = Д»9“ — Д0 , Диут — —~ —Д0
dr Kg dr
157
при одинаковых начальных условиях
Л0+(ти) = Л0~(ти) = Л0(ги),
4^2 (Ти ) = Д(^>2 (ти ) = Дwz (tu ), (6.1 2)
д^+(7И)=д^-(ти)=д«?аи).
Интегрирование уравнений прогнозирующих моделей (6.10)—(6.12) пред-
полагает Использование информации о текущих значениях 0, a>z, 5, а так-
же а или &.
Если несколько изменить постановку задачи, полагая, что измерению
доступны только nyt, е = d>z, а>г и 6, то можно перейти к другой форме
записи прогнозирующей модели путем повышения порядка уравнений
и исключения сигналов а. и 6. В этом случае вместо (6.10) и (6.11) при
условии, что с?Д5р.в/с?т = 0, можно использовать уравнения
d Vk
--Апут = КДу —До>г - Кйу 4пуг,
dr g
d а wz . , armS .
— Де = —KOmz - к-ат2 Де + к-----4nyr, (6.13)
dr Rjt
d
— = к Де
dr
с начальными условиями для F+(r„)
Ди^т (ги) = ^Пут (tu) - Яур в — Д, Де+ (tw) = Де(тм) +й^-вД,
g (6.14)
(тм) = Дсог (Ги)
и для F“(rM)
Дн;т (ти) = Дл^т (гы)+а*р,в “Д. Де“(тм) = Де(ги)-сХр вД.
g (6.15)
Д^г G-M) = До>2(Гм),
которые вытекают из (6.10) и (6.11) при т = ти.
Таким образом, при организации управления объектом (6.1), (6.2)
могут быть использованы по крайней мере два варианта прогнозирования
движения объекта в соответствии с уравнениями (6.10), (6.11) и началь-
ными условиями (6.12) или в соответствии с уравнениями (6.13) и началь-
ными условиями (6.14), (6.15).
Численные исследования алгоритма управления (6.8) с прогнозирующи-
ми моделями (6.10) —(6.12) и (6.13)—(6.15) проводились для гипотетичес-
кого самолета на одном из режимов полета, для которого входящие в (6.1)
коэффициенты имели следующие значения (режим I):
атг ~ 0,33 с-1; a“z = 1,9 с-2; ® = 2,8 с-2 • град-1;
а“=0,23с-х; а®р в = 0,02 с"1 - град"1; Vk/g = 0,23 с.
Варьируемыми параметрами алгоритма являются коэффициент функцио-
158
Рис. 6.1. Влияние коэффициента функционала 130 на переходные процессы системы с
"идеальным” приводом; 0е =150 (штриховые линии); /30 = 800 (сплошные линии):
(30 = 9000 (штрихлунктирные линии)
нала 0О, длительность интервала прогнозирования (оптимизации) Т и дли-
тельность цикла формирования управления Дгц.
На рис. 6.1 представлены результаты исследований влияния коэффициен-
та 0О на качество переходных процессов в контуре нормальной перегрузки
при фиксированных длительностях Ти Д/ц (Т = 0,7 с; Д/ц = 0,03 с). Из
приведенных процессов наилучшее качество в смысле указанных выше
прямых показателей имеет процесс, соответствующий 0О = 800. Этот про-
цесс в дальнейшем принят в качестве эталонного. Следует заметить, что
значение коэффициента 0О можно менять в диапазоне от 400 до 11 000 без
заметного ухудшения таких показателей, как время регулирования /рег и
перерегулирование hn. При 0О > 11 000 происходит потеря устойчивости,
а при 0о < 400 резко снижается быстродействие системы. На других режи-
мах полета характер влияния коэффициента 0О на качество управления
сохраняется, однако изменяются диапазоны допустимых значений 0О.
В процессе численных экспериментов подобрана эмпирическая зависимость
для рекомендуемого (с точки зрения удовлетворения прямых показате-
лей качества) значения коэффициента
0о ~ 0о
а , о»г „
amz + amz ау
6 п И ® t) й
amz ау “ amz ау
(6.16)
где 0о — некоторый коэффициент, не зависящий от режима полета.
На рис. 6.2 представлены результаты исследований влияния длительности
интервала прогнозирования Т на качество регулирования. По оси ординат
159
Рис. 6.2. Влияние длительности интервала прогнозирования Т на достижимое время
регулирования системы с "идеальным" приводом
отложено минимальное (по пространству коэффициентов функционала До)
время регулирования грег по нормальной перегрузке при условии,
что hn < 5 %; по оси абсцисс отложено время прогнозирования Т. Из рисун-
ка видно, что для режима I наиболее благоприятным с точки зрения полу-
чения малого времени регулирования является диапазон длительности
прогнозирования от 0,65 до 0,8 с. На других режимах характер зависимости
сохраняется, но меняется положение экстремума. Для иллюстрации на ри-
сунке представлены результаты для режима И со следующими значениями
параметров:
атг ~ 0.01 с~’» amz ~ ОД 2 с-2; ат£в = 0,08 с-2 • град”1;
ау = 0,008 с-1; а* р’в = 0,0004 с-1 • град-1; Vk/g = 0,26 с.
Эксперименты показали, что с достаточной степенью приближения положе-
ние экстремума функций на рис. 6.2 для объектов типа (6.1) можно опре-
делять по эмпирическим формулам
л { а*л V'2
Т * = ----------------- или Т, = 41 -------------------
а.1/2 \ 6ОВ о а ® о.в /
2(<lmz + amzay) 'атг ау ~ amzay '
Исследование влияния длительности цикла управления Дтц на качество
переходных процессов показало, что возрастание длительности цикла
приводит к постепенному увеличению колебательности переходных про-
цессов. При выборе этого параметра рекомендуется пользоваться эмпири-
ческой зависимостью
Дгц<Т,/5. (6.18)
Реализация описанного алгоритма формирования управления объектом
(6.1), (6.2) включает на каждом цикле:
160
— получение исходных данных о векторе состояния и оценок парамет-
ров (коэффициентов) объекта;
- формирование начальных условий (6.14) и (6.15);
— интегрирование системы (6.13);
— вычисление параметров функционала (6.16) и (6.17);
— вычисление (6.9) и формирование управления по (6.8).
Если воспользоваться для интегрирования уравнений методом Эйлера
по формуле
1
= */ + “ 1Л +Л+1 (ti+l, xt +fih)] h (6.19)
с шагом h - Г/4, а для вычисления интегралов (6.9) — методом трапеций
по формуле
т Т ( Г / Г\ / ЗГ\1)
f Qdt^- е(о)+е(г)+21е(7)+е(-)+е( —) , (6.20)
то на каждом цикле формирования управления требуется выполнять 69
операций сложения, 88 операций умножения и 6 операций деления.
Теперь несколько усложним задачу. Пусть привод является не идеаль-
ным интегрирующим, как это полагалось ранее, а описывается уравнения-
ми (2.89), которые после линеаризации относительно балансировочного
положения ббап - const можно записать в таком виде:
Mi ~М2> Да я -Л4Д8р.в -X3signASp.B - Л2Д6р.в +Л|М,
^тах при М2 > ®тах»
Д5р.в = М2 при 5т1п<Ма <8щах»
®min при М2 (6.21)
&тах ~ ®бал При Ml > £щах “ ®бал»
Д5₽.в ж Ml При 6min ~ ®бал < Mi <^тах ~ ®бал»
. ®min ~ ®бал при Ml ^^min — ^бал-
Здесь — дополнительные переменные; 6mjn и 6mex - граничные значе-
1р«г’с
Рис. 6.3. Влияние длительности интервала прог-
нозирования Т на достижимое время регули-
рования системы с "Идеальным” приводом
(штриховая линия) и с реальным приводом
(сплошная линия)
11.В.Н. Буков
1,6
ц V
5 ft “ /
о о, 3 0,6 0,9 1,2 Г,с
161
ния отклонения руля высоты; 5mjn и $твх — предельные скорости пере-
мещения руля высоты, обусловленные энергетическими характеристика-
ми привода; и — управляющий сигнал, пропорциональный требуемой ско-
рости отклонения руля высоты: At — параметры, отражающие свойства
привода.
Строгое решение задачи оптимального управления требует воспроизве-
дения в прогнозирующей модели динамики привода (6.21). Однако это
приводит к существенному усложнению алгоритма. В [5.9] показано, что
для рассматриваемой задачи можно ограничиться прежней структурой
прогнозирующей модели и алгоритма в целом. Моделирование показало,
что с введением в уравнения объекта уравнений привода (6.21) изменяют-
ся абсолютные значения предельно достижимого времени регулирования,
но сохраняется общий характер зависимостей. На рис. 6.3 дается сравнение
достижимого времени регулирования (при перерегулировании не более
0,05) для объекта с реальным и идеальным приводами. Положение экстре-
мума, как видно из рисунка, не изменяется. При моделировании принима-
лись следующие значения параметров привода:
Л1=18с-1; А2 = 0,04с“2; А3 =0,2град• с“2;
А4 =0,2 с ; 6max — —6min ~ 30 ; 6тах ^min — 30 град с
Наличие реального привода, не учтенного в прогнозирующей модели,
значительно изменяет характер влияния коэффициента функционала До на
качество переходных процессов. На рис. 6.4 представлены результаты
Рис. 6.4. Влияние коэффициента функционала 0О на переходные процессы системы
с реальным приводом: = 0,4 (штриховые линии); 0С = 1,5 (сплошные линии);
= 40 (штрихпунктирныс линии)
162
исследовании иа режиме I при Т = 0,7 с. Обратим внимание на некоторые
особенности:
— в отличие от ’’идеальной” системы переходные процессы с реальным
приводом имеют статическую ошибку, обусловленную сухим трением с
коэффициентом Л з в (6.21);
— из-за возникновения повышенной колебательности процессов при
больших значениях 0О приходится сокращать допустимый диапазон назна-
чения этих коэффициентов, а также в ряде случаев корректировать (6.16).
Заметим, что при сравнении рис. 6.1 и рис. 6.4 следует иметь в виду
различные коэффициенты передачи приводов (6.2) и (6.21) между входом
и выходом, в результате чего существенно различаются порядки коэф-
фициентов До •
В целом возможность использования для формирования управления
упрощенной по сравнению с объектом прогнозирующей модели подтверж-
дена только в экспериментах и требует специальных теоретических исследо-
ваний. Остается нерешенным основной вопрос: как соотносятся оптималь-
ное и формируемое таким путем управления?
§ 6.2. Управление продольным короткопериодическим движением
иа основе алгоритма с аналитическим решением1)
Невысокая сложность объекта управления (6.1), (6.2) позволяет реали-
зовать четвертую редакцию алгоритма, т.е. алгоритм с аналитическим ре-
шением (3.72)—(3.74). Это существенным образом снижает трудоемкость
формирования управления в реальном времени.
Прежде всего требуется получить прЬгноэируемое на интервале [гм, Гк]
состояние (3.72). Характеристическое уравнение линейной системы урав-
нений (6.13) имеет вид (масштаб времени к не принимается во внимание)
а * Р +Оу 0 а К ' “'7
det -О g . Ыт amz Т~~ P+arwiz ук От г Ш Z = 0 (6.22)
0 -1 р
или в развернутой форме
Р[р + P(,amz + ау) + amz + amzay ] = 0. (6.23)
Для устойчивого объекта зто уравнение имеет два комплексных сопряжен-
ных корня и один нулевой корень. Общее решение системы ура вне'
ний (6,13) при произвольных начальных условиях может быть записано
в виде
пу Т(т) = В J п,, т (tu) + В2 е( tu) + В3 wz (tu ), (6.24)
’ 1 Параграф написан при участии В.Г. Чудиновой.
11* из
где
а
amz
Bi =Л1(т) + —---------[1 - Л1(т)],
а а
атг + Чтг ау
а а
Vk Оу Оу
В2 - Лг(т) + ~ ~ ~ г
t W ‘""‘г” - а^ат’-'
Л,--* .-^4—11-Л,(01, (6-2S)
g Omz + dmzOy
t а ыг a wz.2 1
20tnz +0mZ0y Iflmz) . t -x, z .. x I
------------------smv(7-ZM)+cosp(7-rM)j,
T-U^V
Л2(7) = ехр[ — у (7- fM)]sinp(7- tu),
1 , wz
2 (.amz + *y)> v =
а 1 , wz а г
Omz ^\amz ~ay)
1/2-
В соответствии c (3.74) сигнал управления в данном случае определяется
формулой
»f 1 » J
** 3/2 ( ")
Мопт(^и) = _200 J ~ ~ ~ 1иут(т) ~иут.зад]^т- (6.26)
» OOp.eUu)
С учетом зависимости начальных условии (6.14), (6.15) от вариаций поло-
жения руля высоты 6р.в
Эпут(7) 6р.в
Э6пв(ги) ~ г°тг
17 ( ° 6₽-
?к OyOmz
продифференцируем (6.24) по 6р.в:
° ®р.в
**у * mz
а 6р.в а 5р.в
Omzay ~ ОуОщг
- 6 р.в
с
- Biay
Vk
Шг
OmzV
О
1Л1(7)—
—а 11-Л1(7)] =Z(7).
атг+атгау
(6.27)
g
g
Подставляя (6.24) и (6.27) в (6.26), а также полагая на интервале прогно-
зирования Лут.эад = const, получаем в окончательном виде
wonr (М = [Фо«у т.зад + Ф1Нут(?ы)+ Фге(*и) + Фз^Ом)]» (6.28)
где
гм + г
Фо=20о J Z(r)d7,
fu
tu^1'
Ук
Ф1----200---- f Ai(r)Z(r)dT,
8 (6.29)
Ф2---2 0о “3^-- f
amz v ги
Vk
f [l-A^Z^d?.
и
Ф3 = 2 Зо
g\amz + отг ау ) t
Закон управления (6.28) является линейным с коэффициентами, опреде-
ляемыми по формулам (6.29) на основе значений параметров (козффи*
циедтов) модели управляемого процесса (6.1). При изменении оценок
этих параметров, формируемых подсистемой идентификации (1.5) или про-
граммой настройки (1.4), следует в соответствующем тайпе менять коэф-
фициенты (6,29). Определение управления на каждом цикле с длительно-
стью Д?ц требует выполнения четырех операций умножения и трех операций
сложения. Моделирование процессов управления с алгоритмом (6.28),
(6.29) дало практическое совпадение результатов с результатами, получен-
ными в § 6.1,
Обратим внимание иа следующий момент. Если в (6.25) пренебречь
изменением Л/(т) во времени, т.е. полагать А^т) = At(tu), то из этих
формул видно, что при т = tu имеют место равенства Л] = 1, Л2 = 0и фор-
мулы (6.29) приводятся к вцду
a 6р.
^y^mz
а 6 р.в
-атгау
Фо----Ф1 — 20р
а ® р.в
— 0уйт2
17 лв₽ В
Пев у
гм) 1= const,
(6.30)
ф2 = ф3 = 0.
Объединяя (6.2)
плоским движением ЛА чедез контур педегрузки [6.2, 6.3]
^р.в(^и) ~ *о [пут.зад ~ И>»т(^и)]-
и (6.24),
получаем интегральный закон управления
(6.31)
g
Учет юмедения коэффициентов (6.25) на прогнозируемом движении при-
водит к учету в (6.28) эффекта демпфирования угловых колебаний за счет
стенала с (ти) и положения руля высоты за счет сигнала 6р.в (fu).
Приведем некоторые результаты исследования чувствительности дан-
ного алгоритма к ошибкам идентификации параметров управляемого
объекта (6.1). Исследование проводилось [-6.4] методом статистиче-
ских испытаний (методом Монте-Карло) в предположении, что ошибки
воспроизведения параметров (коэффициентов) объекта (6.1), (6.7) в мо-
дели (6.13)—(6.15) или в алгоритме (6.28), (6.29) являются постоянными
в течение времени от tu до tи + 3 Т*. Качество управления оценивалось
по 50 некоррелированным реализациям [6.5]. Для обработки результатов
использовались формулы
/ 1 L 11/2 _ Г J N *11/2
S(G) = — S [и;т(0)-^т0(0)]2 , S= - Е 52(т,) ,
i = i L/v ,=i J
(6.32)
165
Рис. 6.5. Влияние ошибок коэффициентов прогнозирующей модели на переходный
процесс управления перегрузкой
Рис. 6.6. Влияние ошибок отдельных коэффициентов модели на средние по ансамблю
и времени геометрические отклонения переходного процесса управления перегрузкой
где S(rf) — среднее по ансамблю реализаций (в момент времени tj) гео-
метрическое отклонение переходного процесса от процесса луто(О>
полученного при нулевых ошибках воспроизведения параметров; 5 — сред-
нее на интервале (Zu, Ги+ЗТ ] геометрическое-отклонение переходного
процесса; /— номер реализации (£ =50); N— количество уровней кванто-
вания интервала [Гм, ГМ + ЗТ*].
Рис. 6.5 иллюстрирует характер изменения среднего геометрического
отклонения S(tt) на рассматриваемом интервале времени при среднем
квадратическом значении ошибок коэффициентов модели (6.13) —(6.15),
равном 10% от значений коэффициентов (6.1),(6.7). На рис. 6.6 приводятся
результаты исследования влияния случайных ошибок воспроизведения
в модели отдельных параметров объекта на средние по реализациям и в ре-
166
меня геометрические отклонения 5 переходных процессов от процесса
ПутоСО- По оси абсцисс здесь отложены средние квадратические ошибки
указанных на графиках параметров. Показанные на рисунке секторы соот-
ветствуют диапазонам изменения режимов полета гипотетического ЛА
в пространстве высот и скоростей полета. Из рисунка видно, что некоторые
параметры модели могут оказаться решающими в смысле достижения
статистической точности управления перегрузкой ЛА, в то время как иные
без существенного ухудшения точности можно полагать постоянными и не
перенастраивать их в прогнозирующей модели.
§ 6.3. Управление пространственным движением
летательного аппарата1)
В качестве объекта управления рассматривается модель пространствен-
ного движения ЛА (2.48). Задачи управления относятся к задачам пилотаж-
ного уровня: управление угловым положением ЛА и перегрузками
в области умеренных углов атаки и скольжения. Последнее условие позво-
ляет в (2.30) или (2.51) ограничиться линейными членами разложения.
Минимизируемый функционал будем задавать в виде (3.12) со скользя-
щим интервалом оптимизации заданной продолжительности Т. Функ-
цию Изад будем полагать нулевой, а функцию Скач выберем в виде (5.30).
Пусть в качестве управляющих органов используются рули высоты и
направления, а также элероны, сигналы управления которыми представ-
ляются в виде (5.32).
Приводимые ниже результаты получены путем моделирования модифи-
цированного алгоритма управления скоростью перемещения рулевых орга-
нов (5.33)—(5.37), (5.39) [6.6]. Синтез оптимального управления для рас-
сматриваемых задач осуществлялся выбором соответствующих ненулевых
коэффициентов 0(.) в (5.30) и К в (3.12). Исследуемый режим соответ-
ствует И = 10 км, М = 0,8; длительность цикла формирования управле-
ния Д/ц составляет 0,05 с.
На рис. 6.7 показаны наилучшие (по множеству коэффициентов
в смысле прямых показателей качества (см. § 6.1) процессы управления
угловой скоростью cjz при различных длительностях интервала оптимиза-
ции. Эти процессы представляют собой реакцию системы на ступенчатое
изменение cj, зад. При небольших Т наблюдается повышенная колебатель-
ность переходных процессов, а при завышенных значениях процессы стано-
вятся вялыми и растет перерегулирование.
На рис. 6.8. приводятся (в качестве иллюстрации возможности решения
различных задач) процессы управления углом атаки а, углом тангажа £ и
нормальной перегрузкой пу. Перечисленные задачи решены одним алгорит-
мом с изменением только коэффициентов в (5.30) и длительности
прогнозирования (для предпочтительного темпа переходных процессов).
Кроме того, показанные на рис. 6.8,в переходные процессы получены
в двух вариантах: без демпфирования, т.е. при = 0 (сплошные линии),
1) Параграф написан по публикациям и материалам Ю.П.Ци1ина.
167
Рис. 6.7. Процессы отработки заданной угловой скорости wz3an при различных длительностях интервала оптимизации:а -7=0,5 с;
б - 7 = 0,2 с; в - 7 = 1,2 с
Рис. 6.8. Процессы управления в продольной плоскости: а - углом атаки; б - углом тангажа; в - перегрузкой
Рис. 6.9. Процессы пространственного управления (отработки йзад = 20°, тзад =
= 30*) с различными значениями коэффициента 0уг: а - Руг = 0,02: м"3 -с3;
б - Р уг - 0,05 м“3 - с3
и с демпфированием, т.е. при Ф 0 (штрихпунктирные линии). Пара-
метры функционала имели следующие значения:
а) 0их = О>°1 м"2-с2; Руу =0,01 м“2-с2; кр в =40 град2-с"2; Т=О,85с;
б) 0ех=2О; 0е>)=25; 0ег = 25; £р.в = 64град2-с-2; Т=0,8с;
в)0Лу = 4,75; 0wz=39c2; fcp>B = 50 град2-с-2; Т=0,4с.
Остальные коэффициенты 0 (j в (5.30) задавались нулевыми.
Аналогичные процессы могут быть получены и для отдельно рассматри-
ваемого бокового движения ЛА.
На рис. 6.9 представлены результаты моделирования одновременного
управления движением ЛА в продольной и боковой плоскостях. Задача
заключалась в отработке одновременных ступенчатых изменений заданных
углов тангажа и крена. Для парирования нарастания угла скольжения
169
Рис. 6.10 Рис. 6.11
в (5.30) задавались ненулевые значения коэффициента &уг. Из рисунка
видно, что в целом процессы изменения 7 и i? различаются несущественно
при различных значениях £yz. При = 0,02 м“2-с2 угол скольжения
достигает 7°, а затем интенсивно изменяется в отрицательную сторону.
При Pvz = 0,05 м“2 с2 за счет более активного движения рулей 5р<в и
6р.н наблюдается изменение угла скольжения 3 в существенно более узком
диапазоне.
Как отмечалось в § 5.2, для задач автоматизации ручного управления
движением ЛА большое значение приобретает слежение летательным аппа-
ратом за эталонными моделями, характеристики которых согласованы
с характеристиками человека как участника процесса управления. При мо-
делировании полагалось, что при управлении ЛА в продольной плоскости
в качестве эталона может быть взято колебательное звено с определенными
параметрами, а при управлении ЛА в поперечной плоскости — апериодиче-
ское звено. На рис. 6.10,6 и 6.11,6 показаны процессы изменения угловых
скоростей u>z и сох в эталонных моделях при ступенчатом отклонении
соответствующих органов управления (предполагается, что на модели-
руемых режимах полета осуществляется пилотирование по угловой скоро-
сти ЛА [6.7]), а также процессы изменения этих же угловых скоростей
объекта (2.48) и соответствующие им отклонения рулевых органов 5р.в
и 6Э. На этих же рисунках приведены результаты исследования влияния
различных параметров функционала на основные прямые показатели каче-
ства процессов слежения за эталоном. Графики (3(JZ, в и 0WX, к3 ука-
зывают рекомендуемые значения соответствующих параметров, обеспечи-
вающие как допустимое перерегулирование йшг < 0,05, так и наименьшее
время регулирования fper- Значенйе времени регулирования тоже показа-
но на графиках. При очень малых и больших длительностях интервала
прогнозирования наблюдается потеря устойчивости, не устраняемая под-
бором коэффициентов в (5.30).
Для исследования возможности использования для управления объек-
том (2.48) упрощенных линеаризованных прогнозирующих моделей
типа (5.144) рассмотрим прогнозирующую модель ЛА на основе (2.84),
которую запишем в виде
Да = Дсог - Ду Да,
, л (6.33)
• л z б р .в
Да?г = ~-amzka. — amz &toz — omz Д6р.в ,
где Да = Д$ — Д0 — приращение угла атаки. Полагая, что приращения
Гис. 6.10. Оптимизация процесса слежения самолетом за эталонной моделью при отра-
ботке заданной угловой скорости ш23ад;о - зависимость наименьшего времени регу-
лирования и соответствующих параметров функционала от длительности интервала
оптимизации; б - процесс слежения при Т = 0,4 с
Рис. 6.11. Оптимизация процесса слежения самолетом за эталонной моделью при отра-
ботке заданной угловой скорости <лхзад: а — зависимость наименьшего времени регу-
лирования и соответствующих параметров функционала от длительности интервала
оптимизации; б — процесс слежения при Т = 0,5 с
171
^рЛ&) Объект управления a(t)
* (2.48)
Итерирующий
привод (6.2)
Датчики
(2.87), (2.86)
|.9>
У
S<8
Формирование
(в. 37)
Эталон в
ускоренно*
времени
«zl0AW
Прогнозирование
(6.34)
Оценивание
* и состояния
(1.6)
-------
Настройка
параметров
(1.4),(1.5)
amx(tu)
2Ы(П
Pyttu)
Вычисление
чувствительности (6.35)
Выбор режима
Рис. 6.12. Структура алгоритма автоматизированного управления продольной угловой
скоростью ЛА на основе линеаризованной прогнозирующей модели
компонент вектора состояния прогнозирующей модели отсчитываются от
значений соответствующих компонент вектора состояния управляемого
объекта в момент tu, запишем прогнозирующую модель (5.144) для
данного случая:
Ct
---Да = кДь>г - кауАа + а(ги),
dr
л (6.34)
d а а»2
—-Ды2 = — катх Да- катхД<рх +а>2(/и).
dr
Для реализации алгоритма с
прогнозирующей модели следует
вытекающими из (5.146) :
матрицей чувствительности уравнение
дополнить следующими уравнениями,
d ct
Z& kZ — Кйу Z,
dr
d _ а ы2
. — KantzZ a — Kamz
dr
(6.35)
7 6 р.в
a) ^атг
где Ztt = da(T)/d6p.B(rM); Zw = Эсо2(т)/д6р.в(гм).
В случае пилотирования ЛА по угловой скорости тангажа функционал
будем задавать в виде
г + т t + т
I = p f (wz - ^23ад)2^’’ + - f {и2 +Uoht)</t.
(6.36)
I
г
172
Тогда сигнал управления определится формулой
ти + Т/к
^опт(^м) — бр.в (^w) — (^/И ^г(^и) + А<Ог(т)— ^гзадО") ]&?•
ги
(6.37)
Структура этого алгоритма показана на рис. 6.12. Здесь остаются нераскры-
тыми блоки оценивания состояния и настройки параметров. Моделирование
(6.34), (6.35), (6.37) при Дгц =0,05 с дает для рассматриваемого гипотети-
ческого ЛА хорошее совпадение процессов управления с процессами,
полученными на основе полной прогнозирующей модели и представленны-
ми на рис. 6.10 и 6.11.
§ 6.4. Обеспечение поперечной управляемости самолета
на больших углах атаки 1) '
Будем рассматривать управление боковым движением гипотетического
самолета с помощью элеронов и руля направления (см. рис. 2.1). Вследст-
вие аэродинамических перекрестных связей, в том числе из-за перекрест-
ных аэродинамических моментов органов управления, обусловленных ела-
э р н
гаемыми ту 5Э и mx Sp.H в (2-30), движение самолета при отклонении
этих рулей обычно не сводится к вращению относительно соответствующих
главных осей инерции, а является существенно взаимосвязанным.
В выбранной модели аэродинамики гипотетического самолета, начиная
с углов атаки а = 15°, элероны создают подтормаживающие моменты
рыскания при управлении креном. Это ведет к развитию обращенной
реакции крена на отклонение элеронов (речь идет о том, что динамическая
связь ’’элероны — момент рыскания — угол скольжения — момент попереч-
ной устойчивости — угловая скорость крена” преобладает над основной
связью ’’элероны — момент крена — угловая скорость крена”). Как следст-
вие значительно ухудшаются показатели поперечной управляемости ЛА
и возрастает опасность попадания в критические ситуации.
Ниже приводятся результаты исследования функционирования алгорит-
ма с прогнозированием в задаче обеспечения адекватной реакции ЛА на
управляющие воздействия летчика в канале крена при наличии обращенной
реакции. -
В качестве объекта управления принимается модель (2.60), аэродинами-
ческие характеристики которой аппроксимированы в соответствии с приве-
денной в Приложении III таблицей. Моделирование осуществлялось на уни-
версальной ЦВМ.
На рис. 6.13 представлены результаты моделирования неавтоматизирован-
ного бокового движения ЛА. Предварительно объект выводился алгорит-
мом на угол атаки а = 26° , после чего элероны скачкообразно отклонялись
Параграф написан при участии А.Н. Акимова.
173
Рис. 6.13. Движение самолета при обращенной реакции крена
Рис. 6.14. Процессы отработки заданной угловой скорости ^Л3ад при обращенной реакции крена и длительности прогнозирования Г = 0,4 с
« 6 3 э
на угол оэ = 5 . За счет действия момента Мх бэ < О (здесь Мх =
6Э
= qSlmx /J х согласно (2.60)) в начальный момент возникает тенденция
к развитию нормальной реакции а>х < 0. Однако вследствие одновремен-
ного развития угла скольжения 0 < 0 за счет действия тормозящего момен-
6 э 0
та рыскания Mv 6Э < 0 возникает момент Мх$ > 0, преобладающий над
управляющим моментом элеронов, и управляемость по крену нарушается
(в том смысле, что реакция ЛА не соответствует навыкам экипажа) .
На рис. 6.14 приведены переходные процессы, полученные при попытке
использовать алгоритм, описанный в § 6.3, для отработки заданного значе-
ния угловой скорости <<хзад = 0,5 с-1. При этом длительность интервала
оптимизации (прогнозирования) Т = 0,4 с. Алгоритм не справляется
с решением этой задачи. Более того, наблюдается совершенно обратная
картина, характеризующаяся развитием сох до значительных величин проти-
воположного знака.
Проанализируем процесс формирования рассматриваемым алгоритмом
сигналов управления угловой скоростью сох. В качестве органов управле-
ния используются элероны и руль направления. Минимизируемый функцио-
нал задается в виде
t + 1 , ' * Т, 2 + 2 2 + 2 Ч
, f . \2 j 1 г / ‘ 3 "опта , “р.н т “опт.р.нХ ,
7= f (сох - о>л-зад rdT+ - f I------------- + —-----------— jdr,
t “ r ' ^’э ^р.н '
(6.38,
где 0u>.v = 1 с2. Оптимальные скорости перемещения рулей при решении
задачи достижения заданной угловой скорости ссЛзад определяются форму-
лами вида (3.70)
Тд + 7 /к
6 з — А 3 к J"
Ти
дых
Эбэ
^х зад) >
т„ + Т/к
. О СО,-
Зр.н = ^-р.нк / “ (w.t ~ еохзад)с/г.
ООп.н
(6.39)
где ЭсоЛ-/Эйэ и дсол./Э5р.н — коэффициенты чувствительности угловой ско-
рости к изменению положения элеронов и руля направления. В алго-
ритме они вычисляются путем численного интегрирования дифференциаль-
ных уравнений типа (3.71) при нулевых начальных условиях. Выпишем
только два таких уравнения:
d I \ р 30 I*? y 3 со,. сиdec.. си — Зсо* 6-,
— -------1 = ^х----+ М, — +Л7у у--------L + Mx ‘----- + мх .
с7т\Э6э / Эбэ 36з Э5э Эбэ
(6.40)
d / Эсох \ 30 cuv Эсог
— I----- I = ------+ _
<2т \ 36р.н > дбр,н 36р м
си». ЗсОу ,
+ Л/ Л. ------ +Л7 Ч
35р.н 36р н
175
Рис. 6.15. Изменение коэффициентов чувствительности на интервале оптимизации
Г = 1,2 с
Здесь Мх — частные производные правой части уравнения для сох в
(2.60) по аргументам (•); Э ( • ) /Э6э и Э ( •) /Э6р н — функции чувстви-
тельности указанных компонент состояния.
В начальный момент определяющее значение в (6.40) будут иметь члены
МХЭ и •МХР’Н, обладающие отрицательными знаками в пространстве воз-
можных состояний объекта управления. При длительности прогнозирова-
ния Т = 0,4 с решение (6.40) не охватывает те моменты времени, на кото-
рых объект обращенно реагирует на управление, формируемое алгоритмом.
Очевидно, длительность прогноза должна быть соизмерима со временем
развития неадекватной реакции ЛА на управление.
Уравнения (6.40) позволяют достаточно точно оценить необходимую
длительность Т. На рис. 6.15 представлены изменения коэффициентов чув-
ствительности, вносящих основной вклад в формирование правых частей
176
уравнений (6.40), на интервале относительного времени г— tu от 0 до
1,2 с. Функции чувствительности дсох/Эбэ и Эа>х/Эбр.н не являются моно-
тонными функциями времени, а имеют знакопеременный характер. Стано-
вится очевидным, что восстановление поперечной управляемости ЛА
за счет использования алгоритма с прогнозированием возможно при
увеличенных интервалах прогнозирования, приблизительно выражаемых
условиями
fu+T fu+T
, , Эо>х
/ __^(т) dT >0, f ~(7)d7 > 0. (6.41)
tu °°э tu э5р-«
Это соответствует длительности прогноза Т = 1 1,2 с. Результаты модели-
рования управления угловой скоростью ых при Т = 1 с представлены на
рис. 6.16. Алгоритм устойчиво отрабатывает ссхзад = 0,5 с-1 в области соб-
ственной обращенной реакции ЛА. Имеющиеся при этом первоначальные
отрицательные значения <*>х не превышают 0,1 с-1 и объясняются началь-
ным действием моментов Мх(6э) иЛ/х(8р.н).
В то же время на рис. 6.15 видно, что такие функции чувствительности,
как Э0/д5э> Э0/Э5р.н, и Эыу/дбр.н, имеют четко выраженный
монотонный характер. Этот факт, а также физическая картина развития
движения по крену на данных режимах показывают, что другим возмож-
ным способом сохранения нормальной поперечной управляемости ЛА
является формирование заданных углов скольжения 0зад, не превышаю-
щих некоторые граничные по сваливанию значения.
Начиная с момента обнаружения обращенной реакции крена при воздей-
ствии летчика на ручку управления элеронами, формируется сигнал
я
0зад = А’зХэ, (6.42)
fi
где Кэ — коэффициент перекрестной связи между задающим отклонением
ручки управления по крену и углом скольжения; Хэ — перемещение ручки
летчиком. В минимизируемый функционал (6.38) вводится дополнительное
слагаемое
ги + т
/доп = / M0-K!x3)2d7, (6.43)
tu
где Pi - назначаемый весовой коэффициент.
На рис. 6.17 показаны результаты моделирования управления угловой
скоростью ь>х за счет создания заданного (управляющего) угла скольже-
ния. Длительность интервала оптимизации составляет 0,4 с, что соответст-
вует функционированию алгоритма в задаче обеспечения • устойчивости
бокового движения и согласуется с рекомендациями § 6.3. Анализ.качест-
ва формируемых обоими способами управлений по критериям, предложен-
ным в [6.8], позволяет сделать вывод, что- формируемые управления
являются приемлемыми для летчика.
12.В.Н. Буков
177
Рис. 6.16. Обеспечение поперечной управляемости при длительности прогнозирования Т= 1 с
Рис. 6.17. Обеспечение поперечной управляемости с отработкой заданных углов скольжения
Вообще говоря, реализация управления с использованием (6.42) воз-
можна только в случае, если самолет устойчив в боковом движении, т.е,
Шу<0, т^<0, ту cos а + sin а —— < 0. (6.44)
Лк
Этого ограничения лишен первый из рассмотренных выше способов обеспе-
чения управляемости.
§ 6.5. Автоматизация выдерживания ограничений г)
Автоматизация выдерживания заданных ограничений на компоненты
вектора состояния (и вектора положения рулевых органов) ЛА является
одной из основных задач систем автоматического управления полетом. Она
должна решаться как при ручном автоматизированном, так и при автомати-
ческом управлении движением ЛА. При этом меры, направленные на
предотвращение нарушения ограничений, должны приниматься на всех
уровнях многоуровневой системы управления полетом.
Рассмотрим некоторую модельную задачу выдерживания границ
эксплуатационной области 0 объекта,-движение которого описывается си-
стемой линейных дифференциальных уравнений пятого порядка. Вначале
остановимся на типовых одномерных ограничениях, когда ограничивающие
условия накладываются только на одну компоненту вектора состояния.
Пусть движение объекта управления описывается уравнением
x = flx + Z>6, 6 = и, (6.45)
где х = [*i ...х5]' и 6 ~ [6> 61 631' — векторы состояния и положе-
ния рулевых органов. Матрицы а и b имеют вид
«л «12 «13 0 1
«2 1 «2 2 «2 3 1 0
а т 0 «32 «33 «34 «35
0 «4 2 «4 3 «44 «45
«5 1 0 «S3 «54 «5 5
’о 0 Ьц 64 1 0
Ь- 0 0 Z>32 642 0
0 0 0 0 ^5 3
Задача управления заключается в формировании
(6.46)
(6.47)
сигналов на входах
интегрирующих приводов (6.45), предотвращающих превышение заданного
по каким-либо соображениям значения х1доп; Решая задачу с помощью
*) Параграф написан при участии А.Н. Акимова.
12
179
алгоритма с прогнозирующей моделью, минимизируемый функционал
зададим в виде
*м + г । tu+T
f [QKa4(x)+ <2ш(х)]dr +-- f (иК-1и+и'оптК-1иот)атХбМ)
tu 2 tu
где
£?кач00~ “ №2(^2 ~-*2зад)2 + 0з(Хз ~’-^Ззад) Рл(Х4 —^4зад)2]>
(6.49)
п _1° ПРИ *|<*1доп»
Qui *) z ч (о.5 и)
I Pl(Xj -X 1доп) ПРИ xi >х1доп;
0i — весовые коэффициенты (положительные) слагаемых функции ’’ка-
чества” подынтегрального выражения функционала; р2 — параметр (по-
ложительный коэффициент) функции штрафа, определяющий ’’строгость”
заданной границы.
Выбор (6.49) позволяет получить желаемый вид переходных процессов
при движении объекта около границы области 0.
Воспользуемся алгоритмом с матрицей чувствительности (3.70) и прог-
нозирующей моделью с приращениями вектора состояния (5.144), (5.146).
Эти дифференциальные уравнения решаются с нулевыми начальными
условиями. При этом уравнение прогнозирующей модели (5.144) и началь-
ное условие для него записываются в виде
d
— Дхм= каДхм+кх(/и), Дх(/м) = 0, (6.51)
dr
где
Д*м(т) = хм(т) - x(tu); (6.52)
x(Zu) — вектор скорости изменения состояния объекта, соответствующий
началу цикла формирования управления.
Уравнение (5.146) и начальное условие для матрицы чувствительности
принимают вид
d
— Z = KaZ + Kb, Z(fu) = 0. (6.53)
dr
В силу (6.49) и (6.50) матрица bQfbx в (3.70) определится соотношением
ае
— [Р11(*1м — *1доп) Рг(Х2 ~ Х2злр) Рз(.Хз ~ Хззад)04(*4 ~ *4зад)0]>
(6.54)
где х/м = Xj(tu) + Дх,м. Формула (3.70) в рассматриваемом случае усту-
пит место формуле
U1 ki 0 0 тд + г/к Э£>(хм,т)
и2 — — 0 Л2 0 к / Z'(r) —dr. (6.55)
и3_ 0 0 ^3 ти Эхм
180
Рис. 6.18. Влияние различных факторов на показатели качества ограничения одной
компоненты: максимальный заброс (сплошные линии); величина недоиспользования
диапазона (штриховые линии)
Заметим, что в случае организации адаптивного управления движением
ЛА около границы заданной области в от системы идентификации тре-
буется оценивание ненулевых элементов матриц (6.46) и (6.47).
Параметрыалгоритма (6.55), (6.51), (6.53) окончатель-
но выбираются при моделировании. При анализе процессов ограничения
области состояний объекта управления можно использовать такие показа-
тели, как максимальный заброс ДХ/звбр=*»тах —xinon и разность Дх/уст =
= */доп ~ х/уст, характеризующая недоиспользование разрешенного диапа-
зона компоненты X/. Графическое пояснение этих показателей, а также
результаты исследований данного алгоритма представлены на рис. 6.18.
В моделируемом примере наблюдалось резкое ухудшение обоих показа-
телей при Дтц > 0,2 с, а при Г < 0,25 с имели место значительные забросы.
На основе исследований установлена эмпирическая зависимость между
длительностью прогноза, при которой обеспечиваются наименьшие значения
введенных показателей Axi3a6p> Д*1уст> и периодом высокочастотных ко-
лебаний объекта (6.45). Длительность интервала прогнозирования должна
составлять примерно пятую часть периода колебаний.
Аналогично могут решаться задачи ограничения различных компонент
состояния моделей ЛА, а также величин, вычисляемых на их основе. Пе-
рейдем к задаче выдерживания двухмерных ограничений. Так, для объекта
(6.45) можно рассмотреть случай, когда граница области 0 задана в
плоскости компонент Xj и хг. Произвольный и достаточно сложный вид
этой границы показан на рис. 6.19. Здесь область допустимых режимов
(эксплуатационная область) представляет собой область вне областей 7 и 2.
181
Обратим внимание на наличие ’’рукава”, т.е. узкого промежутка между
двумя (а точнее, тремя, если учитывать симметрию границ относительно
оси х>) областями, запрещенными для вектора состояния. Задача выдер-
живания ограничений сводится к предотвращению проникновения вектора
состояния (6.45) в области 1 и 2.
Границы типа показанных на рис. 6.19 могут храниться в памяти БЦВС и
при необходимости использоваться при вычислениях. Построение алгорит-
ма выдерживания ограничений предполагает формирование на этих грани-
цах функции штрафа 0Ш(Х|, х2). Одним из вариантов такой функции мо-
жет явиться взвешенное кратчайшее расстоянием/от текущей точки прогно-
зируемого состояния модели (х1м>х2м) до границы (когда вектор состоя-
ния находится вне области О). Если принять дополнительные меры по
Рис. 6.19. Границы областей 1 и 2, запрещённых для вектора состояния объекта управ-
ления
обеспечению однозначности функции штрафа, например путем разбиения
диапазона х2 на зоны с монотонными участками границы, то функцию
штрафа можно представить в виде
{О при ДХ|Гр<0,
P](2^^Irp I Д^2гр 1/(Д-^1гр ’*’^^с2гр) I при ДХ||.р х* 0.
(6.56)
Здесь ДХ|Гр = х1м - Х|Гр н Дх2гр = х2м - х2гр - удаления текущего
прогнозируемого состояния от граничных значений х i гр при х2м и х2 гр при
х1м (см- рис. 6.19); Pj 2 - общий коэффициент ’’строгости” границ об-
ласти О (в общем случае он может принимать различные значения для
различных участков границы).
Для осуществления ограничения области состояний объекта (6.45) вос-
пользуемся алгоритмом (6.55), (6.51), (6.53). Составляющие частной
производной д(?/дх, зависящие от штрафной функции (6.56), имеют вид
Эх
Г /*1,2 । ^*2гр I3
[ (ДХ1Гр +Дх’гр)15
Р1.2 1 гр sign Дх2гр
(Дх’гр+Дх’гр)‘-5
(6.57)
Заметим, что с целью экономии памяти БЦВС и сокращения объема вычис-
лений границы, показанные на рис. 6.19, могут быть аппроксимированы
кусочно-линейными функциями с уравнениями для каждого линейного
участка
A/Xi +BtX2 + Cj = 0. (6.58)
182
Х2
2 4 6 8 х,
Рис. 6.20. Процессы выдерживания заданных границ в пространстве двух компонент
вектора состояния
(6.60)
В этом случае расстояние до / -го отрезка определяется формулой
x1M + В,х2м +С/)/(Л2 + Я2)1/2 (6.59)
(предполагается, что знаки коэффициентов в (6.58) выбраны так, «по d > 0
вне области 0), а функция штрафа — выражением
0=1° "ри
I Pl.2di При
откуда
3(2Ш
~— = [р'1 2А1<Л*1м + #/*2м +G)
дх
р\ iBiUAiX^+BiX^+Ci) ООО], (6.61)
где р\ 2 = р, 21(А ] + В?)1/2 ; 1 ( • ) - единичная ступенчатая функция,
отличная от нуля при положительных значениях аргумента.
183
На рис. 6.20 представлены результаты моделирования процессов (ва-
рианты I и II) выдерживания границ области © с двумя видами кусочно-
линейной аппроксимации. Здесь же показаны переходные процессы по
компонентам xt и х2, а также отклонения рулевых органов, формируемые
алгоритмом. Алгоритм эффективно выдерживает ограничения в условиях
интенсивного движения объекта вблизи границ, в том числе в условиях
движения в ’’рукавах” эксплуатационной области.
§ 6.6. Обеспечение устойчивости самолета
на больших углах атаки1)
Использование алгоритмов управления движением самолета с прогнози-
рующими моделями позволяет существенно расширить область устойчи-
вости самолета на больших углах атаки. С этой целью может быть использо-
ван любой из рассмотренных ранее алгоритмов с подынтегральной функ-
цией (5.30) минимизируемого функционала, где следует полагать сохзад =
= зад = ^зад ~ 0- При этом движение управляемого самолета описывается
уравнениями (2.60).
Исследования на универсальной ЦВМ показали, что используемый диапа-
зон углов атаки может быть расширен. На рис. 6.21 в качестве иллюстрации
показаны траектории движения в плоскости "угол атаки — угол скольже-
ния” вектора состояния гипотетического самолета, подверженного дейст-
вию возмущений в боковом канале. Траектории получены при одинаковых
возмущениях, но при различной автоматизации: без средств автоматизации,
с традиционной линейной системой улучшения устойчивости и управляе-
те. 6.21. Траектории изменения состояния самолета в плоскости "угол атаки - угол
скольжения” и границы эксплуатационных областей: 1 - самолет без СУУ; 2 - само-
лет с СУУ типа (6.62); 3 - самолет с прогнозирующей системой управления
1) Параграф написан при участии А.Н. Акимова.
184
мости (СУУ) [5.10]
5э = ^э Sp.H =^р.^(<7)^+Лр ’(<7)лг (6.62)
и с прогнозирующей системой управления. Прогнозирующая система,
реагирующая на тенденцию развития бокового движения, парирует возму-
. щения в условиях располагаемой эффективности рулевых органов. Система
• улучшения устойчивости и управляемости типа (6.62) не может парировать
развивающееся движение крена и рыскания из-за отсутствия избытка управ-
ляющих моментов над возмущающими моментами, возникшими в резуль-
тате неэффективных начальных действий. Таким образом, прогнозирова-
ние состояния ЛА на основе многомерной динамической модели (даже в
линейной'форме (6.49), (651)) позволяет существенно повысить опера-
тивность ’’вмешательства” системы управления в процессы движения ЛА.
На рис. 6.21 показан также возможный вариант границ области 0 в сече-
нии (а, 0) для выбранного гипотетического самолета с прогнозирующей
системой управления. Нбвые границы определены в основном из соображе-
ний сохранения достаточного уровня эффективности рулевых органов.
§ 6.7. Двухуровневое управление геометрической
высотой полета1 *)
Рассматривается задача огибания рельефа местности в вертикальной
плоскости. Предполагается, что лежащий впереди рельеф необходимой
протяженности или известен заранее (нанесен на карту), или может быть
определен бортовыми, техническими средствами. Движение самолета осу-
ществляется только в вертикальной плоскости и описывается уравнения-
ми (2.66). Полагая скорость полета постоянной и линеаризуя уравнения
для В и со, в окрестности горизонтального полета (пусть Ф = 0), вместо
уравнений (2.66) запишем
ё = в® Да +ву р вД6р#в, со, = - в ®, Да - a“zД6р.в,
x=Kjrcos0, //=FfcSin0, Дд = а>п
где Да, Д5р.в и Д$ - приращения угла атаки, угла отклонения руля
высоты и угла тангажа относительно балансировочных (для горизонталь-
ного полета) значений авал, 6p.B.6an и дбал. Продифференцировав пер-
вое уравнение (6.63) и воспользовавшись (2.22) и (2.67), избавимся от
приращения угла атаки:
F* б
. ДНут ~—dybtfiyj + Оу i»3z + Оу Др.в>
„ g
/ а \
• тг A wz / 8р.в amz 4р.в|лс z/r
-- & ^nyt ~атг^: ~\атг ~ ау 1^р.в> (6.64)
VkOy \ ау /
g—cosO
х - Vk cos в, Н - Vk sin 0, В ---Дпут,
1) Параграф написан по статье СК. Давыдова, СИ. Штанько [5.5 ] и по материалам
СИ. Штанько.
185
Рис. 6.22. Укрупненная структурная схема двухуровневой системы управления высо-
той полета
где &пу[ - Vk6/g - cos 0 — приращение перегрузки в траекторной СК;
цр.в = fiP.B — скорость перемещения руля высоты.
Дополним уравнения (6.64) уравнениями рулевого привода (2.89) без
учета нелинейности
fip.B =Др.в> Др.в =“^4Др.в -^afip.B +/11ир.в (6.65)
и уравнением управления скоростью изменения сигнала на входе приво-
да (6.65)
йр.в=ип- (6.66)
Структура двухуровневой системы управления высотой полета показана
на рис. 6.22. Будем полагать, что на траекторном уровне формируется за-
данная перегрузка пут.зад, а на пилотажном уровне осуществляется
формирование сигнала управления ип для (6.66). Синтез управления будем
осуществлять на основе алгоритмах матрицей чувствительности (5.22)-
(5.29) для траекторного уровня и (5.20) для пилотажного уровня.
Рассмотрим вначале пилотажный уровень управления движением самоле-
та. Минимизируемый функционал с учетом вводимых дополнительно для
этого уровня функций Q, запишем без терминального члена со скользя-
щим интервалом оптимизации:
1 г и *
1ц ~ ~ f finy (A/lyf ДЛут.зад) (?iu 1 Сш2 1
2 1и
1 'и ♦ Т
+ Т / "* МП.ОПт)^»
2 tu
186
Рб1(^р.в ~Д^р.вшах +®р.в.бал) при Д5р.в >6р.вmax
Сш1 ~ 0Ш2~ Прогнозир d 0 Рб2(“^*р.в "* ^p.Bmin ^р.в.бал] Рб1(1^р.в1 ^р.вшах) При 0 при Рб2(1^р.в1 ®р.втах) При ующая модель имеет вид Vv . ®р.в.бал> при fip.Bmin “^р.в.бал ^Д^р.в ^^рлтах" ®р.в.бал» при Д5р>в < 8p.Binin ~ ^р.в.бал» (6.67) ^р.в ^^р.в тах» 1 ^р.в 1^^р.втах» ^п.в < ®р.в max- л
Ди^т,м — — КОу АПуТ1М + К ву COgM + dr g каур- Мр.в.м»
^zm v _в Диут.м - Kamz согм - к! атр------------—ау )ДбР.в.м,
v кау \ ау J
(6.68)
d
. А^р.в.м = кРр.в.м>
ат
d
Рр.В.М ^-^АЯр.В.М ~ ^2^6p.B.M *" к-^1“р.в.м»
аТ
d
~~~ Мр.в.м ~ О-
ат
В соответствии с (6.68) записываются уравнения для функций чувствитель-
ности (5.20).
Формирование оптимального управления пилотажного уровня основано
на вычислении
ти + т/к
Йр.в ~ Пп.опт = ~ ^р.вк I ( 2пРпу(пут.м ~ пут.зап) +
ги
+ ^6 [Рб j 1 (Д^р.в.м ~~ ^р.втах "* ^р.в.бал) +
+ Рб2 ^Р-в-м ^^p.Btnin ~^р.в.бал)] +
+ । Цбр.в.м ~~ ^р.втах) PeiH 1^р.втах I ^р.в.м)])^Т» (6.69)
где Zп — Zw — до?2М/Эпр.в,м и т.д., 1( *) единичная
ступенчатая функция с указанными аргументами.
На траекторном уровне осуществляется так называемая локальная опти-
мизация (см. § 5.4) заданной перегрузки «>т.зац- Такой подход эффекти-
187
вен при умеренной изрезанности рельефа. Минимизируемый функционал
записывается в виде
1 *и + т
/ [/Зя(^-^эвд)2+^62+^«^.+<2шз+Сш4^7 +
2 tu
1 tU*T
+ “ f kny(ur + MTi0nT)</7,
2 tu
_(₽н("доп-Л) при ^<ЯдОП, (670)
Уш3 ’ I 0 при Н>Нао„,
Рп1(Рут.м Hymax) При
О при
Рл 2 (Пу min ~ Чут.м) При
Иут.м >пу max.
Ну tnin ^пут.м иутах>
пу т.м < пу min •
Прогнозирующая модель траекторного уровня имеет вид
d g d
— вМ=“—Пут.> — *M=KP*COS0M,
dr Vk dr
d d _
= xF^sin 6M, ИуТФ — к ИуТФ, (6.71)
dr dr
d _ d _
Нут* “ Нут * + ВъПут * ^3ДПуг.ЗйД, ДПутязад 0.
dr dr
Здесь первые три уравнения следуют из (6.64), четвертое и пятое уравнения
приближенно описывают процессы внутреннего (пилотажного) уровня
управления (см. (5.22)), а последнее уравнение отражает постоянство
заданной перегрузки на входе ’’внутреннего контура” (5.22) при прогно-
зировании на траекторном уровне. Как показано в § 5.1, включение в
(6.71) уравнений ’’внутреннего контура” в таком виде необязательно. Для
многих практических задач можно ограничиться уравнениями вида (5.18).
Заданная перегрузка определяется формулой
ти + Т/к
АЙ^т.зад = Пт.опт = ~ кпу к f 06 ®м + — ^задС^м)]
tu
+ £п(ЗпИуТ* + ZfjPffl(Haon — Нм) + Znpnil(nyT * — Путах ) +
"* ^пРл2 ^(Пуmin — П^,т ф)} </т, (6.72)
где Ze = Э0м/ЗДи_>,т.зад, ZH = аям/адиут.зад и т.д. Функции Z в (6.69)
и (6.72) удовлетворяют соответствующим уравнениям чувствительности.
Так, для траекторного уровня эти уравнения, согласно (6.71) и (5.26),
имеют вид
d g d d
Ze ~ К ~ Zn, Zx К Vk sin 6MZg, ~~—Zf] =Kf/'kCOS0MZg,
dr Vk dr dr
d d z (6-73)
—Z„ = KZff,
188
Рис. 6.23. Развернутая структурная схема двухуровневой системы управления высотой полета
Рис. 6.24. Траектории движения самолета и изменение перегрузок вдоль рельефа без ограничений (а) и с ограничением (6) перегрузки
Заданная высота полета Язад в (6.72) формируется на прогнозируемой
траектории по рельефу лежащей впереди местности.
На рис. 6.23 представлена развернутая структура двухуровневой систе-
мы управления высотой полета. Некоторые результаты моделирования по-
казаны на рис. 6.24. Заданная высота превышения над рельефом составля-
ла 30 м, минимально допустимая высота полета Нлоп - 15 м, длительность
прогноза на траекторном уровне в пересчете на пройденный при прогнозе
путь составляла 500 м, длительность прогнозирования на пилотажном уров-
не Т = 0,5 с, на обоих уровнях управление обновлялось через каждый 0,02 с.
§ 6.8. Управление разгоном и подъемом самолета 1)
Рассматривается задача вывода самолета на заданную высоту с заданной
конечной скоростью и заданным конечным наклоном траектории. Управ-
ление строится по двухуровневой схеме, когда на траекторном уровне фор-
мируется заданный угол атаки а,, а на пилотажном уровне осуществляется
управление рулевыми органами, обеспечивающее выдерживание самолетом
заданного угла атаки. Предполагая,что полет происходите невозмущенной
атмосфере, и рассматривая только продольное движение, уравнения движе-
ния ЛА можно представить в виде (2.66). Учитывая значительную продол-
жительность исследуемого режима полета, дополним эти уравнения урав-
нением изменения массы ЛА
th = - Се(Н, V)P(H, И, (6.74)
где Се — удельный расход топлива. Будем также полагать, что тяга двига-
телей Р зависит от высоты и скорости полета и определяется только стати-
ческими характеристиками типа показанных на рис. 6.25 [2.3].
Будем здесь рассматривать только формирование управления на траек-
торном уровне. Для а, на основе опыта решения подобных задач прини-
мается программа
<*• =аоп0+«з)0+si(6.75)
где аоп(0
—
— опорная программа вида
ct<s+kat при т<Г1,
(6.76)
/ Гт ti-t
Oto+kati +(am -Оо - ЛаГ1)1 1-------exp------ +
\ Гг — Гз (г
при t>ti.
Здесь S; — параметры программы (см. (5.79)), первый из которых опре-
деляет деформацию сжатия ($> >0) или растяжения («! < 0) опорной
программы по амплитуде, второй - поворот опорной программы относи-
тельно начала координат и третий — сдвиг аргумента и, следовательно, сме-
щение опорной программы параллельно оси времени вправо при $3 < 0 и
влево при $з >0.
1) Параграф написан по статье А.Ю. Кириллова и П.М. Онсвского (6.9).
190
Рис. 6.25. Типичные характеристики одноконтур-
ного турбореактивного двигателя: тяга двигателя
на указанной высоте (сплошные линии); секунд-
ный расход топлива (штриховые линии)
Уравнения движения объекта на траекто-
рном уровне управления с учетом (2.67) и
(2.18) представляются в виде
Р X
Vk= — cos (а. (s{) + ss] - g sin в + — ,
т т
Р g Ya
е = —— sin [а, (Sj) + ^]- -—cos 0 + — -
»гИк Vk mVk
Н = Vk sin 0, т = - СеР, <6-77)
•S1 =«1, S2 = и2, S3 =и3.
Минимизируемый функционал задается в виде (3.12), где
^зад _ Рн№ ^зад) +
+ ~ Py(Vk ~ ^/сзад)2 + 9 Р0& ' ®зад) »
Q - 2 + 0$2S2 + 2 As3s5+C?m.
О при М<МДОП>
= 7 0Ш (М - Мдоп)2 при М > Мдоп.
(6.78)
(6 79)
(6.80)
Штрафная функция выбрана из соображения выдерживания эксплуатацион-
ного ограничения по числу Маха. Для получения достаточно эффективного
управления на интервалах оптимизации, изменяющихся в широких диапа-
зонах, авторы [6.9] задавали элементы диагональной матрицы К функциями
c(t - tK)
Ay—Луосхр---------, (6.81)
1к~
где kj0 - некоторые постоянные коэффициенты; с - коэффициент пропор-
циональности.
Для решения задачи использовался модифицированный алгоритм с прог-
нозирующей моделью (5.85) -(5.90). Численное моделирование выполня-
лось при начальных условиях:Р*(/о) = 220 м • с-1; 0(to) =0: - 8 км;
s,- = 0 при i - 1, 2, 3; а0 = 7,18°; ат = 12,75°; ка = -0,0189 град • с-’
/| = 75 с; г2 = 9,25 с; t3 = 2,75 с. В конце рассматриваемого режима полета
от ЛА требовалось достижение следующего состояния: H(tK) = 9,24 км;
191
Рис. 6.26. Опорная программа изменения угла атаки (а) и процессы реализации траек-
торного управления (б) при невозмущенных (сплошные линии) и возмущенных
(штриховые линии) начальны^ условиях
~ 172,65 м • с"'; 0(tK) = 37,5°; tK = 102 с. Обновление управлений
на траекторном уровне осуществлялось с частотой 1 Гц.
Результаты моделирования приведены на рис. 6.26. Здесь же показан вид
опорной программы для угла атаки аоп. Исследования функционирования
алгоритма в условиях возмущений показали его устойчивую работу при
удовлетворительном качестве управления. Все кривые, приведенные на
рис. 6.26, соответствуют идеальной реализации оптимизируемой програм-
мы (6.75).
Глава 7
ПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ
И АДАПТИВНОЕ УПРАВЛЕНИЕ С ПРОГНОЗИРОВАНИЕМ
Идентификация динамических характеристик объекта управления яв-
ляется одной из важнейших компонент многопараметрических адаптивных
оптимальных систем управления. Алгоритмы с прогнозирующими моделя-
ми предполагают возможность использования в ускоренном времени (или
в аналитическом виде) динамических моделей управляемого процесса.
Как отмечалось в § 1.3, речь идет лишь о процессах, модели которых из-
вестны априорно с точностью до конечного числа параметров (коэффи-
циентов). В сочетании с программным восстановлением (1.4) информации
о характеристиках объекта идентификация является основой для реализа-
ции беспоисковой параметрической адаптации в практических задачах уп-
равления полетом.
§ 7.1. Теорема разделения для задачи адаптивного управления
Адаптивную прогнозирующую систему управления следует рассматри-
вать как один из вариантов адаптивных оптимальных систем управления.
Она представляет собой совокупность взаимосвязанных алгоритмов оце-
нивания- (частично программного восстановления) параметров а управляе-
мого объекта (1.5), оценивания его состояния (1.6) и собственно алгорит-
мов формирования управления (1.7). Последние реализуются в форме
совмещенного синтеза оптимального управления, т.е. синтеза, связанного
с решением оптимизационной задачи непосредственно в процессе функцио-
нирования системы управления. При этом синтез осуществляется на основе
прогнозирующих моделей, воспроизводящих в ускоренном времени не-
управляемое, или ’’свободное”, движение объекта.
В предыдущих главах рассматривались алгоритмы синтеза оптимального
в смысле критерия А.А. Красовского (критерия обобщенной работы)
управления с использованием прогнозирующих моделей. Перейдем теперь
к алгоритмам текущего, т.е. выполняемого в реальном времени, оценива-
ния параметров объекта. В общем случае требуется осуществлять одновре-
менное оценивание вектора параметров а и вектора состояния х (г), однако
ниже в основном речь будет идти об оценивании параметров. Это можно
объяснить тем, что главное содержание адаптивного управления здесь свя-
зывается с задачей управления объектом при недостаточной априорной
информации прежде всего о его динамических свойствах.
Алгоритмы совмещенного оптимального управления, к которым отно-
сится АПС, могут в принципе сочетаться с любым из известных алгорит-
мов параметрического и координатного оценивания (идентификации и
фильтрации). В то же время выбор этих методов может опираться на внут-
'/г 13. В.Н. Буков
193
реннюю связь оценивания с решаемой задачей оптимизации управления
движением объекта. Некоторое приближение этой связи можно установить
благодаря известной теореме разделения (теореме статистической экви-
валентности) [3.14]. Для задачи оптимизации по критерию А.А. Красовско-
го впервые эту теорему доказал И.Е. Казаков [3.10].
Вообще говоря, строгая формулировка теоремы разделения дана для
задачи квадратичного оптимального управления линейным объектом при
гауссовых шумах в линейных наблюдениях (1.2) за состоянием объекта
при известных его параметрах. Задача адаптивного управления с оцени-
ванием параметров объекта является нелинейной и строгого разделения
не допускает. Однако приближенное разделение не только возможно, но
и целесообразно. Приведем доказательство, следуя в основном А.А. Кра-
совскому [1.43, 7.1].
Пусть вектор параметров а объекта (3.8) меняется во времени случай-
ным образом:
с = 1а, (7.1)
где %а — г-мерный центрированный векторный белый шум с известной
интенсивностью Sa. При решении стохастической задачи оптимизации уп-
равления процессом
х =f(x, a, f) + <р(х, a, t)u + 1-х, (7.2)
где %х - и-мерный центрированный векторный белый шум с интенсив-
ностью 5Х, критерий оптимальности (3.12) следует заменить его статисти-
ческой формулировкой (3.23). Стремление минимизировать безусловное
математическое ожидание функционала является вполне естественным.
Воспользуемся результатами § 3.2, сформулированными для стохасти-
ческой задачи, полагая векторы %а и независимыми. Тогда, рассмат-
ривая расширенный вектор состояния для (7.1) и (7.2), вместо (3.24)
следует записать
ЭИ ЭК 1 d2V 1
---+ — /+ — tr ------ Sx + — tr
dt-дх 2 дхдх-2
Э2К
да да’
sa = -Q,
(7.3)
а для оптимального управления иопт справедлива формула (3.15)
dV'(x, a, t)
"опт = - V. «, Г)----;------ • (7.4)
дх
При этом минимизируемый функционал приводится к виду (3.25).
Если вместо значений x(z) и a(t) в каждый момент времени мы распо-
лагаем только наблюдениями (1.2)
z = h(x, а, и, t) + £z,
(7.5)
где £2 — /-мерный центрированный векторный белый шум е интенсив-
ностью Ss, то минимизируемый функционал следует рассматривать как
условное математическое ожидание, причем на основе (3.25)
u(t) = arg min I -
и
lK
= arg min M[ f (u -uont)'K-’(u - nonT)dz | z(t0, z)], (7.6)
t Q
194
где arg min — символ определения функции u(f) из U, доставляющей ми-
и
нимум указанному справа выражению; z(r0, г) — располагаемые наблюде-
ния за движением объекта. В связи с тем что в (7.4) векторы х и а остают-
ся неизвестными, сделанный в § 3.2 вывод о равенстве u(t) и мопт(г) не
является конструктивным. Как и в § 3.2, интеграл в (7.6) будем понимать
в смысле Ито, .тогда в силу перестановочности операций интегрирования и
определения математического ожидания вместо (7.6) можно записать
n(f)=arg mintrA’-1M{[n - попт(х, а)] [и - иОпт(х, <*)]'j z(f0. 01, (7.7)
и
откуда следует необходимость приближения и к попт в смысле наименьших
условных квадратов, т.е. выбор u(f) должен обеспечивать наименьшие
значения вторых моментов разницы и — и опт-
Заметим, что в случае решения линейной'квадратичной задачи для объек-
та с известными параметрами (коэффициентами)
х = ах + Ьи + (7.8)
и функционала (3.23), у которого К,ад = — х'рх и (? = —x'fix, оптимизи-
2 2
рующую функцию V(x, t), удовлетворяющую уравнению (3.24), следует
искать в виде
1 ,
V(x, t) = — х A(t)x + B(t),
(7.9)
где Л — симметрическая положительноопределенная матрица; В — скаляр-
ная функция времени. Тогда оптимальное управление в соответствии с
(7.4) определится формулой 1)
Мопт = -^'Лх, (7.10)
а уравнение (3.24) уступит место уравнению
1 , . • 1 , , 1 , 1 1
— х Ах + В + — х а Ах + —х Аах + — trASx = — — х Вх (7.11)
2 2 2 2 2
1 , 1 ,
с граничным условием — х A(tK)x + B(tK) =— х рх, которое при произ- .
2 2
вольных х эквивалентно совокупности двух уравнений
• , • 1
А+аА+Аа- — р, В =---------1гЛ5х (7.12)
с граничными условиями A(t^) = р, B(tK) = 0. При этомB(t) в (7.9) не
используется, а обеспечивает лишь удовлетворение уравнения (7.11). По-
этому- можно ограничься решением только первого уравнения (7.12),
переходя тем самым к детерминированной постановке задачи.
Подставляя в (7.7) выражение (7.10) для нопт и произвольную линей-
ную форму для искомого управления
u = Lx, (7.13)
*) Правила дифференцирования по матричным аргументам помешены в Прило-
жении I.
‘А 13
195
где х — некоторая оценка состояниях, получаем
w(f) = arg min tr К~1 M[(Lx + Kb'Ах) (Lx + Kb'Ах)' |z(r0, /)].
и
Если принять, что по аналогии с (7.10) L = — КЪ'А, то
u(f) = arg min tr К-1КЭ'ЛМ[(х - x) (x - x)' | z(t0, t)]AbK =
и
= arg min tr ЛЬО'ЛМ[(х - x) (x - x)' | z(t0, r)], (7.14)
и
откуда следует, что оптимальное управление соответствует детерминиро-
ванной постановке задачи, а оценка х в искомом управлении должна быть
наилучшей в среднем квадратическом смысле условной оценкой состоя-
ния х. Это утверждение и обеспечивает разделение задач управления и
оценивания.
В общем случае получение подобного результата является очень сложной
задачей. А. А. Красовский предложил рассмотреть случай достаточно высо-
кой точности оценивания состояния и параметров объекта, когда можно
полагать, что условное распределение, вероятностей этих векторов близко
к дельта-распределению 8 (х - х, а — а), где
х = М[х |z(f0, /)], a-M[a\z(t0,t)]. (7.15)
Тогда в силу свойства дельта-функции соотношение (7.7) приводится
к виду
u(f) = arg min tr К"’ [w - ыопт(х, а)] [и - ыопт(х, а)}', (7.16)
и
откуда непосредственно следует
ал , л л 8V'(x,a,t)
"(0 = "опт (х, а) = К<р (х, a, t) —х—- . (7.17)
Эх (г)
Следовательно, при достаточно высокой точности оценивания состояния
и параметров решение стохастической задачи оптимизации управления с
наблюдениями может представлять собой сочетание совмещенного синтеза
оптимального управления (7.3), (7.4) стохастическим объектом (7.1)
(7.2) в предположении точного измерения векторов x(t) и д(Г) с оцени-
ванием состояния и параметров как условных средних (7.15) [4.4].
Точные алгоритмы оценивания нелинейных процессов по условному
среднему, вообще говоря, представляются бесконечномерными цепочками
уравнений, получаемых на основе условного уравнения Фоккера — План-
ка — Колмогорова. Конечномерные вычислительные алгоритмы оценивания
являются следствием принятия различных аппроксимаций исходной задачи.
Так получены, например, алгоримы оценивания параметров, называемые
фильтрами Калмана первого и второго порядка [4.4, 7.2].
Заметим, что границы применимости предположения о дельта-распреде-
лении для практических задач не установлены и, следовательно, границы
области с предпочтительным и эффективным для рассматриваемой задачи
оцениванием по условному среднему не известны. В то же время, подкреп-
ляя приведенные рассуждения интуитивными соображениями, будем при-
нимать калмановскую фильтрацию как одно из основных направлений по-
строения алгоритмов текущего оценивания параметров.
196
При решении прикладных задач с использованием прогнозирующих мо-
делей интенсивность случайных возмущений в (7.1) и (7.2) предполагается
настолько малой, что на интервале оптимизации [г, Гк] вместо (7.3) можно
решать(3.18), т.е. использовать предложенные в предыдущих главах алго-
ритмы.
§ 7.2. Идентификация при точном измерении компонент
состояния объекта
Выведем уравнения параметрической идентификации на физическом
уровне строгости. Полагая, что оценивание состояния объекта (1.1) осу-
ществляется автономно (или точность измерения вектора состояния доста-
точна для организации адаптивного управления), будем считать, что в каж-
дый момент времени мы располагаем оценками вектора состояния х и ско-
рости его изменения х в соответствии с соотношениями
х = х, х = х + %2. (7.18)
Здесь условно принимается, что все погрешности измерения или оценива-
ния величин, характеризующих движение объекта, связаны с погрешностя-
ми оценок Jc. Помехи можно полагать центрированными, так как
постоянные ошибки датчиков могут быть оценены и соответствующим
образом учтены [7.3].
Если известна аналитическая форма вектор-функции F в (1.1), то оче-
видным линейным по невязке непрерывным алгоритмом оценивания па-
раметров Ьбъекта (1.1) является алгоритм
a = K[i+F(x,a,u,t)], (7.19)
где К — матрица коэффициентов усиления, а выражение в квадратных
скобках характеризует невязку детерминированной части уравнения объек-
та. Эвристический выбор линейной по невязке процедуры оценивания
(7.19) определяет ’’физический уровень” последующих результатов. Выбор
осуществляется из соображений минимизации ковариационной матрицы
(точнее, ее приближения) ошибок оценивания параметров.
Задаваясь определенным уровнем приближения, разложим функцию F в
ряд Тейлора в окрестности оценок х и а и удержим необходимое число
членов ряда. Ограничиваясь линейными членами разложения, в соответ-
ствии с (7.18) получим
А А Л dF
F(x, а, и, t) - F(x, а, и, t) - F(x, а, и, t) + —— Да, (7.20)
да
где dFjda — матрица частных производных векторной функции F по ука-
занному векторному аргументу, вычисленная при х = х и а = а; Да = а — а —
ошибка оценивания вектора параметров. С учетом (7.20), (1.1) и (7.18)
из (7.19) следует
а / 3F \
а = К L+&- —4* • (7.21)
\ да /
197
Вычитая из (7.21) уравнение (7.1),получаем
dF
Да = -Кт Aa + KGx+fe)-^. (7.22)
да
Введем обозначение векторного шума = %х + %•, под которым будем
понимать суммарный шум, искажающий наблюдения за объектом (1.1) и
отнесенный условно к измерителям скорости вектора состояниях.
Известно [4.4], что для линейного процесса (7.22) в случае, если шумы
и являются некоррелированными центрированными белыми шума-
ми с известными интенсивностями Ss и Sa, ковариационная матрица удов-
летворяет уравнению
dF dF' ,
Р=-К—Р-Р K' + K52K' + Sfl.
да да
Это уравнение при det Sy 0 приводится к виду
• / 3F' ,\ / dF' Д'
Р = ( К-Р-г Sf Рх( К-P— Sv1 ) -7
\ да J \ да )
dF'
dF' , dF
~ *£ ~P + SO,
da da (7.23)
откуда следует, что минимальную ковариационную матрицу 1) обеспечи-
вает выбор
dF' .
К=Р — S£l.
da
При этом уравнение (7.23) принимает вид
dF' , dF
p+p-jt Si1 -rP=sa.
да да
да
(7-24)
(7.25)
Формулы (7.19), (7.24) и (7.25) определяют алгоритм идентификации
типа фильтра Калмана первого порядка в непрерывной форме. Начальны-
ми условиями для (7.19) и (7.25) являются соответственно математичес-
кое ожидание начального значения вектора параметров и ковариационная
матрица начальных ошибок оценивания параметров. Вместе с интенсив-
ностями действующих шумов величины й(/0) иР(т0) составляют априорную
статистическую информацию, необходимую для реализации калмановской
фильтрации.
Более строгий подход требует использования в (7.19) полной оценки
векторной функции F(x, а, и, t), которая в общем случае (нелинейность
по векторам х, а или негауссовость шумов в (7.18)) не совпадает с
F(x, а, и, г). Более сложная и более точная аппроксимацияF в (7.19) и
использование более сложных разложений вместо (7.20) позволяют по-
лучить алгоритмы идентификации более высокого порядка, обладающие в
целом [4.4] улучшенными характеристиками сходимости.
При одновременном оценивании состояния и параметров используется
алгоритм типа фильтра Калмана, в котором в отличие от (7.19), (7.24) и
(7.25) оценивается обобщенный вектор, формально объединяющий суб-
1) Имеется в виду матрица с минимальными диагональными элементами.
198
векторы х и а [7.4, 7.5]. Такой подход сопровождается резким возраста-
нием трудоемкости вычислений. Поэтому в дальнейшем будем полагать,
что интенсивности изменения состояния объекта (1.1) и его параметров
настолько различны, что вполне приемлемо их раздельное оценивание.
Кроме того, при решении практических задач идентификации модель
управляемого объекта удобно выбирать таким образом, чтобы парамет-
ры а в (1.1), по крайней мере в течение одного цикла оценивания Дга,
можно было полагать постоянными, т.е.
а = 0. (7.26)
Тогда непрерывный алгоритм оценивания параметров принимает вид
л 3F'
<7 = K[x+F(x,fl,u,0], К = Р~
Ьа
bF' . bF
(7.27)
ba ba
Этот алгоритм, как показано в [7.5], допускает и другие формы пред-
ставления.
Отметим некоторые особенности калмановской фильтрации в задаче
идентификации, определяющие пути совершенствования соответствующих
алгоритмов при решении вопросов их практического применения.
В литературе [1.22] отмечается плохая сходимость оценок параметров
при больших начальных ошибках. Этот недостаток можно преодолеть, либо
используя алгоритмы более высокого порядка (фильтр Калмана второго
порядка, метод инвариантного погружения), либо комбинируя основной
алгоритм оценивания с менее точным (здесь уместнее сказать, формирую-
щим неоптимальные оценки), но быстрее сходящимся на начальном этапе
алгоритмом идентификации [7.6]. С другой стороны, использование прог-
раммы начальной настройки (1.4) может полностью снять этот вопрос.
С целью повышения точности оценивания может оказаться перспектив-
ным сочетание методов идентификации по условному среднему с асимпто-
тически устойчивыми методами адаптивной идентификации с подстраи-
ваемой моделью [7.7].
Другим недостатком алгоритмов типа фильтра Калмана является значи-
тельный объем вычислений, затрудняющий применение даже фильтра Кал-
мана первого порядка как наиболее простого, в задачах с большим числом
оцениваемых параметров (напомним, что речь идет об оценивании в
реальном времени). В этом отношении весьма полезны исследования,
направленные на упрощение алгоритмов идентификации и получение
субоптимальных алгоритмов, обладающих удовлетворительными свойст-
вами [1.10,7.5]. Так, существенное снижение трудоемкости оценивания
параметров обеспечивается при замене уравнения (7.25) уравнением для
’’эмпирической ковариационной матрицы” [1.10,1.43,7.1]. Вопросы при-
ложения такого алгоритма в настоящее время исследуются.
Еще одним недостатком вычислительных процедур, реализующих в
реальном времени на ЦВМ ограниченной производительности (сравнитель-
но невысокое быстродействие, большие ошибки округления и дискрети-
зации во времени сигналов) алгоритм идентификации типа Калмана, яв-
ляется опасность потери устойчивости алгоритма из-за накапливающихся
199
вычислительных ошибок. Избежать потери устойчивости можно использо-
ванием треугольных матричных квадратных корней матрицы Р (впервые
извлечение квадратного корня из матрицы в задаче оптимальной фильтра-
ции применил, по-видимому, Поттер [7.8]).
Суть этого подхода заключается в использовании в алгоритмах оценива-
ния параметров вместо матрицы Р некоторой матрицы 77, определяемой
из условия
Р-*М- (7.28)
При вычислении оценок с помощью матрицы 17 неявным образом гаранти-
руется положительная определенность произведения 7777', т.е. матрицы Р.
Если (7.28) подставить в последнее уравнение (7.27), то можно убедить-
ся, что оно может быть представлено суммой двух уравнений
1 / 3F V , ( dF \ 1
I ^1+ ^ = 0,
\ да / \ да / 2- 29)
, 1 / 3F \' / аг \ 1 , 7
й +т( ~ Рх \ ~ ч N - т Гт? =0’
2 \ да / ' да ' 2
умноженных соответственно на т?’ справа и на 77 слева. Здесь Г — произволь-
ная кососимметрическая матрица. Так как уравнения (7.29) повторяют
друг друга с точностью до операции транспонирования, то можно исполь-
зовать одно из них.
Условие (7.28), вообще говоря, не обеспечивает единственность матри-
цы 77. Само по себе это не создает каких-либо трудностей. Однако при
необходимости вычисления всех элементов матрицы 77 происходит значи-
тельное увеличение трудоемкости всего алгоритма оценивания [7.9]. Ис-
пользование треугольной формы записи матрицы 77 позволяет снизить тру-
доемкость алгоритма.
Если матрицу Г выбрать таким образом, что сумма
/ dF \' f dF \
I — 77 )S£! I —т?) + Г
' да / \ да /
является верхней треугольной матрицей, а начальное значение для 77 (70)
определить из матрицы P(t0) методом разбиения Холецкого [7.8], приво-
дящим к верхней треугольной форме т?(/0), то решение r](t) будет верх-
ней треугольной матрицей при любом t.
В этом случае алгоритм (7.27) уступит место алгоритму
А / dF \ , л . л 1
а = ТЦ “Г *7 I Sv [х + F(x, а, и, 0], г] + — ??Х = 0, (7.30)
\ да / 2
где элементы матрицы Л определяются соотношениями
при
при
при
(7.31)
(здесь 77, и 77/ - столбцы матрицы 77).
200
Алгоритм (7.30), как и (7.27), связан с интегрированием г (г + 3)/ 2
скалярных уравнений (г — число оцениваемых параметров (1.5)). Проце-
дура умножения треугольных матриц, используемая в (7.30), является бо-
лее экономной по сравнению с умножением прямоугольных матриц.
При организации вычислений наЦВМ в реальном времени удобнее пользо-
ваться алгоритмом параметрической идентификации в дискретной форме.
Переход к нему от (7.27) может быть формально осуществлен заменой
производных соответствующими первыми правыми разностями [3.26].
При этом, вводя обозначение для матрицы интенсивностей дискретных слу-
чайных возмущений 5Ед, для которой при условии равенства мощностей
дискретных и непрерывных возмущений справедливо выражение
(732)
ДГ
где Дг — шаг дискретизации во времени, получим для (7.19) и (7.24)
в* =«*_ 1 + К* [хк + Fk (xk, ак_ ь и, г)],
/3F’\ (7JJ)
К*"Р*\ЙУ
где (bF/ ba)k вычисляется при хк и ак_!. Вводя матрицу А = Р~1, из пос-
леднего уравнения (7.27) с переходом к дискретному алгоритму получаем
/bF'\ , /3F\
— ) . (734)
\ba / \Ьа/.
Полагая, что для дискретных матриц сохраняется соотношение Ак -Рк1, на
основании леммы об обращении матриц [7.10] рекуррентное соотношение
(734) преобразуем к виду
Алгоритм (7.33), (735) может быть использован для идентификации.
Но некоторые преобразования позволяют существенно снизить объем вы-
числений. Умножая (7.35) справа на (ЭГ'/ЭЗ)*, вынося влево за скобки
общий матричный множитель Рк_ i (bF1/ b а)к, заменяя единичную матрицу
выражением
и проводя очевидные сокращения, можно убедиться в справедливости соот-
ношения
Тогда вместо первого уравнения (733) можно записать
а а /ЭГ\ /bF\ /ЭГХ!"1 а
^=^-1(^-^)- (7.36)
\dfl/kL \Эа/к \Эо /к\
14. В.И. Буков
201
Алгоритм (7.35), (7.36), записанный в виде
+Kk[*k~Fk(Xk.ak-i.u' О],
/ЭЕ\
?k~Pk-l —т) Ffc_j,
\Эо/„
(7.37)
является наиболее экономным из неупрощенных дискретных алгоритмов
рассматриваемого типа. Это объясняется тем, что в наиболее часто встре-
чающемся случае, когда уравнения объекта (1.1) автономны по оценивае-
мым параметрам и идентификация в силу этого осуществляется для каждо-
го уравнения объекта независимо, в квадратных скобках последнего урав-
нения (7.37) заключена скалярная величина.
Заметим, что если в алгоритме (7.33), (7.35) или алгоритме (7.37) отка-
заться от представления матрицы Рк как ковариационной матрицы ошибок
оценивания (или ее приближения), а также снять указанное выше условие
априорного определения начальных значений о(г0) и Р(г0), то эти алгорит-
мы совпадут с приводимыми в литературе формулировками рекуррентных
процедур метода наименьших квадратов (7.11]. Минимизируемый при
этом критерий для »-го уравнения (1.1) в принятых обозначениях имеет
вид
4нк = (Ц + Fi(*Л «ь К О]2, (7-38)
/=1
где к — номер вычисляемой оценки вектора о; / — номер использованных
оценок х и к в дискретные моменты времени.
В литературе приводятся различные рекомендации по выбору начальных
значений а$ и для рекуррентной процедуры метода наименьших квадра-
тов [7.11], нз которых наиболее распространенной является рекомендация
выбирать начальные условия в виде
д0 = О, Ро =НЕ,
где Я — наибольшее представляемое в ЦВМ число. Снижение уровня априор-
ной информации в целом ухудшает процесс оценивания, однако моделиро-
вание показывает, что разница в процессах оценивания при использовании
калмановской фильтрации н метода наименьших квадратов быстро
исчезает.
§ 7.3. Текущая идентификация в адаптивной системе управления
При постановке задачи идентификации динамических характеристик
объекта управления, осуществляемой в интересах реализации управления,
в большинстве случаев подразумевается, что приближение оценок парамет-
ров а к их истинным значениями обеспечивает приближение формируемого
на основе оценок оптимального управления к искомому оптимальному
управлению для реального объекта. Интуитивно выдвинутое, такое положе-
202
ние подкрепляется сформулированной в § 7.1 теоремой разделения
для предельной точности оценивания параметров и состояния объекта.
Однако надо признать, что для случая ограниченной точности оценивания
параметров приведенная теорема разделения не дает конструктивных
рекомендаций по организации совместного оценивания и оптимизации
управления.
В то же время опыт моделирования процессов адаптивного управления
с различными алгоритмами идентификации параметров объекта в реальном
времени и алгоритмами формирования оптимального управления с исполь-
зованием прогнозирующих моделей показывает не очень сильную связь
между точностью оценок а и качеством управляемого движения. Кроме
того, исследования адаптивной прогнозирующей системы, разомкнутой по
оценкам а, показали1) , что регрессионная поверхность второго порядка
ошибок минимизации функционала качества управляемого движения по
ошибкам оценивания различных параметров модели управляемого ЛА су-
щественно несимметрична относительно начала координат. Следовательно,
среди возможных комбинаций ошибок оценивания существуют такие, ко-
торые слабо влияют на качество управления, и такие, которые могут в зна-
чительной степени ухудшить процесс управления при прежнем уровне точ-
ности оценивания каждого из параметров объекта.
Становится очевидной необходимость разработки другого подхода к
текущей идентификации, выполняемой в интересах адаптивного управления.
При этом представляется целесообразной организация оценивания парамет-
ров таким образом, чтобы в первую очередь достигался достаточно высо-
кий уровень качества управления движением объекта и в меньшей степени
преследовалась (или даже совсем не принималась во внимание) точность
оценивания параметров объекта как таковая.
Приступим к формулировке задачи параметрической идентификации в
интересах адаптивного управления с прогнозированием. Начнем с того, что
рассмотрим два различных процесса, связанных с (1.1) , (1.7) и располагае-
мой информацией о параметрах объекта. Если точно известен вектор пара-
метров а, то, воспользовавшись любым из описанных выше вариантов алго-
ритма управления с прогнозированием, можно реализовать (1.7) и полу-
чить таким образом значение некоторой функции 12(х, а),отождествляемой
с сигналами управления u(t). При этом будем полагать, что выбранный
минимизируемый функционал (3.12) обеспечивает требуемое качество
управления. В этом случае движение объекта описывается уравнением
-*-оп ~^ОП + (7-39)
где Fon = F[xon, а, £2(хоп, о)], а индексом ”оп” отмечено желаемое или
опорное состояние, достижение которого следовало бы поставить целью
функционирования системы.
Однако реальной является другая ситуация, когда формируемое управ-
ление основано на некоторых оценках вектора параметров а и на объект
действуют те же случайные возмущения (будем их полагать центрирован-
Результаты исследований приведены в (7.12)
14
203
ними белыми шумами с известной интенсивностью 5Х). Тогда вместо (7.39)
следует записать
Хреал ~ /*pean + $х> (7.40)
где Fpean = F [ Хреал, а, Я (хреал, Ч) J, а вектор состояния, как и в (7.39),
считается точно измеримым. При необходимости могут быть проведены
соответствующие обобщения.
Кроме того, будем рассматривать еще один вариант функции F, вычис-
ленной в соответствии с выражением
Т'контр = /Ч*ревЛЛП(*ревл,*)1. (7.41)
Предположим, что процессы хоп (г) и хреал (0 протекают в достаточной
близости друг от друга. При этом достаточно близки и значения векторов а
и а. Тогда в окрестности значений функции /'контр можно воспользоваться
линейным разложением
/dF 3F
/’on - ^контр а
\<М ди да/
(dF dF
I — +-------)
\Эх ди дх/
X
А
а-а
*=*реал
(*оп ‘ Хреал),
(7.42)
*~*реал
7*реал “/контр +
dF
да
•*=:-*реал
где все матрицы частных производных вычисляются при условиях а = а,
х = Хреал - Формирование производных Э Sl/да и Э Sl/dx осуществляется по
формулам, вынесенным в Приложение П.
Вычитая (7.39) из (7.40) с учетом (7.42) и вводя обозначения
Хреал - хоп = Дх, а - а = Ла, получаем уравнение для ошибок реального
движения по отношению к желаемому
dF ЭП (dF dF dSl\
Дх = —------До + (— +--------)Дл. (7.43)
du da \Эх ди дх /
Здесь и далее для краткости опускаются условия а -а и х = xpean.
Для оценивания параметров объекта воспользуемся линейным по невяз-
ке уравнением вида (7.19), которое в данном случае запишем так:
а - К [ Л'реал “ (Хреал» (Хреал.®))1» (7-44)
где функция FKонтр (см. (7.41)) представляет собой вычисленную на зна-
чениях Хреап и оценках а скорость хРеаллыч>сравниваемую с реальной ско-
ростью Хреад. Воспользовавшись (7.40) и (7.42), получим линейное
приближение (7.44)
204
Вычитая теперь из (7.1) уравнение (7.45), получаем линейное уравнение
для ошибки оценивания параметров
3F
Да = — К —— Да - + $а. (7.46)
да
Таким образом, совместный процесс управления движением объекта
и линейного по невязке оценивания его параметров описывается в линей-
ном приближении системой уравнений (7.43) и (7.46), т.е.
3F 312 /3F 3F 312 \
Дх =----------Да +1 — +----------I Дх,
Эи За \3х Эи Эх/
bF W
Д» = -К — Д<,-К£
да
Будем в дальнейшем пользоваться обозначениями
3F 312 3F 3F Э£2
а =-----------, /3 = — +--------------.
Эи За За Эи Зх
(7-48)
Введем дополнительный критерий, характеризующий точность прибли-
жения реального управляемого движения к желаемому, т.е. получаемому
при точном знании параметров объекта и при прочих равных условиях.
Пусть таким критерием будет математическое ожидание квадратичной
оценки разности состояний (7.40) и (7.39)
/=М[Дх7?Дх],
(7.49)
где R — заданная функция времени, определенная на всем интервале
[То, ?к] Теперь запишем (7.47) и (7.49) в матричном виде
0
О
d Дх
dt Да
- а
3F
-К —
За _
Дх
Да
(7.50)
+
О
/=М[Дх'/?Дх] = М[1г/?ДхДх'] =1г/?М[ДхДх'] = trRDxx, (7.51)
где Dxx = М[(хреая -хОп) (А'реал ~xon) ’J - матрица вторых моментов от-
клонений реального состояния объекта хреая от желаемого хоп.
Задача формулируется следующим образом. При заданной структуре
объекта управления (1.1), выбранном законе управления *) (1.7) и линей-
ном по невязке уравнении оценивания параметров объекта (7.44) процесс
изменения во времени ошибок выдерживания желаемого (т.е. получаемого
в условиях точного знания параметров) состояния и ошибок оценивания
параметров описывается в линейном приближении уравнением (7.50).
Требуется определить прямоугольную матрицу коэффициентов К в (7.44),
обеспечивающую минимальное значение средней квадратической оценки
(7.51) отклонения управляемого движения от желаемого.
1) Предполагается, что при выбранном законе объект (7.43) устойчив.
205
Начнем решение задачи с записи уравнений для вторых моментов векто-
ров Дх и Да. Известно [4.4], что при гауссовых шумах средние значения
цх * М [Дх]. да - М[Да] и матрица вторых центрированных моментов (кова-
риационных функций) решений уравнения (7.50)
Дх - дх
До — Ца
[Дх' - Цх
&а' - ца]
удовлетворяют уравнениям
Рх
.Ав
3F
-К —
да .
Р
* аа-1
dF
-К —
да .
dF' ,
-----К'
да
Рха
?аа
+
0
KSxK'+5e
(7.52)
(7-53)
где Sx и Sa — матрицы интенсивностей белых шумов и соответствен-
но. Полагая шумы центрированными, т.е. М£Л = 0 и М£а = 0, умножая (7.52)
справа на [дх д^],транспонируя результат и складывая с (7.53), можно
убедиться, что матрица вторых моментов
DXx
&ах
Dxa Рхх
ж
D Р
Рха РхРх
+
^ae - - РаРх
РхРа '
Ра Ра -
удовлетворяет уравнению (7.53) с заменой блоков/>хх,/’ха, А’дд- и Раа
блоками Dxx, Dxa, Dax и Daa. В развернутой форме это уравнение с учетом
симметрии Dxa = D'ax эквивалентно уравнениям
Ьхх ~ &DXX ~ &Dax ~ »
dF' ,
Dxa = $Dxa - ctDaa - Dxa-—K't (7.54)
da
dF dF'
Daa ~ — К— Daa - Daa-----К’ + K.S\ К +Sa.
da da
Минимизация (7.51) по элементам матрицы К должна осуществляться
с учетом (7.54). По выражениям (7.51) видно, что выбор матрицы К
непосредственно на J не влияет. Однако критерий (7.51) можно выразить
через старшие производные по времени. Так, с учетом первой производной
+ / j(r)dr, (7.55)
,в
где J(tii) — значение критерия (7.51) в начальный момент времени /о-
206
При учете второй производной вместо (7.55) следует записать
J(to) + f j(n)dTi dr,.
(7.56)
(7.57)
О
где j(t0) — значение первой производной по времени критерия (7.51) в
начальный момент времени г0. И наконец, выражение для критерия близо-
сти процессов (739) и (7.40) при учете третьей производной по времени
имеет вид
t . т .. Ч ... 1
J(d = A/o) + JH(/o) + J ЛМ + J У«)^ dr)\dr,
в
‘o
где j(<o) — значение второй производной по времени критерия (7.51) в
начальный момент времени г0.
Может возникнуть естественный вопрос, почему именно до третьей
производной здесь раскрыто выражение (7.51). Ниже будет показано,
что только соотношение (7.57) позволяет учесть при минимизации крите-
рия все динамические связи вторых моментов состояния системы (7.47).
Дальнейшее ’’развертывание” (7.57) не имеет смысла.
Чтобы воспользоваться (7.57), требуются аналитические выражения
производных J(t), j(t) и J(t), которые можно получить многократным
дифференцированием (7.51), используя (7.54). Так, с учетом возможности
круговых перестановок матриц под знаком следа получим
j(z) = tr(R Dxx + RD.X) =
« tr[(R + R0 +(i'R)Dxx RaDax - DxtlaR],
J(f) = tr[(/? + R0 + fi’Rj Dxx +(R+RP + №)bxx
-<R<xYDax - Dxa(ci'Ry Rabax Dxaa'R} =
= tr | [(/? +/?/? + 0'Ry + (k +RQ + /3'/?)^ + 0'(k +R^ + P’R)J D,
. dF
- (/? +RP + P R)a + (Ray +0 Ra RaK —
da
(7.58)
dF , , I
a'(R + /?0 + 0'R) + (<*K)‘ —Kot/? +
da J
+ R<xDaaa.' + aDatl a'R I,
... ( • bF dF' .
= 7(«,ft,^Do,/)„) + «aK~-Dux +DXaT~ KoF +
I da da
' / . dF\_.dF ..dF
/ da da
dF' , ,
—K'a'R
da
(7.59)
(7.60)
3Ra + 2Ra + R0a + 3Q'Ra-RaK—)K" +RaK-~ Dax
% it /
—-K'a'R + К' За'А + 2aR +a$'R+ 3a'R0
da '
+ &ха и
. да
dF dF' , , . ,1
— 3/?аК— Daaa -3aDatl----KaR +2RaKSxK a J.
da da 1
207
Для сокращения записи (7.60) введена функция y(R, ot, 0, Dxx, Dax), кото-
рая объединяет все полученные при дифференцировании матрицы размера
п X п, не содержащие в качестве сомножителя матрицу К. Точкой справа
отмечена операция вычисления производной по времени выражения, приве-
денного в скобках.
Соотношение (7.57) может быть записано в виде
1 t т ri
ДО = J(t0) +J(r0)(r - r0) + — J(f0)(r- Го)2 +fd7fdnf J(J)d$.
2 to to tB
(7.61)
Последнее слагаемое в (7.61) представляет собой тройной интеграл третьей
производной критерия (7.51). Из (7.51) и (7.58) видно, что первое и вто-
рое слагаемые в (7.61) явно от матрицы К (г) не зависят. Поэтому можно
утверждать, что искомая матрица КОПТ(Г) в интервале [г0» Л] определяется
выражением
копт(0= argmin J(t) =
к
= arg min
к
1 .. t Т Г) ...
-J(to)(t -10)2 +f drf d7)f At)dt
*0 f0
(7.62)
Другими словами, минимальное значение критерия (7.51) в любой момент
времени г обеспечивает такая матрица коэффициентов K(f) = КОпт(£) ®
(7.44), при которой достигает минимума выражение в квадратных скобках
в (7.62) при подстановке (7.59) в случае, когда f = t0, и (7.60) для f #=z0.
Заметим, что первое слагаемое в (7.62) определяет условие для К в
момент г0, а второе слагаемое — в любой момент f € (г0, г]. Будем мини-
мизировать каждое из этих слагаемых отдельно. При этом становится оче-
видным тот факт, что тройной интеграл функции 7(f) имеет минимальное
значение для любых Г, если выбором матрицы K(f) обеспечивается мини-
мальное значение J в каждый момент f.
Так как (7.60) определено в открытой области значений элементов
матрицы К, то для определения этой матрицы можно воспользоваться
необходимым условием минимума J по К. Используя приведенные в
Приложении 1 правила дифференцирования следа матрицы по матричному
аргументу, получим для (7.60)
3 / . ЭГ \ 3F
— trffiaK— Dax) +— Dax(3Ra + 2Ra + R0oi + 30 Ra) +
ЭК \ Эд / да
dF dF , 3F 3F
+ —DaxRa — 3 — DaaaRa-— DaxRaK— -
da da da da
dF dF
---К — D0XRa + 2SX K'a'Ra = 0.
da da
(7.63)
Это матричное соотношение не раскрывается до конца в силу неопределен-
ности операции дифференцирования первого слагаемого. Однако если
матрица К будет такой, что на всем рассматриваемом интервале времени
208
[fo, ^к] удовлетворяется матричное дифференциальное уравнение
bF dF
— Dax RclK. = — — Dax(3Rd+.2Rd+RPd + 3PRci) +
ba \.ba r ,
bF bF , bF bF
+ Dax Rd — 3 ~~ Daad Rd К + Dax FoK — K —
ba ba ba ba
- Sx K'a'RaK + x(F. a, p,Dxx, Dax, Daa), (7.64)
где x — произвольная функция указанных аргументов, то (7.63) становится
тождеством.
Важный частный случай (7.64) имеет место при условии
bF
rank---Dax Ra = п, (7.65)
ba
т.е. когда произведение перечисленных матриц имеет максимальный ранг.
В этом случае вместо (7.64) можно записать
bF'fbF , bF'\4\bF
К a RDca — DaxRdd RDxa— J i ™ Dax(3Rd +
ba \ ba ba / I ba
bF bF
+ 2Rd + R0a + 3PRa) + — DaxRd — 3 — Daa а /?а +
ba ba
, 1 1 bF
+ SX K'a'Ra K + xl+K— K. (7.66)
J J ba
Уравнения (7.64) и (7.66) не определяют однозначно матрицу К (г), так
как остаются неопределенными начальные условия этих уравнений и функ-
ция x(R. a, р, Dxx, Dax, Daa). Их выбор должен осуществляться из условия
минимизации выражения для 7(г0), в которое в явном виде входит решение
уравнения (7.64) при t = to. Так, если известно аналитическое решение
уравнения (7.64) или (7.66)
К(г) = К [Я, а, Р, Dxx, Dxa, Daa, K(r0), x], (7.67)
то, подставив это решение в (7.59), получим явную зависимость j(f0) от
функции х и начальных условий для К, используя которую следует выбрать
Хи К(г0), обеспечивающие минимальное значение J в момент /о-
Решение этой задачи представляется весьма сложным, в общем виде
аналитическое выражение для К (г) на основе (7.64) ипйп7(Го) не получе-
но и не разработаны пока методы численного решения этой задачи. Здесь
сформулированы условия, которым должно удовлетворять искомое реше-
ние. В соответствии с этими условиями в уравнении для оценок (7.44)
матрицу К(/) следует выбирать такой, чтобы удовлетворялось уравнение
(7.64) или (7.66) и величина J(t0) принимала в соответствии с (7.59)
минимальное значение. В сокращенной записи уравнения (7.66), (7.59)
имеют вид
/ bF \
К(г) = КОПТ(Л, а,Р, — , Dxx, Dax, Daa,X. t), (7.68)
\ ba /
209
где Konr - такая функция, что
dF
а) КОП1 ~ е2Копт + €tSx Копта /?аКопт + etx + Копт —~ КОпт»
да (7-69)
6) KonT(z0) = arg min J(t0),
Где , bF'/bF bF'\
ei « - a RDxa ( — DaxRaa'RDxa-----)
ba \ba ba /
ГЭГ
e2 =£1 — Dax(3/?a + 2/?d + /?/ta + 3/rra) +
L ba
bF bF , 1
+ — Dax #a - 3 —• Daa a Ra L
ba ba J
Условия (7.69) получены с использованием линейных членов разложе-
ния функции F в ряд Тейлора. Поэтому алгоритм\формирования (7.68)
следует относить, как нам кажется, к алгоритмам оценивания первого
порядка. Алгоритмы более высокого порядка могут быть сформированы
на основе условий, полученных с использованием квадратичных и более
высоких разложения функции F, а также с использованием квадратичного
и более сложного представления исходного уравнения оценивания парамет-
ров, которое должно заменить (7.44). Возможны также обобщения на
одновременное оценивание состояния и параметров объекта.
Пр иложение I
ОПЕРАЦИИ МАТРИЧНОГО ДИФФЕРЕНЦИРОВАНИЯ
При решении прикладных задач с использованием аппарата матриц могут
быть полезными некоторые общие правила выполнения дифференцирова-
ния по матричным аргументам. Дифференцирование матриц по скалярным
аргументам, как известно, сводится к поэлементному дифференцированию
матриц и здесь не рассматривается. Далее под вектором будем понимать
матрицу-столбец с определенным порядком расположения элементов.
1.Производная скалярной функции по вектору. Ре-
зультатом дифференцирования является совокупность производных этой
функции по каждой компоненте вектора (по каждому элементу матрицы-
столбца) в отдельности. Форма же представления результатов дифферен-
цирования определяется договоренностью. Здесь принимается, что резуль-
тат дифференцирования скалярной функции по матрице-столбцу представ-
ляет собой матрицу-строку с элементами в виде производных этой функции
по элементам матрицы-столбца аргумента:
' -хг
Х2 Эи ди Эи ди
х = • ЧГ • (П-1)
дх [dxi дх2 дх„] v 7
. хИ .
Это хорошо согласуется с последующими формулами.
2. Производная векторной функции по вектору.
Дифференцирование векторной функции можно формально рассматривать
как дифференцирование каждой компоненты этого вектора в отдельности.
Тогда производная будет представлять собой прямоугольную матрицу,
строки которой соответствуют дифференцируемой компоненте векторной
функции, а столбцы — компонентам векторного аргумента, т.е.
'fl h Xi Х2 ’ Э/ * дх1 ЭЛ dxi Э/1 ‘ дхи - /ТТ 04
J- х = Xtl_ дх . дх1 Эх2 дх„ (11.2)
3. Производная скалярной функции по матрично-
му аргументу. При выполнении дифференцирования можно формаль-
но полагать, что скалярная функция отдельно дифференцируется по столб-
цам матрицы, играющей роль аргумента дифференцирования. Дифференци-
рование по первому столбцу дает первую строку результата, но второму
211
столбцу — вторую строку результата и т.д.:
Л = а\ 1 ЛЦ . . Й2 1 Й2 2 • • • О\п • й2п Эу Эйц Эу Эу 3a2i Эу Эу 3awi Эу (П.3)
_ ит 1 2 • • &тп L ЭД1„ Звгп Зв/ии -
4. Производная скалярной функции матриц по мат-
ричному аргументу. Для выполнения дифференцирования удобно
использовать представление скалярной функции матричных аргументов
в виде следа матрицы. Напомним, что любая скалярная величина является
следом матрицы, составленной всего из одного элемента, т.е.
и = tr v, (П.4)
где tr — символ следа квадратной матрицы, т.е. суммирования всех элемен-
тов, стоящих на главной диагонали матрицы (если А = [а/;], то tM =
п
= S а,-/). Напомним также, что матрицы, перемножаемые под символом
t = 1
следа, могут подвергаться круговой перестановке:
tr АВС = tr ВСА = tr CAB. (П.5)
Дифференцирование следа по матричному аргументу сводится к опусканию
символа следа и соответствующей матрицы в произведении при условии,
что матрица, по которой осуществляется дифференцирование, перенесена
на основе (П.5) в крайнее левое или правое положение:
д д
— tr АВС » — tr ВСА = СА. (П.6)
ЭД эд
Если матрица, по которой осуществляется дифференцирование, отличается
транспонированием от матрицы, стоящей в дифференцируемом выражении,
то дифференцируемое выражение следует предварительно протранспониро-
вать, так как транспонирование матричного выражения под символом сле-
да не влияет на результат. Так, справедливо соотношение
3 Э , ,
—- trBCA =----иАСВ' = С'В. (П.7)
ЭЛ ЭЛ' 7
Таким образом, дифференцирование билинейной формы х'Ау, где х и
у — векторы произвольного размера, по каждому из сомножителей дает
3,3, Э , Э , Э ,
— х Ау = — trx Ау = х А, — х Ау - — tr х Ау = — tr Лух = ух ,
Эу Эу ЭЛ ЭЛ ЭЛ
3 , Э ' Э
— X Ау = - try Л X = —;tr Л ху =ху , (П.8)
ЭЛ ЭЛ ЭЛ
3 3
— х Ау = — tr у А х = у Л ,
Эх Эх
Э , 3 , Э
------ х А у ------ tr х Ау =--- tr Лух = А.
Э(ух') 3(ух) Э(ух')
212
Рассмотрим теперь дифференцирование билинейной формы z’(x)Ay(x)
по вектору х, функциями которого являются векторы z и у. Пользуясь
формулами (П.8), а также правилами дифференцирования сложных функ-
ций и произведения функций, получим
Э , 9,9 9,9
— z (х)Ау(х) = — (z Ау) — у +— (2 Ау) — у =
Эх 9у Эх oz Эх
9 ' Э 9 , , Э
= —tr(z Лу)—у+ — 1г(уЛ 2)— z =
by Эх Эг Эх
, 9 , , Э
= z А — у (х) +у А — z(x). (П.9)
Эх Эх
5.Производная квадратичной формы по вектору.
Вообще говоря, этот случай является частным для (П.9). Особенность
заключается только-в том, что векторные функции z(x) и у(х) в (П.9)
тождественно равны указанным векторным аргументам х. Тогда, принимая
во внимание, что bz/bx = Е и byfbx - Е, где Е — единичная матрица, а также
учитывая симметрию матрицы А, получаем
9 .
— хАх~2хА. (П.10)
Эх
6. Вычисление матричного дифференциального
оператора. Рассмотрим действие линейного дифференциального операто-
п п э п
pa S Е aUxi—на квадратичную форму V = S АцХ^;. В матрич-
1 = 1/=1 bXj = t
ной форме записи соответствующая операция имеет вид
bV
— f, (П.П)
Эх
где V= х 'Ax,f= ах. Очевидно, что оператор ставит в соответствие исходной
квадратичной форме V некоторую новую квадратичную форму W. В силу
(П.10) имеем
W=2x'Aax. (П.12)
Однако квадратичную форму (П.12) можно преобразовать к другому виду.
Добавляя и одновременно вычитая слагаемые х 'а *Ах, перепишем (П.12)
в виде
W = x'Aax +х'а'Ах +х'Аах - х'а’Ах. (ПЛЗ)
Так как все слагаемые в (ПЛЗ) — скалярные величины ине меняют своих
значений при транспонировании, то сумма последних двух слагаемых равна
нулю и, следовательно, получаем
W=x'(Aa +а'А)х, (П.14)
где Ла + а'А — симметрическая матрица новой квадратичной формы.
213
Приложение II
ФОРМУЛЫ ЧАСТНЫХ ПРОИЗВОДНЫХ
ЗАКОНА УПРАВЛЕНИЯ С ПРОГНОЗИРОВАНИЕМ
1к , dQ '(т)
+ / У (т) - dr,
t Эхм(т)
xM(t) = x(t),
Располагая в каждый момент времени значениями компонент вектора
состояния х и оценками компонент вектора параметров а, на основе алго-
ритмов § 3.3 и 3.4 формируются законы управления вида
и = П(х,а), (П.15)
где. £2 — дифференцируемая по х и а функция.
Будем рассматривать управление положением рулевых органов, сформи-
рованное с помощью алгоритма с матрицей чувствительности (3.32),
(3.34), (3.40), (3.45), (3.46). Объединяя перечисленные уравнения и
соотношения, а также опуская для простоты множитель к, запишем для
текущего момента t (для объекта (3.8) )
u(t) = -Kip'(x,a, t)p(t),
^^задОк)
d
-r-xM(r)=fM(xM,a, т),
dr
Y(r) = ..' Y(f), Y(t) = E.
dr Эхм(т)
Особое внимание следует в дальнейшем обратить на параметры времени (
и т, функциями которых являются рассматриваемые переменные. Напом-
ним, что t — текущее реальное время, т —некоторое ускоренное время,
определенное от момента t до tK.
Прежде чем осуществлять дифференцирбвание, воспользуемся для неко-
торых матричных выражений записью в другой форме. Так, первое соотно-
шение (П.16) запишем в виде
м(г) = -А X ipt(x, a, t)pi = £2(х, а), (П. 17)
। = 1
где — матрица-столбец, содержащая т элементов и соответствующая У-й
строке матрицы ч>(х, a, t); pj — скалярный элемент матрицы-столбца p(t)
Такая форма записи удобна для матричного дифференцирования по век-
тору х.
(П.16)
214
Дифференцирование (П.17) по х дает
ж — Л
Эх(г) i=l
Г э<л(0
Ьх(О
Эр//) 1
Р.(0 + ^(0-^ ,
Эх(О J
(П.18)
где dtfjldx — прямоугольная матрица размера /нХ п производных элементов
i-й строки матрицы <^(х, а, t) по компонентам х(г); 9р,/Эх — матрица-строка
производных ьго элемента вектора р по компонентам вектора х. Если
вычисление первого слагаемого в (П.18) не вызывает затруднений нево-
дится к дифференцированию функций эффективности рулевых органов
объекта (3.8) с последующим умножением на компоненты вектора р(/).
сформированного в соответствии с (П.16), то вычисление второго слагае-
мого в (П.18) представляется более сложной задачей.
На основе второго соотношения (П.16) можно записать
РДО = У/'Ск)
д^задОк)
t
П(7)
Э0'(7)
Эхм(т)
dr,
(П.19)
где У,(т)-/-й столбец матрицы У(т) = Эхм(т)/Эх(г). Дифференцируя (П.19)
с использованием правила дифференцирования интегрального выражения
по параметру, получаем
др/(О_дУзаа(гк) ЗУД/К) t у, д* ^эад(^к) +
Эх(0 Эхм(/К) Эх(0 ' к Эхм(/к)Эх'(/)
> Г Э(?(т) ЗУДт) , д2@'(т) 1
+ f + у;.(Т)—* * dr. (П.20)
Г 1эхм(т) Эх (0 Эхм(т)Эх(0-1
Поскольку выражения, связанные с дифференцированием Изад и Q в
(П.20), структурно аналогичны, то ограничимся лишь рассмотрением
функции Q. Квадратная матрица ЭУДт)/Эх(/) представляет собой матрицу
частных производных функций чувствительности Yi(r)~dxM(T)lbxl(t')
(чувствительности прогнозируемого вектора состояния хм (/) к /-й компо-
ненте вектора текущего состояния х(/)) по компонентам вектора текущего
состояния х(л). В силу предпоследнего уравнения (11.16), которое справед-
ливо для каждого отдельного столбца матрицы У(т), т.е.
• d Э/м(хм,а, т) z ,
удт) =2^1"-------- УДт), УД;) = [0... 1 0.. .01 (П.21)
dr Эхм(т)
(единице равен только / н элемент матрицы-строк и УД/)), имеем [3.25]
ЭУДт) _ ЭУДт) Эхм(т)
Эх (0 Эхм(т) Эх(/)
(П.22)
где Эхм(т)/Эх(г) = У(т) и удовлетворяет двум последним уравнениям
(П.16), а ЭУДт)/Зхм(т) (будем эту производную обозначать УДт)) удовле-
творяет уравнению
d - ЭЛДхм»я>7) _ м Э2/м
— у. = у/+ I ---------------- у.. (П.23)
с/т Зхм(т) / -• i Зхм/(т) Зхм(т)
215
с начальным условием У,-(О = 0, где Yt/- — /-Й элемент /-го столбца матрицы
Цт).
Матрицу вторых производных функции Q в (П.20) можно представить
в виде
э2е'(г) э2е<т) эхм(т)
--------— = -------------- -------, (П.24)
дхм(т)дх(г) Эхм(т)дхм(т) Эх (г)
где Эхм(т)/Эх(г) = У(т) и удовлетворяет двум последним уравнениям
(П.16), а Э2(2(г)/Эхм (т) Эх„ (т) - квадратная матрица вторых частных
производных скалярной функции Q(xM, т) по компонентам вектора
хм (т) прогнозируемого состояния объекта.
Объединяя (П.16) и (П.18) —(П.24), получаем совокупность уравнений
и соотношений, интегрирование и вычисление которых в ускоренном вре-
мени на интервале [г, гк] позволяет определить прямоугольную матрицу
dSl(r)/dx(t):
ЭП(О_ „ ”
-----------Л X/
Эх (г) /=1
. Эх (г)
Эр,(О
Эх(г) ’
р,(0 + <а(')
Э ^зад (^к)
Э*м(Лс)
эе'(т) ,
-------dr,
Эхм(т)
р,(0 = 1/Ю
Эр,(О _ ^задСк) р , )+У-(г ) & ^зад(^к)
МО Ьхм(/К) к) ’ к) Эхм(гк)Эх^(гк)
Г('к) +
(П.25)
Эб(т)
. Эхм(т)
к,(т)+г;(т)
э26(т)
Эхм(т) Эх„(т).
Y(r)dr,
d
— хм(т)=/м(хм,а, т),
dr
xM(r) = x(t),
d tyM(xM, о, т)
— Г(7)=-^Ц—Г(т), Y(t)=E,
dT Эхм(т)
d _ Э/М(т) _
у|(7) = —У7(т) + Z
</т Эхм(т) / = 1
Э2/м(т) - z ч п
------------- к,-(т), Г,-(0 = 0.
Эхм/(т)Эхм(т)
п
Напомним, что здесь У,- — столбцы матрицы Y, а У),- — элементы матрицы Y;
У i — квадратные матрицы л-го порядка, общее число которых составляет л.
Получим аналогичные формулы для формирования ЭП(г)/Эо(г). Вос-
пользовавшись формулой (П.17), имеем
эад_ п
—К. 2^
da(t) , = 1
э^(0
Эа(О
Эр,(О
Эа(г) ’
(П.26)
Р.(г) + <р,-0)
где 9y5f-(r)/9fl(r) — прямоугольная матрица размера m X г производных
элементов t-й строки матрицы <р(х, a, t) по компонентам вектора a(t).
Матрица производных Эр,- (г)/Эа(г) определяется на основе формулы
216
(П.19), дифференцирование которой по а (г) дает
эг;ад(р-
Эв(01 Эхм(гк) .
Эд(О
'к I
a
dr.
(П.27)
Эр,(О Я эгзад(/к) эглгк) +
Эхм(гк) Эа(О
^±^> + у;(7)
дхм(г) МО
Ограничиваясь пока, как указано выше, рассмотрением функции Q, вос-
пользуемся уравнением (П.21). На основании теоремы Пеано [3.25] для
производных Э Yj (т)/да(г) = Y, (т) можно записать
d ~ . Э/М(хм,д, т) ~ £ Э2/м
dr Эхм(т)
где а (г) = а (т).
Матрицу Э[ЭС'(т)/Эхм(т)] lba(t) представим в виде
Э
За (г) [ Эхм(т)
где матрица вторых частных производных функции Q по компонентам
хм (7) вычисляется непосредственно дифференцированием заданной функ-
ции Q, а матрица Эхм(т)/Эс(г) = Х(т) в силу третьего уравнения (П.16)
удовлетворяет уравнению
d Vf ' _ Э/м(^м. а, 7) Э/м(хм, а, 7)
—X (т) =-------------X (т) +------------
dr Ьхы(т) ba(t)
с нулевым начальным условием.
Объединяя (П.26)—(ПЗО), получаем совокупность уравнений и соот-
ношений, позволяющую вычислить матрицу частных производных
ЭП(г)/Эа(г):
ЭП(г) =
Эа(О
У,(т)+ S ---------------,,,,
/ = 1 Эхм/(т)Эд(г)
(П.28)
ЭС'(т)
э2С(т)
Эхм(7)
Эхм(т) Эхм(т) Эа(г)
(П.29)
(П.30)
Эр,(О
Эа(О
Э<Р,(О .. . Эр, (г)
Р,(О + <Р, (7)—- ,
da(OJ
Э6'(7) А
------dr,
Эхм(т)
Э2 Чад('к)
п
S
= 1 1 За(г)
। ЭКзад(гк)
Эхм(гк)
К
Э^зад^к) р
Э*мОк)
, ад) +
Эхм(гк)Эхм(гк) J
'к Г Э<2(т) Э2О(Т)
+ / hr^w+y^) -—— ад л,
г L Эхм(г) Эхм(т)Эхм(г)
d АЛ
— Хм(г) = /м(хм. а, т). хм(0 = х(г),
dr
(ПЛЗ)
d Э/м(хм. а. г)
У (г) = -^7 У(7). У(Г) =
dr Эхм(т)
15.В.Н. Буков
217
d - dfM ~ n
TW=-^-i;(7)+ 2
dr bxM i=i
Y
dxMjba
TO = O,
d
— Дт) =
dr
¥m(0 v, 4 , C(H
X (r) +
Эхм(т)-------Эа(г)
x(O=o.
Здесь У/ — столбцы матрицы У; У/, — элементы матрицы У; У,- — прямо-
угольные матрицы размера л X г производных столбцов У, по компонен-
там вектора параметров а (общее количество таких матриц составляет и).
Часть входящих в (П.31) формул и соотношений повторяет формулы
и соотношения, приведенные в (П.25).
Приложение Ш
АЭРОДИНАМИЧЕСКИЕ ХАРАКТЕРИСТИКИ
ГИПОТЕТИЧЕСКОГО САМОЛЕТА
а» град Аэродинамические коэффициенты ЛА в связанной системе координат
Су 6р,в Су , град"* сх с6Р-в, X град" ’ wz(5p.B= 0) т6Р», Z град"1 з
0 0 0,016 0,04 -0,008 -0,015 -0,009 -2,0
5 0,26 0,015 0,02 -0,007 -0,065 -0,009 -2,0
10 0,52 0,016 0,00 -0,006 -0,11 -0,009 -2,0
15 0,80 0,015 0,00 -0,006 -0,16 -0,009 -2,0
20 1,05 0,014 -0,02 -0,005 -0,17 -0,009 -2,0
25 1,25 0,013 -0,02 -0,0045 -0,18 -0,009 —2,0
30 1,46 0,011 -0,02 -0,004 -0,20 -0,008 -2,0
35 1,65 0,011 -0,04 -0,004 -0,23 -0,007 -2,0
40 1,70 0,010 -0,04 -0,004 -0,26 -0,005 -2,0
а, град <Р, г град-1 с5Рв , 2 * град"’ 0 т . X град"1 X град"1 mSP-H . X град"* 9 *хЕ|
0 -0,013 —0,002 -0,0005 -0,0025 -0,00024 -0,72
5 -0,013 -0,002 -0,0018 -0,0024 -0,00025 -0,55
10 -0,013 -0,002 -0,0025 -0,0021 -0,00026 -0,26
15 -0,013 -0,002 -0,0019 -0,0012 -0,00026 -0,10
20 -0,012 -0,002 -0,0011 -0,0004 -0,00025 -0,11
25 -0,009 -0,002 -0,0005 -0,00017 -0,00019 -0,09
30 -0,004 -0,0019 0,0004 -0,00016 —0,00007 -0,10
35 -0,006 -0,0017 0,0009 -0,00015 -0,00004 -0,30
40 -0,014 -0,0015 0,0006 -0,00014 -0,00006 -0,50
ft» град 9 \?1 пР, у 1 град" 6Э "j* ’ , град" твР-н, У град „Му т j' У т х У
0 -0,75 -0,0031 0,001 -0,00146 -0,9 0
5 -0,15 -0,0031 0,00085 -0,00143 -0,92 0,02
10 -0,20 -0,0029 0,00045 -0,0014 -0,94 0,05
15 -0,30 -0,0022 0,0001 -0,0014 -0,98 0,09
20 -0,37 0,0026 -0,0008 -0,0013 -1,00 0,10
25 -0,45 0,0045 —0,002 -0,0012 -1,1 0,07
30 -0,5 0,005 -0,0025 -0,001 -0,95 0,02
35 -0,6 0,0035 -0,003 -0,0004 -0,75 -0,06
40 -0,7 0,0025 -0,0035 -0,0003 -0,5 -0,09
15
219
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ
F — главный вектор сил М
G — сила тяжести Re
Н — высота а
L -момент количества движения у
М — главный вектор моментов -А Ф
Р - сила тяги; матрица ковариаций (У
R - аэродинамическая сила; мат- рица интенсивности белого 0
шума 7 £
S - характерная площадь и
Т — постоянная времени; длитель- ность интервала оптимизации 6
V — скорость ЛА; функция Ляпу- нова е
W — скорость ветра д
а — вектор параметров р
п - перегрузка т
Я — скоростной напор
X — вектор состояния
- число Маха
- число Рейнольдса
- вектор оценок параметров
— вектор оценок состояния
- угол пути
- угол атаки
- угол скольжения
— угол крена
- вектор положения рулевых
органов
- эксплуатационная область
- угол наклона траектории; мат-
рица вторых моментов
— обратное время; угол тангажа
- плотность
— ускоренное время
— угол рыскания
Индексы нижние
а — аэродинамическое ОПТ - оптимальное
апр - априорное п - пилотажный
бал — балансировочный пр — программное
бок - боковое прод — продольное
в — возмущение П.0 — продольное оперение
выч - вычисленное р — релейное
ГР — граничное реал - реальное
Д — датчик per — регулирование
да - двигатель рл - руль высоты
ДОП - допустимое р.н - руль направления
3 - закрылок РУ - ручка управления двигателем
зад - заданное • с — скоростная
ИНТ — интегрирование св - связанная
к - конечное сеч — сечение
кач — качество ср — срабатывание
контр - контрольный т — траекторная
м — модель т.щ — тормозной щиток
н - нормальная ф — фиксированное
ном — номинальное ц - цель; цикл
огр - ограничение ш - штраф
оп - опорное
Индексы верхние
гир — гироскопический Я — летчик
д - дискретное ПК - пилотажный комплекс
доп — дополнительное
220
АББРЕВИАТУРЫ
АдОСУ - адаптивная оптимальная сис- тема управления
АКОР — аналитическое конструирова- ние оптимальных регуляторов
АПС — адаптивная прогнозирующая система
БЦВС — бортовая цифровая вычисли-
тельная система
ВПП — взлетно-посадочная полоса
ЛА — летательный аппарат
мнк — метод наименьших квадратов
ПК — пилотажный комплекс
ПрНК - прицельно-навигационнный комплекс
САПР — система автоматизированного проектирования
САУ — система автоматического уп- равления
СК - система координат
СУУ - система улучшения устойчи- вости и управляемости
СПИСОК ЛИТЕРАТУРЫ
К главе 1
1.1. Аэродинамика и динамика полета неманевренных самолетов. — М.: Воениздат,
1983.
1.2. Бюшгенс Г.С., Студнев Р.В. Аэродинамика самолета. Динамика продольного
и бокового движения. - М.: Машиностроение, 1979.
1.3. Гуськов ЮЛ., Загайнов Г.И. Управление.полетом самолетов. — М.: Машино-
строение, 1980.
1.4. Развитие авиационной науки и техники в СССР: Историко-технические очерки. —
М.: Наука, 1980.
1.5. Красовский АА. Системы автоматического управления полетом и их аналити-
ческое конструирование. - М.: Наука, 1973.
1.6. Активные системы управления самолетов (по материалам иностранной печати
за 1964-1974 гг.). Ч. I: Обзор. - ОНТИ ЦАГИ, 1975. - № 479.
1.7. Техника активного управления в авиации//Техническая информация. — ОНТИ
ЦАГИ, 1980. -№ 21 - 22.
1.8. Бородин В.Т., Рыльский Г.И. Пилотажные комплексы и системы управления
самолетов и вертолетов. - М.: Машиностроение, 1978.
1.9. Буков ВЛ., Красовский А А. Развитие адаптивных систем управления поле-
том//Вопросы кибернетики. Проблемы создания и применения математичес-
ких моделей в авиации. - М.: Научный совет АН СССР по комплексной про-
блеме ’’кибернетика”, 1983.
1.10. Белоцерковский С.М., Кочетков ЮА., Красовский АА., Новицкий В.В. веде-
ние в аэроавтоупругость. - М.: Наука, 1980.
1.11. Федосов Е.А., Белоусов ЮА. Основные проблемы применения бортовых цифро-
вых вычислительных машин для управления движущимися объектами // Вопро-
сы кибернетики. Проблемы авиационной и космической кибернетики (интег-
рированные системы активного управления). - М.: Научный совет АН СССР
по комплексной проблеме ’’Кибернетика”, 1981.
1.12. Драгунова ВЛ. Вопросы построения цифрового вычислительного комплекса
на базе микропроцессорных структур//Вопросы кибернетики. Проблемы авиа-
ционной и космической кибернетики. - М.: Научный совет АН СССР по комп-
лексной проблеме "Кибернетика”, 1981.
1.13. Прангишвили И.В. Микропроцессоры в системах управления//Вопросы кибер-
нетики. Вычислительные машины и системы с перестраиваемой структурой. -
М.: Научный совет АН СССР по комплексной проблеме ’’Кибернетика”, 1978.
1.14. Уколов И.С., Васильев ВА. Вопросы построения интегрированных систем
активного управления летательных аппаратов // Вопросы кибернетики. Пробле-
мы авиационной и космической кибернетики. - М.: Научный совет АН СССР
по комплексной проблеме "Кибернетика”, 1981.
1.15. Интегрированное управление полетом самолета и двигательной установкой//
Экспресс-информация ВИНИТИ, серия "Авиастроение”. — 1983. — № 44.
1.16. Динамические характеристики интегрированной системы управления полетом
и оружием//Экспресс-информация ВИНИТИ, серия ’’Авиастроение”. —
1984. - № 4.
1.17. Буков В.Н., Красовский АА. Иерархическая оптимизация управления поле-
том//Вопросы кибернетики. Проблемы авиационной и космической киберне-
тики (управляющие вычислительные системы движущихся объектов). — М.:
Научный совет АН СССР по комплексной программе ’’Кибернетика”, 1986-
222
1.18. Уколов И.С., Языков В.Г. Принцип избыточности в проблеме разработки
ИСАУ ЛА // Вопросы кибернетики. Интегрированные системы автоматического
управления летательных аппаратов. - М.: Научный совет АН СССР по комплекс-
ной проблеме ’’Кибернетика”, 1982.
1.19. Приспосабливающиеся автоматические системы. - М.: Изд-во иностранной ли-
тературы, 1963.
1.20. Красовский АЛ. Динамика непрерывных самонастраивающихся систем. -
М.: Физматгиз, 1963.
1.21. Цыпкин Я.З. Адаптация и обучение в автоматических системах. - М.: Наука,
1968-
1.22. Саридис Дж. Самоорганизующиеся стохастические системы управления. -
М.: Наука, 1980.
1.23. Петров Б.Н., Рутковский В.Ю., Крутова И.Н., Земляков СД. Принципы построе-
ния и проектирования самонастраивающихся систем управления. — М.: Маши-
ностроение, 1972.
1.24. Адаптивное управление с идентификацией. — Томск: Изд-во Том. ун-та, 1963.
1.25. Ядыкин И.Б. Оптимальное адаптивное управление на основе беспоисковой
самонастраивающейся системы с обучаемой эталонной моделью//Автоматика
и телемеханика. - 1979. - № 2.
1.26. Фомин BJL, Фрадков А.Л., Якубович ВЛ. Адаптивное управление динамичес-
кими объектами. — М.: Наука, 1981.
1.27. Петров А.И. Статистический синтез адаптивных систем терминального управле-
ния с эталонной моделью // Докл. АН СССР. - 1978. - т. 242, № 2.
1.28. Николаев ЮЛ., Теряев ЕД., Уколов И.С., Шамриков Б.М. Построение адаптив-
ных цифровых систем управления многорежимных летательных аппара-
тов//Вопросы кибернетики. Проблемы авиационной и космической кибер-
нетики (адаптивные системы управления летательных аппаратов с ЦВМ). -
М.: Научный совет АН СССР по комплексной проблеме "Кибернетика”,
1974.
1.29. Адаптивная система управления самолета типа F-8 с идентификацией парамет-
ров по принципу ’’скользящего окна”//Экспресс-информация ВИНИТИ, се-
рия ’’Системы автоматического управления”. — 1978. - № 37.
1.30. Законы адаптивного управления для летных испытаний самолета F-8 //Экс-
пресс-информация ВИНИТИ, серия ’’Системы автоматического управления”. —
1978. - № 29.
1.31. Разработка цифровой адаптивной системы управления полетом перспективно-
го самолета//Экспресс-информация ВИНИТИ, серия ’’Авиастроение”. —
1984. — № 4.
1.32. Системы управления самолета F-8C//Экспресс-информация ВИНИТИ, серия
’’Авиастроение”. - 1979.' - № 32.
1.33. Стохастическое управление самолетом F-8 по методу многомерной адаптивной
модели. Ч. I. Установившийся полет//Экспресс-информация ВИНИТИ, серия
’’Системы автоматического управления”. — 1978. - № 32.
1.34. Цифровая адаптивная система управления полетом, использующая устойчивые
одношаговые алгоритмы//Экспресс-информация ВИНИТИ, серия ’’Системы
автоматического управления”. - 1978. - № 34.
1.35. Теряев ЕД. Об адаптивных цифровых системах управления самолетами//Воп-
росы кибернетики. Проблемы авиационной и космической кибернетики. - М.:
Научный совет АН СССР по комплексной проблеме ’’Кибернетика”, 1981.
1-36. Козлов М.С., Федоренко Г.И. Динамика самонастраивающейся системы управ-
ления полетом, сохраняющей заданный запас устойчивости //Самонастраиваю-
щиеся системы. — М.: Наука, 1965.
1.37. NylandF. A self-adaptive control system for a large elastic missile//Ballistic Missile
and -Space Technology. Proceedings of the Fifth Symposium. New York — London,
1960.
1.38. Красовский АЛ. Системы автоматического управления полетом пилотируемых
летательных аппаратов. — М.: ВВИА им. Н.Е. Жуковского, 1971.
1.39. Системы с переменной структурой и их применение в задачах автоматизации
полета. - М.: Наука, 1968.
223
1.40. Красовский А А. Синтез самонастраивающихся систем автоматического регу-
лирования с дискретными корректирующими устройствами//Теория и при-
менение дискретных автоматических систем. - М.: Изд-во АН СССР, 1960.
1.41. Kalman R.E. Design of a self-optimizing control system//Trans. ASME, 1958.
1.42. Ли P. Оптимальные оценки, определение характеристик и управление. - М.:
Наука, 1966.
1.43. Красовский АА., Буков В.Н., Шендрик В.С. Универсальные алгоритмы опти-
мального управления непрерывными процессами. — М.: Наука, 1977.
1.44. Белоцерковский С.М. О роли и месте численных методов в аэродинамике//
Применение ЭВМ для исследования аэродинамических характеристик летатель-
ных аппаратов: Труды ВВИА им. Н.Е. Жуковского. - 1979. - выл. 1309.
1.45. Фелъдбаум АА. Основы теории оптимальных автоматических систем. - М.:
Физматгиз, 1963.
1.46. Nikiforuk P.N., Ohta Н., Gupta М.М. Design a two-level adaptive controller foi appli-
cation to (light control system//AIAA Guid. and Contr. Conf. Hollywood, 1977;
Collect. Techn. Pap., 1977.
1.47. Авиационные приборы и навигационные системы. - М.: ВВИА им. Н.Е. Жуковс-
кого, 1981.
1.48. Красовский А А., Лебедев А.В., Невструев В.В. Теоретические основы пилотаж-
но-навигационных комплексов. - М.: ВВИА им. Н.Е. Жуковского, 1981.
1.49. Кулифеев Ю.Б. Идентификация датчиков//Исследование авиационной техники
с помощью ЭВМ: Труды ВВИА им. Н.Е. Жуковского. - 1981. — вып. 1310.
1.50. Эйкхофф П. Основы идентификации систем управления. - М.: Мир, 1975-
К главе 2
2.1. Буков В.Н. Системы автоматического управления летательных аппаратов, их
исследования и испытания. Ч. I: Материалы лекций. - М.: ВВИА им. Н.Е. Жу-
ковского, 1983.
2.2. ГОСТ 20058-80. Динамика летательных аппаратов в атмосфере: Термины, опре-
деления и обозначения. - М.: Изд-во стандартов, 1981.
2.3. Остославский И.В., Стражева И.В. Динамика полета. Траектории летательных
аппаратов. - М.: Машиностроение, 1969.
2.4. Кирсанов А.П„ Харьков В.П. Упрощенная математическая модель силовой уста-
новки//Исследования по аэроавтоупругости: Труды ВВИА им. Н.Е. Жуковско-
го. - 1978. - вып. 1308.
2.5. Яворский Б.М., Детлаф АА. Справочник по физике. - 2-е изд. - М.: Наука,
1985.
2.6. Бюшгенс Г.С., Студнев Р.В. Динамика самолета. Пространственное движение. -
М.: Машиностроение, 1983. '
2.7. Краснов Н.Ф., Кошевой В.Н. Управление и стабилизация в аэродинамике. -
М.: Высшая школа, 1978.
2.8. Ганиев Ф.И. Метод расчета продольных, боковых и перекрестных аэродинами-
ческих производных летательного аппарата на дозвуковых скоростях//Изв.
АН СССР. Механика жидкости и газа. - 1978. - № 2.
2.9. Апаринов ВА., Дегтярев Н.М., Ковалев Е.Д., Ништ М.И. Расчет нелинейных
аэродинамических характеристик схематизированных компоновок ЛА//Приме-
нение ЭВМ для исследования аэродинамических характеристик- летательных
аппаратов: Труды ВВИА им. Н.Е. Жуковского. - 1979. — вып. 1309.
2.10. Создание и применение математических моделей самолетов. - М.: Наука, 1984.
2.11. Вавилов Ю.А., Андриевский ЮА. Алгоритмическое обеспечение системы иден-
тификации в адаптивной системе автоматического управления//'Научно-мето-
дические материалы по проектированию систем управления летательных аппа-
ратов. - М.: ВВИА им. Н.Е. Жуковского, 1983.
2.12. Идентификация аэродинамических характеристик самолета на больших углах
атаки и скольжения методом априорных оценок//Экспресс-информация
ВИНИТИ, серия ’’Авиастроение”, j 1979. - № 6.
2.13. Буков В.Н. К моделированию самолета в задачах аналитического конструиро-
вания средств предотвращения сваливания//Исследования по азроавтоупру-
гости: Труды ВВИА им. Н.Е. Жуковского. -- 1974. - вып. 1304.
224
2-14. Козлов В.И. Системы автоматического управления летательными аппарата-
ми. - М.: Машиностроение, 1979.
2.15. Кастерский С.М. Математические модели электрогидравлических приводов
самолетных рулей//Исследования по аэроавтоупругости: Труды ВВИА
им. Н.Е. Жуковского. - 1978. - вып. 1308.
2.16. Кастерский С.М. Исследование математической модели системы "электрогид-
равлический сервопривод - гидромеханический рулевой привод - руль” // Науч-
но-методические материалы по управлению, оцениванию и идентификации са-
молета и его оборудования. - М.: ВВИА им. Н.Е. Жуковского, 1983.
2.17. Пастухов С А. Математическое описание пневматического сервомеханизма//Си-
стемы с переменной структурой и их применение в задачах автоматизации поле-
та. — М.: Наука, 1968.
К главе 3
3.1. Летов А.М. Динамика полета и управление. - М.: Наука, 1969.
3.2. Воронов А.А. Основы теории автоматического управления. Ч. I. Линейные систе-
мы регулирования одной величины. - М.; Л.: Энергия, 1965. '
3.3. Нормы летиой годности гражданских самолетов СССР. - М.: Межведомствен-
ная комиссия по нормам летной годности гражданских самолетов и вертоле-
тов СССР, 1974.
3.4. Колман Р., Фалб П., Арбиб М. Очерки по математической теории систем. - М.:
Мир, 1971.
3.5. Кочетков Ю.А. Об оптимальном управлении детерминированными система-
ми // Изв. АН СССР. Техническая кибернетика. - 1976. -I'M.
3.6. Миркин Б.М., Цой М.С. Об одном классе алгоритмов управления линейными
динамическими системами // Адаптация в автоматизированных системах управ-
ления производством. - Фрунзе: Илим, 1982.
3.7. Миркин Б.М., Цой М.С. Синтез управлений с нелинейной обратной связью для
класса дискретных инерционных вероятностных систем//Синтез и применение
алгоритмов обработки информации и управления при различных типах неопре-
деленности. -Фрунзе: Илим, 1983.
3.8. Летов А.М. Аналитическое конструирование регуляторов. Ч. I - V// Автомати-
ка и телемеханика. - 1960. - №4,5,6; 1961. - №4; 1962. - № 11.
3.9. Красовский А.А. Обобщение задачи аналитического конструирования регулято-
ров при заданной работе управлений и управляющих сигналов // Автоматика и
телемеханика. - 1969. - № 7.
3.10. Казаков И.Е. Статистическая теория систем управления в пространстве состоя-
ний. - М.: Наука, 1975.
3.11. Александров А.Г. Свойства аналитически сконструированных линейных систем
// Автоматика и телемеханика. - 1975. - № 10.
3.12. Буков В.Н., Красовский А.А. Операционный алгоритм оптимального управле-
ния // Автоматика и телемеханика. - 1974. - № 10.
3.13. Кочетков Ю.А. О выборе алгоритма управляющей ЦВМ // Научно-методические
материалы по прикладной теории управления, оценивания и идентификации. -
М.: ВВИА им. Н.Е. Жуковского, 1985.
3.14. Острем К. Введение в стохастическую теорию управления. - М.: Мир, 1973.
3.15. Шендрик В.С. Синтез оптимальных управлений методами прогнозирующей моде-
ли // Докл. АН СССР. - 1975. - Т. 224, № 3.
3.16. Ziebolz Н., Poynter Н.М. Possibilities of a two-time scale computing system from cont-
rol and simulation of dynamic systems // Proc, of the National Electron. Conf. -
1954. - V.9.
3.17. Федосеев A.C. Алгоритм оптимального управления с обобщенной прогнозирую-
щей моделью // Автоматика и телемеханика. - 1977. - № 7.
3.18. Красовский А.А., ШендрикВ.С. Универсальный алгоритм оптимального управле-
ния непрерывными процессами // Автоматика и телемеханика. - 1977. - № 2.
3.19. Буков В.Н. Синтез управляющих сигналов с помощью прогнозирующей модели
в адаптивной системе управления // Проблемы управления и теории информа-
ции. - 1980. - Т.9, №5.
225
3.20. Буков В.И. Оптимальные алгоритмы в задачах с ограничениями управляемых
координат Ц Изв. АН СССР. Техническая кибернетика. - 1982. - № 2.
3.21. Буков В.Н. Статические свойства динамических систем, управляемых регулято-
рами с прогнозирующей моделью // Автоматика и телемеханика. — 1982. - №8.
3.22. Кубинцев Г.М., Цатурян К.Т. Итеративный синтез управления при помощи
прогнозирующих устройств // Автоматика и телемеханика. - 1981. - № 8.
3.23. Гулько Ф.Б., Новосельцева ЖЛ. Система управления с прогнозированием // Из-
мерения, контроль, автоматизация. - 1976. - Вып. I, № 5.
3.24. Ивахненко А.Г. Долгосрочное прогнозирование и управление сложными систе-
мами. - Киев: Техника, 1975.
3.25. Хартман Ф. Обыкновенные дифференциальные уравнения. - М.: Мир, 1970.
3.26. Самарский АЛ. Введение в теорию разностных схем. - М.: Наука, 1971.
3.27. Кочетков ЮЛ. Оптимальное управление детерминированными автоматическими
системами в случае неквадратичного терминального функционала // Автоматика
и телемеханика. - 1977. - № 10.
3.28. Бабич ОЛ. О применении метода характеристик в задачах оптимального управ-
ления детерминированными сисл мами // Научно-методические материалы по
автоматическим авиационным системам и математическому обеспечению ЭВМ,-
М.: ВВИА им. Н.Е. Жуковского, 1979.
3.29. Красовский АЛ. Декомпозиция и синтез субоптимальных адаптивных систем //
Изв. АН СССР. Техническая кибернетика. - 1984. - № 2.
3.30. Миркин Б.М. Адаптация целевой функции в задачах управления для инерцион-
ных систем с запаздыванием // Адаптация в системах управления технологи-
ческими процессами и производством. — Фрунзе: Илим, 1984.
3.31. Буков В.Н., Солодников И.Б. Применение алгоритма с прогнозированием при
управлении технологическими процессами с запаздыванием // Изв. АН СССР.
Техническая кибернетика. - 1984. - № 6.
3.32. Качанов Б.О., Кочетков Ю.А. Оптимальное гибридное управление непрерывны-
ми стохастическими системами // Изв. АН СССР. Техническая кибернетика. -
1984.-№ 6.
3.33. Миркин EJM., Шшилякова ВЛ. Оптимизация гибридных дискретно-непрерыв-
ных динамических систем по критерию обобщенной работы // Адаптивное
управление большими системами. — Фрунзе: Илим, 1981.
3.34. Хромов А.Г. Асимптотический метод аналитического конструирования // Изв.
АН СССР. Техническая кибернетика. - 1984. - №4.
К главе 4
4.1. Гантмахер Ф.Р. Теория матриц. - М.: Наука, 1967.
4.2. Линник Ю.В. Метод наименьших квадратов и основы математико-статистичес-
кой теории обработки наблюдений. - М.: Физматгиз, 1962.
4.3. Красовский А.А. Статистическая теория переходных процессов в системах
управления. - м.: Наука, 1968.
4.4. Сейдж Э„ Меле Дж. Теория оценивания и ее применение в связи и управлении.—
М.: Связь, 1976.
4.5. Пугачев В.С., Казаков И.Е., Евланов Л.Г. Основы статистической теории авто-
матических систем. - М.: Машиностроение, 1974.
К главе 5
5.1. Месарович М„ Мако Д., Такахара И. Теория иерархических многоуровневых
систем. - М.: Мир. 1973.
5.2. Динамическая многоуровневая оптимизация в классе нелинейных систем //
Экспресс-информация ВИНИТИ, серия ’’Системы автоматического управле-
ния”. - 1980. - N* 32.
5.3. Автоматизация управления перспективных истребителей (по материалам откры-
той иностранной печати): Обзор. - ОНТИ ЦАГИ, 1984. - № 641.
5.4. Фрадков АЛ. Разделение движений в адаптивных системах управления // Вопро-
сы кибернетики. Проблемы теории и практики адаптивного управления. - М.:
Научный совет АН СССР до комплексной проблеме ’’Кибернетика”, 1984.
226
5.5. Давыдов С.К., Шпнько СЛ. Синтез и исследование двухуровневых алгоритмов
оптимального управления объектом в режиме огибания рельефа местности //
Научно-методические материалы по исследованию аномальных геофизических
полей. - М.: ВВИА им. Жуковского, 1984.
5.6. Шаклеин Т.Л. Антропоцентрический подход к формированию критериев устой-
чивости и управляемости самолетов // Научно-методические материалы по проек-
тированию систем управления летательных аппаратов. - М.: ВВИА им. Н.Е. Жу-
ковского, 1983.
5.7. Радченко МЛ., Савельев ВЛ. Чувствовать самолет // Авиация и космонавтика.-
1978.-№4.
5.8. Кирсанов А.П., Харьков В.П. Упрошенная математическая модель силовой
установки//Исследования по аэроавтоупругости: Труды ВВИА им. Н.Е. Жуков-
ского. - 1978. - Вып. 1308.
5.9. Авруцкий ГЛ., Буков ВЛ., Гросс В.К., Чудинова В.Г. Применение алгоритма с
прогнозированием для системы управления с неидеальным интегрирующим
приводом // Автоматика и телемеханика. - 1983. - № 10.
5.10. РудисВ.И. Полуавтоматическое управление самолетом. — М.: Машиносторение,
1978.
К главе 6
6.1. Чудинова В.Г. Моделирование системы управления полетом с прогнозированием
// Научно-методические материалы по проектированию систем пилотажно-нави-
гационных комплексов. — М.: ВВИА им Н.Е. Жуковского, 1981.
6.2. Бл эй клок ДжЛ. Автоматическое управление самолетами и ракетами. - М.:
Машиностроение, 1969.
6.3. Проектирование многорежимной системы управления самолета AFTI/F-16 //
Экспресс-информация ВИНИТИ, серия ’’Авиастроение”. - 1982. - № 40.
6.4. Чудинова В.Г. Влияние точности настройки динамических параметров прогно-
зирующей модели на качество управления продольным движение летательного
аппарата // Научно-методические материалы по проектированию систем управле-
ния летательных аппаратов. — М.: ВВИА им. Н.Е. Жуковского, 1983.
6.5. ВентцельЕ.С. Теория вероятностей. — М.: Наука, 1963.
6,6. Цигин ЮЛ. Синтез алгоритмов оптимального управления полетом маневренного
самолета // Научно-методические материалы по проектированию систем управ-
ления летательных аппаратов. - М.: ВВИА им. Н.Е. Жуковского, 1963-
6.7. Cooper G.E., Harper R.P. The use of pilot rating in the evaluation of aircraft handling
qualities// NASA. JN-D-5153.1969, April.
6.8. Акимов A.H., Биш В.Н. Обеспечение поперечной управляемости на больших
углах атаки с использованием алгоритма с прогнозирующей моделью // Научно-
методические материалы по обеспечению безопасности полетов. - М.: ВВИА
им. Н.Е. Жуковского, 1986.
6.9. Кириллов А.Ю., Оневский П.М. Способ повышения достоверности результатов
прогнозирования в алгоритмах, построенных по критерию обобщенной работы
// Научно-методические материалы по интегрированным бортовым комплек-
сам. - М.: ВВИА им. Н.Е. Жуковского, 1986.
К главе 7
7.1. Красовский А.А., Белоглазов ИЛ., Чигин Г.П. Теория корреляционно-экстре-
мальных навигационных систем. - М.; Наука, 1979.
7.2. Фильтрация и стохастическое управление в динамических системах. - М.: Мир.
1980.
7.3. Кулифеев Ю.Б. Определение постоянных составляющих ошибок датчиков пило-
тажной информации// Научно-методические материалы по измерителям, матема-
тическим моделям и алгоритмам пилотажно-навигационных систем. - М.: ВВИА
им. Н.Е. Жуковского, 1978.
7.4. Васильев В .А., Парамонов ВЛ. Рекуррентный алгоритм второго порядка для
оценивания состояния и параметров летательного аппарата // Вопросы киберне-
тики. Проблемы авиационной и космической кибернетики. - М.: Научный совет
АН СССР по комплексной проблеме ’’Кибернетика”, 1981.
227
IS. Красовский АА. Субоптимальный алгоритм оценивания и идентификации нели-
нейных процессов // Докл. АН СССР. - 1976. - Т. 231, № 4.
7.6. Denery D.G. An identification algorithm trat is insensitive to initial parameter estima-
tes// AIAA Journal. - 1971. - №3.
7.7. Ядыкин И.Б.. Данилин А.Б., Прибытков A.B., Серегин В.Н. Синтез нелинейных
законов адаптивной идентификации // Вопросы кибернетики. Задачи и методы
адаптивного управления. - М.: Научный совет АН СССР по комплексной пробле-
ме ’’Кибернетика”, 1981.
7.8. Carlson N.A. Fast triangular formulation of the square root filter // AIAA Journal. -
1973. - №9.
7.9. Буков B.H. Идентификация динамических объектов с использованием матрич-
ных квадратных корней // Автоматика и телемеханика. - 1971. — № 8.
7.10. Аоки М. Оптимизация стохастических систем. - М.: Наука, 1971.
7.11. Гроп Д. Методы идентификации систем. - М.: Мир, 1979.
7.12. Буков В.Н., Цигин Ю.П. Исследование влияния ошибок идентификации на ка-
чество управления адаптивного регулятора методом факторного планирования
// Научно-методические материалы по интегрированным бортовым комплек-
сам. — М.: ВВИА им. Н.Е. Жуковского, 1986.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Автомат ограничения 145
Автоматизация ограничений 179
Адаптация 9
— непараметрическая 14
— параметрическая 13
- поисковая 14
Алгоритм модифицированный 69
— с аналитическим решением 70
— с матрицей чувствительности 69
— с синхронным детектированием
68
— с физической моделью 68
— с численным дифференцирова-
нием 68
Алгоритмы с прогнозированием 68
Взаимодействие кинематическое 43
Возмущения случайные 96
Время ускоренное 68
Выдерживание ограничений 179
Высота полета геометрическая 26,
185
Гипотеза квазистационарности 23
Датчик 53
- аэрометрический 16
Движение длиннопериодическое 51
— короткопериодическое 51
— опорное 46
— продольное 163
- пространственное 167
Декомпозиция 104
Длительность цикла оценивания 23
Задача нетерминальная 58
— терминальная 57
Звено инерционное 54
Идентификация текущая 202
Интеграл Ито 65
Качество движения 88
Квазистационарность характерис-
тик 23
Квантование по времени 79
--в конце 80
--в начале 80
Кватернионы 34
Комплекс бортовой интегрирован-
ный 12
Конструирование аналитическое 60
Критерии оптимальности 56
Критерий обобщенный 63
Матрица перехода 27
— Якоби 70
Метод асимптотический 81
— Коши 67
— курсовой 130
— характеристик 67
— Якоби 67
Методы беспоисковые 14
— поисковые 14
Модель движения линейная 45
--математическая 24
— объекта 24
- прогнозирующая 115
— эталонная 113
Напор скоростной 9
Область эксплуатационная 58
Объект 24
Ограничения пилотажные 58
Оптимизация локальная 128
Органы рулевые 24
Ось боковая 28
— нормальная 26
229
Ось подъемной силы 28
— поперечная 26
— продольная 26
— скоростная 28
Ошибки идентификации 93
Параметры Родрига — Гамильто-
на 34
Перегрузка 31
Плотность воздуха 31
Подъем самолета 190
Помехи 96
Правило Ито 65
Привод 53
Программа оптимизируемая 134
Процессы непрерывные 77
Псевдоуправление 109
Работа обобщенная 63
Разгон самолета 190
Регулятор оптимальный 56
Редакции алгоритмов 68
Решение общее 84
Свойства движения статистические
96
--статические 91
Сечение контрольное 141
Синтез управления совмещенный 21
Система координат нормальная 26
-----земная 25
--связанная 26
--скоростная 28
--траекторная 28
Система прогнозирующая адаптив-
ная 64
— управления адаптивная 13
-----оптимальная 15
Состояние модели балансировочное
90
Теорема Пеано 69
— разделения 194
— статистической эквивалентное^
194
Теория Гамильтона — Якоби 62
Точность управления статическая
91
Трудоемкость алгоритмов 76
Углы Эйлера 27
Угол атаки 28
— крена 27
— наклона траектории 28
— пути 28
— рыскания 27
— скольжения 28
— тангажа 27
Управление автономное 19
— адаптивное 193
— двухуровневое 185
— дискретное 77
— дуальное 15
— иерархическое 108
— непрерывное 113
— релейное 122
— траекторное 127
Управляемость поперечная 173
Уравнение Гамильтона — Якоби 62
— движения полное 51
Уровень пилотажный 113
Устойчивость самолета 184
Фильтр Кал мана 196
Функция ’’забывания” 23
— качества 115
— терминальная 115
Характеристики летно-технические
8
— пилотажные 8
Цикл оценивания 23
— формирования управления 22
Число Маха 9
— Рейнольдса 33
Член функционала терминальный
57
230
Валентин Николаевич Буков
АДАПТИВНЫЕ ПРОГНОЗИРУЮЩИЕ СИСТЕМЫ
УПРАВЛЕНИЯ ПОЛЕТОМ
Редактор Ю.Г. Гуревич
Художественный редактор Т.Н. Колъченко
Технические редакторы С.В. Геворкян, В.Н. Никитина
Корректор ТВ. Обод
Набор осуществлен в издательстве
на наборно-печатающих автоматах
ИБ № 12605
Сдаио в набор 07.07.86. Подписано к печати 21.11.86. Т — 19699
Формат 60 X 90 1/16. Бумага офсетная
Гарнитура Пресс-Роман. Печать офсетная
Усл.печ.л. 14,5. Усл.кр.-от1. 14,5. Уч.-изд. л. 16,23
Тираж 2650 экз. Тип. эак. 320 . Цена 2 р. 80 к.
Ордена Трудового Красного Знамени
издательство ’’Наука’’
Главная редакция физико-математической литературы
117071 Москва В-71, Ленинский проспект, 15
4-я типография издательства ’’Наука”
630077 г. Новосибирск-77, ул. Станиславского, 25