Текст
                    МАШИНОСТРОЕНИЕ
ЭНЦИКЛОПЕДИЯ
В СОРОКА ТОМАХ
РЕДАКЦИОННЫЙ СОВЕТ
ФРОЛОВ К.В.
Председатель редакционного совета
Члены совета:
Белянин П.Н. (зам. Председателя редсовета и главного
редактора), Колесников К.С. (зам. Председателя редсовета
и главного редактора), Адамов Е.О., Анфимов Н.А.,
Асташов В.К., Бессонов А.П., Васильев В.В.,
Воронин Г.П., Глебов И.А., Долбенко Е.Т.,
Жесткова И.Н., Кирпичников М.П., Клюев В.В.,
Ковалевский М.А., Коптев Ю.Н., Ксеневич И.П.,
Мартынов И.А., Михайлов В.Н., Новожилов Г.В.,
Носов В.Б., Образцов И.Ф., Огурцов А.П.,
Панин В.Е., Паничев Н.А., Патон Б.Е.,
Петриченко В.Н., Платонов В.Ф., Пугин Н.А.,
Салтыков Б.Г., |Свищев Г.П.1, Силаев И.С.,
Туполев А.А., Федосов Е.А., Фортов В.Е.,
Черный Г.Г., Шемякин Е.И.
МОСКВА “МАШИНОСТРОЕНИЕ” 2000

Раздел! ИНЖЕНЕРНЫЕ МЕТОДЫ РАСЧЕТОВ Том 1-4 АВТОМАТИЧЕСКОЕ УПРАВЛЕНИЕ. ТЕОРИЯ Редактор-составитель академик РАН Е.А. Федосов Ответственные редакторы: академик РАН К.С. Колесников, доктор техн, наук Г.Г. Себряков Редакторы тома: Ю.М. Астапов (Теория линейных систем автоматического управления), |Е.П. ПопоДсГеооия нелинейных систем автоматического управления), А.В. Семенов (Проблема Н°°-оптимизации в теории автоматического управления); ПД. Крутъко (Обратные задачи динамики в теории автоматического управления), И.Е. Казаков (Исследование систем автоматического управления при случайных воздействиях), АА. Красовский (Методы оптимизации систем автоматического управления), В.В. Володин (Управление процессами в организационно-технических системах автоматизированного проектирования), Г.Г. Себряков (Человеко- машинные системы управления), А.Г. Бутковский (Теория управления системами с распределенными параметрами) МОСКВА “МАШИНОСТРОЕНИЕ” 2000
УДК 621.01/.03 ББК 34.44 М38 pfCpr Издание осуществлено при поддержке Российского фонда фундаментальных JJ исследований по проекту № 99-01-14046 Авторы: Е.А. Федосов, А.А. Красовский, | ЕЛ. Попов |, Ю.М. Астапов, И.Н. Белоглазов, В.Н. Буков, А.Г. Бутковский, В.В. Володин, С.В. Емельянов, С.Ю. Желтов, С.Д. Земляков, И.Е. Казаков, С.К. Коровин, М.Н. Красильщиков, П.Д. Крутько, В.В. Малышев, В.С. Медведев, А.А. Огинский, В.Ю. Рутковский, Г.Г. Себряков, А.В. Семенов, А.А. Степанов, Н.В. Фалдин, А.С. Ющенко, И.Б. Ядыкин Рецензенты: | А.А. Воронов!, Н.К. Лисейцев, Н.М. Сотский, Е.Д. Теряев, АЛ. Фрадков, А.П. Чернышев Рабочая группа Редакционного совета: К.С. Колесников, П.Н. Белянин, В.В. Васильев, В.К. Асташов, А.П. Бессонов, Н.Н. Боброва, Е.Т. Долбенко, И.Н. Жесткова, Г.В. Москвитин Машиностроение. Энциклопедия / Ред. совет: К.В. Фролов (пред.) и др. - М.: М38 Машиностроение. Автоматическое управление. Теория. Т. 1-4 / Е.А. Федосов, А.А. Красовский, | Е.П. Попов | и др. Под общ. ред. Е.А. Федосова. 2000. 688 с., ил. Изложены теория линейных и нелинейных систем, систем с переменной структурой, управления и структуры дискретных систем, методы статистической динамики, оптимизации, включая синтез оптимальных управлений при случайных воздействиях, основы теории чувствительности, анализ и синтез человеко-машинных систем и систем с распределенными параметрами. Даны принципы построения, состав, структура и архитектура САПР, техническое обеспечение, методическое обеспечение, автоматизация различных стадий разработки технических объектов; нелинейные методы анализа и синтеза сложных систем управления, ориентированные на использование ЭВМ. Федосов Евгений Александрович, Красовский Александр Аркадьевич, | Попов Евгений Павлович | и др. МАШИНОСТРОЕНИЕ. ЭНЦИКЛОПЕДИЯ Том 1-4 АВТОМАТИЧЕСКОЕ УПРАВЛЕНИЕ. ТЕОРИЯ Лицензия ЛР № 080003 от 12.09.96 г. Редакторы Т.С. Грачева, С.М. Макеева Художественный редактор Т.Н. Галицына Оформление художника Т.Н. Погореловой Корректор Е.М. Нуждина Инженеры по компьютерному макетированию М.А. Евсейчикова, Т.А. Сынкова Сдано в набор 0 9.11.99 г. Бумага офсетная. Усл. печ. л. 55,90. Подписано в печать 20.04.00 г. Гарнитура Times ЕТ. Усл. кр.-отт. 55,90. Тираж 1000 экз. Заказ 1023. Формат 70x100/16. Печать офсетная. Уч.-изд. л. 62,57. Издательство "Машиностроение", 107076, Москва, Б-76, Стромынский пер., 4 Отпечатано в АООТ "Политех-4", 129110, Москва, ул. Б. Переяславская, 46 ISBN 5-217-02817-3 (Т. 1-4) ISBN 5-217-01949-2 © Издательство "Машиностроение", 2000
ОГЛАВЛЕНИЕ Введение....................... 14 Раздел 1. ТЕОРИЯ ЛИНЕЙНЫХ СИСТЕМ АВТОМАТИЧЕ- СКОГО УПРАВЛЕНИЯ........ 17 Глава 1.1. ВВЕДЕНИЕ» ОСНОВНЫЕ ТЕРМИНЫ (Ю. М. Астапов) ... 17 1.1.1. Примеры систем автома- тического управления в маши- ностроении .............. 17 1.1.2. Классификация элемен- тов автоматических систем по функциональному признаку. 19 1.1.3. Требования, предъявляе- мые к системам автоматиче- ского управления......... 20 Глава 1.2. МАТЕМАТИЧЕСКОЕ ОПИ- САНИЕ НЕПРЕРЫВНЫХ СИСТЕМ АВТОМАТИЧЕ- СКОГО УПРАВЛЕНИЯ (Ю. М. Астапов)................. 21 1.2.1. Структурные схемы. Про- хождение сигналов........ 21 1.2.2. Математическое описание элементов и объектов.... 22 1.2.3. Линеаризация характери- стик и уравнений......... 23 1.2.4. Установившееся движе- ние и переходный процесс ....... 24 1.2.5. Передаточные функции линейных систем.......... 27 1.2.6. Классификация элемен- тов автоматических систем по виду передаточных функций .... 29 1.2.7. Математическое описание линейной системы с помощью интеграла свертки........ 33 1.2.8. Передаточные функции двумерных следящих систем. Комплексные координаты.. 34 1.2.9. Математическое описание многомерных систем автомати- ческого управления....... 37 Глава 1.3. ЧАСТОТНЫЕ МЕТОДЫ АНАЛИЗА АВТОМАТИЧЕ- СКИХ СИСТЕМ (Ю. М. Аста- пов) ........................ 38 1.3.1. Логарифмические частот- ные характеристики....... 38 1.3.2. Логарифмические харак- теристики различных соедине- ний элементарных звеньев. 40 1.3.3. Логарифмические харак- теристики звеньев с комплекс- ными коэффициентами...... 42 Глава 1.4. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВ- НЫХ ДИНАМИЧЕСКИХ СИСТЕМ (Ю. М. Астапов).......... 43 1.4.1. Постановка задачи об ус- тойчивости. Определение ус- тойчивости .............. 43 1.4.2. Линейные системы с по- стоянной матрицей........ 44 1.4.3. Частотные критерии ус- тойчивости .............. 46 1.4.4. Выделение областей ус- тойчивости в пространстве па- раметров ................ 50 1.4.5. Устойчивость линейных систем с почти постоянными параметрами.............. 53 1.4.6. Обобщение частотного метода анализа устойчивости на многомерные системы автома- тического управления..... 59 Глава 1.5. КАЧЕСТВО ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО УП- РАВЛЕНИЯ (Ю. М. Астапов) 64 1.5.1. Качество воспроизведе- ния при плавных воздействиях 64 1.5.2. Методы вычисления пе- реходных процессов в линей- ных автоматических системах ... 68 1.5.3. Оценка качества переход- ного процесса по распределе- нию корней характеристиче- ского уравнения................ 75 1.5.4. Интегральные оценки ка- чества .................. 78 1.5.5. Общие рекомендации по проектированию многомерных систем автоматического управ- ления ................... 80 Глава 1.6. ЛИНЕЙНЫЕ ДИСКРЕТ- НЫЕ СИСТЕМЫ (А. С. Ющен- ко) ........................... 82 1.6.1. Классификация дискрет- ных систем............... 82
6 ОГЛАВЛЕНИЕ 1.6.2. Математические модели дискретных систем с одним импульсным элементом....... 84 1.6.3. Дискретные системы с несколькими импульсными элементами................. 92 1.6.4. Частотные характеристи- ки 94 1.6.5. Точность дискретных систем..................... 99 1.6.6. Условия устойчивости линейных дискретных систем ... 101 Глава 1.7. МЕТОДЫ ПРОСТРАНСТВА СОСТОЯНИЙ ДЛЯ ДИС- КРЕТНЫХ СИСТЕМ (А. С. Ющенко)................... 104 1.7.1. Уравнение состояния. 104 1.7.2. Свойства дискретных систем в пространстве состоя- ний 108 1.7.3. Непрерывно-дискретные системы................... 109 1.7.4. Устойчивость дискретных систем в пространстве состоя- ний 112 Глава 1.8. СИНТЕЗ КОРРЕКТИРУЮ- ЩИХ УСТРОЙСТВ ЛИНЕЙ- НЫХ АВТОМАТИЧЕСКИХ СИСТЕМ МЕТОДОМ ЛОГА- РИФМИЧЕСКИХ ЧАСТОТ- НЫХ ХАРАКТЕРИСТИК (В. С. Медведев)............... 113 1.8.1. Связь вида частотной ха- рактеристики с показателями качества системы........ 113 1.8.2. Типы корректирующих устройств............... 117 1.8.3. Порядок синтеза коррек- тирующих устройств в непре- рывной системе........... 119 1.8.4. Синтез дискретных авто- матических систем с помощью логарифмических частотных характеристик........... 122 Глава 1.9. МЕТОД СИНТЕЗА ЛИНЕЙ- НЫХ СИСТЕМ ПО ЗАДАН- НЫМ СОБСТВЕННЫМ ЗНА- ЧЕНИЯМ МАТРИЦЫ СИС- ТЕМЫ (В. С. Медведев)......... 130 1.9.1. Синтез закона управле- ния ......................... 130 1.9.2. Методы вычисления ко- эффициентов обратных связей в системах со многими входами 132 1.9.3. Управление нулями и ко- эффициентами усиления в замкнутой системе........ 135 1.9.4. Управление при инте- гральных обратных связях.. 139 1.9.5. Управление по заданным значениям матрицы системы для дискретных линейных сис- тем 140 Глава 1.10. УПРАВЛЕНИЕ ЛИНЕЙ- НЫМ ОБЪЕКТОМ ПО КВАД- РАТИЧНОМУ КРИТЕРИЮ КАЧЕСТВА (В. С. Медведев)...... 142 1.10.1. Вид критерия качества системы................ 142 1.10.2. Синтез закона управле- ния 142 1.10.3. Численные методы ре- шения уравнения Риккати... 143 1.10.4. Управление стационар- ной линейной системой в уста- новившемся режиме...... 144 1.10.5. Методы определения за- кона управления без решения уравнения Риккати...... 146 1.10.6. Управление в неполно- стью наблюдаемой системе.. 146 1.10.7. Управление дискретной линейной системой по квадра- тичному критерию качества. 147 Глава 1.11. ОЦЕНКА НЕИЗМЕРЯЕ- МЫХ КООРДИНАТ ДЕТЕР- МИНИРОВАННЫХ ЛИНЕЙ- НЫХ СИСТЕМ (В. С. Медве- дев) ......................... 149 1.11.1. Принципы построения наблюдающих устройств..... 149 1.11.2. Наблюдающие устройст- ва стационарных непрерывных линейных систем........ 151 1.11.3. Наблюдающие устройст- ва в стационарных дискретных линейных системах...... 152 1.11.4. Понижение порядка на- блюдающих устройств....... 154 1.11.5. Разделение задач управ- ления и наблюдения..... 156 СПИСОК ЛИТЕРАТУРЫ............. 157 Раздел 2. ТЕОРИЯ НЕЛИНЕЙ- НЫХ СИСТЕМ АВТОМА- ТИЧЕСКОГО УПРАВЛЕ- НИЯ........................... 159 Глава 2.1. ОСНОВНЫЕ ПОЛОЖЕНИЯ (Е. П. Попов)................. 159 2.1.1. Особенности нелинейных систем................. 159
ОГЛАВЛЕНИЕ 7 2.1.2. Виды нелинейностей. 162 2.1.3. Фазовое пространство. Особые точки и линии...... 167 2.1.4. Метод фазовой плоскости 170 2.1.5. Метод точечного преоб- разования и метод припасовы- вания.................... 173 2.1.6. Фазовое пространство систем высокого порядка... 176 Глава 2.2. АВТОКОЛЕБАНИЯ И УС- ТОЙЧИВОСТЬ НЕЛИНЕЙ- НЫХ СИСТЕМ (Е. П. Попов) 178 2.2.1. Метод гармонической линеаризации (гармонического баланса) и методы малого па- раметра ........................ 179 2.2.2. Автоколебания в системах высокого порядка......... 193 2.2.3. Исследование устойчиво- сти нелинейных систем мето- дом Ляпунова............. 195 2.2.4. Частотный метод иссле- дования устойчивости...... 199 2.2.5. Исследование устойчиво- сти нелинейных систем на ос- нове гармонической линеари- зации ................... 201 Глава 2.3. ВЫНУЖДЕННЫЕ И СМЕ- ШАННЫЕ КОЛЕБАНИЯ (Е. П Попов).................... 204 2.3.1. Одночастотные колеба- ния. Явление захватывания. 204 2.3.2. Высшие гармоники вы- нужденных колебаний....... 207 2.3.3. Несимметричные вынуж- денные колебания......... 211 2.3.4. Двухчастотные нелиней- ные колебания............ 212 Глава 2.4. НЕЛИНЕЙНЫЕ ПРОЦЕС- СЫ УПРАВЛЕНИЯ (К П По- пов) ........................... 216 2.4.1. Оценки качества пере- ходных процессов......... 216 2.4.2. Процессы управления при наложении вибраций.... 221 2.4.3. Помехоустойчивость при вибрациях. Сглаживание нели- нейностей ............... 223 2.4.4. Коррекция нелинейных систем................... 227 Глава 2.5. ТОЧНЫЙ МЕТОД ИССЛЕ- ДОВАНИЯ РЕЛЕЙНЫХ СИС- ТЕМ (Я. В. Фалдин).............. 231 2.5.1. Уравнение релейной сис- темы 231 2.5.2. Автоколебания в системах с двухпозиционным релейным элементом............... 232 2.5.3. Автоколебания в системах с трехпозиционным релейным элементом............... 240 2.5.4. Устойчивость автоколеба- ний 244 2.5.5. Вынужденные колебания 249 Глава 2.6. НЕЛИНЕЙНЫЕ ДИСКРЕТ- НЫЕ СИСТЕМЫ {А. С. Ющен- ко) .......................... 253 2.6.1. Математическое описание 253 2.6.2. Определение периодиче- ских процессов в нелинейных дискретных системах. Точные методы.................. 257 2.6.3. Метод гармонической линеаризации для дискретных систем.................. 260 2.6.4. Устойчивость нелиней- ных дискретных систем.... 267 Глава 2.7. ПРИНЦИП БИНАРНОСТИ И НОВЫЕ ТИПЫ ОБРАТНОЙ СВЯЗИ (С. В. Емельянов, С. К. Коровин)...................... 272 2.7.1. Структурный синтез не- линейных систем управления ... 272 2.7.2. Нестандартные диффе- ренцирующие системы...... 282 СПИСОК ЛИТЕРАТУРЫ............. 288 Глава 2.8. ПРИМЕНЕНИЕ ФУНК- ЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА НЕЛИНЕЙНЫХ СИСТЕМ (А. С. Ющенко)................ 288 2.8.1. Описание нелинейных систем с помощью рядов Воль- терра 288 2.8.2. Идентификация нели- нейных систем в форме рядов Вольтерра............... 291 2.8.3. Метод Винера.... 296 2.8.4. Анализ нелинейных сис- тем, представленных в форме функциональных рядов..... 302 2.8.5. Синтез нелинейных сис- тем 308 СПИСОК ЛИТЕРАТУРЫ............. 312 Раздел 3. МЕТОД 1Г-ТЕОРИИ УПРАВЛЕНИЯ (А. В. Се- менов) ....................... 314 Глава 3.1. ПОСТАНОВКА ПРОБЛЕМЫ 314
8 ОГЛАВЛЕНИЕ 3.1.1. Предварительные сведе- ния 314 3.1.2. Нормы сигналов и систем 314 3.1.3. Стандартный объект. 315 3.1.4. Проблема ^-оптимиза- ции 316 Глава 3.2. ПОДХОД ПРОСТРАНСТВА СОСТОЯНИЙ К ПРОБЛЕМЕ ЕГ-ОПТИМИЗАЦИИ.......... 316 3.2.1. Операторы сжатия и Риккати................. 316 3.2.2. Свойства оператора Ric ... 317 3.2.3. Проблема полной ин- формации. Принцип алгебраи- ческой дуальности....... 318 3.2.4. Специальные проблемы 318 3.2.5. Решение общей пробле- мы Н*-оптимизации....... 321 Глава 3.3. ПРОБЛЕМА РОБАСТНОЙ СТАБИЛИЗАЦИИ.................. 324 3.3.1. Неструктурированные не- определенности ......... 324 3.3.2. Критерий робастной ус- тойчивости ............. 325 3.3.3. Эквивалентность проблем робастной стабилизации и Ню- оптимизации.............. 325 • 3.3.4. Нормализованная про- блема робастной стабилизации 325 3.3.5. Параметризация множе- ства регуляторов в нормализо- ванной проблеме робастной стабилизации............ 325 Глава 3.4. АЛГОРИТМЫ ЕГ-ОПТИ- МИЗАЦИИ....................... 327 3.4.1. Процедура Гловера-Дойла 327 3.4.2. Безытерационный вари- ант процедуры Гловера-Дойла 328 СПИСОК ЛИТЕРАТУРЫ............. 329 Раздел 4. ОБРАТНЫЕ ЗАДАЧИ ДИНАМИКИ В ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ (Л. Д. Крутъко)...................... 331 Глава 4.1. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВ- ЛЕНИЯ МЕТОДОМ ОБРАТ- НЫХ ЗАДАЧ ДИНАМИКИ 331 4.1.1. Симметрия в системах автоматического управления и метод обратных задач динами- ки............................ 331 4.1.2. Схема синтеза управле- ний методом обратных задач динамики................ 332 4.1.3. Алгоритмы стабилизации стационарных состояний... 335 4.1.4. Алгоритмы управления следящих систем......... 340 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕ- НИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВ- НОСТИ.......................... 344 4.2.1. Алгоритмы управления по ускорению. Задача стабили- зации .................. 344 4.2.2. Адаптивные алгоритмы управления следящих систем .... 351 4.2.3. Исследование динамики управляемой упругой системы 363 Глава 4.3. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВ- ЛЕНИЯ ДВИЖЕНИЕМ МНО- ГОМЕРНЫХ СИСТЕМ_________________ 367 4.3.1. Алгоритмы стабилизации стационарных состояний... 367 4.3.2. Алгоритмы управления многомерных следящих систем высокой динамической точно- сти 372 4.3.3. Синтез алгоритмов стаби- лизации и управления с учетом динамики исполнительных элементов............... 374 СПИСОК ЛИТЕРАТУРЫ....... 376 Раздел 5. ИССЛЕДОВАНИЕ СИС- ТЕМ АВТОМАТИЧЕС- КОГО УПРАВЛЕНИЯ ПРИ СЛУЧАЙНЫХ ВОЗ- ДЕЙСТВИЯХ.............. 377 Глава 5.1. МАТЕМАТИЧЕСКИЕ МО- ДЕЛИ СИСТЕМ ПРИ СЛУ- ЧАЙНЫХ ВОЗДЕЙСТВИЯХ (Я. Е, Казаков)............... ул 5.1.1. Понятие стохастической модели системы......... 377 5.1.2. Стохастическая непре- рывная модель САУ в про- странстве состояний.... 377 5.1.3. Полная вероятностная характеристика непрерывного стохастического процесса. 379 5.1.4. Стохастическая дискрет- ная модель САУ в пространстве состояний.............. 382
ОГЛАВЛЕНИЕ 9 5.1.5. Одномерные мрдели сто- хастических систем........ 384 Глава 5.2. КРИТЕРИИ КАЧЕСТВА СИСТЕМ (Я. Е. Казаков)..... 386 5.2.1. Постановка задачи анали- за 386 5.2.2. Вероятностные показате- ли устойчивости стохастических систем.................... 386 5.2.3. Вероятностные показате- ли качества............... 387 5.2.4. Общие вероятностные критерии эффективности сис- тем автоматического управле- ния 389 Глава 5.3. УСТОЙЧИВОСТЬ СТОХАС- ТИЧЕСКИХ СИСТЕМ (Я. Е. Ка- заков) ......................... 389 5.3.1. Стохастическая устойчи- вость .................... 389 5.3.2. Оценка устойчивости по функции Ляпунова.......... 390 Глава 5.4. КОРРЕЛЯЦИОННЫЙ АНА- ЛИЗ НЕПРЕРЫВНЫХ ЛИ- НЕЙНЫХ СИСТЕМ (Я. Е. Ка- заков) ......................... 392 5.4.1. Корреляционная теория стохастических линейных сис- тем 392 5.4.2. Точность линейных авто- матических систем......... 394 5.4.3. Метод канонических представлений случайных про- цессов ................ 398 Глава 5.5. КОРРЕЛЯЦИОННЫЙ АНА- ЛИЗ ЛИНЕЙНЫХ ДИСКРЕТ- НЫХ СИСТЕМ (Я. Е. Казаков) 398 5.5.1. Метод дискретных пере- ходных функций состояния...... 398 5.5.2. Рекуррентное уравнение для вероятностных моментов ... 399 5.5.3. Стационарные дискрет- ные системы............ 400 Глава 5.6. КОРРЕЛЯЦИОННЫЙ АНА- ЛИЗ НЕПРЕРЫВНЫХ СТО- ХАСТИЧЕСКИХ НЕЛИНЕЙ- НЫХ СИСТЕМ (Я. Е. Казаков) 403 5.6.1. Линеаризация нелиней- ностей при случайном входном сингале...................... 403 5.6.2. Метод вероятностных моментов............... 404 5.6.3. Точность нелинейных ав- томатических систем.... 407 Глава 5.7. КОРРЕЛЯЦИОННЫЙ АНА- ЛИЗ ДИСКРЕТНЫХ НЕЛИ- НЕЙНЫХ СИСТЕМ (Я. Е. Ка- заков) ....................... 413 5.7.1. Корреляционная теория стохастических дискретных не- линейных систем......... 413 5.7.2. Стационарные дискрет- ные системы............. 416 Глава 5.8. АНАЛИЗ ВЕРОЯТНОСТ- НЫХ МОМЕНТОВ ВЫСШИХ ПОРЯДКОВ (Я. Е. Казаков) .... 418 5.8.1. Одномерное распределе- ние векторного процесса........ 418 5.8.2. Анализ семиинвариантов фазовых координат САУ.... 419 5.8.3. Метод статистических испытаний............... 421 Глава 5.9. МЕТОД ЭКВИВАЛЕНТНЫХ ВОЗМУЩЕНИЙ (Я. Е. Каза- ков) ......................... 422 5.9.1. Основы метода эквива- лентных возмущений...... 422 5.9.2. Определение математиче- ского ожидания и дисперсии ... 423 5.9.3. Интерполяционный ме- тод .................... 424 Глава 5.10. СИСТЕМЫ АВТОМАТИ- ЧЕСКОГО УПРАВЛЕНИЯ С ПАРАМЕТРИЧЕСКОЙ И СТРУКТУРНОЙ НЕОПРЕДЕ- ЛЕННОСТЯМИ (Я. Е. Каза- ков) ......................... 426 5.10.1. Общее определение 426 5.10.2. Системы со стационар- ной неопределенностью.... 426 5.10.3. Системы с нестационар- ной неопределенностью.... 426 Глава 5.11. СПЕКТРАЛЬНЫЕ МЕТО- ДЫ РАСЧЕТА ЛИНЕЙНЫХ НЕСТАЦИОНАРНЫХ СИС- ТЕМ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ (Я. Е. Каза- ков) ........................ 429 5.11.1. Спектральный метод, основанный на параметриче- ских нестационарных спек- тральных передаточных функ- циях .................. 429 5.11.2. Спектральный метод, основанный на интехральном уравнении Фредгольма 2-го ро- да..................... 431
10 ОГЛАВЛЕНИЕ Глава 5.12. АНАЛИЗ СРЫВА УПРАВ- ЛЕНИЯ (СЛЕЖЕНИЯ) В САУ (Я. Е. Казаков)................ 432 5.12.1. Основные определения 432 5.12.2. Применение теории марковских процессов и урав- нения Фоккера - Планка - Кол- могорова ................ 433 5.12.3. Применение теории марковских процессов и урав- нение Понтрягина......... 435 5.12.4. Определение статистиче- ских характеристик времени бессрывного управления.... 435 5.12.5. Применение теории вы- бросов случайных процессов. Стационарные системы...... 436 СПИСОК ЛИТЕРАТУРЫ.............. 438 Раздел 6. МЕТОДЫ ОПТИМИ- ЗАЦИИ СИСТЕМ АВТО- МАТИЧЕСКОГО УПРАВ- ЛЕНИЯ ................. 439 Глава 6.1. ПОНЯТИЕ ОПТИМАЛЬНО- СТИ. КРИТЕРИИ ОПТИ- МАЛЬНОСТИ САУ (А. А. Кра- совский) .................... 439 6.1.1. Модели оптимизируемых процессов и систем..... 439 6.1.2. Частные, общие и гло- бальные критерии оптимально- сти САУ................ 445 Глава 6.2. МЕТОДЫ ПАРАМЕТРИЧЕ- СКОГО СИНТЕЗА {А. А. Кра- совский) .................... 455 6.2.1. Алгоритмы поиска экс- тремумов функций многих пе- ременных .............. 455 6.2.2. Параметрический синтез САУ.................... 465 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРО- ВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ {А. А. Красов- ский, В. Н. Буков)........... 471 6.3.1. Математические основы оптимизации процессов управ- ления 471 6.3.2. Решение линейно- квадратичных задач синтеза оп- тимальных управлений.... 481 6.3.3. Оптимальные прогнози- рующие системы управления ... 485 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ (А. А. Красовский, И. Н. Белоглазов) ... 494 6.4.1. Постановки задач оцени- вания и фильтрации........... 494 6.4.2. Решения линейных задач оценивания............. 499 6.4.3. Оценивание процессов в нелинейных системах..... 507 6.4.4. Оптимальное адаптивное оценивание............. 513 6.4.5. Оптимальные совместные фильтрация и проверка гипотез 516 6.4.6. Совместное оптимальное оценивание, идентификация и проверка гипотез в дискретных динамических системах... 521 Глава 6.5. ОПТИМИЗАЦИЯ СТОХАС- ТИЧЕСКИХ СИСТЕМ (А. А. Красовский, В. Н. Буков). 528 6.5.1. Стохастические задачи оптимизации САУ........... 528 6.5.2. Решение линейно- квадратичных задач при слу- чайных воздействиях....... 531 6.5.3. САУ с прогнозирующими моделями и оптимальными (субоптимальными) фильтрами 533 Глава 6.6. УПРАВЛЕНИЕ ПРОЦЕС- СОМ НАБЛЮДЕНИЯ В СТО- ХАСТИЧЕСКИХ СИСТЕМАХ (Л£ Н. Красильщиков, В. В. Ма- лышев) ..................... 540 6.6.1. Управление процессом наблюдения как задача плани- рования эксперимента в стохас- тических динамических систе- мах 540 6.6.2. Модель планирования эксперимента в динамических системах (общий случай)..... 541 6.6.3. Конкретизация задач управления процессом наблю- дения 541 6.6.4. Модель эволюции харак- теристик точности эксперимен- та.......................... 542 6.6.5. Критерии оптимальности 543 6.6.6. Задача планирования как задача управления уравнением типа Риккати................ 544 6.6.7. Эквивалентные линейные задачи управления........... 545 6.6.8. Численный алгоритм ре- шения эквивалентных задач... 547
ОГЛАВЛЕНИЕ И 6.6.9. Формирование прохрам- мы оптимального маневра лета- тельного аппарата с целью улучшения условий наблюде- ния за движущимся объектом 549 Глава 6.7. АДАПТИВНЫЕ САУ (А. А. Красовский, В. Ю. Рутковский, С. Д. Земляков, И. Б. Ядыкин) ... 551 6.7.1. Классификация и пре- дельные возможности адаптив- ных САУ........................ 551 6.7.2. Беспоисковые алгоритмы адаптивных САУ.......... 554 6.7.3. Алгоритмы адаптивных оптимальных САУ с идентифи- кацией ................. 563 СПИСОК ЛИТЕРАТУРЫ............. 568 Раздал 7. УПРАВЛЕНИЕ ПРО- ЦЕССАМИ В ОРГАНИЗА- ЦИОННО-ТЕХНИЧЕС- КИХ СИСТЕМАХ АВТО- МАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ (В. В. Володин).......... 571 Глава 7.1. ОСНОВНЫЕ ПОЛОЖЕНИЯ ОБЩЕЙ ТЕХНОЛОГИИ АВ- ТОМАТИЗАЦИИ ПРОЕКТИ- РОВАНИЯ...................... 571 7.1.1. Структурные и функцио- нальные составляющие САПР 571 7.1.2. Виды проектирования и компоненты КСАЛ........ 573 7.1.3. Содержание процесса создания САПР.......... 575 Глава 7.2. СПОСОБЫ ОПИСАНИЯ АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ И ПРОЦЕССА ФУНКЦИОНИ- РОВАНИЯ САПР.......... 575 7.2.1. Описание структуры и схемы функционирования САПР................... 575 7.2.2. Описание процесса про- ектирования ТО......... 577 7.2.3. Типовые функциональ- ные составляющие в алгоритме функционирования САПР... 580 Глава 7.3. УПРАВЛЕНИЕ ПРОЕКТИ- РОВАНИЕМ В КОМПЛЕКС- НОЙ САПР..................... 582 7.3.1. Основные зависимости организации процесса проекти- рования ТО............. 582 7.3.2. Содержание требований к качеству проектирования.... 583 7.3.3. Учет требований к досто- верности результатов проекти- рования .................. 585 7.3.4. Учет требований завер- шенности результатов проекти- рования .................. 588 7.3.5. Согласование производи- тельности САПР проектных ра- бот в рамках комплексной САПР...................... 590 Глава 7.4. УПРАВЛЕНИЕ ПОИСКОМ РЕШЕНИЙ В РАСЧЕТНЫХ ПРОЦЕССАХ, РЕАЛИЗУЕ- МЫХ В САПР............... 591 7.4.1. Факторы, определяющие характер расчетных процессов проектирования по отраниче- ниям 591 7.4.2. Метод адаптации поиско- вого алгоритма в реализации расчетных процессов проекти- рования по отраничениям.... 594 7.4.3. Метод многошаговой реализации расчетных процес- сов проектирования по отрани- чениям ................... 597 Глава 7.5. МЕТОДЫ ОЦЕНКИ ОРГА- НИЗАЦИОННО-ТЕХНИЧЕС- КИХ СИСТЕМ АВТОМАТИ- ЗИРОВАННОГО ПРОЕКТИ- РОВАНИЯ ............ 600 7.5.1. Система показателей вы- бора рационального варианта САПР................. 600 7.5.2. Проектная оценка произ- водительности САПР... 601 7.5.3. Оценка качественного влияния САПР на характер проектной деятельности чело- века 602 СПИСОК ЛИТЕРАТУРЫ.......... 603 Раздел 8. ЧЕЛОВЕКО-МАШИН- НЫЕ СИСТЕМЫ УПРАВ- ЛЕНИЯ .............. 604 Глава 8.1. ОБЩИЕ СВЕДЕНИЯ О ЧМС. РОЛЬ ЧЕЛОВЕКА- ОПЕРАТОРА И ФОРМЫ ОПЕРАТОРСКОЙ ДЕЯТЕЛЬ- НОСТИ (Г. Г. Себряков)........... 604 Глава 8.2. ПСИХОФИЗИОЛОГИЧЕ- СКИЕ ХАРАКТЕРИСТИКИ ЧЕЛОВЕКА-ОПЕРАТОРА (Г. Г. Себряков, А. А. Огинский} 605
12 ОГЛАВЛЕНИЕ 8.2.1. Характеристики условий обитания................. 605 8.2.2. Характеристики приема, переработки и выдачи инфор- мации человеком-оператором 606 8.2.3. Влияние эмоциональных состояний ЧО на характеристи- ки приема, переработки и вы- дачи информации.......... 606 8.2.4. Обеспечение условий ра- боты человека-оператора в ЧМС...................... 607 Глава 8.3. ПРОЕКТИРОВАНИЕ ДЕЯ- ТЕЛЬНОСТИ ЧЕЛОВЕКА (ГРУППЫ ЛЮДЕЙ, ЭКИ- ПАЖА) В "ДИСКРЕТНЫХ" ЧМС УПРАВЛЕНИЯ НА УРОВНЕ СОВОКУПНОСТИ ОПЕРАЦИЙ (Л. А. Огинский) 607 8.3.1. Классификация видов деятельности в "дискретных" ЧМС........................ 607 8.3.2. Алгоритмическое описа- ние деятельности........... 608 8.3.3. Показатели деятельности 612 8.3.4. Исходные характеристики человека-оператора для расчета показателей деятельности.... 612 8.3.5. Рациональные значения показателей деятельности.... 612 8.3.6. Совмещенные операции 613 8.3.7. Основные требования к показателям деятельности в подсистемах ЧМС............ 613 8.3.8. Расчет числа членов эки- пажа 614 Глава 8.4. ПРОЕКТИРОВАНИЕ ЧМС СЛЕЖЕНИЯ (Г. Г Себряков, А. А. Огинский, С. Ю. Желтов) 614 8.4.1. Эрратическая следящая система. Основные понятия и определения........... 614 8.4.2. Математические модели деятельности человека-операто- ра в ЧМС слежения.......... 615 8.4.3. Критерии оптимизации ЧМС слежения............... 620 8.4.4. Оптимизация ЧМС сле- жения по критерию минимума времени адаптации человека- оператора и минимума психо- физиологической напряженно- сти ....................... 620 8.4.5. Оптимизация ЧМС по критериям минимума ошибки слежения и психофизиологиче- ской напряженности....... 627 Глава 8.5. МЕТОДЫ ОЦЕНКИ ЧМС (Г. Г. Себряков, А. А. Огинский, А. А. Степанов)................. 631 8.5.1. Задачи оценки ЧМС управления............... 631 8.5.2. Некоторые инструмен- тальные оценки........... 632 8.5.3. Шкалы экспертных оце- нок 632 8.5.4. Экспертная оценка на- пряженности сенсомоторной деятельности, основанная на понятиях нечетких множеств ... 633 Глава 8.6. ТРЕНАЖЕРЫ И КОМ- ПЛЕКСЫ ПОЛУНАТУРНОГО МОДЕЛИРОВАНИЯ ЧМС ЭРГОНОМИЧЕСКИЕ АС- ПЕКТЫ ПРОЕКТИРОВАНИЯ (Г. Г. Себряков, А. А. Огинский) 637 8.6.1. Назначение тренажеров и комплексов полунатурного мо- делирования ЧМС.......... 637 8.6.2. Классификация воздейст- вий на летчика в полете.. 637 8.6.3. Влияние технического облика тренажера на профес- сиональные навыки будущих летчиков................. 638 СПИСОК ЛИТЕРАТУРЫ............... 639 Раздел 9. ТЕОРИЯ УПРАВЛЕНИЯ СИСТЕМАМИ С РАС- ПРЕДЕЛЕННЫМИ ПА- РАМЕТРАМИ (А Г. Бут- ковский)............ 642 Глава 9.1. ВВЕДЕНИЕ. ЗАДАЧИ УПРАВЛЕНИЯ СРП......... 642 Глава 9.2. ПРИМЕРЫ СОДЕРЖА- ТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП И ИХ МАТЕМАТИЧЕСКИЕ ФОРМУЛИРОВКИ............ 644 Глава 9.3. СТРУКТУРНЫЙ МЕТОД ПРЕДСТАВЛЕНИЯ И ИС- СЛЕДОВАНИЯ СРП____________ 656
ОГЛАВЛЕНИЕ 13 9.3.1. Введение 656 9.3.9. Замыкание вырожденной обратной связью 663 9.3.2. Распределенные сигналы 656 9.3.10. Взаимосвязанные систе- 665 9.3.3. Распределенные блоки .... 657 мы 9.3.4. Стационарные распреде- ленные блоки 9.3.5. Суммирование распреде- 658 9.3.11. Стандартная форма краевых задач 9.3.12. Дисперсионные соотно- 666 шения 667 ленных сигналов и параллель- ное соединение блоков 659 Глава 9.4. ПРИНЦИП МАКСИМУМА 9.3.6. Последовательное соеди- ДЛЯ ОДНОГО КЛАССА ЗА- нение распределенных блоков 660 ДАЧ ОПТИМАЛЬНОГО УП- 9.3.7. Частные виды распреде- 660 РАВЛЕНИЯ СРП 670 ленных блоков 9.3.8. Замыкание обратной свя- СПИСОК ЛИТЕРАТУРЫ ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 674 зью 662 675
ВВЕДЕНИЕ Автоматизация производственных процессов, инженерного проектирования и многих функций управляющего персонала является одной из главных основ технического прогресса в машиностроении и приборостроении. Именно автоматизация наряду с новыми технологиями способна многократно повысить производительность и качество на предприятиях - в цехах и конструкторских бюро, а также на всех этапах подготовки производства и в планово-эконо- мических мероприятиях. Комплексная автоматизация производства, включая складское и транспортное хозяйство с применением робототехнических систем и многих других средств с широким использованием вычислительной техники, существенно облегчает человеческий труд. Благодаря автоматизации ликвидируется необходимость выполнения человеком однообразных, утомительных операций. Труд становится более интеллектуальным и интересным. Большое значение имеет также автома- тизация с использованием роботов в аварийных ситуациях, при работе в экстремальной .обста- новке, где затруднено или опасно пребывание человека. Однако, чтобы наиболее эффективно проводить автоматизацию, требуются серьезные пред- варительные научно-технические исследования и расчеты. При этом одной из важнейших теоре- тических проблем автоматизации является теория автоматического управления, которой и по- свящается данная книга. Исторически эта теория берет начало от работы А. И. Вышнеградского, который впервые исследовал динамику системы регулирования паровой машины в 1876 году. Он дал математиче- ское объяснение причин появления неустойчивости системы, получил условия устойчивости, построил диаграмму на плоскости параметров системы, показывающую изменение качества про- цессов регулирования, выделил области апериодичности и колебательности процессов. После этого многие годы развивалась теория автоматического регулирования процессов в различных механических машинах. В XX веке начали появляться следящие электромеханические системы, что послужило стимулом к существенному развитию теории автоматического управле- ния. Наиболее интенсивные разработки этой теории начинаются с сороковых годов нашего сто- летия вместе с началом бурного развития техники автоматизации, в том числе в военных приме- нениях, например - различные системы слежения, наведения и самонаведения. При этом, в ча- стности, широко стали использоваться методы А. М. Ляпунова общей теории устойчивости ди- намических систем, созданные им еще в 1892 г. В пятидесятые годы появились учебники по теории автоматического регулирования и управления. Эта теория начала преподаваться в вузах. Постепенно она становится обязательным предметом во всех технических вузах, а затем и в университетах. Теперь эта теория ввиду своей широкой общности, независимо от физической природы и конструкции конкретных технических систем, стала теоретической основой автоматизации во всех областях техники. С появлением вычислительной техники стали доступными многие задачи автоматического управления, практическое решение которых ранее было обусловлено различными допущениями. Прежде всего, это относится к задачам синтеза систем автоматического управления при соблюде- нии противоречивых требований к устойчивости и качеству. Так возникло условное деление тео- рии автоматического управления на теорию линейных систем, теорию нелинейных систем, тео- рию систем с распределенными параметрами, статистическую теорию, теорию дискретных сис- тем.
ВВЕДЕНИЕ 15 Такое деление породило развитие многих самостоятельных ветвей развития общей теории автоматического управления с весьма плодотворными методами исследования. Именно так воз- никли метод малого параметра, метод гармонической линеаризации, статистические расчеты на основе теории марковских случайных процессов и т.п. Сюда же можно отнести и метод фазового пространства, который сам по себе не требует допущений, но в действительности получил рас- пространение лишь для систем второго порядка с кусочно-линейной аппроксимацией нелиней- ных характеристик. Безусловно, потребность решения многих проблем оказало влияние на развитие фундамен- тальных наук и, в частности, на вычислительную математику. Все же решение многих задач, свя- занных с громоздкими вычислениями, долго оставалось на неудовлетворительном уровне. По- пытки облегчить вычислительные трудности привели в свое время к появлению многочисленных таблиц и номограмм, которые в свою очередь требовали значительного труда на их освоение. Примером может служить задача выбора параметров по критерию минимума интегральной оцен- ки качества переходного процесса. Даже в рамках линейной теории она сводится к достаточно сложным расчетам по вычислению вычетов, не говоря о нелинейных задачах такого же класса, где ее решение вообще не поддается аналитическим расчетам в конечной форме. Следует отметить, что на решение сложных задач автоматического управления особенно благоприятно повлияло появление персональных компьютеров. Помимо известных задач конст- руирования практически разрешимыми стали задачи идентификации математических моделей на основе результатов натурного эксперимента. В самих методах аналитического исследования также произошли изменения: здесь стали играть заметную роль новые методы вычислительной матема- тики, появилась теория программирования, теория алгоритмических языков и т.п. Нельзя не отметить, что под влиянием "машинной эйфории” многие аналитические методы в течение опре- деленного периода оказались отодвинутыми на второй план. Но вскоре выяснилось, что целый ряд теоретических и прикладных задач не поддается прямому решению на компьютере, несмотря на гигантские успехи в повышении объема памяти и быстродействия. Среди таких задач, в пер- вую очередь, стоит отметить асимптотические методы, позволившие разбить возможные движе- ния в динамических системах на непересекающиеся классы. При идентификации математических моделей по данным натурного эксперимента возника- ет проблема поиска глобального экстремума в пространстве параметров со сложной топологией. Без рационального аналитического подхода прямое применение известных алгоритмов поиска экстремума также не приводит к положительному результату. Несмотря на успехи применения вычислительной техники, авторы настоящего издания не сочли возможным приведение каких-либо готовых программ решения задач. Это обусловлено рядом обстоятельств, из которых не последнюю роль играет большое разнообразие алгоритмиче- ских языков. Сами языки быстро меняются в форме различных версии. Гораздо более стабильны в этом смысле общие принципы и методы решения задач теории автоматического управления, которые если и подвержены влиянию времени, то лишь в положительном смысле более смелой их постановки. При желании читатель может обратиться к наиболее универсальным программам конца XX столетия - символьным пакетам типа MAPLE V, а также к получившему известное распро- странение пакету Matlab и их версиям. Наиболее плодотворные результаты получаются при со- вместном использовании аналитических и численных методов, причем численному решению обычно предшествует качественный анализ. Общность теории автоматического управления основана на общности дифференциальных и других видов уравнений для многих явлений. Главное ядро теории - исследование динамики систем на базе их описания указанными уравнениями. По способам динамического описания автоматические системы делятся на следующие большие классы: линейные и нелинейные. Каждый из них содержит непрерывные и дискретные системы; обыкновенные и распределенные; детерминированные и стохастические; с постоянны- ми и переменными параметрами. Кроме того, особые виды составляют оптимальные, адаптивные и некоторые другие системы. Здесь нет смысла рассматривать эти термины, так как читатель найдет в данном томе полные описания и характеристики всех этих систем. Принцип построения книги отражает приведенную классификацию. Первый раздел содер- жит теорию детерминированных линейных систем непрерывных и дискретных. Здесь кроме тра- диционных методов исследования устойчивости и качества процессов излагается метод модаль-
ВВЕДЕНИЕ кого управления, оценка неизмеряемых координат и управление по квадратичному критерию качества. Во втором разделе рассматривается теория детерминированных нелинейных систем непре- рывных, релейных и дискретных. Излагаются методы исследования устойчивости, автоколебаний и качества нелинейных процессов управления. При этом из большого арсенала сложных методов исследования нелинейных систем здесь выбраны наиболее подходящие для проведения инженер- ных расчетов таких систем. Н*-теория управления изложена в третьем разделе. Приведены постановка и решение об- щей проблемы Н'°-оптимизации, а также сводящаяся к последней проблема робастной стабили- зации. Четвертый раздел содержит обратные задачи динамики в теории автоматического управле- ния. Дается метод синтеза управления, алгоритмы управления следящих систем, в том числе адаптивные, а также синтез управления многомерными системами. Исследование систем при случайных воздействиях (стохастических) содержится в пятом разделе. Изложены методы для непрерывных и дискретных систем, критерии качества и устойчи- вости. Корреляционный анализ дается как для линейных систем, так и для нелинейных. Изложе- ны анализ вероятностных методов, метод статистических испытаний, интерполяционный и спек- тральный методы. В шестом разделе даны методы оптимизации систем автоматического управления. Рассмот- рены методы оптимальной и субоптимальной фильтрации, оптимизация детерминированных и стохастических систем, управление процессом наблюдения в стохастических системах. Кратко изложена теория адаптивных систем. Седьмой раздел содержит материал об управлении процессами в организационно- технических системах автоматизированного проектирования. Приведены способы описания ав- томатизированного проектирования, примеры управления проектированием, управления поис- ком решений и методы оценки организационно-технических систем автоматизированного проек- тирования. В восьмом разделе приведены материалы по человеко-машинным системам. Рассмотрены психофизиологические свойства человека, работающего в качестве элемента системы управления, приведены методики проектирования дискретных и непрерывных человеко-машинных систем управления. Теория управления д системах с распределенными параметрами изложена в девятом разде- ле. Рассмотрены стационарные системы и относящиеся к ним краевые задачи. Для одного класса таких систем изложено применение принципа максимума. Книга предназначена для специалистов, работающих во всех отраслях машиностроения и приборостроения. Она будет полезна широкому кругу лиц, изучающих и применяющих на прак- тике методы теории автоматического управления, а также студентам, аспирантам и преподавате- лям технических вузов.
Раздел 1 ТЕОРИЯ ЛИНЕЙНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Глава 1.1 ВВЕДЕНИЕ. ОСНОВНЫЕ ТЕРМИНЫ 1.1.1. ПРИМЕРЫ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ В МАШИНОСТРОЕНИИ Классическим примером автоматической системы служит центробежный регулятор Уат- та, поддерживающий в заданных пределах скорость вращения маховика паровой машины (рис. 1.1.1). Если пренебречь силами трения между вертикальным стержнем и муфтой и в шарнирах, то существенными силами, дейст- вующими на детали регулятора, будут силы веса, опускающие муфту вниз, и центробеж- ные силы, действующие в противоположном направлении. Если маховик машины не вра- щается, то дроссель в паропроводе полностью открыт. При вращающемся маховике равнове- сие в системе наблюдается при равенстве при- веденных к муфте центробежных сил и сил веса. Это равновесное положение муфты и, следовательно, дросселя соответствует совер- шенно определенному значению скорости маховика. Настройка регулятора выполнена таким образом, что смещение муфты, вызван- ное превышением центробежных сил над си- лами веса уменьшает открытие дросселя. Та- ким образом, в системе "регулятор-машина" осуществляется отрицательная обратная связь. В связи с инерционностью маховика и грузиков регулятора между угловой скоростью со вращения маховика и углом открытия а дросселя отсутствует однозначная зависимость. Это может привести к незатухающим колеба- ниям угловой скорости относительно некото- рого среднего значения и даже к неустановив- шемуся процессу с возрастанием амплитуды колебания (рис. 1.1.2). Происходит перекачка энергии из двигателя в регулятор и обратно. Если в системе предусмотрено рассеяние энергии (например, вследствие вязкого трения в муфте), процесс перекачки энергии со вре- менем затухает и устанавливается некоторое постоянное значение угловой скорости махо- вика 0£>О- Рис. 1.1.1. Схема центробежного регулятора скорости Рис. 1.1.2. Процессы регулирования скорости: а - незатухающие колебания; б - неустойчивый процесс; в - затухающие колебания
18 Глава 1.1. ВВЕДЕНИЕ ОСНОВНЫЕ ТЕРМИНЫ Описанный регулятор относится к регу- ляторам прямого действия. Характерной чертой его служит то, что для регулирования откры- тия дросселя используется энергия без какого- либо усиления. Регулятор Уатта, созданный в 1774 - 84 гг., успешно работал и поддерживал величину ©о на постоянном уровне. Позже выяснилось, что его безотказное функционирование, как это ни парадоксально, было связано с невысоким уровнем технологии его изготовления. Именно по этой причине в деталях регулятора проис- ходило рассеяние энергии, необходимое для затухания колебаний. Такое объяснение рабо- ты регулятора пришло позже вместе с появле- нием соответствующего математического аппа- рата, развившегося впоследствии в теорию автоматического регулирования. Естественное желание конструкторов разгрузить чувствительный* элемент привело к созданию гидроусилителя, различные модифи- кации которого применяются достаточно ши- роко: при выпуске шасси самолетов, в систе- мах управления тяжелыми транспортными средствами, в станкостроении, при различных технологических процессах, где требуются значительные усилия (рис. 1.1.3). При сдвиге золотника масло под давлением начинает по- ступать в одну из полостей силового цилинд- ра. При этом силовой поршень следит за пе- ремещением гидрораспределителя, т.е. пере7 мещается вслед за гидрораспределителем, осу- ществляя тем самым отрицательную обратную связь. Сила, действующая на поршень, может достигать десятков тысяч ньютонов, в то время как на перемещение гидрораспределителя за- трачивается лишь сила на преодоление весьма незначительного трения. Это трение невелико, так как поршень подвешен в масляной среде и не имеет сухого контакта со стенками. Гидро- усилитель представляет собой простейшую следящую си'лему, так как перемещение поршня происходит по произвольному закону, который воспроизводится силовым поршнем. Отличие от предыдущего регулятора состоит именно в произвольности управляющего воз- действия u(fi. Такие автоматические системы принято называть системами автоматического управления - в отличие от систем стабилизации Рве. 1.13. Схема пщроусшпггеля (<о = const), поддерживающих регулируемую величину на постоянном уровне. Термин "система автоматического регулирования" яв- ляется менее общим и относится к системам с постоянным управляющим воздействием u(f) = const. Если функция и(0 заранее зада- на, то автоматическую систему называют сис- темой с программным управлением (например, станок с программным числовым управлени- ем). В рассмотренных двух примерах обрат- ная связь реализована непосредственным ме- ханическим воздействием. Рассмотрим систему передачи угла поворота на расстояние. Типич- ным примером такой системы служит дистан- ционное управление антенной радиолокатора (рис. 1.1.4). Пара сельсинов - датчик и прием- ник в трансформаторном режиме - образуют преобразовательное звено угла поворота в электрический сигнал. После некоторого уси- ления этот сигнал поступает на обмотку ис- полнительного двигателя, который разворачи- вает ротор приемника до тех пор, пока он не встанет в положение, согласованное с датчи- ком. При этом одновременно вращается под- вижная часть объекта (нагрузка). Благодаря электрической связи между сельсинами пере- дача угла возможна на расстояниях в несколь- ко сотен метров. На рис. 1.1.4 показаны лишь основные связи и элементы, которые позво- ляют осуществить сам принцип передачи угла. Такая система не обладает достаточной точно- стью, и для ее усовершенствования необходи- мы некоторые дополнительные элементы. Все приведенные здесь примеры отно- сятся к управлению одной величиной - скоро- стью вращения, перемещением или углом поворота. Автоматические системы с одной управляемой или регулируемой величиной (координатой состояния) называют одномерны- ми. Весьма распространенный класс образу- ют системы с управлением по двум каналам - двумерные .следящие системы. Примером могут служить системы пространственного сопрово- ждения, применяемые на станциях слежения Рас. 1.1.4. Схема дпеганцаонного управлеякя углом поворота
КЛАССИФИКАЦИЯ ЭЛЕМЕНТОВ АВТОМАТИЧЕСКИХ СИСТЕМ 19 за спутниками, астрогиды крупных телеско- пов, координаторы управляемых ракет, авто- пилоты летательных аппаратов. В двумерных автоматических системах каналы управления обычно связаны между собой, причем природа этих связей может иметь различное физиче- ское происхождение. В системах сопровождения в качестве элемента, осуществляющего повороты лилии визирования, часто используют гироскоп, имеющий три степени свободы (рис. 1.1.5). Уравнения движения гироскопа имеют вид [2J: + £У1 +НУ2 = (1.1.1) Гу2 +&2-НУ1 = М2, где I - момент инерции ротора относительно осей вращения рамок; Н - собственный кине- тический момент ротора: £, - коэффициент демпфирования; и уз - Углы поворота ра- мок; М\ и М2 - моменты коррекции. Как следует из уравнений (1.1.1), каналы управления связаны между собой благодаря свойствам тела, вращающегося вокруг непод- ( вижной точки, - кинетический момент Н вхо- дит в виде коэффициента при угловой скоро- сти из смежного канала. Обратная связь осуществляется с помо- • щью датчиков, преобразующих угловые откло- нения оптической оси от линии визирования в моменты коррекции М\ и Му- М\ = к(х\ - J1); Л/2 = к(х2 - у2). Пример многомерной системы, в которой происходит управление сразу несколькими координатами, - автоматическая система управления полетом самолета. Предположим, что под влиянием некоторых внешних причин самолет отклонился от курса. На датчиках Рис. 1.1.5. Схема следящего координатора чувствительного элемента - гироскопа - воз- никнет электрический сигнал, пропорцио- нальный этому отклонению. Сигнал поступает после некоторого усиления на рулевую маши- ну, которая перекладывает руль, и самолет должен вернуться на курс. Вследствие инерции самолет переходит через положение равнове- сия, и при неправильно сконструированной системе могут развиться незатухающие колеба- ния. Но в данном случае важными представ- ляются еще несколько побочных явлений. Из- за отклонения руля и бокового скольжения самолета меняется его аэродинамическое со- противление и при постоянной тяге двигателя происходит падение скорости, следовательно, уменьшение подъемной силы с неизбежным падением высоты полета. Сложная форма са- молета и скольжение вызывают неравномерное обтекание плоскостей, вследствие чего возни- кает еще и крен. Для компенсации этих явле- ний необходима по меньшей мере работа еще трех каналов, которые влияют друг на друга. 1.1.2. КЛАССИФИКАЦИЯ ЭЛЕМЕНТОВ АВТОМАТИЧЕСКИХ СИСТЕМ ПО ФУНКЦИОНАЛЬНОМУ ПРИЗНАКУ В любой автоматической системе можно выделить элементы, выполняющие простей- шие функции. Чувствительные элементы - измеряют значение регулируемой координаты. В приве- денных примерах такую функцию выполнял центробежный маятник в системе регулирова- ния угловой скорости. Гидрораспределитель усилителя реагирует на смещение малого поршня. В системе стабилизации курса само- лета угловую величину воспринимает гиро- скоп. В системе передачи угла на расстояние угол поворота антенны или какой-либо другой Нагрузки воспринимает сельсин-приемник, ротор которого непосредственно связан с на- грузкой. Сельсин-датчик и сельсин-приемник об- разуют вместе элемент, измеряющий разность между углом поворота и его действительным значением. Элемент, измеряющий разность между заданным значением регулируемой ко- ординаты и ее действительным значением, называют сравнивающим элементом, или диф- ференциальным устройством (от латинского differentia - разность). Объект регулирования рассматривается как элемент автоматической системы. Несмотря на то, что объект регулирования или управляе- мый объект сам может представлять собой сложное техническое устройство, в теории автоматического управления обычно рассмат- ривают его как элемент, состояние которого характеризуется набором входных и выходных координат. Так, для самолета входной коорди- натой является отклонение руля, выходной -
20 Глава 1.1. ВВЕДЕНИЕ. ОСНОВНЫЕ ТЕРМИНЫ его отклонение от заданного курса. У самолета как объекта регулирования существуют и дру- гие входные и выходные координаты, таким образом, различные системы управления ока- зываются связанными между собой через объ- ект регулирования. Исполнительные элементы оказывают не- посредственное воздействие на объект регули- рования. Это двигатель, поворачивающий ан- тенну радиолокатора, рулевая машина, откло- няющая рули, силовой цилиндр, развивающий необходимое усилие для перемещения нагруз- ки. Подразделение автоматической системы на элементы по функциональному признаку оказывается иногда условным. Например, гид- роусилитель, в котором мы выделили гидро- распределитель и силовой цилиндр, в сово- купности можно рассматривать как исполни- тельный элемент, входной координатой кото- рого служит смещение штока гидрораспреде- лителя, а выходной - смещение штока сило- вого плунжера. Все без исключения элементы автомати- ческих систем осуществляют преобразование входных координат в выходные. В том случае, когда существенной является именно эта функция, элемент называют преобразователь- ным. Как правило, преобразовательные эле- менты имеют на входе и выходе координаты различной физической природы: давление - перемещение, угол поворота - электрическое напряжение, скорость вращения - угловое отклонение и т.п. Преобразовательные элемен- ты нередко совмещают также и функцию уси- ления по мощности. В таком случае их назы- вают усилительными элементами. При анализе динамических свойств ав- томатических систем нами будут выделены корректирующие элементы. В соответствии с их названием они осуществляют исправление динамических свойств систем с обратной свя- зью. 1.1.3. ТРЕБОВАНИЯ, ПРЕДЪЯВЛЯЕМЫЕ К СИСТЕМАМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Основное назначение системы автомати- ческого управления состоит в обеспечении заданного соответствия между входной и вы- ходной координатами. В случае следящей сис- темы входная координата должна быть равна выходной в любой момент времени. Посколь- ку автоматическая система работает на основе сравнения входной и выходной координат, такое равенство принципиально неосуществи.- мо и можно лишь говорить о достаточно ма- лой разности между входной и выходной ко- ординатами. Эта разность в между входной величиной U и выходной (управляемой) х в дальнейшем называется ошибкой, а соотноше- ние в = и - х - условием замыкания системы. Обычно различает ошибку в установившемся режиме при х = const и ошибку в переходном процессе. Требование в = 0 при х = const ока- зывается принципиально выполнимым для астатических систем. Что касается переход- ного процесса, то обычное требование к его виду состоит в обеспечении его минимальной длительности (рис. 1.1.6). Время переходного процесса Т формально удовлетворяет условию |х(0-х(®)|< ДХ) t>T. Помимо параметра Т форма переходного про- цесса характеризуется перерегулированием ст: _ Хщах ~Х(°°) х(®) В зависимости от назначения системы автома- тического управления считается приемлемым то или иное значение параметра ст. Например, в случае управления движением лифта с пас- , сажирами при остановке его на заданном по программе этаже естественным следует считать ст = 0, т.е. процесс должен быть монотонным (без перерегулирования). Обычно перерегули- рование соответствует колебательным процес- сам с затуханием, более быстро протекающим по сравнению с монотонными. Величина пе- ререгулирования характеризует в этом случае скорость затухания. Очевидно, что при ст = 1 процесс х(/) сведется к незатухающих колеба- ниям. Поэтому выбор параметра ст наряду с Т достигается в результате некоторого компро- миссного решения. В автоматических системах, предназна- ченных для сопровождения движущихся объ- ектов (пример с антенной радиолокатора) мо- жет оказаться, что на первом месте условием оценки качества будет выполнение неравенства
СТРУКТУРНЫЕ СХЕМЫ ПРОХОЖДЕНИЕ СИГНАЛОВ 21 |е(/)| < А для произвольного момента време- ни. При этом имеется в виду, что при сопро- вождении перемещающихся в пространстве объектов (самолетов, спутников) приходится воспроизводить с некоторой заданной точно- стью сравнительно плавные входные воздейст- вия «(/), не имеющие разрывов. В таком слу- чае главным показателем качества служит ве- личина Д. Если мы имеем дело с многомерной сис- темой, то в качестве показателя выступает норма вектора ошибки, сформированная по какому-либо из принятых правил: 1) ||е|| = тах|с/| либо 2)Н = | (евклидова норма), ч=1 ) где 8/, / = 1, 2, 3, ..., п - компонент вектора ошибки. Глава 1.2 МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ НЕПРЕРЫВНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 1.2.1. СТРУКТУРНЫЕ СХЕМЫ. ПРОХОЖДЕНИЕ СИГНАЛОВ В теории автоматического управления для пояснения основных принципов работы, последовательности операций, прохождения сигналов и взаимосвязей различных элементов используются структурные схемы, выполняе- мые с помощью условных геометрических фигур, например, прямоугольников в произ- вольном масштабе. При анализе и синтезе систем на определенной стадии целесообразно абстрагироваться от конкретной физической природы протекающих в них процессов. По- этому структурным схемам отдается предпоч- тение перед принципиальными электрически- ми, гидравлическими, кинематическими и другими схемами. На рис. 1.2.1, а, б изображены структур- ные схемы системы стабилизации скорости и системы передачи угла на расстояние. В пря- моугольниках указаны наименования элемен- тов. На рис. 1.2.1, б показано дифференциаль- ное устройство (в виде кружка с перекрести- ем), осуществляющее вычитание угла поворота антенны из задаваемого внешним устройством угла «(/). Рас. 1.2.1. Структурные схемы: а - системы регулирования скорости центробежным регулятором; б - системы передачи угла; в - многомерной системы автоматического регулирования На рис. 1.2.2 показана структурная схема многомерной системы управления летатель- ным аппаратом, на вход гироблока поступают углы рыскания ц/, тангажа 3 и крена у. После преобразования в электрические сигналы и усиления они поступают на вход трех рулевых машин соответственно. Пилот имеет возмож- ность вмешаться в управление угловыми коор- динатами и скоростью полета благодаря диф- ференциальным устройствам. При большом числе переменных для упрощения структурной схемы можно воспользоваться менее подроб- ной схемой, считая координаты состояния компонентами некоторых векторов. При этом связи в структурных схемах обозначаются двойными линиями (см. рис. 1.2.1, в). Струк- турная схема становится более информатив- ной, если внутри прямоугольников записаны математические соотношения между входной и выходной координатами. Стрелками показано направление прохождения сигналов. Под этим понимается причинно-следственная зависи- мость между координатами. Например, в па- ровой машине угловая скорость зависит от величины наклона а дросселя. Обратная зави- симость а от со показана стрелкой в обратной связи. Зачерненный сектор в дифференциаль-
22 Глава 1.2. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ НЕПРЕРЫВНЫХ СИСТЕМ Рис. 1.2.2. Структурная схема многомерной системы автоматического управления полетом: $э - угол отклонения элеронов; 5» - угол отклонения руля высоты; - угол отклонения руля направления;* v - скорость полета; ДСН - датчик скоростного напора; СПТ - система подачи топлива; РМ - рулевые машины; УС - усилители; КР - коррекция режима работы двигателя ном устройстве показывает, что связь отрица- тельна, т.е. с = и - х. 1.2.2. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ ЭЛЕМЕНТОВ И ОБЪЕКТОВ Наиболее общий способ описания эле- мента автоматической системы основан на использовании понятия оператора, устанавли- вающего правило, по которому каждой точке множества входных координат ставится в соот- ветствие точка из множества выходных коор- динат. В случае функциональной зависимости между входной и выходной величинами таким оператором служит эта зависимость. Пример 1.2.1. Напряжение на однофаз- ной обмотке сельсина-приемника (см. рис. 1.1.4) связано с углом поворота сельсина- датчика функциональной зависимостью и = — к sin 8. Множеством входных координат является прямая -оо < е < +оо. Множество выходных координат представляется отрезком (Л *]• Приведенный пример иллюстрирует про- стейшую связь между входной и выходной координатами (входом и выходом). Значи- тельно более распространен случай зависимо- сти, задаваемой дифференциальным уравнени- ем. Для вывода уравнения обычно использу- ются фундаментальные законы физики и ее разделов, развившихся в самостоятельные дис- циплины. Пример 1.2.2. Рассмотрим дифференци- альное уравнение одного из видов исполни- тельных элементов - электрического двигателя постоянного тока. В качестве исходного урав- нения воспользуемся законом механики, со- гласно которому угловое ускорение ротора пропорционально действующему на него мо- менту сил 1^- = Му (1.2.1) dr где I - момент инерции вращающихся масс, приведенный к валу двигателя; (р - угол пово- рота ротора. Момент М, возникающий благодаря взаимодействию электромагнитных полей ро- тора и статора, зависит от приложенного на- пряжения «(/) и угловой скорости вращения ротора со. Таким образом, М = Л/(<р, со) - некоторая, вообще говоря, нелинейная функ- ция двух переменных. На этот раз управляющее напряжение и может принимать значения, принадлежащие эксплуатационной области управлений. Выход- ная же величина <р, как это следует из уравне- ния (1.2.1), не определяет состояния элемента. Для полного описания состояния необходимы две величины; <р и со = . Если считать эти at величины компонентами некоторого вектора, то множество таких векторов при некоторых дополнительных предположениях образует линейное (в данном случае двумерное) про- странство. В классической теории автоматиче- ского управления такое пространство называ- ют фазовым. Дифференциальное уравнение (1.2.1) можно записать в виде двух уравнений пер- вого порядка: (1.2.2) т 1// I —— = и dt v Система (1.2.2) является частным случаем более общей записи вида ^- = //(*i>*2.•••>*»; 1=1, 2.....л, (1.2.3)
ЛИНЕАРИЗАЦИЯ ХАРАКТЕРИСТИК И УРАВНЕНИЙ 23 которую называют нормальной формой Коши системы дифференциальных уравнений. Как известно [1.7], к такой форме сводится любое уравнение порядка л, разрешенное относи- тельно старшей производной. 1.2.3. ЛИНЕАРИЗАЦИЯ ХАРАКТЕРИСТИК И УРАВНЕНИЙ Линейные зависимости являются наибо- лее простой формой связи между величинами и обладают весьма важным свойством супер- позиции, сильно облегчающим теоретические исследования. Формально этот принцип запи- сывают в виде следующих соотношений. Если А - линейный оператор, устанавливающий взаимноодназначное соответствие между неко- торыми множествами, то Л(х + у) = Ах + Ау и (1.2.4) А(кх) - кАх, гае х и у - координаты состояния; X - произ- вольное число. Линейная зависимость удовле- творяет этим свойствам. Функциональная зависимость между вхо- дом и выходом какого-либо элемента или сис- темы, полученная в результате эксперимента или теоретических построений, сравнительно редко бывает линейной. Обычно она лишь в той или иной степени приближается по форме к линейной зависимости и задача состоит лишь в том, чтобы аппроксимировать нели- нейную функцию у — fx) линейной формой у = кх + Ь. Если функция f задана своим аналитическим выражением, то, записывая ее разложение в ряд Тейлора f(x) = /<Х0 ) + (х - х0) + о(х - х0), Х=Хо мы получаем искомую аппроксимацию. Такую процедуру называют линеаризацией. Для осу- ществления линеаризации необходимо сущест- вование первой производной функции fix). Процедура линеаризации легко реализуется и для неявных зависимостей вида Дх, у) - 0. Записывая снова разложение Тейлора и удер- живая члены с приращениями х - Хо и у - - Уо, имеем СЛЛ. •*“*0 (х-х0) + У=Уо ду x=xbv 7 У=Уо Если зависимость между координатами пред- ставлена в виде графика, то процедура линеа- ризации в окрестности какой-либо точки эк- вивалентна проведению касательной в этой точке, которая и будет искомой линейной зависимостью (рис. 1.2.3). Наконец, если основанием для построе- ния линейной зависимости служит таблица значений входной координаты {х} и соответ- ствующих значений выходной координаты {у}, то для построения искомой линейной зависи- мости можно воспользоваться методом наи- меньших квадратов, согласно которому Х(х/ -Ф -у) к = —п----------’ £(х/-*)2 /=1 (1.2.5) п п У^х1 - Х^х1У! , ^-лх2 /=1 где средние значения Xi и 1 л у = — \ yt • Формулы (1.2.5) пригодны, если "tl из каких-либо предварительных соображений известно, что искомая модель линейна. В слу- чае нелинейной характеристики необходимо воспользоваться приемами идентификации, а затем линеаризовать полученную нелинейную зависимость с помощью разложения в ряд Тейлора в окрестности предполагаемой рабо- чей точки. Если функции в правой части системы уравнений (1.2.3) принадлежат классу диффе- Рис. 1.2.3. Линеаризация нелинейных характеристик
24 Глава 1.2. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ НЕПРЕРЫВНЫХ СИСТЕМ ренцируемых, то система также может быть линеаризована с помощью указанного разло- жения Л(*1>*2- ! у dfl +у^- i = l, 2,.. *л) = Л(*1О.*2О.-.*ло) + “j=“jO ., п. Вводя обозначения J Xj = XJ0 J Uj=Uj0 линеаризованной системе уравнений (1.2.3) можно придать матричную форму X = AX + BU, (1.2.6) где X = (xj, х2, ...» хл)т - вектор координат со- стояния (для краткости в дальнейшем -вектор состояний); U = (iq, «2, ип)т ~ вектор, управлений, некоторые компоненты которого могут быть, в частности, нулями. Матрица коэффициентов А - квадратная порядка п х п. Матрица коэффициентов В - порядка п х г и г < п. Если элементы матриц А и В не зависят от времени, то линеаризованную систему уравнений (1.2.3) называют стационарной, в противном случае - нестационарной. К матричной форме записи вида (1.2.3) легко приводится линейное уравнение произ- вольного порядка ’ D + ... + а,рс = (12.7) = + b^m ~ О + ... + Ьти. Вводя обозначения: х = хь х(1> = jq = х2, (1.2.8) у(Л 1) — у. _ * — Хл_2, из (1.2.6) получаем хп - — +...+ —и - — хп-...~ aQ aQ aQ *1- (1.2.9) После этих операций соотношения (1.2.8) и (1.2.9) можно записать в форме (1.2.6), где на этот раз векторы состояний и управлений принимают вид X = (хь х2, ..., хл)т; U = (и, iX1), ..., iXw))T. Матрицу коэффициентов 0 1 0-0 0 0 1 ••• 0 ап ап-\ ап-2 _£1_ ао ао называют матрицей Фробениуса, а матрицу В записывают в виде 0 0 0 -0 0 0 0 -0 Ьт Ьт\ .. а0 а0 а0 Дифференциальное уравнение произ- вольного порядка (1.2.7) с постоянными ко- эффициентами можно записать также в опера- торной форме. Если воспользоваться обозна- чением для оператора дифференцирования р = d / dt, х<*> = ркх (к = 0, 1....п), то из (1.2.7) следует N(p) х(/) = М(р) и(/), где полиномы N(p) и М(р) удовлетворяют свойствам (1.2.4) линейных операторов. 1.2.4. УСТАНОВИВШЕЕСЯ ДВИЖЕНИЕ И ПЕРЕХОДНЫЙ ПРОЦЕСС Итак, линейное дифференциальное урав- нение (1.2.7) путем некоторых преобразований приводится к виду (1.2.6). Из формул (1.2.8) следует, что и обратно матричная форма запи- си (1.2.6) эквивалентна скалярной форме (1.2.7). В различных случаях полезными ока- зываются обе формы записи. В этом параграфе ограничимся рассмотрением стационарных линейных уравнений. Из теории этих уравнений известно [1.7], что решение представляет собой сумму
УСТАНОВИВШЕЕСЯ ДВИЖЕНИЕ И ПЕРЕХОДНЫЙ ПРОЦЕСС 25 х(0 = х(О + Х(0, где х(0 - решение соответствующего одно- родного уравнения (т.е. уравнения с нулевой правой частью), a x(f) - частное решение неоднородного уравнения, зависящего от кон- кретного вида управления u(f). Решение х(0 представляет собой реакцию на начальные условия, его называют переходным процессом ап=ХС/еМ- /=1 Постоянные интегрирования С/ (/ = 1, 2, ..., п) определяются начальными условиями. Чис- ла X/ - это корни характеристического уравне- ния + Л1ХЛ 1 + ... + ал = О, которые можно записать в виде определителя det аи ~ а21 Л31 Л12 @22 ~ а32 - Л1л Л2л •” а3п = 0. ал1 ап2 апп ~ \ (1.2.11) Если переходный процесс обладает свойством lim x(t) = 0, то с течением времени система /->а совершает движение, определяемое функцией u(t). Переходный процесс "в чистом виде" можно наблюдать, если внезапно замкнуть обратную связь при «(0 — 0. Переходный процесс, таким образом, определяется собст- венным движением системы автоматического управления из произвольной точки множества состояний, отличной от нулевой. Из всех тестовых сигналов w(0 наиболее информативен класс гармонических функций вида и = sin(®/ + <р), где без ограничения общности можно поло- жить (р = 0 или (р = у. Тогда в качестве управления можно рассмотреть и = e^r = cos®/ + /sin®/. Такое управление удобно тем, что при диффе- ренцировании оно не меняет своей формы (в отличие от тригонометрических функций). Сами тригонометрические функции описыва- ют некоторое "установившееся" движение, повторяющееся через равные промежутки вре- 2л мени к— (к = 1, 2, ...), наименьший из ® которых называют периодом колебаний Т — 2л / ®. Установившееся движение найдем в виде х(0 = После подстановки х в исходное урав- нение получаем выражение для функции •щ\ : A)O°)W+^1O°)W i+ - +bm *оО)л +ai(j&)n~i+...+an Аф®) ЛГ(/®)’ (1.2.12) Эту функцию называют частотным оператором системы, описываемой уравнением (1.2.7). Частотный оператор полностью определяется коэффициентами уравнения и, следовательно, параметрами элементов. Этим утверждением между частотным оператором и дифференци- альным уравнением устанавливается взаимно- однозначное соответствие. Числитель и знаменатель функции 1К(До) принадлежат к классу целых полиномов пере- менной /®. Следовательно, частотный опера- тор линейной динамической системы с посто- янными коэффициентами является дробно рациональной функцией /ю. Частотный оператор можно записать в виде ИХДо) = Л(й)еА“), а также в виде И^(/®) = Р(ю) +У’0(ю). Здесь Л(ю) и Р(®) - четные, а 0(ю) и Q(w) - нечетные функции частоты ®. Вследствие этого реакция динамической системы на управляющее воздействие и(0 = +е-^°г) = cos®/ отличается от «(0 по фазе на угол 0(ю) и по амплитуде после умножения на функцию Л(ю): х(0 = Л(ю) cos[®Z + 0(®)]. Это свойство действия оператора WV®) на входной сигнал u(t) оказывается весьма удобным при практических расчетах, так как вместо того чтобы каждый раз решать неодно- родное линейное уравнение для вычисления
26 Глава 1.2 МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ НЕПРЕРЫВНЫХ СИСТЕМ установившегося движения, достаточно один раз найти оператор и, следовательно частотные характеристики Л(ш) и 0(со). Функ- цию Л(со) называют амплитудно-частотной, а 0(со) - фазочастотной характеристиками ли- нейной динамической системы. Удобство ис- пользования этих характеристик становится особенно заметным при вычислении реакции линейной системы на периодическое входное воздействие вида N u{t) - (ov cos vco/ + bv sin vco/) V=1 с коэффициентами разложения в ряд Фурье 1 Т av = — j u(t)co&v<i)tdt (1.2.13) 1 О и т bv = у J u(t) sin vtotdt, Т = 2ти / со. о Благодаря свойству суперпозиции иско- мая реакция записывается сразу в виде N x(t) = У* I Л(у<вдау cos^vco/ + 0(vco)j + • + bv sin(vo)/ + 0(vco))j| Частотный оператор FK(/a)) допускает простую геометрическую интерпретацию, если рассматривать его как вектор с компонентами Р(со) и зависящими от параметра со (рис. 1.2.4). При этом длина вектора И'Х/со) Рис. 1.2.4. Годограф частотного оператора равна Л(со), а угол, образованный вектором с положительным направлением оси Р(со), равен 0(со). Связь между частотными характеристиками такая же, как у декартовых координат с полярными: л(ш) = V/>2(e>)+Q2(«>); Р(со) = /4(co)cos0(co); (1.2.14) 0(со) = arctga((o) / Р(со); С(со) = y4(co)sin0(co). Кривая, которую описывает конец векто- ра при изменении частоты со от -оо до +оо, называется годографом функции FF(/co). Благодаря свойству четности /’(со) и нечетно- сти 2(ю) годограф симметричен относительно оси Р(со), и обычно при его построении при- нято ограничиваться положительными часто- тами 0 < со < +оо. Годограф FF(/oo) наглядно демонстрирует зависимость амплитуды выход- ного сигнала от частоты. С ростом частоты эта амплитуда обычно убывает. Этот факт выража- ет фильтрующие свойства динамической сис- темы - начиная с некоторого значения частоты, амплитуды выходного сигнала стано- вится столь малой, что в некоторых практиче- ских приложениях ею можно пренебречь. Убывание функции Л (со) с ростом частоты может и не был» монотонным. В таком случае частотная характеристика обладает резонансны- ми свойствами или свойствами полосового фильтра. Еще более важное свойство годогра- фа заключается в возможности суждения об устойчивости работы автоматической системы. Ценное качество годографа состоит также в том, что он может был» определен экспери- ментально. Для осуществления такого экспе- римента необходим генератор гармонических функций, работающий в нужном диапазоне частот, и прибор для регистрации входного сигнала и(/) и выходного сигнала x(t) (напри- мер, шлейфовый осциллограф). По записям сигналов определяют характеристики Л (со) и 0(со). Полученные данные можно использо- вать для экспериментального определения неизвестных параметров исследуемой системы, т.е. для идентификации математических моде- лей с реальными устройствами. Работа с генератором гармонического сигнала обычно требует достаточно больших затрат времени. Собственно эксперимент мо- жет был» проведен гораздо быстрее, если огра- ничиться экспериментальным определением переходного процесса с последующей обработ- кой полученных записей.
ПЕРЕДАТОЧНЫЕ ФУНКЦИИ ЛИНЕЙНЫХ СИСТЕМ 27 Для построения алгоритма обработки следует рассматривать переходный процесс как отрезок установившейся реакции динамиче- ской системы на периодическое ступенчатое воздействие вида (рис. 1.2.5) «(/) = 2«0£ (-1)v 1(/ - VT), (1.2.15) V гае индекс v - пробегает целочисленный ряд значений, а функция 1(/) определяется как единичное ступенчатое воздействие: , [ 1, / О, 10 = (о, ,<а 0216) Согласно принципу суперпозиции реакция системы на сигнал вида (1.2.15) х(0 = 2«о£(- 1)VA(/ - vT), V гае h(f) - переходная функция (реакция системы на единичную ступеньку) (1.2.16). Нетрудно проверить, что разложение u(f) в ряд Фурье имеет вид 4и0 1 . (2у + 1)л ц(,) = V~X^TTxSin Т (,-217) v=0 Формулы (1.2.13) позволяют вычислить коэф- фициенты разложения функции x(f): «V = ^г-(1 - cosjtv)| h(t)co&^-dt О и Т \ - cos>tv)J О Таким образом, как и в разложении (1.2.17), отличными от нуля будут лишь гармоники с нечетными номерами Рис. 1.2.5. Реакция аитоматяческой системы на периодическое ступенчатое мздойепше 4и0 Г ,(Тх\ , 4и0 a2v+i =—- А— cosxdx =—-c2v+i л * \ л / л о , Г j 4и0 *2v+l =— * ----- SinX<fc=—-52v+I Л * \ Л / Л О Относя составляющие амплитудного спектра выходного сигнала x(t) к соответст- вующим гармоникам входного воздействия и и(/), получим дискретную последовательность значений амплитудно-частотной характеристи- ки c2v+l + ^v+l • Как и следовало ожидать, в последнем выра- жении не содержится параметра Uq. Это, од- нако, не означает, что при проведении экспе- римента он может был» любым. Следует пом- нить, что при снятии переходной функции ни один элемент системы не должен выходить на нелинейный режим (например, достигать зоны насыщения). Дискретная последовательность значений фазочастотной характеристики получается в виде e(2v+i)| = arctg-2v+1 s2v+1 Амплитудная и фазовая характеристики линейной системы с частотным оператором НХ/со) в виде дробнорациональной функции j(o определяются одними и теми же коэффи- циентами. Поэтому характеристики оказыва- ются связанными однозначным соответствием. Взаимнооднозначное соответствие между ха- рактеристиками можно увидеть также из соот- ношений (1.2.14). Величина шага по частоте Дсо = л / Т тем меньше, чем более длинный отрезок Т переходного процесса используется в алгорит- ме обработки. Таким образом, ступенчатое воздействие вида (1.2.16) оказывается весьма информатив- ным и, кроме того, позволяет существенно сократить время эксперимента при определе- нии частотных характеристик системы. Поэто- му ступенчатое воздействие часто используется как тестовый сигнал как при эксперименталь- ных, так и при теоретических исследованиях. 1.2.5. ПЕРЕДАТОЧНЫЕ ФУНКЦИИ ЛИНЕЙНЫХ СИСТЕМ При изучении частотных характеристик и переходных процессов стационарных линей- ных систем соответствующую роль играли два
28 Глава 1.2. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ НЕПРЕРЫВНЫХ СИСТЕМ типа входных воздействий, названных тесто- выми сигналами - гармонический сигнал вида wosin((o/ + ср) и ступенчатая функция вида Uq- !(/) определяемая соотношениями (1.2.16). Эти две функции позволили сформулировать фундаментальные понятия переходного про- цесса и частотного оператора. Однако они далеко не исчерпывают многообразия внешних воздействий, достаточно привести пример функции u(t) = /. Для расширения возможно- стей исследования линейных систем весьма полезными оказываются методы операционного исчисления, в основании которого находится интегральное преобразование Лапласа* ра Дробно-рациональная функция парамет- W(p) = М(р) N(p) (1.2.20) 00 £{/(')} = F(p) = J /(Пе-"Л, (1.2.18) О для существования которого достаточно, чтобы порядок роста оригинала flj) не превосходил порядка некоторой экспоненциальной функ- ции ес/, где с - вещественная константа. Такое условие охватывает достаточно широкий класс внешних воздействий, встречающихся в при- кладных задачах исследования динамических систем. Методы операционного исчисления удобны также тем, что при обращении к ним наиболее просто учитываются начальные усло- вия, т.е. значения координат состояния в на- чальный момент времени t = 0. Методы клас- сической теории дифференциальных уравне- ний также достаточно хорошо разработаны, и для получения решения уравнения линейной системы можно было бы и не обращаться к операторным методам. Но эти методы образу- ют естественное развитие частотного подхода и дают возможность расширить также понятие частотного оператора. В дальнейшем мы будем пользоваться односторонним преобразованием Лапласа (1.2.18), при котором предполагается, чтоД/) = 0 при t < 0. Сформулируем понятие передаточной функции динамической системы, описываемой уравнением (1.2.7). В отношении управляю- щего воздействия положим, что в начальный момент t = 0 и i/(v) = 0, v = 1, 2, 3, ..., п. Тогда с учетом начальных условий для управ- ляемой координаты, преобразуя по Лапласу обе части уравнения, имеем называется передаточной функцией по отно- шению к управляющему воздействию. Мы используем для ее обозначения символ FF, так как она получается из частотного оператора формальной заменой усо на р. Второе слагаемое в выражении (1.2.19) также является дробно-рациональной функци- ей р с тем же знаменателем и соответствует начальным условиям. В частности, при нуле- вых начальных условиях из (1.2.19) следует «.!.!> т.е. передаточная функция линейной динамиче- ской системы - это отношение преобразований Лапласа выходной и входной координаты при нулевых начальных условиях. Порядок полинома V(p) не выше п - 1, и коэффициенты его суть линейные комбина- ции начальных условий и коэффициентов исходного уравнения (1.2.7). В теории автоматического управления различают также передаточные функции по отношению к ошибке и к возмущающему воз- действию. Для того чтобы дать определение, обратимся к структурной схеме (рис. 1.2.6). К такой схеме сводится большинство автома- тических систем при некоторых обобщениях понятия регулятора с передаточной функцией и объекта регулирования F₽o(p). На выход объекта кроме выходного сигнала регулятора z(/) влияет возмущающее воздейст- вие Д/) (помеха, паразитная генерация, внеш- нее силовое воздействие и др.). Согласно оп- ределению передаточных функций ДО = ^„(р) Е(р); ДО = fF0(P) (ДР) + ДО); дополнив эти равенства уравнением замыка- ния Е(р) — U(p) - Х(р), получаем N(p) Х(р} = М(р) U(p) + V(p) или Х(р) = У(Р) N(P)' (1.2.19) * Операционное исчисление может был» построено и без использования преобразова- ния вида (1.2.18). Рве. 1.2.6. Структурная схема с утфавляхмцим и(0 возмутцаямцямДО мздейстмяма
КЛАССИФИКАЦИЯ ЭЛЕМЕНТОВ АВТОМАТИЧЕСКИХ СИСТЕМ 29 Х(р) = ^(pWP(p) U(p) + w F(pY l^Wp(p)WM w (1.2.22) Здесь выделены передаточная функция по отношению к управлению U(p) и передаточная функция по отношению к возмущению F(p) (множитель при изображении Д/)). Используя снова уравнение замыкания, исключим изображение выходной величины из (1.2.22): ад = Т^№)^) + ^о(Р) l + ^(p)Fr0(p) (1.2.23) Множитель в первом слагаемом называют передаточной функцией по отношению к ошибке. Все три упомянутые передаточные функции имеют одинаковый знаменатель, куда входит произведение Wo(p) ^р(Р) последовательно соединенных звеньев. Нетрудно показать, что любое число последовательно включенных звеньев с передаточными функциями W/(p) (i = 1, 2, 3, ..., п) эквивалентно одному звену с передаточной функцией, равной произведе- нию W\(p) ... Wn(p). Параллельные соединения звеньев с передаточными функ- циями Н/(р) (/ = 1, 2, 3, ..., л) эквивалентно также одному звену, но с передаточной функ- цией, равной сумме ^(р) + + ... + + Wn{p). При нулевых начальных условиях и ра- зомкнутой обратной связи передаточная функ- ция систем становится равной Wp(p) W$(p). 1.2.6. КЛАССИФИКАЦИЯ ЭЛЕМЕНТОВ АВТОМАТИЧЕСКИХ СИСТЕМ ПО ВИДУ ПЕРЕДАТОЧНЫХ ФУНКЦИЙ Согласно основной теореме высшей ал- гебры [10] полиномы М(р) и N(p) в числителе и знаменателе дробно рациональной функции (1.2.20) можно разложить на множители, т.е. М(р) = Ьй(р - Hl) (р - ц2) ... (р - цж); N(p) = <ю(р - Xi) (р - Х2) ... (р - Х„), где и X/ - корни уравнений М(р) = 0 и МР) - 0. В случае вещественных коэффици- ентов л/ (Z = 0, 1, ..., п) и (к = 0, 1, ..., т) корни ц* и X/ представляют собой веществен- ные числа, либо попарно сопряженные ком- плексные. Объединяя скобки с комплексными корнями попарно, можно выделить в качестве элементарных сомножителей квадратные трех- члены вида р2 - 2oifcP +0£ - в числителе и р2-25/р + у2 - в знаменателе. Указанное разложение передаточной функции на элемен- тарные множители и служит основанием для классификации. Всего можно выделить шесть элементов, получивших специальные наиме- нования. При этом стандартным видом этих множителей считают такой, у которого сво- бодный член (не содержащий р) равен едини- це. 1. Апериодическое звено. Передаточная функция где Г - постоянная времени, с; таким образом, произведение 7)? - безразмерная величина. Частотные характеристики выражаются формулами: Л(®) = 1 71+г2©2 - амплитудно-частотные и 0(ю) = arctgT© - фазочастотные. Выделив вещественную «(©) и мнимую v(©) частотные характеристики, можно по- строить годограф апериодического звена, имеющий вид полуокружности, касающейся мнимой оси в точке (0, 0) (рис. 1.2.7, а). Ре- акция звена на ступенчатое входное воздейст- вие (рис. 1.2.7, б) Рис. 1.2.7. Характеристики апериодического звена: а - годограф; б - переходный процесс
30 Глава 1.2. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ НЕПРЕРЫВНЫХ СИСТЕМ МО = 1-е'*. Предельное значение сдвига гармонического сигнала по фазе при ® -> оо равно 90° (выход- ной сигнал запаздывает). Физическими примерами апериодиче- ских звеньев служат электродвигатель (входной сигнал - управляющее напряжение, выходная координата - угловая скорость вращения рото- ра) и RC - цепочка (рис. 1.2.8, а) 2. Колебательное звено. Передаточная функция W(p) = , у- 1-------, Т2р2 +2^7J>+1 где Т - постоянная времени; £ - коэффициент демпфирования. Амплитудно-частотная характеристика Л(в>) = -----------------. ^(1- Т2в>2) +(2^т<о)2 Фазочастотная характеристика 0(<о) = arctg—(1-2.24) 1-Т2ш2 Вычисление фазочастотной характеристики имеет одну особенность. При значениях ® > > 1 / Т сдвиг по фазе становится отрицатель- ным, если пользоваться углами первой четвер- ти в соответствии с определением функции arctg. По этому правилу работают все вычисли- тельные машины. Это приводит к результатам, противоречащим физике прохождения сигнала через колебательное звено, 6) Рис. 1.2.8. RC-цеш, реалжзукмцк: а - апериодическое звено; б - колебательное звено так как с ростом частоты сдвиг по фазе должен монотонно увеличиваться в сторону запазды- вания. Поэтому при ® > 1 / Т алгоритм вы- числения фазового угла следует построить по правилу 0(®) = 180° - 0(ю), где 0(ю) - угол, вычисляемый по формуле (1.2.24). Амплитуд- ная характеристика имеет максимум при 0>=yVl-21j2- При нулевом демфировании (звено в этом случае называют консервативным) резо- нансный пик переходит в разрыв характери- стики. При увеличении £ в интервале 0 £ £ £ <, 1/2 максимум функции Л(ю) становится меньше и смещается влево, пока при £ = 1/2 не займет крайнего положения на частоте ® = = 0. При дальнейшем увеличении £ максимум Л(®) остается в точке ® = 0, но уже не соот- ветствует условию А' (®) = 0, так как произ- водная становится отрицательной. Если демп- фирование £ > 1, то колебательное звено сле- дует рассматривать как два последовательно включенных апериодических с постоянными времени и Годограф подходит к*точке (0, 0), касаясь вещественной оси, т.е. предельное значение сдвига фаз равно 180°. Переходная функция вытекает из выра- жения для W(j>)/p или в форме с фазовые углом Простая физическая реализация колеба- тельного звена представляется цепочкой из индуктивности, активного сопротивления и емкости. Падение напряжения на емкости
КЛАССИФИКАЦИЯ ЭЛЕМЕНТОВ АВТОМАТИЧЕСКИХ СИСТЕМ 31 связано с общим падением напряжения соот- ношением (рис. 1.2.8 б) LC + RC + хг = хь а2 л Рассеяние энергии происходит на сопротивле- нии Я которое связано с коэффициентом демпфирования £ прямой зависимостью. 3. Интегрирующее звено. Некоторые из корней знаменателя пере- даточной функции N(p) могут оказаться нуле- выми. В таком случае это элементарные звенья с передаточной функцией Такие звенья называют интегрирующими, и это наименование непосредственно связано с переходной функцией t Л(/) = / = J 1(г)Л. О Годограф интегрирующего звена пред- ставляет мнимую отрицательную полуось. Фа- зовая характеристика не зависит от частоты и равна 90°. В качестве примера интегрирую- щего звена можно указать на электрический исполнительный двигатель, если за входную координату принять управляющее напряже- ние, а за выходную - угол поворота ротора. При этом нужно пренебречь переходным про- цессом из-за инерционности ротора. Другой пример - электронный усилитель с очень большим коэффициентом усиления с емко- стью в обратной связи. Такая схема интегриру- ет входное напряжение, если выходной сигнал не достигает своего предельного значения (рис. 1.2.9). 4. Дифференцирующее звено первого порядка. Так называют элементарное звено с пе- редаточной функцией W(p) = 1 + Тр, соответствующей вещественному корню поли- нома М(р) в числителе передаточной функции Рас. 1.2.9. Интегратор аналоговой ЭВМ: к - коэффициент усиления Амплитудно-частотная характеристика Л(ю) = V1 + Г2©2 - монотонно возрастающая функция частоты. Это указывает на то, что реализация диффе- ренцирующего звена с помощью пассивных технических устройств, т.е. устройств, не со- держащих источников энергии принципиально невозможна. Фазочастотная характеристика 0(ю) = arctgT© в отличие от апериодического звена сдвигает выходной сигнал по отношению к входному в сторону опережения с предельным значением сдвига 90°. Годограф представляет собой полу- прямую, параллельную мнимой оси для поло- жительных значений. Изобразить переходную функцию в дан- ном случае невозможно из-за формальных трудностей дифференцирования разрывной функции 1(/), производная которой определе- на всюду, кроме точки t = 0. Преодолеть эти трудности можно с помощью предельного перехода, рассматривая последовательность дифференцируемых функций вида lim | — + — arctgcrx ] = 1(/). о->оо к 2 It ) Дифференцируя левую часть этого равенства и затем переходя к пределу, получим одно из выражений для 5-функции, которая, таким образом, является обобщенной производной от функции !(/)> 5(/) = 1од1 о->оо л(1 + (Т2Х2) После этого можно записать выражение для переходной функции дифференцирующего звена первого порядка Л(/) = 75(0 + 1(0. Сигнал производной технически реали- зуется в различных дифференцирующих уст- ройствах (рис. 1.2.10, а). Напряжение на щет- ках тахогенератора пропорционально скорости вращения его ротора, т.е. и = Л^ф. Переда- точная функция ЯС-цепочки (рис. 1.2.10, б) имеет вид %2(Р) _ RCP Х\(р) \ + RCp' При низких частотах, когда можно пре- небречь произведением RCp по сравнению с единицей,
32 Глава 1.2 МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ НЕПРЕРЫВНЫХ СИСТЕМ в) Рис. 1.2.10. Принципы реализации операции дифференцирования: а - тахогенератор; б - ЛС-цепочка; в - следящий координатор W(p) = Т2р2 4- + 1 соответствует паре комплексных сопряженных корней полинома М(р) (1.2.20). Это звено также нереализуемо с помощью пассивных устройств. Его амплитудно-частотная характе- ристика Фазочастотная характеристика 0(<о) = arctg 2^ 7<о / (1 - 7^со2) в пределе сдвигает сигнал на 180° в сторону опережения. Нетрудно вычислить годограф в виде кривой второго порядка. Переходная функция с помощью обобщенных производ- ных имеет вид А(0 = Г^ +2^75(/) +КО- Сигнал по второй производной, как пра- вило, связан с измерением различных силовых факторов, которые благодаря второму закону Ньютона пропорциональны соответствующим угловым или линейным ускорениям. На рис. 1.2.11 изображен датчик линейных ускорений. Смещение грузика массой /л, который одно- временно служит поршнем демпфирующего устройства, Эти устройства не обладают, разумеется, пере- даточной функцией (1.2.25). Однако, комби- нируя сигнал с его производной, можно полу- чить искомую зависимость Приведем одну из оригинальных схем дифференцирования с помощью интегрирующего элемента (рис. 1.2.10, в). Из схемы следует уравнение ix2 +x2=xi. Очевидно, при достаточно большом коэффи- циенте усиления к выходная координата х2 почти равна входной. В то же время на выходе усилителя сигнал равен производной х2 и приближенно равен производной входного сигнала Xj. Такая схема используется при сопровождении различных перемещающихся в пространстве объектов, в частности, при наве- дении по методу пропорциональной навига- ции [1.3]. 5. Дифференцирующее звено второго по- рядка. Передаточная функция этого звена и при достаточно малом демпфировании f преобразуется в сигнал м, пропорциональный измеряемому ускорению. 6. Пропорциональное звено с передаточ- ной функцией W(p) = к, равной константе, осуществляет безынерционное преобразование, что является идеализацией реальных процес- Рис. 1.2.11. Датчик линейных ускорений
МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ ЛИНЕЙНОЙ СИСТЕМЫ 33 сов. Примерами пропорциональных звеньев служат электронные усилители, редукторы, механические трансмиссии, всевозможные датчики, чувствительные элементы. Описывая элемент автоматической системы как пропор- циональный, мы делаем определенные допу- щения. Например, в случае редуктора таким допущением является отсутствие зазоров в зубчатом зацеплении. Электронные усилители в действительности обладают некоторым пере- ходным процессом и т.д. Проверка справедли- вости допущений не является, вообще говоря, элементарной задачей и тесно связана с про- блемой идентификации математических моде- лей. 1.2.7. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ ЛИНЕЙНОЙ СИСТЕМЫ С ПОМОЩЬЮ ИНТЕГРАЛА СВЕРТКИ Как было установлено в предыдущем па- раграфе, 5-функция является обобщенной производной от единичной ступенчатой функ- ции 1(1)* Для соответствующего предельного перехода можно использовать различные кон- структивные построения. В частности, в каче- стве такого весьма простого подхода можно рассмотреть последовательность прямоуголь- ных импульсов вида Очевидно, что при п —> оо предельная функ- ция последовательности 5Л(/) обладает извест- ными формальными свойствами 5-функции: 5(0 = 0 при /#0, оо при t = О и о° J b(t)dt = L -00 Благодаря принципу суперпозиции реак- ция линейной системы на входное воздействие 5Л(/) имеет вид М') = »Л(0-Ф-7 Переходная функция h(f) принадлежит к классу дифференцируемых. Поэтому, переходя к пределу при п -> оо, получаем где £(/) - импульсная переходная, или весовая функция линейной динамической системы. Она равна производной от переходной функ- ции Л(1). Произвольную ограниченную (не обяза- тельно непрерывную) функцию м(1) можно рассматривать как сумму “(<) = / = —СО Обращаясь снова к принципу суперпозиции, найдем реакцию системы на воздействие u(fy. x(t) = J u(x)k(t - x)dt. (1.2.26) -00 Полученное выражение известно в тео- рии линейных цепей как интеграл Дюамеля. Рассматривая значения м(1) отличные от нуля лишь при положительных значениях /, запи- шем (1.2.26) в виде х(Г) = J u(x)k(t - т) А. (1.2.27) О По физическому смыслу функция k(f) равна нулю при / £ 0, т.е. верхний предел в (1.2.26) можно заменить на t t x(t) = J u(x)k(t - т) A. (1.2.28) 0 Мы получили связь между входной u(f) и выходной х(0 координатами, не обращаясь к аппарату преобразования Лапласа. В дейст- вительности между обоими методами сущест- вует простая связь. По определению переход- ной функции !{*(/)} = jw(p). По теореме об изображении производ- ной ЦЩ)} = W(p). (1.2.29) Таким образом, весовая функция - это ориги- нал для передаточной функции. Найдем теперь изображение выходной координаты х(/) из (1.2.28): 00 t Х(р) = | м(т)е_;пА| k(t - x)t~^~^dt О о или, согласно (1.2.29) А(р) = U(p)W(p). 2 Зак 1023
34 Глава 1.2. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ НЕПРЕРЫВНЫХ СИСТЕМ В математике интеграл в формуле (1.2.28) называется сверткой функций u(f) и k(f). Выражение (1.2.29) можно получить и другим путем. Благодаря фильтрующему свой- ству 5-функции ее изображение = 1. -00 Так как k(f) - это реакция на 5-функцию, то ее изображение находят как произведение W(p) • 1, т.е. (1.2.29). Итак, выражения (1.2.29) и (1.2.21) в оп- ределенном смысле равносильны, а весовая функция k(f) так же, как и передаточная, пол- ностью определяет динамические свойства линейной системы. В зависимости от функ- ционального назначения входной и выходной координат различают весовые функции по отношению к управляющему воздействию, по отношению к ошибке, к начальным условиям. Пример 1.2.2. В момент времени / = 0 на управляющую обмотку исполнительного дви- гателя с постоянной времени Т подается на- пряжение u(f) = .dsinco/. Требуется найти за- кон изменения угловой скорости Q(/) враще- ния ротора, пользуясь весовой функцией. Решение. Из выражения для передаточной функ- ции, которое следует из уравнений (1.2.2), 1 + 7J> следует, что весовая функция *(0 = уе'*, ПО. Подставив в (1.2.28) выражение для управляющего сигнала и для весовой функции, имеем Q(/) = sincoTcft, О или после вычисления интеграла Q(0 = sin(<o/ + arctgTco) - Vl + T2co2 AkxoT -I ’1 + T2/ ’ На рис. 1.2.12 показана зависимость Q(/) и ее составляющие, соответствующие устано- вившемуся движению и влиянию начальных условий. Рве. 1.2.12. Переходный процесс н его соспшлякмцне 1.2.8. ПЕРЕДАТОЧНЫЕ ФУНКЦИИ ДВУМЕРНЫХ СЛЕДЯЩИХ СИСТЕМ. КОМПЛЕКСНЫЕ КООРДИНАТЫ Уравнения двумерной системы сопрово- ждения (1.1.1) записаны в скалярной форме. На рис. 1.2.13 изображена структурная схема, соответствующая этим уравнениям. Учитывая условия замыкания, запишем +-4F2 = *(*i -л); 1У2 + - Ну\ = к(х2 - у2). Умножив второе уравнение на j = 7-Т и сложив с первым, найдем Гу + ty - jHy = k(x - у), (1.2.30) ще у = У1 + jyi и х = Xj + jX2 - комплекс- ные координаты двумерной системы. Преобра- зуем (1.2.30) по Лапласу при нулевых началь- ных условиях. Согласно определению переда- точной функции (1.2.20) имеем Г(Р)___________к Х(Р) Ip1 +(E,-jH)p + k' Рис. 1.2.13. Струпурная схема следящей системы с пфоскопяческям нсполшггельиым элементом
ПЕРЕДАТОЧНЫЕ ФУНКЦИИ ДВУМЕРНЫХ СИСТЕМ 35 В данном случае не все коэффициенты знаменателя являются вещественными числа- ми. Поэтому корни знаменателя не обладают свойством взаимной сопряженности. Для квадратного уравнения с комплекс- ными коэффициентами остается справедливой известная формула вычисления корней ±^2-Я2 -4*Г->2^я). Последнее выражение можно привести к виду, когда под знаком радикала будут только вещественные величины. Обозначив для крат- кости а = £2 - - 4kl, Р = -2£17, имеем Таким образом, в общем случае передаточную функцию двумерной системы можно привести к виду Р ^(р)=4 -т-----------х р П(^->+а/) /=1 Q П(Т*Я + 7 + Р*) (1.2.31) П(7’«./’+>+а») т=1 Кроме уже знакомых элементарных со- множителей - пропорционального и интегри- рующего, полученных для одномерных систем, здесь появляются еще четыре разновидности ранее не встречавшихся сомножителей. В со- ответствии с принятой терминологией их на- зывают апериодическими и дифференцирующими элементами передаточной функции с ком- плексными коэффициентами. 1. Апериодические звенья с комплекс- ными коэффициентами - это звенья с переда- точными функциями »Г(р) = 1 7>-/+а и ^(р) = 1 Тр + j + а ’ С этими передаточными функциями со- поставляются структурные схемы (рис. 1.2.14). Они различаются знаками перекрестных свя- зей в скалярном варианте или знаками в об- ратной связи в векторном варианте. Рис. 1.2.14. Структурные схемы, реализующие передаточные функции звеньев с комплексными коэффициеигами [14]: а - апериодического; б - дифференцирующего 4? 2*
36 Глава 1.2. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ НЕПРЕРЫВНЫХ СИСТЕМ Для получения частотных характеристик звеньев с комплексными коэффициентами достаточно положить р =jas. Например, И» =-------± v 7 а + у(Т© - 1) Амплитудно-частотная характеристика Л(©) = (а2 + (Т© - 1)2) Фазочастотная характеристика . Тео - 1 0(со) = -arctg—-—. При изменении частоты в пределах -оо < со < +оо конец вектора IF(/©) в коорди- натах U = Re И4, V = Im W опишет годограф. В случае апериодического звена это будет ок- ружность. Действительно, полагая после очевидных преобразований получаем уравнение смещенной окружности. Как и в случае обычного апериодического звена, эта окружность касается мнимой оси, но оциф- ровка по частоте уже несимметрична относи- тельно вещественной оси (рис. 1.2.15, а). Лег- ко проверить, что при замене частоты со на (2 / 7) - со частотный оператор 1К(/со) заме- няется на комплексно-сопряженный / 2 4т (1.2.32) Для того чтобы сформулировать понятие о переходной функции звена с комплексными коэффициентами, необходимо ввести опреде- ление двумерного ступенчатого воздействия х(/) = 1(/) е/₽ = 1(/) (coscp 4- j sinep), где ф - некоторый постоянный угол. Реакцию звена на такое воздействие на- ходят из дифференциального уравнения Г ^-+(>+«)> = l(Z)e*. Изображение выходной координаты име- ет вид 1 Т р Tp + j + a Отсюда непосредственно следует запись для переходной функции *(') = -+- ко-+И = J +«v > лЛР ( al ( t f \А =---- 1(0 “ eT cos— + у sin — , y+al I T TJ) которое при необходимости можно предста- вить в скалярной форме, выделяя веществен- ную и мнимую части. 2. Дифференцирующее звено с ком- плексными коэффициентами. Как и в предыдущем случае, возможны две разновидности передаточных функций из числителя функции НХ/со) (1.2.31): IF(p) = tp +j + Р Рис. 1.2.15. Годографы частотных операторов с комплексными коэффициентами звеньев: а - апериодического; б - дифференцирующего
МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ МНОГОМЕРНЫХ СИСТЕМ 37 ИЛИ WW = V -j + А Эти две разновидности звеньев также имеют структурные схемы с перекрестными связями, но на этот раз связи не обратные, а прямые (см. рис. 1.2.14). Заменой р в усо по- лучаются две разновидности частотного опера- тора = У(Т0) ± 1) + р, откуда следуют выражения для амплитудной Л(со) = [(по ± I)2 + р2]1/2 и фазовой частотных характеристик 0(со) = arctg(To) ± 1) / р. Годограф представляет собой прямую, параллельную мнимой оси (рис. 1.2.15, б) с тем же нарушением симметрии в оцифровке. Справедливо свойство (1.2.32), установленное для апериодического звена. Для вычисления переходной функции необходимо обратиться к дифференциальному уравнению TJ+(>+₽>=>'> из которого следует искомое решение вида • й(0 = твфе* + (/ + р)1(/)е = = T8(0e-* + 1(071 + Р2 х (. . о х exp^ yep + arctg —J. Здесь комплексный множитель при 8-функции при переходе к скалярной записи распадается на тсо$ф и Tsimp - компоненты интенсивности 6-импульсов. Преобразуя (1.2.33) по Лапласу, можно получить систему линейных алгебраических уравнений относительно изображений коор- динат. Так как ранг этой системы равен л, то могут быть составлены отношения фл(/,)=^’(/=1’2......"); ф^) = л^’(г=1,2......и) для каждого управляющего и возмущающего воздействия. Эти отношения называют переда- точными функциями. Совокупность переда- точных функций записывается в виде переда- точной матрицы ФцОО Ф12ОО ••• Ф1я0») ф(р) = ^210») Ф22ОО ••• ФгаОО фЛ10>) ФлгО») Фи О’). по управляющим, а также ФйОО Ф1г0») ••• ФкОО' ф'0») = Ф21 О’) Ф22ОО - ФЬ.О’) ФмО») ФлгО») ФмО). - по возмущающим воздействиям. Поскольку все элементы- передаточных матриц линейной системы являются дробно- рациональными и, следовательно, интегрируе- мыми функциями, то Умножая каждый эле- мент на е/* и интегрируя, можно получить матрицу, состоящую из импульсных переход- ных функций, которую называют импульсной переходной или весовой матрицей. Например: 1.2.9. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ МНОГОМЕРНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ В скалярной форме уравнение много- мерной замкнутой системы можно записать в виде к=1 к=1 г.1 (/= 1, 2..») (1.2.33) где - управляемые координаты; - управ- ляющие или задающие воздействия; fr - воз- мущающие воздействия; ацАР)у Ь^Цр), c^ip) - полиномы символа />, который в данном слу- чае рассматривается как символ дифференци- рования. с+> |фООе"ф = К(П = c-Jco *н(0 *12(0 - *1л(0" *21(0 *22(0 - *2п(0 А1(0 *„2<0 ••• ^лл(0. Техника вычислений передаточных и ве- совых матриц особенно экономно выглядит в матричной записи уравнений (1.2.33): А(р)х(0 = B(p)g(l) + (1.2.34) Преобразуя по Лапласу (1.2.33), имеем А(р)Х(р) = B(p)G(p) + C(p)F(p), откупа
38 Глава 1.3. ЧАСТОТНЫЕ МЕТОДЫ АНАЛИЗА АВТОМАТИЧЕСКИХ СИСТЕМ Х(р) = A-l(p)B(p)G(p) + A-l(p)C(p)F(p) или в соответствии с правилами вычисления обратной матрицы X(f) - + det А(р)' + A*(p)C(p)F(p)). Пример 1.2.3. Пусть уравнение (1.2.34) имеет вид "11(f) "12(F)] Г*1 (01 "21(F) "22(F)J [*2 (О J _ [411(F) 412(F)] Г«1(0] + L*21(F) *22 (F) J [«2(0j + ["11(F) "12(F)] 171(0' ["21(F) C22(F)J [/2 (0. ’ Найдем передаточную матрицу Ф(р) и Ф'(р) соответственно для управляющих и воз- мущающих воздействий. Присоединенная матрица "22(F) -"12(F)' .-"21(F) "11(f). A*(f) = и определитель матрицы А(р) detA(p) = ац(р) аиО») - ап(р) a2i(p). Изображение вектора координат состоя- ния выражается через изображение векторов управлений и возмущений после умножения слева на матрицу А-1(р): 7(F) x2(f). = (1/Д)А’(р) Г4ц(/>) L*21(F) + (1/д)а’(/>) "11(F) "21(F) 412 (f) 7(F) 422(F). 7(F). "12(F)' 17 (f)] "22(F)] >2(F)J’ ще Д = вц(р) O22(p) - an(p) "21(f)- Таким образом, передаточная матрица по управляющему воздействию ф(р)=ГФ11(/,) ф,2(р) Р L«21(F) Ф22 (P)j где Фц(р) = ^-("22(f)4ii(f) - ап(р)Ь21(р)); ®12(F) = -^("22(f)4i2(f) - "12(F)422(F)); Фг^Р) = ^-(- "21(F)411(F) + "n(P)421(P)); Ф22<Р) = ^•(-"21(f)4i2(p) + "ii(f)422(p)); Д = "h(f) an(p) - "12(f) "21(p)- Элементы матрицы Ф*(р) получаются из элементов Ф(р) заменой на (i, к = 1, 2, ...). Исследования точности, устойчивости и качества многомерной системы можно прово- дить так же, как и в одномерном случае, раз- бив ее на отдельные каналы. Однако сущест- вуют и работы, обобщающие методы, развитые для одномерных систем. Глава 1.3 ЧАСТОТНЫЕ МЕТОДЫ АНАЛИЗА АВТОМАТИЧЕСКИХ СИСТЕМ 1.3.1. ЛОГАРИФМИЧЕСКИЕ ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ * Несмотря на современное развитие мето- дов вычислительной математики и вычисли- тельном техники, графоаналитические методы анализа динамических систем до сих пор имеют определенное распространение. Со временем произошло лишь смещение акцентов использования этих методов. В самом начале становления частотных методов с помощью графиков получали значения параметров при конструировании автоматических систем. В современных условиях графические приемы служат для суждения о принципиальной воз- можности требуемых показателей качества при заданной структурной схеме. Определенная гибкость и простота графических построений позволяет сравнительно быстро выбрать наи- более приемлемый вариант структуры, набора необходимых элементов, а также увидеть целе- сообразный способ коррекции свойств проек- тируемого устройства. В линейной теории систем автоматиче- ского управления в задачах анализа и синтеза часто используют логарифмические частотные характеристики (ЛЯХ). Для их графического изображения по оси частот наносят логариф- мическую шкалу с оцифровкой в обычных единицах (Гц или рад/с). Расстояние между произвольным значением частоты со и ее зна- чением, отличающимся в 10 раз, называют декадой. Двукратное изменение частоты соот-
ЛОГАРИФМИЧЕСКИЕ ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ 39 ветствует октаве (см. рис. 1.3.1). В логариф- мическом масштабе обычно изображают ам- плитудно-частотную и фазочастотную характе- ристики. При этом значение амплитуды вы- ходной координаты измеряется в единицах амплитуды входа также в логарифмическом масштабе. Десятичный логарифм отношения lg%2 / X} измеряется в белах (Б). Эти единицы измерения заимствованы из физики и вытека- ют из закона Вебера-Фехнера, связывающего громкость и силу звука. Аналогичная зависи- мость существует между звездной величиной и освещенностью, создаваемой светилом. Лога- рифмический масштаб дает возможность охва- та сравнительно больших диапазонов изобра- жаемых величин. В теории автоматического управления обычно используют в качестве основной единицы децибел (дБ). Измеряют отношения величин Х2 и Xj в дБ с помощью коэффициента 20, а не 10, как это принято в физике: (х2 / *1), дБ = 201g(x2 / Х1). (1.3.1) Это объясняется тем, что в теории управления большей частью рассматриваются кинематиче- ские факторы, которые связаны с энергией квадратичным соотношением (например, ки- нетическая энергия тела массой т, движуще- гося со скоростью V, равна mv2 / 2). В даль- нейшем в соотношении вида (1.3.1) предпо- лагается, что Xi = 1. Фазочастотную характеристику принято выражать в градусах с равномерной оцифров- кой (см. рис. 1.3.1). Помимо экономии места при изображе- нии больших интервалов частот и амплитуд использование логарифмического масштаба приводит к выпрямлению характеристик звеньев в области высоких и низких частот. Рис. 1.3.1. Логарифмические характеристики апериодического звена Это весьма удобно при графических построе- ниях, и при определенном навыке характери- стики можно строить "на глазок" даже без линейки, но, разумеется, на предварительно заготовленной логарифмической сетке. Рассмотрим логарифмические характери- стики элементарных звеньев, начиная с апе- риодического (рис. 1.3.1). В соответствии с изложенной методикой выразим в децибелах амплитудно-частотную характеристику 201g А (со ) = -201g 71 + 7'2<о2. Очевидно, при со -> 0 величина 201gH(<o) так- же стремится к нулю (низкочастотная асим- птота). При со -> оо асимптотическое поведе- ние характеристики выражается формулой 201gH(<o) - -201g Тео. Обе асимптоты пересекаются в точке с часто- той со = 1 / Т. При этом 201gH(l / 7) = =-201gV2 = -3 дБ. Такая поправка часто ока- зывается пренебрежимо малой. Частотные* характеристики, не учитывающие поправки называют асимптотическими. У апериодиче- ского звена высокочастотная асимптота имеет наклон - 20 дБ на декаду или -6 дБ на октаву. Частотные характеристики колебатель- ного звена образуют семейство кривых для различных значений параметра %. Высокочас- тотная амплитуда имеет наклон -40 дБ на де- каду (-12 дБ на октаву). Фазочастотная харак- теристика увеличивает крутизну вместе с уменьшением параметра £ (рис. 1.3.2). Все вы- Рис. 1.3.2. Логарифмические характеристики колебательного звена
40 Глава 1.3. ЧАСТОТНЫЕ МЕТОДЫ АНАЛИЗА АВТОМАТИЧЕСКИХ СИСТЕМ числения для построений выполняются по формулам (1.2.24). Благодаря свойству логарифмов характе- ристики дифференцирующих звеньев первого и второго порядка отличаются лишь знаком от характеристик соответственно апериодического и колебательного звеньев. Характеристики интегрирующего и пропорционального звеньев строятся еще проще. В частности, амплитудно- частотная характеристика интегрирующего звена - это прямая с постоянным наклоном -20 дБ на декаду, проходящая через точку со = = 1, Л (со) = 0 дБ. 1.3.2. ЛОГАРИФМИЧЕСКИЕ ХАРАКТЕРИСТИКИ РАЗЛИЧНЫХ СОЕДИНЕНИЙ ЭЛЕМЕНТАРНЫХ ЗВЕНЬЕВ Построение логарифмических характери- стик цепочки последовательно соединенных звеньев не вызывает затруднений. Передаточ- ная функция цепочки, состоящей из звеньев с передаточными функциями И%>) (/ = 1, 2, ..., л), равна произведению ИИ» = Ж1(р) и/2(р)... %(р). Записывая частотные операторы в форме ИХ/о>) = 4(<») еЛ'<ш>. получаем Л(со) = Л1(со) Л2(со) ... Лл(со), откуда следует правило суммирования: п 2OlgJ(<o) = 20^21g (<о). /=1 Очевидно, что правило сложения спра- ведливо и для фазовых частотных характери- стик последовательного соединения, т.е. п /=1 Рассмотрим правило получения характе- ристик при параллельном соединении и при замыкании системы отрицательной обратной связью. Связь между частотными операторами разомкнутой и замкнутой систем задается формулой Ф(усо) = । 3 2) V 7 l + FFO) U f Если представить операторы в показа- тельной форме: Ф(/со) = Л(со)е/ф(“); то для расчета амплитудной и фазовой частот- ных характеристик замкнутой системы получа- ем (13.3) ср(©) = arctg[sin0 / (Н+ cos0)]. Если требуется получить Л(©) в децибе- лах, вместо символов Н и А в формулы (1.3.3) следует подставить соответственно 10^/20 и 104/20 Тогда рабочие формулы для получения логарифмических частотных характеристик замкнутой системы имеют вид 2OlgH(co) = - 101g(l + 10-^/Ю + + 2 • 1O-^/2ocos0); ср(©) = (sin0 / 10^/20 4- COS0). Построение номограммы для перехода от ха- рактеристик разомкнутой системы к характе- ристикам замкнутой осуществляется по фор- мулам, получаемым путем обращения соотно- шений (1.3.3): Я (со) = 20 _________(13.4) А £ 1; |о - 180°| < arccos^l- 1 / Л2. Igf - cos0 ± Jcos20- 1+1/Л2j; Полагая в (1.3.3) Л = const, получаем однопараметрическое семейство графиков Н — = Н(а). При Л < 1 угол 0 в (1.3.4) может принимать любое значение, а перед радикалом будет знак "+". Аналогично для линий ф = const из (1.3.3) находим Н = 2Olg(sin0 / tgф - cos0), (1.3.5) |18о° - е| < <р. Из формул (1.3.4) и (1.3.5) следует, что графики H(Q) при Л = const и ф = const суть периодические функции 0, симметричные относительно линии 0 = 180®. Поэтому при построениях достаточно ограничиться интер- валом 0® £ 0 £ 180® (рис. 1.3.3). Кроме того, при малых значениях Н((&) вектором FF(/o)) в знаменателе выражения (1.3.2) можно пренеб- речь по сравнению с единицей. Это означает, что линии Л = const и ф = const практически совпадают соответственно с линиями Н = = const и 0 = const.
ЛОГАРИФМИЧЕСКИЕ ХАРАКТЕРИСТИКИ ЭЛЕМЕНТАРНЫХ ЗВЕНЬЕВ 41 Фаза 6(ы) -Ж°-ЗХГ-2К°-г<Л9 ~180° -120°-д0°-40° 0° Н,0Б 32 28 24 - -to (OfiOD 20 16 НК9Г<11 111ДО Iffirauil Vfth са II 12 8 Ulf-I a III- vr. -л и на л /г -. ги_1~2-° МОИИ1"1 I г в^л" । нял?» тмш и 111ГЛ* ЖЙ III ihtt&^LVIlll fi\v 1ИГАЯК&4Ч1 4 О -4 -8 -12 -16 —20 III»liSfc«' VHL’Z/z II II »|1ЕИНК'Лй’гг'1« а’ммами и we гвжжатлшвд:: ($Ш) ($16) (0,178) и1ии«1й;2'Ч1ии«и2Е1’Е1!!! illlSHaBWeieiieeilBieeB^'.SlII IIIIIBIII IIII1II1IIIIII ши lalllllllllllll ши 1а»мт|Ди11им»» ши (0^079) —24 ^«Г-Й^-Ю^-б^-^гО9 60° 100° Ш)° 180° -160°-120о-80о-40о 40° 80° 120° 160° Избыток (разы Рис. 1.3.3. Номограмма для построения частотных характеристик при замыкании обратной связно При больших значениях Я(со) из той же формулы (1.3.2) следует, что Ф(/Ф) = 1. Это соответствует значениям Л (со) - 0 дБ и ср = 0°. Поэтому при построении номограммы можно ограничиваться интервалом изменения функ- ции Н = ± 30 дБ (или 0,0316 <, Н<, 31,6). Последовательность операций при пре- образовании характеристик сводится к нанесе- нию графика параметрически заданных функ- ций Н((о) и 0(оо) в прямолинейной сетке (см. рис. 1.3.3) и считыванию значений Л(со) и ф(со) с криволинейной сетки. Номограмма допускает некоторое рас- ширение применения. Пусть требуется полу- чить частотные характеристики системы по отношению к ошибке ф-у-’-ГйЙо' Очевидно, что если поделить числитель и зна- менатель (1.3.6) на FFX/b), то полученное выражение по структуре не будет отличаться от формулы (1.3.1). Нанося в прямолинейной сетке характеристики Я(со) и 0(со) с изменен- ными знаками, при считывании с криволи- нейной сетки получим искомые частотные характеристики А(<о)= I 08(со) = argB'X/co). Если изменить знаки при считывании с криволинейной сетки, то вместо функции Ф8(/со) можно получить характеристики, соот- ветствующие обратному выражению —2—=l + IF0w), ФеО<о) т.е. использование номограммы в данном слу- чае эквивалентно операции добавления едини- цы к частотному оператору разомкнутой сис- темы ^(/со). Это дает возможность преобразо- вания структурной схемы с суммированием выходных координат неограниченного числа звеньев с передаточными функциями И^/оо) {k = 1, 2, ..., л) (рис. 1.3.4). Преобразуя фор- мулу для параллельного соединения = и^(Ао) + + .. + и«(Ао) = = ИЪ(М + ИЭДЬ) + ... + (1-3.7) Где ^п(А») - + »Ш») / W'itf»)), найдем характеристики слагаемого И^О’оо) с помощью предварительного вычитания из характеристик характеристик ^(/со) в логарифмическом масштабе. Затем выполняем операцию добавления единицы с последую- щим суммированием результата с характери- стиками Процедура выполняется нужное число раз согласно выражению (1.3.7). Ряс. 13.4. Схема параллельного соединения
42 Глава 1.3. ЧАСТОТНЫЕ МЕТОДЫ АНАЛИЗА АВТОМАТИЧЕСКИХ СИСТЕМ Рве. 1.3.5. Структурная схема контура с гибкой обратной связью Операция суммирования с единицей ока- зывается полезной в преобразовании схемы с гибкой обратной связью (рис. 1.3.5). В данном случае эквивалентный частотный оператор имеет вид ФО)= , откуда следует, что для получения характери- стик оператора Ф(/’со) достаточно из характе- ристик вычесть результат операции 1 + 1.3.3. ЛОГАРИФМИЧЕСКИЕ ХАРАКТЕРИСТИКИ ЗВЕНЬЕВ С КОМПЛЕКСНЫМИ КОЭФФИЦИЕНТАМИ Без потери общности можно рассмотреть лишь один из четырех типов звеньев с ком- плексными коэффициентами. Рассмотрим, например, апериодическое звено с передаточ- ной функцией Тр + J + ОС Логарифмические характеристики в дан- ном случае также имеют асимптоты. Действи- тельно, логарифмируя выражение для ампли- тудно-частотной характеристики, находим 20lg4(to) = -201g | Та I - 101g| 1 + 2 / (Та) + + (1 + а2) / (TW)). Асимптотическое поведение функции определяется слагаемым 201g | Тео |. Ввиду асимметрии оцифровки имеет смысл вычис- лить эту характеристику на всем диапазоне изменения частоты -оо < со < +оо. Очевидно, в точке со = -1 / Т функция Л (со) имеет макси- мум, равный 1 / а (рис. 1.3.6). Фазовые характеристики изменяются бо- лее круто при уменьшении параметра а. Здесь можно отметить некоторую аналогию с по- строением характеристик колебательных звеньев при различных коэффициентах демп- фирования При положительных значениях частоты наклон асимптоты амплитудной ха- рактеристики равен -20 дБ/дек, при отрица- тельных значениях частоты 4-20 дБ/дек. Построение характеристик остальных звеньев с комплексными коэффициентами в логарифмических координатах сводится к от- ражению их относительно оси частот - в слу- чае дифференцирующего звена - либо относи- тельно линии со = 0 - в случае замены J на - J. Сама линия со =0 в логарифмических коорди- натах, разумеется, отсутствует. Рис. 1.3.6. Логарвфмвческве харакгервставв апериодического звена с комплекснымв коэффвцвеигама
ПОСТАНОВКА ЗАДАЧИ ОБ УСТОЙЧИВОСТИ. ОПРЕДЕЛЕНИЕ УСТОЙЧИВОСТИ 43 Глава 1.4 АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ ДИНАМИЧЕСКИХ СИСТЕМ 1.4.1 ПОСТАНОВКА ЗАДАЧИ ОБ УСТОЙЧИВОСТИ. ОПРЕДЕЛЕНИЕ УСТОЙЧИВОСТИ При работе различных автоматических устройств возможны нарушения нормального функционирования. Например, вместо стаби- лизации угловой скорости вращения маховика паровой машины (см. рис. 1.1.2) может на- блюдаться процесс незатухающих колебаний, связанный с перекачкой энергии из регулятора в объект регулирования и обратно. Устойчи- вость движения может рассматриваться не только в системах с обратной связью. Из курса баллистики известно, что угловое движение вращающегося снаряда описывается системой дифференциальных уравнений 5] + 2о82 “* 2681 — c8j — е62 = 2о0; (1.4.1) 82 - 2а&1 + 2Ь62 - с82 + e6i = -0 - 4Л0, где 8j и 82 - углы отклонения оси снаряда от вектора скорости; 0 - угол наклона вектора скорости к горизонту. Коэффициенты а, Ь, с и е при заданной траектории полета можно рассматривать как функции времени. Наруше- ние устойчивости полета в данном случае вы- ражается в том, что снаряд переворачивается на траектории и либо летит дном вперед, либо совершает беспорядочные угловые движения. В небесной механике постановка задачи о так называемых вековых возмущениях эле- ментов движения планетных систем также связана с проблемой устойчивости орбит. При переходе с эллиптической орбиты на парабо- лическую или гиперболическую тело навсегда покидает данную планетную систему, и это также будет нарушением устойчивости движе- ния. Со времени появления работы А. М. Ля- пунова* постановка и решение проблемы ус- тойчивости движения получили достаточно общую форму, которая является универсаль- ной для многих прикладных задач из различ- ных областей техники. Для математической постановки задачи об устойчивости вернемся к уравнениям вида (1.2.3), в которых опустим вектор управлений (“1, «2, «тУ- * Ляпунов А. М. Общая задача об устой- чивости движения, Харьков, 1892 (Переиздана Гостехиздатом в 1950 г.). = 0 = 1,2,...,»). (1.4.2) Каждому вектору начальных значений координат состояния / =1, 2, ..., п соответству- ет единственное решение, имеющее смысл при /о < t < оо (бесконечная продолжаемость впра- во). Процессы, установившиеся в динамиче- ской системе (1.4.2), описываются тривиаль- ными решениями У* =(л,У2,--,Ул) 0 = 1,2.........и), (14.3) компоненты которого являются корнями уравнений J/ 01, Уъ •••, у») = о- Физически наблюдаемыми будут устой- чивые тривиальные решения (1.4.3). Придадим приращения X/ координатам состояния и введем обозначения Xi (Х|, хъ .... х„) = Г, 01 + *1, •••, Уп + хп). Тривиальному решению (1.4.3) системы (1.4.2) соответствует тривиальное решение X, =0 0 = 1, 2, ...,») (1.4.4) уравнений = Xt(xi, х2,.... х„) 0 = 1, 2,...,»). (14.5) По терминологии теории устойчивости тривиальное решение системы (1.4.5) называ- ется невозмущенным. Пусть в начальный момент времени t = = /о переменные состояния X/ принимают значения X/q, из которых хотя бы одно не рав- но нулю. Эти начальные значения называют возмущениями. Каждому набору возмущений (х10> *20, •••» *ло) соответствует возмущенное движение X = X (хю, x^J 0, представ- ляющее собой решение системы (1.4.4). Невозмущенное движение (1.4.4) называет- ся устойчивым, если для любого положительного г найдется 8 = 8(c) > О такое, что из неравен- ства шах|х/о| < 8 вытекает неравенство |х(х10, *20, •••> *ло; *)|| < 8 для любого Если существует число с, для которого не- возможно найти 8 = 8(c), о котором говорится в определении устойчивости, то такое движе- ние называют неустойчивым.
44 Глава 1.4. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ ДИНАМИЧЕСКИХ СИСТЕМ Рис. 1.4.1. К определению устойчивости по Ляпунову Определению устойчивости можно при- дать геометрический смысл, наглядно изобра- женный на рис. 1.4.1. Решение Т(/), начав- шись из круга (сферы) радиуса 8, не покидает полуцилиндра радиуса с с образующими, па- раллельными оси /, которая представляет со- бой также тривиальное устойчивое решение системы (1.4.5). Существование устойчивого решения для уравнений, описывающих систему автоматиче- ского регулирования, означает, что с течением времени в этой автоматической системе уста- новится режим, соответствующий этому ус- тойчивому решению, причем произойдет это без постороннего вмешательства. Дальнейшие термины касаются некото- рых уточнений определения устойчивости движения. Если при достаточно малых возму- щениях Х/о < 8, / =1, 2, ...» л, норма решения И*10’ •••’ х"0; 0| -> 0 при t —>оо, то реше- ние называют асимптотически устойчивым. Если число 8 может быть как угодно большим, то систему называют устойчивой в целом. Условия, при которых уравнения вида (1.4.5) допускают линеаризацию или замену исходной системы (1.4.5) уравнениями пер- вого приближения, установлены в гл. 1.3. Справедливость такой замены заранее не оче- видна. Первый вопрос, который возникает при линеаризации состоит в возможности суждения об устойчивости решения системы (1.4.5) по соответствующим ей уравнениям первого приближения. Ответ на этот принци- пиальный для всей теории автоматического управления вопрос дается двумя теоремами Ляпунова. Все случаи исследования устойчи- вости системы (1.4.5) подразделяются на кри- тические и некритические. Для обнаружения этих случаев необходимо установить знаки корней характеристического уравнения линеа- ризованной системы (1.4.5) в виде (1.2.10) либо в виде (1.2.11). Теорема 1. Если вещественные части всех корней характеристического уравнения отрицательны, то невозмущенное движение системы (1.4.5) устойчиво независимо от вида остаточного члена, отброшенного при линеа- ризации. Теорема 2. Если среди корней характери- стического уравнения найдется хотя бы один с положительной вещественной частью, то не- возмущенное движение системы (1.4.5) неус- тойчиво независимо от остаточного члена. Эти два случая принадлежат к некрити- ческим. К критическим относят те случаи, когда все корни характеристического уравне- ния имеют отрицательные вещественные час- ти, за исключением хотя бы одного с нулевой вещественной частью. Лишь в этих случаях вопрос об устойчивости невозмущенного дви- жения не может быть решен на основе анализа линеаризованной системы. Таким образом, во всех критических случаях требуется анализ членов разложения порядка выше первого, что целиком относится к разделу нелинейной тео- рии автоматического управления. В этой главе мы ограничимся рассмотрением некритиче- ских случаев. 1.4.2. ЛИНЕЙНЫЕ СИСТЕМЫ С ПОСТОЯННОЙ МАТРИЦЕЙ После затухания переходного процесса (если он обладает таким свойством) координа- ты состояния изменяются во времени в соот- ветствии с управляющим воздействием (и\, U2, ..., ит). Поэтому вопрос об устойчивости движения сводится к анализу поведения реше- ния однородного уравнения, которое получа- ется из (1.2.6) при и = 0. В свою очередь ус- тойчивость тривиального решения X = 0 ли- нейной системы зависит от знаков корней X/ характеристического уравнения. Вычисление корней уравнения вида (1.2.10) в полных ра- дикалах при п 5 принципиально невозмож- но, хотя численная процедура поиска корней алгебраического уравнения разработана доста- точно хорошо. В данном случае речь идет о более простой задаче - об определении знаков корней характеристического уравнения. Реше- ние этой задачи в общем виде находят с по- мощью вычисления определителя, составлен- ного из коэффициентов уравнения (1.2.11). Критерий Гурвица. Составим определи- тель Гурвица по следующему правилу: по главной диагонали выпишем коэффициенты 02, ..., ап, индексы остальных элементов возрастают на единицу при уменьшении но- мера строки на единицу. Если получается i < < 0 или i > л, то элементы определителя за- меняются нулями. Таким образом, крайний
ЛИНЕЙНЫЕ СИСТЕМЫ С ПОСТОЯННОЙ МАТРИЦЕЙ 45 правый столбец содержит лишь один отлич- ный от нуля элемент ап. Левый столбец со- держит два таких элемента а\ и Oq. где коэффициент b указывает на наличие вяз- кого трения. Запишем систему уравнений в форме Коши: *1 *3 а5 л7 ... О' *0 *2 fl4 *6 ... 0 Н = det 0 0 а1 *0 *3 *2 *5 *4 ... 0 ... 0 0 0 0 0 ... ап Для того чтобы корни харакгеристиче- ского уравнения имели отрицательные вещест- венные части,необходимо и достаточно, чтобы определитель Гурвица (1.4.6) и все его диаго- нальные миноры имели знак, одинаковый со знаком Oq. Пример 1.4.1. Вернемся к анализу устой- чивости регулятора Уатта, помещенного в са- мом начале главы. Составим математические модели элементов системы. Уравнение объекта регулирования достаточно универсально и было нами записано в виде (1.2.2). Правда, это уравнение относилось к электрическому двига- телю, но с формальной точки зрения это не имеет значения, хотя физические основы дей- ствия электродвигателя и паровой машины принципиально различны. Этим и интересен пример. В отличие от электродвигателя управ- ляющим воздействием служит не напряжение, а открытие дроссельной заслонки, которое пропорционально coscp, как это следует из рис. 1.1.1. Таким образом, 1^- = мЛ.-мн, где Ма - момент, развиваемый паровой маши- ной на валу; - момент нагрузки. Более подробно это уравнение можно записать в виде 7 —• = Ма - Мк - к cos Фо + к совф = = -F + £совф. При некотором открытии дросселя Фо устанав- ливается постоянное значение угловой скоро- сти ©о и сумма моментов на валу машины также становится равной нулю Мдо = М& Уравнение регулятора также записывает- ся на основе второго закона механики </2ф 2 » • , dp m—z- = лг© />/&1ПфСО8ф-т#81Пф- dr а* dp dp 22,- Ь — = wco/sm фсовф - gsm ф - — do к F л=7со5<₽-7- Коэффициент n = top / © - передаточное от- ношение конической пары между валом ма- шины и регулятором. Тривиальное решение находится непо- средственно: ф = 0; совфо = — (14.7) 1 8 ©0 = ~ ------• лу/со$фо В соответствии с классической методикой составим уравнение в приращениях. Полагая Ф = фо + Дф, ф = фо + Дф, © = ©о + Д©, имеем </Дф </Дф 2 2 . 2 2 • « * = Л ©о СОвфоДф + Л ©q Sin 2фоД© - - g cos Фо Дф - ~ Дф; nt d&o к . . — = —у sin Фо Av- Заменяя ©пл2 = -—-— , запишем харакге- / cos фо ристический многочлен этой линеаризованной системы det gsin2<pp /cos Фо b_ 2g sin фр m b0 0 -X В результате вычисления определителя получаем
46 Глава 1.4. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ ДИНАМИЧЕСКИХ СИСТЕМ Ь .2 £Sin(₽0 л 2к . 2 — V + т----—к + ——SU12 <Ро = °- т /cos ср о Воспользовавшись критерием Гурвица, находим достаточное условие систем "регулятор-машина" JW>2fcc^=2F (14g) Ш ©Q ©Q В правой части неравенства (1.4.8) вторая дробь имеет следующий смысл. Каждый двига- тель (в том числе и паровая машина) обладает внешней характеристикой, т.е. зависимостью скорости вращения вала ©о от нагружающего момента Мп. В случае положительного самовы- равнивания скорость вращения машины падает при увеличении нагружающего момента, т.е. ---— = —— = —V < 0. dMn dF Из тривиального решения (1.4.7) следует, что А) 0 = const; дифференцируя это соотноше- ние по ©о, находим dF 2F 1 duiQ ©о v Отсюда условие устойчивости системы "регулятор-машина" приобретает вид Устойчивость прямо зависит от коэффи- циента демпфирования Ь. 1.4.3. ЧАСТОТНЫЕ КРИТЕРИИ УСТОЙЧИВОСТИ О знаках корней характеристического уравнения (1.2.10) можно судить по форме годографа характеристического многочлена при замене р на у©. Согласно теореме Виета характеристический многочлен представляется в виде произведения Dip) = ао(р - h) (Р - >-2) ••• (Р - М. где X/ (/ = 1, 2, ...» л) - корни характеристиче- ского уравнения. Заменив здесь р на у©, получим вектор D(fo) = ао(А° " М (Z® " ^2) — (Z® " М» (14.9) аргумент которого равен сумме аргументов сомножителей arg DO) = £ arg(>o - X,). /=1 Если частота © меняется от -со до +оо, то конец вектора D(j(o) опишет годограф на ком- плексной плоскости. При этом каждый эле- ментарный сомножитель в произведении (рис. 1.4.2) получит приращение аргумента. Это приращение равно л, если корень X/ лежит в левой полуплоскости, и -л, если корень нахо- дится справа от мнимой оси. Таким образом, приращение аргумента вектора Д arg = (п- т)п -тп = -со<(0<+а> = (л - 2т)л, где m - число корней характеристического многочлена В правой полуплоскости (см. рис. 1.4.2, а). Pic. 1.4.2. К доказательству краггеркя усгойчивост1 Михайлова: а - изменение аргументов сомножителей X/ - у'©; б - годограф характеристического полинома
ЧАСТОТНЫЕ КРИТЕРИИ УСТОЙЧИВОСТИ 47 Для устойчивости системы должно вы- полняться условие т = 0. Отсюда следует час- тотный критерий Михайлова: система автома- тического управления будет устойчивой, если изменение аргумента вектора Д arg D(J(a) = пп, -СО<(0<+СО где п - порядок характеристического уравне- ния D(p) = 0. Существует и другая формулировка кри- терия Михайлова. Она вытекает из ранее уста- новленного факта симметрии годографа отно- сительно вещественной оси плоскости {Re 7), ImZJ). Если изменять частоту со от 0 до +оо, то изменение аргумента уменьшится вдвое по сравнению с предыдущей формулировкой. Отсюда следует утверждение: система автома- тического управления будет устойчивой, если годограф D(J(a) характеристического много- члена степени п при изменении со от 0 до +оо будет монотонно проходить п квадрантов комплексной плоскости. Пример 1.4.2. Рассмотрим систему стаби- лизации угла крена летательного аппарата (рис. 1.4.3). Угол крена воспринимается чувст- вительным элементом - гироскопом. На об- мотках струйного устройства возникает на- пряжение и, пропорциональное углу отклоне- ния у и = к3у. Силовой цилиндр через трансмиссию от- клоняет элероны на угол 8 78 4- 8 = Постоянная времени Т приблизительно учитывает эффект сжимаемости воздуха в си- ловом цилиндре. Поведение самого объекта регулирования описывается уравнением ff + by = Л18, где I - момент инерции летательного аппарата относительно продольной оси Ox; b - коэффи- циент демпфирования колебаний в атмосфере. Уравнение замкнутой системы стабили- зации крена в операторном виде tUP2 + Ьр)(1 + Тр) + *1*2*31 Y(0 = 0. Годограф D(j(a) строится по формуле D(j(a) = kxkqkb - (/ + + + Jto(d - 77ш2). (1.4.10) Для выполнения конкретных построений положим / = 0,4 кгм2; b = 1,2 кг-м^с*1; Рис. 1.4.3. Функциональная схема канала стабилизации угла крена летательного аппарата kfak^ = 5 Нм; Т= 0,12 с. На рис. 1.4.4. показан годограф ТХ/ш) при этих значениях параметров. Поскольку порядок уравнения системы равен трем, для обеспечения устойчивости годограф должен монотонно пройти три квадранта, что и на- блюдается в данном случае. Пусть в процессе конструирования несу- щие поверхности летательного аппарата уменьшены, так что коэффициент демпфиро- вания b уменьшился до b = 0,8 кг-м^с*1. При Рис. 1.4.4. Годограф системы стабилизации крена
48 Глава 1.4. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ ДИНАМИЧЕСКИХ СИСТЕМ понижении давления воздуха в питающей сети увеличилась постоянная времени Т до 0,2 с. При компенсации снижения динамических качеств системы путем поднятия общего ко- эффициента усиления до к = 8 Н м происхо- дит потеря устойчивости. Это следует из го- дографа /)(/©), построенного для этих значе- ний параметров. Он уже не проходит все три квадранта монотонно, а попадает из первого квадранта в четвертый и лишь затем в третий. В этом примере легко решается и такая задача: при каком коэффициенте усиления происходит потеря устойчивости при заданных значениях параметров /, b и Г ? Из выражения (1.4.10) следует, что мни- мая часть D(j(a) обращается в нуль при Подставив это значение частоты в веществен- ную часть />(/©) и приравнивая ее к нулю, находим предельное значение коэффициента усиления . _Ь(/+ЬГ) *max “ jy При значениях параметров второго вари- анта этого примера получаем ктал = 5,6 Н м. Частотный критерий Найквиста. Наиболее просто частотные характеристики строятся в логарифмическом масштабе. Построение час- тотных характеристик разомкнутой системы сводится к операциям сложения и вычитания логарифмических характеристик элементарных звеньев. Годограф разомкнутой системы также позволяет сделать вывод об устойчивости ее в замкнутом состоянии. Для того чтобы убедить- ся в этом, рассмотрим функцию ф(Л>) = 1 + W(Ja>) = 1 + = _ D(j(a) + М(ра) " 9 где VK(jio) - частотный оператор разомкнутой системы. Функция ср(/со) также дробно- рациональная, причем в числителе ее стоит характеристический многочлен замкнутой системы от переменной у©, в знаменателе - характеристический многочлен разомкнутой системы от той же переменной. О корнях зна- менателя можно сделать заключение без ка- ких-либо вычислений, так как он получается при перемножении передаточных функций элементарных звеньев. В частности, для ком- бинации апериодических и колебательных звеньев все корни полинома D(p) отрицательны (дифференцирующие звенья добавляют в качестве сомножителя единицу, а интегрирующее звено мы рассмотрим несколько позже). Полином D(p) + М(р) не обязательно имеет корни только с отрицательными вещест- венными частями. Если корней с положитель- ными частями т, то изменение аргумента при 0 < <о < +оо равно (см. вывод критерия Ми- хайлова) Д arg [Р(у©) + Л/(до)] = (л - 2т)—. О^со^+со 2 Поскольку Д arg D(J(o) = л —, общее приращение аргумента составит Д arg ф(у©) = -лис. 0^со<+« Геометрически это означает, что годограф функции ф(/©) охватит начало координат плоскости {Неф, 1тф} т/2 раз в отрицатель- ном направлении. В частности, при устойчи- вой замкнутой системе т = 0, т.е. годограф ни разу не охватит точки (0, 0). Годограф частот- ного оператора разомкнутой системы FF(/©) отличается от годографа функции ф(/©) лишь постоянным сдвигом вдоль вещественной оси. Поэтому для случая отрицательных корней полинома разомкнутой системы справедлив следующий критерий устойчивости Найквиста: годограф частотного оператора разомкнутой системы не должен охватывать точку с коор- динатами (-!,/• 0). Рассмотрим случай так называемых не- минимально-фазовых звеньев. В качестве примера неминимально-фазового звена можно указать на элемент с передаточной функцией вида Физически такое звено реализуется как двига- тель с отрицательным самовыравниванием (при работе элекгромашинного усилителя эф- фект отрицательного самовыравнивания дос- тигается при перекомпенсации). При замене р на -у© звено переходит по своим свойствам в обычное апериодическое, при построении годографа которого мы отбрасывали верхнюю половину окружности (см. рис. 1.2.7, а). В данном случае при изменении © от 0 до +оо мы обязаны сохранить именно верхнюю поло- вину окружности и фазовая характеристика 0(©) = arctgT© напоминает характеристику
ЧАСТОТНЫЕ КРИТЕРИИ УСТОЙЧИВОСТИ 49 дифференцирующего звена первого порядка. Амплитудная же характеристика соответствует обычному апериодическому звену. Таким об- разом, в отличие от классических элементар- ных звеньев с отрицательными корнями зна- менателя передаточной функции здесь уже нельзя по виду амплитудно-частотной характе- ристики написать выражение для фазочастот- ной характеристики и наоборот. Происхожде- ние термина "неминимально-фазовый" стано- вится ясным, если обратить внимание на пе- редаточную функцию звена с отрицательным к. При этом фазочастотная характеристика 0(<») = 180° - arctg Та, т.е. меняется от 180 до 90°, оставаясь по абсо- лютной величине большей, чем соответствую- щая характеристика устойчивого апериодиче- ского звена. Предположим, что характеристическое уравнение D(k) = 0 разомкнутой системы имеет Z корней с положительной вещественной частью. Рассуждая так же, как и в предыдущем случае, найдем, что изменение аргумента функции FK(/od) составит в разомкнутой сис- теме Д arg [1 + FK(»] = л^--(л-2/)^ = Отсюда следует формулировка критерия Найк- виста: система автоматического управления будет устойчивой, если годограф частотного оператора в разомкнутом состоянии охватывает критическую точку (-1, j • 0) / / 2 раз в положительном направлении. Рассмотрим, наконец, весьма часто встречающийся случай нулевых корней в ха- рактеристическом уравнении ZX/oo) = 0. В этом случае изменение аргумента годографа W(j&) при со —> 0 становится неопределен- ным. Для устранения неопределенности поло- жим в малой окрестности точки (0, 0) плоско- сти корней {ReX, ImX}, Л, = re/*, 0 £ у . Тогда при г -> 0 годограф W(j&) будет из- меняться по дуге бесконечно большого радиу- са и 0£ arg W(Ja) £ vy, где v - кратность нулевого корня уравнения D(k) = 0. Такое правило может показаться не- сколько искусственным. Следующий пример иллюстрирует справедливость этого правила. Пример 1.4.3. Требуется установить усло- вия устойчивости системы стабилизации из примера 1.4.2 с помощью критерия Найкви- ста. Запишем выражение частотного операто- ра разомкнутой системы. Очевидно, переда- точная функция последовательного соедине- ния объекта управления, силового исполни- тельного элемента чувствительного элемента* (гироскопа) 1^(п\ - - ^1^2^3 w U(p) (\ + Tp)(IP+b)p' Характеристическое уравнение разомкнутой системы имеет один нулевой корень. При значениях параметров / =0,4 кг-м2; Т = 0,12 с; b = 1,2 кгм^с*1; = 5 Н м годограф FF(/do) имеет вид, изображенный на рис. 1.4.5. Так как он не охватывает точку (-1, j • 0), то при указанных значениях параметров система устойчива. При со = (Ь / /7)1/2 годограф пересекает вещественную ось. Подставляя это значение частоты в выражение для вещественной части оператора FK(/oo) и приравнивая единице, получаем предельное значение коэффициента крена
50 Глава 1.4. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ ДИНАМИЧЕСКИХ СИСТЕМ Рас. 1.4.6. Логарвфмаческае характеристакв системы стабилизации крема щ+ьт) лтах “ jrp » найденное ранее с помощью критерия Михай- лова. Графические построения в этом примере охватывают довольно узкий интервал частот. Кроме того, трудно проследить поведение годографа вблизи начала координат. Указан- ных недостатков лишены логарифмические характеристики. На рис. 1.4.6 показаны лога- рифмические характеристики, относящиеся к примеру 1.4.3. Для построения амплитудной характеристики наиболее удобно наметить вна- чале частоты изломов 1 / Т = 8,33 с*1 и Ь/1 = = 1,2 / 0,4 = 3 с'1. Затем на частоте со = 1 с'1 отметить точку 20 / Ь) и провести низкочастотную асимптоту с наклоном -20 дБ/дек. На частотах изломов наклон по- следовательно увеличивается до -40 и -60 дБ/дек. В полученную асимптотическую характеристику вводятся поправки. Затем сум- мируются составляющие arctgTco и arctg/co / b фазовой характеристики 0(со). На частоте со = = 5 с'1 0(со) =180°. На этой же частоте Л (со) = -8,7 дБ. Это запас устойчивости по амплитуде - настолько можно поднять ампли- тудную характеристику, чтобы система оказа- лась на границе устойчивости (штриховая ли- ния). При частоте со = 2,855 с"1 амплитудная характеристика Л (со) = 1, что соответствует нулю в децибелах. Фазовая характеристика отстоит от линии 0(со) = 180® на 27,5° - это запас устойчивости по фазе. Такой дополни- тельный сдвиг по фазе также выводит систему на границу устойчивости. Эти запасы можно указать и на рис. 1.4.5. В полярных координа- тах линии нулевых децибел соответствует ок- ружность единичного радиуса. Луч, проходя- щий через точку пересечения годографа с еди- ничной окружностью, также образует угол 27,5° с отрезком вещественной оси 0(со) = « 180°. Значение Л(5) = 0,3676, и для потери устойчивости коэффициент усиления доста- точно увеличить в 2,27 раза, что также соот- ветствует его увеличению на 8,7 дБ. Графические построения наглядно пока- зывают возможности изменения запасов ус- тойчивости путем варьирования параметров. Очевидно, величина запасов устойчивости непосредственно связана с затуханием пере- ходного процесса. Возникает вопрос о выборе значения запасов устойчивости. Различные подходы к решению этого вопроса приведены в гл. 1.5, посвященной качеству процессов управления в линейных системах. 1.4.4. ВЫДЕЛЕНИЕ ОБЛАСТЕЙ УСТОЙЧИВОСТИ В ПРОСТРАНСТВЕ ПАРАМЕТРОВ Критерии устойчивости отвечают на во- прос об устойчивости системы автоматиче- ского управления при заданных значениях параметров. При конструировании систем уместен обратный вопрос: при каких значени- ях параметров система сохраняет свойство устойчивости ? Как мы видели в рассмотрен- ных примерах, критерии устойчивости позво- лили ответить на этот вопрос в смысле выбора коэффициента усиления. Существуют, однако,
ВЫДЕЛЕНИЕ ОБЛАСТЕЙ УСТОЙЧИВОСТИ В ПРОСТРАНСТВЕ ПАРАМЕТРОВ 51 наиболее общие приемы выделения областей устойчивости в пространстве параметров. Ос- новная идея выделения областей устойчивости состоит в установлении связи между точками пространства параметров и распределением корней характеристического уравнения замк- нутой системы. Рассмотрим для простоты од- носвязную область в пространстве параметров, соответствующую области устойчивости (рис. 1.4.7). Непрерывному изменению совокупно- сти параметров соответствует кривая АА'. При переходе границы области устойчивости Г в пространстве параметров в плоскости корней характеристического уравнения по крайней мере один корень (или пара сопряженных корней) перейдет из левой полуплоскости в правую через мнимую ось. Каждой точке гра- ницы соответствует одна или несколько точек мнимой оси плоскости корней. В этом смысле граница Г является отображением (необяза- тельно взаимнооднозначным) мнимой оси. Некоторые точки границы Г могут иметь своими образами бесконечно удаленные точки оси 1ml. Таким образом, замкнутой кривой Г соответствует замкнутый же контур в плоско- сти корней с учетом бесконечно удаленных точек. При практической реализации идеи ото- бражения оси 1ml в границу Г важным пред- ставляется вопрос об ориентации областей устойчивости и их образов в плоскости кор- ней. Под ориентацией понимается правило обхода областей. В случае, изображенном на рис. 1.4.7, при обходе области устойчивости по границе Г в направлении, указанном стрел- кой, сама область остается слева. В плоскости корней область устойчивости также показана остающейся слева. Формальное правило отображения оси 1ml в границу Г дается характеристическим уравнением при замене 1 на /оо. Тогда D(pi, Ръ — > Рп> 7®) = 0 - параметрически заданное уравнение граничной поверхности. Рис. 1.4.7. Отображение траекторий в пространстве параметров на плоскость корней характеристнческого уравнения Для того чтобы составить представление о возможных случаях построения граничных линий, рассмотрим ряд примеров. Пример 1.4.4. Найти область возможных значении вещественного параметра а, при которых характеристическое уравнение 13 + 12+1 + а= 0 не имеет корней с положительной веществен- ной частью. Положим 1 = /оо. Тогда очевидно, соот- ношение а = со2 + /<о(со2 - 1) и представляет собой уравнение искомой по- верхности. Параметр со в данном случае легко исключить, но этого не следует делать, так как он указывает нам направление обхода (рис. 1.4.8). Условимся штриховать границу слева при движении в сторону возрастания парамет- ра со. Тогда при переходе с заштрихованной стороны на незаштрихованную один корень из левой полуплоскости перейдет в правую. В данном случае единственной областью, пре- тендующей на название устойчивой, будет внутренность петли. Это нетрудно проверить: при а - 1/2 определитель Гурвица имеет вид det 1 1/2 1 1 1 О О О 1/2. причем достаточно вычислить лишь один ми- нор второго порядка, который равен 1/2. По- этому область устойчивости обозначена симво- лом (3), что означает • количество корней с отрицательной вещественной частью. Другие области обозначены символами (2) и (1). По- скольку в условиях задачи требуется найти лишь вещественные значения параметра а, то достаточно взять отрезок а е (0, 1). Ряс. 1.4.8. Гранмцж устойчивости с одной несобственной точкой
52 Глава 1.4. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ ДИНАМИЧЕСКИХ СИСТЕМ Пример 1.4.5. Рассмотрим аналогичное характеристическое уравнение, но с неизвест- ным параметром а при второй степени 1 I3 + аХ2 + X + 1 =0. Теперь граница области устойчивости задается соотношением Она имеет бесконечно удаленные точки при со = 0 и при со — оо (рис. 1.4.9). Правило штриховки выявляет область устойчивости а > > 1. Пусть теперь характеристическое уравне- ние содержит два неизвестных параметра р\ и Р2- Мы ограничимся случаем, когда оба пара- метра образуют линейную комбинацию вида P\S(P) + Рг&р) + Л(р) = о, которая после подстановки р = усо распадается на два линейных уравнения относительно р\ и Р2- PiSi(w) + />2<21(о>) = Л1(ш); (1.4.11) Р152(<о) + Р2Й(<>>) = Л2(ш). Из линейной алгебры известно, что для суще- ствования единственного решения определи- тель системы не должен обращаться в нуль: Если определитель системы равен нулю, а ранг расширенной матрицы не равен нулю, то система несовместна. Наконец, в случае Рве. 1.4.9. Граница устойчивости с двумя несобственными точками линейной зависимости системы (1.4.11) она обладает бесчисленным множеством решений, которым геометрически соответствует прямая в плоскости параметров {р\, р$. Такую прямую называют особой. В случае положительности определителя системы правило обхода сохра- няется. Если А < 0, то правило меняется на обратное, т.е. при обходе области устойчиво- сти штриховка наносится справа. Такие прави- ла штриховки находятся в соответствии с тео- рией аффинных и функциональных преобра- зований. Пример 1.4.6. Задача Вышнеградского за- ключается в выделении области устойчивости на плоскости параметров ц и 6, линейно вхо- дящих в характеристическое уравнение X3 + цХ2 + 8Х + 1 = 0. Положив здесь X — усо, сразу находим уравнение гиперболы ц = 1/8, которая делит всю плоскость на области устойчивости и не- устойчивости. Однако для правильного нане- сения штриховки приходится записать опреде- литель системы Он обращается в нуль лишь при со = 0, т.е. при ц -> ±оо. Штриховка наносится дважды на одну сторону гиперболы. Непосредственная проверка при ц = б = О подтверждает пра- вильность штриховки. Особых прямых в огра- ниченной области нет (рис. 1.4.10). Пример 1.4.7. Любопытный пример по- строения граничных линий дает уравнение К3 + цХ2 + X + б = 0. Рис. 1.4.10. Построение границы устойчивости в задаче Вышнеградского
УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 53 Подстановка X = усо приводит к резуль- тату 5 = ш2ц, ще частота со определяется из соотношения со - со3 = О, т.е. частота может принимать всего лишь три значения со = 0 и со = ±1. Таким образом, в плоскости {щ 5} искомая граница состоит из двух особых прямых (рис. 1.4.11). Поскольку вдоль каждой прямой со не меняется, правило штриховки остается неясным. Подобные задачи часто удается решить с помощью введения малого параметра. Рас- смотрим вместо исходного уравнения (1.4.12) уравнение вида X3 + |лХ2 4- (1 4- £|1)Х 4-5=0, которое переходит в исходное при е -> 0. Но в последнем случае правило нанесения штри- ховки не вызывает сомнений. Действительно, из определителя системы следует сое О т.е. при 0 < со < 4-оо штриховка должна быть правой, а при -оо < со < 0 - левой. Другая особая прямая штрихуется так, чтобы она за- штрихованной стороной была обращена к заштрихованной стороне прямой 5 = р. После нанесения штриховки расстановка обозначе- ний на отдельных областях не вызывает за- труднений. Изложенный метод построения границ области устойчивости наиболее нагляден для случая двух неизвестных параметров. При большем числе параметров трудоемкость мето- да существенно возрастает, например, при вы- Рк. 1.4.11. Особые прямые в качестве границы устойчивости делении области устойчивости в трехмерном пространстве с тремя неизвестными парамет- рами ц, 5 и у. Одному из параметров придает- ся какое-либо постоянное значение, а в плос- кости остальных двух параметров осуществля- ется построение границы области устойчиво- сти. Таким образом, осуществляется построе- ние сечений тела в пространстве трех парамет- ров. Наглядность метода сохраняется для слу- чая трех параметров. При дальнейшем увели- чении числа параметров можно говорить лишь о трехмерных сечениях четырехмерной облас- ти. При решении конкретных задач может оказаться, что вся эта громоздкая процедура не имеет смысла, если можно воспользоваться прямыми методами. Пример 1.4.8. Найдем область устойчиво- сти в пространстве параметров а, 0 и у триви- ального решения системы уравнений dx а — =-yx + ay + fiz; dy -~ = -ах 4-уу+ az; at dz — = -0x-ay-yz. В данном случае характеристическое уравнение -Y-X. -a -р a -r-X - a -Y-X -(la2 +02J(y+X) = O легко решается. Его корни Xj = -у; >-2,3 = "Y ±J^2a2 +p2. Следовательно, для устойчивости доста- точно выполнения условия у > 0. Параметры a и 0 могут был» любыми. 1.4.5. УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОЧТИ постоянными ПАРАМЕТРАМИ Многие объекты системы управления описываются математическими моделями, параметры которых медленно меняются по сравнению со скоростью изменения коорди- нат. В особенности это относится к угловому движению летательных аппаратов. Характер- ные частоты угловых колебаний находятся в пределах от единиц герц до нескольких десят-
54 Глава 1.4. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ ДИНАМИЧЕСКИХ СИСТЕМ ков герц. В то же время скорость изменения аэродинамических коэффициентов, плотности атмосферы, высоты полета и другие параметры таковы, что на протяжении одного периода угловых колебаний их можно считать посто- янными. На этом допущении был основан широко применявшийся метод "замороженных коэффициентов", вытесненный впоследствии вычислительной техникой с реализацией не- доступных ранее методов анализа и синтеза систем автоматического управления. Задачу интегрирования дифференциаль- ных уравнений с переменными параметрами можно считать в большинстве случаев прин- ципиально решенной (имеются в виду числен- ные методы), и главное место в этом разделе отводится проблеме качественной оценки асимптотического поведения систем с пере- менными параметрами на уровне универсаль- ных теоретических выводов. Поскольку боль- шинство систем управления с переменными параметрами являются многомерными, для изложения используется в основном язык ли- нейной алгебры с необходимыми дополнения- ми из теории устойчивости. Норма матрицы. Норма вектора может быть распространена на совокупность элемен- тов, образующих матрицу, если иметь в виду систему аксиом, используемых в дальнейшем при некоторых доказательствах; итак, под нор- мой матрицы понимается неотрицательное число ||А||, удовлетворяющее следующим ус- ловиям: 1) ||А|| = 0 тогда и только тогда, если А = 0; ' 2) для любого числа а ||аА| = НН; 3) ||A + B||s|A|| + |B| - аксиома тре- угольника. К этим трем аксиомам добавляется нера- венство типа Коши-Буняковского*: 4) ||ав| ^а|||14 Всем четырем аксиомам удовлетворяют обычно используемые в качестве норм опреде- ления: |А|| = тах^|ал|, J к либо ||А||=пшх£|а4 1 либо, наконец, евклидова норма Н=ЕЫ2 и* Уг где под обозначением SpA (от немецкого die Spur - след) понимается сумма диагональных элементов. Фундаментальная матрица решений. Рас- смотрим линейную систему ^ = A(Z)y + /(Z), (1.4.13) где элементы матрицы А(/) принадлежат к классу непрерывных функций внутри некото- рого интервала I = [а, оо), т.е. ад(1) е С(7), у(/) и f(/) - векторы-столбцы, причем УХО € « С(Г). Для системы (1.4.13) справедлива теоре- ма о существовании и единственности реше- ний [1.6]. Это означает, что для системы чисел tQ е I и Jo = (У10, •••» Уло)т существует реше- ние у(/), определенное для всех t е I и удов- летворяющее начальному условию у(/) = Уо- Это решение единственное внутри а < t < оо. Пусть далее Х(/) = [JtyjtCOL detX(0 # 0, решение однородной системы ▲ /л л=А(/)х- (1.4.14) записанное в виде квадратной матрицы (п х п). Такая матрица решений называется фундамен- тальной. Нетрудно убедиться, что фундаменталь- ная матрица удовлетворяет матричному диф- ференциальному уравнению ^1 = A(Z)X(Z), (1.4.15) где под производной матрицы Х(/) понимает- ся матрица с элементами dXjk(t) Л Любое решение однородной системы (1.4.14) можно записать в виде х(0 = Х(1)с\ (1.4.16) * Неравенство этого типа иногда связы- вают с именем Г. А. Шварца, в работах кото- рого оно встречается, начиная с 1884 г. В. Я. Буняковский опубликовал его в интегральной форме в 1859 г. Алгебраическое неравенство принадлежит Коши (1821 г.). где с — (q, С2, ...» сл) - вектор столбец, ком- понентами которого служат константы, опре- деляемые из начальных условий. Пусть х(/) - решение, удовлетворяющее начальному усло- вию x(/q). Полагая в (1.4.16) t - ф получим равенство
УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 55 х(/Ь) = X(/fo)cT. Следовательно, соотношение (1.4.16) можно записать в виде х(/) = Х(/)Х-1(/Ь)х(/Ь). Произведение Х(/)Х-1(^) = к(/, (q) на- зывают матрицей Коши. Может показаться, что матрица Коши за- висит от выбора фундаментальной матрицы. В действительности это не так. Пусть Х(/) - другая фундаментальная матрица системы (1.4.16). Каждый элемент этой матрицы отличается от элемента матрицы Х(/) постоян- ным множителем, т.е. Х(0 = Х(/)С, где С - некоторая невырожденная матрица с постоянными элементами Согласно из- вестному свойству Х-1(/) = С-,Х’1(/), поэтому соответствующая матрица Коши k(Z,Z0) = X(Z)X'*('o) = Х(')С С 'х-Чо = = к(','о)' не отличается от предыдущей. Аналогично скалярному уравнению лю- бое решение ХО неоднородной системы (1.4.13) можно записать в виде У« =У(О+Х(/)С, (1.4.17) где у(/) - некоторое частное решение. Дейст- вительно, дифференцируя (1.4.17), находим ^- = ^ + ^-С = Ay+f + AXC = dt dt dt J = A(y +XC) + f. Если частное решение обращается в нуль- вектор при t — то, очевидно, с = х-><<ь) у«ь) и, следовательно, y(0=y(0+k(/, /b)y(Zo)- Метод вариации произвольных постоявших. Способ отыскания частных реше- ний линейного неоднородного уравнения, в деталях разработанный Лагранжем, распро- страняется на матричную запись дифференци- ального уравнения (1.4.13). Таким образом, решение ищется в виде У (О = Х(/) □(/), (1.4.18) где Х(0 - фундаментальная матрица соответст- вующей однородной системы (1.4.14), а 11(1) - пока неизвестная функция. Подставляя выра- жение (1.4.18) в (1.4.13), получаем dX Х(Ол+‘л " = AWX(0"+f(')- Используя соотношение (1.4.15), находим выражение для определения неизвестной функции ц(/): X(z)^ = f(z). dt Отсюда и(0 находим интегрированием t (0-e+|x*(t)f(t)A. *0 Возвращаясь к формуле (1.4.18), получа- ем общее решение неоднородной системы t y(Z) = X(Z)c +jk(Z>T)f(t)A. *0 Для определения постоянного вектора с положим t = Iq: С = X->(Zo)y(4>), следовательно, t У(0 = М'ДоМо) + J к(/,т)Г(т)А. (1.4.19) В частности, если фундаментальная матрица Х(0 нормирована при / = /fo, т.е. X(tQ) = Е, из формулы (1.4.19) получаем t y(Z) = X(Z)y(Z0) + jk(Z,t)f(t)A. *0 (1.4.20) Из формулы (1.4.19) вытекает, что неод- нородная система (1.4.13) имеет частное реше- ние t У(0 = J k(Z,t)f(t)</r, zo удовлетворяющее начальному условию У ('о) = О- Случай постоянной матрицы. Как уже бы- ло установлено, фундаментальная матрица Х(/)
56 Глава 1.4. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ ДИНАМИЧЕСКИХ СИСТЕМ удовлетворяет однородной системе (1.4.14) или матричному уравнению (1.4.15). Очевидно, этим уравнениям удовлетворяет и произведе- ние Х(/)Х-1(/). Рассмотрим также матрицу Х(/ - т + /fa). Подстановка ее в уравнение (1.4.14) или (1.4.15) при А = const приводит к тождеству, следовательно, матрица Х(/ - т + tQ) также фундаментальна для однородной системы. Кроме того, при t — т и Х(/Ь) = Е Х(/)Х-1(т) = Х(/ - т + /Ь) = Е. Таким образом, матрица Х(/ - т 4- tQ) совпа- дает с фундаментальной матрицей в точке t = = т и по теореме о единственности решений не может отличаться от последней в других точках интервала [а, оо). В частности, при tQ = = 0 вместо (1.4.20) можно записать t y(O = X(Z)y(O) + jX(Z-t)f(t)A. о (1.4.21) Если начальные условия нулевые, то t y(Z) = jx(Z-t)f(t)A. о Мы получили уже известное нам выра- жение (1.2.28) с точностью до обозначения функций. Это позволяет рассматривать фунда- ментальную матрицу А = const с еще одной точки зрения - это совокупность реакций многомерной системы на воздействие в виде многомерной 8-функции. Выражение (1.4.22) получено без обра- щения к понятию 8-функции. Лемма Гронуолла-Веллмана [7]. Пусть на интервале [/Jo, оо) заданы две неотрицательные непрерывные функции и(1) 0 и Г(/) £ 0, и(0, Г(/) е с[/(), оо) и выполняется неравенство t u(0 £ с + Jf(t)ii(T)A, (1.4.23) где с - некоторый постоянный вектор-столбец. Тогда справедлива верхняя оценка t u(0 £ с exp J ffc) dr. zo Доказательство следует непосредственно из условия (1.4.23), которое в результате умноже- ния на f(0 можно записать в виде -----f(z). с + j f(t)u(r)</r zo Числитель дроби в левой части неравен- ства представляет производную знаменателя; интегрируя, находим *0 отсюда t t u(0 £ с + J Г(т)и(т)Л £ cexpj f(0<ft, Z0 *0 что и требовалось. Устойчивость линейной системы с почти постоянной матрицей. Теорема 1. Пусть система (1.4.14) с постоянной матрицей А = const ус- тойчива. Тогда система = [А + B(Z)]y, (1.4.24) где В(0 € с|0, оо) И J||B(n||rfz < оо также О устойчива. Доказательство. Пусть Х(/) - фундаментальная матрица системы (1.4.14) и Х(0) = Е. Рассматривая В(/)у как возмущение в уравнении (1.4.24) и в соответствии с методом вариации постоянных, запишем интегральное соотношение вида (1.4.21) У(О = Х(Г)у(О) + J X(t - t)B(t)y(t)A. О Отсюда, используя аксиоматику нормы, нахо- дим ||у(пКВх(/)||||у(о)||+ + J ||X(Z - т)| ||В(г)|| |у(г)|А. О (1.4.25) По условию теоремы система (1.4.14) устойчи- ва, следовательно, матрица Х(/) ограничена. Пусть, например, ||X(f)|| < к при t е [0, оо).
УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 57 Неравенство (1.4.25) только усилится» ес- ли подставить к вместо ||Х(/)||: О Г О’ ||y(Z)|| <. Му(О)| + J ф(т)|| ||y(t)|| А. О Используя лемму Гр онуолла-Веллмана, имеем ||у(')|| £ ф(0)|| ехр Л j |В(г)|| tk 2 L О £ ф(0)|| exp fcj ||В(0)| А < оо. . О В соответствии с определением устойчи- вой системы (см. разд. 1.4.1) деорема доказана. Пример 1.4.9. Рассмотрим уравнение вто- рого порядка (1.4.26) Обозначив — = у dt У и, следовательно, . приведем уравнение (1.4.26) к форме Коши. Сравнение с (1.4.24) показывает, что в данном случае Матрица А соответствует консервативной системе с ограниченным решением вида х(/) = + С2е-/а/. Дальнейшее сравнение с (1.4.24) позво- ляет записать Следовательно, J||B(0|A = |<oo. О Согласно теореме 1, предшествующей примеру, решение уравнения (1.4.26) должно оставаться ограниченным. Уравнение, однако, интегрируется в конечной форме лишь при некоторых значениях параметров а и Ь. На рис. 1.4.12 показан график решения х(/) при х(0) = 0 и X0) = 1; а = 0,01; а = 1; Ь = 3. Этот случай, как нетрудно убедиться, не сводится к интегрируемому. Решение получе- но численно. В начале функция х(/) довольно быстро осциллирует, затем период колебаний возрастает, принимая предельное значение, равное 2л. Амплитуда колебаний также стре- мится к некоторому постоянному пределу, (см. теорему 1). Значение этого предела зави- сит от начальных условий и определяется лишь численной процедурой. Рве. 1.4.12. График решения уравнения с почта постоянной матрицей
58 Глава 1.4. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ ДИНАМИЧЕСКИХ СИСТЕМ При достаточно общих предположениях оказывается возможным установить асимпто- тическую устойчивость возмущенной системы. Для этого необходимо ввести понятие экспо- ненциала матрицы. Экспоненциалом квадратной матрицы X называют функцию ехрХ = еХ Очевидно, что в соответствии с опреде- лением нормы Рк£^=е|х|- <1-4-27> v=0 Ввиду абсолютной сходимости числового ряда (1.4.27) определение экспоненциала имеет смысл для любой квадратной матрицы X. Найдем производную экспоненциала по параметру t. Дифференцируя абсолютно сходящийся ряд по 7 получаем = Ае* = е^А. Отсюда следует, что матрица вида Х(/) = = удовлетворяет матричному уравнению = АХ dt при начальном условии Х(0) = Е. Рассмотрим еще одну оценку нормы экспоненциала матрицы А/. Ограничимся вна- чале случаем отсутствия кратных характери- стических чисел матрицы А. При таком усло- вии она приводится к диагональному виду, т.е. существует такая невырожденная матрица S, что А = S-Miag(Xb ..., X„)S, где Xt О .о”Х diagA = = diag(Xb Ал) - диагональная форма матрицы А. Очевидно, еА/= S-MiagCe**',...» Если а = max Re X /, то согласно свой- J J ствам нормы KII4s',llhteliisiisCe<u- При наличии кратных корней матрица А приводится к квазидиагональному виду с клетками Жордана, порядок которых соответ- ствует кратности корней. При этом можно показать [1.7], что справедлива оценка ]еА'| 2 Се(а+б)/, (1.4.28) где е > 0 - произвольно малое число. Асимптотическая устойчивость линейной системы с почти постоянной матрицей. Теоре- ма 2. Если система (1.4.14) асимптотически устойчива, то и возмущенная система (1.4.24), где В(/) е С [ф, оо) и В(/) -> 0, также асим- птотически устойчива. Доказательство. Осуществим замену переменных в уравнении (1.4.24) у = Тогда + Ae^z = [А + B(r)leA/z dt dt L J и, следовательно, = e^BWe^z. Последнее уравнение эквивалентно интеграль- ному t z(Z) = z(Z0) + j e’AtB(t)eAtz(-t)zft. 'o Возвращаясь к переменной у, находим У(0 = eA(,‘/«,y(Z0) +1 еА1'*’)в(т)у(т)Л. 'о Оценим норму решения у(/) при t е е 1<Ь. ®) ||у(')|| 2 ||еА<'*'|>,| |y(z0)| + 4||еА<'-’)||||ВО)|| |УМ А; *0 здесь норма экспоненциала матрицы согласно (1.4.28) также не превышает экспоненты се(а + 8Ч где С > 0. Таким образом, из асимп-
ОБОБЩЕНИЕ ЧАСТОТНОГО МЕТОДА АНАЛИЗА УСТОЙЧИВОСТИ 59 готической устойчивости системы (1.4.14) сле- дует а < 0 и мы имеем |у(')|| 1С |у(/0)||е<“+е)<''‘ь) + 4«(“+еХ'-х)|1МЫ|л- *0 Согласно лемме Гронуолла- Веллмана 5 с ИМ е"(а+с)<’ exp jc|B(z)| Л, to следовательно, |У(О|| * с |у(/0 )|| + cj |В(т)|| А. (1.4.29) Последнее слагаемое в показателе экспоненты растет не быстрее некоторой линейной функ- ции. Действительно, на основании правила Лопиталя получаем t /->00 t — /q /->00 1 т.е. t JИМ Л <e(t-t0). *0 Неравенство (1.4.29) принимает вид |y(/)|sc|y(/o)|e‘e+2*X,-W, откуда и следует асимптотическая устойчи- вость решения у(/). Свойство асимптотической устойчивости системы (1.4.14) оказалось настолько сильным, что при доказательстве теоремы 2 нам не по- надобилась сходимость интеграла от нормы возмущающей матрицы В(/) и оказалось вполне достаточной сходимость ее к нулевой матрице. 1.4.6. ОБОБЩЕНИЕ ЧАСТОТНОГО МЕТОДА АНАЛИЗА УСТОЙЧИВОСТИ НА МНОГОМЕРНЫЕ СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Использование вычислительной техники в интерактивном режиме открывает новые возможности для применения частотных мето- дов анализа и синтеза автоматических систем. Частотные методы, имеющие в своей основе строгую и хорошо изученную теорию функций комплексного переменного, допускают также и графическую интерпретацию, что значитель- но облегчает задачу конструирования следя- щих систем. Мы имели возможность убедиться в этом на примере 1.4.3, где использовался критерий Найквиста в логарифмических коор- динатах. Частотные методы обладают весьма цен- ным качеством - малой чувствительностью к ошибкам в определении параметров математи- ческой модели исследуемой системы. Такая нечувствительность к малым изменениям па- раметров получила, наименование робастно- сти. При введении запаса по фазе и амплитуде при использовании критерия Найквиста дос- тигается также робастность проектируемой системы. Напомним некоторые определения из алгебры матриц, которые понадобятся для последующего изложения основных идей час- тотного анализа многомерных линейных сис- тем и введем здесь же необходимую символи- ку. Симметрической называют квадратную матрицу А, если она равна своей транспониро- ванной Ат: А = (a/у); Ат = (од). Комплексносопряженной матрицей для матрицы А = (ау) называют матрицу А = ^ау}. Ее элементами служат числа ад , комплексно сопряженные элементам ау мат- рицы А. Эрмитово-сопряженной или просто со- пряженной называют матрицу А* = Ат. Для нее справедливы соотношения: (А*)* = А, (А + В)* = А* + В*, (АВ)* = В* А*. Если А* = А, то матрицу называют эр- митовой или самосопряженной. Обратную по отношению к А матрицу бу- дем обозначать А*1. По определению А'1 А = АА-» = Е, где Е - единичная матрица того же порядка, что и А. Ее главная диагональ заполнена еди- ницами, а остальные элементы - нули. Обратная матрица А*1 единственная для А. Действительно, если допустить существова- ние другой обратной матрицы В, то
60 Глава 1.4. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ ДИНАМИЧЕСКИХ СИСТЕМ В А = А1 А. Умножая последнее равенство на А'1 справа, получим В = А1. Квадратную матрицу называют невырожденной, если ее определитель detA не равен нулю. Каждая невырожденная матрица имеет обратную. Ортогональной называют матрицу, обла- дающую свойством А-' = Ат Отсюда следует, что для ортогональной матри- цы ААТ = АТА = Е. Нетрудно проверить не- посредственным перемножением, что матрица поворота в плоскости cos a -sin а sin а cos а ортогональна. Если матрица U обладает свойством U-1 = U*, то ее называют унитарной. Легко проверить, что detU = 1. Введем операцию полярной декомпозиции матриц. Подобно тому, как комплексные чис- ла можно представить в полярных координа- тах, комплексная матрица Т также может был» записана в виде т = иня либо Т = н£и, где U - унитарная матрица; Ид и - поло- жительные полуопределенные матрицы Эрми- та. Их можно назвать соответственно правым и левым модулями матрицы Т. Они однознач- но определяются формулами Нл =7??; (1.4.30) н£ =1/ттг, где Т* означает комплексно сопряженную транспонированную матрицу Т. Если Т невы- рожденная, то U определяется однозначно из любого равенства (1.4.30). Представление мат- рицы в виде (1.4.30) называют полярной деком- позицией. Ее легко найти из сингулярной деком- позиции по величине, для которой существуют программы, входящие в современное матема- тическое обеспечение ЭВМ. Если Т может быть разложена однознач- но в виде Т = XEV*, где X, V - унитарны, Е - диагональна, то т = (xv)*(vEv*) = инл и Т = (ХЕХ*) (XV*) = н£и. Будем рассматривать Т как передаточную матрицу. С помощью полярной декомпозиции введем определения: 1) характеристические коэффициенты усиления матрицы Т, которые являются ее соб- ственными значениями; 2) главные коэффициенты усиления Т, ко- торые служат собственными значениями эрми- товой матрицы при ее полярной декомпози- ции*; 3) главные фазы Т, т.е. аргументы собст- венных чисел унитарной матрицы U при по- лярной декомпозиции. Теорема 1. Значения характеристических коэффициентов усиления передаточной мат- рицы Т ограничены сверху и снизу соответст- венно минимальными и максимальными зна- чениями главных коэффициентов. Теорема 2. Если главные фазы комплекс- ной матрицы Т не превышают угла я, то аргу- менты характеристических коэффициентов усиления матрицы Т ограничены сверху и снизу соответственно максимальными и ми- нимальными значениями главных фаз. Для квадратной матрицы G(p) порядка т х т из теорем 1 и 2 с очевидностью следует, что при любом значении частоты со р — /со можно найти криволинейные прямо- угольные области (рис. 1.4.13), содержащие внутри т характеристических коэффициентов усиления. Если главные фазы выходят за пре- делы угла я, то характеристические коэффици- енты лежат внутри кольцевой области, опреде- ляемой минимальным и максимальным значе- ниями главных коэффициентов усиления. Если криволинейные прямоугольники и коль- цевая область построены для всех частот D- контура Найквиста, то на плоскости коэф- фициентов усиления выделяется область, внут- ри которой лежат все характеристические ко- эффициенты усиления. Такую область будем называть главной областью. Рассмотрим случай многомерной систе- мы с одинаковой размерностью векторов входа ♦ Поскольку собственные числа Т*Т и ТТ* совпадают, можно рассматривать любую декомпозицию. Главные коэффициенты часто называют в вычислительной математике сингу- лярными значениями. Термин главный коэффици- ент усиления больше отражает физическую сторону понятия.
ОБОБЩЕНИЕ ЧАСТОТНОГО МЕТОДА АНАЛИЗА УСТОЙЧИВОСТИ 61 кипения Рис. 1.4.13. выделение главной области на плоскости годографов и выхода. Под коэффициентом усиления мож- но понимать отношение энергии или мощно- сти на выходе к тем же параметрам входного сигнала. Периодический входной сигнал. Запишем входной сигнал в форме и(0 = и sin(co/ 4- 3) : 1(1) = = (iq, 1/2, —, Wm)Tsin(o/ 4- 3) • 1(/). В случае матрицы Т с постоянными ко- эффициентами вектор выходного сигнала можно представить в виде У(О = щ[ТС/®) - ТО)] cos((o/ 4- 3) 4- 4- у [ТО) + ТО) sin(©/ 4- 3)] и/. Найдем среднеквадратическое значение выходного сигнала М2 = J Ут (О У(0 л = i uTS(<o )u. О Здесь матрица S(co) = у|т*О)ТО) +Т*О)ТО)] и, следовательно, действительная и симметри- ческая. Запишем также среднее квадратическое значение входного сигнала 2я/со Н2 = 77 j “т<0 “(ОЛ = 7 «т“ 27С J 2 О и составим отношение ||у||2/|и||2 • Если про- нумеровать главные коэффициенты усиления уХ03) матрицы Т(/со) таким образом, чтобы их значение возрастало вместе с номером, т.е. Yl(<») £ YiC®) ••• Ym(®)> то можно пока- зать, что Г?(И)<;Ыт^т(“)- (1.4.31) Н Отношению (1.4.31) можно придать точ- ный физический смысл, если рассматривать синусоидальный сигнал как напряжение, при- ложенное к сопротивлению в 1 Ом. Тоща ко- эффициент усиления представляет собой от- ношение мощностей, рассеиваемых на этом сопротивлении на входе и выходе системы с передаточной матрицей Т(со). В более общем случае входного сигнала, состоящего из гармоник с различными фаза- ми, т.е. при и//) = U/sin(co/ 4- 3/) • 1(/) границы отношения (1.4.31) остаются теми же. Апериодический входной сигнал. В случае апериодического сигнала вместо ряда Фурье для входного сигнала следует рассмотреть ин- теграл Фурье и/(/ю)= -00 для существования которого необходимо и достаточно условия абсолютной сходимости вида 00 ||ц/(0|Л< 00. — 00 Среднее значение квадрата модуля |U/(/)| называют спектральной плотностью сигнала иХО» и ему также можно придать смысл плотности энергии. Более определенно: энергия, рассеиваемая сигналом на нагрузке в 1 Ом в частотном диапазоне [i/j, 1/3] находит- ся интегрированием “1 N/2 raeU<">(/) = -N/2 Отношение
62 Глава 1.4. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ ДИНАМИЧЕСКИХ СИСТЕМ = £р|(НЛ¥,ф(,НЛ¥) = I'W /=1 назовем коэффициентом усиления многомер- ной системы. В работе [1.12] показано, что этот коэффициент ограничен пределами ,;WsCWts,2(„. |UOH2 Соотношение меащу характеристическим и главным коэффициентами усиления и фазой комплексной матрицы. Рассмотрим две теоре- мы, имеющие ключевое значение для форму- лировки критерия устойчивости многомерных систем. Теорема 1. Характеристические коэффи- циенты комплексной матрицы Т ограничены сверху и снизу соответственно максимальным и минимальным значениями главных коэффи- циентов усиления. (Это хорошо известный результат из линейной алгебры, [1.16]). Теорема 2. Если* главная фаза комплекс- ной матрицы Т не превосходит 180е, то аргу- менты характеристических коэффициентов усиления этой матрицы ограничены сверху и снизу максимальным и минимальным значе- ниями главных фаз. Доказательство . Пусть Т мо- жет быть представлена своей полярной деком- позицией Т = ЦНЯ и v - собственный вектор Т, соответствующий собственному числу X, т.е. Tv = Xv. Обозначим также р/ и Zi - набор собственных чисел и соответствующих им собственных век- торов унитарной матрицы U, образующих ортонормированную систему, аргументы кото- рых служат главными фазами матрицы Т. То- гда М(НЛУ)‘, v] = [(Hrv)*, Tv] = = v*H/UHAv или, представив унитарную матрицу U в виде ^=Xp'z'z'’ 1=1 запишем = Sp'lH«v’zl2- /=1 Здесь предполагается, что матрица Т не- вырожденная и, следовательно, Ид также не- вырожденная и эрмитова по определению. Отсюда вытекает, что скалярное произведение (Н/j v, v) вещественно и неотрицательно, а число X находится внутри выпуклого конуса, порожденного множеством {р/}. Выпуклый конус образует замкнутое множество линей- ных комбинаций с неотрицательными коэф- фициентами. Если описать дугу в комплекс- ной плоскости с центром вначале координат, отсчитывая углы против часовой стрелки, то угол пересечения дуги с поверхностью конуса будет минимальной главной фазой, а угол, при котором дуга выходит из внутренности конуса - максимальной главной фазой. Таким обра- зом, доказано, что аргументы характеристиче- ских коэффициентов Т ограничены сверху й снизу максимальной и минимальной главны- ми фазами Т, что и требовалось доказать. Достаточные условия устойчивости. В наиболее общей формулировке критерий Найквиста утверждает следующее: замкнутая система устойчива тогда и только тогда, если годограф характеристического коэффициента усиления охватывает критическую точку в направлении против часовой стрелки столько раз, сколько полюсов с поло- жительной вещественной частью содержит передаточная функция разомкнутой системы. Теперь нужно сформулировать, исполь- зуя теоремы 1 и 2, аналогичные условия ус- тойчивости в терминах главных коэффициен- тов и фаз передаточной матрицы G(/oo). На основании теорем 1 и 2 для передаточной матрицы G(p) разомкнутой системы при про- извольном значении частоты р = j(a можно найти криволинейные прямоугольники (сег- менты кольцевой области) с углом, определяе- мым максимальным и минимальным значе- ниями главных фаз, внутри которых находится т значений характеристических коэффициен- тов усиления годографа (обобщенной диа- граммы Найквиста). Если главные фазы не образуют выпуклого конуса, то характеристи- ческие коэффициенты усиления лежат внутри кольцевой области, определяемой максималь- ным и минимальным значением главных ко- эффициентов усиления. Если эти кольцевые прямоугольники или кольцевые области по-
ОБОБЩЕНИЕ ЧАСТОТНОГО МЕТОДА АНАЛИЗА УСТОЙЧИВОСТИ 63 строены для значения S вокруг D-контура Найквиста, то на комплексной плоскости можно зачертить область, которую мы будем называть главной; внутри нее будут находиться годографы всех характеристических коэффи- циентов усиления. Построив такую область, можно сформулировать следующий обобщен- ный критерий Найквиста: замкнутая система устойчива, если главная область охватывает критическую точку т раз в на- правлении против часовой стрелки, при этом т - число полюсов передаточной матрицы разомкнутой системы с положительными ве- щественными частями. Можно сформулировать также критерий неустойчивости: замкнутая система неустойчи- ва, если число т охватов точки главной областью не равно числу полюсов с положительной вещественной частью переда- точной матрицы разомкнутой системы. Если критическая точка лежит внутри главной области, то не представляется воз- можным сделать вывод об устойчивости или неустойчивости. Сформулированный критерий Найквиста в обобщенной форме служит для определения устойчивости при наличии одного коэффици- ента усиления, общего для всех контуров. Он не может охарактеризовать робастности устой- чивости при наличии произвольных возмуще- ний. Попытаемся сформулировать достаточные условия робастности многомерной системы при наличии линейных возмещении. Робастная устойчивость. Поставим задачу найти условия, при которых система с обрат- ной связью сохраняет устойчивость, несмотря на аддитивные или мультипликативные воз- мущения (рис. 1.4.14). Покажем, что эти усло- вия выполняются, если ________1_________ |(l+G(/<o)-,)“'|| ||ДС(Л>)||< при V® в мультипликативном случае и IWobir—-п |(I + GO)) *| при V® при аддитивном возмущении. Эти условия выводятся как следствие теоремы о малом коэффициенте усиления при некотором преобразовании структурных схем. Для того чтобы использовать критерий Найквиста в робастном смысле, преобразуем схемы, изо- Рис. 1.4.14. К определению робастной устойчивости при возмущениях: а - мультипликативных; б - аддитивных браженные на рис. 1.4.14 а и 1.4.14, б к виду рис. соответственно 1.4.15, а и 1.4.15, б. Сле- дует обратить внимание на то, что система на рис. 1.4.14, а устойчива тогда и только тогда, когда устойчива система на рис. 1.4.15, а. То же можно сказать в отношении схем на рис. 1.4.14, б и рис. 1.4.15, б. Путь дальнейших рассуждений в основном совпадает для муль- типликативного и аддитивного случаев, и мы для простоты ограничимся в дальнейшем мультипликативным. Построим главную область для переда- точной функции (I 4- GO®)'1)'1 и поставим вопрос: можем ли мы, зная главный коэффи- циент и фазу для AG(/o)), построить главную область, внутри которой находятся собствен- ные (характеристические) годографы AGO®) (I 4- GO®)'1)'1 ? Рис. 1.4.15. Преобразование структурных схем при анализе робастной устойчивости: а - при мультипликативном возмущении; б - при аддитивном возмущении
64 Глава 1.5. КАЧЕСТВО ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ При утвердительном ответе мы сможем нало- жить условия на возмущение AG(/<o), при котором возмущенная система остается устой- чивой. Сформулируем этот положительный ответ после введения нескольких обозначений. Обозначим пивные коэффициенты усиления передаточной функции AG(/to) (I + G(j»)-1)_1 через ai(co) £ a2(o) £ ... aw(d)), а фазы через $i(co) < ^(о) £ ... < 3w(co). Пусть для определенности диапазон изменения {ЭХ®)1 не превышает л. Пусть далее главные коэффи- циенты и фазы AG(/(d) будут соответственно 51(ш) < 52(ш) < ... < 5т(ш) и si(co) £ s2(d)) £ < ... £ sm(a). При этом фазы {еХ©)} могут иметь от- рицательный или положительный знак в зави- симости от запаздывающих или опережающих характеристик возмущения. Обозначим также отношения «1(и) 5i(co) и определим величину ( (q(d)) - 1)с2(со) \|/ т (©) = arctd v z —. Vl-(q(d))- l)c2(d))J Теперь сформулируем следующие теоре- мы. Теорема 3 (теорема малого коэффициента усиления). Замкнутая система под мультипли- кативным возмущающим воздействием остает- ся устойчивой, если: a) AG(p) постоянна и б) для всех со 5m(d))aw(d)) < 1. Применение этой теоремы часто приво- дит к незначительным результатам, однако эти результаты могут быть расширены, если рас- сматривать главные фазы, как это сделано в следующей теореме. Теорема 4 (теорема малых фаз). Замкну- тая система под мультипликативным возму- щающим воздействием остается устойчивой, если: a) AG(p) постоянна; б) диапазон изме- нения величины $Х®) + еХ®), A j — 1» • не превышает л для все значений со; в) (ci(co) - - 0 0(“) < •; О Е1(<о) + эки) - ч/т(“) > Д) ет(о>) + Эт(й>) + ч/т(<о) 2 я. Условия г) и д) аналогичны ограничениям на модуль фазы при анализе одномерных систем. Вообще го- воря, теорема 4 чаще важна в низкочастотном диапазоне, когда 3j(co) эквивалентно неболь- шому запаздыванию. В высокочастотной об- ласти di(co) приближается по своему значению к -л, а главная область находится в малой ок- рестности точки -1. В этом случае более по- лезной оказывается теорема 3. В соответствии с этим замечанием для возможности исследо- вания робастности на всем диапазоне частот содержание теорем 3 и 4 объединено в теореме 5. Теорема 5. Замкнутая система под муль- типликативным возмущающим воздействием остается устойчивой при со = сов, если: а) вы- полняются условия теоремы 4 в интервале частот [0, сов]; б) выполняются условия теоре- мы 3 в интервале частот [<ов, оо). Не приводя здесь строгих доказательств теорем 3 и 4, укажем на основные идеи дока- зательства. Теорема 3 ограничивает по модулю годографы главных коэффициентов, и поэтому при любой фазе они не попадают в опасную окрестность точки -1. Содержание теоремы 4 запрещает пересечение отрицательной части вещественной оси путем ограничения на фазу, в результате чего мы снова не попадаем в ок- рестность точки -1, но теперь уже при любой амплитуде. Теорема 5 вобрала в себя ограни- чения предыдущих теорем для разных диапа- зонов частот. Глава 1.5 КАЧЕСТВО ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 1.5.1. КАЧЕСТВО ВОСПРОИЗВЕДЕНИЯ ПРИ ПЛАВНЫХ ВОЗДЕЙСТВИЯХ В рамках линейной теории, которой по- священа настоящая глава, проблема анализа качества процесса автоматического управления сводится к двум аспектам: 1) к анализу точно- сти воспроизведения плавных воздействий и 2) к анализу процесса перенастройки с одного режима слежения на другой, т.е. к исследова- нию переходных процессов. В этом разделе рассматриваются постановка задачи и методы анализа работы автоматических систем при воспроизведении плавных воздействий, кото- рые формально задаются в виде детерминиро- ванных (неслучайных) аналитических выраже- ний. Плавными называют также воздействия, которые принципиально могут быть произве- дены автоматической системой без нарушения энергетических или силовых возможностей исполнительных элементов. С математической точки зрения задача анализа точности эквивалентна решению об- щего уравнения
КАЧЕСТВО ВОСПРОИЗВЕДЕНИЯ ПРИ ПЛАВНЫХ ВОЗДЕЙСТВИЯХ 65 f = Ау + ви, описывающего автоматическую систему. Прак- тические приемы анализа точности автомати- ческих систем позволяют избежать этой, ино- гда достаточно громоздкой процедуры, и сверх того - связать критерий оценки точности с параметрами исследуемой системы формаль- ными соотношениями. Один из таких практи- ческих приемов основан на описании автома- тической системы с помощью интеграла сверт- ки. Обратимся к наиболее общему выражению (1.2.26), которое можно записать также в виде 00 х(0 = J и(/ - т)£(т)А, (1.5.1) О имея в виду, что к(х) = 0 при т £ О, т.к. реак- ция на воздействие в момент т = 0 не может предшествовать последнему. Плавность функ- ции «(/) предполагает существование доста- точно большого числа производных и по t. Запишем разложение в окрестности точки N V “('-т)= tV+o<tJV>- <t5-2> v=0 Умножая левую и правую части (1.5.2) на к(х) и интегрируя, имеем N оо x(O=XA^(-1)VJt4(t)A- v=0 V' О Величины mv = J tv£(t)A, О как известно, называются в математике мо- ментами функции к(х) v-ro порядка. Момен- ты ту можно вычислить и иным способом. Обращаясь к формуле (1.2.29), перепишем ее в явной форме* 00 Ф(р) = | к(х)е~^(Ь. О Дифференцируя v раз по р и переходя к пределу при р —► 0, находим * В отличие от формулы (1.2.29) здесь использовано обозначение передаточной функции Ф(р) для замкнутых систем. 00 = (-1)фЧ(т)А. р=0 о Вычисляя ошибку замкнутой математической системы как разность между выходной вели- чиной х(1) и управляющим воздействием u(f) 80 =. «0 - *0> находим 80 = «(О - £ 8VA(T)<ft = v=0 ’ о = «(О - X (-X)Vmv —Г2- (L5.3) v=0 Формулами вида (1.5.3) практически можно пользоваться, лишь удерживая ограни- ченное число слагаемых, поэтому при интег- рировании опущен остаточный член. Таким образом, представив ошибку в виде отрезка рада 80 = СО«0 + С, С2 (1.5.4) можно составить представление о том, как влияют производные различных порядков на точность воспроизведения входного воздейст- вия u(f). Коэффициенты Q в формуле (1.5.4) называют коэффициентами ошибок. Они свя- заны с моментами весовой функции оче- видным соотношением Q = 1 - то; Q = (-1)* + хтк. Представление ошибок в виде (1.5.4) Особенно удобно, когда управляющее воздей- ствие задается в виде полинома конечного порядка, который можно также рассматривать как еще один тип тестового воздействия (см. п. 1.2.5). Коэффициенты ошибок могут быть най- дены и непосредственно из выражения для весовой функции к^х) автоматической систе- мы по отношению к ошибке 00 80 = |«(Г-т)А6(т)А. О Аналогично предыдущим выкладкам по- лучена формула для вычисления коэффициен- тов ошибок интегрированием 3 Зак 1023
66 Глава 1.5. КАЧЕСТВО ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ 00 Cv=(-l)VpV*eO)A О либо дифференцированием передаточной функции по отношению к ошибке Коэффициенты ошибок могут быть вы- числены и без операций дифференцирования или интегрирования для передаточных функ- ций дробно-рационального типа. Пусть передаточная функция W(p) ра- зомкнутой системы представлена в виде отно- шения двух полиномов pv i + alp + a2p2+...+a„pH ’ здесь v - порядок полюса передаточной функ- ции. Согласно (1.2.23) передаточная функция по отношению к ошибке также представляется в виде отношения двух полиномов Фв(р) ж РЛ1(1+Д1/> + Д2/,2+-+длР") pv(l + aip + а2р2+.. .+a„p”)+ • •• л • +и(1+Ьр+b2pi+...+bmp") Представим передаточную функцию Фк(р) в виде степенного ряда с некоторым радиусом равномерной сходимости, отличным от нуля: Ф«(р) = 4) + АР + АР2 + ••• (1-5.6) Почленное дифференцирование ряда (1.5.6) указывает на связь коэффиц иентов 4 с коэффи- циентами ошибок G. Сами коэффициент 4 можно найш из очевидного тождества [p*(i + щр + ... + ад") + + ц(1 + Ь\р + ... + х х (4) + Ар + —)а ap*(i + <*ip +... + ад"). Пример 1.5.1. Найдем коэффициент ошибок Q), Ci и С2 для следящей системы с передаточной функцией в разомкнутом со- стоянии <,s’> Передаточная функция по отношению к ошибке согласно (1.5.5) принимает вид ф (/>)= (1+У)(1+Тр)р = еУР> (l + tp)(l + Tp)p + (i = A) + l\P + hP2 • Таким образом, получаем соотношение для определения коэффициентов ошибки (1 + 40(1+ Тр)р* 1(1 + V») (1 + Ч»)/> + н!(4> + hp + /jp2)- Отсюда получаем последовательность рекур- рентных соотношений Со =0; Q =^-; CiH + /о = 1; с? = — [т + т-I; НК IV Со (7* + т) +1\ + /2И = Т + т. Коэффициент ошибки при воспроизве- дении постоянной составляющей Q = 0. Этот замечательный результат связан с наличием полюса первого порядка в знаменателе переда- точной функции W(p). Он свидетельствует о том, что статические воздействия вида и =Uq = - const следящая система после затухания переходного процесса воспроизводит без ошибки. Такую систему называют астатине- осой, а показатель v - порядкам астатизма. В связи с этим замечанием получим не- сколько более общий результат. Пусть переда- точная функция разомкнутой автоматической системы имеет вид JT(p) = м^(р) PvD(p)’ соответствующая передаточная функция по отношению к ошибке Фб0»______ pvD(p) + vM(p) Входное воздействие задано в виде поли- нома N u(f) = и0 +и^ + и2/2+...- (1.5.8) Преобразуя по Лапласу (1.5.8), имеем N -I j=0 Р Следовательно, изображение ошибки
КАЧЕСТВО ВОСПРОИЗВЕДЕНИЯ ПРИ ПЛАВНЫХ ВОЗДЕЙСТВИЯХ 67 Е(} = у pvD(p) + nM(p)faop^1' Найдем предел, к которому стремится ошибка системы после затухания переходного процесса. Согласно теореме о конечном зна- чении lim е(/) = lim рЕ(р) = /-►со р->0 = iim------£(£)-----V/,,»-/. р-»0 pvD(p) + цМ(р) fa. Таким образом, если порядок полинома N, представляющего входное воздействие, мень- ше, чем порядок астатизма системы, то ошиб- ка с течением времени стремится к нулю. Если порядок астатизма равен порядку полинома У то с течением времени ошибка принимает некоторое постоянное значение Mm с(0 = При v < N ошибка растет с течением времени неограниченно. Величина ошибки при условии N = v • тем меньше, чем выше коэффициент усиления р разомкнутой системы W(p). Этот коэффи- циент, определяющий точность воспроизведе- ния входного воздействия, называют добротно- стью следящей системы. Требования к точности системы обычно оказываются в противоречии с условиями ус- тойчивости. Так, например, в случае переда- точной функции вида (1.5.7) требование ус- тойчивости удовлетворяется неравенством 1 1 т Т ограничивающим добротность системы сверху. При входной функции «(/) = uq + U\t уста- новившееся значение ошибки будет Системы с повышенным порядком аста- тизма обладают большей точностью, но, вооб- ще говоря, требуют специальных мер по обес- печению их устойчивости. Противоречивые требования к точности и устойчивости могут быть удовлетворены в ряде случаев с помощью корректирующих уст- ройств. Пример 1.5.2. Рассмотрим вновь канал стабилизации крена из примера 1.4.2. В этом случае учтем возмущающий момент А/в, воз- никающий, например, вследствие явления косого обдува. Требуется найти угол крена, образующийся под действием возмущающего момента. Уравнение стабилизируемого объекта за- пишется в виде Ту + bi = + Мъ. Остальные два уравнения имеют прежний вид: и ~ к$у - Уравнение гиростабилизатора и Т8 + 8 = - уравнение силового привода. В операторной форме после исключения про- межуточных координат и и 8 получаем соот- ношение между у(/) и Л/в: [(//> + *)(7> + 1)р + kikfaWtp)- = (7> + 1)М.(р). Пусть Мъ = А/во = const. Тогда Мъ(р) = = Р Установившееся значение угла крена оп- ределяется предельным переходом Густ. = lim Г(Е) = lim pV(j>) = /-►оо р->0 = Мл / k)k2k3. Если, например, = 1 Н-м и k\kik3 = = 5 Н м, то YyCT. = 0,2 рад = 11,46®. Уменьшение угла крена путем простого увеличения коэффициента усиления (добротности) невозможно, так как согласно примеру 1.4.2 при kfafy - 5,6 Н*м система теряет устойчивость. Таким образом, необхо- дима структурная доработка системы. Введем в схему демпфирующий гироскоп (рис. 1.5.1). При вращении по углу крена вокруг измери- тельной оси ротор стремится прецессировать, преодолевая сопротивление пружин. Угол от- клонения рамки регистрируется потенциомет- рическим датчиком. Возникающие переходные процессы демпфируются поршнем, помещен- ным в цилиндр с регулируемым зазором. До- бавляя сигнал с датчика демпфирующего гиро- скопа к прежнему сигналу к$у, получаем « = к3у+к4у. Уравнение канала стабилизации в результате приобретает вид [ Tip* + (/ + bDp2 + (b + k)hfa)p + + М2*з)Г(р)= СП> + \)Мл/р.
68 Глава 1.5. КАЧЕСТВО ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ Рис. 1.5.1. Демпфирующий гироскоп Таким образом, введение демпфирующего гироскопа привело к увеличению коэффици- ента при первой производной от угла крена по времени. При достаточно большом коэффици- енте усиления ^4 установившееся значение угла крена может быть снижено. Выбрав, на- пример, = 4, можно обеспечить устой- чивость канала стабилизации при значениях *1*2*3 < (6 + *1*2*4 )[у + у] = = (0,8 + 4)f—+ —1 =33,6 Нм. ' 'к 0,2 0,4 J Задавшись углом ууст = 2,5е, мы видим, что требующееся при этом значение = = 22,5 с*1 не превышает пределов устойчиво- сти. В то же время корни характеристического уравнения Pl = -5,52 с"1; />2,3 = -0,739 ± j 7,16<о соответствуют переходному процессу с часто- той 7,16 с’1 = 1,14 Гц, затухающему через 4 с, т.е. через три колебания. 1.5.2. МЕТОДЫ ВЫЧИСЛЕНИЯ ПЕРЕХОДНЫХ ПРОЦЕССОВ В ЛИНЕЙНЫХ АВТОМАТИЧЕСКИХ СИСТЕМАХ При анализе показателей качества в гл. 1.3 наиболее часто упоминается время пере- ходного процесса Т Идеальной в смысле бы- стродействия могла бы считаться система с нулевым временем переходного процесса. Тех- ническая неосуществимость такого переход- ного процесса связана в первую очередь с ог- раниченностью момента Л/, развиваемого ис- полнительным двигателем. Максимальное угловое ускорение е, которое способен развить двигатель, равно отношению момента М к моменту инерции /. В свою очередь момент инерции зависит от массы управляемого объ- екта и момента инерции собственного ротора двигателя. В связи с этим в автоматических системах широкое распространение нашли двухфазные электродвигатели с полым рото- ром, выполняемым в виде легкого алюминие- вого стакана. Среди мощных приводов, спо- собных быстро отрабатывать входные воздей- ствия в виде ступенчатых функций, следует отметить объемные гидроприводы с большим давлением рабочей жидкости. Быстродействие автоматических систем, т.е. малое время переходного процесса непо- средственно связано с видом частотной харак- теристики. При нулевом времени переходного процесса автоматическая система могла бы воспроизводить разрывный периодический сигнал в виде "меандры" (см. рис. 1.2.5), раз- ложение которой в ряд Фурье (1.2.17) имеет бесконечно широкий спектр. В то же время частотные характеристики реальных (физичес- ки осуществимых) следящих систем монотон- но убывают с ростом частоты. Это особенно наглядно можно видеть на логарифмических частотных характеристиках (см., например, рис. 1.4.6). С формальной точки зрения это связано с тем, что числитель дробно- рациональной передаточной функции имеет порядок, меньший знаменателя. Условно принято считать, что автомати- ческая система воспроизводит без искажения гармоники с частотой, ограничиваемой поло- сой пропускания. Верхней границей полосы является частота среза, т.е. значение частоты <ос, при котором амплитудно-частотная харак- теристика Л(<ос) = 1, что соответствует 0 в логарифмическом масштабе. Если рассматривать переходный процесс как реакцию на единичный скачок 1(0 с изо- бражением 1 / р, то, очевидно, формальная связь между передаточной функцией системы и переходной функцией представится соотно- шением Заменив здесь р на /со и воспользовав- шись соотношениями Ф(/со) = Р(®) + /О((о), еР1 — cosco/ + j sincof, нетрудно получить интегральную зависимость
МЕТОДЫ ВЫЧИСЛЕНИЯ ПЕРЕХОДНЫХ ПРОЦЕССОВ 69 х(/) = —f ( ^sincoftfo, (1.5.9) Я«> (О О в которую входит только вещественная пере- менная (о. В период развития теории автоматиче- ского управления в 50-х и даже в начале 60-х годов соотношение (1.5.9) играло основную роль при построении переходных процессов графоаналитическим путем (см., например, [16, 21]). При современном развитии вычисли- тельной техники переходный процесс строится путем интегрирования уравнений. Тем не ме- нее частотные методы получили такое широ- кое распространение благодаря своей нагляд- ности, что вычисление характеристик часто включают в математическое обеспечение ЭВМ. Остановимся здесь лишь на качественной оценке протекания переходного процесса, опираясь на формулу (1.5.9). В частности, если функция Р(<о) монотонно убывающая, то можно указать границы, в которых протекает переходный процесс. Типовая зависимость монотонно убывающей характеристики Р((о) показана на рис. 1.5.2. Если заключить его в границы Р-(®) £ Р(®) £ Р+(®), то можно вычислить переходные функции х +(/) и х ’(/), соответствующие указанным границам. В случае Р(©) = Р+(<о) имеем + /а 2 7 Sin 2 о./ а х+(Г) = — I-------dm = — Si((Dcr). Я j (0 я v ' 0 Функция Si(z) - интегральный синус - хорошо изучена и табулирована. Независимо от существующих таблиц ее вычисляют в виде частичных сумм ряда z3 Z5 Z7 Sl(z) " * "ТЗ!+Г5! " Г7!+'" с любой наперед заданной точностью. Благодаря тому что методы решения дифференциальных уравнений, описывающих линейные автоматические системы с постоян- ными параметрами, хорошо изучены, пред- ставляется возможным существенно сократить затраты времени на вычисления переходных процессов в этих системах при использовании ЭВМ. Наиболее популярными методами интег- рирования дифференциальных уравнений, применяемыми при использовании ЭВМ, являются: простой метод Эйлера, модифици- рованный метод Эйлера-Коши, метод Рунге- Кутта и интерполяционный метод Адамса. Все перечисленные методы достаточно универ- сальны, и мы остановимся здесь на целесооб- разности их использования, начиная с наибо- лее просто реализуемого при программирова- нии - метода Эйлера. При этом достаточно рассмотреть интегрирование дифференциаль- ных уравнений двух элементарных звеньев - апериодического и колебательного. Как уже было показано, автоматическая система произ- вольной сложности может быть рассмотрена как комбинация этих двух типов звеньев. До- бавление дифференцирующих звеньев, как будет показано, не вносит принципиально новых приемов в вычислительную процедуру. Рис. 1.5.2. Нижняя я верхняя оценки переходного процесса при монотонно убывающей вещественной характеристике
70 Глава 1.5. КАЧЕСТВО ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ Согласно методу Эйлера в дифференци- альном уравнении вида Г^ + х=«(0 (1.5.10) at производная dx / dt заменяется разностным отношением dx x(t + h)~ x(t) x„+i - xn dt h h ' Следовательно, вместо (1.5.10) имеем хл+1 - ” j»}’ (1.5.11) Единственный характеристический ко- рень разностного уравнения (1.5.11) должен удовлетворять неравенству (1.5.12) в противном случае будет нарушена устойчи- вость вычислительной процедуры. Неравенство (1.5.12) при h > 0 эквивалентно условию h < <27! Возможности метода. Эйлера рассмот- рим на примере. Пример 1.5.2. Найти переходный процесс в линейном фильтре, описываемым уравнени- ем 0Дх + х = 0 (1.5.13) при начальном условии х(0) = 1. Согласно условию (1.5.12) устойчивость счета не будет нарушена, если выбрать шаг счета h = 0,05. Подставив это значение в (1.5.11), имеем Хл+1 = 0,5хл. Вычислим несколько значений хп и сравним их с точным решением: t х(1) е-ю» 0,00 1,000 000 1,000 000 0,05 0,500 000 0,606 531 0,10 0,250 000 0,367 879 0,15 0,125 000 0,223 130 Из приведенных результатов счета следу- ет, что хотя устойчивость не нарушена, точ- ность явно неудовлетворительна. Оценим погрешность метода Эйлера и приведенного примера. Для этого воспользу- емся известным выражением -А , h е 7 = 1- —+ Т 3 Погрешность рекуррентной формулы (1.5.11) равна сумме отброшенных членов разложения, которая не превышает величины первого от- брошенного члена Л2 / (2Т2). При желании получить абсолютную погрешность разового счета, не превышающую, например, 10*6, не- обходимо, чтобы шаг счета не превосходил 1,4 • 10'4 с, что, безусловно, приведет к недо- пустимо большим затратам машинного време- ни. Рассмотрим условия устойчивости вы- числений для колебательного звена с диффе- ренциальным уравнением Т2х + 2£73с + х = u(f). (1.5.14) Вводя обозначение у = х, имеем 1 2$ ---- Т2 Т При переходе к дискретной процедуре счета вместо уравнения (1.5.14) запишем хл+1 Ул+1. 1 -h/T2 h 1-2£А Т (1.5.15) Характеристическое уравнение при £ < 1 имеет два корня 11Д = 1-4Л/т±/л/(г71-§2). Условие устойчивости |Х| < 1 в явной форме (1 - ty / 7)2 + А2(1 - £2)/ Т2 < 1, откуда h < 2£7! Условие устойчивости получилось с большим ограничением, чем у апериодиче- ского звена, т.к. £ < 1. Например, для вычис- ления переходных режимов гиропривода с собственной частотой 70 Гц с коэффициентом демпфирования £ = 0,1 предельное значение шага h равно 4,5 * 10'4 с. Учитывая оценку погрешности, полученную в примере 1.5.2, для сохранения точности шаг приходится умень- шить до величины порядка 5 * 10*7 с. Приведенные примеры показывают, что использование метода Эйлера приводит к большим затратам машинного времени. В вычислительной математике разработа- ны методы, позволяющие использовать более
МЕТОДЫ ВЫЧИСЛЕНИЯ ПЕРЕХОДНЫХ ПРОЦЕССОВ 71 крупный шаг при сохранении точности. Так, например, процедура Рунге-Кутта четвертого порядка имеет погрешность, пропорциональ- ную А5, но требуется четырехкратное обраще- ние к матрице (1.5.15) при продвижении на один шаг, и поэтому необходимы значитель- ные временные затраты. Оценка точности ме- тода Адамса более затруднена, так как требует- ся решение специального вспомогательного уравнения и итерационная процедура, что также сопряжено со значительными времен- ными затратами. От этих недостатков свобод- ны рекуррентные формулы, получение которых для линейных уравнений не представляет за- труднений. Рассмотрим снова уравнение (1.5.2). Согласно принятому методу представим вход- ное воздействие в u(f) его дискретными зна- чениями = и(^). Следовательно, на интер- вале tk <. t <. tk + i x(f) = u* +Ge’*, tk откуда при t = 4 находим С = (x^ -Ук)* T их(0 = «* + (х* ~.ик)е При t = tk + i получаем рекуррентное соотношение = «* +(** -“*)* ’ <1-5.16) где h = tk _ i - Формула (1.5.16) удобна для программи- рования при постоянном шаге А вычисления входного сигнала u(t). Аналогичным приемом находят рекур- рентное соотношение для колебательного зве- на с уравнением (1.5.14). На интервале tk £ t £ < tk + i решение имеет вид х(/) = ик + С1ех«/ 4- tytfy где X) и А.2 - корни характеристического урав- нения ТЫ 4- 2^ТХ 4-1 = 0. Для вычисления постоянных и С2 за- пишем выражение для производной y(f) = С1МХ|' + СгХгеУ При t = tk получаем систему уравнений относительно и С2, решая которую, полу- чаем рекуррентные соотношения для фильтра второго порядка Хк +1 = 1(>-2ех,А - Xie*»*) / (Х2 - М)1 хк - - 1(ех'* - еМ) / (Х2 - Х1)| Ук + + [1 - (XieM + ХгеМ) / (%] - х2)] ик, Ук +1 = 1(еХ'* - *М) / (>-2 - Xi)) ХАгх* - - |(Xiex.* - ХгеМ) / (Х2 - Х])1 Ук - - (eS* - e^)-^j-uk. Х1 - х2 (1.5.17) Так как при £ < 1 корни Xi и Х2 комплексные и сопряженные, то, обозначая а = / Т, р = Jl-t2 /т , имеем Xi - Х2 =j 20, Х1Х2 = = а2 4- р2 Пользуясь соотношениями е^л 4- = 2cos0A; е^А . е-уРА = у. 2sin0A, находим =«* +(** ni. а • cospA -—sin + sinpA, (1.5.18) Ук+1 = (Хк-^к)^ sin РА + + у^ sin 0А + cos 0А^. В формулах (1.5.11), (1.5.16) и (1.5.18) шаг счета определяется не параметрами Т и £, а точностью дискретного представления вход- ного воздействия и*. В частности, для вычис- ления переходного процесса при u(t) - const формулы являются принципиально точными. Как уже говорилось, добавление диффе- ренцирования (числитель передаточной функ- ции или правая часть дифференциальных уравнений) не вносит в вывод рекуррентных формул принципиально новых изменений. Укажем, например, на применение метода для звена с передаточной функцией = (L519) Из (1.5.19) следует Тх + х = Ти. (1.5.20) Обозначим разность х(0 - u(f) = z(0- Тогда вместо (1.5.20) запишем Tz+Z = u(t) - вы- ражение, не отличающееся от (1.5.10) с точно- стью до обозначений переменных. Рекуррент-
72 Глава 1.5. КАЧЕСТВО ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ ное равенство (1.5.16) переписываем в этих обозначениях в виде = -«* +(z* +«*)е'^ = -«* +хке~т или, возвращаясь к старым переменным, по- лучаем окончательно **+1 = £*+!-«*+***’*• Пример 1.5.3. Требуется подготовить ал- горитм расчета переходного процесса в колеба- тельном звене с уравнением 0,5х + х + х = О при начальных условиях х(0) = 1, х(0) = 0 с шагом h = 0,5 с. Находим параметры Т = £ = 1 /1Т— = 7^5- Следовательно, а = / Т — 1; р = =7i^?7r=i. Одноразовым счетом определяем коэф- фициенты рекуррентных соотношений (1.5.18): e^cospA - ^-sinpA^ = 0,823 067 05; |e“* Sinp*= 0,290 786 28; ц2 + P2 саА P SinP* = 0,581 572 56; e«A + COS рл =0,241 494 46. Алгоритм для программы умножения на постоянную матрицу имеет вид Хк + 1 = 0,823 067 05 Хк + 0,290 786 28 у$ Ук+1 = 0,581 572 56 Хк + 0,241 494 46 ук. Кроме переходного процесса х(1) при счете "автоматически” получается и его произ- водная. Как уже отмечалось, величина шага счета h при использовании рекуррентных соотно- шений ограничивается скоростью изменения входного сигнала 1/(1). Более точно соотноше- ние между верхней границей h и свойствами сигнала м(/) определяется теоремой Котельни- кова, согласно которой где f, Гц, - верхняя граница финитного спек- тра сигнала </(/). При построении переходного процесса для цепочки последовательно соединенных звеньев с частотными операторами W/jm) (i e 1, 2..п) выходной сигнал звена с опе- ратором Wf _ 1(до) служит входным для после- дующего звена с оператором W/jat). Поэтому при выборе величины h приходится ориенти- роваться на звено с наименьшей постоянной времени. В качестве верхней оценки величины h можно предложить, например, h = ГДС ^min ~ Пип 7/. Обычно считается, что с уменьшением шага счета точность вычислений возрастает. Однако это утверждение справедливо лишь до некоторого предела, так что шаг счета ограни- чен и снизу. Это связано с погрешностями вычисления коэффициентов рекуррентных соотношений вследствие округлений в цифро- вом процессоре ЭВМ. Как показано в [4], неточность вычисления коэффициентов сказы- вается на последующих ошибках тем сильнее, чем меньше шаг счета. Ошибки округления в меньшей степени проявляются при использо- вании универсальных ЭВМ с большой длиной слова. Оптимальный переходный процесс. В со- ответствии с установленными требованиями к переходному процессу назовем процесс опти- мальным, если он протекает за наименьшее возможное время Поставим задачу пере- хода управляемой координаты х(1) из одного состояния jq = const в другое устойчивое со- стояние Х2 = const при наличии ограничения на величину второй производной x(t) по времени. Как мы видели в самом начале на- стоящего параграфа, такая постановка задачи об оптимальном управлении связана с часто встречающимися техническими ограничения- ми момента, развиваемого исполнительными двигателями следящих систем. При дальней- шем обобщении задачи оптимального управ- ления она становится многомерной задачей вариационного исчисления и решается на ос- нове принципа максимума Понтрягина. Огра- ничимся одномерной трактовкой этой общей задачи оптимального управления, послужив- шей началом фундаментальных исследований, с единственной целью формирования частного подхода к синтезу оптимальных по быстродей- ствию следящих систем. Решение задачи о форме оптимального процесса в такой поста- новке очевидно. Если под величинами Х\ и X}
МЕТОДЫ ВЫЧИСЛЕНИЯ ПЕРЕХОДНЫХ ПРОЦЕССОВ 73 Рас. 1.5.3. Опгамалышй переходный процесс п соответствующая ему частотная харахтернсгяха разомкнутой системы понимать углы поворота вала исполнительного двигателя, то для осуществления наиболее быстрого поворота на угол *2 - нужно, что- бы половину этого угла двигатель проходил, разгоняясь с максимальным ускорением ет, а другую половину - тормозясь с заменой вели- чины гт на -ет (рис. 1.5.3). Таким образом, закон изменения ускорения x(t) по времени выражается формулой х(/) = 1(К-2л[/- Т • 1пип I- 2 +^min)8m Интегрируя дважды это выражение и имея в виду свойства единичной ступенчатой функ- ции (1.2.16), получим выражение для опти- мального переходного процесса, справедливое для всех X(/) = 1(0^L?- (1.5.21) Техническая реализация такого процесса возможна, если иметь в распоряжении испол- нительный элемент с передаточной функцией 1 / S2 и переключающее устройство в виде идеального реле, работающего в соответствии с логикой 1 при и = • - 1 при 0 при 0 £ х < Xq / 2 х0 / 2 £ х < Xq Xq ^Х ИЛИ х < 0. Такая реализация вводит нас в круг идей не- линейной теории автоматического управления. Если же попытаться решить проблему, ис- пользуя линейные элементы, то необходимо найти изображение функции (1.5.21) и отнести его к изображению скачка х<) • 1(1). Тогда получим передаточную функцию линейного устройства, осуществляющего оп- тимальный поворот на заданный угол Xq. Пре- образуя по Лапласу (1.5.21), в соответствии с теоремой запаздывания [9.16], имеем или так как 8ш = 4хо/^1Ып mtn L' Г ще Хо = х2 - р-ехр^Тцщр) .
74 Глава 1.5. КАЧЕСТВО ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ Следовательно, оптимальная передаточная функция ф(/>) = + еч>(-Твипр)]. Наличие [Р в знаменателе не должно создавать впечатления, что передаточная функция Ф(р) обладает полюсом второго по- рядка. Действительно, пользуясь разложением экспоненты в ряд Тейлора в окрестности точ- ки р = 0, находим lim Ф(р) = —lim - » + lZrin 1 + А 2 2 4 ) + ” ^айлР + у “• • •) (1.5.22) Вычислим также передаточную функцию ра- зомкнутой оптимальной системы. Из формулы (1.2.22) следует т.е. она не может быть реализована с помощью линейных элементов с сосредоточенными па- раметрами. Тем не менее представляется инте- ресным график ее амплитудно-частотной ха- рактеристики в логарифмическом масштабе, поскольку его можно сопоставить с характери- стиками, получаемыми с помощью различных комбинаций типовых звеньев при конструиро- вании. Логарифмические характеристики оп- тимальной передаточной функции рассчиты- ваются по формулам \2 sin со I (1.5.24) ^(Р) = Ф(Р) 1-Ф(р) или, учитывая (1.5.22), „ . <о > 2Sin--Sin<0 г— = arctg------------------- •_ J со 1ШП/ 1-2 cos — + cos со 2 1 - 2ехр(- ^5- р) + ехр(- ТщшР) . <0 2 sin — - sin со - arctg—---------------------- СО 2 Q —— + 1 - 2 COS — + COSCO 4 2 (1-523) Пользуясь тем же разложением экспо- ненциальных функций, нетрудно убедиться, что оптимальная передаточная функция ра- зомкнутой системы имеет полюс первого по- рядка в точке р = 0, т.е. она обладает астатиз- мом первого порядка. Это соответствует при- нятому нами оптимальному переходному про- цессу, который обладает свойством lim х(Г) = х0 = const, /-►со Из выражения (1.5.23) следует, что опти- мальная передаточная функция не принадле- жит к классу дробно-рациональных функций, вытекающим из (1.5.23) при замене — = ^rninP- Числитель выражения для подсчета |1К| представляет собой периодическую функ- цию со с периодом 4л, причем точки со = 4Ьс (к = 0, 1, 2, ...) являются корнями и ампли- тудно-частотная характеристика терпит разрыв в этих точках (рис. 1.5.4). При низких частотах справедлива асимптотическая формула iHWh-T’ (1.5.25) из которой следует, что оптимальная переда- точная функция соответствует интегрирующе- му звену, амплитудно-частотная характеристи- ка которого имеет наклон - 20 дБ/дек. Под этим наклоном оптимальная характеристика пересекает линию нулевых децибел (рис. 1.5.3).
ОЦЕНКА КАЧЕСТВА ПЕРЕХОДНОГО ПРОЦЕССА 75 Рас. 1.5.4. Распределение корней характеристического уравнения Фазовая характеристика в соответствии с асимптотической формулой (1.5.25) монотон- но убывает с ростом частоты, начиная от ли- нии -90°. 1.5.3. ОЦЕНКА КАЧЕСТВА ПЕРЕХОДНОГО ПРОЦЕССА ПО РАСПРЕДЕЛЕНИЮ КОРНЕЙ ХАРАКТЕРИСТИЧЕСКОГО УРАВНЕНИЯ Пусть Ч = nun|ReXv| расстояние до ближайшего корня характеристического урав- нения замкнутой системы от мнимой оси плоскости корней. Так как дробно- рациональная функция может быть представ- лена в виде суммы двух элементарных дробей М(р) f Су D(P)P “jb-by’ (1.5.26) то вещественной величине ч соответствует апериодическая составляющая переходного процесса Она и определяет время зату- хания всего процесса, так как все другие со- ставляющие затухают быстрее. Если исходить из соотношения е-”' = 0,05, то время затухания Т = --1110,05 = -. п п Оценка времени не изменится, если ближайшей к мнимой оси окажется пара ком- плексных сопряженных корней (см. рис. 1.5.4), так как гармоническая функция мажо- рируется экспонентой с показателем чА т.е. х(1) = е’л/(Лсо8рГ + 2?sinp/)» (1.5.27) Величину ч принято называть степенью устойчивости. В выражении (1.5.27) отношение ц = |т| /р| называют колебательностью. Эта величина характеризует при ч > 0 быстроту затухания амплитуды за один период 2л / р. Действительно, из (1.5.27) следует (4cosp/ + Rsinpr) _ 2л = ‘ ’ х(0, т.е. значения переходного процесса, разделен- ные промежутком времени 2я / р, отличаются 2лп постоянным множителем е . В разложении (1.5.26) неопределенные коэффициенты наиболее экономно находим следующим образом. Умножив обе части ра- венства на X - Ху и перейдя к пределу при X —> Xv, получаем = °-5-28) В частности, Со = М(0) / 2X0). Выражению (1.5.28) можно придать не- сколько измененную форму С — lim \ Л/(Х)____1_ Су-ton(X. - Лфу) ^*(^у)^у (L5.29) В случае кратных корней необходимо предварительное дифференцирование. Если при 01 + 02 + • + 0л = » + (Р-Хг)?"-’]а(Р), то оригинал можно найти с помощью общей формулы где
76 Глава 1.5. КАЧЕСТВО ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ Ф^(р) = rf'-1 ф'-1 Q(p) Из (1.5.28) следует, что если корни зна- менателя Xv мало отличаются от корней поли- нома Л/(Х) (нулей передаточной функции замкнутой системы), то и коэффициенты G будут малы, что приведет к уменьшению ам- плитуд отдельных составляющих переходного процесса. Выражения (1.5.29) и (1.5.30), а также методика оценки качества, как следует из со- держания настоящего параграфа, требуют зна- ния корней полиномов D(p) и М(р). Матема- тическое обеспечение современных ЭВМ, как правило, содержит стандартные программы вычисления корней полиномов. Приведем два простых алгоритма, позволяющих вычислить корни, не обращаясь к помощи "большой" ЭВМ. Для реализации алгоритмов достаточно программируемого калькулятора. Определение вещественного корня. Поли- ном нечетной степени с вещественными ко- эффициентами имеет по крайней мере один вещественный корень. Запишем разложение ДХ) = AXW) + (1 - + + о(Х - Х<*>), где - приближенное значение корня по- рядка к в итеративной процедуре. Полагая D(X(* + D) = О, находим х(*+1) = х(*) _ =х(*) _ Dk/Djc (1.5.31) Пример 1.5.4. Найдем корни полинома X3 + 6Х2 + ИХ + 6. Не прибегая к громоздкой формуле Кардано, запишем формулу для итераций ,«) ^X<*)[ll + xW(6 + xW)] 11 + Х(Л)(12 + ЗХ(А:)| Задавшись = 0, находим последовательно X(D = -0,545 454 54; Х<4> = -0,999 091 51; Х<2) = -0,848 953 21; Х<5> = -0,999 998 64; Х(3) = -0,974 674 12; Х<6) = -1,000 000 00. После к = 6 итерации повторяются, по- этому Xj = -1,000 000 00. Поскольку заранее неизвестно, вещественны ли два других корня, в данном случае можно просто решить квад- ратное уравнение, коэффициенты которого находятся из тождества (X + 1)(Х2 + />Х + q) г X3 + 6Х2 + ИХ + 6. Таким образом, Xj = -2, Х3 = -3. Фактически в этом примере реализован метод касательной Ньютона. Дальнейшее раз- витие этого метода позволяет найти также и комплексные корни. Определение комплексных корней. Разде- лим полином D(p) на трехчлен рР + 1р + т с неизвестными коэффициентами I и т. Обо- значив частное от деления через Pi(p), полу- чим тождество D(p) s (р2 + lp + mi)Di(p) + рР(1, т) + + С(/, т). (1.5.32) Коэффициенты I и т можно определить, решая систему Р(/, т) = 0; Q(Z, т) = 0. Для решения этой системы можно воспользоваться методом касательной плоскости, наклон кото- рой определяется производными Р и Q по аргументам I и т. Для определения производ- ных Хичкоком предложен метод без операции дифференцирования [1.4]. Разделим много- член, входящий в (1.5.32), снова на трехчлен рР + Ip + т. Получим тождество D\(p) = (рР+ Ip + m)Di(p) + pR(l, m) + + 5(Z, m). Продифференцируем no Z и m, и в ре- зультат дифференцирования подставим один из корней трехчлена jP + Ip + т, который обозначим через а/ (/ = 1, 2): a*R(l, т) + а/5(/, т) + azP/(Z, т) + + e/(Z,m) = 0; а, R(l, т) + S(l, m)+aiPb (I, m) + + CmG,w) = 0, или, так как = -fct/ - m, a/[P/(Z, m) + 5(Z,m)] - ZP(Z,m) + + [C/(Z, m) - mP(Z,m)] = 0; (1.5.33) а,[Р;,(/,т) + Я(/,т)] + + [e^(/,m) + 5(/,m)] = 0.
ОЦЕНКА КАЧЕСТВА ПЕРЕХОДНОГО ПРОЦЕССА 77 Если корни eq и а2 не равны, то из (1.5.33) следует, что равна нулю каждая из скобок. Производные вычисляются в виде линейных комбинаций остатков от деления на трехчлен р2 + 1р 4- т: Pl(l,m) = lR(l,m)~S(l,m)-, = -Я(/,т); (1.5.34) В соответствии с методом Ньютона, ко- торый был использован в примере 1.5.4, запи- сываем условие Р^,т^)^ +Р^,т^)лт^ = где дХ*) = Цк + 1) . X*); д„(*) = „(* + !).„(*). Формулы для программирования полу- чаются в виде »(*+!) _ К*) Qpm - PQ'm . P/Q'm-P^Qi' (1.5.35) m(*+l)=OT(*)+^Z^_. PiQ'm-PkQl Пример 1.5.5. Требуется провести оценку колебательности и степени затухания переход- ного процесса в электрогцдравлическом при- воде со структурной схемой, изображенной на рис. 1.5.5 с передаточными функциями, выра- жаемыми формулами: к W3(p) = k„p, = 1 + Г2р Рве. 1.5.5. Струпуряая схема элекгрогцаравлаческого сапового правода Гидропривод И^(р) представляет собой пару "насос-мотор”; производительность насо- са управляется электрическим двигателем 1К2(р) через редуктор W$(p) . Цепочка уси- литель - двигатель ^(Р) охвачена гибкой обратной связью, состоящей из тахоге- нератора (р) и корректирующего звена w4(p). Значения параметров следующие: кус крр — 5 рад / В-с; кщ — 1520 с"^; 71 = 0,006 с; крг = 15 В-с / рад; Т2 = 0,38 с; т = 0,05 с; ^>=1:2; Т= 0,08 с. Приступим к оценке параметров пере- ходного процесса, для чего запишем выраже- ние передаточной функции системы с разомк- нутой главной обратной связью кускднкркт (1 + /’2[(1 + Ч’Х1 + Г2/>) + ’ + *ус*4т*да(1 + М](1 + V) Характеристическое уравнение замкнутой системы имеет вид ТТ2тХ5 + [(Т + Т2)т + ТТ2 + + кускггкдЛ7\х]'к4 + [Т+ Т2 + куСк^лкггТ\+ 4" т(1 4- kyckfinkfr) ] X3 4" (1 4" Хус^дтт^гг) ] X2 4" 4" кускррк^кт Т^К 4" кус.кррк^кгп = 0. В результате подсчета коэффициентов уравнения и после деления на коэффициент при старшей степени находим Л(М = X5 4- 49,925Х4 4- 3118,5Х3 4- 4- 50 000Х2 4- 950 000Х + 2 500 000 = 0. Поскольку уравнение нечетной степени, оно должно иметь по крайней мере один ве- щественный корень. Согласно алгоритму (1.5.31) итерационная формула имеет вид
78 Глава 1.5. КАЧЕСТВО ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ Xv + 1 = Xv - D(Xv) / D(Xv). Для чтобы алгоритм быстрее сходился к искомому корню, рекомендуется вначале грубо установить границы отрезка, внутри которого он находится. Вывод значений полинома D(X) на печать дает результаты D (-3) = 19 601,4; Р (-4) = -687 827,2, причем внутри отрезка (-3, -4) производная Р(Х) сохраняет знак. Это гарантирует сходимость алгоритма, и в резуль- тате весьма небольшого числа итераций полу- чаем Xi = -3,026 904 4. Округление пока про- изводить нецелесообразно, так как это может привести к большим погрешностям при опре- делении оставшихся четырех корней. После элементарной операции деления D(X) на X - -X] по формулам by — а* + X] by _ 1 (До = 1, ао = 1) находим коэффициенты полинома четвертого порядка X4 + 46,898X3 + 2976,5X2 + 40 990Х + + 825 926 = 0. В результате засылки коэффициентов этого полинома в процедуру (1.5.34) - (1.5.35) нахо- дим оставшиеся корни Х2>3 = -6,501 177 643 ±>18,480 369 84; Х4,5 = -16,947 870 36 ± >43,183 328 34. Как видим, скорость затухания переход- ного процесса определяется степенью устойчи- вости г| =3,03 с'1 и через 1 с процесс войдет в пятипроцентный допуск от установившегося значения. Колебательность р. в данном случае определяется парой корней Х2>з- Отношение амплитуд затухающей гармоники определяется значением Более высокочастотная составляющая почти не сказывается на форме переходного процесса, так как через 0,18 с она полностью затухнет. В этом примере заслуживают внимания сравнительно большие значения частот колеба- тельных составляющих. Первая из них - 18,5 с'1 определяется частотой среза. Вторая - 43,2 с*1 связана с высоким коэффициентом усиления во внутреннем контуре, который равен = 75. Сам управляющий дви- гатель, имеющий постоянную времени Т = = 0,08 с, ослабляет поступающий на его вход сигнал, начиная с частоты 12,5 с*1, что сущест- венно ниже 43,2 с*1. Примененные здесь сред- ства коррекции обусловлены вторым порядком астатизма при сравнительно высокой доброт- ности, равной 50 с'2. 1.5.4. ИНТЕГРАЛЬНЫЕ ОЦЕНКИ КАЧЕСТВА Метод оценки переходных процессов с помощью несобственных интегралов вида /2=]х2(/)а (1.5.зб) о привлек внимание исследователей тем, что он позволяет получить аналитическое выражение, связывающее величину /2 с параметрами сис- темы автоматического управления. При этом качество системы характеризуется одним чис- лом. Следует иметь в виду, что это число /2 характеризует форму переходного процесса лишь косвенно. Например, графики функций х(/) (рис. 1.5.6, о и б) имеют одну и ту же оценку вида (1.5.36). Обе функции описыва- ются уравнением Рве. 1.5.6. Переходов процессы с одоошмыми квадратичными ингегралышии оценками
ИНТЕГРАЛЬНЫЕ ОЦЕНКИ КАЧЕСТВА 79 Нетрудно вычислить интегральную оцен- ку / \ г 11 1 а /2 = -I —+ —-------------- . 4 la a2+p2J На рис. 1.5.6, а а =-1,0 с*1; р = 5,4575 с-1. Кривая, изображенная на рис. 1.5.6, б характе- ризуется параметрами а =-1,5 с1, р = 0,856 23 с1. В обоих случаях = 0»258 12 с. Если для оценки качества автоматической системы важ- на форма переходного процесса, то интеграль- ная оценка не подходит для этой цели. В свя- зи с этим методика использования интеграль- ных оценок предполагает отыскание условий минимума их в пространстве параметров. С физической точки зрения положительным качеством квадратичных интегральных оценок /2 является то, что они характеризуют систему с энергетической точки зрения. Это может ока- заться решающим фактором при проектирова- нии автоматических систем в некоторых слу- чаях. Для вычисления интегральных оценок вида (1.5.36) можно воспользоваться извест- ным соотношением ОО оо Jx2(t)dt = J О -СО вытекающим из интеграла свертки. В результа- те подстановки изображения X(j(a) под инте- гралом оказывается дробно-рациональная функция и для получения конечного результа- та следует воспользоваться теоремой о вычетах [8]. При этом, к сожалению, получаются до- вольно громоздкие выражения. Пример 1.5.6. Найти общую формулу для квадратичной оценки качества системы с пере- даточной функцией в разомкнутом состоянии к. W(p) = ~П~2-------------V р(Т2р2 + 2?7> + 1) Запишем формулу для передаточной функции по отношению к ошибке (1.2.5). В данном случае pil + X,Tp + T2p2) „ „2 2 • p(l + %7> + TV Таким образом, для получения искомого выражения необходимо вычислить интеграл “ , . > Т4р4 +{1Т2 -*2Т2\р2 +1 [е2(/)Л = -^ f j—-------------—*-----vi-----------------------Лр. (1.5.37) 0 (Г P + WP + P + * - T P + 2ЗД2 - p + fc В монографиях [15, 23] приводятся гото- вые выражения для интегралов вида (1.5.37) Z-J-f &»(*> п 2я/ J ЫХ1Ы-Х) ’ — СО hn(x) = OQX« + atx* ’1 + ... + ап; = box2” -2 + М2" -1 + ... + bn. В нашем случае при п = 3 находим 7 т(1-Ч2)-2§/* С повышением порядка п сложность по- добных выражений быстро возрастает и поль- зоваться ими для поиска экстремальных зна- чений параметров становится неудобно: теря- ется главное преимущество - возможность аналитического исследования. В таких случаях следует воспользоваться одной из численных процедур поиска экстремума интегральной оценки в пространстве параметров, например, методом симплекс - поиска. Предельное значение квадратичной оценки равно нулю, что эквивалентно при- ближению переходного процесса к скачкооб- разной функции. Это может оказаться непри- емлемым как по причине физической неосу- ществимости, так и ввиду нежелательности резких изменений координаты x(f). От этого недостатка свободна так называемая улучшен- ная квадратичная оценка вида /2 = J (х2 + T2x2^dt, (1.5.38) О где константа Т выбирается из соображений плавности изменения функции x(f). Нетрудно показать, что при /2 = m^n процесс x(t) ста- нет тождественным экспоненте с постоянной времени Т. Действительно,
80 Глава 1.5. КАЧЕСТВО ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ 1г = J (х + Тх)2 Л - J 2Txxdt = о о = |(х + 7Х)2Л + 75с2(О). О Наименьшее значение /2 наступает при х + Тх = 0, т.е. при х(/) = x^-f / т. Дальней- шим развитием оценки вида (1.5.38) служат линейные комбинации производных одной координаты Z = j(x2 + а2х2 + b2x2 ^dt о либо интегралы от квадратичной формы коор- динат многомерной системы Z = J рх? + а2х2+...+а2х2)<Й. о В частном случае монотонного переход- ного процесса может быть использована ли- нейная интегральная оценка 00 Л=/х(0Л. о 1.5.5. ОБЩИЕ РЕКОМЕНДАЦИИ ПО ПРОЕКТИРОВАНИЮ МНОГОМЕРНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ В перечень наиболее типичных показате- лей качества следует включить: 1) устойчивость, 2) малую чувствительность к погрешно- стям оценки параметров математической мо- дели, 3) малую чувствительность (инвариант- ность) по отношению к внешним возмущени- ям, 4) устойчивость по отношению к частич- ному нарушению местных обратных связей, 5) взаимную независимость каналов управления либо их малую взаимосвязь, 6) быстродействие. Анализ устойчивости многомерных сис- тем автоматического управления на ранних стадиях проектирования можно осуществить с помощью обобщенного критерия Найквиста с последующим уточнением модели при про- верке ее робастности. Если предположить, например, наличие аддитивной помехи в виде добавки AG(p) к основной передаточной мат- рице G(p), то для обеспечения робастной ус- тойчивости достаточно потребовать, чтобы максимальное значение главной амплитудно- частотной характеристики (I + G(/co))-1 было невелико, также невелики должны быть вариа- ции главной фазово-частотной характеристики этой матрицы. По аналогии с выражением (1.3.6) матрица Фе(/<о) = (I + G(/<o))-1 есть передаточная матрица многомерной системы по отношению к ошибке. Она играет заметную роль при проектировании, поэтому для ее оценки целесообразно ввести критерий. В качестве такого критерия часто рассматривает- ся спектральная норма ЦфеО»)||2 = тах^ф’Фе. где X/ - собственное значение матрицы Фе. Удовлетворение требований к инвари- антности по отношению к отклонению пара- метров реальной системы от параметров мате- матической модели зависит от робастности системы. Если предположить, что передаточ- ная матрица G(p) в действительности отлича- ется от идеальной на величину AG(p), то ва- риация AR(p) передаточной матрицы R(p) замкнутой системы подчиняется неравенству |arU<»)RO)-4|2 (agojg-'o)^ которое накладывает ограничение на спек- тральную норму |ф^о«>)|2 в требуемом диапазоне частот [0, од]. Инвариантность по отношению к внеш- ним возмущениям также связана с малой ве- личиной спектральной нормы (рис. 1.5.7), так как при этом уменьшается вклад возмущаю- щего воздействия в выходной сигнал, который можно записать на основании принципа су- перпозиции в виде Частичное нарушение обратной связи в одном из контуров можно рассматривать как мультипликативное возмущение, тогда можно провести анализ робастной устойчивости. При этом главные амплитудно-частотная и фазоча- стотная характеристики определяются из усло- вия, что элементы матрицы AG(p) при нару- шении связи в контуре с номером ц опреде- ляются в соответствии с символикой Кронеке- ра, т.е. [1 при /,у=ц; вц = S _ у |0 при i * J.
УПРАВЛЯЕМОСТЬ, НАБЛЮДАЕМОСТЬ И ИДЕНТИФИЦИРУЕМОСТЬ 81 Y(p) Рис. 1.5.7. Влияние внешнего возмущения на вектор выходных координат многомерной системы Ограничения на спектральную норму ||Ф8|| благоприятно сказываются и на малом взаимном влиянии каналов управления. Дей- ствительно, при этом передаточная матрица ||Фе|| сравнима с ||G(/o)|| и передаточная функция замкнутой системы определяется характеристикой регулятора fe(/co) ~ Im. УПРАВЛЯЕМОСТЬ, НАБЛЮДАЕМОСТЬ И ИДЕНТИФИЦИРУЕМОСТЬ ЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ При исследовании систем автоматиче- ского управления существенную роль играют фундаментальные понятия управляемости и наблюдаемости. Управляемость системы. Пусть некоторая динамическая система описывается уравнени- ем ^ = Ах + В«, (1.5.39) at ще х — (Xj, ..., хп) - вектор состояния; и = = (ui, ..., i/m) - вектор управлений; А - квад- ратная матрица размером п х л; В - матрица из п строк и т столбцов. Система называется полностью управляемой, если существует вектор управлений и = u(f), переводящий ее из произ- вольного начального состояния Хо в состояние, определяемое вектором х = (0, 0...0), за ко- нечное время. Теорема Калмана об управляемости. Сис- тема полностью управляема, если ранг матри- цы .... (В:АВ:А2В:...: А«-1В) равен порядку системы п. Пример 1.5.7. Система описывается урав- нением *1 *2 0 1 хг - 1 °J [*2 о 1 вектор. Запишем произведение матриц Блочная матрица из теоремы Калмана 0 1 1 0 [В ! АВ] = имеет ранг 2 и, следовательно, система полно- стью управляема. В этом примере можно найти управление м(1) в явном виде. Обозначим х = xj и запи- шем эквивалентное уравнение системы в ска- лярной форме d2x решение которого при и = const имеет вид х(1)= С^+ С^ + и. Пусть начальное состояние системы ха- рактеризуется значениями х(0) = Xq и х(0) = 0. Тогда после несложных преобразований полу- чаем Х(1) = (Х{) - и) cos t + и. Нетрудно убедиться, что управление [хл / 2, 0 £ f < я; и = < [0 , я £ t < оо переводит систему в состояние xj = х = 0; Xj = х = 0 в течение промежутка времени t = = п. Наблюдаемость системы. Система, опи- сываемая уравнением (1.5.39), называется пол- ностью наблюдаемой, если на основании из- мерения величин У " Сх, (1.5.40) где С - некоторая матрица, можно определить вектор начального состояния системы Хо- Теорема Калмана о наблюдаемости. Сис- тема, описываемая уравнением (1.5.39), при измерениях компонент вектора состояния согласно (1.5.40) полностью наблюдаема, если ранг матрицы (C'iAT<X...‘:(AT)«-1C>') равен порядку системы п. Пример 1.5.8. Пусть, как и в предыдущем примере, система описывается уравнением В данном случае управление и представ- ляет собой скалярную величину, которую можно рассматривать как однокомпонентный *1 *2 0 1]Г*1 .° °1 1*2 0 1 и
82 Глава 1.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ причем измеряется координата у = Хр Мат- рица С состоит из двух элементов. Очевидно, С = [1 0], о о 1 о 1 о 1 о Ст АТСТ ’о" 1 Следовательно, матрица из теоремы Калмана ’1 !о 0| 1 имеет ранг 2 и система полностью наблюдае- ма. Заметим, что если бы матрица С имела вид С = [0 1], т.е. измерялась бы производная jq = *2, то система не была бы полностью наблюдаемой, так как по значению производ- ной невозможно определить значение перво- образной Xj. Идентафицируемость. При разработке сложных систем управления на различных стадиях используют разнообразные методы, среди которых можно отметить аналитические расчеты и исследования, моделирование и, наконец, натурный эксперимент. Часто возни- кает задача: по данным натурного эксперимен- та сделать вывод о функционировании систе- мы в соответствии с ее математической моде- лью, т.е. идентифицировать модель с реально существующей системой. В наиболее широкой постановке проблемы идентификации предпо- лагается наличие случайных факторов, при которых точные измерения невозможны. В самой простой постановке идентификацией линейных систем называется определение эле- ментов матрицы А в уравнении (1.5.39) по данным измерений компонент вектора состоя- ния х. Практически даже такая простая поста- новка задачи предполагает использование вы- числительной техники, работающей с дискрет- ными величинами. Поэтому вместо диффе- ренциального уравнения (1.5.39) следует вос- пользоваться эквивалентным рекуррентным соотношением xffc + 1] = Ax[fc], к = 0, 1, ..., п - 1. (1.5.41) Здесь без отраничения общности положено и = 0. Каждое уравнение вида (1.5.41) для фиксированного к равносильно п скалярным равенствам. Таким образом, для определения п2 элементов матрицы А мы имеем столько же уравнений. Записывая систему (1.5.41) в виде равенства строк с векторными компонентами МО. х(2),х(л)| = = А[х(0), Ах(0),А" • Ъг(О)], нетрудно убедиться в том, что для идентифи- цируемости достаточно, чтобы матрица [х(0), Ах(0), ..., Ал - !х(0)] была невырожденной. Глава 1.6 ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ 1.6.1. КЛАССИФИКАЦИЯ ДИСКРЕТНЫХ СИСТЕМ Понятие дискретной системы управления содержит в себе понятие дискретного сигнала. Условимся считать сигнал дискретным, если он определяется последовательностью значе- ний х(//), заданных в дискретные моменты времени tj, i = 1, 2, ..., tj € [0, оо). Возникно- вение дискретных сигналов в автоматических системах может вызываться различными при- чинами. Первая - это специальная диск- ретизация непрерывного сигнала, осуществ- ляемая с помощью его импульсной модуляции. Ее цель, например, - передать одновременно несколько сигналов по одному каналу или повысить помехозащищенность сигнала, пере- даваемого на большие расстояния. Импульсная модуляция может быть необходима ввиду осо- бенностей устройства объекта управления. Например, в случае управления приводом постоянного тока с широтно-импульсной мо- дуляцией управляющего сигнала. Вторая причина дискретизации, связана со способом измерения сигналов в системе управления. Например, при использовании цифровых датчиков угла поворота или декре- ментных цифровых датчиков скорости сигнал измеряется в дискретные моменты времени. В более сложных случаях, связанных с анализом обстановки с помощью системы технического зрения, информация для управления может быть выработана тоже только в дискретные моменты времени. Третья причина, являющаяся основной в большинстве современных систем управления, - это использование вычислительной, обычно микропроцессорной техники. Использование ЭВМ в контуре управления предполагает пре- образование обрабатываемых сигналов в дис- кретную форму и выполнение необходимых действий с полученными последовательностя- ми чисел. Дискретизация сигнала в цифровых системах есть аналого-цифровое преобразование, т.е. преобразование непрерывного сигнала в
КЛАССИФИКАЦИЯ ДИСКРЕТНЫХ СИСТЕМ 83 последовательность значений, представленных в цифровом коде. Любая система, в замкнутом контуре управления которой используются дискретные сигналы, называется дискретной системой управления. Классификация дискретных систем управления определяется принятым в ней спо- собом дискретного преобразования сигнала. А именно, системы с импульсной модуляцией называются импульсными, а системы с аналого- цифровым преобразованием сигнала - цифро- выми. В свою очередь, импульсные системы классифицируют по способу импульсной мо- дуляции сигнала. Если в процессе модуляции сигнал заменяется последовательностью им- пульсов, амплитуда которых пропорциональна значениям сигнала х(/л), измеренным в рав- ноотстоящие моменты времени tn = пТ, Т = = const, п = 0, 1, ... , то речь идет об ампли- тудно-импульсной модуляции. В этом случае (рис. 1.6.1, а) результат модуляции может быть записан как п y(f) = ^kux(tm)s(t- tm), т=0 ',б1) t е[лТ, (л + 1)Т], п = 0,1,..., где Х0 - функция, описывающая форму им- пульса модулирующей последовательности, А,, = const. При широтно-импульсной модуляции изменяется ширина импульса, а его форма, амплитуда и моменты возникновения остаются неизменными (рис. 1.6.1, б). В этом случае y(t) = m=Q (1.6.2) в частности, для прямоугольных импульсов, показанных на рис. 1.6.1, 4*(бя)> " 6я1 ~ ” 6») ~ * 1R " " т(*(6я))]> где (х)\к1Х ПРИ И^тах; ^7*тах ПРИ И > *тах - модуляционная характеристика преобразова- ния. На рис. 1.6.1, в показана фазо-импульсная модуляция сигнала, смысл которой ясен из ри- сунка и формулы 1.6.1. Способы импульсной модуляции: а - амплитудно-импульсная; б - широтно-импульная: в - фазо-импульсная п У(0 = £М®П*('тЦ'-₽(*('т>)). /я=0 t е[лТ, (п -4-1)7’], л = 0,1,..., (1.6.3) о/ ч _ ПРИ И -^тах» |^рхтах ПРИ И > *тах- Фазо-импульсная модуляция является частным случаем время-импульсной модуляции, к которой относится также частотно-импульс- ная модуляция, когда частота импульсов зави- сит от значений модулируемого сигнала. Пе- речисленные виды модуляции сигнала относят к модуляции первого рода. При модуляции вто- рого рода модулируемый параметр импульсов (амплитуда, ширина и др.) изменяется в тече- ние времени существования импульса [23]. В зависимости от того, какой способ мо- дуляции используется, говорят об импульсных системах с амплитудно-импульсной, широтно-
84 Глава 1.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ импульсной или временной импульсной моду- ляцией. Из перечисленных видов модуляции только амплитудно-импульсная определяет линейный способ преобразования непрерыв- ного сигнала в дискретный (1.6.1). Остальные способы нелинейны, что следует из формул (1.6.2), (1.6.3). В соответствии с этим к линей- ным импульсным системам можно отнести сис- темы только с амплитудно-импульсной моду- ляцией и линейной непрерывной частью. Другие виды импульсных систем нелинейны. В цифровых системах значения сигнала, измеренные в равноотстоящие моменты вре- мени tn = пТ, представляются в цифровой форме. Если числа ат, имеющие т разрядов, представляются в системе счисления с основа- нием г цифровыми символами v*, то т ат = к=0 При этом должен быть определен закон, по которому значениям непрерывного сигнала х(/л) присваивается одно из дискретных зна- чений ат. Эту процедуру называют квантова- нием сигнала по уровню в отличие от квантова- ния сигнала по времени при импульсной моду- ляции. Например, этот закон может быть представлен преобразованием, показанным на рис. 1.6.2. По оси абсцисс отложены значения х, а по оси ординат - число а. В данном слу- ( ( Ск чае х = ат, если I т — о <. х < I т +— 1о , т I 2j \2J причем ”шаг квантования” b определяется чис- лом разрядов. Таким образом, аналого-цифровое пре- образование нелинейно. Однако при достаточ- но большом числе разрядов эффектом кванто- вания по уровню можно пренебречь, т.е. при- ближено считать это преобразование линей- ным. В этом случае цифровую систему можно рассматривать как импульсную с амплитудно- импульсной модуляцией. 1.6.2. Интерпретация процедуры квантования сигнала по уровню 1.6.2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДИСКРЕТНЫХ СИСТЕМ С ОДНИМ ИМПУЛЬСНЫМ ЭЛЕМЕНТОМ Простейшая дискретная система автома- тического регулирования с амплитудно- импульсной модуляцией сигнала ошибки по- казана на рис. 1.6.3. Импульсный элемент, осуществляющий эту модуляцию, описывается формулой (1.6.1). Переходя в ней к относи- тельному масштабу времени 1 = t / Т и вводя решетчатую функцию е[/и7] = e(/m) = е[/и7]> т = 0, 1, ... получим УТ (') = У *и eTtm]sT (i-m), t е[л, п + 1], п = 0,1,..., где индекс Т соответствует записи соответст- вующих функций в относительном масштабе времени, т.е. Ут(<) = y(iT) и т.д. Пусть непрерывная часть системы опи- сывается дифференциальным уравнением с постоянными коэффициентами. Тогда ее вы- ход г i ХТ (О = £ С^т (0 + ТJ kTn(' ” /=1 0 (1.6.5) где - весовая функция системы, а пер- вое слагаемое в правой части зависит от на- чальных условий. Из (1.6.4) и (1.6.5) следует: г п хт (о=Z С/А (0+У *(' '"W М; /=1 т-0 (1.6.6) функцию t - v)sT(x)(K 0 (1.6.7) называют весовой функцией приведенной непре- рывной части. Смысл этого понятия поясняет- 1.6.3. Дискретная система автоматического регулирования
МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДИСКРЕТНЫХ СИСТЕМ 85 Приведенная непрерывная часть 1.6.4. Условная схема разомкнутой мпульсной састемы ся на рис. 1.6.4. Приведенная непрерывная часть включает в себя помимо непрерывной части эквивалентный непрерывный элемент с весовой функцией (формирующий элемент). Выделение такого элемента позволя- ет единообразно представить импульсные сис- темы с любой формой импульса. Входом фор- мирующего элемента служит последователь- ность 8-импульсов: п yi(o = Х8 * * *(' от)етН <1б-8> т=0 Условный элемент системы, выполняю- щий преобразование (1.6.8), называют идеаль- ным импульсным элементом и обозначают зна- ком 1. Таким образом, любая линейная дис- кретная система с амплитудно-импульсной модуляцией может быть представлена в виде совокупности идеальных импульсных элемен- тов и непрерывных приведенных частей. При нулевых начальных условиях равен- ство (1.6.6) представляет собой отношение "вход-выход" вида хг(‘)= (L6-9) т=0 Это уравнение разомкнутой дискретной системы, которое удобнее записывать, исполь- зуя понятие решетчатой функции как для вхо- да, так и для выхода системы. Вводя смещен- ные решетчатые функции ММ = хт(0;=я+е, %с] = *('Хл+6’ ще е - переменная, принимающая значения на отрезке [0, 1), будем иметь п ММ" Е*1Л -m,8]e7’[m]. (1.6.10) т=0 В частности, при 8 = 0 получится соот- ношение, связывающее вход и выход разомк- нутой системы только в дискретные моменты времени: п Мл1 = ХФ -mje/’pn]. (1.6.11) т=0 С учетом равенства ег(7) = «г(/) - xT(t) уравнение замкнутой дискретной системы при- обретает вид п k\n - /и, е]^ [m] + ер [л, е] = gp [л>8] • /я=0 (1.6.12) Обратим внимание на то, что это урав- нение записано при нулевых начальных усло- виях. Если начальные условия отличны от нуля, то помимо весовой функции должны быть также заранее определены сла- гаемые (обще* решение одно- i родного дифференциального уравнения не- прерывной части), т.е. собственное движение системы. Тогда вместо (1.6.12) получим ^С/Лт[л,8] + /=1 л + - т,е]ет’[т] + е^р^е] = /я=0 = 87’[л»8]- (L6.13) Для решения уравнений замкнутой дис- кретной системы, т.е. определения зависимо- сти сигнала ej{n, 8] или xj{n, 8] от входа grfn, е] в явной форме, можно воспользовать- ся ^преобразованием, или дискретным преоб- разованием Лапласа. Если решетчатая функция х[л] удовле- творяет условию |х[л]| е-по <оо, ст > О, л=0 то для нее определено ^преобразование: Z{*H} = " = (1-6.14) л=0 Изображение X (z) является при этом аналитической функцией в области абсолют- ной сходимости написанного степенного ряда, т.е. в области
86 Глава 1.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ к|>е-°. В табл. 1.6.1 приведены изображения ха- рактерных решетчатых функций, встречаю- щихся при исследовании дискретных систем. Свойства Z-преобразования приведены в [5]. Упоминавшиеся дискретное преобразо- вание Лапласа (D- преобразование) отличается от Z-преобразования только переменной: z>{*W}“S*We ,"ж-¥Ь(9)- (1-6.15) л=0 Таким образом, X*(z)| ,=Хо(9). •Z=e* Одно из свойств Z- преобразования за- ключается в том, что Z-преобразование сверт- ки решетчатых функций является произведе- нием Z-преобразований этих функций, т.е. п /л=0 = X*(z)K*(z). (1.6.16) В частности, применяя Z-преобразование. к обеим частям (1.6.10), получим X*fcs) = Fr*(z,s)£*(z), (1.6.17) гае X’(z,e) = z{x7-[n,€]}; E\z) = z{er[n]}, a W (z,s) = Z|i[n,s]| - передаточная функ- ция разомкнутой дискретной системы. Подвергая Z- преобразованию обе части уравнения (1.6.12), получим E*(z) + E*(Z,c) = G'(z,s), G*(z,f>) = Z{gr[«,s]}. (1.6.18) В частности, при e = 0 (г) = ^«(z)G’(z). (1.6.19) где Фе(г) = [1 + lK*(z)j - передаточная функция системы по ошибке. Подставляя это выражение в (1.6.17), по- лучим А'*(?,е) = Ф*(г,£)(?’(?), (1.6.20) гае Ф*(г,£)=Иг(г>е)[1 + И'’(г)]’ - пере- даточная функция замкнутой дискретной сис- темы. Переходя к оригиналам, можно получить искомое отношение "вход-выход" во времен- ной области. Формула обращения Z- преоб- разования имеет вид x[«l = -lTfx,(z)z"-1rfZ, (1.6.21) 1 1 2л/ J где С - любой замкнутый контур в области |z| > е”° , обходимый один раз в положитель- ном направлении. Применяя свойство (1.6.16), получим из (1.6.19) «/[«] = «три], (1.6.22) /я=0 гае *е[л] = Z'’^e(z)}. Аналогично из (1.6.20) будем иметь п = ХМЛ" т’£1 «тМ. (1.6.23) т=0 где &ф[л,е] = Z 1|ф*(с,с)| - весовая функ- ция замкнутой дискретной системы. Соответст- венно ке[п] - весовая функция той же системы по ошибке. Итак, если известно описание непрерыв- ной части системы в форме (1.6.5), то с по- мощью написанных формул можно найти и описание дискретной системы (1.6.23) типа "вход-выход". Для практического вычисления весовых функций £е[л], кф[п, е] используется метод вычетов, в соответствии с которым I ^'{/’(z)} = £ Restate”-1 1 ’ V=1 Z=ZV (1.6.24) где Zv - полюса функции F*(z)> а вычеты оп- ределяются по известной формуле ResF*(z)z" 1 = Um . 1 . * х z->zv(rv -1)! 4ft'v-l x[(z-Zv)'’vf’(z)z"-1], (16.25) где rv - кратность полюса Zv-
1.6.1. Таблица ^-преобразования F\z) = Дл, e] F(g) = £{/(«)} F Xz, S) - si) -Dz {£(?)} Цл] Z 1|л, e] £ z z-i Я z-l е0^ Z ea(n+e) 1 Zfi™ z-ta Я~<* Z-ea sin юл Z sin co sin со(л + e) co Z 2 sin me +zsinio(l-8) Z - 2z cosco +1 q2 + co2 J z -2Z COSCO +1 COSCO л Z2 - Z COSCO cos co (л + e) Я Z2 CQSC08 - z cos co (1 - e) Z2 - 2z COSCO +1 q2 + co2 z2 -2ZCOSC0 +1 л Z Л + 6 1 Z I g (г - О2 я2 (z-1)2 z-i л2 z(z +1) (z -1)3 (Л + 8)2 2! я3 z(z +1) 2Z8 zc (z-i)3 (Z-1)2 пк zRtiz) (< - 1)*И ( Л + 8 )* k\ qk^\ zJ<(z)e*-v iiW (z -i)v+1 сЬал Z2 -Z cha ch a( л + e) Я Z2chae - z cha(l - e) Z2 - 2z cha +1 q2 - a2 Z2 - 2z cha +1 show zsha sh a( л + e) a Z2shas - z sha(l - e) Z2 - 2z cha +1 q2 - cl2 Z2 - 2z cha +1 МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДИСКРЕТНЫХ СИСТЕМ
88 Глава 1.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Продолжение табл. 1.6.1
МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДИСКРЕТНЫХ СИСТЕМ 89 Во многих случаях непрерывная часть системы задается не весовой функцией а передаточной ^h(s), т.е. вместо (1.6.5) урав- нение непрерывной части записывается (при нулевых начальных условиях) как Х(5) = Y(s)WH(s). При переходе к относительному времени t = //Т для функций полу- чатся изображения по Лапласу Jrr(9) = £{xr(/)| = ^X(J ’ ’ 1 L=«/r Следовательно, ХТ (?) = YT (Я) «"и (?), ШеЙ>н(9) = 1Гн(9/Т). Из (1.6.4) следует, что Ут(я) - ierMnr^)z-m = m=0 где Иф(д) = ~ передаточная функция эквивалентного'формирующего устрой- ства. Следовательно, XT(q) = E*(z)W(q), (1.6.26) где W(q) = Wa>(q)WH(q) - передаточная функция приведенной непрерывной части. Равен- ство (1.6.26) соответствует (1.6.10), причем W(q) - z{fc(7)|. В форме ^преобразования оно приобретает вид (1.6.17). Связь между W(q) и FF*(z, е) определяется как Dz -пре- образование jr*(Z,s)= Dz{W(q)}. (1.6.27) Справедливы следующие формулы, опреде- ляющие прямое и обратное Dz -преобразова- ния: 00 {»"(?)} = £и,(? + 2л/г)е<«+2’5'г,Е g=lnz (1.6.28) 1 jir*(z,e)z~e<fe. о (1.6.29) Для вычисления Dz -преобразования применяют метод вычетов, в соответствии с которым [10] w\z,z) = v=l Z - , (1.6.30) 9=9» где q» - полюсы изображения W*(q). Dz -изображения для передаточных функций типовых звеньев приведены в табл. 1.6.1. Основные свойства Dz -преобразования даны в [16]. Таким образом, если непрерывная часть системы задана своей передаточной функцией, то описание системы в изображениях (1.6.17), (1.6.20) может быть найдено без перехода во временную область с помощью Dz -преобра- зования. Пример 1.6.1. Найти математическую мо- дель "вход-выход" дискретной системы с ам- плитудно-импульсной модуляцией сигнала ошибки последовательностью прямоугольных импульсов (рис. 1.6.1, а) шириной уТ (у < 1). Передаточная функция непрерывной части А? Передаточную функцию формирующего элемента определим как »г(?)=ь{*т(')}=М’СО "т)}= l-e'7’ и 9 . Передаточная функция приведенной не- прерывной части 1 - ₽ = Т/ТН; * = М*н- Определим передаточную функцию дис- кретной системы с помощью Dz -преобразо- вания: ♦ — к — ( w <Z^ = Dz * Л-DJ-g-------Л [?(₽ + ?)] ]?(₽ + ?)
90 Глава 1.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Здесь А к =k_Q fl 1 1 = «(₽ + «)] ₽ ₽+«j _ к Г z _ ze~pe p|_z-i z-e-P Для преобразования второго слагаемого в выражении FF*(z, е) используется равенство [16] _ P{e-1W)} = F (^,е “ т) при у < 1; е~qF (q, 1 + е - у) при 0 е < у. Используя это свойство D -преобразо- вания, получим окончательно = kuk^-^zle^ -1) ---------тт------ при у е < 1; Z-е р = *и*н[г(1-ере) + е-Р(е«1'-е) - 1)] z -е'₽ при 0 е < у. В частности, если ширина импульсов достаточно мала по сравнению с периодом повторения, т.е. у -► 0, приближенно получим р + ? ^и^нРт ZC . Z-e’p 0 е < L Если же у = 1, то Wz*(z, е) определяется по второй формуле: JK’(z,e) = Мн 1-е-Р* Z-1 Z-e’₽ В последнем случае формирующий эле- мент называют экстраполятором нулевого по- рядка; его передаточная функция 1 -е‘^ И'ф(9) = *и-!-^-, следовательно справедлива формула: w'(z,t) = Z>z (1 - = - Z-1H L И'нв)! z ч и я Г Отметим, что наряду с рассмотренным точным методом определения передаточных функций дискретных систем используются приближенные методы. Они основаны на при- менении формул численного дифференцирова- ния. Так, если положил» Ps~r\ x(f) — dt 4" Л = /'[лТ]« ± {/[(л + 1)т] - /[лт]}, то *’(z) = y{(z-i)F’(z)-z40]} и при /[0] = 0 дифференцирование по методу Эйлера первого порядка соответствует замене Z - 1 . оператора р на . Аналогично, при ис- пользовании неявного метода Эйлера первого Z-1 порядка р заменяется на —— , а для метода z(z - 1) Эйлера второго порядка - на —(----г. Вы- Щ +1) полняя такую замену непосредственно в выра- жении передаточной функции непрерывной системы, мы получим ее дискретный аналог FK*(z). Такая дискретная передаточная функ- ция соответствует разностному уравнению, приближенно описывающему непрерывную часть системы. Передаточная функция замкнутой дис- кретной системы может быть найдена в соот- ветствии с (1.6.20). Для системы с кратковре- менными импульсами из примера 1.6.1, в ча- стности, получим * k "У 7с~ре Ф (г,с) =------------z-; о е < l х(1 + Лу)-е-₽ Пример 1.6.2. Найти сигнал ошибки е[п] и выходной сигнал х[л, е] в замкнутой дис- кретной системе из примера 1.6.1, если к ее входу приложено воздействие g(t) = 1(7) . В соответствии с (1.6.19) найдем
МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДИСКРЕТНЫХ СИСТЕМ 91 £*te) = o:(z)(7*(z) = =_________z-e'p____________Z (г-е’р+ЛиЛне’р(еру - lj) z " 1 г(г-е~р) (z-lXz-a)’ а = e”₽Aii; kt = 1 - -1). При у <. s < 1, используя выражение FF*(z, е), найденное в примере 1.6.1, получим г 1 GT-1 [*иМ2е’Ре(е’РУ - О х[п, 8] = Z 1 И -------------- - По формуле для вычетов (1.6.25) полу- чим - ^и^не (Z - 1)(Z - а) (й<^ 1-а"*1 1-а z=z, 2 Ф»1 = ]TRes V=1 z"(z-e ₽) (z-l)U-a) Аналогично при 0 8 < у, найдем х(я,е] = 1=1, !-е-Р «"(а-е-Р) 1 - а 1 - а *H*H«[z(,-e’Pe) + e’₽(e₽(l"s) -!)] (z - l)(z - а) = Г1 - *ле_₽<”+1) *‘-1 1-а L 1 1-е‘₽. При любом выражение в квадратной скобке стремится к единице при п —> оо, а е[п] - к установившемуся значению 1 - е-р «(«)-* —;------= «у 1-а у Сигнал на выходе системы можно найти по формуле (1.6.17) р)л,(г’£) Вид этого процесса показан на рис. 1.6.5. При л -> оо, ал = Л”е-рл -s> 0 и возни- кает периодический установившийся процесс 1.6.5. Переходные процессы в дискретной системе
92 Глава 1.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ при 0 8 < у, - 1)е-₽е при у е < 1; к'-ч±, 1 -а что является характерной особенностью ли- нейных дискретных систем. 1.6.3. ДИСКРЕТНЫЕ СИСТЕМЫ С НЕСКОЛЬКИМИ ИМПУЛЬСНЫМИ ЭЛЕМЕНТАМИ Уравнения, связывающие выход и вход, аналогично могут быть получены и для дис- кретных систем с несколькими импульсными элементами, в том числе для многомерных систем. Если периоды повторения всех им- пульсных элементов совпадают, систему назы- вают синхронной-, если к тому же совпадают и моменты возникновения импульсов, то систе- му называют синфазной. Для синхронной, но в общем случае не- синфазной системы, представляющей собой последовательное соединение г импульсных элементов и непрерывных частей (рис. 1.6.6), используя соотношение (1.6.10), можно запи- сать: п */1”>£1= 2л/-1['”>е1-1]Мл-от’е " Е(-1]’ л»=0 / = 1,2..г; 8,-1 £ 8 < 1, гае С/ - относительное смещение моментов возникновения импульсов. При е < 8/ _ J ki [0, 8 < 8/ _ J г 0 и л-1 х/[л,е]= ^х/_1[т,е/ч]А:/[л-т,е-е/_1], т=0 ИЛИ Х/[л + 1,8] = = ^х/-1[«.®/-1Н4"_да’1+6-е'-1]- т=0 В Z-изображениях получим: при 8/ _ J < 8 < 1 (1.6.31) При 0 < 8 < 8/ _ j ^7(z,e) = + е - е^). Если Xq(z) - G*(z) - изображение входного сигнала, то из написанных равенств следует: г-1 П^-«1-е1-1)х /=1 При 8Г_1 8 < 1; г-1 /=1 xW'(z,l+s-sr-i)G,(z), при 0 8 < 8r_j. (1.6.32) Здесь обозначено, как и раньше, ^*(z.£) = 2{^[П,е]} = Dz {^(д,е)}. В частности, если система синхронна и синфазна, то 8/ = 0, / = 1, ...» г - 1 и = n<;(z,8)fjir;(z)G*(z). /=i (1.6.33) Для синхронной, но несинфазной систе- мы, образованной параллельным соединением элементарных дискретных систем (рис. 1.6.7), уравнение в Z-изображениях следует из (1.6.31): при Zj _ J £ 8 < 8у; j — 1, ..., г; ео = 0; 8Г = 1 х *(z,£) = iX(z-e/-i)»7(z,® - 8<-i)+ /=1 + Z'1 52<^*(г,6/_1)И^*(с,1 + 8 -8,,!). /=;+1 (1.6.34) 1.6.6. Последовательное соединение импульсных систем
ДИСКРЕТНЫЕ СИСТЕМЫ С НЕСКОЛЬКИМИ ИМПУЛЬСНЫМИ ЭЛЕМЕНТАМИ 93 1.6.7. Параллельное соединение импульсных систем Передаточная функция параллельного соединения существует только для синфазной системы. В этом случае x‘(z>6) = G*(z)Z и'/(г>8)- /=1 (1.6.35) Приведенные формулы применимы и для асинхронных систем, если периоды повто- рения во всех импульсных элементах кратны одному и тому же числу, причем моменты возникновения импульсов (через соответст- вующее число периодов) совпадают. Такие системы называют многократными. Пусть в системе, показанной на рис. 1.6.6, г = 2 и период повторения импульсов в первом эле- менте Ту а во втором Т / N. Тоща второй' элемент можно представить как параллельное соединение систем с одной непрерьшной ча- стью с импульсными элементами с перио- дом Ту но со смещенными на 7} = iT / N, / = 1, 2, ..., N моментами возникновения им- пульсов. Тоща, используя формулы (1.6.32), (1.6.34) можно получить: При 8у _ 1 £ 8 < 8у ; j = 1.ЛГ; 8у = j / N, eq = О N «=;+1 X xG‘(z). (L6.36) 1.6.8. Многомерная дискретная система Рассмотрим многомерную систему, пока- занную на рис. 1.6.8. Непрерывная приведен- ная часть этой системы имеет к выходов и г входов; она описывается передаточной к х г- матрицей W(?) = W0(«)WH(?) = Х(?) = WH (,)¥(<?); W<t>(0) = - г х г-матрица формирующих элементов; W„(9) = [^(«)] - k х г-матрица не- прерывной части системы. Положим, что система синхронна, но несинфазна; обозначим 4л,ё]= к1(л|, ег(л, £|]... еДл, ег. (]|т, E*(z,s) = г{Цл,ё]}; G*(z,e) = Z{gpi,e]}; X*(z,e) = /{х[л, s]}; W#(z,e) = PjlT(9)}. С учетом (1.6.34) будем иметь X*(z,e) = W*(z,8)E*(z,8), (1.6.37) причем вид передаточной матрицы W*(z,e) зависит от 8: при 8у _ j 8 < 8у; j = 1, 2,..., г; 8q = 0; 8Г = 1 W‘(z,e) = - ej)... W'/yfee - e + 8 " 8 + 8 - e,.,) ^21(z,E)K/i(z,e-ei)..H^(z,e-ey_1)z'1^+1(z>l + E-E7)...e"’H/2r(z>l+e-er_1) W/tl(z,e)ITt'2(z,s-s1)...irJfcy(z,s-sy_1)z'1»GG+l(z>1 + e-e7)...e’»H^(z,l + E-Er_1)
94 Глава 1.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Поскольку сигнал ошибки выражается найти равенством = в[л,ё] - Сх[л,ё], Е-(г J) = [l + CW‘(z,e)]',G,(z>?)> где С - г х ^-матрица постоянных коэффици- ентов обратной связи, то из (1.6.37) можно где I - единичная матрица. W*(z,8) = H'n(z) z-’W'nCz.l-ej) ... z-^czu-e,.!) . *2i(z) И'и(г) ... z’^CzU+cj-e,..!) ^(z.e,-!-ej) ... ^fa-(z) Таким образом, X'(z,c) = W*(z,e)[l + CW*(z,e)] * x x G*(z,c) = <D*(z,c,c)G*(z,c), (1.6.38) где ф'(г,с,е) = W'(z,c)Jl + CW*(z,e)]1 - передаточная матрица синхронной несинфазной замкнутой дискретной системы. В частности, для синфазной системы W*(z,e) = W(z,e)[w^(z,e)]; (1.6.39) X*(z,e) = W*(z,s)[l + CW*(z,0)]’'g*(z). Соответственно выражение ф*(г,е) = w‘(z,e)[l + CW*(Z,O)]'’ - это передаточная матрица синхронной синфаз- ной замкнутой дискретной системы. 1.6.4. ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ Для решетчатых функций, удовлетво- ряющих условию абсолютной сходимости: оо Я/И1 < оо, определено дискретное преоб- л=0 разование Фурье: = Fd {/[л]} = Y е-^л/[л]; л=0 • (1.6.40) /Н=И=i J (1.6.41) Применяя это преобразование к обеим частям уравнения разомкнутой дискретной системы (1.6.10), найдем: Х*(уш,е) = W* (jtn ,е) Е*(ja), (1.6.42) где Х*(Д,с) = Fd {хг[л,е|}; причем FF*(j©,e) = Fd{^[w,e]| называют амплитудно-фазовой частотной характеристи- кой (АФЧХ) дискретной системы. Эта характе- ристика может быть также найдена по переда- точной функции дискретной системы: или по передаточной функции приведенной непрерывной части W(q) с использованием D -преобразования (1.6.28): 1Г’(л»,с)= £»r[y(S> г--<о (1.6.43) где ^(Я = ^ф(Я^н(Я- Здесь со - относительная частота, связанная с частотой со по формуле „ 2к со = со/ = со —. со0 Используя обычную частоту со, вместо (1.6.43) получим W\jaT,z} = = у + ~o)]e’y(S+re”)6. CL6.44)
ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ 95 FK(jco) = ^(/со) 1Гн(л>), соо = Амплитудно-частотная (АЧХ) Л(со,е) = = е)| и фазо-частотная (ФЧХ) ср(со) = = aig W (/со) характеристики дискретной системы имеют тот же смысл, что и соответст- вующие характеристики непрерывной систе- мы: если на входе этой системы имеется гар- монический сигнал epi] = a cos сол, то на выходе - установившийся сигнал х[л,е] = а4(со,е) cosjco/i + ср(со )] <1-6.45) Этот сигнал в общем случае, однако, не является гармонической функцией от пере- менной t = л + е , будучи таковой только в дискретные моменты времени. Частотные характеристики дискретной системы являются периодическими функция- ми от частоты со с периодом 2я: IK*[/(co + 2яг)] =’FF*(/(o), г = 0,± 1,±2,... . Это является следствием того факта, что для произвольной частоты со cos(co + 2яг)л = cos сол, т.е. гармонические функции с частотами ©+2яг соответствуют после квантования по времени одной и той же решетчатой функции. Вследствие периодичности частотные ха- рактеристики дискретных систем задаются на конечном интервале изменения со шириной 2л; обычно принимают -я < со я. При увеличении частоты квантования сигнала сод частотная характеристика дискрет- ной системы И'7’* (/со) приближается на интер- вале своего определения к частотной характе- ристике приведенной непрерывной части. Справедлива теорема Котельникова: если |lT(/co)|«O при со £ cocj u cog £ £ 2coci, то на интервале -сод /2^ со cog/ 2 частотные характеристики дискретной систе- мы приближенно совпадают о частотными ха- рактеристиками приведенной непрерывной час- ти: W\j<s>T) « (1.6.46) Или, при тех же условиях » 1Р(/со) при |со| £ я. Это утверждение обычно используется для обоснования распространения методов теории непрерывных систем на дискретные при достаточно большой частоте квантования сигнала. Частотный спектр сигнала на выходе не- прерывной приведенной части может быть найден по формуле (1.6.26) при q где для краткости через Е (/со) обозначено Г(е*). Если |Г(/со)| ® 0 при со сос2 и сод £ ;> 2max(coci, соС2), то спектр сигнала x(f) при- ближенно совпадает со спектром этого же сиг- нала в непрерывной системе, состоящей из при- веденной непрерывной части дискретной сис- темы. Это позволяет говорить об эквивалент- ности непрерывной и дискретной систем. При несоблюдении одного из перечисленных усло- вий спектр сигнала на выходе дискретной сис- темы содержит дополнительные высокочастот- ные составляющие (рис. 1.6.9), характеризую- щие квантование сигнала на ее входе. Для замкнутой дискретной системы час- тотный спектр ошибки определяется по фор- муле (1.6.19): гае = р + - амплитудно- фазовая частотная характеристика системы по ошибке. 1.6.9. К анализу частотного спектра сигнала на выходе дискретной системы
96 ГЛАВА 1.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Выражение Ф*(.Яе) = + »'*(>“)] * определяет АФЧХ замкнутой дискретной сис- темы. Пример 1.6.3. Найти АФЧХ дискретной системы из примера 1.6.1 при с = 0. В соответствии с полученным в примере 1.6.1 выражением передаточной функции ра- зомкнутой системы ЛиЛне ₽(еЭт -1) е»-е-₽ ия= Годограф АФЧХ 1Г*(/со), 0 £ со £ я приведен на рис. 1.6.10. При -я со 0 го- дограф не строится, так как W (- /со) = Можно также записать выражения fcHfcHe P(ePY “ 4 Ф Ы =--------1 -e^l-*„fcH(e|5’' -1)] Для вычисления АЧХ и ФЧХ дискретных систем на ЭВМ целесообразно использовать формулу (1.6.44). При е = 0 для со/ — со' + + /Дсо, / = 0, 1, ..., М, вычисляют 1 N Re /Г) « £ Re »ф(<о, + л» о)1; 1 r=-N 1 N hbW'ijatT)*— £1тЖ[Д<о, + лоо)], г=-Х 1.6.10. Годограф амплитудно-фазовой частотной характеристики выбирая число N из требований к точности расчета частотных характеристик. По этим характеристикам определяют |ил*(/оо/7’)| и ачЖ’(/»(Т). Логарифмические частотные характери- стики дискретных систем получают с помо- щью (модифицированного) ^-преобразования w = 2 Z-1 Т z + Г (1.6.47) Если Z = , то w —/со*, * 2 , со со = — tg —. Т 2 Таким образом, w-преобразование ото- бражает отрезок мнимой оси -jit /со jit, на котором определены частотные характери- стики дискретной системы, в мнимую ось /со* плоскости w. Поскольку передаточные функции W*(z) обычно являются дробно-рациональными, то и АФЧХ z~ 7ТГ также дробно-рациональны. Таким образом, функции lK*(/co*) формально ничем не отли- чаются от АФЧХ непрерывных систем и для них могут быть построены логарифмические амплитудные и фазовые частотные характери- стики (ЛАЧХ и ЛФЧХ): = 2О1^И^(у<о* <pw(>') = argH^(>*). Переменная со* называется псевдочасто- той и имеет свойственную круговой частоте размерность с1; 0 со < оо . Задаваясь видом формирующего устрой- ства, можно найти ЛЧХ для типовых звеньев • Теперь для любой передаточной функции Ww / Для систем с экстраполятором нулевого порядка (см. пример 1.6.1) передаточные функции для типовых звеньев приведены в табл. 1.6.2.
ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ 97 * i Г ♦ Т 1 + е"р Т = выражения Rk(z) см. с. 88; Т[ = —-----0 = — iz=---2 i-e р /1 bw- т(1-20е~₽ -е~2р) р2 /(_е.₽|2 : *' = 2(ch₽-l); Т Icha + cosS. 2 V cha - cos 8 ’ a = lj₽; 8 = p71-52; t, Sha „ T-foa-aS-^inS) p2sin8 ’ 7ch2a-cos28 ’ 2 cha - cos8 ’ " 28(cha -cos8)' 4 Зак 1023
98 ГЛАВА 1.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Пример 1.6.4. Построить ЛАЧХ для дис- кретной разомкнутой системы с прямоуголь- ными импульсами, у = 1, если передаточная функция непрерывной части к FT(s) = J „ v s(l + 7\s) к = 100 с'1, Г = ОД с, 1\ = ОД с, &и = 1- частоты квантования сигнала coq —> °° (Т-> 0) увеличивается полоса частот 0 £ со £ сол, сол —> —> оо, на которой частотные характеристики дискретной системы совпадают с частотными характеристиками соответствующей непрерыв- ной системы. Эту полосу можно оценить, за- давая погрешность е: По табл. 1.6.2 по формуле N J +ло0)]<8 r=-X I г#0 (1.6.48) l-wT/2 т 1 - wT /2 w 1 1 + wT{ (1-wT/2^l + wT2) tv(l + w7j') T2 = T{ -7\= 0,01 c; Т' Г1+е’₽ n p = т I 7\ = L при достаточно большом числе N. При 0 £ со £ сол, 0 со* со*л ше - АФЧХ приведенной непрерывной части. При достаточно большой частоте кванто- вания со о можно приближенно записать: ♦ 2 А соТ “ =7rtg~ss(0’ ЛАЧХ, ЛФЧХ, соответствующие найден- ной передаточной функции, показаны на рис. 1.6.11. Из свойств частотных характеристик дис- кретных систем следует, что при увеличении ||»W<0)| = 1.6.11. Лопцмфмаческве частотные характернстжкн днскретной системы
ТОЧНОСТЬ ДИСКРЕТНЫХ СИСТЕМ 99 1.6.12. Построеняе ЛАЯХ дискретной сястемы методом обособленного н^преобразованвя и, следовательно, LmH^pco*) » LmfKH(y©), что дает возможность переносить без измене- ния низкочастотную часть ЛАЧХ непрерывной системы на плоскость ЛАЧХ дискретной сис- темы, отображая с помощью формул и таблиц w-преобразования только высокочастотную часть ЛАЧХ непрерывной части. Такой способ называют обособленным ^-преобразованием [10]. Пример 1.6.5. Построить ЛЧХ дискрет- ной системы с прямоугольными импульсами, у = 1 и непрерывной частью w (s) = *(1+М___________ hW s(l + Tis)(l + T2sy к = 45 с"1, 7, = 10 с, Т2 = 0,025 с, Тз = 0,8 с, Т = ОД с. Выберем полосу частот [0, 10 с*1]. Тогда сол = 10 с’1, ш*л « 11 сч, ©о = 62,8 с-1» LmlT [/(©о " ®л)1 = ”34 ДБ; LmlF [/(©о - ©л)] = -39дБ. Значения, соответствующие г £ 2 в (1.6.48), пренебрежимо малы и с « 0,12. Если десятипроцентная точность удовлетворительна, то низкочастотная часть ЛАЧХ И^(/©) в вы- бранной полосе частот сохраняется без изме- нения, а для высокочастотной части ITB(s) = 1,74—- в 5(1 + 0,0255) получим ♦ — (174 Wt(w) = Dw iii- I 5 1,74 - 0,025 1 + 0,025s 1,74(1 - 0,05w)(l + 0,027w) w(l + 0,025w) Результирующая ЛАЧХ приведена на рис. 1.6.12. 1.6.5. ТОЧНОСТЬ ДИСКРЕТНЫХ СИСТЕМ Точность при гармонических воздействиях. Если ко входу системы приложено воздействие g(F) = acos©^, то установившаяся ошибка еу[п] может быть найдена по формуле (1.6.45) = e|®;(>“i)|cos[“l" + aig®;(y«0i)], (1.6.49) где Фе(/©1) и argOe(j©i) -амплитудно- и фазочастотные характеристики импульсной системы по сигналу ошибки при частоте вход- ного сигнала ©j. Для их определения могут быть использованы логарифмические частот- ные характеристики дискретных .систем, рас- смотренные в п. 1.6.3. Так, если И^(у©*) = - амплитудно-фазовая частотная характеристика разомкнутой импульсной сис- темы, то с помощью номограмм замыкания [18] можно построить логарифмические час- тотные характеристики LmO^(y© *) = -Lm[l + * а1ВФ«(Л>‘) = —atg|l + и с их помощью найти установившуюся ошибку * (1.6.49). Если при значении ©х, соответст- вующем ©1, выполняется ИО/шJM » 1, то 4
100 Глава 1.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ амплитуду установившейся ошибки можно приближенно найти непосредственно по ЛАЧХ ЬтИ'фю*): 2016^ х -LmH^(/oQ + 2Olga, а смещение по фазе сигнала ошибки - из гра- фика ЛФЧХ: arg Ф*(> J) « - arg И'фо J). При условии ©о > 2сос ЛЧХ разомкнутой импульсной системы совпадают с ЛЧХ приве- денной непрерывной части (п. 1.6.2) в низко- частотной области 0 < со £ ©л. Если частота входного сигнала ©j принадлежит этой облас- ти, то справедлива приближенная формула « а|фб(л) i)| cosfco + argOe(j© j)} (1.6.50) Если к тому же |FF(jco j)| » 1, то 201gey « -LmW'p’co j j + 201ga. Таким образом, установившаяся ошибка в импульсной системе совпадает приближенно с установившейся ошибкой в непрерывной системе, полученной путем замыкания приве- денной непрерывной части отрицательной обратной связью. В отличие от непрерывных систем сигнал ошибки (1.6.49) характеризует отклонение выходного сигнала системы x(f) от входного g(t) только в дискретные моменты времени t = п. Для того чтобы исследовать ошибку системы в интервалах между моментами кван- тования, необходимо с использованием полу- ченных характеристик |Og(/o)|, а^Ф*(у©) найти выходной сигнал при заданном входном гармоническом воздействии в любой момент времени. С учетом формулы Ф*(у©,с) = (j©) FF*(j©,e) имеем для установившегося значения хг(0=а|фХ^1)||>г*(^1’е)|сов[“|/'+ +arg !) + аг8 1’Е)]- (1.6.51) Отсюда следует, что установившаяся ошибка в дискретной системе по амплитуде, рассматриваемая как разность входного и вы- ходного сигналов, Ме) = - ^1)||И>М)- Вследствие возможных колебаний внутри периода повторения она может быть больше, чем ошибка, определяемая по формуле (1.6.49). Точность при полиномиальных воздействи- ях. Коэффициенты ошибок. При произвольном воздействии gf/t] ошибка дискретной системы может быть найдена по формуле (1.6.22) е|л| = «Iя-"4 (1.6.52) т=0 Если известны передаточная функция по ошибке Фе(х) и изображение входного сиг- нала G (z) , то значения сигнала ошибки е[п] могут быть найдены по формуле вычетов: е|л] = ^Ке8Ф‘(г)С‘(г)г"и V Z=Z, либо как коэффициенты разложения в ряд Лорана выражения ®e(z)G*(z)= ^C„Z'", л=0 где е[л] = сп. В последнем случае эти значе- ния определяются путем деления числителя правильной дробно-рациональной функции Фб (z) G (z) на ее знаменатель. Как и в непрерывном случае, дискретную систему называют статической, если при по- стоянном воздействии в ней возникает устано- вившаяся ошибка, и астатической - в против- ном случае. При действии на систему полино- миального сигнала порядка к «|л| = Лс|л| = ао + ар» + ... + акпк, имеющего ^-изображение вида (см. табл. 1.6.1) G*(z)- J? g ; C*(z)| ,*о, (z-l)K+1 'z=l ошибка е[п] стремится к нулю, если порядок астатизма системы г > к + 1, к постоянной вели- чине при г= к и к бесконечности при г < к. Признаком астатизма порядка г является наличие нуля функции Og(z) в точке Z = 1 порядка г, т.е.
УСЛОВИЯ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ 101 = (z - 0Гфео(г); ф«о(г)|г=1 * °- Для определения установившейся ошиб- ки при полиномиальном воздействии для дис- кретных систем может применяться подход, аналогичный методу коэффициентов ошибок. Выразим решетчатую функцию - /л] в (1.6.52) через ее разности различных поряд- ков по формуле *=0 yKJ - биномиальные коэффици- енты, и сгруппируем слагаемые, соответст- вующие разностям Д*Йл - к]: <л] = £ (-1)’сР"1д’сф - <] = т=0 к=0 = (L6.53) к=0 *• Коэффициенты Ск = £(-l)*»l<,%[l»l], (1.6.54) т=к связывающие установившуюся ошибку с раз- ностями входного сигнала, могут быть названы коэффициентами ошибок дискретной систе- мы. Они могут быть также найдены путем дифференцирования передаточной функции по ошибке: C>c = d (1.6.55) т.е. как коэффициенты разложения функции Фе(?) в степенной ряд ф‘<г)=Ё77<1-г’1>*’ <1б-5б> который может быть получен и с помощью ^-преобразования правой части (1.6.53). Пример 1.6.6. Найти установившуюся ошибку в замкнутой дискретной системе если входное воздействие представляет собой фак- ториальный полином второго порядка g[fl] = 1 + л + ^-л(2), а передаточная функция разомкнутой системы ж-fc). MfeiwL. Вначале определяется передаточная функция по ошибке , (z-l)(z-0,4) 0e(z)=(z-l)(Z-0,4)+ 0,5(z+0,6)’ соответствующая системе первого порядка астатизма. Следовательно, со = 0. Учитывая, что Agf//] = 1 + л; ДЭДл] = 1, Д*Йл] = 0, к > 2, достаточно определить два первых ко- эффициента ошибок: С\ и С2- Вводя перемен- ную д = 1 - Z"1 и осуществляя деление числи- теля передаточной функции на знаменатель, получим: Фе (д) = + = о,75<5 + 0,9g2 +...; 0,8 - 0,5g + 0,7g2 Ci = 0,75; C2 = 1,8. Установившаяся ошибка ey[n] = qAgfn -1) + Д2#|л - 2] = = 0,75л + 0,9. 1.6.6. УСЛОВИЯ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ Основные теоремы. Условия устойчивости движения дискретной системы определяют характер изменения движения при малом из- менении начальных условий. Рассмотрим дис- кретную систему, описываемую уравнением вида (1.6.20): %*(z) = O*(z)G*(z), (1.6.57) где G (z), X (z) - Z-изображения входного и выходного сигналов, а P‘(Z) ф‘(г) = ^77 = -^------ C(z) у=0 (ms к) - передаточная функция системы. Переходя к оригиналам в (1.6.57), получим разностное уравнение системы:
102 Глава 1.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ к т £ а/4л + = X Мл + 4 (1.6.58) 7=0 /=0 Рассмотренные выше зависимости вида (1.6.23) могут рассматриваться как решения соответствующих разностных уравнений. Если в (1.6.58) ад и ак отличны от нуля, то это раз- ностное уравнение порядка к. Задав при п £ пд входное воздействие #(л] и к начальных усло- вий х[ло), *1ло + 1], —> Мло + к - 1], из (1.6.58) последовательно можно определить все значения решения х[л] при п £ пд + к. В частности, при #(л] = 0 решение одно- родного разностного уравнения к ^e74«+j] = 0 (1.6.59) 7=0 определяется только начальными условиями *ho+ г- 0, ... к - 1. Величину отклонения решений от со- стояния равновесия можно определить евкли- довой нормой ||х[л|| вектора х[л] = {х[л], ..., х[л + к - 1]}т. Состояние равновесия х[л] - 0, т.е. три- виальное решение уравнения (1.6.59) называют устойчивым (по Ляпунову), если для любого ма- лого числа с > 0 найдется такое 8(e) > 0, что при НМ < 8 будет выполняться ||х[л|| < с начиная с некоторого ng. Тривиальное решение уравнения (1.6.59) называют асимптотически устойчивым в ма- лом, если при отклонении начальных условий НМ < d решение асимптотически стремит- ся к нулю: 1нп||х(л|| = а Ввиду линейности системы из устойчи- вости тривиального решения следует устойчи- вость любого решения, а следовательно, и всей системы. Из асимптотической устойчивости в малом следует асимптотическая устойчивость в большом, т.е. для любых решений (1.6.59). Многочлен е'(Х) = аоХ» + -1 + ... + . 1Л + называют характеристическим многочле- ном для рассматриваемой системы, а уравне- ние 0*(Х) = 0 - характеристическим уравнени- ем. Корни характеристического многочлена определяют вид решения (1.6.59) при произ- вольных начальных условиях, а следовательно, условия устойчивости. Действительно, реше- ние х[л] (1-6.59) можно найти с помощью методов п. 1.6.2 в виде х|л)= У Res^^lz"*1 -1 е <«> Z-K К' = (L6.60) V=1 где Pg (z) - полиномы, коэффициенты кото- рых зависят от начальных условий; Xv - корни характеристического многочлена; РДл] многочлены степей rv - 1, соответствующей кратности rv корня Xv, v = 1, ..., к*; к/ к. Из вида (1.6.60) следуют теоремы: теорема об устойчивости линейной дис- кретной системы: линейная дискретная система устойчива, если для всех корней характеристи- ческого многочлена 0*(Х) выполняется усло- вие |Хv| £ 1, причем равенство |XV| = 1 может иметь место только для простых корней; теорема об асимптотической устойчивости: линейная, дискретная система асимптотиче- ски устойчива, если для всех корней ха- рактеристического уравнения выполняется условие |XV| < 1, v = 1,2,...,jc'. Необходимость и достаточность условий этих теорем доказана в [10]. Если условия теоремы об устойчивости не выполняются, т.е. существует корень характеристического урав- нения такой, что |XV|> 1 либо |XV| = 1, но кратность корня выше единицы, то система неустойчива. Геометрическая интерпретация условий устойчивости заключается в том, что корни характеристического многочлена должны ле- жать на плоскости Z внутри круга единичного радиуса |z| = 1 либо на самом круге при усло- вии, оговоренном в первой теореме. Для асимптотически устойчивой дис- кретной системы ее весовая функция может быть представлена с использованием формулы (1.6.24) в виде Мл] = Z’Uo'Cz)) = У Res^^V*1 1 ’ OU) z. Z-Лу С учетом условия |XV| < 1 отсюда следует, что функция Л[л] абсолютно суммируема, т.е.
УСЛОВИЯ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ 103 00 <оо, ас учетом формулы л=0 (1.6.23) можно получить следующее утвержде- ние: в асимптотически устойчивой систе- ме при ограниченном входном сигнале |g[л] | < L < оо выходной сигнал остается ог- раниченным при любом л < оо: |х(л| £ ML < оо. Для проверки условий устойчивости дис- кретных систем применяют к р и т е р и и ус- тойчивости, позволяющие определить расположение корней характеристического многочлена 0*(Х) относительно окружности единичного радиуса, не определяя сами корни. Некоторые из них приведены ниже. Критерии устойчивости. Критерий Раусса - Шура (Шура - Кона). Пусть 1 0 0 ... 0 «1 1 0 ... 0 А)т “ «2 «1 1 ... 0 ... ... ... «т-1 «т-2 «т-3 ... 1 ак «к-1 «к-2 ... «к-т+1 0 «к «к-1 ... «к-т+2 ^кт ~ 0 0 «к ... «к-т+3 0 0 0 ... ак ^От ^кт Акт Л)т Если все определители Дт положительны, т.е. Дт > О для всех т, то все корни Уц харак- теристического многочлена @ (X) лежат внут- ри единичной окружности, т.е. система асим- птотически устойчива. Если выполнить дробно-линейное пре- образование W = T(1.6.61) Х + 1’ отображающее единичную окружность |Х| = 1 в левую полуплоскость Rew < 0 плоскости w, то можно воспользоваться критерием Гурвица для получившегося характеристического мно- гочлена 2*(w) = b$wK + b\wK l+...+bK_^ + bK. Критерий Гурвица. Все корни характеристического многочлена Q (w) лежат в левой полуплоскости Rewz < 0, / = 1, ...» к?, если Ао > 0 и главные диагональные миноры матрицы Гурвица Н положительны, 0 ... о‘ Ьз *1 ... 0 я = *5 *4 Ьз ... 0 . ... ... 0 0 0 ... Ьк_ Система при этом асимптотически ус- тойчива. Пример 1.6.7. Найти условие асимптоти- ческой устойчивости, если характеристическое уравнение имеет вид 1 + а\к + (12$ = 0. Выполняя замену переменной (1.6.61), получим (1 - w)2 + fli(l - w2) + ЛгО + w)2= 0 или Aow2 + biw + Z>2 = 0; fa = 1 + a2 - «1; b\ = 2(1 - a2)‘, Z>2 = 1 + al + a2- По критерию Гурвица условие устойчи- вости имеет вид Д1 = Ь\ > 0; Д2 = b\b2 > 0; Ао > 0. Аналог критерия Михайлова для дискретных систем. Если число полных оборотов годографа (Z(X) при одно- кратном обходе точкой X окружности единич- ного радиуса в положительном направлении рав- но порядку к полинома (У(Х), то все корни лежат внутри единичной окружности и система асимптотически устойчива. Этот критерий является следствием принципа аргумента. Используя последнее утверждение, не- трудно получить и формулировку критерия Найквиста, определяющего устойчивость замкнутой системы по виду годографа разомк- нутой системы. Критерий Найквиста для дискретных систем. Для того чтобы замкнутая дискретная система была асимп- тотически устойчива, необходимо и достаточ- но, чтобы годограф АФЧХ разомкнутой систе- мы W (Joi) при изменении переменной т от О до п обходил точку (-1, J0) последовательно в положительном направлениир/2 раз, гдер - число полюсов W*(z) вне единичной окружности.
104 Глава 1.7. МЕТОДЫ ПРОСТРАНСТВА СОСТОЯНИЙ ДЛЯ ДИСКРЕТНЫХ СИСТЕМ В частности, если р = 0, то для соблюде- ния условий асимптотической устойчивости замкнутой дискретной системы цадо потребо- вать, чтобы годограф W (/о) не охватывал точку (-1,/)). В случае, когда система обладает аста- тизмом и, следовательно, W*(z) имеет полюс порядка v на самой единичной окружности в точке Z = 1, годограф FK (/о), как и для непрерывных систем, дополняется окружно- стью бесконечного радиуса, обходящей в по- ложительном направлении, начиная от веще- ственной оси, v квадрантов. К полученному годографу применяется критерий Найквиста в предположении, что полюсы |z/1 = 1 лежат внутри контура обхода. Все частотные критерии устойчивости непрерывных систем могут быть без измене- ний применены к дискретным системам после модифицированного w-преобразования: (см. п. 1.6.3). В частности, сохраняется крите- рий устойчивости Найквиста, сформулирован- ный для ЯЧХ. Пример 1.6.8. Проверить устойчивость замкнутой дискретной системы с прямоуголь- ными импульсами (у = 1) и передаточной функцией непрерывной части И'нф = , ** , HV s(l + 7ij) Kj = 100, /Си = 1, период квантования Т = = 0,1 с; 7i = 0,1 с. Для рассматриваемого случая передаточ- ная функция разомкнутой дискретной системы получена в примере 1.6.4: (1 - 0,05w)(l + 0,0 lw) w(l + ОД lw) В соответствии с критерием устойчивости в области частот, для которых > 0, фазовая характеристика не должна пересекать ось ф = -л или пересекать ее четное число раз. В данном случае это усло- вие не выполнено и, следовательно, система неустойчива в замкнутом состоянии. При снижении коэффициента усиления до 26 дБ система становится устойчивой. При к = 10 запасы устойчивости по амплитуде и по фазе составляют Дд = 6 дБ, Дф = 20°. FK,(w) = 100 Глава 1.7 МЕТОДЫ ПРОСТРАНСТВА СОСТОЯНИЙ ДЛЯ ДИСКРЕТНЫХ СИСТЕМ 1.7.1. УРАВНЕНИЯ СОСТОЯНИЯ Рассмотрим дискретную линейную сис- тему, описываемую разностным уравнением порядка к (1.6.58): к m '£aJxtn + j] = '£bi£n + i], т<.к, J=A где g[fl], х|л] - решетчатые функции, описы- вающие входной и выходной сигналы в систе- ме. Введем новую переменную ЯЛ1 в соответ- ствии с уравнениями к у=о (1.7.1) m ^bty[n + i] = 4n]. /=о В эквивалентности уравнений (1.7.1) и (1.6.58) нетрудно убедиться с помощью ^пре- образования. Вектор у[л] = £У1[л] ... ук[л]}т с компонентами уДл] = у[л + Л, / = 1» —> к называют вектором состояния дискретной сис- темы. Перейдем к матричной форме записи уравнений системы. Введем матрицу 0 1 0 0 0 0 0 1 0 0 А = 0 0 0 1 0 _^1_ _^2 _^з_ _ ак-1 _ ^к_ . g0 «0 «0 g0 g0. и векторы - g1^0 [ | _ ^0gm j| ^Ogm+1 Oq J I m До A g0 > d = ^о/до. Тогда уравнения (1.7.1) примут следую- щий вид:
УРАВНЕНИЯ СОСТОЯНИЯ 105 у[л + Ц = Ау[л) + Ь^л];1 х|л) = сту[л] + ф[л). J (1.7.2) Первое из этих уравнений является раз- ностным уравнением состояния, а второе выра- жает выход системы х(л] через ее вход g[fl] и вектор состояния Ял1- Полученная форма записи является аналогом соответствующих уравнений непрерывных систем в пространст- ве состояний. Универсальность этой формы позволяет исследовать свойства дискретных систем независимо от их размерности, а также от числа входных и выходных сигналов. Пример 1.7.1. Составить уравнение со- стояния для дискретной системы с передаточ- ной функцией W W (Z-l)(Z-rfJ‘ В данном случае Oq = d, aj = -(1 + d), ai = 1, Ao = 0, b\ = ac(1 - d) и уравнения (1.7.2) имеют вид: Л|л + 1) = лИ; Уг!" + !] = (!+ </-1)У11л) - «НугИ; дс(л] = к(1 - <0У1[л]. Задание начального значения у[ло! век- тора состояния и входа g[fl] при п £ Лд позво- ляет определить из первого уравнения (1.7.2) состояние в любой последующий момент вре- мени, а из второго уравнения (1.7.2) при п £ п$ определяется выход системы. Получим: у|л] = А"-"»Яло1 + £ /=Ло (1.7.3) Матрица У[л,ло ] = Ал-л° - переходная матрица дискретной (стационарной) системы. В частности, при gf л] s 0, л £ ng переходная матрица определяет состояние системы по формуле Ял)=А"-"»у1ло). Переходная матрица состояний обладает следующими свойствами: 4»2,»ll*l»l.»ol = V[«2,«o]. («2 >«1 >«о); Y[»2,»i]= Y ‘[fli.flj], ¥[л0,л0] = Е; Мл + 1,ло)=А¥[л,ло]. В аналитической форме переходная мат- рица состояний может быть получена с помо- щью ^-преобразования. Применяя его к урав- нению состояния (1.7.2) При gfn] s 0, т.е. у[л + 1) = Ау[л] с начальными условиями у[0], будем иметь Y*[z] = (Ez - A)"1 z у[0]. Следовательно, к Y[n,0] = ^Res(Ez-A) *z" (1.7.4) где - полюса функции (Ez - А)-1 г". Пример 1.7.2. Найти переходную матрицу состояний в предыдущем примере 1.7.1. Решение: Y*(z,0) = (Ez-A)’1z = ________z________ z+d 1 Z2 +zd~' -(l + d-1) J***"1 1 z к Y[h,0] = ^ResY^z.OJz"*1 cizr+^z" сз(г"-*") czZi+ciz" 3 , i . ,1 c, =- + </. C2 =- + </, z,=2+ —. ?2 = -^-2. c3 = c4=i(rf + l). * Другой способ вычисления переходной матрицы состояния основан на теореме Кэли - Гамильтона, согласно которой матрица удовле- творяет собственному характеристическому уравнению [10]. Определение переходной матрицы со- стояния существенно упрощается, если урав- нение состояния может быть приведено к диагональному виду. Первое из уравнений (1.7.2) можно при- вести к диагональному виду, если собственные числа матрицы А, т.е. корни X/ характеристи- ческого уравнения det(A - ХЕ) = 0 - простые. Тогда существует невырожденное преобразова- ние у = Ру*, такое, что
106 Глава 1.7. МЕТОДЫ ПРОСТРАНСТВА СОСТОЯНИЙ ДЛЯ ДИСКРЕТНЫХ СИСТЕМ Р'АР = diag[XtX2 ... XJ = X; И» + 1) = Х^'|л] + Ь'йл); М") = сту|л] + dg[n]; Ы = Р-Ц», ст' = сП». (1.7.5) Такое представление называют нормаль- ной формой уравнений состояния. Переходная матрица состояний для урав- нения (1.7.5) сразу может быть записана в виде Цл,л0] = Х"-"» = diagfx"'"0 Х"/»... Х"к’"»| При использовании передаточных функ- ций для построения уравнений состояния форма (1.7.5) может быть найдена непосредст- венно, без промежуточного построения систе- мы (1.7.2). Полагая, что полюса передаточной функции IT*(z) простые, получим и'’<г) = £т£/г+</ l=lz~Kl (при т < к выполняется d = 0), где С/= lim W*(z)(z - X/), i = 1,2,...,к. Положим X*(z) = W\z)G\z) = Y crfd) + rfG’(z). /=1 Тоща уравнения состояния примут вид )'/(л + 1] = Х/)'/[л) + ^л], а выходной сигнал определится по формуле к *|л] = ^с/)»/1л) + <%1л], /=1 или в векторных обозначениях у[л +1] = Xy[»J + bg[nj;l xH = cTy|flJ + <feH, J ' • ’ ст = [с,... ск], X = diag[Xi... XJ, Ь = |1... 1Р, что совпадает по виду с системой (1.7.5). Пример 1.7.3. Составить уравнения со- стояния для дискретной системы с прямо- угольными импульсами, у = 1 и передаточной функцией непрерывной части L. ^=(1+м{1+м- Применяя аппарат Dz -преобразования (см. п. 1.6.2), получим передаточную функцию системы в виде *!(*<)+frZ + ^Z2) (г)_ ’ _ ~ Х)р2 . _ *1(^2 ~ QP1 . 1 Р1“Рг 2 Рг”Р1 Р/ = 7/ / Т, Xf= е-р', i = 1, 2. Уравнения состояния имеют вид )'1(л+1) = е*₽у|(л] + «1л); _И2(л + 1| = е*₽2.И2|л) + йл); 4«) = C1J»1W+C2)'2l»|. В более общем случае, когда среди собст- венных чисел X/ матрицы А могут быть и кратные, вместо (1.7.6) получится система уравнений следующего вида Ял + 1| = JypiJ + bgpi];l х[л] = Сту[л] + dgp»], J где J = diag[Ji ... J/] - клеточная матрица Жордана; Элементы системы (1.7.7) также могут быть найдены из передаточной функции сис- темы, которая в рассматриваемом случае мо- жет быть представлена в виде / = 1,2,...,/; т - 1,2,...,Г/,
УРАВНЕНИЯ СОСТОЯНИЯ 107 Г/ - кратность полюсов X/; d = lim W (z). Полагая, как и выше x,(z)=j;Jci,r;(z)+rf(?,(z), /=и=1 будем иметь Itf+I(z) = Y?(zXz-X,) при J=1.2.... r;(z)(z-M = G‘(Z). 1 = 1,2.....1, откуда и следует система разностных уравне- ния вида (1.7.7): у^п + 1] = МД"! + Уд + il"J> J = 1.2...г,. ь ^[Я + 1] = Х'7'»/И + «1Л1’ (1-7-8) 4«1 = '£'£сдУ1/1п] + dg[n], Ы>=1 Таким образом, в (1,7.7) Ст = [СцС12 ... Сц , С21С22 ... С2г^ — ••• > сас'2 ••• % 1Т; элементы вектора - столбца Ь равны нулю за исключением элементов С номерами и, п + + — И + + ••• + ГЪ которые равны единице. Уравнения состояния (1.7.2) не обяза- тельно соответствуют дискретной системе, состоящей из импульсного элемента и непре- рывной части. Они могут рассматриваться как уравнения дискретной линейной системы произвольного вида с одним входом и одним выходом. Матрица А в этом случае может быть произвольной. Для многомерных дискретных систем уравнения (1.7.2) можно обобщить, записав их в виде У(л + 1| = Ау[л] + BgpiJ; (1.7.9) х[л] = Су|л] + Dg|n], me g[n] - г х 1-вектор входных сигналов; х[и] - / х 1-вектор выходных сигналов; В, D, С - прямоугольные матрицы соответствующих размеров. Матрица А размера к х к в этом случае может иметь произвольный вид. Если собственные значения матрицы А являются простыми и Р-!АР = X = diag[XiX2 ... XJ, то также, как и выше, выполняя невырожден- ное преобразование у =Ру', можно получить уравнения состояния многомер- ной системы в нормальной форме?. /(л + 1) = Ху'|л] + B'g(n|; (1.7.10) х|л] = С'у-|л] + D'gH, где В' = Р-1В, С' = СР. В случае, когда среди собственных зна- чений матрицы А имеются кратные, диаго- нальная матрица X в уравнении состояния заменяется на матрицу Жордана аналогично (1.7.7). Уравнения (1.7.9) и (1.7.10) могут быть получены аналогично предыдущему, если из- вестна матричная передаточная функция сис- темы. Пример 1.7.4. Составить разностное уравнение в нормальной форме для двухка- нальной синхронной синфазной системы с кратковременными импульсами. Передаточная матрица задана в виде = [^‘(Z)], 1 = 1,2; • Z2 • 1 • z • z2 ^ = 771= ^(z) = ^^. Уравнения системы в форме (1.7.9) могут быть получены аналогично предыдущему. Раз- ложим Wy (z) на простейшие дроби, тогда %2‘(z) = [i-^g1‘(z) + + (—------—1<?2(z)- lz+3 Z + 27 ' Полагая n*(z)=^?Gi*(z); *2(z)=^Gi'(z);
108 Глава 1.7. МЕТОДЫ ПРОСТРАНСТВА СОСТОЯНИЙ ДЛЯ ДИСКРЕТНЫХ СИСТЕМ 1з*(г)—Ц<Ъ*(г); *4*(z)—'—Girt. £ + 3 Z + 2 будем иметь: yd" + Ч = -yihl + gihl; Уг{п + 1] = -2уг1"] + «1И; уз|л + 1] = -зу3[л] + &И; у4(л + 1] = -2у4[л] + £2|л]; %1|л] = -уйл] - 4у2|л] + у3[л] + &[л]; JC2l«l = -2>2l«l - 2у4[л] + ЗУз1«1 + что соответствует уравнениям состояния в форме (1.7.10) при X = diag[-1 -2 -3 -2]; 1 О' 00 ~ Г-1-41 0 ‘ В' = ; С' = ; 0 1 [0 -2 3 -2J 0 1 Полученные уравнения могут быть реше- ны как рекуррентные соотношения либо най- дена аналогично предыдущему переходная матрица состояний. 1.7.2. СВОЙСТВА ДИСКРЕТНЫХ СИСТЕМ В ПРОСТРАНСТВЕ СОСТОЯНИЙ Уравнения состояния дискретной систе- мы, записанные в форме (1.7.2) или (1.7.9), позволяют определить некоторые свойства систем, используемые при их анализе и синте- зе. Дискретная система удовлетворяет усло- вию (полной) достижимости, если при нулевых начальных условиях у[ло] = 0 найдется такое п> ло и входной сигнал gf/л], т = ло, ло + 1, ..., л, который переводит вектор состояния в любую желаемую точку у[л]. Справедлива следующая теорема о дос- тижимости: система (1.7.2) удовлетворяет условию достижимости тогда и только тогда, когда ранг матрицы Q = [b АЬ Д2Ь ... А« - *Ь] (1.7.11) равен размерности пространства состояний к. Доказательство этой теоремы основано на использовании равенства (1.7.3) при у[ло] = 0 , т.е. соотношений, имеющих при ло = 0 вид т-1 у[т] = £Am"1"/bg[/], m = l,2,...,fc, /=0 (1.7.12) в частности, jW = Qgo> go = {gl*- l]gl* - 2]...g[0]}T. При выполнении условий теоремы суще- ствует обратная матрица Q'1, позволяющая определить последовательность g[0], gfl], ... gt&- 1] непосредственно из уравнения (1.7.12). Если условия теоремы выполняются, то заданное значение вектора состояния может быть достигнуто из произвольного начального состояния у[0]; при этом формула (1.7.12) примет вид yR] = A*MOJ+Qgj, или для произвольного л у|л + Л] = A*yH + QgJ, (1.7.13) gj = {«И - I + »1«1* - 2 + л]...^л|}т. Таким образом, дискретная система, удовлетворяющая условию достижимости, может быть описана векторным разностным уравнением порядка к (1.7.13). Вводя новый вектор состояния z = fZ] Z2 ... Zjt]T размера к2, где zi|«] = у|л], г2[л] = у|л + 1], ... Zk[n] ~ У1л + & - 1], это уравнение можно записать в виде уравнения первого порядка Векторное пространство, в котором оп- ределен вектор Z, может быть названо расши- ренным пространством состояния дискретной системы. Соответственно уравнение (1.7.14) будем называть расширенным уравнением состояния. Вычислив один раз из (1.7.2) последова- тельность у[л], л = ло, Ло + к, исполь- зуемую в качестве вектора начальных условий для уравнения (1.7.14), далее можно решать (1.7.14), определяя за один шаг сразу последо- вательность состояний z|л].
НЕПРЕРЫВНО-ДИСКРЕТНЫЕ СИСТЕМЫ 109 Дискретная система (1.7.2) (полностью) управляема, если существует такое число к и такая последовательность значений входа + 1]> — £|ло + Ч, что для любого начального значения у[ло] будет выполняться у [Л] = 0, т.е. это значение переводится в ноль за конечное число шагов. Из (1.7.13) следует, что в этом случае должно выполняться условие А*у|л0] = -р> АЬ А2Ь ... А*_,ь]8т[ль!- (1.7.15) Теорема об условиях управляемости, ко- торая основана на анализе последнего соотно- шения, формулируется так: дискретная система управляема тогда и только тогда, когда ранг матрицы A'*Q = [а4Ь А'2Ь ... A'*b] равен размерности к пространства состоянии. Здесь предполагается, что detA # 0. Сигнал gT[/io] в управляемой системе может быть найден из равенства Ял0) = -A’*QgT[«o] = = ЧА’*Ь А*+,Ь ... А-,Ьйт(л0|, (1.7.16) следующего из (1.7.15). Однако, если матрица А и, следователь- но, А* - невырождены и система удовлетворя- ет условию достижимости, то она удовлетворя- ет и условию управляемости. Такая система может быть переведена из заданного начального состояния в произволь- ное и возвращена обратно, в связи с чем ее также называют обратимой системой. Состояние системы у [л] наблюдаемо, если оно может быть восстановлено по будущим значениям выходного сигнала х[т] при т — = п + 1, п + 2, ..., п + к, к < оо. Состояние системы у[л] восстанавливае- мо, если оно может быть определено по пред- шествующим значениям выходного сигнала x[m], т = п - 1, л - 2, ..., л - к, к < оо. Из второго уравнения системы (1.7.2) следует: х[я] = Ry[«] + Pg[«], (1.7.17) гае х[л] = {х[«] 4«+11 ••• 4» + *-1]}т, Й«1 = {«(”1 «|» + 1)... g[» + fc-i]}T, Я = [ст с7А стЛ2 стЛ*-*]Т, Р= d О стЬ d стА*“2Ь стА*“3Ь О ... О О о ... о о стА*-4Ь ... стЬ d Следовательно, система (1.7.2) наблюдае- ма тогда и только тогда, когда ранг матрицы R равен размерности к пространства состоя- ний. Аналогично можно установить, что сис- тема (1.7.2) восстанавливаема тогда и только тогда, когда ранг матрицы R = [cTA-* етА-(*-,)...етА-1]1 равен размерности к пространства состояний. Систему (1.7.2) называют идентифици- руемой, если для автономной системы у[л + 1] = Ау[л] можно определить матрицу А по результатам измерений выходных координат х|л| = Сту|л1. Пусть система наблюдаема и вектор с из- вестен. Введем вектор состояния в расширен- ном пространстве состояния (см. 1.7.14): г|л] = {у|л] у|л + 1] ... у[л + к - 1]}т. Тоща можно записать: г[л + 1] = Аг[л]; (1.7.18) х|л] = cTAz[n] = стг(л +1], т.е. (ст) *йл] = А4л]. Следовательно, система идентифицируема тогда и только тогда, когда невырождена мат- рица Z[n] = {у[л] Ау[л] ... А* - ^[л]}. (1.7.19) 1.7.3. НЕПРЕРЫВНО-ДИСКРЕТНЫЕ СИСТЕМЫ Уравнения состояния. К дискретным сис- темам, строго говоря, относят любые системы, описываемые разностными уравнениями вида (1.7.2) или (1.7.9). Это могут быть и системы, не содержащие непрерывной части, например, цифровые устройства, дискретные автоматы.
ПО Глава 1.7. МЕТОДЫ ПРОСТРАНСТВА СОСТОЯНИЙ ДЛЯ ДИСКРЕТНЫХ СИСТЕМ Такие системы полностью описываются дис- кретными уравнениями состояния. Для того чтобы отличить системы, содержащие непре- рывную часть и дискретные элементы, в част- ности, импульсные элементы, от систем не содержащих непрерывной части, их называют дискретно-непрерывными. Эти системы рас- сматривались в гл. 1.6. Для них, как показано в п. 1.7.1, также справедливы дискретные уравнения состояния, однако они недостаточ- ны для полного описания движения системы. Так, компоненты вектора состояния у [л] из уравнения (1.7.2) имеют смысл временной последовательности значений переменной у. Поэтому, в частности, начальные значения у[ло] не могут быть выбраны произвольно, так как они должны удовлетворять уравнениям движения непрерывной части системы. На- помним также, что исходное уравнение (1.6.57) получено в гл. 1.6 при нулевых на- чальных условиях. Таким образом, описание непрерывно-дискретной системы в форме, рассмотренной в гл. 1.6, должно быть допол- нено ее описанием в пространстве состояний непрерывной части системы. Рассмотрим разомкнутую дискретную систему простейшего вида, т.е. непрерывную систему, на вход которой подается модулиро- ванная последовательность S-функций (см. рис. 1.6.4). Пусть дифференциальное уравне- ние непрерывной приведенной части имеет вид (О = X т ~ к- 1=0 J=0 (1.7.20) Введем переменную y(t) так, что ^а/У(/>(0 = /('). /=0 7=0 в эквивалентности этих равенств уравнению (1.7.20) нетрудно убедиться с помощью преоб- разователя Лапласа. Вектор состояния непре- рывной системы определяется как у(0 = Lxi(O >1(0 ••• >>к(0Г; yi = у; dt У2’ dt Ук' Справедливы следующие уравнения со- стояния: ^ = Ау + Ь/; х = сту+3/, (1.7.21) dt гае L ак ак ак 3 = Х ак Для заданных начальных условий у(/о) и функции ДО* * состояние у(/) в любой момент времени t > /о может быть найдено с помощью переходной матрицы состояния t У(') = Y(z,zo)y(/O) + f Y(l,x)b/(r)A; (1.7.22) для t = t / T , где Г, как и выше, - период квантования; при = л, / = л + 1 будем иметь: уг[л +1| = еАГуг|л] + л+1 + Т I п Подставляя сюда /^(т) = gptn] 5(т - л) при п < т < п + 1, получим разностное уравне- ние состояний для непрерывно-дискретной сис- темы УтЧ п +1] = еАГуг|л| + 7eA7,bgr|n|, (1.7.23) к которому нужно добавить уравнение для дискретных значений выхода. Если в уравне- нии непрерывной части (1.7.20) т < ку то это уравнение имеет вид хг|и) = сгут-|и].
НЕПРЕРЫВНО-ДИСКРЕТНЫЕ СИСТЕМЫ 111 В случае, если на вход непрерывной час- ти поступают прямоугольные импульсы, т.е. /гСО = ки«т\"}> л 2 ? < л +1, уравнение (1.7.23) примет вид ут[п +1] = е АГу т [и] + л]; (1.7.24) L=-A“'(E-eA7J ЬА;И. При этом в (1.7.20) можно положить m £ < к и уравнение для выходного сигнала запи- шется в виде + (1.7.25) В отличие от рассмотренного в п. 1.7.1 уравнения (1.7.2) состояния дискретной сис- темы здесь вектор состояния уу{л] имеет иной смысл: если в первом случае компонентами вектора состояния были последовательные (во времени) значения переменной состояния, то теперь вектор состояния - это совокупность измеренных в один и тот же момент компо- нент вектора состояния непрерывной системы. Переходная матрица состояний для раз- ностного уравнения непрерывно-дискретной системы определяется из вида его решения. Так, для уравнения состояний (1.7.23) полу- чим г . Ит(п-па) г , уг[л] = е ' ч'ут[ло] + Л-1 . + т=ъ (1.7.26) Таким образом, переходная матрица со- стояний ¥[л,ло] = еА7’('’'"’). При g[n] = 0 состояние системы опреде- ляется как уН»] = У|л, ло] уИло! • При нулевых начальных условиях Лд = 0, УНло] = 0 выражение ХЧл,м]Ь£г[Л1] (1.7.27) т=0 описывает эволюцию системы при заданном воздействии. Для случая (1.7.24) уравнение (1.7.27) примет вид л-1 Ут1л)= (1.7.28) m=0 Свойства в пространстве состояний. Из (1.7.27) следует: у т-i*)=08о; Ъо = {«[*- П«1*-21-«1°1}Т; (1-7.29) Q=[b еАГЬ e^b ... ^ТЬ . Таким образом, система (1.7.23) удовле- творяет условию достижимости, (см. п. 1.7.2) тогда и только тогда, когда ранг матрицы Q равен размерности пространства состояний.. Соответственно для (1.7.24) Q=[l еАГЬ еЛтЪ ... e(*'1)A7L . (1.7.30) Системы (1.7.23), (1.7.24) удовлетворяют условию управляемости тогда и только тогда, когда аналогичное условие выполняется для мат- рицы e"A7*Q. Однако при условии det А # 0 всегда А7* выполняется и det е # 0 и, следовательно, понятия управляемости и достижимости для разомкнутых непрерывно-дискретных систем совпадают. Для непрерывно-дискретной системы, удовлетворяющей условию достижимости, с учетом (1.7.29), (1.7.30) можно записать век- торное разностное уравнение порядка к, ана- логичное (1.7.13) для случая дискретных сис- тем уг[л + Л] = еАПуг[л] + О8;, (1.7.31) где in ={gl*-i+»i...g[n]}T. Это уравнение соответствует системе ^-разностных векторных уравнений первого порядка (т.е. к2 скалярных разностных урав- нений) по аналогии с (1.7.14): г[л+ 1] = Az(n] + QgJ, (1.7.32) где 0 Е 0 .. . о' ’o' 0 0 Е .. . 0 0 А = ; Q = еАП 0 0 .. .. °. Q,
112 Глава 1.7. МЕТОДЫ ПРОСТРАНСТВА СОСТОЯНИЙ ДЛЯ ДИСКРЕТНЫХ СИСТЕМ определяющей описание системы в расширен- ном пространстве состояний z[n) = {у|л] у[л + 1] ... у|л + к - 1]}т. Эту систему можно записать и в форме (1.7.18), т.е. 4 л +1] = еАГг(л] + bgj (1.7.33) (для случая (1.7.27)]. Уравнения (1.7.32), (1.7.33) устанавлива- ют связь между разностным уравнением не- прерывно-дискретной системы в форме (1.7.23), (1.7.24) и ее разностным уравнением состояний как дискретной системы (1.7.2), поскольку расширенный вектор состояния z[h] содержит информацию р компонентах вектора у из (1.7.21) в последовательные мо- менты времени л, п + 1, ..., л + к - 1. Начальные условия в расширенном про- странстве z[ziq] задаются путем определения решений уравнений (1.7.23), (1.7.24) в форме (1.7.26) при л = Ло, Ло + 1, ..., л© + к - 1, после чего может решаться уравнение (1.7.32), обеспечивающее за один шаг определение последовательности векторов у[л], у[л + 1], .... у|л + к - 1]. Рассмотренные уравнения состояния могут быть использованы для определения процессов в непрерывно-дискретных системах не только в дискретные моменты времени t = л, но и в произвольные моменты. Дейст- вительно, полагая в (1.7.22) t = л+е, полу- чим уг[л,е) = еАбГуг[л1 + л+е _ + Т j еА7’<п+Е’’>Ь/г(т)Л = Л xe*‘7’yrW + TeXnbgr['»l, О 2 е < 1. (1.7.34) Аналогично в случае (1.7.24) уг|л,е! = еАеГуг[л] + L(e)gr [л), (1.7.35) где L{e)=-A-1(E-eXn] Ь*и. Таким образом, определив решение в дискретные моменты времени из уравнений состояния (1.7.23), (1.7.24) или (1.7.31) и под- ставив уН«1 в (1.7.34), (1.7.35), можно найти его в произвольный момент времени t = л + е, 0 £ с < 1. Уравнения (1.7.23 - 1.7.25) описывают разомкнутую дискретную систему. При замы- кании системы к этим уравнениям нужно до- бавить уравнение замыкания, например, gl»l = «I»] - = «1«1 - где м[л] - управляющий сигнал. Тогда вместо (1.7.23) и (1.7.24) получим соответственно: уг[л + 1] = е^7’(Е-7Ьст)у7’(л]+ Te^rb4«]; (1.7.36) Ут[« + 1]=(е*7’-1лг)уг[л]+ 1л[л]. (1.7.37) Таким образом, изменяется переходная матрица состояния, а следовательно и условия управляемости и достижимости, которые для замкнутых непрерывно-дискретных систем могут не совпадать. 1.7.4. УСТОЙЧИВОСТЬ ДИСКРЕТНЫХ СИСТЕМ В ПРОСТРАНСТВЕ СОСТОЯНИЙ Введенное в п. 1.7.1 пространство со- стояний позволяет обобщить понятие устойчи- вости и основные теоремы, сформулирован- ные в п. 1.6.5. Пусть линейная дискретная система опи- сывается уравнением состояний у|л + 1] = Ау|л|. (1.7.38) Тривиальное решение у|л| а 0 системы (1.7.38) называют устойчивым по Ляпунову, если для любого сколь угодно малого числа с > 0 существует такое малое число 6(e) > О, что любое решение у[л], для которого в на- чальный момент л = 0 выполняется условие |у(0Ц < • удовлетворяет неравенству ||у(л| < с , начиная с некоторого значения л = N < оо. Тривиальное решение у[л] в 0 называют асимптотически устойчивым, если оно устой- чиво и существует такое число d, что для лю- бого решения у[л], такого, что |у[л| £ d, бу- дет выполняться предельное соотношение: Шп|у|л| = а Л->« Тривиальное решение называют неустой- чивым, если существует такое е > 0, что для любого 8 > 0 найдется момент времени N, при котором, несмотря на соблюдение условия |у( 0|| < » будет выполняться неравенство ЫМ >s.
СВЯЗЬ ВИДА ЧАСТОТНОЙ ХАРАКТЕРИСТИКИ С ПОКАЗАТЕЛЯМИ КАЧЕСТВА ИЗ Исследование устойчивости произволь- ного решения £[л] системы (1.7.38) можно свести к исследованию устойчивости триви- ального решения, если ввести переменную, описывающую отклонение возмущенного дви- жения от невозмущенного х[л] = у[п] - £[л]. Из (1.7.38) следует х[л + 1] = Ах[л], т.е. полученная система разностных уравнений имеет тривиальное решение х[л] = 0, соответ- ствующее у [л] = £[л]. Если это решение ус- тойчиво, или асимптотически устойчиво, то устойчиво, или асимптотически устойчиво решение £[л] системы (1.7.38). Устойчивость линейной системы опреде- ляется собственными значениями матрицы X/ уравнения состояний (1.7.38), т.е. корнями характеристического уравнения системы det(A - ХЕ) = 0. (1.7.39) Теорема об устойчивости линейной дискретной системы. Линейная дискретная система, описываемая уравнением состояний (1.7.38) устойчива, если для всех собственных значений X/ матрицы А выполняется условие |Х/| £ 1, причем равенст- во |Х/| = 1 может иметь место только для про- стых собственных значений. Теорема об асимптотической устойчивости. Линейная дискретная система (1.7.38) устойчива асимптотически, если все собственные значения X/ матрицы А расположены внутри единичного круга, т.е. |Х,|<1. Теорема о неустойчивости. Линейная дискретная система неустойчива, если по крайней мере для одного из собствен- ных значений Ху матрицы А выполняется не- равенство |Ху|> 1, либо |Ху| = 1, но в по- следнем случае, кратность /у собственного зна- чения Ху у > 1. Доказательство этих теорем можно найти в [10, 16]. Они служат обобщением теорем об устойчивости, сформулированных в п. 1.6.6, поскольку в общем случае характер изменения выходного сигнала не позволяет судить о ха- рактере изменения состояния. Для непрерыв- но-дискретных систем, рассмотренных в п. 1.6.6, характеристический многочлен det(A - ХЕ) сов- падает со знаменателем передаточной функции системы, что позволяет рассматри- вать полученные в п. 1.6.5 условия устойчиво- сти в качестве частного случая сформулиро- ванных. При этом условия устойчивости могут быть проверены без перехода в пространство состояний. Для анализа расположения корней харак- теристического многочлена det(A - ХЕ) без определения самих корней могут использо- ваться алгебраический критерий Раусса-Шура и аналог критерия Михайлова для дискретных систем (см. п. 1.6.5). Глава 1.8 СИНТЕЗ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ ЛИНЕЙНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ МЕТОДОМ ЛОГАРИФМИЧЕСКИХ ЧАСТОТНЫХ ХАРАКТЕРИСТИК Задачей синтеза автоматических систем является рациональный выбор вспомогатель- ных элементов, параметров и структуры сис- темы при заданном динамическом описании объекта управления в целях обеспечения за- данных показателей качества системы. Этими показателями являются запасы устойчивости по амплитуде Д£ и фазе Д(р, вид переходного процесса при ступенчатом воздействии (время переходного процесса /л, величина nepepeiy- лирования су, время достижения максималь- ного значения переходного процесса число колебаний переходного процесса и др.), точность системы при заданных входных воз- действиях (порядок астатизма г, допустимое значение максимальной ошибки системы, допустимые значения коэффициентов оши- бок). Удобным практическим методом реше- ния этой задачи, особенно на начальных эта- пах синтеза является метод логарифмических частотных характеристик. 1.8.1. СВЯЗЬ ВИДА ЧАСТОТНОЙ ХАРАКТЕРИСТИКИ С ПОКАЗАТЕЛЯМИ КАЧЕСТВА СИСТЕМЫ Одной из основных оценок качества сис- темы являются запасы ее устойчивости. Для определения запасов устойчивости по виду логарифмических частотных характеристик разомкнутой системы применяют критерий Найквиста. На рис. 1.8.1 приведены логариф- мическая амплитудная (ЛАХ) Lm[fK(/(D)] и фазовая (ФЧХ) (р(ш) частотные характеристи- ки разомкнутой системы. Запас устойчивости по амплитуде AZ определяется на частоте сре- за (точки пересечения ЛАХ линии нулевых децибел) и равен величине превышения фазо- вой характеристикой на этой частоте линии
114 Глава 1.8. СИНТЕЗ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ Рис. 1.8.1. Логарифмические частотные характеристики 180°. Запас устойчивости по фазе Д(р опреде- ляется в точках пересечения ФЧХ линии 180° и равен отклонению в этих точках ЛАХ от линии 0 дБ. Быстродействие системы опреде- ляется значением частоты среза сос и прибли- зительно оценивается величиной л 4л ---<--------> ®с ®с (1.8.1) хде 1ц -время переходного процесса (т.е. вре- мя, за которое реакция системы на единичное ступенчатое воздействие будет отличаться от установившегося состояния не более, чем на 5 %). Переходный процесс в неминимально фазовой системе полностью определяется зна- чением вещественной частотной характеристи- ки Р((&) замкнутой системы. На рис. 1.8.2 приведены зависимости времени переходного процесса /л и величины перерегулирования о от значения Рщах- По этим зависимостям по заданным ст и /п можно определить требуемую частоту среза ЛАХ разомкнутой системы. Для минимально фазовых систем фазовая характе- ристика полностью определяется амплитудной частотной характеристикой. На достаточно протяженном участке наклона асимптотиче- ской частотной характеристики -20 дБ на де- каду (дБ/дек) запаздывание по фазе равно примерно л/2 радиан (или 90°). Отсюда следу- ет, что для получения хороших динамических качеств системы частоте среза должен соответ- ствовать отрезок асимптотической логарифми- ческой амплитудной характеристики, имею- щий наклон 20 дБ/дек, а для обеспечения достаточных запасов устойчивости этот отре- зок должен быть достаточно протяженным в обе стороны от частоты среза. Точность систе- мы определяется ее порядком астатизма, ко- эффициентом усиления и значением ампли- тудной частотной характеристики разомкнутой системы на рабочих частотах, имеющих значе- ние ниже частоты среза. Это объясняется тем, Ряс. 1.8.2. Зависимость времени переходного процесса и перерегулирования от Р—* что передаточная функция замкнутой системы по ошибке определяется выражением а при |Ж(/>)| » 1 (практически Lm[ И^'со)] > > 20 дБ) это равенство можно заменить при- ближенным: (1.8.3) т.е. величина ошибки при подаче на вход сис- темы гармонического сигнала обратно про- порциональна значению амплитудной частот- ной характеристики на рабочей частоте вход- ного сигнала. Логарифмическую амплитудную частотную характеристику условно деляг на три части (рис. 1.8.3). Область низких частот определяет точность системы в установившемся режиме. Область средних частот определяет качество пере- ходного процесса. Область высоких частот прак- тически не влияет на точностные и динамические свойства системы, поэтому логарифмическую амплитудно-частотную характеристику в этой области можно выбирать достаточно произволь- но, руководствуясь требованием простоты реали- зации синтезируемой системы. Желаемые частотные характеристики сис- темы. В минимально фазовых системах фазо- вая частотная характеристика полностью опре- деляется видом амплитудно-частотной харак- теристики. Поэтому в таких системах их син- тез можно восполнять, используя только ам- плитудно-частотные характеристики. Для ре- шения задачи синтеза строится желаемая ам- плитудно-частотная логарифмическая характе- ристика. Желаемой ЛАХ называют такую ам- плитудно-частотную характеристику разомкну- той системы Иж(до), при которой выполня- ются заданные показатели качества замкнутой системы по точности и виду переходного про- цесса.
СВЯЗЬ ВИДА ЧАСТОТНОЙ ХАРАКТЕРИСТИКИ С ПОКАЗАТЕЛЯМИ КАЧЕСТВА 115 Рис. 1.8.3. Области частот логарифмической амплитудной характеристики Требования к точности сис- темы. Требования к точности могут быть заданы по-разному. 1. Заданы частота сор и амплитуда ар за- дающего гармонического воздействия g(f), которое должно быть отработано системой = apSin(o)p/), (1.8.4) и допустимое значение ошибки £доп. Тогда согласно приближенной формуле (1.8.3) зна- чение амплитудной частотной характеристики на частоте сор должно быть |»rOp)| * —• (1.8.5) едоп * 2. Заданы максимальная скорость gmax, максимальное ускорение входного воз- действия и допустимое значение ошибки. В этом случае входное воздействие заменяют эквивалентным гармоническим воздействием вида (1.8.4), где значения' амплитуды ар и частоты сор сигнала рассчитывают по форму- лам: ®р = £ max/8 max > ар ~ &тах/&тах • (1-8.6) При таком выборе обеспечивается дос- тижение максимальных скорости и ускорения входного сигнала, отрабатываемого системой. Значение амплитудной частотной характери- стики на частоте сор определяется неравенст- вом (1.8.5). 3. Задан порядок астатизма системы г и требуется обеспечить слежение за сигналом #(0 ~ &тах^Г • Установившаяся ошибка имеет вид Sycr = c0g(O + qg(O+—+crg(r)(t) = qg^x, (1.8.8) где С/ - коэффициенты ошибок. Так как в сис- теме г-го порядка астатизма коэффициент ошибки cr = 1 / Ку то имеем 8уст = &тах/• (1.8.9) Из формулы (1.8.9) определяется необхо- димый коэффициент усиления системы &гпах/еуст • (1.8.10) По полученным данным строится низко- частотная часть асимптотической желаемой ЛАХ системы. Требования к качеству пе- реходного процесса. По заданным времени переходного процесса /п и величине перерегулирования а (см. рис. 1.8.2) выбира- ется значение частоты среза сос и через точку сос проводится среднечастотная асимптота же- лаемой ЛАХ системы с наклоном -20 дБ/дек, которая продолжается в обе стороны до отклоне- ния AL от линии нулевых децибел на 12 - 16 дБ, значение AL можно выбрать по графику (рис. 1.8.4). Этим обеспечиваются требуемые запасы устойчивости и заданное время переход- ного процесса. Среднечастотная асимптота со- прягается с высокочастотной частью прямой с наклоном 40 или 60 дБ/дек. Высокочастотная часть желаемой ЛАХ не влияет на качество сис- темы и выбирается исходя из вида заданной не- изменяемой части системы, низкочастотная часть ЛАХ которой совпадает с низкочастотной частью желаемой ЛАХ. Таким образом, построение желаемой асимптотической ЛАХ включает следующие этапы: построение низкочастотной части исходя из требований точности; построение среднечастотной части исхо- дя из требований устойчивости и допустимого времени переходного процесса; построение высокочастотной части исхо- дя из вида ЛАХ неизменяемой части; сопряжение низкочастотной и высоко- частотной частей желаемой ЛАХ со среднечас- тотной. Pic. 1.8.4. Замспмосп! значений запасов по амплитуде фазе от величины перерегулирования
116 Глава 1.8. СИНТЕЗ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ Типовые желаемые ЛАХ. Для обеспечения построения желаемой ЛАХ вводят типовые передаточные функции и соответствующие им желаемые ЛАХ. Виды типовых передаточных функций приведены в табл. 1.8.1 [17, 21]. Типовые желаемые ЛАХ для систем с первым порядком астатизма приведены на рис. 1.8.5. Из условия устойчивости желаемые ЛАХ-0 должны иметь первую сопрягающую частоту не ниже частоты среза. ЛАХ-1 - ЛАХ- IV имеют одинаковые значения сопрягающих частот 0)2, ©з и протяженность среднечас- тотного участка h = W3 / (02- Типо вые ЛАХ-1 - ЛАХ- IV для систем со вторым порядком астатизма отличаются тем, что в низкочастотной области имеют асимпто- ту с наклоном только -40 дБ/дек. Запас устой- чивости для ЛАХ систем с астатизмом первого и второго порядков определяется протяженно- стью среднечастотной асимптоты h = W3 / ©2» который, например, можно выбрать из графи- ков, определяющих участки AZj и AL2 (см. рис. 1.8.4). Значение Tj можно выбрать по формуле [21] 1 1 100 + ст ---® с---------------- т, Т, а где Т\ - первая сопрягающая частота желаемой ЛАХ. * ЛАХ-Д, ЛЛХ~2 Pic. 1.8.5. Типовые желаемые ЛАХ
ТИПЫ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ 117 1.8.2. ТИПЫ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ В результате энергетического расчета системы выбирают исполнительный двигатель и проектируют механизм передачи усилия от двигателя к объекту управления (редуктор). Передаточная функция, описывающая дина- мические свойства объекта управления, меха- низма передачи и исполнительного двигателя после энергетического расчета обычно не мо- жет быть изменена проектировщиком системы управления, и поэтому ее называют передаточ- ной функцией неизменяемой части системы, а соответствующую ей ЛАХ - логарифмической частотной характеристикой неизменяемой час- ти. В процессе синтеза в систему вводят до- полнительные динамические звенья, называе- мые корректирующими устройствами, которые должны так деформировать ЛАХ неизменяе- мой части системы, чтобы она приблизилась к желаемой ЛАХ. Этот этап проектирования автоматической системы называют синтезом корректирующих устройств. Различают сле- дующие корректирующие устройства: последо- вательные, параллельные и корректирующие устройства по внешнему воздействию. Последовательные корректирующие уст- ройства. Такие устройства с передаточной функцией Ип(р) включаются в схему последо- вательно неизменяемой части системы (рис. 1.8.6). После введения последовательной кор- рекции передаточная функция разомкнутой системы Ш(р) принимает вид Щр) - WM %(р). (1.8.11) В качестве последовательной коррекции кроме сигнала, пропорционального ошибке, используется производная ошибки (ПД- регулятор), интеграл от ошибки (ПИ-ре- тулятор), производная и интеграл (ПИД- регулятор). Введение производной в цепь ошибки. Этот случай характеризуется передаточной функци- ей последовательного корректирующего уст- ройства вида кг п 1 + "F' k + 1 W„(p) = к + = кv '-----------. п 7р + 1 Тр +1 (1.8.12) Рве. 1.8.6. Схема включения последовательного кор- ректирующего устройства Рис. 1.8.7. Коррекция введением производной по ошибке Как следует из рис. 1.8.7, введение про- изводной расширяет полосу пропускания сис- темы и обеспечивает опережение по фазе в полосе частот ац - ©2» что при правильном подборе параметров корректирующего звена может увеличить запасы устойчивости системы и даже сделать из неустойчивой системы ус- тойчивую. Введение интеграла в цепь ошибки. Опи- сывается передаточной функцией последова- тельного корректирующего устройства вида И'п(Р) = ^±^ = */> + —• (1.8.13) тр тр Из рис. 1.8.8 следует, что при выборе достаточно большого значения т можно с по- мощью интегральной коррекции увеличить наклон низкочастотной части ЛАХ, не изме- няя значение фазы и амплитуды ЛАХ в сред- нечастотной части, т.е. практически не изме- няя запасов устойчивости системы, увеличить порядок астатизма и повысить точность систе- мы. Введение интеграла и производной в цепь ошибки позволяет использовать свойства дифференциальной и интегральной коррекции одновременно. Передаточная функция после-
118 Глава 1.8. СИНТЕЗ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ довательного корректирующего устройства этого типа имеет вид №п(р)=К + Клр+^-. (1.8.14) Возможны и другие более сложные виды последовательных корректирующих устройств. Параллельные корректирующие устройст- ва. Данные корректирующие устройства реали- зуются путем введения в систему дополни- тельных местных обратных связей (рис. 1.8.9). Здесь параллельное корректирующее устройст- во описывается передаточной функцией И^с(р). После введения параллельной коррекции переда- точная функция разомкнутой системы прини- мает вид H'lGO W„(P) i + W'ocGO И'нСр)’ (1.8.15) В случае выполнения неравенств »1 справедлива приближенная формула при |И,ос(»и'нО'»)| « *> ^1(Р) И'ос(Р) При |И'0с(»И,нО)|» L (1.8.16) Практически приближенные формулы считаются верными в полосах частот, где вы- полняются неравенства Lm[ И^У©) И^(/ш)] > > 20 дБ или Lm[ И^с(/й)) И^(/й))] < -20 дБ. В противном случае следует выполнять уточнен- ный расчет на ЭВМ или пользоваться М- но- мограммой. При выполнении неравенства Lm[ И^с(до) И^(до)] > 20 дБ ЛАХ неизменяе- £(t) Рис. 1.8.9. Схема включения параллельного корректирующего устройства Рис. 1.8.10. Пример коррекции ЛАХ путем введения параллельного корректирующего устройства мой части системы практически полностью определяется видом передаточной функции И^с(р) (при неизменной передаточной функ- ции И^(р)). Это позволяет обеспечить требуе- мый вид среднечастотной части логарифмиче- ской амплитудной характеристики разомкну- той системы. На рис. 1.8.10 приведен один из возможных видов передаточной функции па- раллельного корректирующего устройства (при условии выполнения вышеуказанного неравен- ства) при И^(р) = 1. Эта передаточная функ- ция имеет вид И'осО’) = (1-8.17) ар т.е. И'осйО = (1.8.18) Передаточная функция параллельного корректирующего звена типа (1.8.18) может быть реализована путем введения обратных связей от датчиков скорости и ускорения вы- ходного сигнала. Коэффициенты ант выби- рают исходя из вида желаемой ЛАХ системы. При коррекции с передаточной функцией (1.8.18) получаем систему с желаемой ЛАХ нулевого типа. Чтобы перейти к желаемой частотной характеристике второго типа, можно включить последовательно звену с передаточ- ной функцией (1.8.18) звено с передаточной функцией rip / (rip + 1), тогда получим ат1/>2(тр + 1) tiP + 1 (1.8.19) H'oJP) = и в полосе частот, в которой выполняется не- равенство Lm[ И^(/ш) ^^(/w)] > 20 дБ, полу-
ПОРЯДОК СИНТЕЗА КОРРЕКТИРУЮЩИХ УСТРОЙСТВ 119 чим ЛАХ, соответствующую желаемой ЛАХ третьего типа (рис. 1.8.10). Для параллельной коррекции можно применять звенья и с другими передаточными функциями. Корректирующие устройства по внешнему воздействию. Путем введения компенсирую- щих сигналов по внешнему воздействию уда- ется теоретически, при определенных услови- ях, свести к нулю ошибки от внешних воздей- ствий. Это свойство называют инвариантно- стью системы по отношению к внешнему воз- действию. Пусть на вход системы через звено с передаточной функцией И^(р) дополнительно вводится сигнал задающего воздействия (рис. 1.8.11). Тогда имеем следующую передаточную функцию замкнутой системы <18-20) или, переходя к эквивалентной разомкнутой системе, получаем ее передаточную функцию W(nx ^^(PW(P) ЛР) 1-Ф(р) \-w^(p)W(pY (1.8.21) Из выражения (1.8.20) следует, что ха- рактеристическое уравнение системы 1 + W(p) = 0 (1.8.22) при введении компенсирующей связи не ме- няется, т.е. коррекция данного вида не влияет на устойчивость системы. Передаточная функ- ция замкнутой эквивалентной системы по ошибке Выбирая, например, И^(р) = получаем систему, инвариантную к входному воздействию. Однако передаточная функция FH(p), как правило, нереализуема. Но можно обеспечить приближенное равенство в рабочей полосе частот, обеспечив в результате частич- ную инвариантность системы. На практике, как правило, в качестве компенсирующей свя- зи выбирают сигнал по первой (а иногда и по второй) производной входного сигнала, т.е. Рве. 1.8.11. Схема включения корректирующего устрой- ства по внешнему воздействию Рис. 1.8.12. Схема включения инвариантной компенси- рующей связи по внешнему возмущению и;(р) = К\Р + К^. (1.8.24) Введением подобного корректирующего звена можно повысить порядок астатизма сис- темы. Введением компенсирующей связи мож- но обеспечить и инвариантность по отношению к возмущающему сигналу ftf). Для системы, структурная схема которой приведена на рис. 1.8.12, имеем передаточную функцию по от- ношению к возмущающему воздействию ф/0»=*<£) = Z F(P) ^(рУ^рУ-^рУ^рУ] 1 + ^(рУ^2(рУ (1.8.25) Условием полной инвариантности по от- ношению к возмущающему воздействию будет Ч'М = ^з(РУ / ^(Р)- (1.8.26) Комбинированный метод коррекции. При комбинированном методе коррекции исполь- зуется одновременно последовательная, парал- лельная коррекции и коррекция по внешнему воздействию. Может также использоваться любая их комбинация. 1.8.3. ПОРЯДОК СИНТЕЗА КОРРЕКТИРУЮЩИХ УСТРОЙСТВ В НЕПРЕРЫВНОЙ СИСТЕМЕ Из предыдущего следует, что синтез кор- ректирующих устройств следует выполнять в следующем порядке. 1. Построить желаемую асимптотическую логарифмическую амплитудно-частотную ха- рактеристику системы Ьт[1Гж(до)] = 2О18[1Гж(ло)]. 2. Построить асимптотическую ЛАХ не- изменяемой части системы Lm[ Иж(до)], та- ким образом изменив ее коэффициент усиле- ния, чтобы низкочастотная часть ее совпала с низкочастотной частью желаемой ЛАХ.
120 Глава 1.8. СИНТЕЗ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ 3. Путем ввода корректирующих уст- ройств так трансформировать ЛАХ неизменяе- мой части, чтобы она совпала с желаемой ЛАХ. 4. Проверить устойчивость внутреннего контура системы. 5. Путем коррекции асимптотических ЛАХ построить точную ЛАХ системы и соот- ветствующую ей ЛЧХ. После этого уточнить полученные запасы устойчивости системы и ее внутреннего контура. 6. Выполнить анализ синтезированной системы аналитическими методами или моде- лированием на ЭВМ и, если потребуется, уточнить параметры корректирующих уст- ройств. Синтез последовательного корректирую- щего устройства. Для последовательного кор- ректирующего устройства желательно выпол- нение равенства »i(P) = %(Р) ^н(Р), (1.8.27) откуда получаем Wn(p)=W,&)/WM. (1.8.28) Для логарифмических частотных харак- теристик имеем Lm[ И'(до)] = - Ьт[И"н(до)]. (1.8.29) Таким образом, ЛАХ последовательного корректирующего устройства определяется вычитанием ЛАХ неизменяемой части из же- лаемой ЛАХ. Синтез параллельного корректирующего устройства. Рассмотрим структурную схему системы, представленную на рис. 1.8.9. При синтезе параллельной коррекции желательно обеспечить выполнение равенства (Р) =------------------ (1.8.30) l + WOc(p)WH(p)’ l откуда следует, что "н(р) "ж(/0 Вычисление выражения (1.8.31) доста- точно сложно, поэтому часто используют при- ближенный метод. Из выражения (1.8.30) сле- дует, что и'нО) И'жО)» при |И'ж(»И'ос(/о>)| «1, при |И,жОш)И/ос(»|» L На рис. 1.8.10 приведен пример такого приближенного расчета. Сплошной линией показана приведенная к требуемому коэффи- циенту усиления ЛАХ неизменяемой части системы. Линией 6-2-3-4-7-8 показана желае- мая ЛАХ системы. Продолжим асимптоты желаемой ЛАХ влево и вправо от частот со 1 и й)4, как это показано на рис. 1.8.10 штрихпункгирной линией. Линию 1-2-3-4-5 примем за обратную асимптотическую ЛАХ параллельного корректирующего устройства (Р) • Логарифмическую частотную харак- теристику, соответствующую передаточной функции ИосОО Ин(р), найдем, вычитая ЛАХ Lm[ И^(до)] из ЛАХ , т.е. Lm[ И^сСдо) И^Сдо)] = Lm[ И^(до)] - -Lm[»'o’cI0e>)| (1.8.33) ЛАХ, соответствующая Woc(P) ^h(p)> показана на рис. 1.8.10 штриховой линией. Тогда со- гласно приближенному равенству после введе- ния корректирующего звена имеем левее час- тоты ©1 |И/Гж(/й))| « |И/н(/й))| (но по условию приведенная ЛАХ неизменяемой части на низ- ких частотах совпадает с желаемой ЛАХ), пра- вее частоты «4 также справедливо это же нера- венство , но в высокочас- тотной области вид желаемой ЛАХ не влияет практически на динамические свойства систе- мы, и поэтому желаемая ЛАХ может быть вы- брана произвольно. Между частотами coj и й)4 справедливо приближенное неравенство |^ж(»| « т.е. в этой полосе час- тот действительно (1.8.34) Приближение будет грубым в районе частот близких к со j и Ш4, где условие |^н(/<»)И,ос(/и)| »1 не выполняется. На этих частотах следует воспользоваться М-номограммой или выполнить расчеты на ЭВМ. Определение устойчивости внутреннего контура. Нами использовался вариант крите- рия Найквиста для случая устойчивой разомк- нутой системы. Поэтому следует проверить, выполняется ли это условие. С этой целью опять воспользуемся критерием Найквиста. Разомкнутому внутреннему контуру системы соответствует передаточная функция
ПОРЯДОК СИНТЕЗА КОРРЕКТИРУЮЩИХ УСТРОЙСТВ ш Ин(р) Woc(p)' Но ЛАХ для этой передаточной функции (см. рис. 1.8.10) задается формулой WM] = - -Un^O)} Запас устойчивости внутреннего контура по фазе проверяется на частоте со4, соответст- вующей пересечению ЛАХ разомкнутого внут- реннего контура от нулевых децибел. Это можно сделать, построив ЛФХ разомкнутого внутреннего контура в районе частоты <о4. Именно по этой причине разность наклонов ЛАХ Ьт[И^(до)] и в точке их пересечения на частоте <о4 не должна превы- шать -20 дБ/дек (или возможно -40 дБ/дек при условии, что асимптота с разностью на- клонов -20 дБ/дек близка к частоте <о4). Пример 1.8.1. Рассчитать корректирую- щие устройства для автоматической системы по следующим данным: порядок астатизма г = = 1, максимальная скорость слежения gmax = -0,5 рад/с, максимальное ускорение слеже- ния gjnax = 0,2 рад/с2, максимальная ошибка сшах = 0,003 рад, допустимое перерегулирова- ние Яшах = 30 %, допустимое время переход- ного процесса tn < 1,0 с; передаточная функ- ция неизменяемой части системы имеет вид 00 = pfap + ifop^p + l)' где Т\ = 0,33 с; Т2 = 0,010 с; Т3 = 0,001 с. Для расширения полосы пропускания неизменяемой части системы введем последо- вательное корректирующее устройство с пере- даточной функцией ^п(Р) = (74Р+ 1)/(Т5р+ 1), где Т4 = 0,33 с; Т5 = 0,01 с. Логарифмические частотные характери- стики, используемые при синтезе, приведены на рис. 1.8.13. Теперь рассчитаем вид низко- частотной части желаемой ЛАХ исходя из требований точности. Рабочая частота сор = = £max/£max = °»418 с‘*- Модуль передаточной функции разомкнутой системы при со = сор |ифш )1 = -^- = ——-------417 с"1. 1 ' Л «тах^ ОД- 0,003 Рве. 1.8.13. Пример построения ЛАХ и ЛФХ при расчете корректирующих устройств
122 Глава 1.8. СИНТЕЗ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ Построим на рабочей частоте контроль- ную точку Ар = 53 дБ и выше нее, исходя из требования астатизма, проведем низкочастот- ную асимптоту с наклоном -20 дБ/дек. Отсюда получаем коэффициент усиления разомкнутой системы К - 100. Выберем желаемую ЛАХ системы типа I. Исходя из требуемого времени переходного процесса и величины перерегули- рования выберем частоту среза по кривым (см. рис. 1.8.2), получаем <ос = 12 сч. Изломы же- лаемой ЛАХ на частотах ©2 и юз выберем ис- ходя из заданного перерегулирования о = 30 % по кривой, приведенной на рис. 1.8.4, примем AZ2= 8 дБ, «2 = 6 с'1, ALj = 18 дБ, (03 = 100 с1. В высокочастотной области направим желае- мую ЛАХ по ЛАХ соответствующей передаточ- ной функции й^(р)И^(^) (ломанная 1-2-3-4 на рис. 1.8.11). Желаемой ЛАХ соответствует ломаная 1-5-6-7-8. ЛАХ, соответствующую обратной передаточной функции (р) параллельного корректирующего устройства, получим, продолжив среднечастотные асим- птоты желаемой ЛАХ за точки, соответствую- щие частотам Ш] и 003, откуда находим переда- точную функцию параллельного корректи- рующего устройства »;со>) = °.°ip2(^-p+i \(0 з , 0,01р2(0,01р + 1) (о,167 р-н) Для определения устойчивости внутрен- него контура найдем его ЛАХ путем вычита- ния ЛАХ, соответствующей частотной характе- ристике ^^(/и)), из ЛАХ, соответствующей частотной характеристике И^(/(о)^н(А°)- По- лучаем ЛАХ разомкнутого внутреннего конту- ра, которой соответствует штрихпункгирная линия на рис. 1.8.13. После построения ЛФХ для желаемой ЛАХ и ЛАХ разомкнутого внут- реннего контура находим запасы устойчивости системы Д<р = 60° и внутреннего контура Дфв = 45°. ЙК *(z). Для этого выполняется w-преобра- зование по формуле = r*(z)| 1Л* с последующей подстановкой ЙК =/о*, где со* - псевдочастота. По выражению мо- гут быть построены логарифмические ампли- тудою- и фазо-частотные характеристики (ЛАЧХ и ЛФЧХ). Напряду с применением Dz - преобразования для получения ЙК *(z) могут был» использованы и приближенные формулы, позволяющие определить переда- точную функцию дискретной системы непо- средственно по выражению передаточной функции ее непрерывной части. Эти же фор- мулы можно применить и для приближенного вычисления ЛАЧХ и ЛФЧХ дискретных сис- тем, заменяя в них переменную z на е-^ . Благодаря тому, что в низкочастотной области ЛЧХ дискретной разомкнутой системы совпадают с ЛЧХ ее непрерывной части, по- строение ЛЧХ дискретной системы обычно проводят только в высокочастотной области. При этом расчеты могут был» значительно упрощены при использовании приведенных ниже формул: XJS (п\___________юв____________ю в В1 р(1 + Тч+1РУ (1 + Т„р)~ Р ,UUS) i=q+i Пъ2(р) = = (1.8.37) p 1.8.4. СИНТЕЗ ДИСКРЕТНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ С ПОМОЩЬЮ ЛОГАРИФМИЧЕСКИХ ЧАСТОТНЫХ ХАРАКТЕРИСТИК Построение логарифмических частотных характеристик. Логарифмическая частотная характеристика дискретной системы может был» получена по ее передаточной функции Wrtip) = __________fflB p[Tj2P2 +2^ + 1) (1.8.38)
СИНТЕЗ ДИСКРЕТНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ 123 гае Tq + 1, Tq + 2, ...» Тп - постоянные време- ни, для которых сопрягающие частоты больше 2/Т0. С использованием таблицы Dz - преоб- разования для системы с экстраполятором нулевого порядка (см. табл. 1.6.2) для этих выражений получим: (1.8.39) л л или, учитывая, что и при /=д+1 /=д+1 Т Tt< < То / 2 cth « 1, имеем 2Т0 где 1 + rf2 + 2г/cos f—г\ Т2_______________ZLIZlI. J э - Т I i г l + d2 -2dcos-£'- ' Т\ l + d2 + 2dcos^-- t2=______________ l + d2 - 2d cos Ti -4§^-fl-</2 +2Wsin^0 711 Tjp (1.8.41) т<? = т^+1+...+тя2 +тд+1т^+2+...+ + Tg+2Tg+i+... или приближенно / м2 (1.8.42) Желаемые частотные характеристики дис- кретной системы. Как и для непрерывной сис- темы, точность дискретной системы определя- ется низкочастотной частью желаемой ЛАХ. Поэтому в силу совпадения ЛАХ непрерывной и дискретной систем на низких частотах низ- кочастотная часть желаемой ЛАХ дискретной системы может быть выбрана так же, как и для непрерывной системы. Допустимое значение периода дискретности Tq, обеспечивающее заданную величину ошибки появляющейся между замыканиями ключа, можно определить
124 Глава 1.8. СИНТЕЗ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ по формулам [22]: для системы первого по- рядка астатизма То £ (1.8.45) 1 &max для системы второго порядка астатизма I Зен г° ъ— I б max Запас устойчивости определяет вид час- тотных характеристик в области средних и высоких частот. Как и для непрерывных сис- тем, запасы устойчивости дискретной системы определяет протяженность участка ЛАХ с на- клоном -20 дБ/дек, пересекающего ось нуля децибел. Для дискретных систем заданное пере- регулирование ст может был» обеспечено, если выполнены два условия [22]: 1) сумма сопрягающих частот, меньших частоты среза (ос, удовлетворяет неравенству (1.8.47) 2) сумма постоянных времени, соответст- вующих сопрягающим частотам, большим частоты среза (ос «<ос, удовлетворяет нера- венству (1.8.46) То 1 1004-сг у л -^- + Т£ S — — > С1-8-48) 2 <ос 200 +ст где ст = 100 % (М - 1); 7) и v постоянные времени сомножителей соответственно знаме- нателя и числителя передаточной функции; = £ Tj . 7=^+1 При решении задач синтеза дискретных систем целесообразно использовать типовые желаемые ЛАХ, построенные для псевдочасто- ты <о* [22]. В табл. 1.8.2 приведены типовые передаточные функции и соответствующие им ЛАХ. 1.8.2. Типовые передаточные функции дискретной и непрерывной систем Тнп Передаточная функция ЛАХ дискретной системы непрерывной системы (Г/ < То / 2) II
СИНТЕЗ ДИСКРЕТНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ 125 Продолжение табл. 1.8.2 Тип ЛАХ дискретной системы Передаточная функция непрерывной системы (7} < Го/2) *(' + т1/>) р2П(т'*>+1) /=3 Ряс. 1.8.14. Схема введения коррекции в дискретной системе с помощью непрерывного корректирующего устройства Различие между типовыми ЛАХ для дис- кретных систем наблюдается только в низко- частотной области, поэтому переходные про- цессы для одних и тех же значений перерегу- • лирования ст и частоты среза сос будут для всех типов ЛАХ практически одинаковыми, за исключением времени окончания переходного процесса. Поэтому для оценки качества пере- ходного процесса можно воспользоваться нормированными графиками переходных про- цессов, построенными для ЛАХ типа III при постоянном значении Те (например, 0). Дискретная передаточная функция ра- зомкнутой системы может быть получена из ее частотной характеристики заменой (1-8 49) /о Z + 1 гае z = . Например, для желаемой ЛАХ типа III при Те = 0 она имеет вид 2 k IqJ (1.8.50) Синтез корректирующих устройств дис- кретных систем. Возможности дискретной кор- рекции шире, чем в непрерывных системах. Для коррекции дискретных систем можно использовать все способы коррекции непре- рывных систем, а также новые способы. Как и для непрерывных систем, под коррекцией дискретных систем понимают такое изменение структуры и параметров системы, при котором частотная характеристика неизменяемой части системы приближается к желаемой. Непрерывная коррекция заключается во ведении в непрерывную часть системы после- довательного и параллельного корректирую- щих устройств непрерывного типа (рис. 1.8.14) и выполняется аналогично синтезу корректи- рующих устройств непрерывных систем при- ближением ЛАХ непрерывной части системы к желаемой ЛАХ непрерывной части (см. табл. 1.8.2). Дискретная коррекция выполняется с помощью дискретных корректирующих уст- ройств (рис. 1.8.15). Передаточные функции разомкнутой системы для последовательного корректирующего устройства (рис. 1.8.15, а) имеют вид »'*(z) = <(z)»'h’(z); (1.8.51)
126 Глава 1.8. СИНТЕЗ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ f) Рве. 1.8.15. Схема введешя коррекцжж в дискретно* снсгеме с помощью дискретного корректирующего устройства Рис. 1.8.16. Схема введения коррекции в дискретно* сисгеме.путем введения компенсирующего сигнала для параллельного корректирующего устройст- ва (рис. 1.8.15, б) Г*(х) =-----У"'Z) ;----. (1-8.52) I + ^ocCz^hCz) Синтез дискретных корректирующих устройств удобно восполнять с помощью же- лаемых ЛАХ дискретной системы для псевдо- частоты (см. табл. 1.8.2), используя те же методы расчета, что и для непрерывных систем (см. п. 1.8.6). Коррекция с помощью введения кванто- вания по времени основывается на изменении эквивалентных постоянных времени и показа- телей колебательности непрерывной части системы при квантовании сигналов по време- ни, что следует из выражений (1.8.39) - (1.8.44). Путем надлежащего выбора частоты квантования можно повысить запасы устойчи- вости системы. Коррекция с введением компенсирую- щих сигналов также может осуществляться в дискретной системе. Структурная схема систе- мы с такой коррекцией приведена на рис. 1.8.16. Передаточная функция такой системы имеет вид ф«,) = »<n(z)>rH,(z) + )r;(z))rH,(z) l + ^n’Cz^Z) (1.8.53) а передаточная функция по ошибке Фё(г) = 1-ф’(г) = i + ^n’Cz)^)’ (1.8.54) откуда следует условие инвариантности систе- мы ^k(Z) = K~'(Z). (1.8.55) Расчет дискретных систем с комбиниро- ванным управлением можно вести методами, описанными для непрерывных систем. Ис- пользование комбинированного управления позволяет формировать желаемую ЛАХ основ- ного канала системы с меньшим коэффициен- том усиления, следовательно и меньшей часто- той среза, что позволяет снизить требуемую частоту квантования сигнала по времени. Пример 1.8.2. Выполнить синтез непре- рывного корректирующего устройства для
СИНТЕЗ ДИСКРЕТНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ 127 дискретной системы по следующим данным: требуемый порядок астатизма г = 1, макси- мальная скорость входного сигнала gmax. = = 0,3 рад/с, максимальное ускорение gmax. = =0,09 рад/с2, максимальная допустимая ошиб- ка &тах = 0,005 рад; допустимая величина перерегулирования о = 30 %; период дискрет- ности сигнала по времени Tq = 0,08 с; время переходного процесса £ 1 с, передаточная функция непрерывной неизменяемой части системы имеет вид ^н0>) = / , , 4-----------г, где 7\ = 0,125 с, £ = 0,5. Левее частоты среза <вс ЛАХ дискретной системы совпадает с ЛАХ ее непрерывной части, а псевдочастота со* с частотой о, поэто- му желаемую ЛАХ в этом диапазоне частот можно выбирать так же, как и для непрерыв- ной системы. Из выражений (1.8.5) и (1.8.6) находим рабочую частоту (йр и модуль частот- ной характеристики разомкнутой части систе- мы при со = (Ор имеем ®р = Ф33*- = 03 рад/с, &тах К(л°р)|* - в™ =200 с-‘. & max Б max По этим данным иа рис. 1.8.17 построена контрольная точка А*. По табл. 1.8.2 выбираем желаемую ЛАХ второго типа. Желаемую ЛАХ проводим выше точки А*. Частоту среза <вс выбираем из требуемого времени переходного процесса Ап*» и величине перерегулирования по графику (см. рис. 1.8.2), получаем <вс = = 10 с*1. Через проводим асимптоту с на- клоном -20 дБ/дек. В низкочастотной области желаемая частотная характеристика системы (линия 1-2-6-7 иа рис. 1.8.17) имеет вид где К — 200 с"1; 1\ = 5 с; tj = 0,3 с. Для получения заданного переретулиро- вания необходимо, чтобы выполнялось нера- венство (1.8.47): 1__1_ (В pg+ 100 П ’ Г/ а 130 т.е. 3-0,02 <10--- 30 требуемое условие выполнено. Необходимое значение общего коэффициента усиления К = = 200 с*1. Для обеспечения заданного показа- теля колебательности в высокочастотной об- ласти должно выполняться неравенство (1.8.48). Отсюда получаем допустимое значе- ние для суммы постоянных времени, имею- щих значение, меньшее 1 / (йс: riS2.M0=±»=0(07 L vc 200 2000 с. Lm Рис. 1.8.17. Пример построения частотных характеристик при синтезе непрерывного корректирующего устройства в дискретной системе
128 Глава 1.8. СИНТЕЗ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ В высокочастотной области при <ос > > 2 / Tq = 25 желаемую ЛАХ направим по ЛАХ неизменяемой части (с приведением к требуемому коэффициенту усиления), получим передаточную функцию желаемой ЛАХ во всем диапазоне частот (см. рис. 1.8.20, лома- ная 1-2-6-7-4) ***mto= 7^ = 7^ = 667 С’' &max v,UU1j примем К = 1000. Построим ЛАХ неизменяе- мой части системы в низкочастотном диапазо- не псевдочастот, совпадающую с ЛАХ для не- прерывной системы: ) И'ннО’) = . ./ . . V----------rr-f уш 1О,5усо + iM 0,06уш +1) ще — = — = 0,025 с . При таком значении ©4 40 -— требование Те = 0,05 с < 0,07 с выполня- сь ется. ЛАХ нескорректированной системы на рис. 1.8.22 соответствует линии 1-2-3-7-4. За обратную передаточную функцию параллель- ного корректирующего устройства (как и для непрерывной системы) примем ломаную 5-2- 6-7-8, которой соответствует передаточная функция ^oc(P) = 21 1 р —р+1 Vй 4 25<т,/> + 1) />2(0,025р + 1) 25(03р + 1) На рис. 1.8.17 приведены также ЛЯХ, со- ответствующие желаемой передаточной функ- ции и передаточной функции разомкнутого внутреннего контура, из которых следует, что запасы устойчивости по фазе соответственно Дер = 50°, Дср1 = 40°. Пример 1.8.3. Рассчитать передаточную функцию дискретного корректирующего уст- ройства для системы, непрерывная неизме- няемая часть которой имеет передаточную функцию вида ^н(Р) = -I------^7-------г, p(0,5P + ty0fl6p + l) скорректированная система должна удовлетво- рять следующим требованиям: ошибка, при линейном входном воздействии с максималь- ной скоростью (Ощах = 1 рад/с не должна пре- вышать 0,0015 рад, время переходного процес- са должно быть меньше = 1 с при пере- регулировании о £ 40 %; запас устойчивости системы по фазе должен быть не менее 40°; период квантования сигналов по времени То = = 0,01 с. Необходимый минимальный коэффици- ент усиления системы согласно выражению (1.8.10) со* £ 2 / То = 200 с-1. Для построения этой ЛАХ в области вы- соких псевдочастот воспользуемся выражением (1.8.43), получаем <о^1- 0,005уш *)(1 + 0,00285уш*) х х(1-О,ОО285у<о*| <о* > 200 с 1. Отсюда следует вид ЛАХ неизменяемой части дискретной системы во всем диапазоне псевдочастот (с требуемым коэффициентом усиления) »Ф>’) = 1000(1 - 0,005уш*)(1 + 0,00285уш*) х у’ш *(о,5 ую * + 1^0,06 yto * +1) х (1 - O,OO285y<o*j Соответствующие логарифмические частот- ные характеристики для дискретной неизменяе- мой части системы приведены на рис. 1.8.18 (ломаная линия 1-2-8-9-10-11-12). Исходя из требуемой точности и времени переходного про- цесса выберем желаемую ЛАХ для непрерывной системы типа I (см. табл. 1.8.2) с частотой среза сос =10 с’1 и сопрягающими частотами 1 / Т\ = = 0,04 с'1; 1/xi = 2 с’1; 1/Т2 = 40с-1; 1/Т3 =
СИНТЕЗ ДИСКРЕТНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ 129 Рис. 1.8.18. Пример построения ЛЧХ при синтезе дискретного корректирующего устройства = оо и коэффициентом усиления К = 1000 с1. Этой ЛАХ соответствует передаточная функция w 1000(03р + 1) р(25р + 1)(0,025р +1) Для построения желаемой ЛАХ в области низких псевдочастот со* « со < 2/ Tq = 200 с*1 используем ЛАХ непрерывной части системы w ил__________1OOO(°.S> + 1) ж W - >(25> + ^0 025> + ,) > откуда согласно табл. 1.6.1 и формуле (1.8.42) получаем для дискретной системы ЗД = 4,44958(z - 0,980211)(0,007955 + г) * (z - l)(z - 0,67032)(z - 0,99960) х (z + 0,8810614) После перехода к псевдочастоте по формуле z = (1 +ХТо/2)/(1 -ХТ0/2) имеем ^ж(>’) = 1(Юо(1 - 0,005/о *^1 + 0,00031648/0 *) х > *(25 /со * + 1)(1 + 0,025332/о *) х (1 + 0,5/о*) Логарифмические амплитудная и фазовая частотные характеристики системы для этой частотной характеристики приведены на рис. 1.8.18 (ломаная 1-2-4-5-6-7). Обратную час- тотную характеристику параллельного коррек- тирующего устройства определим по тому же методу, что и для непрерывной системы, ей соответствует асимптотическая ЛАХ, обозна- ченная ломанной 13-2-3-4-5-7, / (0’025/° * + О v ' 4010,5/о + 1111 + 0,00015/0 I или при коррекции по скорости / ,4 /о *0,025/О *+ 1) w°c(> ) = -1----. . V----------——+Г• ' ’ 40|о,5/о +1М1+ 0,00015/о ) 5 Зак 1023
130 Глава 1.9. МЕТОД СИНТЕЗА ЛИНЕЙНЫХ СИСТЕМ После подстановки Jm* = 200(z - l)/(z + 1) получаем передаточную функцию дискретного корректирующего устройства ^ос(2) = 0,2883784г2 - 0,4806306z + 0J922522 Z2 - 3,845048 • 10" 2 z - 0,9230991 Следовательно, разностное уравнение, которое должно быть реализовано на ЭВМ для вычисления сигнала дискретной параллельной коррекции по скорости, имеет вид Цсор1^^Ы ~ 0,038405i/KOp[(£ - 1) 7q] + + 0,923099wKOp[(* - 2) То] + +0,2788378 x[/fTo] - - 0,480361 х[(Х-1)Т0] + - 0,192252 х[(Х -2)Т0]. Глава 1.9 МЕТОД СИНТЕЗА ЛИНЕЙНЫХ СИСТЕМ ПО ЗАДАННЫМ СОБСТВЕННЫМ ЗНАЧЕНИЯМ МАТРИЦЫ СИСТЕМЫ Собственные значения матрицы А систе- мы х = Ах + Ви (19.1) определяют ее динамические свойства в пере- ходном режиме, так как вид переходного про- цесса (для простых собственных значений) определяется выражением хп(Г) = + С2еХ2'+...+Сяех< (1.9.2) где X/ - собственные значения матрицы систе- мы (/ = 1, 2, ..., л). 1.9.1. СИНТЕЗ ЗАКОНА УПРАВЛЕНИЯ Системы с одним входом. Рассмотрим объект управления, описываемый дифферен- циальным уравнением вида x = Ax + bu(/), (19.3) где А - матрица системы размера п х п\ х - вектор переменных состояния размера п х 1; Ь - вектор управления размера п х 1; u(Z) - скалярное управляющее воздействие. Пусть управляющее воздействие является линейной функцией от переменных состоя- ния, т.е. U = -1х, (1.9.4) где I - вектор размера 1 х /. Тоща уравнение (1.9.3) примет вид х = (А-Ы)х. (1.9.5) Собственные числа матрицы А - Ы , яв- ляющиеся корнями характеристического урав- нения системы (1.9.5), находят из алгебраиче- ского уравнения det(XE - А + Ы) = 0. (1.9.6) Если желаемое положение, корней X/ (/’ = 1, ..., п) на комплексной плоскости зада- но, то по формуле Виета можно найти значе- ния коэффициентов а, характеристического уравнения а&п + -1 + ... + ап = 0. (1.9.7) Приравнивая коэффициенты при одина- ковых степенях X в выражениях (1.9.7) и (1.9.6), получим п алгебраических уравнений для определения п неизвестных коэффициен- тов // (/ = 1, 2, ..., п) обратных связей, при которых обеспечивается заданное значение корней характеристического уравнения (1.9.6). Доказано [2], что система из п алгебраических уравнений для определения коэффициентов // всегда имеет единственное решение, если сис- тема (1.9.3) полностью управляема. Пример 1.9.1. Найти закон управления для следящей системы, структурная схема ис- полнительного устройства которой представ- лена на рис. 1.9.1. Здесь и - входное управ- ляющее воздействие; JQ — а - угол поворота исполнительного вала; х2= а - частота вра- щения исполнительного вала; = /я - сила тока в якоре исполнительного двигателя по- стоянного тока; Мъ - возмущающий мо- мент. Желаемые значения собственных значе- ний матрицы замкнутой системы Xj = -2,5 + + >7100-6^5 ; Х2 = -2,5 -J<J100-625 ; Х3 = = -200. Управляющим сигналом является на- пряжение и на якоре исполнительного двига- теля. Приведенной структурной схеме соответ- ствует система дифференциальных уравнений вида Х1 =х2;
СИНТЕЗ ЗАКОНА УПРАВЛЕНИЯ 131 Ряс. 1.9.1. Структурная схема нсполшггелыюго устройства Х2 = 0Дх3 + 0,005Мв; D(k) = det(XE - А + BL) = х3 = -8ОООХ2 - 204х3 + 204м. Значения матриц А и В для этой системы X -1 = det 0 X 0 -ОД 200/1 8000 + 200/2 X + 204 + 200/3 200 Выясним, управляема ли Для этого вычислим ранг [в » АВ » А2В]. Имеем система, матрицы гапк[в > АВ j А2в] = ' 0 0 20,0 = rank 0 20,0 -4080 = 3, 204 -40800 8123200 так как det[B > АВ ! А2В| # а Рассматриваемая нами система управляема, следовательно, с помощью соответствующего выбора элементов матрицы обратных связей L — [Zi h 'з1 собственные значения матрицы А - BL можно сделать равными любым напе- ред заданным числам. Характеристическое уравнение для заданных собственных значений матрицы А - BL имеет вид D(k) = (X - М) (X - Хз) (X - Х3) = = X3 + 205Х2 + 1100Х + 20 000. Общий вид D(k) ДЛЯ ПРОИЗВОЛЬНЫХ /1, /2 и /3 задается выражением = X3 + (204 + 200/3)Х2 + (800 + 20/г)Х + + 20,0/1. Приравнивая значения коэффициентов при одинаковых степенях в выражениях най- денного и желаемого характеристических уравнений имеем /3 = 1 / 200; /2 = 15,0; = 1000,0. Закон управления системой имеет вид и = -(1000,00X1 + 15,00X2 + 0,005х3). Матрица замкнутой системы 0 0 А = -200000 1 0 о ОД -11000 - 205 Структурная схема построенной системы приведена на рис. 1.9.2. Задача синтеза регуля- тора с заданным расположением собственных значений его матрицы А решена. Системы со миогими входами. Объект управления со многими входами описывается уравнением х = Ах + Ви, (1.9.8) где х и А имеют тот же смысл, что и в п. 1.9.2; В - матрица управления размера п х т\ и - вектор управления размера т х 1. Будем считать, что система (1.9.8) явля- ется полностью управляемой. Пусть координа- ты вектора управления являются линейными функциями переменных состояния, т.е. зада- ются выражением 5*
132 Глава 1.9. МЕТОД СИНТЕЗА ЛИНЕЙНЫХ СИСТЕМ U = -Lx, (1.9.9) гае L - матрица обратных связей размера т х х п. Поставим задачи синтеза модального управления следующим образом: найти такие значения коэффициентов обратных связей (т.е. элементов матрицы L), чтобы корни характег ристического уравнения замкнутой системы x = (A-BL)x (1.9.10) имели заданные значения Xi, Ха- рактеристическое уравнение для замкнутой системы имеет вид det(XE - А + BL) = аоХл + а\№ ~1 + ... + ап = 0, (1.9.11) гае коэффициенты До, ау ..., ап могут быть найдены из известных значений корней Xj, Х2, ..., Хл по теореме Виета. Приравнивая численные величины ко- эффициентов Oq, ..., ап, вычисленные по за- данным собственным значениям матрицы А - - BL, к их выражениям, зависящим от эле- ментов матрицы L, получим систему уравне- ний, из которых находим требуемые значения коэффициентов обратных связей 1д от у-й пе- ременной состояния к Z-й координате управ- ления. В отличие от скалярного управления, в данном случае число уравнений меньше, чем число неизвестных, и ряд коэффициентов обратных связей можно назначать произволь- но исходя из возможной физической реализа- ции. 1.9.2. МЕТОДЫ ВЫЧИСЛЕНИЯ КОЭФФИЦИЕНТОВ ОБРАТНЫХ СВЯЗЕЙ В СИСТЕМАХ СО МНОГИМИ ВХОДАМИ Если система (1.9.1) имеет нескольких входов, то управление (1.9.4) имеет вид (1.9.9), гае неизвестная матрица обратных связей L имеет т - строк и л - столбцов, т.е. содержит т х п элементов. Из условия равенства коэф- фициентов характеристического многочлена имеем л уравнений. Таким образом, из л уравнений нужно определить т х л неизвест- ных. Лишние (т - 1) х л неизвестных можно назначить произвольно или на значения эле- ментов матрицы L наложить (т - 1) х л до- полнительных условий. Эти условия могут быть различными. Мультипликативное представление матри- цы коэффициентов обратных связей. Напишем матрицу L в виде произведения вектора- столбца г размера т х 1 на вектор-строку q размера 1 х л (т.е. имеем л + т неизвестных) L = rq. (1.9.12) В этом случае уравнение для определе- ния собственных значений А - BL замкнутой системы имеет вид det(XE - А + Brq) = 0, (1.9.13) или det(XE - А + bq) = 0, (1.9.14) где b = Вг - вектор размера л х 1. Уравнение (1.9.14) соответствует разомкнутой системе с одним входом
МЕТОДЫ ВЫЧИСЛЕНИЯ КОЭФФИЦИЕНТОВ ОБРАТНЫХ СВЯЗЕЙ 133 х = Ax+bq. (1.9.15) Значение вектора г произвольно, необхо- димо только обеспечение условия полной управляемости, т.е. rankjb • Ab • An-1bj = п. (1.9.16) Таким образом, для синтеза управления в сис- теме со многими входами необходимо: выбрать вектор г размера т х 1. Этот выбор определяет глубину обратных связей по каждому входу. Если подача сигналов на ка- кой-либо вход системы нежелательна, то соот- ветствующие т координат вектора г можно положить равными нулю (полученная система с вектором управления Ь = Вг должна быть полностью управляемой, т.е. критерий (1.9.16) должен соблюдаться); найти элементы матрицы q так же, как для системы с одним входом (см. п. 1.9.2); вычислить матрицу коэффициентов об- ратных связей. Введение обратных связей по входу, соот- ветствующему одному столбцу матрицы управле- ний. Если выбранный у-й столбец by матрицы управления В соответствует полностью управ- ляемой системе, т.е. rankfb • Ab • An-1b| = л, то, положив обратные связи по остальным входам равными нулю, можно рассчитать мат- рицу коэффициентов обратных связей L. Обеспечение пропорциональности элемен- тов строк матрицы BL.'Если в матрице BL обеспечить линейную зависимость строк, то путем умножения строк этой матрицы на по- стоянные числа и сложения результатов (что не изменяет значения определителя матрицы) матрицу ХЕ - А + BL можно привести к ви- ду, когда элементы 1у матрицы коэффициентов расположены лишь в одной строке. В этом случае в выражение det(XE - А + BL) неиз- вестные 1у входят лишь линейно, т.е. для вы- числения коэффициентов обратных связей получаем систему линейных уравнений. Приведение матрицы системы к диаго- нальному виду. Известно [16}, что всякую мат- рицу А с помощью невырожденного линей- ного преобразования, задаваемого матрицей Т, можно привести к Жордановой форме, т.е. если в уравнении х = Ах+Ви (1.9.17) положим х — Tz, где Т - некоторая невырож- денная матрица, то получим z = T"1A’I^ + T"1Bu. (1.9.18) Можно всегда найти такую матрицу Т, что J = Т-1АТ имеет вид Ji: о ;...; о • ... • ... ' о • о г... • (1.9.19) где J/ - есть клетки Жордана вида II *4* X, 1 ... о‘ 0 X/ ... 0 0 0 ... X/ • Здесь X/ - есть собственное значение матрицы А, причем собственные значения матриц А и Т-1АТ одни и те же. Таким образом, получаем к независимых линейных дифференциальных уравнений вида: Zi = XZi +Z2 +£11^1 + ^2и2+---+^1жиж^ Z2 = kZ2 +Z3 +^1«1 +^2и2+-"+^жиж^ Zr = kZr +ЬпЩ + br2U2 +.. •+Ьтит* (1.9.20) где by - элементы матрицы Т-1В. Для каждого уравнения системы (1.9.20) можно найти такие обратные связи вида = -(/yiZl + IjlZl + ••• + /jrZr), j = 1, 2...m, (1.9.21) что матрица полученного нового линейного дифференциального уравнения будет иметь любые наперед заданные собственные числа. Таким образом, для каждой клетки Жордана задачу можно решать, автономно. В том случае, когда собственное значение X матрицы А простое, то клетке Жордана со- ответствует одно дифференциальное уравнение первого порядка вида Ъ = (1.9.22) Если требуемое значение собственного значения есть X/, то управление по желаемо- му расположению корней характеристического уравнения замкнутой системы имеет вид
134 Глава 1.9. МЕТОД СИНТЕЗА ЛИНЕЙНЫХ СИСТЕМ X/ — X* =------~ — Zt. ьи (1.9.23) Следовательно, если требуется изменить только одно собственное значение матрицы А, то (в случае простых собственных значений) уравнение (1.9.17) с помощью невырожден- ного линейного преобразования х = Tz нужно привести к диагональному виду, а затем по выражению (1.9.23) вычислить требуемое управление. Затем с помощью обратного пре- образования х = T-1z найти управление в зависимости от значений переменных состоя- ния Xj — X/ ~ Uj=--,-~-L±Jlkxk. (1.9.24) bij к=\ При управлении (1.9.24) изменится лишь одно собственное значение матрицы замкну- той системы, а остальные останутся неизмен- ными. Аналогичные выражения можно полу- чить и для кратных собственных значений, например, для клетки Жордана второго по- рядка имеем Z/ = Х/г/ +Zt+i + bgUj; (1.9.25)- Z/+i = X/Z/+1 Если желаемые величины собственных значений матрицы системы после замыкания обратных связей равны Xj и Х2 » то’ выбирая управление «/=-(//*/+ //+1^ + 1), (1.9.26) имеем = (Х/ - bylfjzi +(1 - fy6+i)*/+b (1.9.27) Ъ+1 =-^/+ijto +(^/ -bt+ijh+ifa+i- Отсюда получаем выражение для характери- стического уравнения D(X) = X2 +^/+ijZ/+i + btjh - 2Х/)х + + [х2 -Х/^7/ +?/+iZ/+i + Af+1,//)]. (1.9.28) Приравнивая коэффициенты при одина- ковых степенях X/ полученного выражения и выражения для желаемых собственных значе- ний получаем систему уравнений для опреде- ления неизвестных коэффициентов обратных связей byh + bt+ijl^i = 2Х/ - Xi - Х2; (1.9.29) (?/+1 - X/d^k - X/?/+1j//+i = XjX2 - X2. В результате имеем Z1 = [х? - ХУ(Х! - Х2) + ; Z2 = [Цх, + k2)btj - У^Ьу - XjX2/ty + + 2X/?/+ij +Х2)д/+1уУ?/21 у . Последовательно перемещая собственные значения матрицы системы в желаемые поло- жения, можно итерационным путем решить задачу желаемого размещения полюсов систе- мы. Обеспечение минимальной зависимости желаемых значений полюсов системы от возму- щений, вызванных отклонением значений эле- ментов матриц А и В от номинальных. Для за- данных одномерной или многомерной систе- мы (1.9.1) и желаемого расположения полюсов замкнутой системы рассчитывается матрица L коэффициентов обратных связей такая, что система в замкнутом состоянии при u = -Lx имеет желаемые полюса. Другими словами, собственные значения матрицы А - BL замк- нутой системы должны быть равны желаемым полюсам системы (с точностью до порядка следования). Для системы с несколькими вхо- дами применяется алгоритм, описанный в работе Kautsky, J. and N. К. Nichols, "Robust Pole Assignment in Linear State Feedback," Int. J. Control, 41 (1985), pp. 1129 - 1155. Этот алго- ритм использует дополнительные степени сво- боды для того, чтобы найти решение, мини- мизирующее чувствительность значений полю- сов замкнутой системы к возмущениям эле- ментов матриц А и В (т.е. отклонениям их значений от номинальных). Таким образом, применение данного алгоритма обеспечивает малую зависимость решения задачи из-за от- клонения исходных данных от номинальных значений и весьма полезно при численных расчетах. Данный алгоритм рекомендуется применять и для систем с одним входом. При решении задач высокого порядка некоторое желаемое размещение полюсов системы может потребовать очень больших значений коэффи- циентов обратных связей. Проблемы чувстви- тельности, связанные с большими значениями коэффициентов обратных связей, требуют
УПРАВЛЕНИЕ НУЛЯМИ И КОЭФФИЦИЕНТАМИ УСИЛЕНИЯ 135 особого внимания при назначении желаемых значений полюсов системы. В работе Laub, А. J. and М. Wette, Algorithms and Software for Pole Assignment and Observers, UCRL-15646 Rev. 1, EE Dept., Univ, of Calif., Santa Barbara, CA, Sept. 1984 изложены результаты числен- ного тестирования задачи. Этот алгоритм можно использовать также и для расчета коэффициентов обратных связей наблюдателя при оценивании вектора пере- менных состояния многомерной системы по- сле транспонирования матрицы А и замены матрицы В на С1* (см. 1.11). Алгоритм приме- ним как к непрерывным, так и к дискретным системам. Пример 1.9.2. Выбрать коэффициенты обратной связи для системы управления двух- звенным манипулятором с двумя управляю- щими воздействиями, описываемой системой дифференциальных уравнений вида Х1 =х2; Х2 = -4X2 + 4х4 + 200«i - 200M2J *3 = х4; Х4 = 4х2 “ 6х4 - 200Ui + 300l/2- Желаемые величины собственных значе- ний матрицы замкнутой системы: Х^ = Х2 = = -10; Х3 = Х4 = -1ОО. Для заданного примера матрицы А и В имеют вид: Из условия Aj = А — BLj = получаем L1 0 10 0 0 -100 о о 0 0 0 1 0 0 0 -100 0 1,48 0 1 0 1 0 0,98 На втором этапе выбираем матрицу об- ратных связей из условия равенства собствен- ных значений первой подсистемы Xj = -10; Х2 = -100. Синтез первой подсистемы выполняем на втором этапе из условия 0 1 0 0 -1000 -по 0 0 А2 = Ai - BL2 = 0 0 0 1 0 0 0 -100 В результате получаем L2 = 15 0,06 10 0,04 0 О' 0 0 Третий этап заключается в синтезе зако- на управления для подсистемы х3, Хд. Из ус- ловия 0 10 0 0-404 0 0 0 1 0 4 0 -6 0 0 200 - 200 0 0 - 200 300 Характеристическое уравнение для за- данных значений корней замкнутой системы имеет вид А 3 = А2- BL3 0 1 0 0 -1000 - -100 0 0 0 0 0 1 0 0 -1000 -110 получаем L3 = 'о 0 -° 0 10 од' 10 од • Окончательно имеем D(k) = X4 + 0,22Х3 + 0,141X2 + 0,00022Х + + 0,000001. Вычислим требуемые значения элементов матрицы обратных связей L. На первом этапе синтеза вычислим об- ратные связи из условия развязки систем с координатами Xi, х2 и х$, х± Выбираем L = Lj -Ь L2 L3 = 15 10 1,54 10 1Д 1,04 10 1,08 т 61 62 Аз 64 u = -Ljx = - LZ21 *22 *23 *24 J 1.9.3. УПРАВЛЕНИЕ НУЛЯМИ И КОЭФФИЦИЕНТАМИ УСИЛЕНИЯ В ЗАМКНУТОЙ СИСТЕМЕ Корни характеристического уравнения (собственные значения матрицы системы по- люса передаточной функции) определяют вид переходных процессов в системе. Результат приложения к системе внешних воздействий
136 Глава 1.9. МЕТОД СИНТЕЗА ЛИНЕЙНЫХ СИСТЕМ определяется не только полюсами, но и нуля- ми соответствующей передаточной функции. Так, для того чтобы внешние воздействия не влияли на систему (система была инвариант- ной к данному внешнему воздействию), нужно обеспечить равенство нулю передаточной функции по этому воздействию. Если внешнее воздействие описывается функцией типа многочлен, то чтобы ошибка системы в уста- новившемся режиме была равна нулю, переда- точная функция по ошибке по отношению к этому воздействию должна иметь нуль в нача- ле координат кратности на единицу выше сте- пени многочлена (система должна обладать свойством астатизма). Таким образом, для обеспечения выполнения системой заданных свойств необходимо управлять размещением не только полюсов, но и нулей передаточной функции. Пусть система описывается векторным линейным дифференциальным уравнением х = Ах+Ви, (1.9.31) а заданное положение собственных значений матрицы А (корней характеристического урав- нения) обеспечивается путем введения обрат- ных связей с матрицей L, кроме того, в закон управления введем слагаемое, пропорциональ- ное входному воздействию g, т.е. U = -Lx + Mg, (1.9.32) ' где М есть матрица размера т х I коэффици- ентов при входном воздействии; g - вектор размера / х 1 скалярных входных воздействий. В этом случае уравнение, описывающее динамику замкнутой системы, принимает вид х = (А - BL)x+ Mg. (1.9.33) Так как матрица М не входит в матрицу А - BL замкнутой системы, то значения ее элементов не влияют на корни ее характери- стического уравнения. Преобразуем уравнение (1.9.33) по Лап- ласу, получим (рис. 1.9.3) Х(р) = (рЕ - А + BL)-1MG(p). (1.9.34) Матрица передаточных функций системы в соответствии с правилом обращения матриц записывается в виде W(p) = (рЕ - А + BL)“1М = М, (1.9.35) где D(p) = det(pE - А + BL), Н(р) - матри- ца размера п х л, составленная из многочле- нов - алгебраических дополнений матрицы рЕ - А + BL. Из выражения (1.9.35) следует, что мат- рица М не влияет на расположение полюсов передаточной функции, но определяет поло- жение ее нулей. Вычислим передаточную функцию от j’-ro входа системы до /-го ее выхода 1 п = -Щр) Е <L9-36> Многочлены можно представить в виде Hik&) = Ьикр* -1 + h^kP^ ’2 + + ... + hnik. (1.9.37) где коэффициенты h\fa kith ^nik опреде- лены после выбора желаемых собственных значений матрицы А - BL. Таким образом, многочлены, располо- женные в числителе выражения (1.9.36), име- ют вид ₽1//РЛ1 +₽2//РЛ~2+-•+₽«// = п п = ^JhikmkjPr'ik +^Ь21кГПуРПа~2+' -+ к=\ *=1 + ^hnlkmkj' (1.9.38) к=\ Рис. 1.93. Структурная схема системы при управлении нулями передаточной функции
УПРАВЛЕНИЕ НУЛЯМИ И КОЭФФИЦИЕНТАМИ УСИЛЕНИЯ 137 Значения коэффициентов ...» можно вычислить по заданным нулям переда- точной функции с помощью формул Виета. Теперь, приравнивая коэффициенты при одинаковых степенях переменной р, вели- чины элементов j-ro столбца матрицы М можно вычислить, решая систему из п алгеб- раических линейных уравнений hri\mv + + ... + = pwy, j = 1, 2.../; г = 1, 2..п. (1.9.39) Аналогично можно вычислить и элемен- ты других столбцов матрицы Н. Если матрица = Нг является выро- жденной, то система уравнений (1.9.39) не имеет решения. В этом случае необходимо изменить требуемые значения корней характе- ристического уравнения матрицы А - BL и нулей желаемой передаточной функции так, чтобы обеспечить det(Hr) # 0. Если число входных сигналов равно т размерности вектора управления и, то матрица М является квадратной размера т х т. В том случае, когда матрица М является, кроме того, невырожденной, от разомкнутой системы можно перейти к эквивалентной ей замкнутой системе (рис. 1.9.4) х = Ах + BM^g - M^Lx). (1.9.40) Система может быть сделана замкнутой относительно части компенсирующих сигналов ту если число входных сигналов г больше размерности вектора управляющих сигналов и если в матрице М существует минор порядка ту не равный нулю. Из сказанного следует, что для синтеза замкнутой системы с заданным расположени- ем нулей и полюсов передаточной функции необходимо: рассчитать матрицу обратных связей L, при которой обеспечивается требуемое распо- ложение полюсов замкнутой системы; рассчитать столбцы матрицы М компен- сирующего сигнала по управляющему воздей- ствию; если матрица М квадратная и det(M) # 0 (в случае равенства числа входных и управ- ляющих воздействий), то перейти к эквива- лентной замкнутой системе (1.9.40). Пример 1.9.3. Рассчитать коэффициент усиления в следящей системе, рассмотренной в п. 1.9.2. В системе требуется обеспечить ас- татизм первого порядка по отношению к управляющему воздействию и астатизм вто- рого порядка к возмущению. Выходным сиг- налом является переменная Хр Дифференциальное уравнение объекта управления имеет вид *1 = х2; х2 = ОД%з 4- 0,0005Л/в; ХЗ = -8000х2 - 204хз 4- 2001/р После замыкания обратных связей мето- дом, рассмотренным в примере 1.9.2, получа- ем дифференциальное уравнение замкнутой системы Xi =х2; х2 = OJX3 4- 0,0005g2 4- 0,0005А/в; Хз = -200000X1 ~ 11000х2 - 205Хз 4- 200мр Собственные значения матрицы полу- ченной замкнутой системы А-! = -2,5 + >793,75; Х2 = -2,5->793,75; = -200. Полагая U\ = m\g\ + т^2 и преобразуя уравнение системы по Лапласу, получим рХ1(р) - Х2(р) = 0; рХ2(р) - олХ3(р) = 0,0005 С?г(/>) + + 0,0005Л/в(р); Рис, 1.9.4. Эшмле|гпш1 структурны схем, замкнуто* системы
138 Глава 1.9. МЕТОД СИНТЕЗА ЛИНЕЙНЫХ СИСТЕМ Рис. 1.9.5. Структурные схемы синтезированных систем: а - по разомкнутой схеме; б - по замкнутой схеме 200 000X10») + 11 000Х2(р) + + (205 + р)Ху(р) = 2QQm\G\(p) + + 200т2Сг2(Р), откуда xt(p) = Так как в передаточной функции по от- ношению к возмущающему воздействию име- ется ноль первого порядка, то система облада- ет астатизмом по отношению к возмущению Л/в. Чтобы обеспечить астатизм второго по- рядка по отношению к возмущающему воз- действию, положим 20т\ t X “з--------2------4------------<?1 (Р) + р5 + 205/Г +11 ОООр + 200000 20ш2 _ . ч “5--------г-------(?) + / +205/Г +11 000Р + 200000 р(205 4-/>)р,0005 м р3 4-205р2 4-11 000/> 4-200000 В Для того чтобы система обладала аста- тизмом по отношению к управляющему воз- действию, необходимо, чтобы в передаточной функции замкнутой системы по отношению к управляющему воздействию коэффициенты многочленов при нулевой степени переменной р были одинаковы, т.е. 20mj = 20 000, откуда т\ = 1000. (?2(р) = - 0,0005 20т2 рМъ(р), тогда получим *1(Р) = 200000 _ . . —з------2----------------^1 + р3 + 205р2 + UOOO/J +200000 0,1025/>2 1Z , ч “Ч--------S~-------------------Л/ в (р) • р3 + 205р2 + ИОООр + 200000 Требуемые показатели качества системы обеспечены. Структурные схемы синтезиро- ванных следящих систем приведены на рис. 1.9.5.
УПРАВЛЕНИЕ ПРИ ИНТЕГРАЛЬНЫХ ОБРАТНЫХ СВЯЗЯХ 139 1.9.4. УПРАВЛЕНИЕ ПРИ ИНТЕГРАЛЬНЫХ ОБРАТНЫХ СВЯЗЯХ Астатическое регулирование обеспечива- ют введением в цепь обратной связи, соеди- няющей регулируемую координату с точкой приложения внешнего воздействия интегри- рующего звена. Рассмотрим полностью управляемую сис- тему х = Ах + Ви(0, (1.9.41) где А, В - постоянные размера п х п и п х т матрицы; х - вектор переменных состояния размера л х 1; и(/) - вектор управления раз- мера т х 1. В системе требуется обеспечить астатизм по г переменным состояния. В рабо- тах [1, 5] доказано, что эта задача разрешима в случае, когда г £ т. Введем в рассмотрение вектор z размера г х 1, определяемый уравне- нием Z = Тх, (1.9.42) me Т - постоянная матрица размера г х л, формируемая из строк единичной матрицы Е размера л х л, определяемых переменными состояния О* = 1» 2, ..., г), для которых должно быть обеспечено астатическое регули- рование. Объединим (1.9.41) и (1.9.42) в одно уравнение x = Ax + Bu(f), (1.9.43) где - вектор состояния и соответствующие матри- цы расширенного объекта. Будем искать регу- лятор для расширенного объекта в виде х(0 i(7) u(/) = -[L0C |ЬИ] (1.9.44) Тогда уравнение замкнутой системы бу- дет иметь вид x = (A-B[Loc !Ьи])х = Ах, (1.9.45) где матрица системы А имеет вид А А - BL0C j - BL}| —Y"—1—0— (1.9.46) В работе [13] доказано, что для того что- бы поместить корни характеристического уравнения замкнутой системы в заданные по- ложения, необходимо и достаточно, чтобы расширенная система (1.9.45) была полностью управляемой и матрица Ьи имела бы ранг г. Пусть система с матрицей А имеет собст- венные значения Xi, Тогда, как это следует из выражения (1.9.43), матрица А бу- дет иметь собственные значения X}, Х2, ..., Хл, О, 0, ..., 0. Пусть желаемые значения собствен- ных значений матрицы замкнутой системы (1.9.43) равны Хь Х2, Хл, Хл + ь Хл + г Представим вектор управления в виде суммы u(0 = Ui(0 + и2(0- (1.9.47) С помощью управления U} перемещаем л собственных значений матрицы А, а с помо- щью управления U2 перемещаем собственные значения матрицы А, равные нулю. Вектор Ui(0 будем определять из уравнения Uj = -[L ; о] х(/), (1.9.48) где матрица L имеет размер т х г. Если под- ставить (1.9.47) и (1.9.48) в уравнение (1.9.43), то получим х = AiX + Ви2(0, (1.9.49) где (1.9.50) Характеристическое уравнение для мат- рицы (1.9.50) имеет вид det(XEn - А + BL) det(XEr) = 0, (1.9.51) т.е. управление Щ изменяет только собствен- ные значения матрицы А. Матрицу L, с по- мощью которой решается эта задача, можно найти с помощью описанных выше методов. Управление 112» сдвигающее г нулевых собственных значений матрицы расширенной системы, задается выражением [13] и2(0 = L„T(A - BL)”1 ; L„] х(/). (1.9.52) Объединяя соотношения (1.9.48) и (1.9.52), находим выражение для искомого управления u(/) = -[b - L„T(A - BL)”1 ! L„ ]x(0. (1.9.53) Матрица Ljj коэффициентов интеграль- ных обратных связей определяется по формуле I* = №(H№)-1D, (1.9.54)
140 Глава 1.9. МЕТОД СИНТЕЗА ЛИНЕЙНЫХ СИСТЕМ Рис. 1.9.6. Структурная схема синтезированной системы гае Н = Т(А - BL) 1В; (1.9.55) D - любая матрица размера г х г, г собствен- ных значений которой равны желаемым собст- венным значениям замкнутой системы. Пример 1.9.4. Найти закон управления для следящей системы, рассмотренной в при- мере 1.9.2, причем требуется обеспечить аста- тизм второго порядка по отношению к управ- ляющему воздействию замкнутой системы.' Желаемые положения корней замкнутой сис- темы Н = -Т(А - BL) *В = = -[1 О 0] 11 200 1,0 0 205 20000 0 - 1 0,1 20000 0 х 0 X о о 200 = +0,001. Pl = -2^+>7w5; Р2 = -2Л - j ^93,75; Из выражения (1.9.54) имеем РЗ = -200; р4 = -5. Введем дополнительную переменную со- стояния Z = Хр Тоща уравнение расширенной системы будет иметь вид *1 = х2; х2 = ОД*з; ХЗ = -8000х2 - 204хз + 200м; х4 =хР Матрица L для изменения собственных значений матрицы А найдена в примере 1.9.2, L = [1000 55 0,0051. Выберем матрицу D = - 5 (в нашем примере это скаляр). Так как астатизм вводит- ся по координате Хр то матрица Т имеет вид Т = (1 0 О]. Тогаа согласно (1.9.55) I* = HT(HHT)-1D = 5000. Окончательно в соответствии с выраже- нием (1.9.53) получаем u(0 = [Ь - LHT(A - BL)’1 ; Ьи х(/) = = -[775 3,75 -0,02 5000] *1 х2 х3 *4. Структурная схема системы приведена на рис. 1.9.6. 1.9.5. УПРАВЛЕНИЕ ПО ЗАДАННЫМ ЗНАЧЕНИЯМ МАТРИЦЫ СИСТЕМЫ ДЛЯ ДИСКРЕТНЫХ ЛИНЕЙНЫХ СИСТЕМ Дискретная линейная стационарная сис- тема описывается векторным уравнением х[£ + 1] = Ах[£] + Ви[£]. (1.9.56)
УПРАВЛЕНИЕ ПО ЗАДАННЫМ ЗНАЧЕНИЯМ МАТРИЦЫ СИСТЕМЫ 141 Так же, как и для непрерывной системы, мо- дальное управление здесь заключается в пере- мещении собственных значений матрицы сис- темы А размера л х л в заданные положения путем введения линейных обратных связей вида и[Лг] = -Lx[Ar], (1.9.57) гае элементы матрицы L размера т х л есть коэффициенты обратных связей. Собственные значения матрицы А - BL замкнутой системы х[Аг + 1] = (А - BL)x|Ar] (1.9.58) после выполнения синтеза системы по задан- ному расположению полюсов будут равны желаемым величинам. Методы решения задачи определения управления для дискретной системы абсолют- но идентичны изложенным выше методам для непрерывной системы. Пример 1.9.5. Найти закон управления для дискретной автоматической системы (рис. 1.9.7). Разностные уравнения, описывающие динамику объекта управления, имеют вид: *1[Аг + 1] = Xi[Ar] + 0,0461х2| Аг] + + 2,05 IO 5 х3|Аг] + 9,65 • 10 5 и]Аг]; х2|Аг + 1] = 0,835аг2[Аг] + + 4,18 • 10-4х3[Аг] + 4,11 • IO 31/[Аг]; х3|Аг + 1] = -33,42X2]Аг] - - 166,Зх3]Аг] + 8,35 • Ю1 и[Аг]. Желаемые значения собственных значе- ний матрицы замкнутой системы равны Z1 = = 0,8; Z2 = 0,7; Z3 = 0,6. Значения матриц А и В системы 1 0,0461 0 0,835 0 -33,42 2,05 • 10' 5 4,18 10"4 -166,6 ; в = 9,65 • 10"5 4Д110"3 8,35-10"1 Выясним, управляема ли данная система. Для этого вычислим ранг матрицы управляе- мости rank!В ; АВ ; А2в] = 3, т.е. данная система управляема. Характеристи- ческий многочлен для заданных собственных значений имеет вид D(z) = (z - Zi) (z - Z2) (z - Z3) = = Z3 - 2,lz2 + l,46z - 0,336. Общий вид характеристического много- члена замкнутой системы для произвольных значений матрицы L коэффициентов обратных связей задается выражением Z -1 + 9,65-Ю’5 Zj D(z) = det(zE - А + BL) = det 4,11-10’^ 835-10’1 Zi -0,0461-9,65-10’5 Z2 Z-0,835 + 4,1 l-Ю’3 Z2 33,42 +8,35-Ю"1 Z2 - 2,05-10’5 +9,65-10’5Z3 - 4,18-Ю’4 + 4,1HO"3Z3 Z +166,6 + 835-10-1Z3 = Z3 + (164,75 + 0,000iZi + 0,0041Z2 + 0,835Z3)z2 + (- 0,3048 + 0,0162Zj + 0,681Z2 - l,669Z3)z + + (139,097 + 0,018^ -0,6851Z2 +0,8346Z3). Рис. 1.9.7. Структурная схема исходной системы
142 Глава 1.10. УПРАВЛЕНИЕ ЛИНЕЙНЫМ ОБЪЕКТОМ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ Рис. 1.9.8. Структурная схема синтезированной системы Приравнивая значения коэффициентов при одинаковых степенях переменной z ис- ходном и желаемом в характеристических многочленах находим коэффициенты обрат- ных связей 4 = 0,6968; /2 = -39,66; /3 = - 199,6. Структурная схема синтезированной сис- темы приведена на рис. 1.9.8. Глава 1.10 УПРАВЛЕНИЕ ЛИНЕЙНЫМ ОБЪЕКТОМ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ КАЧЕСТВА 1.10.1. ВИД КРИТЕРИЯ КАЧЕСТВА СИСТЕМЫ За общее выражение критерия качества примем интеграл от квадратичных форм пере- менных состояния и управляющих воздейст- вий вида Т J(T) = |[хт(Г) Ф(Г) х(Г) + ит(Г) Т(Г) ll(f)pf + zo + хт(Т)Фтх(Т), (1.10.1) где х(1) - вектор размера п х 1 переменных со- стояния системы; и(/) - вектор размера m х 1 управляющих сигналов; Ф(/)» Фт - положи- тельно определенные матрицы размера весо- вых коэффициентов при переменных состоя- ния; Т(/) - неотрицательно определенная мат- рица весовых коэффициентов при управляю- щих сигналах. Весовые коэффициенты учитывают вели- чину вклада каждого слагаемого в значение критерия качества. Выбор весовых коэффици- ентов является самостоятельной сложной зада- чей и обычно назначается исходя из физиче- ских соображений и затем уточняется путем последовательного решения задачи оптимиза- ции итерационным путем. Весовые коэффици- енты имеют такие размерности, которые обес- печивают одинаковую размерность каждого слагаемого в критерии качества. Задача синтеза управления заключается в определении управления и = и[х(/)1 в линей- ной системе, описываемой дифференциаль- ным уравнением вида х = А(/)х + B(/)u(0, (1.10.2) где А(0 -матрица системы размера п х п\ В(0 - матрица управлений размера m х п. 1.10.2. СИНТЕЗ ЗАКОНА УПРАВЛЕНИЯ Пусть объект, описываемый уравнением (1.10.2), является полностью управляемым и требуется найти оптимальное управление, ми- нимизирующее критерий качества (1.10.1). При выполнении ограничений, наложенных выше на матрицы А(/), В(/), Ф(0, Фт и ^(0, существует положительно определенное реше- ние К(/) матричного дифференциального уравнения вида -^ = Ат(/)К + КА(0 + Ф(/)- at - КВ(г)Т -1 (г)Вт (/)К, (1.10.3) для которого выполняется граничное условие К(7) = Фт. (1.10.4) Докажем это положение. Запишем очевидное равенство
ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЯ РИККАТИ 143 хт(Т) Фтх(Т) = хт(Т) К(Т) х(Т) = = хт(/0)К(/0)х(/0) + Г + /^[хТ(ПК(Ох(о]л = *о = хт(/0)К(/0)х(/0) + + J хт (t) К(г) х(0 + хт (0 х(0 + 'oL + хт(ОК(Ох(о]л. (1.10.5) Подставив в полученное выражение зна- чения х(/) и К(Г) из уравнений (1.10.2) и (1.10.3), получим хт(Т) Фтх(Г) = хт (Г0) К(Г0) х(/0) + т + ||хт(о[ат(Г)К(Г)+ К(/)А(Г) - *о -АТ(Г)К(Г)-К(Г)А(Г)-Ф(Г) + + К(/)В(Г)Ч'"1(Г)Вт(/)К(/)]х(/) + + ит(0Вт(Г)К(Г)х(П + + хт(Г) К(Г) B(/)u(/)|<ft = Г = J|хт(/)[-Ф(П +К(/)В(/)Т-1(/)Вт(/)К(/)] X *0 xx(r) + uT(/)BT(/)K(/)x(r) + + хт(Г) К(Г) В(Г)и(Г)|л. (1.10.6) В результате можем записать /(/) = хт(Т)Фтх(Т)+ Т + J JxT (0 Ф(/)х(/) + ит (0 Т-1 (/)и(Ор/ = h = ХТ(ГО)К(ГО)Х(ГО) + т + J[u(n +т-1(0Вт(0К(г)х(п]ТТ(0 X h X Ju(O + T"1 (r)BT (0 К(Г)х(Г)]л. (1.10.7) Так как матрицы Фт, Т(/) и К(/о) явля- ются положительно определенными, то функ- ционал качества принимает минимальное зна- чение при и(/) = ВЧ/) К(/) х(/) = = -L0) х(/), (1.Ю.8) гае Ц/) = Т-1(/) ВТ(/) К(/). (1.Ю.9) Таким образом, для определения опти- мального управления, минимизирующего кри- терий качества (1.10.1) в системе (1.10.2), не- обходимо: решить матричное дифференциальное уравнение типа Риккати (1.10.3) с граничным условием (1.10.4); найти закон оптимального управления из выражения (1.10.8); вычислить значение критерия качества по формуле /(7) = K(Jq) x(fo). (1.10.10) В результате синтеза получаем линейную оптимальную систему х = |а(/) - B(/)'F-1(0BT(0K(0]x. (1.10.11) 1.10.3. ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЯ РИККАТИ Решение уравнения Риккати может быть выполнено путем численного интегрирования на ЭВМ. Однако если, например, собственные значения матрицы А в стационарном уравне- нии объекта управления (1.10.2) значительно отличаются, то для этого потребуется большое машинное время. Поэтому обычно для полу- чения решения уравнения (1.10.1) используют различные итерационные методы. Решение уравнения Риккагш методом заме- ны переменных. Если известно одно частное решение К}(/) уравнения (1.10.3), то путем замены переменных уравнение Риккати можно привести к линейному матричному уравне- нию. Введем новую переменную К(0 = Kt(/) + R-*(0- (1.Ю.12) Подставив выражение (1.10.12) в уравне- ние (1.10.3), получим - К, (Г) - R1 = К1(0 А(0 + АТ(Г) К1(0 + + Ф(0 - К1(0 В(0 т-1(/) №(/) К1(/) + + R * А(/) + АТ(Г) R1 - - R-* В(1) Т-1(/) Ki(0 - - К10) В(/) T-Ц/) R-». (1.10.13) Учитывая, что матрица Kj(/) есть решение уравнения (1.10.3) и выражение для производной
144 Глава 1.10. УПРАВЛЕНИЕ ЛИНЕЙНЫМ ОБЪЕКТОМ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ обратной функции R 1 = -R 1RR 1, имеем R = [A(/)-B(/) т-1(/) вт(0 KK0JR + + R [А(0 - В(0 т-ЧО ВТ(О KjMF. (1.10.14) Граничное условие для уравнения (1.10.14) принимает вид R(0 = (К(/> - Решение уравнения (1.10.14) можно вы- числить любым численным методом, а функ- цию К\ можно, например, найти как постоян- ную матрицу путем решения алгебраического уравнения Риккати методом, описанным в п. 1.10.5. Решение уравнения Риккати методом Нью- тона-Рафсона. Запишем линейное дифферен- циальное уравнение, соответствующее диффе- ренциальному уравнению (1.10.3) типа Рикка- ти, К/+1 +К/+1 [А(0 - В(0 т-1(/) В*(/) КАО] + + [А(0 - В(0 т-1(/) №(/) КАОГ К/ +1 + + Ф(/) + к,0) В(/) т-1(/) в*(/) кхо = о, / = 1, 2................ (1.10.16) Если матрица А(/) - В(/)'Г'1(/)Вг(/)К1(0 соответствует однородному линейному асим- птотически устойчивому дифференциальному уравнению х = [А(/)-В(/) Т-1(0 Вг(/) КК/)] х, (1.10.17) то последовательность матриц Кх(/)» Кг(/)» —, К//), ... сходится к решению дифференциаль- ного уравнения (1.10.3) типа Риккати, а по- следовательность управлений, задаваемых формулой u/О = -т-1(0 №(/) КХО х(0, (1.10.18) сходится к оптимальному управлению. В каче- стве начального приближения Кх(/) может быть выбрана, например, постоянная матрица кко = фт. Решение уравнений (1.10.3) или (1.10.16) удобно выполнять в обратном време- ни т, выполнив замену t = Т - т. 1.10.4. УПРАВЛЕНИЕ СТАЦИОНАРНОЙ ЛИНЕЙНОЙ СИСТЕМОЙ В УСТАНОВИВШЕМСЯ РЕЖИМЕ Пусть в уравнении (1.10.2) матрицы А и В постоянны, т.е. х = Ах + Ви(Г). (1.10.19) Положив Г = оо, критерии качества (1.10.1) представим в виде J = |[хт(/)Фх(/) + uT(O'Pu(Op#, о • (1.10.20) где Ф и Т - постоянные, соответственно, по- ложительно и неотрицательно определенные матрицы. Справедливы следующие утверждения [Ц: если система (1.10.19) является полно- стью управляемой, то решение уравнения Риккати (1.10.3) при t -> оо сходится к посто- янной положительно определенной матрице К при любом граничном условии; матрицу К можно найти из решения ал- гебраического уравнения КА + АТК + Ф - КВТ-^К = 0, (1.10.21) называемого матричным алгебраическим урав- нением типа Риккати; оптимальное управление по критерию качества (1.10.20) задается выражением u = -Lx = -T’iBTKx. (1.10.22) Оптимальная система в этом случае явля- ется стационарной и описывается уравнением X = (A-BL)x. (1.10.23) Рассмотрим несколько методов решения алгебраического уравнения Риккати (1.10.21). Сведение алгебраического уравнения к дифференциальному. Поставим в соответствие алгебраическому уравнению (1.10.21) диффе- ренциальное уравнение типа Риккати (1.10.3). Тогда, согласно свойствам стационарного дифференциального уравнения Риккати, его решение при t —> оо будет стремиться к реше- нию алгебраического уравнения (1.10.21). Метод Ньютона-Рафсона. Наряду с урав- нением (1.10.21) рассмотрим разностное урав- нение К(+) (А - ВТ'ПРК/) + (А - ВЧ'-’ВгК/)тК/+1 + + Ф + К/ В т1 Вт К/ = 0. (1.10.24) Если все собственные значения матрицы А - ВТ-ДОК] отрицательны, то последова-
УПРАВЛЕНИЕ СТАЦИОНАРНОЙ ЛИНЕЙНОЙ СИСТЕМОЙ 145 тельность решений уравнения (1.10.24) Кь К2, К/, ... , (1.10.25) гае Kj - положительно определенная симмет- ричная матрица, стремится к матрице К - ре- шению уравнения (1.10.21) [1]. Начальное приближение Ki может быть получено, на- пример, методом, рассмотренным в гл. 1.9. Вследствие симметрии матричное урав- нение (1.10.24) имеет п(п + 1) / 2 неизвест- ных и его можно свести к векторному линей- ному алгебраическому уравнению вида А,К,+1 = -Ф(. Матрица А размера п(п + 1) / 2 х п(п + + 1) / 2 имеет вид А 1л А 2л А«1 ••• где Ajy есть блочные матрицы размера (п - к + + 1) х (п - / + 1), элементы которых aki(j,m) определяются по формулам: при / = ку к = 1, 2, ..., л-1 ^ак,nt+fc-b т = 1,2,...,я - к + 1, _ \акк +aJ+k-l, J+k-l aJ+k-l, m+k-l при m = j при m j, j = 2, 3...n - к + 1; m = 1, 2...n - к + 1; аллО» 0 = 2^лл» при к = 1, 2,..., п - 1; / = к + 1, к + 2,..., п - I «и(7.'") = 0- J = 1, 2..../ - к; т = 1, 2...п - / + I; аи(/- Л + 1,т) = а*, т = 1, 2, ..., п - / + 1; 0 при т* j - / + к а и при т = j - 1 + ку J = l- k + 2, 1-к + З, ..., п - к + 1; т = 1, 2, ..., п - /+ 1; ejtoU 1) = о, / = 1, 2,.... п - к-, a^n-k + l, \) = акп-, при / = 1, 2,..., п - 1; к = / + 1, / + 2,..., п - 1 SkiU,m)=0, т = 1, 2....к - /; j = 1, 2, ..., п - к + 1; {2О1-/ при j = 1 aj+/i при j#l, J = 1, 2...n - к + 1; я n при у = « + л-/ ' jo при j*m + k-l, m=k-l+2, k-l+3............n - I + 1; j = 1, 2...n - к + 1; а*/(1, m)= 0. m = 1, 2...n - /; n — I + 1) = 2ащ. Каждой симметричной квадратной матрице типа Ф = [Ф>] размера п х п ставится в соответствие вектор Ф = [ф/] размера п(п+ 1)/2 х 1, где / = = (т - 1)(2/1 - т) / 2 + у, К/+1 есть такой вектор, соответствующий матрице K/+j, а Фу - вектор, соответствующий матрице Ф + + К/ В Т-1 В1* К/, матрица А/ соответствует матрице А - В Т-1 Вт К/. Пример 1.10.1. Дифференциальное урав- нение, описывающее динамику системы, име- ет вид jq = 0,005х2; х2 = 10х3 + 64х4; (1.10.26) Хз = -150х2 - 400х3 + 500о; х4 = -0,7x4. Определить закон управления, минимизи- рующий критерий качества J = J J108X^ (Г) + 10x2(0 + 10x2(0 + oL + 10х4(0 + «2(о]л.
146 Глава 1.10. УПРАВЛЕНИЕ ЛИНЕЙНЫМ ОБЪЕКТОМ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ Значение матриц А, В, Ф и ? в уравне- ниях (1.10.19), (1.10.20) для нашего примера будут: *0 0,005 0 0 0 0 10 64 " 0 -150 - 400 0 0 0 0 -0,7 О о 500 О В = ю8 0 0 0 ф= 0 10 0 0 ; Т = 1. 0 0 10 0 0 0 0 10 Решая уравнение Риккати (1.10.21) мето- дом Ньютона-Рафсона на ЭВМ, получаем 1,26 Ю3 3,3 103 20 1,26 3,3 103 2,13 1,25 10-2 6,76 2,0 1,25 10"2 5 -10—3 4Д4 10-2 1,26 10-3 6,76 4,14 10-2 3,09 • 102 Оптимальный закон управления задается выражением (1.10.22), где матрица коэффици- ентов обратных связей L = Т-,ВтК = [1000 6,25 225 20,7]. 1.10.5. МЕТОДЫ ОПРЕДЕЛЕНИЯ ЗАКОНА УПРАВЛЕНИЯ БЕЗ РЕШЕНИЯ УРАВНЕНИЯ РИККАТИ Рассмотрим некоторые методы определе- ния оптимального управления, в которых не требуется решать уравнения Риккати. Метод приравнивания коэффиц иентов ха- рактеристических уравнений. Рассмотрим метод вычисления матрицы L в оптимальном законе управления для стационарной линейной сис- темы (1.10.19) со скалярным управлением Т для критерия качества (1.10.20) при единичной матрице Т. Для этого нужно составить опре- делитель вида Д(Х) = — А + ХЕ Ф ььт Ат +ХЕ (1.10.27) Определитель Z\(X) есть многочлен степени /1, все корни которого лежат в левой полуплоскости комплексной плоскости X. Определитель матрицы ХЕ - А + bL равен (- 1)Л1>1(Х), т.е. det(XE - А + bL) - Z>i(X) = 0. (1.10.28) Приравнивая коэффициенты при одина- ковых степенях X в выражении (1.10.27) нахо- дим коэффициенты обратных связей // в опти- мальной системе. Метод А И. Лурье. Оптимальное управ- ление для стационарной линейной системы (1.10.19) при скалярном управлении и еди- ничной матрице Т можно найти по следую- щему алгоритму. Пусть d(X) - характеристический много- член системы (1.10.19), a Z)(^, Ь) - характери- стический определитель замкнутой оптималь- ной системы, т.е. d(X) = det(XE - А), (1.10.29) L) = det(XE - A + bL). (1.10.30) Обозначим через d&(X) определитель, получаемый из определителя d(X) заменой в нем к-то столбца на вектор Ь. Тогда уравнение п п d(X)d(-X) + £ £ (Xty (-М = О I=1J=1 (1.10.31) имеет п корней Xi, Х2, ...» Хл с отрицательной вещественной частью и справедливо равенство (X - Х0 (X - Х2) ... (X - Хл) = D(X, L), (1.10.32) из которого можно найти коэффициенты об- ратных связей // в оптимальной системе. 1.10.6. УПРАВЛЕНИЕ В НЕПОЛНОСТЬЮ НАБЛЮДАЕМОЙ СИСТЕМЕ Систему уравнений (1.10.19) путем ли- нейного невырожденного преобразования X = = Tz можно привести к жордановой форме. В случае простых собственных значений мат- рицы А после преобразования уравнение (1.10.19) примет вид
УПРАВЛЕНИЕ ДИСКРЕТНОЙ ЛИНЕЙНОЙ СИСТЕМОЙ 147 Z1 = XjZi + Mi Z2 = x2z2 +М; zr = ^rzr + bru; (1.10.33) Zr+l - ^r+l^r+b Zn ~ ^nZn' В случае г < n система (1.10.33) [а зна- чит, и система (1.10.19)] является неполностью управляемой. Для г переменных состояния системы (1.10.33) можно найти оптимальное по критерию качества (1.10.20) управление. Остальные переменные состояния неуправляе- мы и вносят конечный вклад в критерий (1.10.20) лишь в случае устойчивых собствен- ных значений Xr + j, Хг + 2. Хя для не- управляемых переменных состояния. Поэтому оптимальное управление в неполностью управляемой системе возможно тогда, когда собственные значения, соответствующие не- управляемым координатам, имеют отрица- тельные вещественные части. 1.10.7. УПРАВЛЕНИЕ ДИСКРЕТНОЙ ЛИНЕЙНОЙ СИСТЕМОЙ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ КАЧЕСТВА Нестационарные системы. Задача синтеза оптимального управления для дискретной линейной полностью управляемой системы x[fc + 1] = А[Ч х[Ч + В[Ч u[4 (1.10.34) формируется следующим образом: найти закон управления и[Лг] = и(х[Аг]), минимизирующий значение критерия качества вида VI 4*i]= £(хт[*т*м*1+ к=к$ + ит[Л]Т[*М*]) + хт[ *1 )«1»1Х[Л), (1.10.35) где Ф[Аг], Ф1 - положительно определенные матрицы весовых коэффициентов при пере- менных состояния; *Р[Ч - неотрицательно определенная матрица весовых коэффициентов при управлениях, к = Ар, ..., к\ - 1. Найдем выражение для определения за- кона управления в дискретной системе. Для полностью управляемой системы (1.10.34) при ограничениях, наложенных на матрицы Ф[*ъ Фь *ИЧ критерия качества, существуют по- ложительно определенные матрицы К[Аг], яв- ляющиеся решением разностного уравнения вида К[Ч = АТ[Ч К[* + 1] А[Ч + Ф[Ч - - АЧЧ K[fc + 1] В[Ч С?[Ч + + ВЧЧ K[fc + 1] В(Ч)*1* х В*И Ш + 1] АТИ (110.36) с граничным условием КИ1 = Ф1- (1.10.37) Докажем это утверждение. Запишем оче- видное равенство ХЧЧ1 Ф1 хН1 = хЧЧ] КИ1 х[*1] = = хт[Аь1 К[Ао1 х[Ао1 + + jr(xT[fc + l]K[fc + 1]хт[Дг +1] - к=к$ - xT[fc] К[к]х[fc]). (L10.38) Подставив в выражение (1.10.38) значение х[£ + 1] из уравнения (1.10.34), получим 4*i] = хт[*1]ф1’4*11+ ]£xT[*]®l*M*l + А:=^о + uT[*]T[fc|ul*] = хт[*о]Щ*оМ*Ь1 + fc-i , + £ uffc] + (г[*|Вт[*]К|* + 1JBI*])-1 X X BT[fc)KI* + l]A[fc]x|*l}T X х (вт|Л JKI к +1 |В| к +1| + Т[ Jt]){ul Л] + + ('FIfcJBTIJtJK|Jt + IJBIJt])'1 х х ВТ[*]К(* + 1]А|ЛИ*]}. (110.39) Вследствие положительной определенно- сти матриц КИ и *ИЧ критерий качества, определяемый выражением (1.10.39), прини- мает минимальное значение при линейном управлении вида и[Ч = -СВД ВЧЧ K[fc + 1] х х В[ЧГ^Щ + 1] А[Ч х[Ч = = -1ДЧ х[Ч- (1.10.40)
148 Глава 1.10. УПРАВЛЕНИЕ ЛИНЕЙНЫМ ОБЪЕКТОМ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ Таким образом, для определения опти- мального управления в дискретной линейной системе (1.10.34), минимизирующего критерий качества (1.10.35), необходимо выполнить следующую последовательность действий: решить разностное уравнение (1.10.39) и вычислить матрицы К[Аг], решение уравнения может быть выполнено численным методом на ЭВМ; найти оптимальное управление согласно равенству (1.10.40); вычислить значение критерия качества в оптимальной системе по формуле ЛА] = К[*о1 х[*о)- (1.10.41) Оптимальная дискретная система управ- ления линейным объектом (1.10.33), миними- зирующая критерий качества (1.10.35), являет- ся линейной и описывается разностным урав- нением x[fc+l] = (A[fl-B[fc]L[fc]) хИ, (1.10.42) где L[fc] = (ТИ №U] K[fc + 11 B[fc])-1 X х ВЭД K[fc + 1] A[fc]. (1.10.43) Стационарные системы. Если система (1.10.34) является стационарной, т.е. матрицы. F и G постоянны, матрицы весовых коэффи- циентов ФиТв критерии качества (1.10.35) постоянны, к\ —> оо, т.е. x[fc + 1] = Ах[£) + Bu[fc], (1.10.44) 7 = + ит[*)Ч^Ц*1), k=Q (1.10.45) то справедливы утверждения: решение разностного уравнения (1.10.36) при любых траничных условиях К[^] и к -> оо стремится к постоянной положительно опре- деленной матрице К; оптимальное управление и[Аг] является стационарным и задается выражением u[fc] = - Lx[fc] = = -(Т + Вт К В)"1 Вт К Ах И, (1.10.46) где матрица А определяется как решение ал- гебраического матричного уравнения Ат К А + Ф - - Ат К В СР + Вт К В)"1 ВТ К А = 0. (1.10.47) Уравнение (1.10.47) называют матричным алгебраическим уравнением типа Риккати. Решение алгебраического разностного уравнения тана Риккати. Рассмотрим несколько численных методов решения уравнения (1.10.47) на ЭВМ. Решение алгебраического уравнения сведением его к раз- ностному. Согласно изложенному выше, решение алгебраического уравнения (1.10.47) можно найти как предел решения соответст- вующего ему разностного уравнения вида (1.10.35) при произвольном граничном усло- вии (1.10.37). Решение уравнения итера- ционным методом. Для решения ал- гебраического уравнения (1.10.47) можно вос- пользоваться методом Ньютона-Рафсона. За- пишем уравнение Ат К/+ 1 В (Т + Вт К/ В)-1 ВТК/А + + А* К, В (Т + Вт К, В)-1 х хВтК/+1А=Ф + АтК/А- - Ат К/В (Т + Вт К,В)-1 Вт К/ А. (1.10.48) Если Ki есть положительно определен- ная матрица и собственные числа матрицы Ai = А - (Т + ВТ Ki В)-1 ВТ Ki А имеют отрицательные вещественные части (т.е. сис- тема x[fc + 1] = Ajx[A^] устойчива), то после- довательность решений уравнения (1.10.46) К}, К2, ..., К/, ... стремится к постоянной по- ложительно определенной матрице К, являю- щейся решением уравнения (1.10.47). Для вычисления оптимального управления (1.10.44) можно вычислять не последователь- ность матриц К/, а последовательность матриц Z/ = К/ А (/ = 1, 2, ...). Последовательность вычислений матриц Z/ можно выполнить, например, преобразованием матричного урав- нения (1.10.48) к векторному способом, опи- санным в п. 1.10.5. Если матрица А невырож- денная, то соотношение (1.10.48) можно пере- писать в виде К/+ j В (Т + ВТ К/В)'1 ВТ К/ + + К/В(Т + ШК/В)-1ШК/+1= . = (Ат)-1 ФА-» + К/ - К/ В (Т + + Вт К/ В)1 Вт К/. (1.10.49) Пример 1.10.2. Найти закон управления дискретной системой, описываемой разност- ным уравнением
ПРИНЦИПЫ ПОСТРОЕНИЯ НАБЛЮДАЮЩИХ УСТРОЙСТВ 149 Xiffc + 1] = xjfc] + 4,94 • 10-5 x2[jt] + + 9,35 • 10-7 x3[Jt] + 1,56 • IO*5 Х4[Л:] + + 1,94 . 10-6 u|£]; X2[fc + 11 = 0,972 X2[*J + 2,41 • IO’2 X3[AJ + + 0,620 X4[£] + 9,35 • 10-2u[fc]; x3[fc + 1] = -0,361 x2[£] + 9,92 • IO 3 х3И - - 0,176 X4[£] + l,2u[&|; X4[fc + 1] = 0,993 X4[£]. Минимизирующий критерий качества J = Е(ю8х^1 + lOxjl* ] + 10*3 [£] + *=(T 4- IOX4 [Jt] + H2[fc]j. Матрицы А, В, Ф и T для рассматри- ваемого примера: 1 4,94 10“ 5 9,35 • 10“7 1,56-10"5 А = 0 0,972 2,41 10“2 О 0,620 0 - 0,361 9,92-10“ 3 -0J76 .° 0 0 0,993 1,94 • 10-6 ю8 0 0 0 В = 9,35 10“2 ; Ф = 0 10 0 0 1,20 0 0 10 0 0 0 0 0 1 Т = L Решение уравнения (1.10.47), полученное на ЭВМ методом Ньютона-Рафсона, есть мат- рица 126 103 3,3 103 20 1,26 3,3 103 2,13 1,25 10“2 6,76 2,0 1,25 • 10“ 3 51O"3 4Ц410-2 1,26 10“3 6,76 4,14-10“2 3,09 • 102 Искомое управление описывается выра- жением (1.10.46), где матрица коэффициентов обратных связей L = (Т + Вт К В)1 В7 К А = = [2308,2 1,278 0,0439 5,267]. Глава 1.11 ОЦЕНКА НЕИЗМЕРЯЕМЫХ КООРДИНАТ ДЕТЕРМИНИРОВАННЫХ ЛИНЕЙНЫХ СИСТЕМ 1.11.1. ПРИНЦИПЫ ПОСТРОЕНИЯ НАБЛЮДАЮЩИХ УСТРОЙСТВ Синтез САУ по квадратичному критерию качества или с заданным расположением соб- ственных значений матрицы системы не вызы- вает принципиальных трудностей, если все переменные состояния системы известны. Однако в реальных условиях измерению с помощью физических приборов - датчиков - доступны лишь некоторые переменные со- стояния системы. Это обстоятельство показы- вает необходимость создания способов опреде- ления недоступных для измерения перемен- ных состояния системы на основе измерения лишь измеряемой части переменных состоя- ния. Устройства, с помощью которых опреде- ляются ненаблюдаемые переменные состоя- ния, называют наблюдающими (или наблюдате- лями). Рассмотрим принципы построения на- блюдающих устройств. Пусть управляемая САУ описывается линейным дифференциаль- ным векторным уравнением х = Ах + Ви(/), (1.11.1) где матрицы А и В размера соответственно п х х п и п х т системы и управления (в общем случае зависящие от времени) и вектор управ- ления u(f) размера т х 1 точно известны. Для того чтобы оценить вектор переменных со- стояния х(/) размера п х 1 (при отсутствии измерений и точно известном начальном со- стоянии х(/о))> построим наблюдающее уст- ройство в соответствии с уравнением х* = Ах* +Ви(Г). (1.11.2) В этом случае, подавая управляющее воз- действие и(/) на систему и наблюдающее уст- ройство на выходе наблюдателя (1.11.2), будем иметь точную оценку х*(/) переменных со- стояния х(/) системы (1.11.1) (рис. 1.11.1).
150 Глава 1.11. ОЦЕНКА НЕИЗМЕРЯЕМЫХ КООРДИНАТ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ Рас. 1.11.1. Схема для оценка некзмеряемых координат с разомкнутым наблюдающим устройством Наблюдающее устройство может быть реализо- вано в виде вычислителя на аналоговых или цифровых микросхемах, решающих диффе- ренциальное уравнение (1.11.2). Предлагаемый вычислитель работает по разомкнутому циклу, и в реальных условиях при наличии неучтенных возмущений и не- точном задании и начального условия х*(/) значения оценки и вектора переменных со- стояния будут с течением времени расходить- ся. Для компенсации этого расхождения по- строим наблюдающее устройство по замкнуто-, му принципу, используя результаты измере- ний у(/) части координат вектора состояния х(/) с помощью датчиков, согласно уравнению У(0 = Сх(/), (1.И.З) где матрица С размера / х п (в общем случае нестационарная) считается известной, а систе- ма уравнений (1.11.1) и (1.11.3) описывает наблюдаемую САУ. Разницу между вектором измерения у(/) размера / х 1 и оценкой изме- рения у'(0 = Сх‘(0 используем для усовершенствования наблюда- теля. Для этого в наблюдающее устройство (1.11.2) введем обратную связь с матрицей R размера п х /. Получим замкнутое наблюдаю- щее устройство, описываемое уравнением х* = Ах* +Bu(0 + It[y(0-Cx*]> (1.114) называемым наблюдателем Льюинбергера. Мат- рицу R (в общем случае нестационарную) можно назначать произвольно, например так, чтобы обеспечить устойчивость наблюдателя и затухание переходных процессов в наблюдаю- щем устройстве за требуемое время. Структур- ная схема наблюдающего устройства (1.11.4) Ряс. 1.11.2. Схема для оцени невмеряемых координат с замкнутым наблюдающим устройством приведена на рис. 1.11.2, здесь разность у(/) - - Сх*(/) используется для компенсации неуч- тенных возмущений, всегда имеющих место в реальной системе. Замкнутый наблюдатель имеет два входа: и(/) - по управляющему воз- действию и у(/) - по результатам измерений, получаемых с датчиков, установленных в САУ. Аналогичное наблюдающее устройство может быть построено для дискретной наблю- даемой линейной системы л-го порядка x[fc + 1J = Ax[fc] + Bu[£] (1.11.5) с измерениями вида у(Л) = Cx(fc), (1.11.6) матрицы А, В и С (в общем случае нестацио- нарные) размера соответственно п х п, п х т, I х пн управление и(/) размера / х 1 предпо- лагаются известными. Совершенно так же, как и для непрерывного случая, получаем уравне- ние для дискретного наблюдателя Льюинбергера x*[fc + 1] = Ax*[fc] + + + R(y[fc] - Cx*[fc]). (1.11.7) Матрица обратных связей R размера / х п (в общем случае нестационарная) выби- рается из условия устойчивости наблюдателя и обеспечения требуемого времени затухания переходных процессов. Структурная схема для дискретного наблюдающего устройства приве- дена на рис. 1.11.3. Ранг матрицы С в выражениях (1.11.3) и (1.11.6) меньше, чем размерность вектора со- стояний л, т.е. гапкС < п,
НАБЛЮДАЮЩИЕ УСТРОЙСТВА СТАЦИОНАРНЫХ НЕПРЕРЫВНЫХ СИСТЕМ 151 Рве. 1.11.3. Структурная схема дискретного наблюдающего устройства так как в противном случае при условии rankC = п матрица С является невырожден- ной квадратной размера п х п и вектор пере- менных состояния на основе измерений y(f) определяется формулой х(0 = С-1 у(/>. (1.11.8) 1.11.2. НАБЛЮДАЮЩИЕ УСТРОЙСТВА СТАЦИОНАРНЫХ НЕПРЕРЫВНЫХ ЛИНЕЙНЫХ СИСТЕМ Пусть имеется стационарный линейный объект 5*1, описываемый векторным линейным дифференциальным уравнением (1.11.1). Имеющиеся в распоряжении измеряемые дат- чиками переменные состояния этого объекта используются в качестве входов линейной системы 5*2, описываемой дифференциальным уравнением z = Ajz + Нх(Г) + ТВи(Г), (1.11.9) где z - вектор состояния системы 5*2 размера Z х 1 (/ < /1); А}, Н - постоянные матрицы размера / х / и / х п; Т - некоторая постоян- ная матрица соответствующего размера. Пред- положим, что матрица Т удовлетворяет урав- нению ТА-AiT = H. (1.11.10) Уравнение (1.11.10) имеет единственное решение, если у матриц А и Aj нет общих собственных значений [1]. Умножая уравнение (1.11.1) на матрицу Т и вычитая его из уравнения (1.11.9), с уче- том выражения (1.11.10) получаем z-Тх = Aj(z-Tx). (1.11.11) Если обозначить w = z - Тх, то получа- ем w = AjW. (1.11.12) Решением этого уравнения является вы- ражение w(/) = e^w^) или z(/) = Тх(0 + |z(0) - Тх(0)]. (1.11.13) При отрицательных собственных значе- ниях матрицы Af после окончания переход- ного процесса получаем z(/) = Тх(/), т.е. в этом случае система 5*2 будет наблюдающим устройством для линейной комбинации пере- менных системы Sf. Если наблюдающее устройство должно оценивать переменные состояния объекта Si, то матрица Т будет единичной, и в устано- вившемся режиме будет справедливо равенство z(/) = х(/). Наблюдающее устройство $2 имеет тот же порядок, что и управляемый объект. Матрица наблюдающего устройства Ai = А - Н, (1.11.14) т.е. свойства наблюдающего устройства зависят от выбора матрицы Н. В рассматриваемом случае получаем z = (A-H)z + Hx + Bu(/). (1.11.15)
152 Глава 1.11. ОЦЕНКА НЕИЗМЕНЯЕМЫХ КООРДИНАТ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ Сравнивая выражения (1.11.15), (1.11.3) и (1.11.4), имеем Н = RC, у = Сх. При син- тезе наблюдающего устройства для оценки переменных состояния системы (1.11.1), (1.11.3) матрица С фиксирована, а матрица R - произвольна. Следовательно, в рассматри- ваемом случае наблюдающее устройство 5*2 однозначно определяется выбором матрицы R и описывается уравнением х* = (А - RC) х* + Ry(O + Bu(Z). <1.11.16) Собственные значения матрицы А - RC путем выбора матрицы R можно получить равными любым заданным значениям тогда и только тогда, когда система (1.11.1), (1.11.3) является полностью наблюдаемой. Пример 1.11.1. Уравнения, описывающие динамику системы, имеют вид jq = 0,01х2; х2 = 10*з + ; х3 = -150х3 - 400х4 + 500«(Г); х4 = -О,7х4. Измеряются переменные состояния Х\ и х2. Рассчитать наблюдающее устройство для оценки всех переменных состояния системы. Для рассматриваемого случая матрицы А и В в уравнении (1.11.1) будут: 0 0,005 0 0 0 10 0 -150 -400 0 0 0 матрица С в выражении (1.11.3) 1 0 0 0‘ .0 10°. Согласно выражению (1.11.4) уравнение наблюдателя имеет вид х* = (А - RC) х* + Bu(0 + Ry(O- Неизвестную матрицу R найдем из усло- вия равенства собственных значений матрицы наблюдающего устройства Xi = -120 с-1, Х2 = = -120 с’1, Х3 = -120 с"1, Х4 = 100 с-1 методом модального управления. При заданном выборе собственных значений характеристическое уравнение системы должно иметь вид D(X) = (X + 120)3(Х + 100) = = (X + 100) (X3 + 420Х2 + 5880Х + + 2 744 000). В общем виде матрица R имеет вид В этом случае характеристическое урав- нение для матрицы А - RC записывается в форме D(X) = det(XE - А + RC) = ’Х+/-Ц 0,085 + г12 0 0 '21 ^ + г22 - 10 0,64 Ги 150 +/^2 Х+400 0 . Г41 '42 0 Х+0,7 Чтобы исключить лишние неизвестные, поло- жим /*12 = Г21 = Ги = Г41 ~ 0* тогда D(X) = (X + Гц) |Х3 + (400,7 + Г22)Х2 + + (200 + 400,7f22 + 1500 + 10^2 + 64г42)Х + + 280Г£2 + 64-400/*42 + 1050 + 7/*42] = = (X + гп) IX3 + (400,7 + Г22)Х2 + + (1780 + 4OO,7f22 + 10гз2 + 64г42)Х + + Тгп + 1050 + 28ОГ22 + 64-400г42] . Приравнивая коэффициенты при одина- ковых степенях в желаемом характеристиче- ском уравнении и уравнении общего вида, получаем значения элементов в матрице ко- эффициентов обратных связей наблюдателя 100 0 0 0 0 19,3 4251,72 105,77 1.11.3. НАБЛЮДАЮЩИЕ УСТРОЙСТВА В СТАЦИОНАРНЫХ ДИСКРЕТНЫХ ЛИНЕЙНЫХ СИСТЕМАХ Аналогично, как и для непрерывной сис- темы, построим наблюдающее устройство для дискретной системы (1.11.5) с измерениями вида (1.11.6). В качестве наблюдающего уст- ройства для оценки линейной комбинации фазовых координат Тх|£| системы рассмотрим стационарную дискретную систему, описывае- мую разностным уравнением
НАБЛЮДАЮЩИЕ УСТРОЙСТВА В СТАЦИОНАРНЫХ ДИСКРЕТНЫХ СИСТЕМАХ 153 i\k + 1] = Aiz[it| + TGu[ £] + Нх[£|, (1.11.17) где Н - некоторая постоянная матрица, мат- рица Т определяется из уравнения ТА - AiT = Н. (1.11.18) Вычитая из уравнения (1.11.19) уравне- ние (1.11.17), умноженное на матрицу Т, с учетом соотношения (1.11.18) получаем z[* + i| - Tx[fc + 1] = Ai(z[Ar] - Тх[А|), (1.11.19) или, обозначив z[A] - Тх[А] = w[А), получим однородное разностное линейное уравнение w[& + 1] = A]W|£|, (1.11.20) решение которого имеет вид w[A| = A"w[0|, (1.11.21) или z[A] = Тх(А| + A" (z[0) - Тх|0|). (1.11.22) В установившемся режиме для случая, когда все собственные значения матрицы Fi имеют модуль меньше единицы [т.е. для ус- тойчивой системы (1.11.17)], имеем после затухания переходного процесса z[A] = Тх[ *], т.е. z[А] действительно является оценкой ли- нейной комбинации переменных состояния Тх[А]. Если матрица Т - единичная, т.е. оце- ниваются переменные состояния системы (1.11.5), то матрица H = A-Aj. (1.11.23) 1 4,95 • 10"5 9,35 • 10"7 А = 0 9,75-10"1 1 2,40 10"2 0 -3.6110"1 9,90-10" 3 0 0 0 1,55 • 10"5 6,20-10"1 - 1,75 • 10"1 9,90-10"1 При измерении (1.11.6) уравнение (1.11.17), описывающее наблюдающее устрой- ство, принимает в этом случае вид z[* + 1| = Atz| А] + Ви[А] + Нх[£] = = (А - H)z[fc| + Bu[fc| + Нх [fc|. (1.11.24) Сравнивая выражения (1.11.24) и (1.11.7), получаем Н = RC. Для системы (1.11.5), (1.11.6) матрица С известна, поэтому матрица Н полностью определяется выбором элементов матрицы R, которая для полностью наблюдаемой системы всегда может быть вы- брана так, что собственные значения матрицы А - RC равны наперед заданным числам. Пример 1.11.2. Дискретная автоматиче- ская система описывается разностными урав- нениями вида: + 1| = А] + 4,95 • 10-5 X2[fc| + + 9,35 • 10-7 JC3| А] + 1,55 • IO-5 Х4(А] + + 1,96 • 10 6 Х2[* + 1] = 9.75- 10-Ьг21*1 + 2,40 • 10*2 хзИ + + 6,20- 101 лг4[А] + 9,35 • 10-2w[A); *з[£ + 1] = -3.61- 101 jc2|A] 4-9,90 - 1О-3х3И - - 1,75- 10-» х4[А] + 1,20ц|А|; Х4И + 1] = 9,90- 10-1 Х4(А]. Измеряются переменные состояния Х\ и х2. Найти уравнения наблюдающего устройст- ва для оценки всех переменных состояния. Для рассматриваемого случая матрицы А и В в уравнении (1.11.5): 1,95 • 10"6 9,35 10"2 120 0 Матрица С в выражении (1.11.6) Г! ° ° 0 "0100 Матрица RC в выражении (1.11.7) в общем случае имеет вид >11 гп >11 '12 0 о‘ RC = г2\ '22 '1 0 0 0' '21 '22 0 0 '31 '32 0100 '31 '32 0 0 ’ /41 '42. /41 '42 0 0
154 Глава 1.11. ОЦЕНКА НЕИЗМЕРЯЕМЫХ КООРДИНАТ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ Матрице А - RC соответствует характеристический многочлен D(z) = det(zE - F + RC) = det Z-1 + гц ^1 r3\ l\2 -4,95 10"5 Z + Ггг -9,75 10"1 r32 +3,61 10"1 -935 10"7 -2,40 10"2 Z +9,90 10"3 . Г41 ^2 0 -1,55 • 10"5 -6,20-10"1 1,75 • 10-1 Z-9,90 10"1 Для исключения неоднозначности примем = п2 = >31 = r4i = 0, тоща получим Z-1 + Гц -4,95 10"5 -9,35-Ю-7 -135 10"5 0 Z + Гй - 9,75 • 10"1 — 2,40-10” 7 -6Д0 10-1 0 г^2 + 3,61 • 10"1 9,90 • 10"3 1,75 • 10"1 0 г42 0 -9,90-10"1 = (z - 1 + *ii)[z3 + (Гй “ 1,955l)z2 + (- 0,9801^ + 0,024^2 + 0,62r42 + 0,9545)z + (- 0,0098^ - 0,0238^2 + 2,376 • 10" 4Г42 + 9,7862 • 10" 4 Зададимся следующими значениями кор- ней характеристического уравнения наблюда- теля: Z1 = 0,25; Z2 = Z3 = Z4 = 0,2. Тогда же- лаемый вид характеристического уравнения наблюдателя ОД = (Z - 0,25) (Z3 - O,6Z2 + O,12Z - 0,008). Приравнивая коэффициенты при одина- ковых степенях переменной Z, находим мат- рицу коэффициентов обратных связей дис- кретного наблюдающего устройства 0,75 0 0 0 1Д551 -ОД731 0,8029 1.11.4. ПОНИЖЕНИЕ ПОРЯДКА НАБЛЮДАЮЩИХ УСТРОЙСТВ Описанные выше наблюдающие устрой- ства оценивают весь вектор состояния систе- мы. Однако на основе полученных результатов измерения часть переменных состояния может был» найдена непосредственно, поэтому на- блюдающее устройство следует использовать лишь для оценки остальных переменных со- стояния, его порядок может быть существенно понижен. Рассмотрим порядок построения такого наблюдателя. Пусть система и измерения описываются уравнениями х = Ах + Ви(0; (1.11.25) у(0 = Сх(/); (1.11.26) здесь А, В и С - матрицы размера соответст- венно лхл, лхти/хл;х- вектор пере- менных состояния размера п х 1; и(1) - вектор управления размера т х 1; у - вектор измере- ний размера / х 1 (/ < л). Предположим, что ранг матрицы С равен /. Это соответствует тому случаю, когда система датчиков органи- зована так, что отсутствуют линейно-зависи- мые измерения. Тогда матрицу С можно пред- ставить в блочном виде С = [Сi ! С2], где невырожденная квадратная матрица Cj имеет размер / х /. Выражение (1.11.26) принимает вид у0) = С1Х10) + С2Х20), (1.11.27) где Хт = Jxf • х2 j - блочный вектор пере- менных состояния с размером составляющих Z х 1 и (п - Z) х 1. В результате можно запи- сать *1(0 = СГ1 |у(/) - С2Х2(/)1. (1.11.28) Вводя блочные матрицы А=[Л1-1-1-А-121 и в = [®1- |а21 I Аа] [в2]’ уравнение (1.11.25) можно переписать в виде *1 = А11х1 + А12х2 +B1U(O; (1.11.30) Х2 = А21Х] + А22х2+B2u(Z). (1.11.31) Подставляя значение Х\ из соотношения (1.11.28) в уравнение (1.11.31), получаем Х2 =(А22 - А21С[!С2)х2 +B2u(0 + + А21С,*у(0, (1.1132)
ПОНИЖЕНИЕ ПОРЯДКА НАБЛЮДАЮЩИХ УСТРОЙСТВ 155 или, обозначив А = А 22 — AjiCj ^2, имеем х2=Ах2+и(/). (1.11.33) Дифференцируя выражение (1.11.27) по времени и подставляя значение Xj и Х2 из (1.11.30) в (1.11.27), получаем У(0 -(С1АП + CjAa)Cf‘y(l) + + [С1А12+CjAjjfCjAi 1 + С2А21) Cf1 Сг]х2+ + (CiBi + СгВгМО. (1.11.34) Введем переменную У(О=У(О - (С1Ац + С2А21) СГ1 у(0 - - (CjBi + C2B2)u(l) и матрицу С « С4А12+ С2А22 ‘ (С1Ац + С2А21) Cf1 С2. Тогда выражение (1.11.32) можно пере- писать в виде у(0=Сх2(П. (1.11.35) Таким образом, получим новую систему (1.11.33) с измерениями (1.11.35) более низ- кого порядка п - /, чем в системе (1.11.25). Для этой системы можно построить на- блюдающее устройство описанным выше ме- тодом, тогда оценка Х2 координат вектора Х2 определяется дифференциальным уравнением х2 = Ах2+u +R^y - Сх2), (1.11.36) где R выбирается из условия устойчивости наблюдателя и требуемого времени затухания переходных процессов в нем. Значения оценок координат вектора Xj определяются из выражения (1.11.28) *i= Cf* [у(0 - С2Х2 (/))• (1.И.37) Структурная схема наблюдающего уст- ройства приведена на рис. 1.11.4. Рве. 1.11.4. Структурная схема непрерывного наблюдающего устройства пониженного порядка
156 Глава 1.11. ОЦЕНКА НЕИЗМЕНЯЕМЫХ КООРДИНАТ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ Если ввести замену переменной w=X2-Ry, (1.11.38) то, учитывая значения А, у, С, получаем w = (а - RCjw + и - -(A-RcjRy-R^Aj, +C2A2i)C[,y- -R^CjBj + CjBj) ~ = (а - RCjw + u + ^А - RcJr - -R(ciAn +C2A2i)C]'jy- -R^B, +C2B2) u(Z). (1.1 L39) В этом выражении не требуется выпол- нения дифференцирования функции у(/)> По- сле вычисления w(l), путем решения диффе- ренциального уравнения (1.11.39), находим оценку Х20 части вектора переменных со- стояния х(/) по формуле х2(0 = W2(z) - Ry(Z), (1.11.40) затем по выражению (1.11.37) находим оценку *i(0- Совершенно аналогично можно найти устройство оценки пониженного порядка для дискретной системы, описываемой уравне- ниями: х[& + 1] = Ах[£] + Ви[Лг]; (1.11.41) у[£] = Сх[Лг], (1.11.42) где можно представить у[Л1 = С1Х1И1 + Сгх2|А:| (1.11.43) при условии, что квадратная матрица Cj раз- мера 1*1 является невырожденной. Тогда можно записать: Х1И + 1] = Anxjfc] + А12х2И + Biu[Ar]; (1.11.44) хгИ + 1] = A2iXi[*] + А22Х2И + ВгцИ]. (1.11.45) Не выполняя промежуточных выкладок, при- ведем лишь окончательный результат х2[А: +1] = Ах2[fc] + ад + R(y|к 1 - Сх2[fc]), (1.11.46) где ад = в2ад + А21сг'ад; = У1* + И - (С,А12 + С2А21)С[,МЛ| - -(с^в, +с2в2)ад; С = CjAj2 + С2А22 ~ -(С1Ац + C2A2i)Cj’1C2; А = А22 - и для оценки вектора х>[Аг] имеем хГ[Л] = СГ1(у1^1-С2Х2[Л|), (1.11.47) или для того чтобы не выполнять измерение у|* + П. введем новую переменную w|*l = х2 И - Ry[fc|. Тогда из выражения (1.11.45) получаем w[* + 1] = (а - Rc)w|fc] + [f - RC- - R(C|B| + CjBjJCj'JjUI - -r^b, + с2в2)ад + ад. (1.11.4$) Решая уравнение (1.11.48), находим зна- чение w[Ar] и затем из выражений (1.11.47) и (1.11.34) находим оценки х^ [fc] и Х*(Лг]. В этом случае не требуется измерения функции y|fc + И Структурная схема наблюдающего уст- ройства пониженного порядка приведена на рис. 1.11.5. 1.11.5. РАЗДЕЛЕНИЕ ЗАДАЧ УПРАВЛЕНИЯ И НАБЛЮДЕНИЯ Собственные значения системы синтези- рованной по какому-либо критерию качества при полном измерении переменных состояния и собственные значения матрицы наблюдаю- щего устройства разбиваются на две независи- мые друг от друга группы. Имеем управляемую и наблюдаемую сис- тему, описываемую векторным дифференци- альным уравнением вида х = Ах + Ви; (1.11.49) у = Сх (1.11.50) и наблюдающее устройство, описываемое дифференциальным уравнением
СПИСОК ЛИТЕРАТУРЫ 157 Рас. 1.11.5. Структурная схема дискретного наблюдающего устройства пониженного порядка х* = (А - RC)x* + Ry(f) + Bu(0. (1.11.51) Пусть линейное управление, найденное для системы (1.11.49), при полном измерении вектора переменных состояния имеет вид и = -Lx(0- (1.11.52) Воспользуемся этим же законом управления для случая неполного измерения, замыкая систему уже не по вектору переменных со- стояния, а по его оценке х*(1), т.е. введем закон управления вида и = -Lx*(0- (1.11.53) Введем новую переменную х = х* — х. (1.11.54) Тогда из уравнений (1.11.49) - (1.11.51) и (1.11.53) получаем х= (A- BL)x - BLx; (1.11.55) i=(A-RC)x. (1.11.56) Характеристическое уравнение получен- ной системы имеет вид ГГА-BL -BL 1 ГХЕ|оТ| ХЁ_Р ‘ = det(A - BL- IE) det(A - RC - IE). (1.11.57) Отсюда следует, что характеристический многочлен системы, замкнутой по оценкам переменных состояния, равен произведению характеристических многочленов замкнутой системы "объект + регулятор" и характеристи- ческого уравнения оценочного устройства. Сказанное позволяет сделать вывод о том, что синтез линейного регулятора можно выполнять сначала в предположении, что все переменные состояния измеряются, а затем построить линейное устройство оценивания и замкнуть систему по оценкам переменных состояния. Если расположение полюсов замк- нутой системы и наблюдателя в отдельности нас удовлетворяет, то полученная в результате система будет соответствовать предъявляемым к ней требованиям. Все сделанные в этом параграфе выводы относительно непрерывных линейных систем с линейными наблюдающими устройствами полностью распространяются и на дискретные линейные системы. СПИСОК ЛИТЕРАТУРЫ 1. Андреев Ю. Н. Управление конечно- мерными линейными объектами. М.: Наука, 1976. 424 с. 2. Астапов Ю. М., Васильев Д. В.', Залож- нев Ю. И. Теория оптико-электронных следя- щих систем. М.: Наука. 1987. 326 с. 3. Афанасьев В. Н., Колмановский В. Б., Носов В. Р. Математическая теория конструи- рования систем управления. М.: Высшая шко- ла, 1989. 447 с. 4. Березин Е. С., Жвдков Н. П. Методы вычислений. М.: Физматтиз. 1962. Т. 1, 464 с. Т. 2, 620 с. 5. Бесекерский В. А Динамический син- тез систем автоматического регулирования. М.: Наука, 1970. 576 с.
158 СПИСОК ЛИТЕРАТУРЫ 6. Бесекерский В. А. Цифровые автома- тические системы. М.: Наука, 1976. 575 с. 7. Девщдович Б. П. Лекции по математи- ческой теории устойчивости. М.: Наука, 1967. 472 с. 8. Деч Г. Руководство к практическому применению преобразования Лапласа и Z-преобразования: Пер. с нем. М.: Наука, 1971. 288 с. 9. Динамика цифровых следящих систем / Ю. А Николаев, В. П. Петухов, Г. И. Фек- листов и др. М.: Энергия, 1970. 496 с. 10. Иванов В.А, Ющенко А С Теория дискретных систем автоматического управле- ния. М.: Наука, 1983. 335 с. 11. Казамаров А А, Палатаик А М., Родняккий Л. О. Динамика двумерных систем автоматического регулирования. М.: Наука, 1967. 308 с. 12. Кузовков Н. Е., Карабанов С В., Са- лычев О. С. Непрерывные и дискретные сис- темы управления и методы идентификации. М.: Машиностроение, 1978. 222 с. 13. Кузовков Н. Т. Модальное управление и наблюдающие устройства. М.: Машино- строение, 1976. 184 с. 14. Куо Б. Теория и проектирование цифровых следящих систем. М.: Машино- строение, 1986. 448 с. 15. Макаров И. М., Менский Б. М. Таб- лица обратных преобразований Лапласа и об- ратных Z-преобразований. М.: Высшая школа, 1978. 247 с. 16. Матемаггаческие основы теории авто- матического регулирования / В. А. Иванов, В. С. Медведев, Б. К. Чемоданов, А С. Ющенко. М.: Высшая школа, 1997. Т. 1, 367 с. Т. 2, 454 с. 17. Основы проектирования следящих систем / Под ред. Н. А. Лакоты. М.: Машино- строение, 1978. 391 с. 18. Понов Е. П. Теория линейных систем автоматического управления и регулирования. М.: Наука, 1989. 304 с. 19. Справочник по теории автоматиче- ского управления / Под ред. А. А. Красовско- го. М.: Наука, 1987. 712 с. 20. Сгрейц В. Метод пространства со- стояний в теории дискретных линейных сис- тем управления. М.: Наука, 1985. 296 с. 21. Техническая кибернетика / Под ред. И. И. Солодовникова. Кн. 1. М.: Машино- строение, 1967, 712 с. 22. Федоров С. М., Литвинов А П. Авто- матические системы с цифровыми вычисли- тельными машинами (теория и проектирова- ние). М.: Энергия, 1965. 224 с. 23. Цыпкин Я. 3. Теория линейных им- пульсных систем. М.: Физматтиз, 1973. 416 с.
Раздел 2 ТЕОРИЯ НЕЛИНЕЙНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Глава 2.1 ОСНОВНЫЕ ПОЛОЖЕНИЯ 2.1.1. ОСОБЕННОСТИ НЕЛИНЕЙНЫХ СИСТЕМ Расчет и проектирование автоматических систем управления и регулирования и других систем с обратной связью (имеющих замкну- тые контуры) очень важно проводить с учетом влияния содержащихся в них нелинейностей или же специально вводимой нелинейной коррекции. Наличие нелинейностей часто влияет не только количественно, но может и принципиально изменять вид и качество ди- намических процессов в системе. Особенно это важно в автоматических системах, содер- жащих замкнутые контуры управления. Любое отклонение статической характе- ристики от прямой линии у = кх и любое отклонение в уравнении динамики от линей- ности хотя бы одного элемента делает систему в целом нелинейной. Поэтому существует не- обозримое число разновидностей нелинейных систем. Для нелинейных систем не существует единых универсальных методов. Каждый их класс и даже характер исследуемого процесса в этом классе требует своего подхода при расче- тах и проектировании системы. Часто строгое исследование нелинейной системы представ- ляет большие трудности и практически стано- вится нереальным. Поэтому часто приходится прибегать к принципиально приближенным методам. Инженерные методы исследования и расчета нелинейных систем изложены в рабо- тах [6, 29, 30, 35, 43]. Кроме того полезные материалы по этим вопросам содержатся в общих руководствах [8, 34, 37]. Другая литера- тура, рассматривающая более специализиро- ванные задачи по нелинейным системам, будет прокомментирована по ходу изложения. Обычно часть системы, включающая большинство ее звеньев, описывается линей- ными уравнениями (передаточными функция- ми или частотными характеристиками) и вы- деляется одна или несколько нелинейностей. В зависимости от того, как входят переменные в выражения нелинейностей, различают два класса нелинейных систем. Нелинейные сястемы первого класса. Эго системы, уравнения которых могут быть при- ведены к такому виду» когда в нелинейную функцию входит одна переменная (возможно, со своей производной по времени). При нали- чии одной нелинейности уравнение динамики системы записывается в виде Q(p)x +R(j>)y = р = ±-, (2.1.1) где Q(p)t R(p), S(p) - операторные многочле- ны, причем у = F(x) или у = F(x,px). (2.1.2) Эго соответствует объединению всех ли- нейных звеньев системы в одну линейную часть с выделением нелинейного звена (рис. 2.1.1, а). Передаточные функции линейной части системы (собственная и по внешнему воздействию): W'<^WY (2.1.3) К такого же типа нелинейным системам первого класса могут быть в большинстве слу- чаев приведены и системы с двумя последова- тельно соединенными нелинейными звеньями (рис. 2.1.1, б), так как в результате двух нели- нейных операций можно получить нелинейное уравнение (2.1.2), непосредственно связываю- щее переменные у и х. Могут быть системы первого класса с двумя или более нелинейностями и другого вида, например, если в схеме нелинейные звенья I и II имеют одну и ту же входную переменную х (рис. 2.1.1, а). Нелинейные сястемы второго класса. Эго системы, в которых нелинейные функции содержат две или несколько переменных. К системам второго класса относят большинство систем с двумя и несколькими нелинейностями (рис. 2.1.2, а, б). Однако и система с одной нелинейностью может отно- ситься к системе второго класса, если нели- нейная функция зависит от двух переменных.
160 Глава 2.1. ОСНОВНЫЕ ПОЛОЖЕНИЯ а) 6) «) Рис. 2.1.1. Структура нелинеОных систем первого класса <0 Рис. 2.1.2. Структура нелинеОных систем второго класса
ОСОБЕННОСТИ НЕЛИНЕЙНЫХ СИСТЕМ 161 Особенности нелинейных процессов. Про- цессы в нелинейных системах имеют весьма существенное отличие от линейных, что необ- ходимо учитывать при проектировании авто- матических систем. Если в линейных системах при отсутст- вии внешнего воздействия изменение масшта- ба начальных условий влияет лишь на масштаб переходного процесса, форма же его сохраня- ется, то в нелинейных системах с изменением величины начального отклонения (при отсут- ствии внешнего воздействия) может сущест- венно измениться не только форма переходного процесса, но и его принципиальные свойства. Например, если при малых начальных откло- нениях собственные колебания нелинейной системы являются затухающими, то при боль- ших начальных отклонениях они могут ока- заться расходящимися (рис. 2.1.3, а), и наобо- рот (рис. 2.1.3, б). В первом случае система при больших отклонениях оказывается неустойчивой, в то время как при малых отклонениях она устой- чива, причем величина аТ служит границей устойчивости системы по амплитуде начального отклонения. Во втором случае нулевое состоя- ние системы неустойчиво, а колебания со всех сторон сходятся к автоколебательному режиму с амплитудой ас. В результате нелинейная система, в от- личие от линейной, может иметь три области в пространстве параметров: устойчивости, неустойчивости и особой области, соответст- вующей двум описанным явлениям. Это пока- зано, например, на рис. 2. L4 для первого слу- чая и рис. 2.1.5 - для второго, где к - параметр системы (например, общий коэффициент уси- ления разомкнутой цепи). Pic. 2.1.3. Графит переходных процессов В отличие от линейной системы, период собственных колебаний нелинейной системы может заметно меняться с изменением ам- плитуды колебаний в переходном процессе. Иногда в одной и той же системе воз- можны два или несколько устойчивых состояний в зависимости от начальных условий процесса. Тогда говорят об области притяжения каждого из них по начальным условиям. Например, область притяжения для равновесного состоя- ния определяется начальными амплитудами, лежащими ниже кривой СВ (рис. 2.1.6), а для автоколебательного режима область притяже- ния лежит выше этой линии. Рис. 2.1.4. Плоскость "амплитуда-параметр" с неустойчивым периодическим режимом Рис. 2.1.5. Плоскость "амплитуда-параметр" с устойчивым периодическим режимом Рис. 2.1.6. Плоскость "амплитуда-параметр" с двумя периодическими режимами 6 Зак 1023
162 Глава 2.1. ОСНОВНЫЕ ПОЛОЖЕНИЯ Особенность, связанная с несимметричной нелинейностью, показана на рис. 2.1.7. На вы- ходе нелинейности у возникает постоянная составляющая (при симметричном входе х). Если в цепи данной системы нет интегрирую- щего звена, то зга составляющая проходит по всему контуру и на входе нелинейности тоже появится постоянная составляющая х°, кото- рая определится уравнением замкнутого кон- тура системы. Следовательно, появляется ста- тическая ошибка в системе помимо внешнего воздействия (что необычно) вследствие собст- венной несимметрии (даже при отсутствии внешнего воздействия). Важной особенностью нелинейных про- цессов управления является несправедливость принципа суперпозиции решений при сложении отдельных составляющих процесса. Разнообразные особенности поведения нелинейных систем при наличии внешних воздействий (управляющих и возмущающих) будут показаны в последующих главах. За счет величины внешнего воздействия может даже нарушаться устойчивость нелинейной систе- мы, чего нет в линейных системах. Своеобраз- ный скачкообразный характер имеют и резо- нансные явления (рис. 2.1.8). Важно иметь в виду, что в нелинейных системах при наличии автоколебаний или внешних вибраций статическая характеристика нелинейного звена для основного сигнала управления будет отличаться от заданной его нелинейной характеристики. Известно, на- пример, что даже в релейной системе при наличии автоколебательных вибраций статиче- ская характеристика для основного сигнала получает вид плавной кривой (эффект вибра- ционного сглаживания нелинейности). 2.1.2. ВИДЫ НЕЛИНЕЙНОСТЕЙ Статические нелинейности. Они опреде- ляются статическими характеристиками у = F(x) отличающимися тем или иным обра- зом от прямолинейной у = кх. Так, нелиней- ность релейного типа в общем случае (рис. 2.1.9, а) имеет зону нечувствительности и петлю гистерезисного типа, выражающую не- линейное (координатное) запаздывание в сра- батывании реле. На рис. 2.1.9 представлены и частные случаи. Характеристики релейного типа могут быть и несимметричными, например, если реле или просто контактная пара работает в режиме включения и выключения напряжения одной полярности (рис. 2.1.10, а, б). Следующей разновидностью являются непрерывные статические нелинейности. Они могут задаваться аналитически в виде степен- ных и других функций или же графически (рис. 2.1.11, а - е, где к - крутизна характери- стики - тангенс угла наклона). В третьем из этих случаев показано изменение уровня ха- рактеристики от внешних условий, например от нагрузки на выходе. Такие нелинейности могут иметь гистерезисные петли (рис. 2.1.12, а, 6), в том числе с изменением гистерезисной характеристики при разных амплитудах (а\ и 02) колебаний входной величины х. Встреча- ются и несимметричные нелинейные характе- ристики (рис. 2.1.13, а - в). Особый вид имеет характеристика зазора (рис. 2.1.14), когда при перемене направления движения ведомая деталь остается неподвиж- ной, пока не будет выбран зазор (горизон- тальные стрелки на рис. 2.1.14 при разных амплитудахдолебаний входной величины а). Некоторые системы включают звенья с периодическими нелинейностями (рис. 2.1.15), которые отличаются наличием участ- ков с отрицательным наклоном. Например, Дх) = fcsinx.
ВИДЫ НЕЛИНЕЙНОСТЕЙ ИЗ г) Э) Рис. 2.1.9. Симметрвчиые релейные нелинейности «) О Рис. XI.10. Несимметрпше релейные нелинейности
164 Глава 2.1. ОСНОВНЫЕ ПОЛОЖЕНИЯ л) О Рис. 2.1.12. Гистерезисные нелинейности и) 6) •) Рис. 2.1.13. Несимметричные непрерывные нелинейности Рис. 2.1.14. Нелинейность типа "зазор” Рис. 2.1.15. Нелинейности с падающими участками
ВИДЫ НЕЛИНЕЙНОСТЕЙ 165 Искусственно вводимые нелинейности. Применяются, например, характеристики с опережением переключений (рис. 2.1.16, а, 6). Такое "координатное” (нелинейное) опереже- ние улучшает процесс управления наподобие опережения по фазе в линейных дифференци- рующих устройствах. 0 Рве. 2.1.16. Нелинейности с опережающей петлей Динамические нелинейности. Они описы- ваются нелинейными дифференциальными зависимостями. Примером служит нелинейное введение производной наряду с самой величи- ной (2.1.2). Другой пример - изменение "постоянной времени” в зависимости от вход- ной величины: F(x)py + у = кх. К динамическим нелинейностям отно- сится также звено с нелинейным трением, причем различается квадратичное трение fi(py) = kipy + c(j>y)2 sign у и сухое трение (рис. 2.1.17, а), имеющее важ- ную особенность: при ру = 0 сила трения 7*1 может принимать любое значение в пределах -с £ F\ £ +с (этим она принципиально отли- чается от релейной). Когда ру = 0 и сумма всех других сил окажется по модулю меньше с, система остановится до тех пор, пока изме- нение сил не приведет к значению 1I = с. На рис. 2.1.17, б показан другой реальный случай сухого трения. При наличии линейного и сухого трения и линейной восстанавливаю- щей силы уравнение колебательного звена имеет вид тр2у + кгру + с sign ру + к\у - кх. (2.1.4) Рве. 2.1.17. Двнамическве велввейноств
166 Глава 2.1. ОСНОВНЫЕ ПОЛОЖЕНИЯ В случае, когда массой т из-за ее мало- сти можно пренебречь и восстанавливающей силы к^у нет, это уравнение вырождается в нелинейную функцию (рис. 2.1.17, в), что эквивалентно наличию зоны нечувствительно- сти. Это наблюдается обычно в приводных устройствах. Если же значением массы т пренебрега- ется при наличии сухого трения и линейной восстанавливающей силы, уравнение звена (2.1.4) вырождается в нелинейную функцию вида рис. 2.1.17, г. Тут влияние сухого трения эквивалентно зазору в механической передаче (см. рис. 2.1.14). Эго бывает в чувствительных и управляющих элементах с легкими подвиж- ными частями. Динамическая нелинейность имеет место в электродвигателе (рис. 2.1.18) при разных значениях управляющего напряжения и и уг- ловой скорости х = ©да, что апроксимируется выражением М = _^«-(с2+С4|х|)ж Нелинейность логического тана. Логиче- ское устройство может иметь два или несколь- ко входов и выдавать ступенчатый сигнал в зависимости от определенных логических комбинаций свойств входных величин. Про- стой пример: на вход логического устройства подаются отклонение управляемой величины х и скорость отклонения у = рх. На выходе его формируется управляющая функция Ф(х, у), причем Ф = +1; -1; 0 в зависимости от соче- тания значений х и рх. Логику формирования выхода можно закладывать самую разнообраз- ную. Простейшая логика следующая. Подают- ся сигналы управления (Ф = +1 или -1) тогда, когда знаки х и рх одинаковы, т.е. система уходит от требуемого режима (х = у = 0). При противоположных знаках х и рх управляющих сигналов не подается (Ф = 0), так как система сама приближается к требуемому состоянию. Эго изображено графически на плоскости х, у = рх (рис. 2.1.20) с учетом зон нечувстви- тельности Xi, У\. Пример динамической нелинейности с неразделяющимися переменными представляет уравнение двухфазного индукционного двига-> теля, которое можно представить в виде (см. [29]) (Tip + 1)х + Ьи2х = кхи, где х - угловая скорость вала двигателя; u(f) - амплитуда управляющего переменного напря- жения. Эго приводит к системе второго класса с нелинейностью F= и2х. Нелинейность неременной структуры. Она является особым типом динамической нели- нейности, так как связана с изменением струк- туры передаточных функций илй дифференци- альных уравнений системы (рис. 2.1.19). Рас. 2.1.19. Система с персмеыюй структурой Рис. 2.1.18. Нелинейная характеристика электродвипггеля Рис. 2.1.20. Логическая нелинейность
ФАЗОВОЕ ПРОСТРАНСТВО ОСОБЫЕ ТОЧКИ И ЛИНИИ 167 2.1.3. ФАЗОВОЕ ПРОСТРАНСТВО. ОСОБЫЕ ТОЧКИ И ЛИНИИ В общем случае нелинейные дифферен- циальные уравнения динамической системы п-го порядка (без внешнего воздействия) име- ют вцц = 4>i(xi,x2,...,xi,'), i = 1,2,...,л, (2.1.5) me Xt - координаты состояния системы, или в векторной форме л = ф<*>- (2.1.6) где х есть вектор в л-мерном пространстве с координатами X/. Такое л-мерное пространст- во (рис. 2.1.21), координатами которого явля- ются координаты состояния системы X/, назы- вают фазовым. Здесь начальное состояние x(/q) изобразится определенной точкой Mq, а про- цесс во времени, т.е. решение уравнений (2.1.5) - в виде некоторой кривой (см. рис. 2.1.21), которую называют фазовой траектори- ей данной системы. Текущую точку на ней Му соответствующую состоянию системы в произ- вольный момент времени /, называют изобра- жающей точкой. Значения нелинейных функ- ций Ф/ = —- определяют проекции скорости at v изображающей точки М. Практически используют фазовую плос- кость (л = 2) (рис. 2.1.22). Рас. 2.1.21. Фазовая плоскость Уравнения (2.1.5) при п =2 принимают вид ^-=Ф1(Х,,Х2), ^- = Ф2(ХЬХ2). (2.1.7) Дифференциальное уравнение фазовой траектории: <&2 = Ф2<Х1,Х2) Ф1(Х1,х2) ’ Координаты точек равновесного состоя- ния системы определяются нулевыми значе- ниями скорости: Ф1(Х1,х2) = 0, ф2(хьх2) = а (2.1.9) Ввиду неопределенности правой части уравне- ния (2.1.8) точки равновесного состояния сис- темы являются особыми точками фазовой плос- кости. Типы особых точек. Они определяются исследованием линейных уравнений dXi = anX! + а12х2; dx2 -^- = а21Х1 +022X2. (2.1.10) Уравнения, определяющие координаты равно- весного состояния: ЯцХ1 + а12х2 = 0, а21х, + а22х2 = 0. (2.1.11) Здесь существует единственная особая точка Х1 = 0, х2 = 0, Характеристическое уравнение линейной системы (2.1.10) имеет два корня A.j, Х2, кото- рые могут быть вещественными, комплексны- ми, мнимыми или же нулевыми. В случае, когда корни Х>, Х2 веществен- ны, различны и имеют отрицательные знаки, получается апериодический переходный про- цесс. Фазовые траектории вливаются в начало координат (рис. 2.1.23, а). Такую особую точку О называют устойчивым узлом. В случае же, когда корни Xj, Х2 вещест- венны, различны и имеют положительные знаки, получается тоже апериодический пере- ходной процесс, но расходящийся (рис. 2.1.23, б). Особая точка О в этом случае - неустойчи- вый узел. В случае разных знаков вещественных корней Xi, Х2 система неустойчива. Картина фазовых траекторий показана на рис. 2.1.24 с кривыми типа гипербол, имеющих асимптоты ki, k2. Эта особая точка О - седло.
168 Глава 21. ОСНОВНЫЕ ПОЛОЖЕНИЯ Рис. 2.1.24. Особая точка типа "седло** Во всех случаях конкретное очертание траекторий на фазовой плоскости можно уточнить методом изоклин. Изоклиной назы- вают линию, соединяющую точки фазовых траекторий с одинаковым наклоном касатель- ной dxi / dxi = с. Уравнение изоклины с наклоном кц (см. рис. 2.1.24): с _ g21 + °22^и а11 +а12^н (2.1.12) Задаваясь разными величинами кц, вы- числяют каждый раз наклон касательных с, чем и определяется ,очертание фазовых траек- торий. Наконец, в случае равных вещественных корней (Xj = А.2) получается вырожденный узел (рис. 2.1.25), устойчивый при Xj^ < 0 и неус- тойчивый при Х12 > 0. При комплексных корнях Xj, Х2 характе- ристического уравнения (2.1.10) переходный процесс является колебательным. Фазовые тра- ектории имеют вид спиралевидных кривых. Если в комплексных корнях Х^2 = а ± jp вещественная часть а < 0, то изображающая точка на фазовой траектории приближается к началу координат (рис. 2.1.26, а). Особую точ- ку О называют устойчивым фокусом. Если ве- щественная часть комплексных корней а > 0, то спиралевидные траектории расходятся от начала координат. Особая точка О - неустой- чивый фокус (рис. 2.1.26, 6). При чисто мнимых корнях характеристи- ческого уравнения (2.1.10) Х^2 = ± jp полу- чаются эллипсовидные замкнутые кривые (рис. 2.1.27). В этом случае особую точку О называют точкой типа "центр". Это соответст- вует периодическим во времени колебаниям. Ряс. 2.1.25. Вырожденный "узел”: а - устойчивый; б - неустойчивый -) 0 Рис. 2.1.26. Особые точки тип» "фокус**: а - устойчивый; б - неустойчивый
ФАЗОВОЕ ПРОСТРАНСТВО. ОСОБЫЕ ТОЧКИ И ЛИНИИ 169 Описанное понятие типов особых точек используют при исследовании нелинейных систем. Особые точки и линии нелинейных сис- тем. Для нелинейных систем второго порядка (2.1.7) особые точки, отвечающие равновес- ным состояниям, определяются из условий (2.1.9). Для выяснения типа каждой особой точ- ки уравнения (2.1.7) линеаризуются при малых отклонениях координат в окрестности особой точки. Затем определяются корни характери- стического уравнения линеаризованной систе- мы, по которым согласно изложенному выше и устанавливается тип особой точки. Пример 2.1.1. Заданы уравнения нели- нейной системы: dx о dv — = -х(1+х2)-2к ~- = х + у. (2.1.13). х+у Уравнение фазовых траекторий будет ф =___________________________ А - х(1 + х2) - 2у Отсюда для особых точек имеем х(1 + х2) +2у = 0, х+у = 0, (2.1.14) откуда получаем три возможные равновесные состояния: Корни характеристического уравнения вещественны, разных знаков. Это особая точка типа седло. Линеаризованная система в окрестности точки х = -1, у = 1 имеет тот же вид. Это тоже особая точка типа седло. Для асимптот Т] = фазовых траекто- рий в седловых точках из уравнения фазовых траекторий _ 5 + п -4^-2т] получаются два значения . -5-V17 , -5 + V17 кх -----------; к2 =-----------. 1 4 2 4 На рис. 2.1.28 эти асимптоты показаны в окрестностях особых точек А и В. Точка же О типа центр должна был» окружена замкнутыми кривыми. Исходя из этого, на рис. 2.1.28 изо- бражен примерный ход фазовых траекторий на всей плоскости. Для определения направления движения изображающей точки по фазовым траекториям достаточно исследовать какую-либо одну точ- ку. Например, в точке х = 0, у = 1 согласно уравнениям (2.1.13) имеем dx / dt = -2; dy / dt = L Это обозначено стрелкой на дан- ной фазовой траектории, а вследствие непре- рывности системы - и на всех остальных (см. рис. 2.1.28). На рис. 2.1.28 жирно обозначенные кри- вые разделяют области с разными типами фа- зовых траекторий. Это пример особых линий, называемых сепаратрисами. В соответствии с этим и процессы в системе будут иметь со- вершенно различную форму в соответствую- щих областях начальных условий. 1) х = у = 0; 2) х = 1, у = -1; 3) х = -1, у = 1. В окрестности точки х = у = 0 линеари- зованные уравнения имеют вид dx dy Ц-Х~2у’ Tt Корни характеристического уравнения ~ чисто мнимые. Это особая точка типа центр. В окрестности точки х = 1, у = -1, вводя малые отклонения координат £ = х - 1, Т] = у + 1, получаем линеаризованную систе- му: -Ч-2Г); = £ + П- Л Л Рис. 2.1.28. Фазовые траекторш с сепаратрасама
170 Глава 21. ОСНОВНЫЕ ПОЛОЖЕНИЯ Важным типом других особых линий яв- ляются предельные циклы - замкнутые кривые, соответствующие периодическим процессам, в окрестности которых имеют место колебатель- ные переходные процессы. Если фазовые тра- ектории изнутри и снаружи сходятся к данно- му предельному циклу (рис. 2.1.29, д), то будет устойчивый предельный цикл, отвечающий ав- токолебаниям. Если же они удаляются в обе стороны (рис. 2.1.29, б) - неустойчивый пре- дельный цикл, представляющий границу облас- тей начальных условий, когда равновесное со- стояние О устойчиво при небольших началь- ных отклонениях, а при больших - система неустойчива (устойчивость в малом, и неус- тойчивость в большом). 2.1.4. МЕТОД ФАЗОВОЙ ПЛОСКОСТИ Изображение процессов на фазовой плоскости ограничивается вторым порядком уравнения динамики системы. Однако обычно автоматические системы описываются уравне- ниями высокого порядка. Несмотря на это метод фазовой плоскости имеет большое зна- чение для выявления ряда характерных осо- бенностей процессов в нелинейных системах в весьма наглядной форме. Переходные процессы н автоколебания в релейных системах. Пусть, например, уравне- ния объекта и регулятора (рис. 2.1.30) имеют вид: (r1p + l) = -fc1x1, pxl=F(x), (2.1.15) где Дх) - релейная характеристика общего вида (см. рис. 2.1.9, а). Рис. 2.130. Пример системы регуировааяя Уравнение (2.1.15) представляем в виде at at li ii l Отсюда дифференциальное уравнение фазовых траекторий _ 1 *1 F(x) Ti Ti у (2.1.17) На фазовой плоскости (x, у) выделим три области: (2) Дх) = -с, (2) Дх) = 0; (3) Дх) = +с. Эти три области разделены пря- мыми, которые называют линиями переключения. Такую фазовую плоскость называют многолистной. На каждом листе (1, 2, 3) полу- чится свой вид фазовых траекторий. По лини- ям переключения эти листы "сшиваются". Фа- зовые траектории непрерывно переходят с одного листа на другой (за исключением неко- торых особых случаев, где они могут встре- чаться). В области (2) интегрирование уравнения (2.1.17) дает: х = -kicTi ln|y - Ajcj - 1\у + Ср (2.1.18) Фазовые траектории имеют асимптоту у = к\С, к которой они стремятся при неогра- ниченном увеличении х (рис. 2.1.31). В области (2) фазовые траектории - пря- jp молинейные отрезки у = - — + Сг • Наконец, в области (3) уравнение (2.1.17) дает х.= k^Ti 1п|у + Ахс| - Т\у + С3. (2.1.19) Фазовые траектории стремятся к асимптоте у = -kic при уменьшении х. Рас. 2.131. Фазовые траекторяя релейпой сястемы общего вада
МЕТОД ФАЗОВОЙ ПЛОСКОСТИ 171 В целом фазовые траектории принимают спиралевидную форму. Эго соответствует зату- хающим колебательным процессам. Они зату- хают не до нуля, а до некоторого значения (рис. 2.1.31, 2.1.32) в интервале -Ь\ < х < , у = 0 внутри зоны нечувствительности реле (см. рис. 2.1.9, а). Вместо особой точки полу- чается особый отрезок равновесных состояний. В случае петлевой гистерезисной харак- теристики (см. рис. 2.1.9, в) будет отсутство- вать область (2) (см. рис. 2.1.31). В этом случае слева от линии переключения (рис. 2.1.33) строим фазовые траектории по уравнению (2.1.18), а справа - по уравнению (2.1.19). Снаружи фазовые траектории образуют схо- дящиеся спирали, а изнутри расходящиеся, стремящиеся к предельному циклу, который выделен утолщенной замкнутой линией. Это устойчивый предельный цикл, отвечающий автоколебаниям. Установившийся режим работы такой сис- темы является автоколебательным. Так рабо- тают, например, вибрационные регуляторы напряжения сети постоянного тока. Парамет- ры системы должны быть выбраны так, чтобы амплитуда и частота автоколебаний находи- лись в допустимых пределах. Рас. 2.1.33. Фазовые траектории релейной системы с гистерезисом Система со скользящим процессом. Задана система автоматического регулирования (рис. 2.1.34) с нелинейностью Д*]) (см. рис. 2.1.9, д) уравнениями р2х = kxx2; х2 = F(xi) = csignxb xi = -х - хос = -(1 + kocp)x. Представляем их в виде = У, = ~kiC Sign(x + Лос>). (2.1.20) Дифференциальное уравнение фазовых траекторий: = -y-sign(x + fcocy). (2.1.21) Линия переключения на фазовой плос- кости (рис. 2.1.35) у = --^—х. (2.1.22) ^ос Справа от этой линии х + к^у > 0. По- этому из уравнения (2.1.21) у2 = -2кхсх + Сх. Фазовые траектории - параболы, ветви которых направлены в отрицательную сторону оси х. Положение вершины параболы опреде- ляется произвольной постоянной Cj, т.е. на- чальными условиями переходного процесса Ряс. 2.1.34. Схема сястемы с простейшей релейной характеристикой Рис. 2.1.35. Фазовые траектории при скользящем процессе
172 Глава 2.1. ОСНОВНЫЕ ПОЛОЖЕНИЯ Слева от линии переключения х + < 0, и уравнение фазовых траекторий (2.1.21) дает параболы у2 = 2кхсх + С2. На отрезке АВ линии переключения фа- зовые траектории встречаются. Начнутся быст- рые переключения реле около нулевого значе- ния Х\ (см. рис. 2.1.9, д) с +с на -с, причем изображающая точка М (см. рис. 2.1.35) будет двигаться к началу координат. Это и именует- ся скользящим процессом в системе. Закон движения в скользящем процессе оп- ределяется уравнением линии переключения: ^• + -!-Х = 0, (2.1.23) Л *Ос откуда х - xQe~t/koc. В результате нелинейная система второго порядка (2.1.20) на участке скользящего про- цесса вырождается, в линейную систему первого порядка (2.1.23). При этом закон движения в скользящем процессе не зависит от параметров прямой цепи системы и определяется только коэффициентом обратной связи. Система с логическим управлением. Урав- • пение вращения космического объекта вокруг своей оси имеет вид = Л/1Ф(ср,со), (2.1.24) где J - момент инерции; со - угловая скорость; М\ - постоянный вращающий момент со сто- роны системы управления, реализуемый газо- выми движками; Ф - логическая функция управления (Ф = -1, 0, +1). Уравнение системы преобразуется к виду •37 = сф(ф>“)> с=т- at at J Физический смысл величины с - постоянное угловое ускорение вращения объекта под дей- ствием момента М\. Дифференциальное урав- нение фазовых траекторий: = — Ф(ср,со). (2.1.25) Оср со В области, где Ф = -1, это уравнение приводит к фазовым траекториям в виде пара- бол: со2 =-2сф+С\. (2.1.26) В области, где Ф = +1, имеем фазовые траектории со2 = +2ар + С2. (2.1.27) Наконец, в области, где Ф = 0, получаем прямые линии со=С3. (2.1.28) Откладывая на фазовой плоскости (рис. 2.1.36, а) значения угла поворота ср тела вокруг оси, мы фактически получаем цилинд- рическую фазовую поверхность, которая здесь развернута на плоскость в пределах -тс < ср < +тс. По сравнению с идеальной картиной логического управления (см. рис. 2.1.36, о) учтем здесь влияние временного запаздывания в системе управления. Пусть Ti - запаздывание при включении газовых движков, а т2 - при их выключении. Подходя к линии включения движков ср = Ь\ (рис. 2.1.36, 6) по закону (2.1.28), за счет запаздывания Tj перейдет за эту линию на величину Дер = cirq. Вся линия включения наклонится вправо. б) Рис. 2.1.36. Фазовые траектории при логической нелинейности: а - идеальный; б - с запаздыванием
МЕТОД ТОЧЕЧНОГО ПРОБРАЗОВАНИЯ И МЕТОД ПРИПАСОВЫВАНИЯ 173 К линии же выключения движков со = -bi объект подходит по закону (2.1.26) с постоянным ускорением -с и засчет запазды- вания Т2 он перейдет за эту линию на величи- ну Дсо = -СТ2- Линия выключения w = -bi теперь сместится вниз (см. рис. 2.1.36, б). Фазовые траектории сходятся к предель- ному циклу, т.е. установившийся процесс ста- билизации космического объекта будет автоко- лебательным. Система с переменной структурой. Часто в системах, склонных к колебаниям, при помо- щи переменной структуры стремятся органи- зовать скользящий апериодический процесс. Пусть измерительное и исполнительное уст- ройства вместе с регулируемым объектом (рис. 2.1.37, а) описываются передаточной функцией ^>=4- Звено 1 имеет коэффициент усиления к\, зве- но 2 - коэффициент усиления - к\ (перемена знака сигнала). В переключающем устройстве формируется величина dx хх=у + сх\ у = — , (2.1.29)- причем уравнения системы J2x . , + к\кх = 0 при х^х > 0; J2x . —у- - к\кх - 0 при х^х < 0. dt1 (2.1.30) (2.1.31) Линиями переключения будут: ось у, где х = 0, и прямая у =-сх, х{ = 0. (2.1.32) Тогда (рис. 2.1.37, 6) в правой полуплос- кости - над линией переключения, а в левой - под ней, где ХХ\ > 0, фазовые траектории бу- дут эллипсами. В остальных областях, где xxi < 0, - гиперболами. Все фазовые траекто- рии встречаются на линии переключения у ~ - сх. Это и означает наличие скользящего процесса. Но в отличие от случая, описанного выше, здесь линия скользящего процесса не ограничена. Поэтому при любых начальных условиях система входит в режим скользящего процесса без предварительных колебаний. Рис. 2.1.37. Система с переменной структурой: а - схема системы; б - фазовые траектории системы 2.1.5. МЕТОД ТОЧЕЧНОГО ПРЕОБРАЗОВАНИЯ И МЕТОД ПРИПАСОВЫВАНИЯ Метод точечного преобразования базиру- ется так же на использовании фазового про- странства. Возьмем некоторую линию АВ (рис. 2.1.38 ). Ее пересекает фазовая траектория в точке Q. С увеличением времени t эта фазовая траектория снова пересечет линию АВ в дру- гой точке Q'. Обозначим координаты точек Q и С по дуге АВ через 5 и s'. Точку Q' назы- вают последующей по отношению к исходной точке Q. Зависимость •s’ = называют точечным преобразованием линии АВ самой в себя. Рис. 2.1.38. К принципу точечного преобразования
174 Глава 11. ОСНОВНЫЕ ПОЛОЖЕНИЯ Рис. 2.1.39. Точечное преобразование: а - функция последования; б - диаграмма точечного пробразования В случае, когда последующая точка Q' совпадает с исходной Q (рис. 2.1.39, а) J(s) = s = s*, получится замкнутая фазовая траектория (см. рис. 2.1.38). Это называют точечным преобразо- ванием точки самой в себя. В большинстве случаев бывает легче на- ходить функцию преобразования в параметри- ческой форме. В качестве параметра берется время т прохождения изображающей точки по фазовой траектории от исходной Q (см. рис. 2.1.38) до ее последующей Q': S = ^=/2«. (2.1.33) Строятся графики этих функций (рис. 2.1.39), что именуется диаграммой точечного преобразо- вания. Точка пересечения их дает координату s' = s = 5 ♦ замкнутой фазовой траектории (предельного цикла), причем абсцисса этой точки определяет период Т соответствующих колебаний системы. Ход точечного преобразования: берем некоторую исходную точку на кривой s (см. рис. 2.1.39). Перемещаемся по вертикали до кривой s', находя тем самым последующую точку при том же значении параметра Tj (это будет время движения изображающей точки по фазовой траектории от Q до Q' на рис. 2.1.38). Затем найденную последующую точку принимаем за новую исходную, для чего по горизонтали (см. рис. 2.1.39) переносим ее на кривую s. После этого переходим снова на кривую 5* уже при новом значении т = Т2 и т.д. Весь ход точечного преобразования пока- зан на рис. 2.1.39, б стрелками. В данном слу- чае получен устойчивый предельный цикл (автоколебания с периодом 7). Отсюда условие устойчивости предельного цикла'. На рис. 2.1.40 иллюстрируется вид диа- грамм точечного преобразования для других четырех случаев: а - неустойчивый предельный цикл; б - наличие двух предельных циклов, из которых один неустойчивый, а второй устой- чивый; в - расходящиеся колебания, г - зату- хающие колебания.
МЕТОД ТОЧЕЧНОГО ПРОБРАЗОВАНИЯ И МЕТОД ПРИПАСОВЫВАНИЯ 175 Рис. 2.1.41. Фазовая траектория релейной системы Пример 2.1.2. Заданы уравнения объекта и регулятора: (TiP +1) = ; PXi = F(X), ще Дх) - гистерезисная релейная характери- стика (рис. 2.1.9, в). Представляем уравнения в форме ^ = у; Т1% + У = ~к№- <21-34) На фазовой плоскости (х, у) нанесем ли- нии переключения: х = b при у > 0; х = -Ь при у < 0. Это будут полупрямые По и ГЦ (рис. 2.1.41). Ввиду нечетной симметрии характери- стики Дх) можно рассматривать только один участок фазовой траектории QQ\ идущий от полупрямой По до П1, так как закон возвра- щения этой траектории к линии По аналоги- чен. Это является точечным преобразованием полупрямой По в полупрямую Пр Пусть в точке Q будет t = 0, а в точке Q\ обозначим t = т. На участке фазовой траекто- рии QQi имеем Дх) = с. Интегрирование уравнений (2.1.34) дает у = С1е"//7’1 -^с; (2.1.35) х = - кга + С2. (2.1.36) Обозначим ординаты точек Q и Qi соот- ветственно через у и Ур Закон точечного пре- образования будем искать в виде функций Уо(т), У1(т). Из первого уравнения при началь- ных условиях: t = 0, х = Ьу у = уо определяем J'l = Оо + кхс)^/т' - кхс, (2.1.37) а из второго уравнения Уо = kiCt - kic. (2.1.38) 71(1-е /Г1) Тогда из (2.1.37) с учетом (2.1.38) полу- чим У1 = к{П~^т Ъ~х/Т'-к\С. (2.1.39) 7i(i-e /Г1) Эти формулы и являются искомыми за- конами точечного преобразования в парамет- рической форме. Построим диаграмму (рис. 2.1.42) точеч- ного преобразования в виде кривых Уо(т) и >*1(т). (Переменная У\ берется по модулю). Тут в переходном процессе определены все значе- ния ординат уо и yi и время т движения на каждом участке, а также амплитуда у* и полу- период Т автоколебаний. Это позволяет по- строить переходный процесс для переменной у (рис. 2.1.43), а затем и для переменной х (рйс. 2.1.44, где х* - амплитуда автоколебаний). Полнее о методе точечного преобразова- ния см. [10, 23, 27]. Рис. 2.1.42. Диаграмма точечного преобразования релейной системы У Рис. 2.1.43. График скорости процесса
176 Глава 2.1. ОСНОВНЫЕ ПОЛОЖЕНИЯ Рис. 2.1.45. Седловые особые точки: а - седло-узел; б - седло-фокус Рис. 2.1.44. Переходный процесс установления автоколебаний Существует еще так называемый "метод припасовывания”. Он применяется в основном к нелинейным системам типа кусочно- линейных, т.е. таких, у которых динамика процессов описывается различными линейны- ми дифференциальными уравнениями по уча- сткам. Решения, найденные для отдельных участков, сшиваются аналитически (или чис- ленно на ЭВМ). При этом произвольные по- стоянные интегрирования вычисляют каждый раз, полагая, что начальные условия для /1-го участка определяются значениями переменных в конце (л - 1)-го участка. Пример см. в рабо- те [30]. 2.1.6. ФАЗОВОЕ ПРОСТРАНСТВО СИСТЕМ ВЫСОКОГО ПОРЯДКА Выше рассмотрены типичные для нели- нейных автоматических систем собственные динамические процессы на примерах систем второго порядка. Поведение же систем более высокого порядка, начиная с третьего, облада- ет особенностями. Известно, что и в линейных системах третий порядок тоже имеет принци- пиальные отличия от второго, например, воз- можность появления неустойчивости при всех положительных коэффициентах уравнения. В нелинейных системах высокого поряд- ка кроме особых (стационарных) точек и пре- дельных циклов, рассмотренных ранее (см. п. 2.1.3), встречаются и более сложные типы особых точек, например, типа седло-узел (рис. 2.1.45, а) и седло-фокус (рис. 2.1.45, 6). Возможен также седловой предельный цикл (рис. 2.1.46), где имеется устойчивая траекто- рия на цилиндрической поверхности А и неус- тойчивая - на плоскости В. Что касается простого предельного цикла (периодического движения), то при его устой- чивости в системе, как известно, имеют место автоколебания. Устойчивость предельного цикла в нелинейных системах высокого по- рядка может был» определена так называемы- ми показателями Флокё следующим образом. В уравнении системы Рис. 2.1.46. Седловой предельный цикл: А - устойчивый; В - неустойчивый х = /(х); х = {хь...,хл}; / = {/ь. (2.1.40) вводится малое отклонение от предельного цикла х = хп + £ . Это выражение подставля- ется в (2.1.40), и функция /раскладывается в ряд по степеням £ с отбрасыванием всех чле- нов степени выше первой. Получаются урав- нения первого приближения с периодически- ми коэффициентами: п ii = k=l а1*т = а-г dXf (2.1.41) Общее решение этой линеаризованной системы п 7=1 где /у - периодические функции. Комплексные числа ау называют показателями Флокё. Один из них при наличии периодического решения обязательно равен нулю. Исследуемое перио- дическое движение будет устойчиво, если все
ФАЗОВОЕ ПРОСТРАНСТВО СИСТЕМ ВЫСОКОГО ПОРЯДКА 177 вещественные части остальных Оу отрицатель- ны. Если какие-нибудь из них положитель- ны - периодическое движение неустойчиво. Случаи седловых пространственных тра- екторий, как например, на рис. 2.1.45, имеют место, когда вещественные части показателей Флоке ау имеют разные знаки. В системе высокого порядка (в отличие от второго) устойчивым состоянием кроме положения равновесия (устойчивая особая точка) и периодического режима автоколеба- ний (устойчивый предельный цикл) может был» еще квазипериодическое движение с двумя или более рационально независимыми часто- тами. Например, в системе третьего порядка оно изображается в фазовом пространстве в виде инвариантного тора, т.е. устойчивой тра- ектории на поверхности двумерного тора, и имеет две рационально независимые частоты. Это представляется в фазовом пространстве как сумма двух движений изображающей точ- ки М: вращение aj(/) вектора Jj, т.е. враще- ние поперечного сечения тора вокруг центра #1 (рис. 2.1.47) и одновременно вращение <Х2(0 вектора /г» т е- точки на поверхности тора вокруг точки 0%. На рис. 2.1.48 показано рождение инвариантного двумерного тора из теряющего устойчивость предельного цикла (перерождение периодического движения в квазипериодическое) в нелинейной системе третьего порядка. В системах же высокого порядка возможны и более сложные картины движения. Рис. 2.1.47. Тороидальное фазовое пространство Рис. 2.1.48. Рождение двумерного тора из теряющего устойчивость предельного цикла В теории нелинейных систем различные виды установившихся режимов (устойчивая стационарная точка, устойчивый предельный цикл, инвариантный тор) имеют общее на- именование аттракторов. Указанные типы установившихся режимов называют простыми аттракторами. Кроме того возможны хаоти- ческие режимы колебаний системы (в сплош- ных средах это турбулентность). Если эти ре- жимы таковы, что фазовые траектории заклю- чены в ограниченной области фазового про- странства, то такие хаотические режимы назы- вают странными аттракторами. Следователь- но, странный аттрактор представляет собой один из важных видов установившихся со- стояний нелинейной системы высокого по- рядка с паутинообразным комплексом неза- мыкающихся фазовых траекторий, к которым притягивают все окрестные траектории пере- ходных процессов (как ранее притягивались к стационарным состояниям). Это есть устано- вившееся состояние динамического хаоса не- линейной системы. Процессы возникновения хаотических движений со странными аттракторами в дина- мических системах различны. Отметим три таких процесса. Процесс первый. С изменением некото- рого основного параметра в нелинейном ди- намическом уравнении системы высокого по- рядка могут происходить бифуркации, вызы- вающие перестройку фазовых траекторий. В результате система от первоначального рав- новесного состояния, переходя через периоди- ческий режим, может получить трехчастотное квазипериодическое движение, как правило, неустойчивое. Оно разрушается, и возникает хаотический режим в ограниченной области. Это и есть странный аттрактор. Процесс второй. С изменением парамет- ров системы могут наблюдаться бифуркации последовательного удвоения периода предель- ного цикла (рис. 2.1.49). Когда при опреде- ленном значении параметров системы пре- дельный цикл достигает бесконечно большого периода, т.е. превращается в незамыкающуюся фазовую траекторию в ограниченной области, то тем самым формируется хаотический уста- новившийся режим - странный аттрактор, притягивающий, как это было в предельных циклах, окружающие фазовые траектории (не показанные на рис. 2.1.49). О 20 40 <л>,Гц Рве. 2.1.49. Переход в странному аттрактору через последовательность бифуркаций
178 Глава 22 АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ Рве. 2.1.50. Точечное преобразование режима с перемежаемостью Рве. 2.1.51. Двукратный устойчавый цикл Процесс третий. В некоторых динамиче- ских системах переход к хаотическому режиму при определенном сочетании параметров про- исходит через так называемую перемежае- мость, когда участки (во времени) почти пе- риодических колебаний начинают чередовать- ся с всплесками хаотических режимов, после чего устанавливается странный аттрактор. Ил- люстрация режима колебаний с перемежаемо- стью представлена специфической диаграммой точечного преобразования (рис. 2.1.50). Там, начиная с точки Л, идет определенная после- довательность хода точечного преобразования, соответствующая колебательному процессу. Видно, что этот процесс неизбежно попадает в окрестность максимума кривой, после чего, совершив несколько нерегулярных колебаний, процесс снова отбрасывается в область малых значений координат. Отсюда все снова повто- ряется аналогичным образом по близкому, но несовпадающему с прежним, маршруту. В результате движение в целом не будет иметь никакого конечного периода (в духе странного аттрактора). Возможность возникновения описанных явлений в нелинейных динамических системах надо учитывать, имея в виду, однако, что в системах автоматического управления они, как правило, недопустимы. Наконец, отметим еще одну особенность колебательных процессов, не фигурировавшую ранее в примерах п.п. 2.1.4 и 2.1.5. Там рас- сматривались простые колебательные процес- сы, когда каждый предельный цикл (устойчивый или неустойчивый) определялся на диаграмме точечного преобразования одной точкой пересечения кривой fts) с биссектри- сой координатного угла (например 5*, см. рис. 2.1.39, а). Однако в нелинейных системах могут существовать более сложные колебатель- ные процессы, характеризующиеся не точка- ми, а циклами на диаграммах. На рис. 2.1.51 показан, например, двукратный устойчивый цикл диаграммы точечного преобразования. Здесь кроме одной точки пересечения S* (в данном случае неустойчивой) появляются еще двукратные точки , изображающие сложный установившийся режим колебаний системы. В общем случае могут существовать и т- кратные точки. Более подробно с изложенным в данном параграфе материалом можно познакомиться в работе [17, гл. 2]. Различные методы исследования фазо- вого пространства систем высокого порядка см. (27, 39]. О более сложных нелинейных колебани- ях и о хаотических колебаниях, которые явля- ются детерминированными беспорядочными (непериодическими) Нелинейными колеба- ниями без наличия случайных процессов, см. книгу Ф. Мун, Хаотические колебания, М. "МИР", 1990. Они изображаются в фазовом пространстве в виде странного аттрактора, когда отдельная фазовая траектория с течени- ем времени может заполнять целую область. Глава 2.2 АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ Автоколебания - это устойчивые незату- хающие собственные колебания, возникающие в системе без каких-либо внешних колебатель- ных воздействий, но при наличии какого-либо источника энергии, поддерживающего колеба- ния. Они являются следствием собственных внутренних свойств системы. При этом ампли- туда и частота автоколебаний не зависит от начальных условий процесса. Конечно, не в любой нелинейной системе будут обязательно автоколебания, но существенно то, что возни- кают они только при наличии нелинейности.
МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ И МЕТОДЫ МАЛОГО ПАРАМЕТРА 179 2.11. МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ (ГАРМОНИЧЕСКОГО БАЛАНСА) И МЕТОДЫ МАЛОГО ПАРАМЕТРА Исследование и расчет нелинейных сис- тем высокого порядка методом гармонической линеаризации (гармонического баланса) про- водят при любых видах нелинейностей, в том числе и релейных. Но для релейных систем существует и точный метод, который изложен в гл. 2.5. Осамы метода. В уравнениях динамики нелинейной системы, относящейся к первому классу (см. п. 2.1.1), какую бы сложную струк- туру она ни имела, выделяется нелинейность (см. рис. 2.1.1, а) в ваде (2.1.2), а вся линей- ная часть системы описывается передаточной функцией (2.1.3) или дифференциальным уравнением (2.1.1). Амплитудная частотная характеристика линейной части имеет обычно вид, представ- ленный на рис. 2.2.1, где 7 - при наличии нулевого полюса, 2 - при его отсутствии. Подадим на вход нелинейности сигнал x^asinco/. (2.2.1) На выходе нелинейности возникнут высшие гармоники, которые нельзя считать малыми. Но, проходя через линейную часть системы в соответствии с ее частотной харак- теристикой (см. рис. 2.2.1), они сильно уменьшают свои амплитуды по сравнению с первой гармоникой. Свойство линейной части автоматиче- ской системы подавлять высшие гармоники, генерируемые нелинейностью, называют свой- ством фильтра. Это свойство, как правило, хорошо выполняется в автоматических систе- мах высокого порядка (начиная с третьего). На этом основании не .будем принимать в расчет высшие гармоники на выходе нели- нейности (при необходимости их можно учесть [29]). ятейвой часта Выходная переменная нелинейности по первой гармонике записывается в виде У = F(x) = 9(e)+^-^plx (I) (2.2.2) (для статической нелинейности F(x) при от- сутствии flj) на рис. 2.1.1, а); 2я q = — J F(a sin ф) sin цяАр, о ц/ = со/; (2.2.3) 2л q* = — J F(a sin ф) cos У динамических нелинейностей F(x, рх) поя- вится еще зависимость q и q’ от о [29], так как под интегралами будет функция /(asiny, a® cosц/). Это и называют гармонической линеариза- цией нелинейности, а величины q(a) и q\a) - коэффициентами гармонической линеаризации. Гармонически линеаризованная переда- точная функция статической нелинейности: И'н («, *) = угг = ?(«) + <2.2.4) Л (5) (О Амплитудно-фазовая ее характеристика (при s = /со) И'н (") = ?(«) + /?'(«)• (2.2.5) зависит только от амплитуды и не зависит от частоты, в противоположность характеристи- кам линейных звеньев. В динамических нели- нейностях появляется зависимость от ампли- туды и от частоты. Для нелинейных систем второго класса, когда имеется две или несколько нелинейно- стей, разделенных линейными частями (см. рис. 2.1.2), требуется выполнение свойст- ва фильтра для каждой из линейных частей системы. В случае несимметричной нелинейности несимметричными окажутся и колебания. Для систем первого класса будем иметь х = х° + asincof, где х° - постоянная составляющая. При этом для статических нелинейностей у = F(x) = F°(x°,a) + [f(a,x°) + + Ч (а'Х ) р х*, (2.2.6) со
180 Глава 22 АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ где F® - постоянная составляющая, х* = a sin со/, причем С(Х) + Л(Х) q(a,to) + Ч'(а,ю} СО X =0. 2л Г° = — J Г(х° + a sin v|/)*fy; о 2л q = — Г F(x° + a sin ц/) sin ЯД J о 2л q* = — f F(x° + a sin ц/) cos\|/(fy. яд J о (2.2.12) (2.2.7) (2.2.8) Для динамических нелинейностей фор- мулы усложняются [29]. Вычисленные для ряда типовых нелинейностей коэффициенты гармонической линеаризации и их графики для симметричных колебаний представлены в табл. 2.2.1, а для несимметричных колебаний - в табл. 2.2.2, которыми и следует пользоваться при определении колебаний в конкретных нелинейных системах. Существуют два основных способа опре- деления автоколебаний на этой основе: алгеб- раический и частотный. Алгебраический способ определения авто- колебаний и их устойчивости. Для определения симметричных автоколебаний в системах первого класса согласно (2.1.1) и (2.1.2) запишем уравнение замкнутой системы (при ЛО - 0): Q(p)x + R(p)F(x, рх) = 0. (2.2.9) Периодическое решение уравнения (2.2.11) соответствует паре чисто мнимых Х^ = характеристического уравнения, т.е. равенству: Q(je>) + А(/о )[«(«>«>) + /?'(«.“)] = Л Выделив вещественную и мнимую части: Х(д, со) + jY(a, со) = 0, получим два алгебраических уравнения Х(*,ю) = 0; Г(д,со) = О, (2.2.13) корней из которых и определяются искомые амплиту- да и частота а, со периодического решения. Надо исследовать его устойчивость. Вы- вод критерия устойчивости периодического решения см. [30]. Критерий имеет вид дХ dY\* (dY дХV Л --------------------------> °: . да дсо ) \ да да J (2.2.14) где звездочка означает, что после дифферен- цирования выражений (2.2.13) надо подставить значения а и со периодического решения. В дополнение нужно потребовать, чтобы многочлен Решение ищется приближенно в форме х = о sin со/ с двумя неизвестными д и со. После гармонической линеаризации при ста- тических нелинейностях Дх) уравнение при- обретает вид е(Х)+л(Х)[?+^-х \ со > X2 + со2 (2.2.15) Q(P) + R{p) 9(a) + Р к = 0, (2.2.10) со а при динамических Дх, рх) - Q(p) + R(p) q(a,m) q(a,to) 1 + L p Ух = 0. co JJ (2.2.11) Поскольку в искомом решении а = const и со = const, то это уравнение можно рассматривать как обыкновенное ли- нейное уравнение, но с неизвестными посто- янными коэффициентами, зависящими от искомого решения, что характерно для нели- нейных систем. Характеристическое уравнение гармони- чески линеаризованной системы в общем случае: удовлетворял критерию Гурвица (или Михай- лова). В случае систем третьего и четвертого порядка для этого достаточно потребовать лишь положительности коэффициентов урав- нения. Применение алгебраического способа к системам второго класса см. в книге [29]. Частотный способ определения автоколе- баний. Для систем первого класса записывают- ся амплитудно-фазовые частотные характери- стики линейной части и статической нелиней- ности в виде = «<в>+ (2.2.16) Пара чисто мнимых корней характери- стического уравнения замкнутой системы по- является, когда -ВГЙ- <1!л”
МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ И МЕТОДЫ МАЛОГО ПАРАМЕТРА 181 Рис. 2.2.2. К определению автоколебаний Это комплексное уравнение определяет амплитуду а и частоту со. Графическое реше- ние находится пересечением В двух кривых (рис. 2.2.2), на одной из которых имеются отметки значений со, на другой а. Критерий устойчивости периодического решения (см. (30]): положительный отсчет амплитуды а вдоль кривой - 1/И^в) (см. рис. 2.2.2) должен быть направлен изнут- ри вовне через кривую И^(/со). Несимметричные автоколебания. Для их определения воспользуемся алгебраическим способом. Уравнение нелинейной системы с внеш- ним воздействием ДО (см. рис. 2.1.1, а): Q(p)x +R(p)F(x) = S(p)f(t). Положим правую часть здесь постоянной: = cf. Это может был» в двух случаях: а) /(0 = const = /°, Су = 5(0)/°; б) /(0 = /° + ct при S(p) = pSx (р), Cf=cSt(fS). Второй из них - для систем с нулевым полю- сом в передаточной функции линейной части. Решение уравнения системы Q(p)x + R(p)F(x) = Cf (2.2.18) ищется в виде колебаний с постоянной состав- ляющей: х = х° + х*; х* - a sin со/. (2.2.19) Однако несимметричные колебания мо- гут иметь место и в системе без внешнего воз- действия = 0), если F(x) - несимметрич- ная нелинейность (см. рис. 2.1.7). В результате гармонической линеариза- ции нелинейности (2.2.6. - 2.2.8) получим = Су. Вьщелим отсюда уравнение для постоянных составляющих: Q(0)x° + R(0)F°(x°,a) = Су (2.2.20) и уравнение для периодических составляющих: + я(/>)[?(а,х°) + q'(a,x°)p / = 0. (2.2.21) Постоянная составляющая Х° и колеба- тельная х*, т.е. в и со, определяются не в от- дельности, а только путем совместного реше- ния этих уравнений. Сначала из алгебраиче- ского уравнения (2.2.20) определяется зависи- мость Х° = Х°(а). (2.2.22) Затем подстановка ее в выражения q(a, Х°) и q’(a, х°) для заданной нелинейности дает но- вые выражения и графики для q(a) и q'(a). Тогда уравнение приводится к виду (2.2.10) и прежним путем решается, после чего по (2.2.22) определяется и Х°. Методы малого параметра Рассматрива- ются колебания, близкие к синусоидальным, на основе предположения о малости отклоне- ния нелинейности от линейной характеристи- ки. Так, выражения для нелинейностей вида у — F(x) заменяются на у = йх + цГ(х), где ц - малый параметр. Такой метод малого параметра разрабо- тан Б. В. Булгаковым, в том числе и для авто- матических систем. Для уравнения второго порядка р2х + со о* = ц/Х*, рх) Ван-дер-Полем был предложен приближенный метод медленно меняющихся коэффициентов. В отличие от некоторых других методов ма- лого параметра он не дает возможности по- строения высших приближений, но зато по- зволяет определить не только само периодиче- ское решение, но и процесс его установления во времени вблизи этого периодического ре- шения. Н. М. Крылов и Н. Н. Боголюбов [3] разработали асимптотический метод, позво- ляющий строить высшие приближения не
182 Глава 2.2. АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ 2.2.1. Коэффициенты тарном илю! лииеарпащн Л х) «<0) ?'(a) 1 9 = 0 при а* 1т, С 5Г 2с . « = -т«о. в**. по 9' = 0 -С § II 1 ft 1» 2 с ~о л § -I ч $1 К II И S ft< 9' = 0 F JC 2С t | С оъгъзь х а л£т£л + 1, л = 1,2,...; о 4с , Q = ~tQo, по «' = o п 0О-= V=1 —/1 - Г— ay 1а )2 F 4С . q=Tbqb' с Ч ТЧ$> а ПО 7 1 Т сч 53 1 •ft 1 ft II § 96 = --4 40 a2 Fa С - X 9- 4С = к + — па q' = 0 F С fl 2с . « = -7«0> ebfr. ПО о |< Ci 1 к II ftt __ 7п ф Л ь q^- । ft |» 1 to + T 1 (N . О « ! П •ft II f mb}2 \ a J
МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ И МЕТОДЫ МАЛОГО ПАРАМЕТРА 183 для симметричных колебаний Графики Числовые значения a/b 1 1,1 1,2 1,3 72 1,7 Яо 0 0,76 0,92 0,98 1 0,96 а/Ь 2 2,5 3 4 6 10 Яо 0,86 0,71 0,63 0,48 0,33 0,20 9i 0 а a 0 0,2 0,5 1 1,5 2 5 10 9s oo 5 2 1 0,67 0,5 0,2 0,1 0,6 ол 0,2 : ffCi J 1 ! ।—► a/b 0 1 1,2 1,7 2 2,2 Я0 0 0 0,46 0,5 0,48 0,43 0,6 a/b 2,5 2,7 3 3,2 3,5 3,7 4 и 1 £ э * о 9b 0,61 0,59 0,56 0,64 0,65 0,64 0,6 0,5 0 —ЛК II \ -0,6 1 2 За/Ь ' Г 1 г 3 afb —I— - I - I / I / " I/ - !/ a/b 1 1,1 1,2 Л 2 3 6 9s 0 0,38 0,46 0,5 0,43 0,31 0,16 -90 1 0,83 0,69 0,5 0,25 0,11 0,03 О 1 г за/ь о 1 2 з а/ь a/b 1 для m - 0,5 3 6 1,1 1,2 4i 2 9o 0,87 1,19 1,22 1,16 0,92 0,64 0,32 -9o 0,5 0,41 0,35 0,25 0,12 0,04 0,01
184 Глава 2.2. АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ q = к, при а £ Ь\ q = kq^ при а £ Ь\ b 00 = хР, Р = - q = к, при а £ Ь> q = kqn, при az к b 00 = 1 - ХР, Р = - а <7' = 0 q = kq$, при a z mb\ 00 = 1 “ Хр> mb < а <>Ь\ 90 = Х₽2 " Х₽1, » _mb Ь ₽1=-Г’ ₽2 = а ?' = 0
МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ И МЕТОДЫ МАЛОГО ПАРАМЕТРА 185 Продолжение табл. 2.2.1 Графики Числовые значения а/Ь 1 1,2 1,5 2 2,5 3 5 Яо 0 0,11 0,29 0,5 0,63 0,71 0,86 -90 0 0,18 0,28 0,32 0,30 0,28 0,20 для кусочно-линейных характеристик Х(Р) = -^(arcsin р + P-J1 - Р2] р 1,0 0,9 0,8 0,7 0,6 X 1,000 0,963 0,896 0,811 0,716 ₽ 0,5 0,4 0,3 0,2 0,1 X 0,609 0,495 0,376 0,253 0,127 1 0,5 0 к - • 1 1 1 1 1 1 ► 1 2 5 Я 5 а/Ь а/Ь 0 1 1,5 2 3 4 5 7 10 Яо 1 1 0,78 0,61 0,42 0,31 0,25 0,18 0,13 ч 0,5 0 \ ж 1 г 3 4-50/5 а/Ь 1 1,5 2 3 4 5 7 10 СО Яо 0 0,22 0,39 0,58 0,69 0,75 0,82 0,87 1 1 0.5 0 L т~0,5 LJ । » । ж 0,5 1 1,5 2 2,5 а/Ь а/Ь 0,5 0,6 Д 0,8 та т 1 = 0,5 1,5 2 3 5 10 Яо 0 0,23 0,66 1 0,91 0,75 0,53 0,33 0,17
186 Глава 2.2. АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ Дх) F-ksinx X J F*KXl X F’Xxltifnx F*x", п-нечетме Fsxnnqnxfl-4emHoe 9=Mt>; go = 1 при a £ b\ *2 (*2 . ’°-IT "U 1 o b $=—\a^b a хР; 2k r . . 9 = —^l(a). a J\ - функция Бесселя первого рода q = —ко1 = 0,75faz2 g q = —ka = 0,85faz Зя 3-5...n . л-1 q -------------kan 1 * 4-6...(Л + 0 .4 2-4...П . л-i q =--------------kan 1 * яЗ-5...(л + 1) « = у[х₽2 + ХР1] Р1=-^, ₽2=^- a>bi к 9 = у [хРз - Xp2 - XP1 + XP<] ₽i 4’ ₽*4> P’4 n th + th-lb . P 4 = ' ; , a>- *3 a ? = у[хРз -хРг-xPi] Pl =-y. P2 =-y-> e^*2 a a Рз=1-^- д' = 0 < = 0 < = 0 4b[C ^ =“• 2 jut С=Ц*2-*1) ._ 2c(bi - bj) ’ ~ 2 с = к(Ьз-Ь2) , 2k 4' =---fX ЯЛ X (h - a)№ -
МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ И МЕТОДЫ МАЛОГО ПАРАМЕТРА 187 Продолжение табл. 2.2.1
2.2.2. Гармоническая линеаризация при несимметричных колебаниях Дх) Г°(лР, а) «и А с 4 1 Л® X 2с . х° —arcsin— л а — 11 - (— 2 ла v a J 0 Г 0 ? с с xQ — +— arcsin— 2 п а — 11 f *0>|2 ла u к а J 0 С с с . х° -Ь — + —arcsin 2 п а 2< 4Р1 0 1 1 f х° ~ ГТ 11 1 ZT .2 0 b X U у «4 с ( . b + xQ — arcsin 2л а . b-xQ -arcsin + а . mb + х° + arcsin а . mb-x^\ -arcsin а ) 1- 2сд . . —j-O-»1) aL К с 0 i 1 » < С ла 1 _ Гд + х0> 1| 1 а ) 2 _1! л'» + 1 + J км1. II 1 а ) Г/лд + х0> 1 J 2 Ч < А °х 1 а 1 2 Глава 2.2. АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ
МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ И МЕТОДЫ МАЛОГО ПАРАМЕТРА 189 Продолжение табл. 2.2.2
190 Глава 2.2. АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ Продолжение табл. 2.2.2
МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ И МЕТОДЫ МАЛОГО ПАРАМЕТРА 191 Продолжение табл. 2.2.2
Дх) F°(xP, a) q(a, х°) #o(a)sinx°, /О - функция Бессе- ля первого рода нулевого порядка 2л о —/i(e)cosxu, J1 - функция Бесселя первого рода (см. табл. 2.2.1) к (х0)3 + -^х°а2 Зк Г /121 (х°)2+^- 4 г° Ла2 2—х(Р) + а + |х(Р), х° ₽=т 4Лв{) Зя 7 § " '"ПТ' 1 NJ К_> ! * Р F-Q при х< о; F~x* при х>0 / а + 2х(₽) - + х(Р)+|х(Р) 4 з4 _ а2 ft 4ft2
Продолжение таби. 2.2.2 8 q\a) Графики Глава 2.2. АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ
АВТОКОЛЕБАНИЯ В СИСТЕМАХ ВЫСОКОГО ПОРЯДКА 193 только для периодического решения, но и для процесса его установления во времени вблизи периодического решения в виде х = asin\|/ + ei/i(a,\|/) + 82i/2(fl,4/)+--- Кроме того, Н. М. Крылов и Н. Н. Бого- любов показали, что к тем же результатам первого приближения приводит энергетический баланс, т.е. сведение нелинейной задачи к ли- нейной с эквивалентными энергетическими соотношениями. На использовании введения малого па- раметра основывается также метод разделения движений [11]. Существует еще приближенный квазигармонический метод [46]. 2.2.2. АВТОКОЛЕБАНИЯ В СИСТЕМАХ ВЫСОКОГО ПОРЯДКА На примерах выявляются наиболее ха- рактерные особенности, свойственные автоко- лебаниям систем высокого порядка. Пример 2.2.1. Следящая система (рис. 2.2.3) описывается уравнениями: Рис. 2.2.4. График коэффициента гармонической линеаризации х = а-0; и = Г(х); (1\Р +1)/ = k\ и; (Т2р +1 )рР = k2i, где Дх) - нелинейная характеристика усили- теля с насыщением. Характеристическое уравнение гармони- чески линеаризованной системы: + (7| + 7*2 )А,2 + А, + knq(a) = О, *л = *1*2- После подстановки А, = усо получаем два уравнения Рис. 2.2.5. Кривые амплитуды и частоты на плоскости параметров Для характеристики с насыщением используем готовый график q(a) (см. табл. 2.2.1). С его помощью находим амплиту- ду а периодического решения, как показано на рис. 2.2.4. Имеют место автоколебания, так как критерий (2.2.14) удовлетворяется. Поскольку q(a) £ к, то условие сущест- вования автоколебаний: Х(а,ш) = 0, knq(a) - (TJ + Т^)®2 = 0; К(а,со) = 0, со - 7172®3 = 0. Из второго уравнения 1 а из первого (2.2.23) (2.2.24) (2.2.25) Рис. 2.2.3. Схема следящей системы где К = кЛк - общий коэффициент усиления разомкнутой цепи данной системы в линей- ном плане. На рис. 2.2.5 показана область автоколебаний, где изображены согласно (2.2.24) и (2.2.25) линии равных значений ши а. Пример 2.2.2. В следящей системе усили- тель имеет релейную характеристику (см. рис. 2.1.9, б). Решения (2.2.4) и (2.2.5) сохраняют свой вид. Меняется только график q(a) (рис. 2.2.6). Уравнение (2.2.25) имеет в результате два ре- шения ах и По критерию (2.2.14) оказыва- ется, что в точке а\ решение неустойчиво, а в точке а2 - устойчиво. В соответствии с этим на рис. 2.2.7 изображена зависимость амплитуды автоколебаний и неустойчивой амплитуды а\ от коэффициента усиления линейной части системы кц. При этом граничное значение коэффициента усиления 7 Зак 1023
194 Глава 2.2. АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ Рис. 2.2.6. График коэффициента гармонической Рас. 2.2.8. Амплитуда (а) частота (б) автоколебаний Рис. 2.2.7. Кривые амплитуды периодического процесса Аналогично алгебраический способ при- меняется и к нелинейным системам с динами- ческими нелинейностями, а также системам второго класса [29]. Пример 2.2.4. Для следящей системы с релейным усилителем (см. рис. 2.1.9, б), ис- пользуя выражение q(a) из табл. 2.2.1, запи- шем 1 яд2 4cVa2 - Ь2 Графически эта функция изображена на рис. 2.2.9. Передаточная функция линейной части sCTjs + lXTzs + l)’ При < ^гр равновесное состояние ус- тойчиво при любых начальных условиях. Если bn < то равновесное состояние устойчиво лишь при малых начальных отклонениях (ниже линии tJi), а при больших начальных отклонениях устанавливаются автоколебания с амплитудой ^2- “ Пример 2.2.3. В той же следящей системе реле имеет петлевую характеристику (см. рис. 2.1.9, tf). Тут характеристическое уравне- ние получает вид TjT^ +(Ti+T2))? + Х+*Л 4fa)+—А- =0, СО Решение с учетом выражений q(a) и q '(а) (см. табл. 2.2.1) определяет зависимости а и со от параметра (рис. 2.2.8). Зависи- мость со(&л) отличает эту систему от предыду- щих, где частота со не зависела от В отличие от случаев, показанных на рис. 2.2.4 и 2.2.8 с мягким возбуждением авто- колебаний (от нулевых значений начальных условий), на рис. 2.2.7 для релейной системы с зоной нечувствительности имеем жесткое возбуждение автоколебаний, требующее заброса начального состояния системы за линию Амплитудно-фазовая частотная характе- ристика для нее приведена на рис. 2.2.10. Функция - 1/И^(д) в данном случае уклады- вается вся на отрицательной части веществен- ной оси, причем на участке b £ а £ bjl ам- плитуда отсчитывается слева извне внутрь кри- вой а на участке а > Ь^2 - в обрат- ную сторону. Следовательно, первая точка пересечения а\ дает неустойчивое периодиче- ское решение, а вторая а2 - устойчивое (автоколебания), что согласуется с прежним решением (см. пример 2.2.2). Рис. 2.2.9. Обратная амплитудная т враги рмг тага иг вииг Йип г та
ИССЛЕДОВАНИЕ УСТОЙЧИВОСТИ НЕЛИНЕЙНЫХ СИСТЕМ МЕТОДОМ ЛЯПУНОВА 195 Рас. 2X12. Амплпуда смепщае несимметричных автоколебаний Пример 2.2.5. В следящей системе (рис. 2.2.11) заданы Дх) в виде рис. 2.1.9» б и передаточные функции 1\S +1 S(12s + V (2.2.26) Для решения алгебраическим способом запишем уравнение замкнутой системы (Г1Р + 1)(Г2р + 1)рх + ktk2F(х) = = *1(Т2/> + 1)/«(1). (2.2.27) Определим несимметричные автоколеба- ния при задающем воздействии g — g^t. В соответствии с (2.2.20)» (2.2.27) и табл. 2.2.2 получаем уравнение для постоянных состав- ляющих 2с х^ kfa —arcsin— = ktgi9 л а откуда находим зависимость x°=asin-^-. (2.2.28) 2с&2 Подстановка ее в выражение для q (см. табл. 2.2.2) дает Для определения частоты © и амплитуды а несимметричных автоколебаний используем уравнения (2.2.21) и (2.2.27) с данным значе- нием 9» откуда Рас. 2X11. Схема следящей системы 4ckik2T\T2 ng! Со __ . vvo - • Jc(7j + 7^) 2c^2 Тоща согласно (2.2.28) постоянная со- ставляющая (смещение) 0 = 2скхк2Т\Т2 . *g\ л(1\+Т2) ск^ Результаты представлены графически (рис. 2.2.12). Решения других конкретных задач опре- деления автоколебаний» в том числе и для нелинейных систем второго класса с двумя нелинейностями» приведены в работе [29]» ще также изложен метод и примеры вычисления высших гармоник автоколебаний как симмет- ричных» так и несимметричных. При этом вносится поправка и в первую гармонику ав- токолебаний. Для практики обычно бывает достаточно первого приближения. 2.2.3. ИССЛЕДОВАНИЕ УСТОЙЧИВОСТИ НЕЛИНЕЙНЫХ СИСТЕМ МЕТОДОМ ЛЯПУНОВА В отличие от линейных систем здесь ус- тойчивость системы может зависеть не только от структуры и параметров самой системы» но также и от исследуемого положения равнове- сия или процесса движения» и от размера на- чального отклонения» и даже от характера внешних воздействий. Поэтому при расчете нелинейных систем всегда должно оговари- ваться» какое ее состояние исследуется. Понятие устойчивости по Ляпунову. За- пишем уравнения динамики нелинейной сис- темы л-го порядка при отсутствии возмущаю- щих воздействий ^- = Ф/(х1,х2....х„), / = 1,2,...,л. (2.2.29) 7*
196 Глава 12. АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ При этом состояние системы, устойчивость которого исследуется, или как говорят, невоз- мущенное движение будет X/ = 0. Невозмущенное движение системы назы- вают устойчивым, если, задав "трубку” сколь угодно малого /1-мерного сечения с (рис. 2.2.13), можно подобрать в начальный момент t$ такую область начальных условий 8, зависящую от е, что с увеличением t возму- щенное движение х/1) не выйдет из заданной трубки е. Аналитическое определение понятия ус- тойчивости по Ляпунову формулируется сле- дующим образом. Невозмущенное движение системы X/ = 0 называют устойчивым, если при заданном е > 0, сколь бы оно мало ни было, существует такое 5 > 0, зависящее от е, что при началь- ных условиях |^/(A))|<S, / = 1, 2,...,/! (2.2.30) в дальнейшем движении (t < t < со) выполня- ется условие |х,(0|<е, / = 1, 2, (2.2.31) Если условия указанного выше опреде- ления выполнены и имеем х/1) -> 0 при t -+ со, то невозмущенное движение X/ = 0 называют асимптотически устойчивым. Если же х/1) -> 0 при t -+ со после любых началь- ных отклонений, то систему называют устой- чивой в целом. Существует еще понятие абсо- лютной устойчивости, означающее асимптоти- ческую устойчивость системы в целом при любом характере нелинейности (внутри опре- деленного класса нелинейных систем). В последующем придется иметь дело с непрерывными функциями координат состоя- ния системы V(x\, Х2, ...» хл), обладающими свойствами V= 0 при Х\ = Х2 = — = хп = 0. Рис. 2.2.13. К определении» понятия устойчивости по Ляпунову Функцию V называют знакоопределенной (положительной или отрицательной), если во всей рассматриваемой области, содержащей начало координат, она сохраняет один и тот же знак и обращается в нуль только в начале координат, как, например, при п = 3 функция V = а2х2 + Ь2х2 + с2х2. Если же функция V сохраняет один и тот же знак, но обращается в нуль не только в начале координат, то такая функция - знакопо- стоянная (положительная или отрицательная). Например, при п = 3 функция V - (xj + х2)2 + с2х2 обращается в нуль на прямой х2 — - Xj при х3 = 0. Наконец, функцию V называют знакопе- ременной, если она в рассматриваемой области не сохраняет одного и того же знака. Например, V = Xj +х2 + х3. Описанные функции V от координат со- стояния системы, обращающиеся в нуль в начале координат, играют важную роль в тео- ремах об устойчивости и неустойчивости не- линейных систем, их называют функциями Ляпунова. Пусть имеется нелинейная система, опи- сываемая уравнениями динамики (2.2.29). Составим производную функции Ляпунова по времени: dV dV dxx dV dx2 dV dxn dt Sxj dt dx2 dt dxn dt Используя (2.2.29), в силу уравнений системы можно записать dV dV dV dV —— = —Ф1 + т—Ф2 +--- + -Т—ФЛ- dt дхх дх2 дхп (2.2.32) В результате получается некоторая функ- ция координат состояния системы dV ~^‘^(хх,хг.......х„). (2.2.33) Теорема Ляпунова об устойчивости. Если для системы уравнений (2.2.29) существует знакоопределенная функция К(х), производ- ная которой dV/dt - И^х) является знакопо- стоянной противоположного знака, то реше- ние системы х = 0 устойчиво.
ИССЛЕДОВАНИЕ УСТОЙЧИВОСТИ НЕЛИНЕЙНЫХ СИСТЕМ МЕТОДОМ ЛЯПУНОВА 197 Pic. 2.2.14. К теореме Ляпунова об устойчивости На рис. 2.2.14 представлена геометриче- ская иллюстрация этой теоремы при условии И(х) > 0. Если И^(х) < 0, то фазовая траекто- рия пересекает поверхности V = С извне внутрь, а в случае W = 0 - может остаться на такой поверхности. Поэтому в теореме гово- рится просто об устойчивости, но не об асим- птотической устойчивости. Из формулировки теоремы следует, что теорема Ляпунова дает достаточные условия устойчивости решения х = 0 нелинейной сис- темы. Значит, если условие теоремы удовле- творяется, то система устойчива. Но это не означает, что система не может быть устойчива и за пределами этих условий. Насколько пол- но условия теоремы охватят действительную область устойчивости системы, зависит от вы- бора функции Ляпунова К(х). Теорема Ляпунова об асимптотической ус- тойчивости. Если для системы уравнений (2.2.29) существует знакоопределенная функ- ция К(х), производная которой dVjdt - W(x) является тоже знакоопределенной, но проти- воположного знака, то решение системы х = 0 будет устойчивым асимптотически. Геометрическая иллюстрация теоремы может быть представлена тем же рис. 2.2.14, но только с той разницей, что при К(х) > 0 имеем всюду W(x) < 0. При этом фазовая траектория, пересекая поверхности V = const извне внутрь, не может оставаться на них, а пойдет внутрь вплоть до начала координат, где х = 0 и К(х) =0. Теорема Ляпунова о неустойчивости. Если для системы уравнений (2.2.29) существует какая-нибудь функция К(х), производная ко- торой dV/dt - И^(х) является знакоопреде- ленной функцией, причем в любой сколь угодно малой окрестности начала координат, имеется область, в которой знак И(х) совпада- ет со знаком FK(x), то решение системы х = 0 неустойчиво. ,1г Рис. 2.2.15. К теореме Ляпунова о неустойчивости Геометрическая иллюстрация теоремы для случая п = 2 показана на рис. 2.2.15. А. И. Лурье разработал алгоритмы полу- чения необходимых и достаточных условий абсолютной устойчивости некоторых классов нелинейных систем методом Ляпунова. Не излагая методики в общем воде, приведем примеры ее использования. Пример 2.2.6. Уравнения нелинейной системы (рис. 2.2.16) заданы в воде (Тхр + 1)х2 = -^ixj; х = х2 - fcOc*3 J (2.2.34) (Т2р + 1)рх! = fc2x3; х3 = Г(х). В обозначениях А. И. Лурье* П1 =х2; яг = *i; пз =/>хь /(«) = F(x), вследствие чего система (2.2.34) принимает вод: 1 к\ П1 ="т[П1--угпг; иг = пз; (2.2.35) ПЗ = --^-Пз * = П1 - *осП2- У2 >2 Рис. 2.2.16. Схема нелинейной системы к примеру 2.2.6 * См. А И. Лурье. Некоторые нелинейные за- дачи теории автоматизированного управления. М.: Гостехиздат, 1951. *
198 Глава 2.2. АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ Корни определителя системы ^2 = °; ^з=“у"- 71 72 Далее вычисляем Я, = -^-; Н2 + 1 Т\Т2 1 Т2 \.Ti ) п = ; 1г =-Ы*1 +*»с); Рис. 2.2.17. Области абсолютной устойчивости иа плоскости параметров: а-(къ кос).б-(к2, М тз 72-71 &1&2 .о л. r *1*2 *ос*2 Р1 = 7Г7Г ₽2 °’ ₽3 тГТг'^7 Поэтому r2=|L+Yi = *2(*i+*2); *1 A3 9 Ф1 -Рз)(Х1 -Х3) _ 4X1X3 Рис. 2.2.18. Схема нелинейной системы к примеру 2.2.7 Условия устойчивости Г2 > 0; -4» <Г2 имеют вид: *oc>-*l! *2><>; (2.2.36) (2.2.37) *2 что показано на рис. 2.2.17. Пример 2.2.7. Система (рис. 2.2.18) опи- сывается уравнениями (Tip + l)pci = -^х3; х2 = (к2 + к3р)ху (2.2.38) pc3=F(x); x = x2-fcOcx3- Введем обозначения: П1 - *1! П2 = W Ч = х3; /(р) = F(x); система (2.2.38) принимаем вид: 1 *1 »11=П2; П2 = -=г’12--57?; л -ч i = /(а); с = *2П1 + Мз - *оЛ Кории определителя Х.| “ 0; У.2 = - 1/Tj. Далее вычисляем: М = ^-,n2 = А = X; А = -1; 71 71 71 02 = -*1*2; ₽2 = *1*2 л
ЧАСТОТНЫЙ МЕТОД ИССЛЕДОВАНИЯ УСТОЙЧИВОСТИ 199 Рве. 2.2.19. Область абсолютной устойчивости на плоскости параметров Вопрос об устойчивости решается нали- чием вещественного решения квадратного уравнения для 2a2.jk^ + alTi + кхк2 -= 0. Это будет при 0<^2 < *»с +*1*3 , (2.2.39) ед что и является условием абсолютной устойчи- вости (рис. 2.2.19). Применение метода Ляпунова к задачам теории нелинейных автоматических систем см. также [16]. 2.2.4. ЧАСТОТНЫЙ МЕТОД ИССЛЕДОВАНИЯ УСТОЙЧИВОСТИ Частотный критерий В. М. Попова опре- деления устойчивости нелинейных систем, как и метод Ляпунова, дает достаточные условия абсолютной устойчивости нелинейной систе- мы, хотя во многих случаях эти условия тоже оказываются необходимыми и достаточными. Пусть в системе имеется одна однознач- ная нелинейность: у = Дх) (рис. 2.2.20). Рас- смотрим два случая расположения характери- стики: первый - нелинейная характеристика расположена в секторе [0, £да]; второй - в сек- торе [Ао, к^. Линейная часть системы описы- вается уравнением Q(p)x = -R(p)y. Рис. 2.2.20. Характеристик* нелинейности Теорема В. М. Попова (доказательство см. [43]). Состояние равновесия нелинейной системы будет абсолютно устойчивым, если нелинейная характеристика находится в секто- ре [0, кт] (рис. 2.2.20) и существует такое дей- ствительное число Л, что при всех со 0 вы- полняется неравенство Re[(l - j®)] + у- > 0, (2.2.40) где W(j<a) - амплитудно-фазовая частотная характеристика линейной части системы. Вводится модифицированная частотная характеристика линейной части где (со) = £7(<о); Км (со) = со У (со). (2.2.41) Выражения (2.2.40), (2.2.41) преобразу- ются к виду: (<*>) - ЛКм(со) + у- > 0. (2.2.42) Это есть уравнение прямой на плоскости координат VM. Прямая проходит через точку -1/кт на оси UM и имеет крутизну на- клона 1/Л. Критерий устойчивости: состояние рав- новесия нелинейной системы абсолютно ус- тойчиво, если нелинейная характеристика F\x) находится внутри сектора [0, £т] и можно провести через точку -1/&т прямую так, что она не пересечет модифицированную частот- ную характеристику (последняя лежит справа). На рис. 2.2.21 показаны случаи (д, б), когда критерий абсолютной устойчивости вы- полняется, а на рис. 2.2.22 (а, б) - когда не выполняется. Для случая, когда нелинейная характери- стика Дх) расположена в секторе [Aq, £да] (рис. 2.2.23), неравенство (2.2.40) в теореме В. М. Попова принимает вид Re (1 + jah) . + - 1 — > 0. [ 1 + kaW(j<o) J km-k0 (2.2.43) Введя в рассмотрение модифицированную частотную характеристику (2.2.41), получаем, что уравнение [эквивалентное (2.2.43)] + ^м + 1 = 0
200 Глава 2.2. АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ б) Рис. 2.2.21. Частотные годографы для устойчивой системы, если Дх) - в секторе [0, Дгт] Рис. 2.2.22. Частотные годографы для неустойчивой системы Рис. 2.2.23. Нелинейная характеристика с ограничениями на плоскости координат модифицированной частотной характеристики (UM, VM) дает пара- болу, проходящую через точки - 1/ко и - 1/кт и имеющую в этих точках крутизну наклона касательных соответственно - 1/А и 1/Л. По- строение параболы ясно из рис. 2.2.24. Формулировка критерия’, состояние равно- весия нелинейной системы будет абсолютно устойчиво, если нелинейная характеристика находится внутри сектора [Aq, £да] и можно провести через точки -l/Ао и -l/km такую па- раболу с вертикальной осью, чтобы модифи- цированная частотная характеристика линей- ной части лежала вне этой параболы (рис. 2.2.25). На рис. 2.2.25 нельзя провести прямую через точку -\/кт так, чтобы она не пересека- ла модифицированную частотную характери- стику Я^(/(о), т.е. при более широком секторе (см. рис. 2.2.20) система была бы неустойчива. Частотный метод В. М. Попова, изло- женный выше применительно к определению устойчивости равновесного состояния систе- мы, распространен был также и на исследова- ние устойчивости процессов в нелинейных системах [22, 43]. Ряс. 2.2.24. Годограф В. М. Попом для характеристик с ограничениями Ряс. 2.2.25. Частотный годограф для устойчивой системы, если Дх) - в сегторе [ip,
ИССЛЕДОВАНИЯ УСТОЙЧИВОСТИ НЕЛИНЕЙНЫХ СИСТЕМ 291 Пример 2.2.8. Задана система (см. рис. 2.2.16), описываемая уравнениями (2.2.34). Структурное выделение линейной части системы показано на рис. 2.2.26. Для нее получаем FT(s) = Ж3(41Г1(») + *ОС]- _ ^2(^1 + ^ос) + (71<У + 1)(72<5 + 1)<У Заменив s = j(ot получаем частотную характе- ристику линейной части, где -*2 ад+t2)+t2*O(.(i+t1V -----1----5^5----------ГТ" (7i + Т2)2<о2 + (1 - Т1Т2<о2)2 - ад*»2 - ЫЪ +*ос)| a>[(7j +Т2)2и2 +(1 - TiT2<o2)2] Образуя далее модифицированную час- тотную характеристику по формуле (2.2.41), строим ее на комплексной плоскости U, V и применяем критерий В. М. Попова в форме рис. 2.2.21, если характеристика Дх) нели- нейности лежит в секторе [О, Лм] (см. рис. 2.2.20). Если же Дх) лежит в секторе [Ао, &ж] (см. рис. 2.2.23), то критерий приме- няем в форме рис. 2.2.25. Видим, что построение будет довольно громоздким и не носит общего характера, а проводится отдельно для каждого варианта численно заданных всех параметров системы. Применение метода В. М. Попова к ав- томатическим системам см. также [8, 22, 43]. Рас. 2.2.26. Структурная схема млпмйвой свстемы с выделенной линейной частью 2.2.5. ИССЛЕДОВАНИЕ УСТОЙЧИВОСТИ НЕЛИНЕЙНЫХ СИСТЕМ НА ОСНОВЕ ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ Ниже как и в п.п. 2.2.3 и 2.2.4 рассмат- риваются системы с одной нечетной симмет- ричной нелинейностью F(x). Для всех нели- нейных систем такого типа, обладающих свой- ством фильтра (см. п.2.2.1), исследование аб- солютной устойчивости (т.е. независящей от формы нелинейности) на основе метода гармо- нической линеаризации [29] дает результаты, точно совпадающие с результатами исследова- ния строгим методом Ляпунова. Но для каж- дой конкретно заданной формы нелинейности здесь можно получить более широкую область устойчивости нелинейной системы. Определение абсолютной устойчивости. Характеристическое уравнение гармонически линеаризованной системы имеет вид 0(Х) + Л(1)«(а) = а (2.2.44) Условием наличия периодического ре- шения является равенство нулю предпослед- него определителя Гурвица Нп_\ = 0. При этом все остальные фигурирующие в критерии определители должны быть положительными. В системах третьего и четвертого порядков для этого необходимо и достаточно, чтобы коэф- фициенты уравнения были положительными. Условием Нп.\ = 0 при изменении в реальных пределах значений q определяется область существования периодического решения в данной системе. Тогда условие абсолютной устойчивости для систем порядка п £ 4 будет ЯЛ-1(?) s 0 (2.2.45) при любых возможных значениях коэффици- ента гармонической линеаризации 0 £ q £ «>. Следовательно, граница области абсолютной устойчивости определится как такая совокуп- ность параметров линейной части системы, при которой обращается в нуль наименьшее значение определителя всех возмож- ных, т.е. (-®я-1(^)1наим. в 0- (2.2.46) Это наименьшее значение может иметь характер минимума функции или краевого наименьшего значения. В этих двух случаях имеем соответственно: 1) =0; 2) q - 0 или q = «о. (2.2.47) Тогда, исключив из уравнений (2.2.45) и (2.2.47) величину q> найдем границу области абсолютной устойчивости системы, выражен-
202 Глава 22 АВТОКОЛЕБАНИЯ И УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ ную через параметры линейной части системы. Если условие (2.2.47) дает не минимум, а мак- симум Hn.\(q), то это будет границей области абсолютной неустойчивости системы, внутри которой < 0 при всех возможных зна- чениях 0 £ ф £ оо. При исследовании систем выше четвер- того порядка целесообразно вместо критерия Гурвица использовать критерий Михайлова, когда берется левая часть характеристического уравнения (2.2.44) при X = /со, т.е. D(Jn) = Q(jn) + R(Jn)q = ЛГ(ю Л) + jY(p,q). Периодическое решение определяется’ уравнениями Х(<о,$) = 0, Г(<о,$) = а (2.2.48) Граница области абсолютной устойчиво- сти системы будет та, за которой не существует вещественных положительных решений этих уравнений для а и со ни при каких значениях О £ q £ оо. Пример 2.2.9. Исследуем систему, схема которой дана на рис. 2.2.16, описываемую уравнением (2.2.34). Характеристическое уравнение гармонически линеаризованной системы: Т1Т2Х3 + (Tj + Т2)Х2 + (1 + 7i*2*0C$)X + +(*1+*ос)*2?- (2.2.49) Предпоследний определитель Гурвица Нп-1 =Тг+Т2+ Tlk2(TlkoC ~ = °- (2.2.50) Формула (2.2.47) принимает здесь вид ^± = Т1*2(Т1*ОС-Т2*1) = а (2.2.51) oq Величина q не вошла в последнее выра- жение. Поэтому в данном простом примере нет необходимости исключать q из двух урав- нений, как указывалось в общем методе. Тут само выражение (2.2.51) представляет собой уравнение границы устойчивости, т.е. *ос=^- (2.2.52) 72 Проверяя положительность коэффициентов характеристического уравнения, получаем не- равенства ki + кы > 0 и &2 > 0, которые в сочетании с (2.2.52) определяют области абсолютной устойчивости, показанные на рис. 2.2.17. Полученный таким очень простым путем результат полностью совпадает с тем, который более сложными выкладками был выведен методом Ляпунова (см. п. 2.2.3) и представлял также сложности расчета частотным методом (см. п. 2.2.4). Пример 2.2.10. Рассмотрим систему (см. рис. 2.2.18), описываемую уравнениями (2.2.38). Характеристическое уравнение гармо- нически линеаризованной системы TJX3 +(1+А^сТ^)Х2 +(*Ьс +Мз)^+М20 = а (2.2.53) Предпоследний определитель Гурвица Ип-1 = *<x7i (*<>.+*1*3 )?2 + +(км + *1*3 - Txkvk2)q = 0, (2.2.54) а уравнение (2.2.47) " = ^oc^lC^oc + Мз)? + ^ос + oq + (2.2.55) Оба эти уравнения удовлетворяются при q = 0, если ^2= (2.2.56) *171 Это совпадает с полученным по методу Ляпунова условием абсолютной устойчивости (2.2.39), что изображено на рис. 2.2.19. Если же q # 0, то уравнение (2.2.54) можно разде- лить на -q и вместо (2.2.55) написать: + *1*3) = °’ dq\ q ) снкуж получаем вторую границу устойчивости = ° (см. Рис. 2.2.19). Расширение области устойчивости. Ис- пользование метода гармонической линеари- зации позволяет найти и более широкую об- ласть устойчивости при задании конкретной формы нелинейности, когда берется ограни- ченный интервал изменения коэффициента гармонической линеаризации: 4ншм. * Я * quart).* причем для каждого случая величины и Фнаиб. имеют свое определенное выражение через параметры формы нелинейности, в частных случаях может быть = 0 или Зналб. = оо. Рекомендуется следующий порядок исследования.
ИССЛЕДОВАНИЯ УСТОЙЧИВОСТИ НЕЛИНЕЙНЫХ СИСТЕМ 203 Первый шаг: исключение q из уравнений я„_1(«) = 0, ^^- = 0, oq что дает границу области абсолютной устойчи- вости при 0 £ £ £ «о. Это достаточные условия устойчивости при любой форме однозначной нечетной нелинейности. Второй шаг: расширение области устойчивости применительно к заданной не- линейности (т.е. получение дополнительной области устойчивости). Это делается путем подстановки в уравнение = О значений £наим. и 0наиб.> каждое из которых имеет конкретное выражение через параметры формы нелинейности. Получаются уже доста- точные и необходимые условия устойчивости нелинейной системы при конкретно заданной форме нелинейности, так как они являются уже границей области появления периодических решений. Пример 2.2.11. Для примера 2.2.6 область абсолютной устойчивости при 0 £ q £ » имеет вцц, показанный на рис. 2.2.17. Теперь найдем дополнительные области для конкретных не- линейностей. Если в качестве нелинейного звена 2 в згой системе (см. рис. 2.2.16) будет стоять звено с зоной нечувствительности или ограни- ченно-линейное звено с насыщением или бо- лее сложного вида нелинейности, то для всех них величина q будет иметь ограниченную сверху область изменения О £ £ 9наиб. (2.2.57) Поэтому во всех случаях для определения границы устойчивости равновесия нужно вме- сто получавшегося ранее значения q = » взять Оювб. Тогда согласно (2.2.50) граница устой- чивости будет (2Х58) n Tj АВДнаиб. Рис. 2.2.27. Расширенные области устойчивости на плоскости параметров Пример 2.2.12. Для примера 2.2.7 была получена область абсолютной устойчивости (см. рис. 2.2.19), не зависящая от вида нели- нейности. Это соответствует достаточному условию устойчивости (2.2.56). В данной сис- теме оно будет и необходимым для всех случа- ев, когда значение q = 0 является возможным. Это имеет место, в частности, для всех нели- нейностей предыдущего примера. Для нелиней- ности же на рис. 2.2.28, а имеем ^наим. = к. Это значение и надо подставить в уравнение (2.2.54) вместо q = 0 для получения новой границы устойчивости (рис. 2.2.29, а): На рис. 2.2.27, а, б показаны линии 1, опреде- ляемые этим уравнением. Из сравнения с рис. 2.2.17 следует, что ограничение возмож- ных значений q сверху в данной задаче рас- ширяет область устойчивости системы по раз- ному в зависимости от конкретного выраже- ния величины ^наиб- *7наим. = В данном случае область устойчивости равно- весия расширяется.
204 Глава 2.3. ВЫНУЖДЕННЫЕ И СМЕШАННЫЕ КОЛЕБАНИЯ Рис. 2.2.28. График коэффициента гармонической линеаризации (б) дм ломаной характеристики (а) ' Ограничение же величины q сверху при- ведет в данном примере к появлению области неустойчивости системы. Так, если q изменя- ется в пределах 0 < фнаиб. 117111 9наим. Q - 9наиб.> то условие наличия периодического решения при всех положительных параметрах может выполняться лишь при *2<-Ц^-(1 + Т1Лосднаи6.). 11*1 В противном случае будет Нп-\ < 0 при любом возможном значении q, т.е. имеется область неустойчивости (рис. 2.2.29, б или в). Другие примеры исследования устойчи- вости нелинейной системы на основе гармо- нической линеаризации см. [29]. Совпадение результатов исследования ус- тойчивости по методу Ляпунова и более про- стым путем по гармонической линеаризации имеет место для всех нелинейных систем с однозначной нечетно симметричной нелиней- ностью, обладающих свойством фильтра ли- нейной части системы. при конечном qMM 0 *ос в) Рис. 2.2.29. Области устойчивости периодического решения и неустойчивости ня плоскости параметров Глава 2.3 ВЫНУЖДЕННЫЕ И СМЕШАННЫЕ КОЛЕБАНИЯ 2.3.1. ОДНОЧАСТОТНЫЕ КОЛЕБАНИЯ. ЯВЛЕНИЕ ЗАХВАТЫВАНИЯ В нелинейных системах вынужденные колебания могут иметь сложную форму по причине отсутствия у них свойства суперпози- ции решений. Это зависит от наличия одно- временно собственных колебаний системы, а также от влияния еще внешних факторов. Одночастотные вынужденные колебания, имеющие частоту внешнего периодического воздействия, существуют как установившиеся при отсутствии собственных колебаний. В частности, в автоколебательных системах это возможно при условии так называемого захва- тывания или синхронизации. Вообще говоря,
ОДНОЧАСТОТНЫЕ КОЛЕБАНИЯ. ЯВЛЕНИЕ ЗАХВАТЫВАНИЯ 205 в нелинейных системах возможны нерассмат- риваемые здесь субгармонические колебания и другие сложные особенности вынужденных колебаний, а также возникновение скачкооб- разного резонанса [25, 36], показанного на рис. 2.1.8. Для нелинейной системы (см. рис. 2.1.1, а) с внешним воздействием = B Sin со/. (2.3.1) уравнение динамики имеет вид Q(p)x + R(p)F(x) = S(p)f(t). (2.3.2) Решение для определения амплитуды а и фазы Ф вынужденных колебаний (со -задано) ищется приближенно в форме х = a sin(co/ + ср) (2.3.3) (строго говоря, нелинейные колебания не бу- дут синусоидальными, но здесь снова действу- ет свойство фильтра линейной части системы). Произведя гармоническую линеаризацию нелинейности (2.2.2), где в формулах (2.2.3) теперь \р = со/ + ср, приводят (2.3.2) к виду Q(j>) + R(pjq(a) + ^-^-p СО >а sin(co/ + <p) = = S(p)2?sinco/. (2.3.4) Для конкретных нелинейностей исполь- зуется табл. 2.2.1. Применяя символический метод, опреде- ления периодического решения [30], получим комплексное уравнение Z(a) = JSe"/(₽, (2.3.5) где Z(a} = а Q№) + R(J^){q(a) + Jqf(a)] S(Ja)) (2.3.6) графическим решением которого (рис. 2.3.1) определяются две неизвестные а и ср. Правая часть (2.3.5) изображается окружностью радиу- са В, а левая часть Z(a) строится как кривая по точкам с переменным параметром а. Точка пересечения окружности с кривой Да) дает решение. При решении задачи на ЭВМ целесооб- разно (2.3.5) разбить на два вещественных уравнения (модуль и аргумент). Тогда для оп- ределения амплитуды вынужденных колебаний а имеем ?[х2(а,о>) + Г2(а,а>)| = Я2[л?(а>) + }%)], где X, Y - вещественная и мнимая части чис- лителя дроби, стоящей в формуле (2.3.6), а Х& Ys - то же для Д/со). Фаза же будет Y Y ср = arctg-^- - arctg—. Из картины пересечений кривых (рис. 2.3.1) вытекает, что в данном случае од- ночастотные вынужденные колебания (2.3.3) возможны только при достаточно большой амплитуде внешнего воздействия В > Вдор» а при меньшей амплитуде В будет иметь место сложное движение, включающее в себя и соб- ственную частоту системы. Такая картина на- блюдается в автоколебательных системах. Построив серию кривых Да) по форму- ле (2.3.6) для разных значений частоты внеш- него воздействия (рис. 2.3.2), получим график зависимости порогового значения 2^Ор от часто- ты со, например, в виде, изображенном на рис. 2.3.3, где сов - частота автоколебаний дан- ной системы. Выше кривой Д]ор лежит об- ласть значений Б и со, в которой существуют одночастотные вынужденные колебания. Эту область называют областью захватывания. Рис. 2.3.1. Графическое определение вынужденных колебаний Рис. 2.3.2. К определении» вынужденных колебаний при разных частотах
206 Глава 2.3. ВЫНУЖДЕННЫЕ И СМЕШАННЫЕ КОЛЕБАНИЯ Область захОатыбания Сложный процесс Сложный процесс О ofa Рве. 2.3.3. К определению обдаств захвагшваввв ва плоскости амплитуды в частоты ввевлкго воздействия Рве. 2.3.4. Серия амплитудно-частотных харажтервствк при разных воздействиях Явление захватывания состоит в том, что при > Д]Ор собственные колебания (автоко- лебания) срываются и система переходит це- ликом на одночастотные вынужденные коле- бания с частотой внешнего воздействия. На основании рис. 2.3.2 можно постро- ить зависимости а (со) и ср (со), т.е. частотные характеристики замкнутой нелинейной системы по первой гармонике (2.3.3). В отличие от линейных систем здесь характер частотных характеристик Л(со) = а(<ь)/В и ср (со) может существенно зависеть от размера внешней амплитуды В. Поэтому для разных значений В получается серия частотных характеристик (рис. 2.3.4). Расчет частотных характеристик нели- нейных автоматических систем см. [25]. Пример 2.3.1. Уравнение системы (Т1Р + 1)(Т2/> + l)px + kF(x) = = (Ti/> + ОС?!/» + 1)/У(0 при гистерезисной нелинейности (см. рис. 2.1.9, е) и Д|) = В sin со/. Тоща в урав- нении (2.3.5) согласно (2.3.6) будет Z(a) = а 1 - 4g(a) + Jg'(a)] (T1+T2)<02 -Xl-T^o2) Рве. 2.3.5. Првмер определения mibj hjbbbih niirffinl 00^5 Ю IS 20 25 30 Рве. 2.3.6. График амплитуды в фазы выиуждеяных колебаний Для заданной частоты со = 10 с*1 и за- данных параметров системы к = 10, с = 10, b = 4, Т\ = 0,01 с, Tj = 0,02 с кривая Z{a) изображена на рис. 2.3.5, где отмечены значе- ния а. Проведя окружности разных радиусов В, по точкам пересечения определим зависи- мости а(В) и <р(В) (рис. 2.3.6) для вынужден- ных колебаний при данной частоте. Пример 2.3.2. Аналитически определим условия захватывания в системе с идеальном реле (рис. 2.3.7): (Tip + iyx2=k1xi;xl =«(0-х4;х = х2-хос; (Т2р + 1)рх4 = *2х3; Хос = *осХ4; х3 = F(x). Периодическое внешнее воздействие g— В sin со/. Здесь q = Ьс/ка. Поэтому об- щее уравнение системы: (Т1Р + 1)(Т2Р + 1)рх + (fcocTjp + *! + +*«)*гЛх) = *i (Т2/> +1)/«(0,
ВЫСШИЕ ГАРМОНИКИ ВЫНУЖДЕННЫХ КОЛЕБАНИЙ 207 Рве. 2.3.7. Схема нелинейной системы с идеальным реле а уравнение (2.3.5) - (2.3.6) принимает вид 7ta(TiJ(o + 1)(Т2/о + 1)усо + ^(^осТ^усо + к± + + *ос)*2 = + ОУ®- Вещественная и мнимая части этого ра- венства: 4c(ki + fcoc)^ “ *»(Л + Л)®2 = = (Т^со coscp - sintp), (ла ч-^Л^ос)® “ я»ЛЛ®3 = = 7^1 Ао(?2со sin <р + coscp). Решением этих двух уравнений находим амплитуду вынужденных колебаний G + ЯТцо ± ^(G + ЯГ1Ш)2 - (1 + Г/ш2)^2 + Я2 - я^В2) л(1 + Л2(О2) (2.3.7) и фазу <р = -arctg 1 , G - тш где Р _ 46^2(7*2^1 + Л^ос ~ Л^ос) . 7’2<о2+1 s Ьск^к^ + к0С+Т1Т2к0Са>2) <л(Т2ш2 +1) Амплитуда а по своему смыслу есть ве- щественная положительная величина. Поэтому искомое решение для вынужденных колебаний существует (т.е. явление захватывания имеет место) в том случае, если формула (2.3.7) дает вещественный положительный ответ для а. На основании этого, учитывая, что G + ЯДсо > 0> ПРИ положительных парамет- рах системы получаем условие захватывания _2> 2о2 > (# “ G?i®)2 п Л Ki Л £--------=—=—. (2.3.8) 1 4- Т2 (О 2 Данная нелинейная система переходит на одночастотные вынужденные колебания с за- данной извне частотой со только в том случае, когда амплитуда В внешнего периодического воздействия превосходит некоторое пороговое значение, определяемое формулой (2.3.8). Этот порог захватывания зависит от соотно- шения параметров системы и от величины задаваемой извне частоты со, так как через них вычисляются фигурирующие здесь величины (?иЯ. 2.3.2. ВЫСШИЕ ГАРМОНИКИ ВЫНУЖДЕННЫХ КОЛЕБАНИЙ Учитывая высшие гармоники одночас- тотных колебаний, можно рассчитывать выну- жденные колебания нелинейной системы, происходящие не только от синусоидального воздействия, но и от более сложных периоди- ческих внешних воздействий, например, пи- лообразного с треугольным профилем, прямо- угольного и других, в которых первая гармо- ника разложения и ряд Фурье является основ- ной. Теорию этих задач см. [29]. Решение задачи ищется в форме (ограни- чиваясь конечным числом гармоник) п x-xi + ^xk, jq = a sin(cof 4-гр), (2.3.9) к=2 где Х{ - первая гармоника, а хк - высшие: х* = 5ла81п(А<оГ4-фЛ), к = 2,3,...,л, (2.3.10) где Ьк - относительная амплитуда к-й гармони- ки. Полагается, что величина 8* мала по срав- нению с единицей (по свойству фильтра). В уравнении динамики нелинейной сис- темы (2.3.2) внешнее воздействие в разложен- ной в ряд Фурье форме будет (так же ограни- чиваясь конечным числом п гармоник) п f(t) - BY sinсоГ4- ^Вк sin(fao/4- В*). *=2 (2.3.11) Высшие гармоники на выходе нелиней- ности Дх)
208 Глава 2.3. ВЫНУЖДЕННЫЕ И СМЕШАННЫЕ КОЛЕБАНИЯ п FT = a^(rk sin + sk cos fop), (2.3.12) к=2 где \р = (at + <р, причем 2л гк = — i F(a sin \|/) sin kydy; na J о 2л sk = — f F(a sin \|/) cos kydy. na j о (2.3.13) Для определения высших гармоник ис- комого решения (2.3.10) имеем ряд уравнений Q(p)xk + R(P)a(rk sin fop + sk cos fop) = = S(p)Bk sin(foo/ + &*), к = 2,3,..., л, (2.3.14) Представляя sin(foo/+ В*) = sin(fop - fop + B^) и используя символическую запись синусои- дальных колебаний, из уравнений (2.3.14) получаем формулы для вычисления относи- тельной амплитуды Ьк и фазы ($к каждой к-й гармоники: 8* = Q(Jlaa) Кк J к) S(jkto) Вк . CO'foo) а (2.3.15) vk=++ , sk cJ£b CO'foo) a j , к = 2,3,...,л. Если внешнее периодическое воздейст- вие синусоидальное (Вк = 0), то формулы для высших гармоник вынужденных колебаний упрощаются: 5* = R(№ I 2 2 0(yfoo)|* к к ’ к = 2,3,...,л, ф£ = arg -R(Jkto) Q(jha) (2.3.16) Sk + arctg—+ fop. rk Первая же гармоника вынужденных ко- лебаний (2.3.9) определяется обычно по пер- вому приближению (см. п. 2.3.1). Но ее можно уточнить за счет учета найденных высших гармоник нелинейных колебаний [29]. Обычно бывает достаточным учет третьей гармоники. В табл. 2.3.1 даны выражения ко- эффициентов третьей гармоники для типовых нелинейностей. Пример 2.3.3. Определим высшие гармо- ники вынужденных колебаний при несину- соидальном периодическом внешнем воздей- ствии в системе автоматического регулирова- ния третьего порядка (рис. 2.3.8, а) с релейной характеристикой общего вида, описываемой уравнениями: (Т22р2 +Tlp + l)px2 =fcrb Xi=F(x), x = f(t)-x2. Эти уравнения приводим к виду (Т2р2 +T\p + \)px + kF(x)~ = (T2p2+TiP + l)pf(t). Внешнее воздействие Д7) имеет форму пилы (рис. 2.3.8, б), которая представляется рядом Фурье: 8Л f . 1 . , "j 2п fit) = Sin со/—Sin3co/+... , со = ——, I а Р Т ’ П 4 > 7 2в где Тъ - период fit). Согласно (2.3.11) имеем: Рис. 2.3.8. К определении» высотах гармоник: а - схема системы; б - внешнее воздействие
2.3.1. Таблица коэффициевтов кя и Г3 Дх) Нелинейный коэффициент кн Коэффициенты третьей гармоники F[ С И т к» = — 4С а = ; S3 = 0 3 Зла ’ 3 Ft С 0 b X fc = 2с nja2 - b2 и а * s р Сч 1 II о р О 1 р NJ Fk к - , 2С н <4 р | Q 1 еч les' *-4- з|я еч |ечА ' Д *18 4—11 *11 II с 0~Ь X q С 0 mb Ь X ки = — . 1 + . 1-- -»2 fc-w) 2с С А L ( ^}2 (1 Am2^2^li (т^\2 1-4-Т11- — +1-4— Зла 'а' 1 и J] \ о J 2сЬ Г 4b2 ( 4m2d2>) J] ВЫСШИЕ ГАРМОНИКИ ВЫНУЖДЕННЫХ КОЛЕБАНИЙ

Продолжение таб. 2.3.1 © Коэффициенты третьей гармоники ка2 7^ = -—; $3=0 I N и» $3=о 5
НЕСИММЕТРИЧНЫЕ ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ 211 Найдем сначала первое приближение для а и <р первой гармоники согласно (2.3.5) и (2.3.6): аГ + Л>(1-Т22«>2)-71<о2 где q и q' для нелинейности рис. 2.1.9, а см. в табл. 2.2.1, где b\ = mb, bi = b. Для определения амплитуды §з и фазы ФЗ третьей гармоники следует предварительно найти коэффициенты rj и S3. По формулам табл. 2.3.1 их легко получить в числовом виде, так как все входящие сюда величины уже из- вестны. Тогда относительная амплитуда §з и фаза ФЗ для третьей гармоники вынужденных коле- баний (с учетом третьей гармоники внешнего воздействия): ^Оз+^з) с/Зф ! М j’3co(l - 9Т22со 2) - 97\<й 2 9л2а Рис. 2.3.9. Схема нелинейно* системы с двумя воздействиями Решение ищется в форме х = х° + х*, х* = a sin(co/ + ф), (2.3.18) где искомыми величинами являются Х°, а и ф, а частота со задана внешним периодическим воздействием. При гармонической линеаризации нели- нейности здесь можно использовать все гото- вые выражения: F°(x°,a), q(q,x°), q’{a,x°) (2.3.19) для типовых нелинейностей (см. табл. 2.2.2). Итак, уравнение системы (2.3.17) будет 2(/0(*° + **) + Я(/0 F0 + ($ + — /мх \ со / + JS3) ФЗ = агб ------------п п---------¥ ^У3®(1 - 9Т22со2) - 97\со2 е/3ф = S(p)l?sincof + Cf. 8h 9х2а. Разделим это уравнение на два: для постоян- ных и колебательных составляющих 0(0)х° + R(fi)F° (x°,a) = Cf; (2.3.20) Получим результат: х- o(sin(cof+ ф) + 53 8т(3<вГ + фз)], соответствующий пилообразному внешнему воздействию на нелинейную систему. 2.3.3. НЕСИММЕТРИЧНЫЕ ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ Если в системе имеется несимметричная нелинейность или же при симметричной не- линейности к системе наряду с периодическим внешним воздействием Д1) приложено еще и другое внешнее воздействие /(/) (рис. 2.3.9), то будут иметь место несимметричные вынуж- денные колебания. Уравнение динамики не- линейной системы Q(p)x + R(p)F(x) = + Cf, (2.3.17) где//) - периодическое воздействие (2.3.1), а Cf расшифровывается так же, как в п. 2.2.1 по воздействию Q(p) + R(j>)\q(a,x°) + СО X ха sin(co/ + ф) = S(p)B sin со/. (2.3.21) Несмотря на то что формально уравне- ния разделены, решать их можно только со- вместно, так как в оба уравнения входят неиз- вестные х° и а, что отражает специфику нели- нейных систем. Из первого уравнения находится зависи- мость Х°(а). Второе уравнение путем подста- новок р = Jo и sin со/ = преобразуется, как и выше (см. п. 2.3.1), к виду Z(a) = ее’-*, (2.3.22) Уравнение это решается графически (см. рис. 2.3.2). Определив таким образом величины а и Ф при различных параметрах В и со внешнего воздействия, по найденной выше зависимости х°(а) можно определить и величину смещения х°.
212 Глава 2.3. ВЫНУЖДЕННЫЕ И СМЕШАННЫЕ КОЛЕБАНИЯ При решении задачи на ЭВМ удобнее взять модули левой и правой частей ком- плексного уравнения (2.3.22 ) и, используя (2.3.20), решать два уравнения с двумя неиз- вестными а и Х°: 2(0)х° + Я(0)Г°(х°,а) = С/; (2.3.23) a2[jf2(<o,a,x°) + y2(<o,a,x°)j = = В2[х*(о>) + уЛ<4 где Ху Y - вещественная и мнимая части чис- лителя дроби в написанном выше выражении Z(a), a X» Ys - то же для знаменателя 5(/<о). Фаза же <р определится как аргумент выраже- ния (2.3.22) Y Y Ф = arctg—г- - arctg—. (2.3.24) A j Л Пример 2.3.4. К системе (см. рис. 2.3.9) приложено кроме периодического flj) еще внешнее воздействие f\(f) = c^t. Уравнение линейной части задано в виде (Т\р + 1)(Т^р + + l)pxi = - ку, а Нелинейность - рис. 2.1.9, в. Общее уравнение системы: (Г1Р + 1)(Т2 р + 1)рх + kF(x) = = <ТхР + 1)(Т2р + !)/>/(/) + q. После подстановки гармонически линеа- ризованного выражения Дх) из табл. 2.2.2 уравнение системы разбивается на два: kF\x\a) = q; а 1 + *|g(a,x°)+_/?(<»,х°)1 -JTfT^ta3 - (Tj + Г2)в>2 +je> Подставив в первое уравнение выраже- ние Р, получим . b + xQ . b-xQ пс} arcsin--------arcsin---------= —7-, (2.3.25) а а ск откуда определяется Х°(а). Записав квадрат модуля левой и правой частей второго уравнения в виде а2 (Г, +T2)o>2]2 + + ^'(в,х0) + и-Г1Т2<о3] |= (2.3.26) = 52[(7i +Т2)2и2 +<о2(1-Т1Т2о>2)2] и подставив сюда найденное уже выражение х°(а), определим амплитуду вынужденных колебаний а при заданных В, <о и q. Для построения зависимости Х° и а от параметров внешних воздействий q, В> со при проектировании следящей системы поступают следующим образом. Задаваясь разными а и х°, вычисляют по (2.3.25) величину q, а из (2.3.26) - величину В при заданной частоте со. По полученным данным строится зависимость а(В) при разных q = const и заданной со. Затем вычисления по формуле (2.3.26) повто- ряются при других значениях частоты со. 2.3.4. ДВУХЧАСТОТНЫЕ НЕЛИНЕЙНЫЕ КОЛЕБАНИЯ При исследовании вынужденных колеба- ний в нелинейных автоколебательных системах предполагалось выполнение условий захваты- вания. При этом автоколебания "срывались" и в системе устанавливалась частота внешнего воздействия. Однако бывает необходимость расчета двухчастотных колебаний - собствен- ных с наложением вынужденных (при невы- полнении условий захватывания). Кроме того, возможны и двух- или многочастотные собст- венные или вынужденные колебания. Колебания с большой разницей частот. В этом случае можно применить метод гармо- нической линеаризации в прежней форме. Исследуем двухчастотный процесс авто- колебаний в системе Q(p)x + R(p)F(x) = 0, обозначив верхнюю частоту cq, а нижнюю <о2- Приближенное решение ищется в виде х = х°+х*, x* = asin<oiZ; (2.3.27) х° = a0 sin(co2Z + ф). Согласно (2.2.21) и (2.2.20) записываются уравнения для определения х* и Х°: (?(/>) + £(/>) 9(а,х°) + ►х* = 0; ~^ГР (2.3.28) Q(p)x° + R(p)F° (х°, а) = 0 (2.3.29) с той разницей, что теперь Х° не постоянна, а медленно меняющаяся (2.3.27), но коэффици- енты гармонической линеаризации q и q' вы- числяем по тем же формулам табл. 2.2.2. Характеристическое уравнение для (2.3.28):
ДВУХЧАСТОТНЫЕ НЕЛИНЕЙНЫЕ КОЛЕБАНИЯ 213 С(Х) + Л(Х) q(a, х°) + р = о. (О С подстановкой X = у со выделяются ве- щественная и мнимая части: Х(а,<о,х°) = 0; Г(а,<о,х°) = 0. Отсюда находятся зависимости а(х°) и <о(х°). Полученную а(х°) подставляют в имеющееся для заданной нелинейности выра- жение /°(х°,а) (см. табл. 2.2.2), результате чего получают новую функцию Г° = #(х°,а(х0)) = Ф(х°), называемую функцией смещения. Тоща уравнение (2.3.29) для медленной составляющей х°(/) будет Q(p)x° + Я(р)Ф(х°) = 0, где функция Ф(х°) играет роль новой нели- нейности, заменяющей Дх) при прохождении в системе медленного сигнала Х°(/)- Функция смещения Ф(х°) вблизи начала отсчета получает обычно вид плавной одно- значной кривой (рис. 2.3.10) даже для разрыв- ных релейных характеристик, в том числе гисг терезисных и с зоной нечувствительности. Можно провести обычную линеаризацию функции смещения в виде Ф = £нх°, (доказательство последнего равенства см. [29]). Величину кн (см. рис. 2.3.10) называют нели- нейным коэффициентом усиления медленной составляющей. Тоща уравнение (2.3.29) при- мет вид [<2(/>) + kHR(p)]x0 = о. (2.3.31) Значения кц для типовых нелинейностей приведены в табл. 2.3.1, где ас обозначает вы- ражение для амплитуды симметричных (при Х° = 0, п. 2.2.2) автоколебаний в исследуемой системе через ее параметры. Поэтому для по- лучения уравнения (2.3.31) достаточно решить (2.3.28) не в полном виде, а только при Х° = 0). Несмотря на обычный способ линеа- ризации (2.3.30) тут сохраняются нелинейные свойства системы, так как в выражении кц присутствует величина ас. Итак, решением уравнения (2.3.31) определяются медленные колебания х° = a0 sin(to2^ + ф) > после чего найденная выше из (2.3.28) зависимость а(х°) позволяет определить амплитуду, а затем и частоту быст- рых колебаний х* = a sin со . При двухчастотных вынужденных и сме- шанных колебаниях нелинейной системы воз- можны три варианта: а) обе частоты со i и со 2 относятся к вынужденным колебаниям; б) частота coj - вынужденная, а частота со 2 - собственная; в) наоборот, верхняя частота coj - собственная, а нижняя со2 - вынужденная. Последние два случая имеют место в автоколе- бательных нелинейных системах с внешним периодическим воздействием при отсутствии захватывания (см. рис. 2.3.3). Уравнения ди- намики нелинейной системы в указанных трех случаях: a) Q(j>)x+ R(j>)F(x) = Sx(p)M)+S2(p)f2(t)-, (2.3.32) б) Q(p)x + Л(/>)/(х) = 5, (p)fi (0; (2.3.33) В) Q(p)x + R(p)F(x) = S2(j>)f2(t), (2.3.34) где /1(0 = B\ Sinead; fl(0 = sin(co 2* + 3), co! » co 2- В первом случае, когда обе частоты coi и со 2 соответствуют вынужденным колебаниям, решение ищется в форме х = х°+х*; х* = sinfajZ + cpj); (2.3.35) х° = a0 sin(co + Ф2 )• (2.3.36) Гармоническая линеаризация нелиней- ности проводится по формулам табл. 2.2.2. Уравнение системы (2.3.32) после гармо- нической линеаризации разбивается на два:
214 Глава 23. ВЫНУЖДЕННЫЕ И СМЕШАННЫЕ КОЛЕБАНИЯ 0(р)Х° +Л(р)Г0(х°,а1) = S2(p)f2(J)- Q(p) + R(j>) + (2.3.37) gj(gl.XB) ®1 X xai sin((o j/ + cpi) = 5*1 (p)Bi sin co Из последнего определяются амплитуда ai (х°) и фаза <pi(x°) вынужденных колебаний верхней частоты «1 способом, изложенным в п. 2.3.3. Затем в полученном выражении полагается = О, что дает значение а*., необ- ходимое для нахождения коэффициента к„ (см. табл. 2.3.1). Первое уравнение (2.3.37) примет вцд [0(Р) + *нЯ(/>)]о° sin(<o2r +ф2) = = *5*2 00-^2 Sin(o 2/ + 3), (2.3.38) откуда е(ло2)+м*(>2)г (2.3.39) (р2 = 9 .—г- е(л>2)+^нЛ(/о2) Во втором случае (2.3.33) решение ищет- ся в той же форме (2.3.35) и (2.3.36), но с неизвестной частотой (о2. При этом сохраняет- ся первый этап решения для получения 0i(x°) и Ф1(*°)« Но первое уравнение (2.3.37) будет иметь справа нуль, а уравнение (2.3.38) [<?(/>)+*нЯ(/>)]х° =0. Наконец, в третьем случае (2.3.34) реше- ние ищется в форме х = х°+х*; х* = ai sin<01/; а° = В2 х° = а2 sin(o> 2t + <p) (2.3.40) с неизвестной частотой (ор В этом случае пер- вое уравнение (2.3.37) сохраняется прежним, а второе уравнение принимает вид сй>)+яа>)91(а1,х0) (0 •х* = О, откуда амплитуда и частота ©i автоколеба- ний определяются в виде ai(x°) и ®1(х°) (см. гл. 2.2). После этого второй этап решения будет таким же, как в первом случае. Колебания без ограничения близости час- тот*. Решение для двухчастотных автоколеба- ний ищется в виде х = х1 + х2 = «1 sinw 1/ + а2 sin((o 2t + (р) (2.3.41) с неизвестными ар сор а2, со2. Предположим наличие в линейной части системы такого свойства фильтра, что линей- ная часть системы подавляет все гармоники, кроме двух: с частотой <oi и с частотой <о2. В соответствии с этим напишем гармонически линеаризованное выражение нелинейности F(x) (вывод формул см. [29]) Л*) = 91х! + q2x2, (2.3.42) где q\ и qi - коэффициенты гармонической линеаризации: <h где 1 т 1 ’ ^2=—^— 2л ai 2л а2 (2.3.43)- 2л 2л Л = f sin ц/ + а2 sin(v|/ + (р)) х о о х sin ц/Лр, (2.3.44) 2л 2л у2 = F(ai sin ц/ + а2 sin(v|/ + (р)) х о о х sin(\|/ + (р)Лр. При определении двухчастотных автоко- лебаний в системе (?(/>)х + Я(р)£(х) = 0 с подстановкой (2.3.42) получим два уравне- ния: [Q(p) + Л(р)?1(аь «2)1^1 = 0; [<2О) + R(p)q2(a2,ai)\x2 = 0, которые должны решаться совместно. Харак- теристические уравнения с подстановками X = jcoi и X =/»2 после выделения веществен- ных и мнимых частей дают четыре уравнения: .¥1(01,02,(01) « 0; У1(01,02,<О1) = 0; ^202»^1»^2) = ^2 02» ® 2 ) = 0 для определения четырех неизвестных ар (Ор 02, w2> в искомом решении (2.3.41).
ДВУХЧАСТОТНЫЕ НЕЛИНЕЙНЫЕ КОЛЕБАНИЯ 215 Пример 2.3.5. В характеристике (см. рис. 2.1.9, д), где с = 1, переключения реле с 77=1на77=-1и обратно будут происходить при 01 Sin у + «2 sin(xp + (р) - 0 . Следова- тельно, . 01 Sin ч/ , 1, при О£\|/ + Ф^л + arcsin----------- (02 > а\); «2 . 0i sin у л . 0i sin ч/ -1, при л + arcsin —-------£ ц/ + (р <, 2 л - arcsin —---; ^2 а2 . 0i sin ч/ 1, при 2л - arcsin —1ц/ + (р 2л. а2 В результате интегрирования (2.3.44) по- сле преобразований получаем 91 = 8(Р -1) К(к} + 8 Е(к), л 02Л л^01& к = — < 1, 02 где */2 л «*>- J, у., ; о ^1-кzsinz\|/ */2 _____________ £(&) = J - к2 sin2 \ptfy о представляют собой полные эллиптические ин- тегралы соответственно первого и второго рода, числовые значения которых имеются в математических таблицах. Вычисления по этой формуле дают величину коэффициента гармо- нической, линеаризации 91(01) при разных значениях 02 (рис. 2.3.11, а). Для коэффици- ента 92 можно пользоваться тем же графиком с заменой соответственно q\ на эд а1 на а2> 02 на 0р Для характеристики с насыщением зави- симость 91(01) при разных 02 представлена на рис. 2.3.11, б. Аналогично определяется и эд Пример 2.3.6. Определение двухчастот- ных вынужденных колебаний (без ограниче- ния близости частот). Система (рис. 2.3.12) содержит реле F(x) (см. рис. 2.1.9, ф, где с = 1. Приложены два внешних периодиче- ских воздействия с разными частотами: /1 = l?i sin со i/; /2 = ^2 sin(<o + &)• Уравнения системы заданы: (71/> + 1)(Т2Р + 1)г = *у; > = F(x); х =+ f2(t) - z. в) Рис. 2.3.11. Графики коэффициентов двухчастотных автоколебаний два системы: а - релейной; б - с насыщением Рис. 2.3.12. Схема системы с двухчастотным внеаним воздействием
216 Глава 2.4. НЕЛИНЕЙНЫЕ ПРОЦЕССЫ УПРАВЛЕНИЯ Решение для вынужденных колебаний ищется в виде х = Xi + х2 = ai sin(<o 1Z + ср 1) + + а2 sin(<o2Z +(р2). Гармоническая линеаризация F(x) = ?|(ab a2)xj + q2(a2,al)x2. Зависимости <71(#1,Я2) и ^2(а2>а1) даны на рис. 2.3.11, а. В результате уравнение всей системы: С(р)(Х1 + х2) + Я(/»)(91*1 +42*1) = = S(p)(fl+f2); Q(p) = S(p) = (TlP + l)(T2p + l), R(p) = k. Уравнение распадается на два взаимосвя- занные относительно Х{ и х2. К каждому из них применяются формулы (см. п. 2.3.1): *У1(Д1.Дг) а1 1+ ; т l + (Tj+T2)/#i = Я1е-л’1, Д2 1 + ______^2<д2,О1) 1 + (Т1 + Т2)У<о2 - Т\Т2(И2 = Я2е-У(ф2"д). Применяя графический способ решения (см. п. 2.3.1, но с учетом взаимосвязи коэф- фициентов q\ и <?2) находим четыре неизвест- ные ay а2, (pi, Ф2- Числовые расчеты проведены для сле- дующих данных: 71 = 0,02; Т2 = 0,1; к = 10; 3 = 0; = 1,372; с»! = 2; В2 = 1,372; <о2 = 5. Результаты расчета: ах - 0,4; а2 = 0,9; ф1 = 1,52; ф2 = 1,695; qx = 0,72; Я2 ~ 1,32. По этим данным на рис 2.3.13, построе- на кривая полученных двухчастотных вынуж- денных колебаний (штриховая линия). Для сравнения сплошной линией показана точная кривая колебаний данной нелинейной систе- мы. Другой подход к определению двухчас- тотных колебаний см. [36]. Рис. 2.3.13. Двухчастотные колебания Глава 2.4 НЕЛИНЕЙНЫЕ ПРОЦЕССЫ УПРАВЛЕНИЯ 2.4.1. ОЦЕНКИ КАЧЕСТВА ПЕРЕХОДНЫХ ПРОЦЕССОВ В системе, обладающей свойством фильтра, e(p)x + *(p)F(x) = 0 (2.4.1) переходный процесс определяется в виде х = a(t) sin ф(0; (2.4.2) da d\u — = ^(e); -^ = о>(а), (2.4.3) причем затухающему процессу соответствуют отрицательные значения Коэффициент зату- хания £ может быть большим, но медленно меняющимся, как и частота <о (в линейных системах они постоянны). Гармоническая линеаризация нелиней- ности (вывод см. [29]): 7(a) + q'(a) Р-1 (2.4.4) где коэффициенты гармонической линеариза- ции q(a) и q\a) для статических нелинейно- стей сохраняют прежние выражения (табл. 2.2.1). Характеристическое уравнение для гар- монически линеаризованной системы (2.4.1) будет С(Х) + Я(Х) 7(а) + 9-(а)— (0 = а Искомый колебательный переходный процесс (рис. 2.4.1, а, б) соответствует нали- чию пары комплексных корней X = £ ±у<о, т.е. 2(5 +» + Я(5 + у®)[?(а) + ??'(«)] = 0- (2.4.5)
ОЦЕНКИ КАЧЕСТВА ПЕРЕХОДНЫХ ПРОЦЕССОВ 217 Рис. 2.4.1. Переходные процессы: а - сходящийся; б - расходящийся Подстановку значения X = £ + в лю- бой многочлен удобно выполнять путем раз- ложения его в ряд по степеням Jo: О£+Л>) = ОЮ+(^) /«> + \ ак; - 1 f d2Q\ 2lldX.2 J (>)2+- + ^И где индекс £ означает, что в выражения произ- водных надо подставить £ вместо X. В комплексном уравнении (2.4.5) содер- жатся три неизвестные £, со, а, что позволяет найти две переменные как функции третьей: £ = £(а); со = со (а). (2.4.6) Когда эти функции найдены, можно, пользуясь двумя дифференциальными уравне- ниями первого порядка (2.4.3), найти a(f) и \|/(/). Однако операция интегрирования этих уравнений для оценки качества переходных процессов в автоматических системах не тре- буется. В большинстве случаев вполне доста- точно ограничиться нахождением функций (2.4.6) из комплексного алгебраического урав- нения (2.4.5), так как качество колебательного переходного процесса (см. рис. 2.4.1) вполне может быть охарактеризовано величинами £ и со в зависимости от амплитуды колебаний а и от параметров системы. Рис. 2.4.2. Диграммы запухшая нелинейных процессов Оценка качества по диаграммам качества затухании нелинейных колебаний. Диаграмма эта представляет собой семейство линий £ = const (рис. 2.4.2, а) и со = const (рис. 2.4.2, 6) на плоскости с координатами к, а, причем к - подлежащий выбору параметр системы (коэффициент усиления или др.). Для линейной системы линии £ = const и со = const в тех же координатах имели бы вид вертикальных прямых, а в нелинейной системе они искривляются или наклоняются в зависимости от формы нелинейности и от общей структуры системы. Значение £ = О соответствует отсутствию затухания, как, например, в точке С (см. рис. 2.4.2, а). Поэтому линия £ = 0 на диаграмме качества затухания представляет собой зависи- мость амплитуды автоколебаний ас от пара- метра системы к. Протеканию переходного процесса во времени соответствует движение изображаю- щей точки М (см. рис. 2.4.2) по вертикали (к = const). Так, значению к в точке L соот- ветствует вертикальная прямая MqL, Пересе-
218 Глава 2.4. НЕЛИНЕЙНЫЕ ПРОЦЕССЫ УПРАВЛЕНИЯ кающая линии только с отрицательными зна- чениями £. При этом изменение частоты со (а) определяется по соответствующей вертикали на рис. 2.4.2, б. В том случае, коща параметр к иссле- дуемой системы имеет значение, соответст- вующее точке Еу получается два варианта про- текания переходного процесса. Если начальное положение изображающей точки будет ниже точки С(ао < ас), то £ > 0 - колебания расхо- дятся. Если же Oq < ас, то £ < 0 - изображаю- щая точка пойдет по прямой НС вниз (см. рис. 2.4.2), что соответствует затухающему переходному процессу, асимптотически при- ближающемуся к автоколебаниям с амплиту- дой ас. Такие диаграммы могут служить мате- риалом для выбора наилучших параметров системы при ее проектировании. Введем в рассмотрение текущую "постоянную времени" для огибающей колеба- тельного переходного процесса в.«> В линейной системе величина Т была бы по- стоянной во времени. Здесь же эта "постоянная времени" медленно меняется с изменением амплитуды в соответствии с най- денным законом изменения £(а). Беря из диаграммы (см. рис. 2.4.2, а) для заданного к значения £ при разных а, начиная со значения Од при t = 0, и откладывая каждый раз вели- чину Т(а) на оси времени (рис. 2.4.3), получа- ем отрезки касательных, очерчивающих оги- бающую a(f) переходного процесса. Пример 2.4.1. Система (см. рис. 2.2.16) описывается уравнениями: (Tip +1)*2 = х3 - ^(х) - с sign х; (Т2р + l)pxi = *2*з; X =х2 - кжхь Заменяем F(x) = q(a)x, q(a) = —. па Характеристическое уравнение 7,72А? + (7, +72)Х2 + + [1 + Tlk2kocq(a)]X + (fc, + кж)к^(а) = 0. Подстановка X = £ + /со дает X(qM+JY(q^,e>) = 0 или в развернутом виде + (7,+72)^2 + +(1 + TfakocqK + (*, + kx)k2q - -(37,7^4-7,+72)<о2 =0; Y s 37,72Е,2 + 2(7, + 72)!j +1 + + 7,£2£oc£ - 7,72<»2 = а Из второго уравнения с учетом значения q(a) находим 2 v2 1 4cfc2*oc Т\Т2 4 7,72 пТ2а (2.4.8) а из первого 1де 4ск2 /(О = 4^Д + 2 1 + + 8(7, + 72)£2 + 87,72£3. (2.4.10) г,Г, Диаграммы качества нелинейных пере- ходных процессов в виде линий £ = const и со = const в зависимости от параметра ki по- строены по этим уравнениям (рис. 2.4.4, а, 6), где выявляются область устойчивости системы OG и область автоколебаний Gk\. Линия со = 0 характеризует границу колебательных (правее) и монотонных (левее) переходных процессов. а = + , (2.4.9) U2 J -L
ОЦЕНКИ КАЧЕСТВА ПЕРЕХОДНЫХ ПРОЦЕССОВ 219 Для оценки качества переходного про- цесса при одном заданном значении со- гласно вертикали DB (см. рис. 2.4.4, а) строят (с изменением амплитуды колебаний от на- чального значения ад до конечного а^) графи- ки £(а) и со (а) - рис. 2.4.5. Аналогично и на рис. 2.4.6 - для значения согласно верти- кали EF (см. рис. 2.4.4, а) с определением амплитуды автоколебаний 'ас. Процесс уста- новления автоколебаний (вблизи точки £ = 0) по малости £ может быть определен аналити- чески. При этом из (2.4.9) (Т\+Т2)(а-ас) * 2Т1Т2(Яа + Р) ’ где _ ^^2^1 (^2^1 ~ ^*ос) . с" я(Т1+Т2) Я = 1+; Р = —JtjJtoJi. ЛЪ * Это позволяет проинтегрировать уравне- ние (2.4.3) и найти огибающую колебаний 0(4- Рас. 2.4.6. Измеяеяае коэффвцкота затухшая частоты ори штмшмбшвмх IlfSiep 2.4.2. Система управления давле- нием р имеет зазор в механической передаче (рис. 2.4.7). Гармоническая линеаризация дан- ной нелинейности (зазор) для переходного процесса с сильным затуханием согласно (2.4.4): Р1 = ?(°)+^—-я'(а) р. (О где q и q' см. в табл. 2.2.1, а их графическое изображение - на рис. 2.4.8.
220 Глава 2.4. НЕЛИНЕЙНЫЕ ПРОЦЕССЫ УПРАВЛЕНИЯ Рве. 2.4.7. Схема следящей системы при наличии зазора Рис. 2.4.8. Графики коэффициентов гармонической линеаризации элемента с зазором Передаточные функции звеньев системы: ^1 = *. , *2 ; W3=k3; S(1 + 1) Записав уравнение = получим: системы в виде ф(а) + ;?'(«)] = -[<; + (7i + Т2)^2 - - (7i + Т2)о>2 + Ttr^3 - 2rtr2^ - rt4] - — ypo + 2(7j + + 37|72§2e> — TjT^oi^j- Положим 7i = 0,2» ?2 = ОД. Годографы левой части этого уравнения построены (рис. 2.4.9) по параметру b/а (Ь - половина ширины зазо- ра) для разных значений к. Там же представ- лены годографы правой части этого уравнения по параметру со для разных значений £. Точки пересечения обеих кривых дают решение, причем в них определяются все числовые зна- чения: к, а/Ьу со. Полученные результаты и позволяют построить искомую диаграмму качества в виде линий £ = const и со = const на плоскости с координатами а/b и к (рис. 2.4.10). Кривая £ = 0 (автоколебания) расположена в интервале (к^, к'^). Здесь имеются три области: 0 < к < к'^ - система устойчива, к'^ < к < к!^ - режим автоколе- баний, к > к'^ - система неустойчива. При этом значение к'^ совпадает со значением &гр для линейной системы, когда Pi = Р (рис. 2.4.7). Следовательно, зазор вызывает автоколебания с большой амплитудой там, где по линейной теории система устойчива. Рис. 2.4.9. К определению коэффициента затухания £ и частоты со с изменением параметра к и амплитуды а
ПРОЦЕССЫ УПРАВЛЕНИЯ ПРИ НАЛОЖЕНИИ ВИБРАЦИЙ 221 Рис. 2.4.10. Изображение результатов на плоскости л, к Оценки качества по частотному критерию абсолютной устойчивости. Нелинейная харак- теристика F[x) расположена в секторе [0, £т] (см. рис. 2.2.20). На комплексной плоскости вместо модифицированной (2.2.41) строится смещенная частотная характеристика, опреде- ляемая следующим образом: ^см(Л» - И) = исм (0>Л) +;исм (о>Л), гае t/CM(«>,!;) = -HD; Исм(о>Л)=<»1т1ГлО-^). Из критерия абсолютной устойчивости (см. п. 2.2.4) вытекает следующая оценка: не- линейная система с устойчивой линейной частью и нелинейной характеристикой, распо- ложенной внутри сектора [0, кт\, будет обла- дать показателем затухания, не меньшим дан- ного | § |, если через точку - 1/кт можно про- вести прямую так, что она не пересечет сме- щенной характеристики аналогично рис. 2.2.21. Можно определить предельное значение кт, при котором в системе имеет место пока- затель затухания не меньше |^|, если кривая Исы пройдет через точку - 1/кт. Оценки качества, связанные с абсолют- ной устойчивостью, см. также [2]. Другие оценки будут даны в п. 2.4.4. 2.4.2. ПРОЦЕССЫ УПРАВЛЕНИЯ ПРИ НАЛОЖЕНИИ ВИБРАЦИЙ Вибрации, наложенные на процесс управления в нелинейной автоматической системе, могут быть либо собственными - ав- токолебательными, либо вынужденными. Процессы управления в автоколебатель- ных системах. В уравнении системы Q(p)x + R(p)F(x) = S(p)f(t) (2.4.11) ДО - внешнее задающее или возмущающее воздействие, медленно меняющееся во време- ни по сравнению с автоколебательной состав- ляющей процесса. На входе нелинейности х = х°(Г) + х * (Z); x* = asin<oZ, (2.4.12) где - медленная составляющая, которая представляет собой основной сигнал управления. Как и при несимметричных колебаниях (см. п. 2.2.1), здесь Х°(0 и амплитуда а взаимосвя- заны. Поэтому а будет тоже медленно изме- няться во времени в процессе управления. Используем прежние формулы гармонической линеаризации (2.2.6) - (2.2.8) (см. табл. 2.2.2). Уравнение системы (2.4.11) распадается на два OGO + (2.4.13) Q(p)x° + R(p)F° = (2.4.14) Первое из них решается тем же путем, как (2.3.28), и определяет зависимости а(х°) и <о(х°). Затем, как и там, находится коэффици- ент кц (см. табл. 2.3.1). В результате уравнение (2.4.14) примет вид [<2(Р) + kHR(pfy° = S(p)f(t), (2.4.15) причем входящая в выражения кн величина ас определяет зависимость кц не только от вида нелинейности, но и от структуры и парамет- ров каждой конкретной системы. Итак, процесс управления при наличии автоколебательных вибраций определяется в нелинейной системе решением линейного уравнения (2.4.15), но со специфическими свойствами коэффициента кц, отражающим нелинейный характер системы. С таким подходом можно исследовать и процессы скользящего типа в нелинейных системах высокого порядка, рассматривая виб- рации с малой амплитудой (около скользящего процесса) как автоколебательные (см. [26], [29]).
2XL Глава 24. НЕЛИНЕЙНЫЕ ПРОЦЕССЫ УПРАВЛЕНИЯ Прямер 2.4.3. В системе с идеальной ре- лейной характеристикой (см. рис. 2.3.7) зада- ны = '(Тк*л ; 71$+ 1 S(l2S + l) F(x) - с sign х и коэффициент жесткой обратной связи Общее уравнение динамики системы с двумя внешними воздействиями (71^ + l)(T2p + 1)#х + + £| + +*ос)*гЛх) = ki(T2P + i)pg(t) - (2.4.16) —(^oc^iP ** )/"(/). Гармоническая линеаризация нелиней- ности дает F(x) = F0(x°,a) + q(a9xQ)x*9 где согласно табл. 2.2.2. «О 2с . х° 4с fx°1 Г” =—arcsin—; q =—Jl- — . x a xa v a J (2*4.17) Коэффициент усиления нелинейности в процессе управления согласно табл. 2.3.1, = — «е где ас - амплитуда симметричных автоколеба- ний в данной системе. Исследуя уравнение (2.4.16) при х° - 0, gffi « 0, fify ж 0 (см. п. 2.2.1), находим ас = 40^271(72^1 - Tjfcpc) x(7i+72) . (2.4.18) Тоща к -- Т\+Т2 я ПМА-ТМ' ( ’9) Итак, общее уравнение динамики систе- мы относительно переменной х° для процесса управления принимает вид jTiTxp3 + (7i + Т2)р2 + р + + (*о<71Р + *1 + *ос)*2*и]*° = = кх(Т2р + l)pg(f) - (k^TiP+kj + kx)f(t). Дальше при всех заданных параметрах эту систему можно рассчитывать как обыкновен- ную линейную, определяя устойчивость и ка- чество процесса управления. Но при выборе параметров системы надо учитывать выраже- ние для кц (2.4.19). Чтобы определить амплитуду автоколеба- ний, наложенных на процесс управления, надо сравнить выражение q (2.4.17) с таковым при Х° = 0, что дает откуда где ас - (2.4.18). Пример 2.4.4. В следящей системе (рис. 2.4.11) задающее воздействие а меняется произвольным образом. Уравнение системы <Т\Р + 1)(Т2Р + l)pi + (к2 + k3p)F(i) = = (Т1/> + 1)/« (2.4.20) с нелинейностью ДО - рис. 2.1.11, б. Нужно исследовать процесс слежения в случае, когда в системе возникают автоколебания. Нелинейный коэффициент усиления для процесса управления при данной нелинейно- сти согласно табл. 2.3.1 кп = —arcsin—, (2.4.21) х ас rjifi ас - амплитуда симметричных автоколеба- ний.
ПОМЕХОУСТОЙЧИВОСТЬ ПРИ ВИБРАЦИЯХ 223 Рис. 2.4.12. График коэффициента гармонической линеаризации д(а) Она определяется согласно п. 2.2.1 из уравнения 9(ас) к2Т}Т2-к3(Т\+Т2У (2Л-22) причем выражение для д (см. табл. 2.2.2) будет Отсюда ас определяется графически на рис. 2.4.12, где через h обозначена правая часть уравнения (2.4.22). С введением коэффициента кц (2.4.21) * уравнение процесса управления принимает линеаризованный вид (<TlP + 1)(Т2р + 1)р + кн(к2 + k3p))i° = = (1\р + 1)ра. В соответствии с написанными форму- лами можно изобразить зависимости кц от всех основных параметров системы. Процессы управления с вынужденными вибрациями. Уравнение динамики системы Q(p)x + R(p)F(x) = (р)М), (2.4.23) где f(t) - В ЫН tot, a/i(/) - медленное по сравнению с ним внеш- нее воздействие. Решение для процесса управ- ления ищется в виде х = х°(/) + х ♦ (/); х* = a sin(<o/ + <р), где х°(/) предполагается медленной состав- ляющей по сравнению с периодической х*. Гармоническая линеаризация нелинейности проводится по формулам (2.2.6) - (2.2.8) с использованием табл. 2.2.2. При этом заданное уравнение системы (2.4.23) разбивается на два: Q(p)x° + R(p)F°(x°,a) = 5!(p)/i(/); (2.4.24) a sin(<o/ + <р) = = S(p)Bsin®/. (2.4.25) Последнее уравнение решается, как в п. 2.3.3, и определяются а(х9) и ф(х°). Первое же уравнение определяет ход процесса управления в совокупности с най- денной периодической составляющей (вынужденными колебаниями). Чтобы найти процесс управления х°(/), нужно определить коэффициент к PH 'х°=0 - ^н(ас)» где ас - амплитуда симметричных вынужден- ных колебаний, найденная для данной систе- мы по правилам п. 2.3.1. Для конкретных не- линейностей выражения кц(ас) даны в табл. 2.3.1. В результате уравнение (2.4.24) представ- ляется в виде [<2(Р) + к„ Л(р)]х°(/) = 5i(p)/i(/), (2.4.26) где величина существенно зависит от ам- плитуды вынужденных колебаний ас, а эта последняя определяется амплитудой В и час- тотой со внешнего периодического воздействия, а также структурой и параметрами системы: к» ~ к^В, со, к^ Tt). При всех заданных параметрах системы и заданном 0 = 2? sin со/ последнее уравнение может быть проанализировано с целью опре- деления любых качеств процесса управления Х°(/) обычными методами линейной теории автоматического регулирования и управления. Однако при решении задачи не анализа, а синтеза ход решения будет несколько другой, чем в линейной теории, ввиду указанной спе- цифики коэффициента к^. 2.4.3. ПОМЕХОУСТОЙЧИВОСТЬ ПРИ ВИБРАЦИЯХ. СГЛАЖИВАНИЕ НЕЛИНЕЙНОСТЕЙ Вибрационная помехоустойчивость. При наличии внешнего периодического воздейст- вия Д1) = В sin со/ (вибрационной помехи) (см. п. 2.4.2) коэффициент усиления нелиней- ного звена по полезному сигналу управления кн зависит от В и со. Отсюда следует, что все
224 Глава 2.4. НЕЛИНЕЙНЫЕ ПРОЦЕССЫ УПРАВЛЕНИЯ стороны качества процессов управления x9(t) согласно уравнению (2.4.26) будут существенно зависеть от амплитуды В и частоты со внешней вибрационной помехи. От них будут зависеть даже условия устойчивости системы, поскольку кн войдет в характеристическое уравнение системы. Это является важным и иногда опасным специфическим свойством нелинейных сис- тем. В чисто линейных системах оно отсутст- вует. Пусть, например, система устойчива в отсутствие вибраций при значениях какого- либо параметра к линейной части в интервале к\ < к < к2. Пусть при появлении вибрацион- ной помехи изменяется коэффициент ха- рактеристического уравнения системы (2.4.26) таким образом, что с увеличением амплитуды вибраций теряется устойчивость. Тогда можно изобразить границу и область устойчивости системы в зависимости от амплитуды вибра- ционной помехи на плоскости к, В при за- данной частоте со (рис. 2.4.13). Этот график и иллюстрирует вибрацион- ную помехоустойчивость нелинейной автома- тической системы. Рис. 2.4.13. Область устойчивости на плоскости "параметр к - внешняя амплитуда В* Пример 2.4.5. Определим допустимую амплитуду внешней вибрационной помехи из условия устойчивости системы управления самолетом по тангажу (рис. 2.4.14). Такой помехой являются упругие вибрации корпуса самолета, измеряемые чувствительным гиро- скопом вместе с полезным сигналом (поворо- том самолета как твердого тела). Уравнение движения самолета (р3 + atp2 + а2р + а3)9 = ко(Гор +1)8, где 3 и 5 - отклонение угла положения само- лета по тангажу и отклонение руля. Уравнение измерительного устройства системы: х, = (к1 + Л2р)[» +/](/) + fl (/)], где /(/) - медленно меняющееся воздействие; f2(f) - внешняя вибрационная помеха: J2(O = В sin со/, со = 100. Уравнение рулевой машины с ограничением скорости (см. рис. 2.1.11, б): (7> + 1)р8 = F(x), x = xl-xoc, хос = fcoc8. Если Т = 0,08, то амплитуда помехи на выходе рулевой машины будет ослаблена в 800 раз. Это позволяет считать, что силовые линейные звенья, стоящие после нелинейно- сти, практически не пропускают данную час- тоту. Тогда, амплитуда симметричных вынуж- денных колебаний на входе нелинейности ас = В^к} 4-^2® 2 • (2.4.27) Уравнение рулевой машины в условиях вынужденных вибраций имеет вид (Тр + 1)р6 = кнх, где - согласно табл. 2.3.1 будет . . b кп =—arcsin—. (2.4.28) л ас Найдем предельное значение амплитуды Д при которой нарушается устойчивость сис- темы. Характеристическое уравнение системы имеет вид Лор5 + Л1Р4 4- Л2р3 4- Л3р2 4- А^р 4- = а Напишем критерий устойчивости Гурвица Aq > 0; Aj > 0,...; А$ > 0; (Л1Л2 - ЛоЛ3) > 0; (2.4.29) Н = (4А2 - AqA3)(A3A4 - А2А5) - - (Л1Л4 - Л0Л5)2 > 0.
ПОМЕХОУСТОЙЧИВОСТЬ ПРИ ВИБРАЦИЯХ 225 Pic. 2.4.15. График изменения величины Н(к^) Последнее неравенство при некоторых числовых значениях коэффициентов принима- ет вид (рис. 2.4.15) Я(&н) = + 14»2*н + 6,51fcH > °- (2.4.30) Все условия устойчивости (2.4.29) вы- полняются только при кц > 13,7. Из выраже- ния (2.4.28) получим максимально допусти- мую амплитуду вынужденных колебаний на входе нелинейности: flmax = ZT > ^Hmin ~ 13,7. SinZElHmin 2к Например, при к = 80, b = 0,5 имеем Отт = 1,87. Согласно формуле (2.4.27) мак- симально допустимая амплитуда внешней виб- рационной помехи/>(/) будет Дпах __gmax ^к2 + кг®2 = 0,047 при к\ - 0,9; к} = 0,4; со =100. Если при вычислении определителя Гур- вица Н в неравенстве (2.4.30) оставить не за- данным еще другой параметр системы, напри- мер, то можно построить границу устой- чивости системы на плоскости параметров Лое (рис. 2.4.16). Параметр кц можно пересчи- тать на величину амплитуды внешней вибра- ционной помехи. Зная последнюю, можно легко выбрать основные параметры автопилота с учетом описанного выше нелинейного эф- фекта, исходя из заданных качеств процесса управления. Аналогично, вибрационная помехоустой- чивость определяется и при автоколебательных вибрациях. Сглаживание нелинейностей внешними вибрациями. Рассмотрим два варианта решения такой задачи. Вариант первый - внешнее периодическое воздействие //) прикладывается непосредст- венно на входе нелинейного звена (рис. 2.4.17,1). Другое внешнее воздействие - медленное по сравнению с ним. По условиям фильтра в звене 2 амплитуда вынужденных колебаний переменной будет незначительной. Тогда можно считать, иго и переменная Xj практиче- ски не содержит колебательной составляющей и будет определяться медленным воздействием /1(1). В результате переменная х на входе не- линейности будет х = х° + х*, причем х° = X! -х3; х* = /(/) = Usincof. (2.4.31) В данном случае амплитуда а и фаза ср вынужденных колебаний а = д, ср = 0. (2.4.32) # ftD-Bstncrt wt Pic. 2.4.17. Дм варианта (I II) приложения внешего периодического воздействия к нелинейной системе 8 Зак 1023
226 Глава 2.4. НЕЛИНЕЙНЫЕ ПРОЦЕССЫ УПРАВЛЕНИЯ Теперь непосредственно находим сгла- женную характеристику (см. рис. 2.3.10) 2я Ф(х°) = F° = — f F(x° + 5 sin \|/)<fy. о (2.4.33) Для типовых нелинейностей можно вос- пользоваться готовыми формулами для (см. табл. 2.2.2), заменив в них а на В. Это и будет сглаженная нелинейная характеристика. Коэф- фициент усиления медленного сигнала • <2-434) Vox ;хо=о Для типовых нелинейностей в готовых формулах (см. табл. 2.3.1) тоже заменяется ас на В. Замену Ф(х°) = &нх° называют вибра- ционной линеаризацией нелинейности. При этом необходимо обеспечить ма- лость амплитуды вынужденных колебаний переменной Хз по сравнению с внешней ам- плитудой В (см. рис. 2.4.17, I), т.е. нужно слабое пропускание вынуждающей частоты <о линейным звеном 2 совместно с нелинейно- стью: 7?2(в) + («'(в))21^2(>)| « 1, (2.4.35) где в выражении q и q' подставляется а = В. Отсюда определяется необходимая величина этой частоты <о. Она к тому же должна быть значительно выше возможных частот медлен- ного сигнала х9(1) и/1(1). Сглаженную характеристику можно сде- лать точно линейной, если периодическое внешнее воздействие Д|) будет иметь пилооб- разную форму, как, например, на рис. 2.3.8, что тоже применяется в технике. Вариант второй - внешнее периодиче- ское воздействие flfi прикладывается не на вход нелинейного звена (рис. 2.4.17, II). Здесь тоже накладываются требования малости ам- плитуды вынужденных колебаний переменной Хз, что обеспечивается свойством фильтра звена 2. Тогда хп = х® + 5 sin со/; *1 = (0 + а sin(®r + <р), где а-4|Ж1(До)|; ф = argW*i(/oo). (2.4.36) Далее, имея в виду пренебрежимую ма- лость колебательной составляющей перемен- ной Хз, получим х - х°(0 + asin(<o/ + ф), х® = х® - Х3. Итак, в данном случае имеем линейную зависимость амплитуды переменной х от ам- плитуды внешнего воздействия (2.4.36). Сгла- женная нелинейная характеристика 2я Ф(х°) = К° = —]>(*° + asiny)ity, * о Ф(х°) = £нХ°, где а определяется согласно (2.4.36). Для ко- эффициента кн (см. табл. 2.3.1) тоже ас ж а. Пример 2.4.6. Уравнение системы (см. рис. 2.3.9) О\Р + 1)(Т2р + 1)рх + kF(x) = = (T1/> + l)(T2p + l)p[/(/) + /i(0], где Дх) - релейная нелинейность (см. рис. 2.1.9, в). В уравнении системы /1(0 - медленное воздействие, а /(0 = Я Sin со Г. Здесь имеем первый вариант. Поэтому соглас- но (2.4.33) и табл. 2.2.2. _z 0\ ₽0 с( • Ь + Х° Ф(х) = /^ =—I arcsin—— я В Задавшись В = 1, с = 1, b = 0,2, изобразим эту сглаженную характеристику (рис. 2.4.18). Коэффициент усиления сигнала управления в нелинейном звене (см. табл. 2.3.1) *н =----= 0,65. Х(В2 - Ь1) . 6-х® -arcsin—— В 9 Рис. 24.18. Фужади смеащвм
КОРРЕКЦИЯ НЕЛИНЕЙНЫХ СИСТЕМ 227 Для процесса управления получаем ли- нейное уравнение [(Т1/> + 1)(Т2р + 1)/> + А*н]х°(Г) = = (Tip + 0(^2? + ОМ (0* При этом требуется обеспечить соблюде- ние условия (2.4.35) hlg2+(g')2 а>7(71 + Г2)2<о2 + (TiTje»2 - О2 где согласно табл. 2.2.2 и условию (2.4.32) При значениях Т\ = 0,02; Т\ = 0,1; к = 10; с = 1; b = 0,2; В = 1 получаем q - 1,25; q ’ = -0,25. Тоща, например, значе- ние частоты (о - 100 обеспечивает выполнение написанного условия с уменьшением пример- но в 100 раз. Вабрацмввое сглаживание иелиейпостей е вомоовыо автпгпмгбапий. Для этой цели ор- ганизуют в системе внутренний контур, охва- тывающий нелинейность (рис. 2.4.19). Пара- метры этого контура подбираются так, чтобы возникающие автоколебания имели достаточно высокую частоту, которая бы практически не пропускалась остальной частью системы. Пусть уравнение внутреннего контура по переменной х юнею вид й(р)+Л(р)^х°)+5:^^/’ ** = о; (О (2.4.38) й(р)*° + 1«р)Р*(х*,а) = Л^)х5. Определив из первого величину а(х9), и найдем сглаженную характеристику Ф(х°) = F°(x°,a(x0)), линеаризуемую затем в виде Ф(х°) = ^х0. 2Ж4. КОРРЕКЦИЯ НЕЛИНЕЙНЫХ СИСТЕМ Для достижения требуемой точности и качества процесса в нелинейные системы можно вводить линейные корректирующие устройства такие же, как и в линейных систе- мах, а также и специальные нелинейные и псевдолинейные корректирующие устройства. Ливейвжя коррекция нелинейных систем [26]. Рассмотрим системы типа рис. 2.4.20 с одной нечетной симметричной однозначной нелинейностью Дх), гармоническая линеари- зация которой имеет вид F(x) - q(a)x, (2.4.39) где коэффициент гармонической линеариза- ции принимает ограниченные значения ОЗ 9 <; 9Ж или $н $ 0 £ 0т. (2.4.40) Ql (р)х + j?i (p)F(x) = N(J>)X5, (2.4.37) причем вход х$ в этот контур из остальной части системы шрает для этого контура роль медленного внешнего воздействия. Уравнение (2.4.37) разбивается на два: Ряс. 2.4.20. Схема недянейной следящей састемы 8*
228 Глава 2.4. НЕЛИНЕЙНЫЕ ПРОЦЕССЫ УПРАВЛЕНИЯ Линейное корректирующее устройство любого типа вводится в одну из линейных частей W\(s) или И^($), не охватывая нели- нейного звена Дх). Синтез корректирующих устройств проводится следующим образом. 1. Строится логарифмическая амплитуд- ная частотная характеристика первоначально заданной линейной части системы. 2. Формируется желаемая логарифмиче- ская амплитудная частотная характеристика линейной части Яж(/®) в соответствии с тре- бованиями точности и качества процессов, как это изложено в теории линейных систем. 3. Синтезируется линейное корректи- рующее устройство также методом линейной теории. 4. Вычерчивается логарифмическая фазо- вая частотная характеристика полученной скорректированной линейной части системы. В дополнение ко всем этим операциям, выполняемым по линейной теории, добавляет- ся еще один пункт, учитывающий нелиней- ность Дх). 5. Для данной нелинейности с использо- ванием коэффициента q(a) строится "запрет- ная" зона, соответствующая желаемому показа- телю колебательности М. Внутрь этой зоны не должна заходить фазовая частотная характери- стика скорректированной линейной системы. Поэтому надо определить такую запрет- ную зону по показателю колебательности при заданной нелинейности. Пишем передаточную функцию разомкнутой цепи W'(5,a) = ^(i)9(e) и замкнутой системы ф(,а)= = gww l + W(s,d) l+q(a)Wn(s) Выделяем вещественную и мнимую части: ВД = им + jV(<s>). Для показателя колебательности М - |ф(/<о,а)| имеем выражение q-Ju2+У2 ,l(l + qU)2+(qV)2 ’ Отсюда после преобразования получаем урав- нение линий равных значений М на ком- плексной плоскости (U, V): (U-U0)2 -V2 = R2; (2.4.41) Uo = - м2 . R_ М q(M2-l) . (2.4.42) С изменением q (2.4.40) согласно (2.4.42) координата центра окружности Uq и радиус R будут меняться в определенных для каждой нелинейности пределах. Следовательно, каж- дая линия М = const будет определяться как огибающая непрерывного множества посте- пенно меняющихся окружностей. При этом в случае первого неравенства (2.4.40) линия М = const будет незамкнутой (рис. 2.4.21, а), так как в начальной точке q = 0 имеем Uq = оо, R = оо. Показанные на рис. 2.4.21, а величины R\ и U\ согласно (2.4.42) определя- ются выражениями R^—^— =----- qm(M2-\) qm(M2 (2ААЗ) В случае второго неравенства (2.4.40) линия М = const будет замкнутой (рис. 2.4.21, в), причем D Л/ М2 9н(1и2-1) <?„(A/2-i) (2.4.44) а значения R\ и U\ - прежние (2.4.43). Поскольку синтез линейного корректи- рующего устройства проводится по логариф- мическим частотным характеристикам, то изображенные на рис. 2.4.21, а, в линии М = const (запретные зоны) должны быть перенесены в систему координат логарифми- ческих характеристик. Это показано соответст- венно на рис. 2.4.21, б, г. Рас. 2.4.21. Расчетные графики (а, в) и фазовые частотные характеристики (б, г) для случаев: 0^ q^ qm (а, 6) in qn <, q <, qm (в, г)
КОРРЕКЦИЯ НЕЛИНЕЙНЫХ СИСТЕМ 229 Нелинейные корректирующие устройства. Специального вида корректирующие нелиней- ности можно вводить как в нелинейную, так и в линейную систему, в результате чего послед- няя становится нелинейной. Нелинейная кор- рекция дает большое разнообразие форм час- тотных характеристик и вносит их зависимость от величины амплитуды сигнала. Последнее придает системе некоторые свойства самона- стройки по величине ошибки в процессе управления. При этом открывается возмож- ность преодолевать известное из линейной теории противоречие между требованиями точности и требованиями устойчивости систе- мы, а также значительно усиливать регули- рующее воздействие при больших отклонени- ях. Можно ослаблять негативное влияние не- линейности (зазор, гистерезис, зона нечувст- вительности) на процесс управления. Пример 2.4.7. В системе (рис. 2.4.22) с нелинейной обратной связью, сигнал которой уменьшается с возрастанием ошибки, достига- ется убыстрение отработки больших отклоне- ний и уменьшение скорости отработки в кон- це процесса. Уравнение системы в переходном про- цессе без внешнего воздействия (Oj = 0) имеет вид + (^1 + Т2)р2 + (1 + ^ос)р + “ - = °! (2.4.45) ^ос ~ ^2^3^5> Гармоническая линеаризация входящей сюда нелинейности F(x) = |х[рх для переходного процесса, согласно (2.4.4) и (2.2.3) дает Характеристическое уравнение системы (2.4.45) TjTjX3 + (Г] + Г2)Х2 + (1 + ЛОС)Х + к + 4a + + £) = <>• STt После подстановки X = £ + получаем два уравнения: TtT^3 + (Т1 + т^г + 1 + кж - 3TiT2«>2 -^-^А + Л-(Т1+Т2)<»2 = 0; Зл / ЗТ^Т^2®) + 2<o(7j + 7*2 )£ + 1 + Хос - - — к'оса - Т\Т2(п 2= 0. Зл / Из второго уравнения = з§2 +2Д±Д5+1±^_^^-а> 1\Т2 1\Т2 Зп1\Т2 а из первого 0 =----( + + ' Uiek+Д^2 Г V 7j7j ) / I (7i ^-Т^)2 к . 7i +72 , . v + (1 + fcocX + * _z £ - к + J_ z (1 + к~) ГН2 Т\Т2 F(x) = 9(a) + g-(<»)—- (О (2.4.46) На основании этих двух формул можно построить диаграммы качества нелинейных переходных процессов (см. п. 2.4.1) по любому параметру, например, по параметру к. Можно также при всех заданных параметрах опреде- лить зависимости £(а) и <о(а) и провести оценки качества переходных процессов. Рис. 2.4.22. Схема системы с нелинейной коррекцией 8 и , 4
230 Глава 2.4. НЕЛИНЕЙНЫЕ ПРОЦЕССЫ УПРАВЛЕНИЯ Псекдолшкйиая коррекция. Псевдоли- нейными корректирующими устройствами называют такие нелинейные корректирующие устройства, у которых эквивалентные переда- точные функции (а значит, и коэффициенты гармонической линеаризации), в отличие от обычного зависят только от частоты и не зависят от амплитуды. Однако эта зависимость от частоты - нелинейная в том смысле, что ха- рактер ее отличается от частотной зависимости линейных передаточных функций и может быть произвольным, т.е. отсутствует жесткая связь между амплитудными и фазовыми ха- рактеристиками, которая имеется у линейных звеньев. Эго важное преимущество псевдоли- нейных устройств позволяет корректировать фазовые отношения независимо от амплитуд- ных и наоборот. Результат гармонической линеаризации при исследовании устойчивости для псевдоли- нейной функции F(x) имеет вид F(x) = 9(<в)+^Ц/> ; (D а при исследовании колебательных переход- ных процессов F(x) = r9(<o)+^(p-yL (D Формулы для вычисления q и д’ остаются прежними (см. гл. 2.2). Пример 2.4.8. Рассмотрим задачу сущест- венного уменьшения инерционности аперио- дического звена, т.е. отставания выходного сигнала по фазе у = arctg 7®. При помощи ключа (рис. 2.4.23, а) отсекаются хвостовые части выходного сигнала, причем последний приобретает форму, показанную штриховкой на рис. 2.4.23, б. Тоща выражения (2.2.3) для коэффициентов гармонической линеаризации примут вид: ? _ ^COS.Y.|COSM/(X _ у) + Эди у]; (2.4.47) , fcsin2w. . где ц/ = arctg То; q и q' зависят лишь от час- тоты со, но не от амплитуды, что характерно для псевдолинейных корректирующих уст- ройств. Таким образом, вместо уравнения (Тр + l)y = кх получим для скорректирован- ного апериодического звена [Г* («о)р + ф> = к ♦ (®)х, в котором новые эквивалентные постоянная времени Т* и коэффициент усиления к* оп- ределяются формулами г._ Ig'M. <оф(<о) ’ .. = g2(<»)+[<>'(<» )]2 «(“) через q((o) и д’(<в) (2.4.47). Эти зависимости приведены на рис. 2.4.24. Видно существенное снижение инерционности (например, при <в Т = 2 получается Г* = 0,5 Т). Вопросы коррекции и синтеза нелиней- ных автоматических систем см. [24, 26, 29, 42]. Ф Рис. 2.4.23. Не инейное корректируйте устройство: а - схема; б - к описанию принципа действия Рис. 2.4.24. Графики изменения коэффициентов Л*(в), 7*(в) при нелинейной коррекции
УРАВНЕНИЕ РЕЛЕЙНОЙ СИСТЕМЫ 231 Глава 2.5 ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ* 15.1. УРАВНЕНИЕ РЕЛЕЙНОЙ СИСТЕМЫ В гл. 2.1. дано определение нелинейных систем, частным видом которых являются сис- темы, содержащие в контуре управления ре- лейный элемент (рис. 2.5.1). Релейный эле- мент представляет собой статическую нели- нейность, вид которой задается одним из гра- фиков (см. рис. 2.1.9). Нелинейность, порож- денная релейным элементом, является разрыв- ной. Переключение реле происходит при дос- тижении сигналом х порогового значения (д, -by bi, -bi). Различают двух- и трехпозиционные ре- лейные элементы. Выходной сигнал с двухпо- зиционного реле может иметь только два значения и = с, и = -с. Двухпозиционные релейные элементы, представлены на рис. 2.1.9, в, д. На рис. 2.1.9, а, б изображены трехпозиционные релейные элементы, имею- щие зону нечувствительности, т.е. выходной сигнал и в зависимости от величины х может принимать три значения: и = 0, и = с, и = -с. Релейные элементы, изображенные на рис. 2.1.9, а, в, имеют гистерезис, стрелками указано направление переключения. На рис. 2.5.2 представлены входные и выходные величины для различных типов релейных эле- ментов. Если отсутствует гистерезис, то уравне- ние релейного элемента имеет вид и = ф(х). При наличии гистерезиса уравнение релейного элемента и - O(x,d,dj). Рк. 13.1. Струггурвая схема релейной састемы: РЭ - релейный элемент; W[s) - передаточная функция линейной части системы * Приближенные методы исследования и расче- та релейных систем (наряду с другими нелинейными) взложены в гл. 22 - 24. Рис. 2.5.2. Входная и выходная величины релейного элемента: а, б - для двухпозиционного релейного элемента; в, г - для трехпозиционного релейного элемента; б, г - для релейного элемента с гистерезисом В соответствии со структурной схемой (см. рис. 2.5.1) линейная часть системы задает- ся передаточной функцией M(i)’ гае M(s) и N(s) - многочлены, причем много- член M(s) имеет более высокую степень, чем многочлен N(s). Разность между степенями многочленов M(s) и N(s) называют индексом передаточной функции. Движение объекта описывается линейным дифференциальным уравнением M(p)X = N(p)u. d Здесь р = — - оператор дифференцирования. at Уравнение релейной системы имеет вид М(р)Х - Af (р)Ф(х, b, bi), х = g - X. Характерной особенностью релейных систем является то, что в них обычно возни- кают незатухающие периодические колебания, называемые автоколебаниями (см. п. 2.2.2).
232 Глава 2.5. ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ 2.5.2. АВТОКОЛЕБАНИЯ В СИСТЕМАХ С ДВУХПОЗИЦИОННЫМ РЕЛЕЙНЫМ ЭЛЕМЕНТОМ Симметричные автоколебания (при gffy = 0). В режиме автоколебаний на вход объекта поступает периодический сигнал «(/) = с sign sin у /, (2.5.1) где 2Т - период автоколебаний. Этот сигнал можно разложить в ряд Фурье. Поскольку линейная система обладает свойством суперпо- зиции, то в автоколебательном режиме Х(/) = — У —— я“2Л-1 Кеиф-^(2* -1)J х х sin у- (2к - 1)/ + Im / у (2к - l)j х х cos у (2к -1)/ (2.5.2) Период автоколебаний 2Т определяется из условия переключения релейного элемента. Если в некоторый момент времени проис- ходит переключение реле с минуса на плюс, то X(t*) = -b, X(t * -0) < 0. (2.5.3) Обозначим через Х*(1) значение пере- менной X, соответствующее переключению в периодическом движении релейного элемента с минуса на плюс. Из (2.5.2) находим х * =уЕ чг-т1тИ'’£(2* - 4 (2.5.4) Далее справедливы равенства: z’ (Л = V Е Re ^0 Т <-2к - о) - к=1 4 1 7 -с lim sFF(s); J->00 (2.5.5) Z+(T) = ^£Ren{/|(2*-l)) + 1 k=\ 4 1 7 +c lim 5^(5). J—>a> Здесь Г(Т) = Х(Г*-0); z+(T) = X(t * + 0), т.е. через z(7) обозначено значение X(t) в момент переключения релейного элемента с минуса на плюс. Если индекс передаточной функции больше единицы, то lim sH^(s) = 0 J—>со И г-(Л = г+(Т). Соотношения (2.5.3) используются для определения возникающих в релейной системе автоколебаний. Перейдем в равенствах (2.5.4) и (2.5.5) от полупериода Т к круговой частоте я со = —: Т X * f—] = *£ у Itn »Г(й>(2Л - 1)); IcoJ л £^2fc- 1 v ' (2.5.6) г^ЬуЕ^Н2*-1))* Тс lim sW(s). (2.5.7) J->OO Таким образом, автоколебания опреде- ляются из условий X*[—] = -/>; z'|-|<a (2.5.8) ксо/ ксоУ В соответствии с равенством (2.5.8) частота автоколебаний со определяется точкой пересе- чения графика функции Х*|—I с прямой \(07 X* = -Ь (рис. 2.5.3). График функции Х*|—I может иметь \(07 несколько точек пересечения с прямой X* = -Ь. Как следует из второго условия (2.5.8) . _(л^ +(л^ (здесь предполагается, что Z — = Z — в \(07 \(07 точке пересечения, соответствующей автоколеба- ниям, zf—1 < о, \(07 поэтому в системе, характеристики Х*|—I \(07 и z| —I которой представлены на рис. 2.5.3, \(07 имеют место автоколебания круговой частоты ®0-
АВТОКОЛЕБАНИЯ В СИСТЕМАХ С ДВУХПОЗИЦИОННЫМ РЕЛЕЙНЫМ ЭЛЕМЕНТОМ 233 Рве. 2.5.3. К определению частоты автоколебаний Строго говоря, соотношения (2.5.8) не могут служить гарантией того, что найденное решение действительно соответствует автоко- лебаниям. Окончательный вывод можно сде- лать лишь, построив с помощью равенства (2.5.2) само это решение и убедившись, что на периоде релейный элемент имеет только одно переключение. Но ситуация, при которой ре- шение, полученное исходя из условий (2.5.8), затем не подтверждается, является достаточно редкой. Неравенство г-(т)<0 при Х*(7) = -Ь действительно гарантирует переключение релейного элемента с минуса на плюс. Однако, если X '(Т) = -ь, ?-(т)<0, z+(T)>0, то соответствующее им периодическое реше- ние системы имеет амплитуду, равную Ь. Для системы с релейным элементом, изображенным на рис. 2.1.9, д, автоколебания определяются из соотношений: Х*(Г) = 0; Г(Т)<о, z+(r)>0. Перепишем равенства (2.5.6) и (2.5.7): Im Ифю) + у Im 1К(зло) + + |lmlT(5«a) +... , (2.5.9) и = ~[Relr(/m)+ + + Re JP(5i»)+...]. В зависимостях (2.5.9) предполагается, как это обычно имеет место на практике, что lim sFF(s) = 0. Тогда z — = Z+ — . Из J—>00 (2.5.9) следует, что функции X * — и к СО 7 1 ~ — Z — могут быть построены соответствен- (0 \(07 но по мнимой и действительной частотным характеристикам путем графического сумми- рования. Поскольку | W[ko) |, как правило, быстро убывает, то при построении функций X * — и — z — на практике учитывается \(07 (О VC07 сравнительно небольшое число членов ряда. V * I I — 1^1 Функции X * — и z — , а также VC07 ксоУ их аналоги, с помощью которых определяются возникающие в релейной системе автоколеба- ния, будем называть R - характеристиками. Прежде чем перейти ко второму способу построения R - характеристик Jf*|—I и \со/ Z — , рассмотрим один прием, который \со/ существенно упрощает задачу [37]. Представим передаточную'функцию Ц7($) = M(s) в виде суммы простых дробей. Каждому дей- ствительному простому корню а уравнения M(s) = 0 будет соответствовать слагаемое вида к s-a’ а каждой паре комплексно-сопряженных кор- ней -а ± /р - слагаемое Es + D (s + а)2 +02 Передаточная функция ________(s 4- 6)(s2 4- 2^S 4- 5)(s2 4- 4)_ (5 4- ax)(52 4- 45 4- 20)(52 4- 25 4-10)<5 4- a2)S ’ например, разлагается на сумму простых дро- бей:
234 Глава 25. ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ W'(s) =---— +-----— + — + -----— + s + oj s + a2 s s2 + 4s + 20 t E2s + D2 s2 + 2s +10 ’ где числа ky k2, &з, Еу Е^ находятся по методу неопределенных коэффициентов. В этом случае структурную схему релейной сис- темы можно представить в виде рис. 2.5.4, здесь буквой Е обозначено суммирующее звено. В соответствии со структурной схемой / \ 5 / \ ( X 5 ( X ** -=5>; -; Л-) = !>?(-)• 1(07 " \(0/ \(0/ " \(0/ Таким образом, зная ^-характеристики типо- вых звеньев, можно достаточно просто по- строить ^-характеристики релейной системы, ^-характеристики типовых звеньев приведены в табл. 2.5.1. В отличие от частотного варианта данного метода в качестве независимой пере- менной здесь целесообразно рассматривать полупериод Т Далее, приведенные в табл. 2.5.1 зависимости справедливы при любых знаках параметров к, а, а, т.е. их можно использо- вать также для построения ^-характеристик неустойчивых звеньев. В табл. 2.5.2 приведены периодические решения, соответствующие типовым звеньям. Периодическое движение релейной системы определяется равенством /=1 где хХО - решение /-го типового звена; / - число звеньев. Определение несимметричных автоколеба- ний. Такие автоколебания возникают в релей- ной системе (см. рис. 2.5.1) при подаче на ее вход постоянного сигнала g. На рис. 2.5.5 показан несимметричный релейный сигнал и(1), который характеризует- ся тремя параметрами: с, т, Т, где с - ампли- туда сигнала; 2Т - период; хТ - интервал по- ложительного значения сигнала и(1). Рассмот- рим сначала объект управления, когда переда- точная функция W(s) не имеет нулевого по- люса. В несимметричном периодическом дви- жении на вход объекта управления поступает периодический релейный сигнал, вид которого (один период) изображен на рис. 2.5.5. Обо- значим через А* (7} т), Z~(T, х) - значения (в периодическом движении) переменных X(t) и X(t) в момент переключения реле с минуса на плюс, а через А** (Г, т), ?"(7’,т) - соот- ветствующие значения в момент переключения релейного элемента с плюса на минус. По- скольку производная X(t) в момент пере- ключения реле может иметь разрыв первого рода, то, как и выше, предел слева будем обо- значать символами Z~(T, х), z~(T,x) , а пре- дел справа - символами Z+(T, т), ?+(Т,т) . Рас. 23.4. Струпурвм схема ремйяой састеммдм
АВТОКОЛЕБАНИЯ В СИСТЕМАХ С ДВУХПОЗИЦИОННЫМ РЕЛЕЙНЫМ ЭЛЕМЕНТОМ 235 I 2.5.1. S4 1 S а + .g. со. СО. § г Е*. а я Ь«ч “я 1 + Е*. 4» S со. + ем СО. + 1 ем .а. Е*. Я 4» 1 Q |сО. 3 ГМ £ I м | и 1 4 1 4 (Г) (Г) (Г) • 1 + S к
236 Глава 25. ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ 2.5.2. Симметричные период
АВТОКОЛЕБАНИЯ В СИСТЕМАХ С ДВУХПОЗИЦИОННЫМ РЕЛЕЙНЫМ ЭЛЕМЕНТОМ 237 Рис. 2.5.5. Вид сигнала с выхода двухпозицнонного релейного элемента в несимметричном периодическом движении Здесь: Ml = l-e2"7, COS2PT +|-e2“r sin2PT; M2 = —-e2a7’sin2PT--e2“rcos2pT; 2 P P Ni =|e2“rsin2pT; ^=|(1-e2arc°s2pT); Ниже приведены ^-характеристики ти- повых звеньев Для апериодического звена: kc(\ -2ear +е2аГ) x * (Лт) = ——7------—L; х (cos2pT -^-sin2pT^ + Li = 2ear x Z>c fot . _ -у—-у -smpr-cospr srnpr + or+p2\P J P _?£_A2a7’ a2+p2‘ De a2 +p2 ’ jtJ2e(22’-')‘-1-e2‘7’) x * *(T, t) = —*-----------------• 2аТ (2.5.10) Z~ (T, т) = -kc -ax*(T, t); x —COSpr- P De a2 + p2 sinpr + -j^cosprj + Г(Т,х) = кс-ах**(Т,х); z+(Tfx) = z~(Tfx)+ 2кс; e2ar [sin 2P T + J cos 2P 7j - ; or + p2 4 P J P a(2T-r) ^.&iap(2T-r) + Г(Т,т) = Г(Т,т)-2Ахг. Для сложного колебательного звена: хЧТ т)- . v ’7 mxn2 - M2Nx ’ L®N2-L2Nt r**(T t'i =_________ V 7 МiN2 - M2Nx ’ z-(r>T)=.^l^-Z^2A v ’ 7 MiN2 - M2Ni 9 (2.5.11) ^^-[coep(2T - r) - ^-sinp(2T - r) a2 + |r \ P 7^C ? e2aT fcos 2p T - sin 2p rl - a2+p2 I H P J De a2 +p2 ’ a(2T-r) ^.cosp(2r_r)_ ? (Т,Т) MiN2 - M2Ni ’ 2^-y^sinP(2T - r) +^COSP(2T - r) Z+(Т,х) = z~ (Т,х)+ 2Ес; Z +(Т,х) = z ~ (Т,х) - 2Ес. . Pc e2arfsin2pr +£cos2pr| + a2+p2 I P ) 2Ec a2 +p2 ’ = хТ. L2 = 2©^ х Z? = 2е‘ ^2 = ~2e'
238 Глава 25. ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ Выпишем условия переключения релей- ного элемента: £-х*(Т,т) = />; z"(T,t)<0; (2.5.12) g-x**(T,T) = -Z>; ?"(Т,т)>0, (2.5.13) здесь g = const - входной сигнал. Соотноше- ния (2.5.12) соответствуют переключению реле с минуса на плюс, а соотношения (2.5.13) - с плюса на минус. Они позволяют определить возникающие в релейной системе автоколеба- ния при постоянном входном сигнале g, точ- нее, установить два основных параметра этих автоколебаний: Тит. Графический способ определения аатоко- лебаннй. Используются условия (2.5.12), (2.5.13). Задаваясь значениями Т (0 £ Т < <ю), можно при различных значениях т (0 < т < 2) построить семейство Л-характеристик А* ( Г, т), А**(Т, т) (рис. 2.5.6, 2.5.7), провести на рис. 2.5.6 прямую X* = g-b, (2.5.14) а на рис. 2.5.7 - прямую X** = g + d. (2.5.15) Точки пересечения прямой (2.5.14) с се- мейством А*(Т, т) позволяют построить функ- цию * = Г1(Т), а точки пересечения прямой (2.5.15) с семей- ством А**(Т, т) - функцию = Yz(T). При построении функции У1(Т) необходимо учитывать лишь те точки пересечения, кото- рые удовлетворяют второму условию (2.5.12). Аналогично при построении функции У2(^) учитываются точки пересечения, удовлетво- ряющие неравенству (2.5.13). Точка пересечения графиков функций У1(Т) и Уг(^) (рис. 2.5.8) определяет воз- никающие в релейной системе несимметрич- ные автоколебания. Форма автоколебаний определяется с помощью табл. 2.5.3, в которой представлены несимметричные периодические решения ти- повых звеньев. Рас. 2Л.6. Построение функции yi(7) Х~(Г,Г) Ряс. 2.5.8. £ определению полупериода 7е я параметра т® Частотный метод. Этот метод основан на разложении периодического сигнала и(0 в ряд Фурье, в результате чего могут быть получены зависимости для R-характеристик: Х»(Т,г) = С(Г7.Г)^(0)-)-2сх х У-2- + Т \ Т ) + fl-cos2fcrjlmH'T/2fcj ; I Т ) \ Т )
АВТОКОЛЕБАНИЯ В СИСТЕМАХ С ДВУХПОЗИЦИОННЫМ РЕЛЕЙНЫМ ЭЛЕМЕНТОМ 239 2.5.3. Несимметричные периодические решения W(s) Х(О (0 i t <. 2Т°) к s+a fx»(T°,T0)-—le'" +—fe~a('~rl>) -i) l(Z-r°) + — k a J a v ' a Es + D (s + а)2 + р2 | x * —7^Ц-|е"а' cosp/ + i(ax »+ V cr+p2J PV r Dea, ] -a/ • De ifr 1 -a(l-r°} + Ec-—z ? e ^sinp/H-— --2 -\Ec-— e au f x a2+02J a2+02 [Pl a2+p2J x sinp(Z - r°) + fl - e-a</-f0) sinp(/ - r°)l • l(f - r°), a24-p2V 7 __ „0 _ где Г = т 1 . Х**(7>) = С(ГГ Г) *К(0) + 2с х -siny - с lim slF(s); Г(Т,т) = Z’(T,t) 4- 2с lim sW^s); J->CO Для определения формы несимметрич- • ных автоколебаний используется следующий рад: X(t)= 1 х ^sincoofcr° RelF(iDOfc) + + (1 - cosco 0b,0jlmlK(ia)o^))cosfco0/ + + ^1 - cosco0fcr°)RelF(ico0fc) - - sin co ofcr°ImlF(ico 0£)j sin kxo 0/| я здесь con =—7Г - круговая частота автоколе- v у* и +8Ш“Лт1т1Р|+c lim sW(s); T \ T ) j->co Z+(T,t) = z"(T,t) - 2c lim s Ж(s); r = xT. баний; r° = т°Т°. В релейный системе с астатическим объ- ектом управления при подаче на ее вход по- стоянного сигнала g — const возникают не- симметричные автоколебания той же частоты, которую имеют симметричные автоколебания, возникающие в системе при отсутствии вход- ного сигнала (g = 0). Несимметричное перио- дическое решение
240 Глава 2.5. ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ ло=«+£х/(о, /=1 здесь Xj - симметричные периодические коле- бания типовых звеньев, задаваемые табл. 2.5.2. Пример 2.5.1. Рассмотрим релейную систему, структурная схема которой изображе- на на рис. 2.5.9, гае к\ = 1; Т\ = Г, 7*2 = 0,5; 7з = 0,2; с = 10; b = 0,1. Полагая, что вход- ной сигнал g = 0, найдем возникающие в сис- теме автоколебания. Разложим передаточную функцию на сумму простых дробей. Тогда структурную схему системы можно представить в виде, изображенном на рис. 2.5.10, где = -^7- = 1, т\ «2=^ = 2, «Э=^- = 5, *1=2,5, Г2 Т3 ki = = -^. Так как при отсутствии входного сигнала в системе возникают сим- метричные автоколебания, то для определения автоколебаний воспользуемся /{-характеристи- ками х*(7), Z~(T). В соответствии с табл. 2.5.1 1 - 50 1 - е2Т 5 1 - X * (Г) = 25-!-^ - +4L-£5T > 1 + е' з 1 + е2' з 1 + е5У z’(T) =-25 1 + 1-еГ> 1 + е^, 100 Г. 1-е2Г +--- 1 +--- 3 I l + e2rJ Рис. 2.5.11. К определению частоты автоколебаний: 1 - /{-характеристика системы; 2 - прямая х* = -Ь Рис. 2.5.12. График выходного сигнала системы в режиме автоколебаний Из рис. 2.5.11 следует, что в системе могут иметь место автоколебания периода 2 7®, где 7® = 0,835 с. Так как z(7°) = -4,82 < 0, то в точке 7® выполняются оба условия (2.5.8). В соответствии с табл. 2.5.2 автоколебания задаются равенством X(t) = -34,8бе"' + 28,05е"2' - ЗД9е"5' +10; (02 2<Т°), Х(2 + Т°) = -Х(2). (2.5.16) 25 f 1-е5П На рис. 2.5.12 показана форма периоди- ческого сигнала Х(Т). Поскольку релейный элемент переключается на периоде только один раз, то в системе действительно имеют Рве. 2.5.9. Структурная схема релейной системы место автоколебания частоты л “О = 7о = = 3,76 1/с. Форма автоколебаний определяется равенством (2.5.16). Рис. 2.5.10. Эквивалентная структурная схема, используемая дм расчета ^-характеристик 2.5.3. АВТОКОЛЕБАНИЯ В СИСТЕМАХ С ТРЕХПОЗИЦИОННЫМ РЕЛЕЙНЫМ ЭЛЕМЕНТОМ Ниже рассматриваются только симмет- ричные автоколебания (g(/) = 0). Релейный сигнал, который в периодическом движении поступает на вход объекта управления изобра- жен на рис. 2.5.13. Этот сигнал можно задать двумя параметрами: Г и у, здесь по-прежнему 2Т - период. Для определения Т и у можно воспользоваться условиями переключения релейного элемента с нуля на плюс и с плюса на нуль.
АВТОКОЛЕБАНИЯ В СИСТЕМАХ С ТРЕХПОЗИЦИОННЫМ РЕЛЕЙНЫМ ЭЛЕМЕНТОМ 241 Рве. 2.5.13. Вид сигнала с выхода трехпозиционного релейного элемента Обозначим через Х*(Т,у), z(T,y) значе- ния в периодическом движении соответствен- но выходной величины X(f) и ее производной X(f), соответствующие переключению релей- ного элемента с нуля на плюс, а через у), z(T,y) - значения X(f), X(t) соответствующие переключению реле с плюса на нуль. Тогда условия переключения релей- ного элемента имеют вид: Х*(Т,у) = -д; z”(T,y)<0; (2.5Л7) X**(T,Y) = -/>i; Г(Т,у)>0. (2.5.18) Соотношения (2.5.17) и (2.5.18) записаны применительно к релейному элементу с гисте- резисом (см. рис. 2.1.9, а). Если релейный элемент не имеет гистерезиса, то в соотноше- ниях (2.5.17) и (2.5.18) необходимо положить b\ = b . Далее, условие (2.5.17) соответствует переключению реле с нуля на плюс, а условие (2.5.18) - переключению реле с плюса на нуль. Разлагая релейный сигнал м(0 в ряд Фу- рье и используя пришпш суперпозиции, по- лучаем следующие зависимости: x[sin тгу(2к -1) Re W(ка (2к -1)) + +(1 - cosjry(2fc - 1))1тИ/Г(/со(2А: -1))]; Z = —У[(1-со87гу(2А:-1))х <(0 J п кЛ х ReFF(/(o(2fc - 1)) - sin тгу(2к -1) х х ImFF(Ko(2fc - 1))1 - — lim sFF(s); J 2 j->oo + c lim sJV(s); J->00 x[sinjry(2fc - l)RelK(/a)(2A: - 1)) - -(1 - cosjry(2fc - 1))1тИЧи)(2А: -1))]; Z[— ,Y I = —- [(cosтгу(2A:- 1)- 1) x K k=l x ReFF(i(o(2fc - 1)) - sin jry(2fc -1) x X 1тЖ(«о(2А; -1))1 + - lim 5W(s); 2 j->co Z+[—-,Y I = Z I —,Y I _ c I*131 sH'(s), \co J \co J s-vn 'T n здесь T = — . co Приведем ^-характеристики типовых звеньев: к к ^ = 7’ ^> = 777’ »F(s) = — (s + а)2 +р2 Для интегрирующего звена: х*(Т,у) = -^~; x”(T,y) = -^; z”(T,y) = 0; z~{T,y) = kc; (2.5.19) z+(7’,y) = Asc; z+(T,y) = 0. Для апериодического звена: jtc(i - етаГ - еаГ + е(1+т)аГ) ♦ (т «X ___1________________________L • ксеаГ(1 + е(1 у)аТ -еуаТ - еаГ) ^т}--------------------- (2.5.20) г-(Т,т) = -ах‘(Т,т); z“(T,y) = кс - ах**(Т,у); z*(T,y) = z-(T,y) + kc; Г(Т,у) = -ах**(Т,у).
242 Глава 2.5. ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ Для сложного колебательного звена: х»(т,Г)-..4Уд.-4м . 1 У' M1N2-M2Ni x**(T у) = 2—1 ♦ 4 MXN2 - M2Ni ’ Z~(T v) - MlL2~M2Ll . v MXN2-M2NX' (2.5.21) r~(T ~~• V ,T' MxN2 -M2Nt ’ z+(r,Y) = z-(T,r) + &; (Т,у) = z~(Т,у) - Ес. Здесь: г* Ес /_ . De ~ a al(^»V) + 2 о2 Х Р сг+р2 х i+®2(7,y)-^®i(7,y) ; L ₽ J = _|(1+в2(г,у))+_^х X «1(Г,т)+|(1 + о2(Т,у)); Я = +^Lr[ff;(r,T) - Р cr+p2l -e^coslpT+^e^sinlpT-oi^Y)]; (1-05(7,г))+^[с;(Г,у)- _2aT sm2pT+j^Q2(7’,Y)-®2aTcos2₽7’) J oi(T, Y) = e“r(1+T) sin ₽Г(1 + у) - - e“r sin₽T - e“l,r sinpY7; 02(7,r) = евГ(1+т) cospT(l + у) - - e“r cospr - е“гГ cospY Г; oj(7,y) = e“rsinpT-e“r(1-Y)sinpT(l-T) + + е“^(2-т) sinpyp - y); oJ(7,y) = еаГ cospr-e“r°-1') соврг(1-у) + + е«П2-т) cospr(2 - y). Автоколебания определяются из условий (2.5.17)» (2.5.18). Графический способ опреде- ления автоколебаний с помощью соотношений (2.5.17), (2.5.18) полностью идентичен рас- смотренному в п. 2.5.2, где он используется для определения несимметричных автоколеба- ний. Именно, задаваясь значениями у» в функции параметра Г (0 £ Т £ «) строятся семейства характеристик А* (Г, у), А**(Г, у). Точки пересечения прямой А* = -Ь с семейст- вом А*(Т,у) определяют функцию у = /}(Т), а точки пересечения прямой А** = -Ь\ с се- мейством А**(Т, у) - функцию у=/^(Т). При построении функций /}(Т) и fzGD необходимо учитывать неравенства (2.5.17) и (2.5.18). Точка пересечения функций (рис. 2.5.14) и определяет автоколебания, точ- нее, параметры автоколебаний 7® и у®. В табл. 2.5.4 приведены составляющие периодического движения, соответствующие типовым звеньям. Наряду с табл. 2.5.4 для определения формы автоколебаний использу- ется также соотношение X(t) ‘ _ 1И°х X КеИфо)о(2* -1)) +(1 - cos(2jt - 1)лу °) X х ImJr(foo(2£ - l)))cos(2£ - 1)®о* + + ^1 - cos(2fc - 1)ку° j ReFK(jro0(2& -1)) - - sin(2fc - i)Ky°ImFK(ja>0(2fc - l))j x x sin(2fc - 1)®о*], Pec. 2Л.14. К шфедыешп» аятешебамВ в priefcui системе с трехпозишмшм релеВиым элементом
АВТОКОЛЕБАНИЯ В СИСТЕМАХ С ТРЕХПОЗИЦИОННЫМ РЕЛЕЙНЫМ ЭЛЕМЕНТОМ 243 2.5.4. Периодические реикикя типовых звеньев при трехпозицвонном релейном элементе W(s) х(1) (0S1ST0) И I х * (Т°,г0) + kct - kc(f - У°Т°) • l(t - 7°Г°) к s+a fx‘(T°,r0)-—V" +—+—fe’e('-T’r’) -111(/-7°T°) \ aJ a a ' Es + D fx*(T°,r°)—5^-T]e-a,coep/+|(ax*(r0,r0)-z’(T0,r0) + I a2+pzJ P' + Ec —y)e-o/ sin fit + |cosp(l - 7°T0)) + a2+p27 |_az+p2' ' +|(sinP(r - 7 °т°)) - у sinp(7 - 7°T°) • 1(1 - 7°T°) +^(1 -1(1 - 7°T°)); x(l + T°) = -x(l). (s + а)2 + Р2 где ©о = я/Г0 - круговая частота автоколе- баний. Форму автоколебаний можно* получить численно, проинтегрировав на периоде урав- нения движения объекта при соответствующих начальных условиях и управлении </(/) (Т = 7°, у = у0), задаваемом рис. 2.5.13. Пе- редаточная функция объекта при этом должна быть разложена на сумму простых дробей, как это показано на рис. 2.5.4. Начальными усло- виями для апериодических и интегрирующих звеньев являются числа х*(7®, у°), найденные по формулам (2.5.19) - (2.5.21), а для слож- ного колебательного звена - числа х*(7°, у°), Г(7°,Г°). Приведем уравнения движения в форме Коши, которые соответствуют сложному коле- бательному звену, т.е. передаточной функции X(s) Es + D U(s) 52+2а5 + а2+р2 Эти уравнения имеют вид: *1 = Х2 + (2.5.22) х2 = (Л - 2аЕ)и - 2ах2 “ (а2 + Р2)х1, где Xi = х; х2 = х - Ей . При определении формы автоколебаний уравнения (2.5.22) должны интегрироваться при начальных условиях МО) = X • (T°,r°); х2(0) = -Г (Т°, 7°) • Пример 2.5.2. Рассмотрим релейную сис- тему, изображенную на рис. 2.5.1, где Tj5 + 1 (T2s2 + 2^T3s + 1)(Т25 +1)5 Релейный элемент является трехпозици- онным и имеет характеристику, представлен- ную на рис. 2.1.9, а. Положим Т\ — 0,1; Т2 = 0,8; Тз = 0,5; £ = 0,2; с = 10; = 0,7; b = 1. Полагая, что входной сигнал отсутствует (g « 0), найдем возникающие в релейной сис- теме автоколебания. Представим передаточную функцию объ- екта в виде суммы простых дробей: ч к В Es + D И'(.у) = — +------+---------=----- s 5 + a (s + а)2 + р2 ще а = ^=0,4; Р2 = Д-(1 -f,2) = 3,84; Т Т$ к = 1; В = -0,767; Е = -0,233; D = -1,145; а = ^- = 1,25. т2
244 Глава 2.5. ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ Очевидно, X * (Т,г) = *1’ (Г, V) + х"2(Т,у) + х3' (Т, г); Х**(Т,у) = хГ(Т,г) +хГ(Т,у) +х$*(Т,у); z~(T,y) = Zi (Т,у) + zi(T,y) + Z3<T,y); Z-(T,y) = zffT.r) + Zi(T,y) + Z3-(T,Y). ^-характеристики интегрирующего, апериоди- ческого и колебательного звеньев рассчитыва- ются по формулам (2.5.19) - (2.5.21). На рис. 2.5.15, a, d, приведены семейства характеристик Х*(Т, у), х**(Т, у). По точкам пересечения характеристик Х*(Т, у) с прямой X* = -д, (см. рис. 2.5.15, а) построена функ- ция у = п(7), а по точкам пересечения харак- теристик Х**(Т, у) с прямой X** = -д], (рис. 2.5.15, б) - функция у = /^(7). Графики этих функций изображены на рис. 2.5.16. В точке пересечения функций Т0 = 1,91, у0 = 0,92. Таким образом, в рассматриваемой релейной системе возможны автоколебания с частотой Wq = л/Т° = 1,64 и параметром у0 = 0,92. б) Рис. 2.5.15. К построению функций п(7) /1(7) Рис. 2.5.16. Определение основных параметров 7°, у0 периодического решении Рис. 2.5.17. Вид выходного сигнала в режиме автоколебаний Форма автоколебаний задается функцией Х(0 = х1(П+х2(0 + х3(П, где *2(0» *з(0 периодические состав- ляющие соответственно интегрирующего, апе- риодического и колебательного звеньев. На рис. 2.5.17 показана форма периоди- ческого сигнала X(f). Функция X(f) исключает возможность дополнительных переключений релейного элемента, т.е. в рассматриваемой релейной системе действительно имеют место автоколебания периода 2Т° =3,82 с парамет- ром у0 = 0,92. 2.5.4. УСТОЙЧИВОСТЬ АВТОКОЛЕБАНИЙ Перейдем от передаточной функции W(s) к дифференциальным уравнениям, для чего представим передаточную функцию в виде суммы простых пробей. Интехрирующее и апериодическое звенья (см. табл. 2.5.1) при- водят соответственно к уравнениям х-ки\ х-ки-ах. Сложному колебательному звену соответ- ствуют уравнения (2.5.22). Если передаточная функция имеет вид 5 + Д1 5 S1 +45 + 20 ! E2s + D2 S2 +25 + 10 ’
УСТОЙЧИВОСТЬ АВТОКОЛЕБАНИЙ 245 то движение объекта описывается уравнения- ми: xj = к\и - w, х2 = к2щ *3 = Е\и + Х4; х4 = (Pj - 4Ei)u - 20х3 - 4х4; xs = Е2и + х6; х6 = (D2 - 2Е2)и - 10х5 - 2х6. Выходная координата системы X = Xi + х2 + х3 + х$. (2.5.23) В дальнейшем будем считать, что движе- ние объекта описывается матричным уравне- нием ^- = Ак+Ал1, (2.5.24) dt где х = (%i, хл) - л-мерный вектор со- стояния (фазовый вектор системы); В - посто- янная матрица порядка п х п\ к - л-мерный вектор коэффициентов (постоянная матрица порядка л х 1); и - скалярная величина - вы- ход релейного элемента. Выходной сигнал X образуется суммиро- ванием ряда компонент вектор X. Поскольку не все компоненты вектора X участвуют в формировании выхода X, выходной сигнал X(f) будем задавать равенством X(t) = RTx(Z), где R - л-мерный вектор, составленный из единиц и нулей; символом RT обозначается транспонированная матрица. При g = 0 дви- жение релейной системы задается уравнениями ^- = Вх + кФ(Х, b,bi); dt (2.5.25) X = -R?x. Каждому периодическому решению £(/) (4) < / < оо) системы (2.5.25) в фазовом про- странстве соответствует некоторая замкнутая траектория, т.е. совокупность точек L = {£(0: t еRo,00]} фазового пространства. Решение £(0 называют асимптотическим ор- битально устойчивым, если найдется е > 0, такое, что для всех решений х(0 системы (2.5.25), удовлетворяющих неравенству ||х('о) - £(*0 )| < е, где |х-§| = 7(»-5)т(*-5) - евклидова норма, траектория х(0 при t -> «=> навивается на замкнутую линию L, т.е. рас- стояние между точкой х(0 и линией L стре- мится к нулю при t -> со. Устойчивость симметричного периодиче- ского решения в системе с двухпозиционным релейным элементом. Обозначим х(/) = F(x°,c,/) решение уравнения (2.5.24) при и = с, где х° = х (t = 0), F = (/1, /2, ...» Fn) - л-мер- ный вектор. Введем матрицу RTh где dF(x,c,T) v dx х=х*(7’°), - матрица порядка л х л, dF(x,c,T) h------dT~ х=х*(Т°), у,_у’О - л-мерный вектор. Вектор h совпадает в пе- риодическом движении с производной dx , если x(t = 0) = х*(Т°). & t=T°-Q Устойчивость периодического решения определяется собственными числами матрицы G. Пусть Х/(/ = 1,/и, m < п) - собственные числа матрицы G. Если они удовлетворяют условию |Х,| <1, i = 1,ш, (2.5.26) то соответствующее периодическое решение системы (2.5.25) асимптотически орбитально устойчиво. Если найдется хотя бы одно такое X/, что |Х/| > 1, то периодическое решение (автоколебания) системы (2.5.25) неустойчивы. Для релейной системы, изображенной на рис. 2.5.1 (см., также уравнения (2.5.25)), по- лучено простое необходимое условие устойчи- вости симметричных автоколебаний.
246 Глава 2.5. ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ Если в автономной (g » 0) релейной сис- теме симметричное периодическое решение периода 27’° асимптотически орбитально ус- тойчиво, то dX*(T) dT Т—Т^ £0. (2.5.27) Знак равенства в условиях (2.5.27) соответству- ет критическому случаю, когда об устойчиво- сти автоколебаний невозможно судить по ли- неаризованному точечному отображению. По- этому на практике следует применять строгое неравенство dX*(T) <°- dT (2.5.28) Неравенство (2.5.28) имеет простую гео- метрическую интерпретацию. Оно выполняет- ся, если ^-характеристика А* (7) пересекает в точке Т = прямую А* = -Ь сверху вниз (см. рис. 2.5.11). Если автоколебания определяются по характеристике X * I — I (см. рис. 2.5.3), ко 7 то условие (2.5.28) необходимо заменить соот- ношением do >0. ®=®° Неравенство (2.5.27) представляет собой необходимое условие устойчивости, и как не- обходимое условие оно не может гарантиро- вать устойчивость автоколебаний. Однако если неравенство (2.5.27) не выполняется, то соот- ветствующее периодическое движение неус- тойчиво. Для релейной системы второго по- рядка неравенство (2.5.28) является достаточ- ным условием устойчивости. Построение матрицы G. По определению матрица <2 = - dF[ dF[ dF^ дх\ дх\ дх*п ^2 дх{ дХ2 йх* _дх{ дХ2 дх^ Так как система (2.5.24) состоит из уравнений, описывающих движение типовых звеньев, на которые разбивается передаточная функция объекта управления, то для определения про- dFt mwjDODL —j- можно воспользоваться аху табл. 2.5.2. В соответствии с табл. 2.5.2, если переменная X/ является выходом интегрирую- щего или апериодического звеньев, то соответ- ственно SFi _ .. SFt _ e-eT°. ’ дх; ’ (2.5.29) = 0 при i # j. В том случае, когда переменная X/ представля- ет собой выход сложного колебательного звена, = cospr0 +^-sinpr° ; dxt L P Д'- ' ^’sinpr0; a»/+i P ^.-«^P^-^stapT0; P (2.5.30) = e-ar°|cospT0 -£sinpT°l; дхм L P J = 0; — j- = 0 при J * [/, i +1]. dxj dxj Поскольку периодическое решение x(l) обладает симметрией, то h = -z'(T°), (2.5.31) где Z = (Zi ,Z2f->Zn) - ^-мерный вектор, компоненты которого можно рассчитать по формулам табл. 2.5.1. Преимущество такого способа определения вектора h заключается в том, что компоненты вектора z ’ обязательно вычисляются при нахождении автоколебаний (см. п. 2.5.2). Определим компоненты вектора z ’ коле- бательного звена, которое описывается двумя уравнениями (2.5.22). Если переменная X/ яв- ляется выходом колебательного звена, то X/ (Т) и Zi (Т) рассчитываются по форму- лам табл. 2.5.1. В соответствии с (2.5.22)
УСТОЙЧИВОСТЬ АВТОКОЛЕБАНИЙ 247 х*мОУ = Zi (Т) + Ес-, (2.5.32) 2/“+1(Г) = -[л + 2azr (Г) + (а2 + р2)*’ (Г)]- Выполнение неравенства (2.5.26) можно проверить с помощью стандартных программ по определению собственных чисел матрицы. Неравенства (2.5.26) не предполагают точного знания собственных чисел Xj, Х2, •••> Хт, а лишь устанавливают принадлежность их определенной области. Поэтому для проверки устойчивости автоколебаний могут использо- ваться известные алгоритмы локализации соб- ственных чисел матрицы. Собственные числа матрицы G являются корнями уравнения det(G - XI) = 0, (2.5.33) где det(G - XI) - определитель матрицы; I - единичная матрица. Определитель det(G-XI) представляет собой многочлен степени п. В соответствии с (2.5.26) периодиче- ское решение асимптотически орбитально ус- тойчиво, если корни уравнения (2.5.33) принад- лежат внутренности единичного круга (одно из собственных чисел матрицы G равно нулю). Преобразование V-1 отображает единичный круг плоскости X в левую полуплоскость плоскости V, т.е. преоб- разование переводит область IX | £ 1 в область Re v £ 0, Исследуемое периодическое решение устойчиво, если корни многочлена det(G-^-i|l) (2.5.34) имеют отрицательные вещественные части. Для определения расположения корней мно- гочлена (2.5.34) можно использовать извест- ные алгебраические критерии Гурвица или графический критерий Михайлова. Устойчивость периодических движений часто удобно оценивать с помощью частотного критерия, который аналогичен критерию Найквиста, применяемому для определения устойчивости линейных систем. Пусть в релейной системе (рис. 2.5.1) имеет место периодическое решение X(f) пе- риода 2Т°. Асимптотическая орбитальная ус- тойчивость этого периодического решения имеет место тогда и только тогда, когда асим- птотически устойчива изображенная на Рис. 2.5.18. Структурная схема импульсной системы, по которой определяется устойчивость автоколебаний рис. 2.5.18 импульсная система с идеальным импульсным элементом и периодом квантова- ния Т°. Передаточная функция 1К*(5) строится по следующему правилу. Разложим передаточ- ную функцию W(s) на сумму простых дробей. Положим для определенности, что их/ \ *1 *2 Es + D s + a s (s + a)2+p2 Обозначим Xj(/), *2(0 > *з(0 выходные сигналы (см. рис. 2.5.4) соответственно апе- риодического, интегрирующего, сложного колебательного звеньев. В режиме автоколеба- ний X/ (0 (/ = 1,3) - периодические функции. Передаточная функция xf(r°) s + a s x3-(r°) s t x3 (T°) + 2ax3 (7*°) ! X-(T°)__________X-(T0) (s + a)2 + p2 здесь X(f) = xi(/) + X2(0 + xjfjj. В силу сим- метрии периодического движения *1 (Т°) = -Zi (Т°); xi (Г°) = -zi (Т°); х3 (Т°) = -zi (Т°); Х-(Т°) = -?-(Г°); xi (Т°) = De + 2ад3 (Т°) + (а2 + р2)х3* (Т°). Аналогичным образом строится переда- точная функция ГК*(5)*при любом числе сла- гаемых в разложении функции W(s). Перейдем от передаточной функции FF*(5) к Z- передаточной функции FF**(z). Этот переход можно выполнить с помощью D -преобразования по формуле /=1 j=j/
248 Глава 2.5. ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ здесь Sf - полюсы передаточной функции W*(s). На практике обычно используют таб- личный способ перехода к Z- передаточным функциям. Подставим в передаточную функцию w**(z) z = ^. Автоколебания частоты © о = л / Т° асимптотически орбитально устойчивы, если при возрастании © от 0 до л / разность между положительными и отрицательными переходами годографа ) через отрезок (-оо, -1) действительной оси равна 1/2, где I - число полюсов передаточной функции И^з), имеющих положительную вещественную часть. Положительные и отрицательные пере- ходы определяются точно также, как и при использовании критерия Найквиста. Переход через отрезок (-оо, -1) действительной оси из верхней полуплоскости в нижнюю (точка а, рис. 2.5.19) называют положительным, а пере- ход из нижней полуплоскости в верхнюю (точка б) - отрицательным. Если точка lV**(eiwT ) при © = О или © = ©о лежит на отрезке (-оо, -1), то соответствующий переход называют полупереходом. Знак полуперехода определяется по тому же правилу, что и для полного перехода. Если передаточная функция И^з) имеет нулевой полюс, то функция FF**(z) будет иметь полюс z = 1. В этом случае годограф lV**(ei(aT ) (0 £ © £ ©о) дополняется дугой бесконечно большого радиуса. Указанная дуга обходится по часовой стрелке, причем при ее обходе вектор FK** должен повернуться по Л часовой стрелке на угол — р, где р - крат- ность полюса Z = 1 (рис. 2.5.20). Рис. 2.5.19. К определению устойчивости автоколеба- ний с помощью годографа И/'**(е/ш'Г°) Устойчивость системы с трехпозиционным релейным элементом (см. рис. 2.1.9, а, б). Ус- тойчивость системы по-прежнему оценивается неравенствами (2.5.26). Однако матрица G теперь задается соотношением G = -G2GX, где Г RThi J \ К п2 ' (2.5.35) Входящие в (2.5.35) матрицы Q\ и Q2 определяются по тем же формулам, что и мат- рица Q, т.е. задаются равенствами (2.5.29), (2.5.30). Однако при определении матрицы Q\ в соотношениях (2.5.29), (2.5.30) аргумент Т° следует заменить на у°Т°, а при определе- нии матрицы Q2 полупериод Т0 - на Т°(1-у°). Далее, 1ц = z"(T0,y0); h2 = -z-(7’°,Y0), причем компоненты векторов Z (Т0,у°) и Z~ (Т°,у°) рассчитываются по формулам (2.5.19) - (2.5.21). Если переменная Х/(д явля- ется выходом колебательного звена, то компо- ненты Z/Zj-j (7го, у °), (7°, у °) определя- ются по формулам zr+i(7’0,Y0) = A-2az/-(r°,Y0)- -(а2+р2)хГ(Лг0);
ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ 249 гм(Т°,у°) = -[2o<(To,y0) + + (а2+Р2)х*(Т°,у°)| Пример 2.5.3. Рассмотрим релейную сис- тему, структурная схема которой изображена на рис. 2.5.9. Выше было установлено, иго в данной системе возникают симметричные автоколебания периода 2 Г0 = 1,67 с. Оценим устойчивость этих автоколебаний. Выпишем матрицы 100 Г 1 — е27,0>| 3 I l + e27”J 6.Q-W RTh 1-е5Н l + e57’°J Производя необходимые вычисления, найдем, что 0,2618 G = -0,2589 - 0,0029 - 0,0746 - 0,0759 - 0,0012 -0,0061 - 0,0092 0,0155 Так как матрица G имеет собственные числа = 0,34, Х>2 = 0, Х.3 = 0,017, удовлетво- ряющие неравенствам (2.5.26), то соответст- вующее периодическое решение асимптотиче- ски орбитально устойчиво. 2.5.5. ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ Вынужденные колебания возникают в релейной системе при периодическом входном сигнале где Я - амплитуда; Jo(O - периодическая функция, удовлетворяющая условию max|/o(0| = L Периодический входной сигнал является симметричным, т.е. Hfa(t + Тъ) = = - где 2ТЪ - период. При некоторых значениях амплитуды Н входной сигнал подавляет автоколебания, про- исходит принудительная синхронизация, и в системе устанавливаются периодические коле- бания, частота которых равна частоте входного сигнала (режим захватывания). Подавление автоколебаний может сопровождаться установ- лением в релейной системе периодических колебаний с частотой, кратной частоте вход- ного сигнала ©в/v, где ©в = п/Тъ - круговая частота входного сигнала; v - целое положитель- ное число (захватывание субгармоническое). Двухпозиционный релейный элемент. Как и при исследовании автоколебаний, вынуж- денные колебания определяются из условия переключения релейного элемента. Если в системе имеет место периодическое движение периода 2 Гв, то справедливы соотношения - Х*(ТЛ) = b; 0it*^2Ta; (2.5.36) здесь момент I* играет роль "фазы" входного сигнала, с помощью которой устанавливается взаимное соответствие периодического входа с периодическим выходом. Выход релейного элемента имеет вид, представленный на рис. 2.5.21. Фаза входного сигнала I* определяется точкой пересечения графика функции (рис. 2.5.22) с прямой g = X*(TB) + b (2.5.37) Рве. 2.5.21. Вад сигнала с выхода релейного элемента Рве. 2.5.22. К определению фазы входного сигнала
250 Глава 2.5. ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ (на рис. 2.5.22 точки t\ , /2 )• Точка пересече- ния является фазой входного сигнала лишь в том случае, если она удовлетворяет второму условию (2.5.36). Фаза входного сигнала может определяться неоднозначным образом, т.е. в системе имеют место вынужденные колебания при различных фазах входного сигнала, при- чем форма вынужденных колебаний не зави- сит от фазы. Соотношения (2.5.36) позволяют опреде- лить фазу входного сигнала, при которой в системе могут иметь место вынужденные коле- баний основной частоты ©в = л/ Тъ. Само периодическое решение X(f) определяется с помощью табл. 2.5.2 так же, как это делается при установлении формы автоколебаний. По- скольку период вынужденных колебаний равен 2Тв, то в формулах табл. 2.5.2 следует поло- жить Т° = Тъ. Соотношения (2.5.36), строго говоря, не гарантируют существование при данной фазе ./* вынужденных колебаний. Чтобы сде- лать окончательный вывод, необходимо указанным выше способом построить выход- ной сигнал X(f) и с помощью функции х(/) = HfQ(t + /*)- X(f) убедиться, что в ин- тервале 0 £ t £ 1ТЪ релейный элемент имеет только одно переключение в точке t — Тъ. При исследовании релейных систем час- то интересуются критическим значением ам- плитуды которое задается равенством Якр=|* + Х»(Тв)|. (2.5.38) Равенство (2.5.38) получено из первого условия (2.5.36). Поэтому, если Н < Якр, то в релейной системе невозможен захват на ос- новной частоте ©в. При Н > Нкр захват, как правило, имеет место. Однако строгий вывод о наличии в системе при Н > Нкр вынужденных колебаний можно сделать, лишь выполнив указанные выше исследования. Определеяяе субгармонических колебаний. Если период входного сигнала равен 27^, то субгармонические колебания могут иметь пе- риод 2Т°, где Т° = v7^, v = 3, 5, 7, ... Для определения субгармонических колебаний используются соотношения: Н/0{Ц*)-Х*(уТъ) = Ь-, OS1*S2TB; Hftft*) - Z'tyTJ > 0. (2.5.39) Момент t* задает фазу входного сигнала и может быть найден как точка пересечения трафика функции g = (0 £ t £ 2ТЪ) с прямой g = * + Jf(vTB). Форма субгармонических периодических ко- лебаний задается функцией X(f), которая оп- ределяется с помощью табл. 2.5.2, причем в указанных формулах необходимо положить - vTB. Для субгармонических колебаний крити- ческое значение амплитуды задается равенст- вом Якр =|Z> + X*(vTB)|. (2.5.40) От функции (2.5.38) трафик функции (2.5.40) отличается масштабом по оси Тъ или оси л ®в = т\ Трехпозицношый релейный элемент. Рас- смотрим сначала захват на основной частоте. В этом случае условия переключения релей- ного элемента приводят к соотношениям: 0 2f*S2TB; (2.5.41) ЯЛ(1*)-г-(Гв,г)>0; <o('*+y7’b)-^,(7’b,y) = *i; 0 S t* 5 2ТВ; (2.5.42) * +тГв) - Z (Тв, т) < а Соотношения (2.5.41), (2.5.42) позволяют определить фазу входного сигнала t* и пара- метр у. Графический способ определения Г* и у. На рис. 2.5.23 изображен входной сигнал g - Hf(M. Задавшись значениями у (0 £ у £ 1), построим семейство прямых g-b + X*(T3iy) (2.5.43) (на рис. 2.5.23 сплошные линии). Точки пере- сечения прямых (2.5.43) с трафиком функции g - позволяют построить функцию /• = щ(у). (2.5.44) При построении функции (2.5.44) учиты- ваются лишь такие точки пересечения, которые удовлетворяют второму условию (2.5.41). Воспользуемся условиями (2.5.42). По- строим семейство функций g=.dl+Jf(TB,T). (2.5.45)
ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ 251 Рис. 2.5.23. К построению функций щ(т) М-г(т) Рис. 2.5.24. К определению режима захватывания На рис. 2.5.23 функции (2.5.45) изобра- жены штриховыми линиями. По точкам пере- сечения прямых (2.5.45) с трафиком входного сигнала построим функцию t* = Н2(Г), (2.5.46) причем необходимо учитывать неравенство (2.5.42). На рис. 2.5.24 изображены функции Р1(у) и H2(y)- Точка пересечения этих функ- ций задает значения /* и у * удовлетворяющие соотношениям (2.5.41) и (2.5.42). Если указан- ные функции не пересекаются, то в системе невозможны вынужденные колебания с часто- той ©в = л/Тв. Функции Hi(y) и M-2(y) могут быть неод- нозначными и иметь несколько точек пересе- чения (см. рис. 2.5.24). В соответствии с рис. 2.5.24 условиям (2.5.41), (2.5.42) удовле- творяют (Zi ,yi) и (/2,Y1) • Чтобы убедиться, какое из решений соответствует вынужденным колебаниям, необходимо для каждой пары (*1 >Y1) и (^2,71) построить соответствую- щее им периодическое решение Х(/) и с по- мощью функции x(f) = + /*)- X(t) про- верить число переключений управления на периоде. В принципе действительными могут оказаться несколько решений, т.е. в релейной системе при заданной амплитуде Н и частоте © в = л / Тъ входного сигнала возможны вы- нужденные колебания той же частоты, но при нескольких значениях у. Для определения формы вынужденных колебаний необходимо построить функцию X(j) согласно табл. 2.5.4, однако в указанные формулы необходимо подставить Т° = Тъ и соответствующее значение у. Период субгармонических колебаний ра- вен v27’B, где v = 3, 5, .... Субгармонические колебания определяются из условий: Z5f0(^)-^*(vTB,Y) = z>; 0<S/*<S2TB; (2.5.47) W^*)-r(vTB,Y)>0; ^/o(/*+YTB)-X**(vrB,Y) = ^i; 0^/*^2TB; (2.5.48) W/*+YTB)-r(vrB,Y)<0. Условия (2.5.47) соответствуют переключению релейного элемента с нуля на плюс, а условия (2.5.48) - с плюса на нуль. Соотношения (2.5.47), (2.5.48) аналогич- ны условиям (2.5.41), (2.5.42). Поэтому фаза /* и параметр у из условий (2.5.47), (2.5.48) оп- ределяются по рассмотренной выше схеме. Семейство прямых (2.5.43) в этом случае необ- ходимо заменить прямыми
252 Глава 2.5. ТОЧНЫЙ МЕТОД ИССЛЕДОВАНИЯ РЕЛЕЙНЫХ СИСТЕМ g = d + X*(vTB,Y), 0< у <1, а семейство (2.5.45) - прямыми g = bl+ Х**(уТв,г), 0 < Y < 1. Форма субгармонических колебаний за- дается функцией %(/), причем соответствующие типовым звеньям периодические составляющие хХО определяются согласно табл. 2.5.4, но при этом необходимо положить = уТъ, у0 = у*, здесь у* - параметр, удовлетворяющий соот- ношениям (2.5.47), (2.5.48). Проверка справедливости полученного субгармонического решения X(f) выполняется по стандартной схеме: строится функция x(Z) = Hfo(t + /*) - X(Z), 0 £ t <> 2vTB, с по- мощью которой легко определить число пере- ключений релейного элемента в интервале 0</£2vTB. При определении субгармонических ко- лебаний с помощью соотношений (2.5.39) или (2.5.47), (2.5.48) значениями v (v = 3, 5, 7, ...) необходимо задаваться. Устойчивость вынужденных колебаний. Используются неравенства (2.5.26). Если релейный элемент является двухпо- зиционным, то (h~ -lT)RTg 3fo'('*) + RTb’ (2.5.49)' здесь матрица Q и вектор h задаются равенст- вами (2.5.29) - (2.5.31), в которых следует по- ложить Т° = vTB (v = 1, 3, 5, ...). При v = 1 периодическое решение X(f) имеет период 2ТЪ. В этом случае неравенства (2.5.26) позво- ляют определить устойчивость (или неустой- чивость) вынужденных колебаний, имеющих основную частоту со в = я / Тъ . При v = 3, 5, 7, ... с помощью соотношений (2.5.26), (2.5.49) оценивается устойчивость субгармонических колебаний. Для систем с двухпозиционным релей- ным элементом получено простое необходи- мое условие устойчивости вынужденных коле- баний, которое имеет вид (2.5.50) Это условие справедливо как для вынужден- ных колебаний основной частоты сов, так и для субгармонических колебаний, имеющих кратные частоты «в/v (v = 3, 5, 7, ...). Нера- венство (2.5.50) позволяет весьма просто на ранних этапах исследования исключить из рассмотрения решения, которые заведомо неустойчивы. Например, из рис. 2.5.22 следу- ет, что фаза /] , соответствует неустойчивому вынужденному периодическому движению. Если релейный элемент является трехпо- зиционным, то матрица G = -C?2<ji*, (2.5.51) где g;-01+ ; WZ‘+YVTB)-RTh! (2.5.52) (hj-hpRT(22 WbR’hj’ (2.5.53) Матрицы <2i, Qi, hi , 112 рассчитыва- ются по тем же формулам, что и соответст- вующие матрицы, входящие в равенство (2.5.35). Однако поскольку вынужденные коле- бания имеют полупериод уТъ (v = 1, 3, 5, ...) и параметр у = у*, то при расчете матриц, вхо- дящих в зависимости (2.5.52) и (2.5.53), следу- ет положить = vTB, у0 = у*. В зависимости от значения v с помощью собственных чисел матрицы (2.5.51) (см. неравенства (2.5.26)) оценивается устойчивость вынужденных коле- баний круговой частоты ®a/v (v = 1, 3, 5, ...). Пример 2.5.4. Рассмотрим релейную сис- тему (рис. 2.5.1) с трехпозиционным релейным элементом, полагая, что на вход системы по- ступает периодический сигнал g = 6sin-^-/. 2^2 Передаточная функция FF(s) и параметры релейного элемента приведены в условиях примера 2.5.2. Требуется определить возни- кающие в системе (если они имеют место) вынужденные колебания. Рис. 2.5.25. К определению параметров / * у вынужденных колебаний
МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ 253 На рис. 2.5.25 изображены графики функций Hi (у) и Ц2(т)- Одна из ветвей функ- ции H2(y) оказывается разрывной (на рисунке разрыв указан штриховой линией). Этот раз- рыв обусловлен необходимостью приведения в соответствии с (2.5.42) фазы /* к диапазону 0<;/*<;2Тв. Функции Hi(y) и P2(y) пересекаются в четырех точках, причем в точке 1 не выпол- няются неравенства (2.5.41), (2.5.42), и, следо- вательно, она не может соответствовать выну- жденным колебаниям. Соотношения (2.5.41), (2.5.42) имеют три решения (/2=3,01, у2 = 0Л8 ), (/3 = 2,72 , yj = 0,88 ), и (/4 = 4,05 , у4 = 0,97 ), задаваемые точками 2, Л 4. На рис. 2.5.26, а, б, в представлены Рис. 2.5.26. Графики вынужденных колебаний: а - (Г* =3,01, у* =0,48); б- (Г*=2,72, у* =0,88); в - (/*=4,05, у* =0,97) соответствующие указанным решениям графи- ки функций Х(/), g(/), х(/). Таким образом, в рассматриваемой релейной системе при пе- риодическом входном сигнале возможны три варианта вынужденных колебаний, т.е. урав- нения М(р)Х = ЛГ(р)Ф(х, Ь, ), х = g - X, при /* = 3,01, /* = 2,72 и /* = 4,05 имеют периодические решения, представленные на рис. 2.5.26, а - в. Устойчивость вынужденных колебаний оценивалась с помощью собственных чисел матрицы (2.5.51). Выполненные расчеты пока- зали, что только собственные числа матрицы (2.5.51), соответствующие решению /4 = 4,05 , у 4 = 0,97 , удовлетворяют неравенству (2.5.26). Это означает, что в рассматриваемой системе на практике реализуются вынужденные коле- бания, имеющие параметр у = у 4 = 0,97 . Глава 2.6 НЕЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ 2.6.1. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ К нелинейным дискретным системам отно- сят системы с амплитудно-импульсной моду- ляцией сигнала, у которых нелинейна непре- рывная часть, а также системы с нелинейными способами модуляции сигнала, в том числе с широтно-импульсной, фазо-импульсной, час- тотно-импульсной модуляцией (см. п. 1.6.1).* Цифровые системы также относятся к этому классу. Математическое описание нелинейных дискретных систем с амплитудно-импульсной модуляцией зависит от расположения нелиней- ного элемента в ее структурной схеме относи- тельно импульсного элемента. Если нелиней- ный элемент Ф(е) расположен перед импульс- ным (рис. 2.6.1, а), то уравнение системы име- ет вид ф»,е] = £|л,е]- m=0 (2.6.1) где k - весовая функция приведенной непре- рывной части (см. п. 1.6.2). Если, в частности, МО] = 0, то при £ = 0 из (2.6.1) следует:
254 Глава 2.6. НЕЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ «) •) Рис. 2.6.1. Нелпейиая дискрета система с ампшудно-пшульсяой модуляцией л-1 4л| = «[«]-£ " «I <2 б-2> ж=0 Из этого рекуррентного соотношения можно определить сигнал ошибки, соответст- вующий входному сигналу g(i). Выходной сигнал в системе определится по формуле: х(7) = Ф(е[/л])£(7 - mj. (2.6.3) ж=0 Если нелинейный элемент расположен после импульсного элемента (рис. 2.6.1, 6), то из вида структурной схемы следуют соотноше- ния: t О У<!) = £/('- m=0 ж F(y,m) = J ф(уС0)^н(^ - *)<£• О Полагая t = п + е , два последних равен- ства можно переписать в виде: л Ял,б| = Дл,е| - £ F(y,m)s(n - m,e); m=0 (2.6.4) ж—11 F(y,m) = Ф(ук,81)*н['и - '•Лк*; r=Oo (2.6.5) Л«.е]= (2.6.6) ж=0 Уравнение (2.6.4) в отличие от (2.6.1), содержит нелинейность Ду, /и), зависящую от значений Яг, 8) при г = 0, 1, ..., т - 1; О £ 8 < 1. Полученные равенства дают возможность рекурренгно вычислить Ял» е1 при п = 1, 2, ..., О £ е < 1, приняв при г = О И«,б] = (g[0)-x(0|).s(c). Выходной сигнал в системе теперь опре- делится по формуле х[/1,е] = F(y,m + e). В наиболее общем случае, когда нели- нейный элемент содержится в непрерывной части системы (рис. 2.6.1, е), импульсная система описывается следующими соотноше- ниями: t X(t) = jФ(Я^)*2и(' - (2.6.7) О л Ия.б| = /[л,е]- ж=0 (2.6.8) /м = <2б-9> ж=0 t *1(0 » J Х*)*1и(* - ОЛ; (2.6.10) о Ж-11 F(y,m) = Ф(укЛ1)*2Н1'и " г№ r=Oo (2.6.11) Уравнение (2.6.8) имеет такой же вид, как и (2.6.4); из него при п = 1, 2, ... последо- вательно можно вычислить Ял> е1» полагая ЯМ1 = («1«1 - *Ю])*1(0,е). После этого из (2.6.7) может быть опре- делен процесс на выходе системы.
МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ 255 Таким образом, общее уравнение, опи- сывающее рассмотренный класс нелинейных дискретных систем, - это уравнение вида (2.6.8), содержащее в правой части "нелиней- ность с памятью" о предыдущих значениях искомого сигнала у[/л, е], т = 0, 1, ..., п - 1. Дискретная система с нелинейными спосо- бами импульсной модуляции включает один или несколько нелинейных импульсных элементов и непрерывные части, описываемые диффе- ренциальными уравнениями. Если непрерыв- ные части линейны, то легко могут был» со- ставлены уравнения нелинейной дискретной системы. Так для системы на рис. 2.6.2 (Н.И.Э. - нелинейный импульсный элемент) при широтно-импульсной модуляции получим с учетом (2.6.2) для сигнала ошибки оо «(0 = g(i) - 2^signe|MR(e|»»l,7,m), m=0 (2.6.12) EUe i = J о (2.6.13) - функция, описывающая форму импульса. Если импульсы прямоугольные * (рис. 2.6.1, б), то Рис. 2.6.2. Дискретная система с нелинейной модуляцией сигнала ошибки $(е[/и],т - т) = 1(т - т) - 1(т - т- y(ef/и])), где у(е) - модуляционная характеристика им- пульсного элемента (см. п. 1.6.1). В этом слу- чае из (2.6.13) при t = т + £ следует к(фп], F, m) = i-m) = = = е J £н(ч)<й] при 0 £ с £ г(е[>и]); О У ]Х(е - nWn при 1 > £ £ у(е[/и]) .0 и уравнение (2.6.12) при / = л + £ может был» записано в виде л-1 у(е[т]) е - £ sign elm] | *н[л - т,г - пМп - sign 4л|| Лн(п)<*1. т»0 о О при 0 £ £ £ (2.6.14) л Y(elmJ) g|fl,£]- У>цпфи] т>е “ чИп> ПРИ у(е[л|) ^ £ < 1. т=0 о Из первого равенства при £ = 0 получа- ется рекуррентное соотношение л-1 Y(dm]) е(л) = £(л)-£sign«M |лн(л-л1-ч)<Лъ т=0 О (2.6.15) позволяющее вычислить фг] при п = 1, 2, ... После этого из (2.6.14) можно определить процесс изменения ошибки в любой момент времени, т.е. при 0 £ £ < 1. Сигнал на выходе системы определится как х(Г) = ^signepn]fc(e[/n],F,m). (2.6.16) m=0 Пример 2.6.1. Найти процесс изменения ошибки в системе с широтно-импульсной модуляцией прямоугольными импульсами. Модуляционная характеристика имеет вид Y(e) = O^H при И < 2; 1(e) = 1 при |е| > 2. Передаточная функция непрерывной части И^(5) = А:/(1 + T\S)\ k= 1, Т\ — 0,2 с, период квантования Т = 0,1 с. Ко входу системы приложено единичное ступенчатое воздейст- вие. Соотношение (2.6.15) в данном случае имеет следующий вид:
256 Глава 2.6. НЕЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ л-1 y(e[mj) ё[п\ = 1[л] - signe[/и 1 J Лр1е“₽|(л“т)+₽,ПЛ] = ш=0 о л-1 = 1[л] - y^signe[m]jte"₽,(”“w)(e₽,Y(^w,) - 1), ?я=О ₽! =Т/71 =ОЛ При х(О) = О получим е[О] = 1, далее e[lj = 0,84, e[2J = 0,75, ... При 0 £ 8 < у(е[л]) по формуле (2.6.14) получим л-1 е(л,8] = 1[л,8]- yR>signe[/w]Aje~P1^”~/”)~g^ х Л1=О х - 1) - signepi](i - е"р,е| При у(е(л]) £ £ < 1 е|л,е] = 1|л,с] - ^signe|wi]Ae₽l<'‘ ” е) х Л1=О х(7) = y^signejmK(elm],F,m), (2.6.17) Л1=О где i fc(e[m],7,m) = Js(t - т - 0(e[m]))fcH (7 - ¥)tfc, о (2.6.18) 0(e) - модуляционная характеристика. В частности, при использовании прямо- угольных импульсов с постоянной шириной уТ (рис. 1.6.1, в) 5(7) = 1(7) - 1(7 - у) функ- ция k(eyi,m) определяется следующим образом: &(е|/и],7,/и) = &(е[/л],7 - т) = Вид процесса, построенного по этим формулам, и соответствующего ему сигнала на выходе импульсной системы показан на рис. 2.6.3. При фазо-импульсной модуляции выход- ной сигнал в нелинейной дискретной сис- теме (см. рис. 2.6.2) может быть найден по формуле 7-л1-р(е(л11) о при т + 0(е[/л|) < 7 < т + 0(е[/л|) + у, у |kK(t - т- (P(e|m|) + п)<#П 0 при 7 > т + 0(efmj) + у. Рис. 2.6.3. Переходные процессы в системе с широтно-импульсной модуляцией сигнала (2.6.19) Уравнение для сигнала ошибки е(О = g(i) - £signetfliK(eM,F,m) m=0 отличается от (2.6.12) только видом функции *(е|м],7 ,т). Для случая прямоугольных им- пульсов при 7 = п + 8 это уравнение с учетом (2.6.19) можно записать более подробно:
ОПРЕДЕЛЕНИЕ ПЕРИОДИЧЕСКИХ ПРОЦЕССОВ В НЕЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМАХ 257 л-1 У 8-Р(е(я]) gh,8j- ^signe[m]jA:Hh-m,8-p(e[m])-T]]dn4-signe[n] Jкн m=0 о О ф|,е] = при р(е|л]) £ е £ ₽(ИЛ1) + т; (2.6.20) £(л,е]- £signefm)pHl«- m=0 о т, е - Р(е[т]) - т]Ип при 0(4"1) + у £ е < L Из первого уравнения, как и в предыду- щем случае можно определить рекуррентное соотношение для вычисления е[п] при л = 1, 2, ... е[л] = $[и] - л-1 г - £ signe[ ™1J ₽(4>и]) - nWn т=0 0 (2.6.21) Это уравнение имеет такой же вид, что и уравнение (2.6.15), что позволяет составить общее рекуррентное соотношение, справедливое как для широтно-импульсной, так и для фазо- импульсной модуляции: ef»l = «[»!- л-1 Y(e[mJ) -^signefmj J*н[л - т - Р(е[/и|) - пИп- m=0 0 (2.6.22) В первом случае здесь надо положить 0(е[т]) = 0, а во втором у(е[/л]) = у = const. После того как вычислена решетчатая функция е[л], из (2.6.20) можно найти про- цесс изменения сигнала ошибки в любой мо- мент времени, а из (2.6.17) - процесс измене- ния выходного сигнала в системе. Пример 2.6.2. Найти вид функции к(фп],1 - т) (2.6.19), если *н(0 = V=1 Полагая в (2.6.19) / = л + е, г = л-/и, будем иметь при 0(е[/и]) £ е + г £ P(ef /и]) + у едн г) = 52—(1 - ехр(- 9v(r + е - МИМ)))) V=1 При т + Р(е(/и]) £ г + е < 1 /с(е[т],г) = = ехр(" «v(r + е - Р(е|м|)))(е'’’1' -1) V=1 Аналогичный подход применяется и при составлении математических моделей нели- нейных дискретных систем с другими видами модуляции сигнала. 2.6.2. ОПРЕДЕЛЕНИЕ ПЕРИОДИЧЕСКИХ ПРОЦЕССОВ В НЕЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМАХ. ТОЧНЫЕ МЕТОДЫ Для нелинейных дискретных систем, в отличие от нелинейных непрерывных систем, могут быть получены точные уравнения, опре- деляющие периодические процессы в системе. Методику их составления рассмотрим для слу- чая нелинейной дискретной системы с ампли- тудно-импульсной модуляцией, уравнение которой имеет вид (2.6.1). При g[n,e]«0 уравнение можно переписать при 8 = 0 сле- дующим образом: п efn] = - Ф(е[л - /и])£[/и]. (2.6.23) т=0 Задача заключается в определении перио- дического решения (автоколебаний), т.е. решет- чатой функции, удовлетворяющей условию efn] = efn + гМ\, где г = 0, ±1, ±2,..., М - период е(л]. Группируя слагаемые в правой части (2.6.23) по М слагаемых, получим: 52$(е|л - = т=0 N (r+DAf-1 r=0 m=rM 9 Зак 1023
258 Глава 26. НЕЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ N М-1 = 2 Е ф^п ~z rM]W+= г=0 /=0 N М-1 = YY/t><An~t]we+rM\= г=0 /=0 М-1 = ^Ф(е(л-<])ЛГЛг1<], /=0 KN[t} = ^t + rM\ г=0 Поскольку автоколебания возникают по- сле завершения переходных процессов, то величина N должна быть выбрана достаточно 00 большой. Если |Л[гI < оо , то при N -> оо г=0 существует предельная функция оо г=0 Таким образом, из периодичности е(л] следует, что уравнение (2.6.23 ) для п = 0, 1, 2,... можно заменить уравнением М-1 фи=- £ (2-б-2*> 1=0 определенным для конечного числа значений аргумента п = О, 1, ..., М - 1. Последнее урав- нение можно рассматривать как нелинейную систему М уравнений относительно неизвест- ных значений е[0], е[1], ..., е[М - 1]. Если эта система имеет решение, то оно определяет автоколебания с периодом М. Поскольку пе- риод заранее неизвестен, исследование систе- мы (2.6.24) проводят последовательно при М= 1, 2, ... Для этого целесообразно использовать численные методы. Систему уравнений (2.6.24) можно пред- ставить как векторное уравнение е = -КФ(е), (2.6.25) где е = [е(0] е(1]... efM-ll]1; Ф(е) = (Ф(е[О|) Ф(е[1|)... Ф(е[М -1])]1; ЩО] К[М-1] ... К|2] Щ1]' 41] ЩО] ... ЩЗ] Щ2] К[М-1] ЩМ-2] ... Щ1] К[0] Применяя метод последовательных при- ближений, задают начальное приближение е° и определяют последующие приближения из соотношения е' = -КФ(е/-1)> i = 1,2,... (2.6.26) Если последовательность {е*} сходится, то для данного М существует периодический процесс, который и определяется в результате процедуры. В некоторых случаях установить сходимость можно заранее, пользуясь прин- ципом сжатых отображений (теорема Банаха). Согласно этому принципу для е*, принадле- жащего некоторому метрическому пространст- ву, должно выполняться соотношение |к^Ф(е<_1) - Ф(е* )j| £ <х||е/-1 - е'| при а < 1. Если функция Ф дифференцируе- ма, то отсюда следует достаточное условие сходимости ЧёК1- (2.6.27) В частности, при = шах^|х^| полу- чим М-1 N= EIM 7=0 Если принять гипотезу о том, что иско- мые автоколебания симметричны, т. е. е]п + kN] - (-1)*ф1]> где N = М/2 - полупериод, к = 0, 1, 2, ...» то задача несколько упрощается. Полагая в этом случае, что Ф(е) - нечетная функция, получим аналогично предыдущему JV-1 Ил] = Ф(ф1 - *1)*д RL (2.6.28) /=0 где п = О, 1..N- 1. Таким образом, число уравнений, как и число неизвестных, сокращается вдвое.
ОПРЕДЕЛЕНИЕ ПЕРИОДИЧЕСКИХ ПРОЦЕССОВ В НЕЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМАХ 259 Функцию АГ[1] можно найти с помо- щью Z-преобразования: r=0 ^*(Z). W*(z) = г{цп]}. По формуле обращения г=0 (2.6.29) ад] Res i-zM Z=Zy где Zv - полюсы W*(z)- В частности, если все полюсы простые, то это вьфажение имеет вид Р -л-1 v=l !“<v Аналогично определяется А"д[€] с уче- том того, что \ ’ l-z l + Z (2.6.30) Уравнения, определяющие периодиче- ский режимы в нелинейных дискретных сис- темах, можно построить с использованием ряда Фурье. При этом искомую периодическую функцию фИ с периодом М представляют в виде частичной суммы ряда Фурье: N «[«1= Хс*е7*“',> (2-6-31) k=-N ще аГ = 2л / М ; ^ = JИ/2, если М четно и N = (М - 1) / 2 , если М нечетно; . М-1 с* = ~й Е (2.6.32) м to Таким образом, периодическая решетча- тая функция, в отличие от периодической непрерывной, точно представляется отрезком ряда Фурье (2.6.31). Если нелинейность Ф(е) нечетна, то Ф(4Я1) - периодическая решетчатая функция с периодом М и для нее справедливы соотно- шения (2.6.31), (2.6.32): N ф(4л])= £муЛюл; (2.б.зз) £=-ЛГ 1 М~' Ьк=± £ф(Ф»])е-'*ии = л=0 . М-1 ( N А ЧЕ^Е^еУ'ю" е'у*“и. (2.6.34) М я=0 \г=-Л ' Подставляя (2.6.31), (2.6.33) в уравнение нелинейной дискретной системы (2.6.23), по- лучим _ nN k=-N m=0k=-N При достаточно больших значениях п п N ЕЕ Ьк^^п т>£[/и]« m=Qk=-N N «> k=-N т=0 N = ^b^W^JSk), k=-N где - амплитудно-фазовая частотная характеристика линейной части дискретной системы (см. п. 1.6.1). Следовательно, из рассматриваемого уравнения получается система 2N + 1 равенств относительно такого же числа неизвестных Q: ск ~ ~bkW*(Jk&), (2.6.35) к = 0, ±1, ±2.±АГ, где Ьк определяются по формуле (2.6.34). Если искомый процесс - симметрическая периодическая решетчатая функция и М — 2N, то сумма в правой части (2.6.31) со- держит только нечетные гармоники: k=-Ni Nl = N - 1 если N четно и N\ = N, если N нечетно; штрих у знака суммы означает сум- мирование только по нечетным гармоникам. В этом случае в (2.6.35) значения к - нечетные числа к = ±1, ±3, ..., ±N\\ 9*
260 Глава 26. НЕЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Ьк =' о *-1 ( Д . _ ] -^-^Ф 2^ ckeJnM e~Jkx*n, (2.6.37) М л=0 lr=-AG - 1 = W*(Jn/WW*(a,N,<p), (2.6.41) где причем b±ff = 0 при четном N; с_к - ск , Ь_к - Ьк ; ЙК*(-уАЕ) = FF*(/Ato) . Следова- тельно, при определении симметричных авто- колебаний достаточно рассмотреть всего N\ уравнений (2.6.36) при к = 1, ...» N\, из кото- рых можно найти N\ неизвестных ск. Таким образом, получена другая форма нелинейных уравнений, позволяющих найти периодический процесс в дискретной системе, если он существует. Эти уравнения являются точными и погрешность вычислений опреде- лится только приближенным численным мето- дом, применяемым для их решения. 2.6.3. МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ ДЛЯ ДИСКРЕТНЫХ СИСТЕМ Приведенные выше соотношения (2.6.34), (2.6.35) позволяют определить перио- дический процесс в нелинейной дискретной системе как сумму N гармонических состав- ляющих. Однако в большинстве случаев для практики достаточно найти первую гармонику автоколебаний, что приводит к методу гармо- нической линеаризации для нелинейных дис- кретных систем. Будем искать автоколебания в виде сим- метричного процесса вида е(л] = а cos(co« + ср), со = 2к/М = k/N. Предположим также, что выполняется неравенство «|И'»(/ш)| (2.6.38) при к = 1, 2, ..., TV = М/2. Тогда вместо ра- венств (2.6.35), (2.6.37) можно рассмотреть лишь одно равенство, соответствующее к = 1: q = -/>1^*0©), (2.6.39) где 2 N~l Ф(а cosfcoh + ср))е" ; (2.6.40) л=0 q = М^/2. Подставляя (2.6.40) в (2.6.39), уравнение для первой гармоники записывают в виде FFH*(a,AT,cp) = (2.6.42) - дискретный коэффициент гармонической ли- неаризации нелинейного элемента Ф(х). Урав- нение (2.6.41) является аналогом основного уравнения метода гармонической линеариза- ции в теории непрерывных систем. Поскольку значением N заранее задаются, из (2.6.41) нужно найти а и ср, что можно сделать графи- ческим способом. Из семейства кривых - FFH-1(a,JV,(p) 0 а £ оо , построенных для „ Я Я различных значений------— ср ——, выби- 2N 2N рается та, которая при ср = ср * пересекает годограф FF (/со) в точке со * = k/N . Иско- мое значение амплитуды а * соответствует точ- ке пересечения годографов (рис. 2.6.4). Для нечетных нелинейностей (a, JV,-cp) = (а, N, ср), что позволяет ограничиться построением i¥H(a,N,(p) при Рис. 2.6.4. Определение параметров автоколебаний методом гармонической линеаризации
МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ ДЛЯ ДИСКРЕТНЫХ СИСТЕМ 261 Пример 2.6.3. Вычислить дискретный ко- эффициент гармонической линеаризации для релейной характеристики (рис. 2.6.5, а). При W = 2, - — ср — 4 4 При 7V = 3 »,н(«Д<Р)=^е’л> х (а&ср) = —[Ф(а coscp) + /Ф(а sin <р)]е & = а При определении автоколебаний для N= 2 нужно построить трафики Следовательно, при 0 ср — L* (аД ср) = ^аДср) = И,н(вД<Р)=^е-А>. За т. е. семейство прямых линий, расположенных внутри угла — я ср — я (рис. 2.6.5, 6). 4 4 Соответствующие графики L 5я 7я расположены в секторе — ср . 6 6 При N = 4 ср) = 2а sin — 8 Рис. 2.63. К примеру 2.6.3: определеяие параметров автоколебаний Прямые L (а,4, ср) лежат в секторе 7^9 -я £ ср — я. 8 8 На рис. 2.6.5, б показан годотраф FF (Jo) , соответствующий условиям возник- новения автоколебаний при N = 2. Фаза автоколебаний ср* определяется прямой, про- ходящей через точку ; условие их возникновения имеет вид: — sargFP Ь-К—. 4 \ 2/ 4 Общий вид Wn(a,N для нелиней- ности из примера приведен в табл. 2.6.1. дис- кретных коэффициентов гармонической ли- неаризации для некоторых типовых нелиней- ностей [44].
262 Глава 2.6. НЕЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ 2.6.1. Таблица дискретных коэффициентов гармонической лппеаризацпн Ввд нелинейности Ф(х) Дискретный коэффициент гармонической линеаризации w£(a,N,q>) Для четного N aN sin—— 2N Для нечетного N ---*____е-*, хт . я aN sin—— os<₽^; __2С_ -4Ф±#) с aVsin-^- 2# {(^1 + к2 +1) + Sin-^(fci +к2 +1) sin — N . а я sin—— 2N ехр -2Дч> (*1"*2)] + exp -4<P+^y(*l ~к2) я . . я 27УФ^ k'i - Е<— arccos— ±ф . я к а 71 ^-^-(л1+л2+1)_ Sin-£:(*1 +к2 +1) Г / ----Р я--------ехр - 2/1 ф + sinjv я sin—— 2N ф+^(л’ _*2))
МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ ДЛЯ ДИСКРЕТНЫХ СИСТЕМ 263 Рис. 2.6.6. Определеок параметров автоколебаний с помощью логарифмических частотных характеристик Для исследования устойчивости автоко- лебаний справедливы те же критерии, что и в случае непрерывных систем. Так, если годо- граф L (a,N,<p*) при увеличении а выходит из области, ограниченной годографом W (/со) , то автоколебания устойчивы. В рассмотренном выше примере (см. рис. 2.6.5) автоколебания устойчивы. Сформулированное условие пред- полагает, что FP(^) не имеет полюсов в пра- вой полуплоскости. Метод гармонической линеаризации для дискретных систем с использованием ЛЧХ аналогичен соответствующему методу для не- прерывных систем. Задача сводится к решению уравнений, следующих из (2.6.41): - ЬтИ^АГ.ф) = 'у (2.6.43) -ж -ащИ'^в.АГ.ф) = (2.6.44) Пример 2.6.4. Определить методом ЛЧХ автоколебания, соответствующие N = 2 в дис- кретной системе, имеющей заданные ЛАЧХ и ЛФЧХ (рис. 2.6.6). Нелинейный элемент име- ет релейную характеристику (см. рис. 2.6.5, а); Т=0,1 с. -ЬтИ'н^Дф) = 20\ga / cjl; argtrH*(d,2,v) = j-ф. „ я я Значению — = — соответствует • 2 ♦ я 2 пл - »o = 7tg—=7 = 2ос*. Если при этой частоте ФЧХ ф(со) = argFFM,(/»*) не заходит в заштрихо- ванную область (кривая 1), то автоколебаний при N ~ 2 нет, в противном случае (кривая 2) из цэафиков 1Кн(а,2,ф) можно найти ампли- туду а* и фазу ф* автоколебаний (см. рис. 2.6.6).
264 Глава 2.6. НЕЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Метод гармонической линеаризации ис- пользуют при анализе автоколебаний в цифро- вых системах, обусловленных эффектом кван- тования сигнала по уровню (см. п. 1.6.1). Не- линейность, описывающую квантование по уровню, можно представить так, как показано на рис. 1.6.2, т.е. как сумму релейных характе- ристик с зоной нечувствительности: L Ф(х) = £/>(*); (2.6.45) *=1 при а^ = кс с при О при Ь, к = 1,2,...,£; Н <(*-{)*• ной дискрет-ной системе возникнут автоколе- бания. Вид процесса на выходе нелинейного элемента у|л] показан на рис. 2.6.7, б. При N = 2 ^нА:(л»2>ф) - О при а < Д^/соБф; — е"^ при Д^/ссйф < а < Д^/зтф; cJl "А"?) ----е при а>Дл/8Шф. . а (2.6.49) На рис. 2.6.8, а показана при Коэффициент гармонической линеариза- ции для функции Ф(х) определяется по фор- муле (2.6.42) в виде: L ^(a,N,4>) = (2.6.46) к=\ v’f ( (* 4^т+ф) х 7, -fy I Д cos[— ffl -кр 11е т=0 ' (2.6.47) Рассмотрим более подробно дискретный коэффициент гармонической линеаризации И^(л,ЛГ,ср) различных значений N. При N = 1 О ПРИ flCOSCp < Д*, д* = 2С -/д, —е ™ при асовф>Дл. (2.6.48) Область на комплексной плоскости, в которой лежат соответствующие годографы =-И^^А^ф), представляет собой левую полуплоскость относительно вертикаль- ной прямой с абсциссой -Д&/2С (рис. 2.6.7, а). Если точка годографа АФЧХ линейной части системы соответствующая ш=70\Г=л, окажется внутри этой области, то в нелиней- -----< Ф < — область, в которой лежат годо- 4----4 графы 1^,^(а,2,ф) при различных значениях амплитуды а. При Д^/cos ф < а < Д^/зшф годографы лежат в подобласти 7, а при а > Дд/sin ф - в подобласти 2. Если точка годографа АФЧХ линейной части системы лежит в подобласти, обозначенной 0, то автоколебания не возни- кают; в подобласти 1 автоколебания возникают и имеют вид, показанный на рис. 2.6.8, б\ в подобласти 2 они имеют вид, показанный на рис. 2.6.8, в. В области 7, 2 возможны оба вида автоколебаний в зависимости от знака фазы ф колебательного процесса. Рис. 2.6.7. К условию возникновения автоколебаний при TV- 1
МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ ДЛЯ ДИСКРЕТНЫХ СИСТЕМ 265 я) Рис. 2.6.8. К условию возникновения автоколебаний при 7V- 2 Рис. 2.6.9. Область возникновения автоколебаний при произвольном значении N Для произвольного N, т.е. для произ- вольной частоты искомых автоколебаний, до- пустимая область их возникновения будет заключена внутри угла (рис. 2.6.9). Полученные коэффициенты гармониче- ской линеаризации FKH^(a,^(p) можно ис- пользовать для решения задачи об определе- нии автоколебаний в цифровой системе. Пусть, например, L = 2 и N = 2. Тогда И'нО’Дф) = И^|(вД<р) при 0<в<-у; 2»&(a,2,q>) при а>у, причем определяется по формуле (2.6.49), Д1 = Ь/2\ Д2 = 3/>/2. Область расположения годографов £*(a>2,cp) показана на рис. 2.6.10, а. Воз- можны пять типов периодических процессов у[л] в зависимости от соотношения амплитуд и фаз: 1) 3/2д > л cos ср > b/2\ a sin ср < />/2; 2) 3/2b > л cos ср > d/2; a sin ср > д/2; 3) 3/2b < fl cos ср; 3/2b > esincp > d/2; 4) 3/2b < fl cos ср; 3/2b < esincp; 5) 3/2b < flcoscp; esincp < b/2. Эти области удобно представить на ком- плексной плоскости х = и + /V = (рис. 2.6.10, б). Нумерация областей на плос- кости годографов соответствует типам перио- дических процессов, показанных на рис. 2.6.11. Для того чтобы определить периодиче- ский процесс в цифровой системе, нужно най- ти годограф £*(дДср), проходящий через точку 1F*(/ л/2) годографа АФЧХ линейной части. На практике обычно пользуются доста- точным условием отсутствия автоколебаний, вызванных квантованием сигнала по уровню. Из приведенных выше положений следует, что достаточным условием отсутствия автоколеба- ний при произвольном N является условие, чтобы точка не принадлежала заштрихованной области, полученной для N = 1, 2, 3 (см. рис. 2.6.10, а). Это условие сохраняется при увеличении числа учитываемых разрядов L.
266 Глава 2.6. НЕЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ а) б) Рис. 2.6.10. Область автоколебаний в цифровой системе (L - 2, 7V- 2) Рас. 2.6.12. Запретам зова дм фазочастотно* тирагп риг тики
УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ 267 Достаточное условие отсутствия автоколе- баний в цифровой системе можно сформулиро- вать в терминах логарифмических частотных характеристик. Для каждого значения можно построить соответствующую запретную зону для ФЧХ линейной части системы (рис. 2.6.12). При Lm.FKw(/co ) > 201gAjt/c = г отклонение ф(го*) от -я должно быть не менее я/TV, а при LmFKw(/o ) < г это отклонение ф ог- I • Г1 раничивается условием cosy = IFK (/<»*) . Автоколебания с полупериодом N не возни- кают, если значение ф(<»о) ПРИ . 2 я “0=7^ не попадает в построенную запретную зону. С помощью ЛЧХ можно определять и параметры периодических процессов в цифро- вых системах (см. [44]). 2.6.4. УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ Основные теоремы об устойчивости. Ме- тоды анализа устойчивости по Ляпунову не- прерывных нелинейных систем были распро- странены и на дискретные системы. Пусть нелинейная дискретная система описывается системой разностных уравнений, записанных в нормальной форме: У[» +1) = ₽<у(л]), (2.6.50) где У = [У1 .ydT; F = [Ji...FdT; п = 0,1,2,..., F[ - непрерывные функции переменных у/, причем 7*Х0, ..., 0) = 0, / = 1, ..., к. Тогда сис- тема имеет тривиальное решения у[л] = 0, соответствующее начальным условиям у[0] = 0. Для каждых ненулевых начальных условий у[0] из (2.6.50) определяется единст- венное решение у [л]. Тривиальное решение у[л] = 0 называют устойчивым по Логунову, если для любого сколь угодно малого числа £ > 0 существует такое 5(e) > 0, что любое решение у [л], для которого в начальный момент выполняется условие Ы<>1 < 5, удовлетворяет неравенству ||у[л|| < £, начиная с некоторого значения n = N <<п. Тривиальное решение у[л] = 0 называют асимптотически устойчивым в области А, если оно устойчиво и существует такое число А, что для любого решения у[л], такого, что Цу1о| < А, будет выполняться равенство lim|yt»fl = °. Л—>оО Тривиальное решение называют неустойчи- вым, если существует такое £ > 0, что для любого 5 > 0 найдется момент времени N, при котором несмотря на соблюдение условия Нош < 5 будет выполняться неравенство IlyWh е- Исследование устойчивости произволь- ного решения у[л] = £[л] системы (2.6.50) можно свести к исследованию устойчивости тривиального, если ввести переменную, опи- сывающую отклонение возмущенного движе- ния у [л] от невозмущенного £[л]. х[л] = у] л] — £[л]. Из (2.6.50) следует х|л + и = F(x[«] + а»1) - = С(х|л]). Полученная система разностных уравне- ний имеет тривиальное решение х[л] = 0, соответствующее у [л] = £[л]. Если это реше- ние устойчиво или асимптотически устойчиво, то устойчиво решение £[л] системы (2.6.50). В соответствии с методом Ляпунова вве- дем знакоопределенные и знакопостоянные функ- ции (Ляпунова) ..., у%) в пространстве решений у. Определим первую разность V, взятую в силу системы (2.6.50) как AJ'O'l....z0 = *'0'll'» + l],--.n['» + l|)- -у(уМ,...,уМ) = = Р(Л(у1л],...,Ft(y|/»])) - ио-Ил],= = H(F(ypil) - К(у[л])). Справедливы следующие теоремы об ус- тойчивости тривиального решения дискретной системы. Теорема об устойчиво- сти. Если в некоторой окрестности начала координат у = 0 существует знакоопределен- ная функция F(y) такая, что ее первая раз- ность ДЦу) в силу системы (2.6.50) является знакопостоянной функцией противополож- ного знака, то тривиальное решение системы (2.6.50) устойчиво.
268 Глава 26. НЕЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Теорема об асимптоти- ческой устойчивости. Если в некоторой окрестности начала координат су- ществует знакоопределенная функция К(у), первая разность которой ДЦу) в силу системы (2.6.50) является знакоопределенной функцией другого знака, то тривиальное решение систе- мы (2.6.50) асимптотически устойчиво. Теорема о неустойчиво- сти. Если существует непрерывная функция И(у), удовлетворяющая условию ЦО) = 0, первая разность которой ДР(у) в силу (2.6.50) является знакоопределенной функцией, при- чем в любой окрестности начала координат найдется точка, в которой И(у) принимает значение одного знака с ДК(у), то тривиаль- ное решение (2.6.50) неустойчиво. Доказательство этих теорем можно найти в [10]. С помощью общих теорем об устойчиво- сти дискретных систем был установлен ряд частных, но более удобных для практического применения условий устойчивости. Наиболее часто используется теорема об устойчивости по уравнениям первого приближения. Пусть уравнения системы (2.6.50) могут быть представлены в виде у[и + 1] = Ау[л] + Ф(у[л]), (2.6.51) т.е. в них может быть выделена линейная часть, описываемая матрицей А = /,у = 1, ...» к, и нелинейная часть Ф = [cpi, ...» cpJT; Ф(0) = 0, причем нелинейные члены имеют порядок малости выше первого, т.е. ФпЦтГ = ft (2-6.52) Систему линейных разностных уравне- ний у[» +1] = Ayl»] называют в этом случае системой линейного приближения. Если функции F(y) не только непрерывны, но и непрерывно дифференци- руемы, то систему первого приближения, как и в случае непрерывных систем, можно полу- чить с помощью ряда Тейлора, записанного в окрестности тривиального решения. Теорема об устойчиво- сти по первому приближе- нию. Если все собственные значения X/ мат- рицы А расположены внутри единичного кру- га, т. е. |Х/| < 1, /= 1, 2, ..., к'< к, то тривиальное решение системы (2.6.51) асимптотически устойчиво. Покажем, каким образом достаточность условий этой теоремы вытекает из теоремы об асимптотической устойчивости для случая, когда все корни различны, т.е. существует невырожденная матрица Т такая, что Т*АТ = X = diagP-j ...X*]. Полагая в (2.6.51) х = Ту, получим х[и +1] = Хх[и] + \|/(х[и]); (2.6.53) \|/(х) = Т-1Ф(Т_1х). Из определения системы линейного при- ближения следует, что для \|/(х) выполняется условие Выберем V = ||х||. Тоща первая разность в силу системы (2.6.53) будет ДГ(х[л]) = |х|л +1|| - ||х|л| = = хт|л](ХтХ - Е)х[л] + 2ц/т(х[л])Х(х[л]) + + Ч'т(Мл))'И(х|л]). При ||хЦ -> о ^(X’X-EJxIs-a-xURx); ||v|/T(x)Xx|| < Хщ^РХх) и, следовательно, существует такая окрестность начала координат, в которой с учетом условия |Х/| < 1 первая разность ДИ(х[л]) является отрицательно определенной функцией. Следо- вательно, тривиальное решение (2.6.53) асим- птотически устойчиво. Теорема о неустойчиво- сти. Если хотя бы одно собственное значе- ние матрицы А расположено вне единичного круга, т.е. | Х/| > 1 для некоторого /, то триви- альное решение системы (2.6.53) неустойчиво. Если среди собственных значений X/ есть такие, что I Х/| = 1, то по уравнениям линей- ного приближения нельзя судить об устойчи- вости тривиального решения системы (2.6.53). Пример 2.6.5. Исследовать устойчивость тривиального решения системы разностных уравнений:
УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ 269 УЙЛ + 1] = 0,5у1[л] + siny2(n]; У2[п + 1] = - 1,5у2[л] + У1[л]у2[л]. Правая часть системы удовлетворяет ус- ловию (2.6.52). Применима теорема об оценке устойчивости системы по уравнениям первого приближения; последняя имеет вид: У11» + 1] = 0,5У1[л] + У2[л|; yiln + 1] = -1,5у2[л]. Собственные числа матрицы а_Г0’5 1 О -0,5 определяются из характеристического уравне- ния det(A - ХЕ) = X2 + X - 0,75 = 0; Xi = -1,5; Х2 = 0,5. Поскольку | Xi | > 1,5, тривиальное решение системы неустойчиво. Условия устойчивости нелинейных дис- кретных систем. На практике применяется ряд частных критериев устойчивости, которые могут быть обоснованы с помощью основных теорем об устойчивости (см. выше). Условие сжатия (Критерий Калмана-Бертрама). Если правая часть систе- мы нелинейных разностных уравнений (2.6.50) F(y) определяет функцию сжатия, т.е. ||Г(У)|| < Ы от» любого у * 0, то тривиальное решение этой системы асимптотически устой- чиво. Действительно, полагая К(у) = |у||, по- лучим, что первая разность в силу системы (2.6.50) отрицательно определена: ДИ(у[л]) = |у|л + 1||-||у|л|| = = ||₽(У(»])||-М1<а По теореме об асимптотической устойчи- вости тривиальное решение системы (2.6.50) асимптотически устойчиво. Если функции Fj дифференцируемы по своим переменным, то обозначая в окрестности начала координат можно запи- сать неравенство В этом случае достаточным условием для того, чтобы F(y) была функцией сжатия, явля- ется условие ||f|| < 1. к В частности, полагая ||f|| = получим условие сжатия в форме к max, £|/j| < L (2.6.54) >1 Следующие критерии определяют доста- точные условия устойчивости для нелинейных разностных уравнений второго и третьего по- рядка. Критерий Пури-Дрейка: а) тривиальное решение нелинейного разностного уравнения второго порядка у\п + 2] + аху\п +1] + a2yln] + +/(И»],Ял + 1],и) = 0, гдеДх!, х2, п) обращается в нуль при всех п только при Х\= х2 = 0; а2 - действитель- ные числа, асимптотически устойчиво, если выполняются условия а2 > 0; (а2 + I)2 - в2 > 0; 1 - а2 > 0; 2Г12(1-Г2) f(Xi,X2,n) r(!-r2) X. <°’ где п=^7Т^в2+1)2-в*’ г = а2; б) тривиальное решение разностного уравнения третьего порядка у\п + 3] + аху\п + 2] + а2у\п +1] + взу[л] + + /(Я»1,Я« +11,Я» + 21,») = о- где/(х1, х2, Х3, л) обращается в нуль при всех п только при х\ = х2 = хз = 0, асимптотиче- ски устойчиво, если выполняются условия в3 <0; Вх> 0; В2 - > 0;
270 Глава 2.6. НЕЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ (В, + В2)2 - В32 > о; 2^/2(Х1,Х2,Хз,л); В] = 1 - а2; В2 = а2 ~ а1аз! В3 = «1 - а2а3; В2(И-а2) 1 аз(А+*2)’ с ______________BtB32__________ С2 ’ 1 +(В2-В2)[(В!+В2)2-Вз2]’ ' Пример 2.6.6. Определять устойчивость тривиального решения нелинейной системы по теореме Калмана-Бертрама: У1[л +1| = 1 + 0ДУ1[л| - cosy2[n|; У2(" + Л = У1 [»] - <W2 [л] + у,2!»!- В данном случае /п = о»5; /12 = °; /21 = 1; /22 = -°л Проверим условие сжатия ||F(y)j £ ||у| (2.6.54): 2 max/ ^fy = max[0,5; 0,5] < L J=1 Условие сжатия выполняется, следова- тельно, правая часть рассматриваемой системы определяет функцию сжатия и по критерию Калмана-Бертрама тривиальное решение асимптотически устойчиво. Пример 2.6.7. Исследовать устойчивость тривиального решения нелинейного разност- ного уравнения у[л + 2] + у\п +1] + 5у[л] - (1 + с sin п)у3 [л] - - у2\п + 1]у[л] = 0 по критерию Пури-Дрейка. Для того чтобы воспользоваться критери- ем в формулировке а), вычислим г = 0Л; п=з/5/б; zi=-1/3. Проверим условие устойчивости: г > 0; (г +1)2 - г2 > 0; 1 - г2 > 0; 0 < (1 + с sin и)у2[и] + у2[п +1] . Последнее условие определяет область на фазовой плоскости (Ии],Я# +1]), в которой тривиальное решение устойчиво. Условие абсолютной устойчивости. Со- стояние равновесия дискретной системы, по- казанной на рис. 2.6.1, а абсолютно устойчиво, если оно устойчиво при любых начальных отклонениях и для произвольной нелинейной характеристики Ф(е), удовлетворяющей усло- виям: Ф(0) « 0; еФ(е) > 0 при е * 0; os®W<ti Jt > 0. (2.6.55) е Ниже формулируются достаточные усло- вия абсолютной устойчивости дискретных систем, являющиеся аналогом соответствую- щих условий для непрерывных систем. Достаточное условие абсо-ъ лютной устойчивости для устойчивой линейной части. Если линейная часть дис- кретной системы (см. рис. 2.6.1, а) устойчива, т.е. все полюса ее передаточной функции лежат внутри единичного круга, нели- нейная характеристика удовлетворяет условиям (2.6.55) и выполняется неравенство i/k + Re !F*(/o) > 0, (2.6.56) где - АФЧХ, то нелинейная дискрет- ная система абсолютно устойчива. Доказатель- ство этого условия можно найти в работе [10]. Условие (2.6.56) означает, что АФЧХ FF*(/o) линейной части дискретной системы должна располагаться правее вертикальной прямой -1/к. Из условия касания и прямой -1/%о (к$ £ к) определяется макси- мальная величина сектора, в котором может находиться нелинейная характеристика Ф(е) устойчивой системы: [0, Лбе]. Пример 2.6.8. Исследовать абсолютную устойчивость состояния равновесия нелиней- ной дискретной системы (рис. 2.6.1, а), если передаточная функция непрерывной линейной части WH(s) = ki/s(l + Tis), к\ = 2 с1, Т1 = 0,25 с, период квантования Т = 1 с, импульсный элемент осуществляет амплитудно-импульсную модуляцию с кратко- временными импульсами (см. п. 1.6.2). Нели- нейность удовлетворяет условиям (2.6.55).
УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ 271 Определим передаточную функцию ли- нейной дискретной системы, считая импульс- ный элемент идеальным: W(z) = Dz{W(q)} = *1Z(1- е~р) (z-l)(z-e'₽)’ Р = Г/ТЬ Амплитудно-фазовая частотная характе- ристика линейной дискретной системы _ 0,982(1,018 cosco - 1,018- у 0,982 sin со) (1 - cos со) (1,000324 - 0,036 cosco) Годограф АФЧХ приведен на рис. 2.6.13 при 0 < со < л . Выполняется условие RelF*(jco) > -1,037. Следовательно, нелинейная дискретная система абсолютно устойчива, если нелиней- ная характеристика расположена в секторе [0, М при = 1/1,037 = 0,9643. В более общей форме условия устойчи- вости нелинейной дискретной системы фор- мулируются для случая, когда Ф(е) принадле- жит сектору [fcj, fc] (рис. 2.6.14): ki << к; к^к> 0 (2.6.57) е и линейная дискретная система является неус- тойчивой или нейтральной. Достаточное условие абсо- лютной устойчивости для слу- чая неустойчивой линейной части [44]. Если линейная часть дискретной системы неустойчива и ее передаточная функ- ция lF*(z) имеет т полюсов вне единичного круга и нелинейная характеристика удовлетво- ряет условию (2.6.57), то нелинейная дискрет- ная система (рис. 2.6.1, а) абсолютно устойчи- ва, если АФЧХ 1F*(/d) при изменении со от О до л не пересекает окружности ТП 1 [ 1 1 I U* + - -г + тЧ 2\к кх) + Г*2 =1[-1 4 U1 f|2 ’ к) (2.6.58) и охватывает ее против часовой стрелки т/2раз. При т = 2 см. рис. 2.6.15. Рис. 2.6.14. Область определенна Ф(е) Рис. 2.6.15. Годограф, удовлетворяющвй условию абсолютной устойчивости при т - 2 Достаточное условие абсо- лютной устойчивости для слу- чая устойчивой, или нейтраль- ной линейной части. Если линейная часть дискретной системы устойчива, или ней- тральна, т.е. передаточная функция W*(z) имеет полюсы на единичной окружности и внутри единичного круга; нелинейная характе- ристика удовлетворяет условию (2.6.57), то нелинейная дискретная система (рис. 2.6.1, а) абсолютно устойчива, если АФЧХ 1F*(j<o) не охватывает и не пересекает окружность (2.6.58) (рис. 2.6.16).
272 Глава 27. ПРИНЦИПЫ БИНАРНОСТИ И НОВЫЕ ТИПЫ ОБРАТНОЙ СВЯЗИ Рис. 2.6.16. К условию абсолютной устойчивости для случая устойчивой, или нейтральной линейной части Рис. 2.6.17. К обобщенному условию устойчивости для случая устойчивой линейной части Можно расширить условия устойчивости для случая устойчивой линейной части, когда Де) удовлетворяет условиям (2.6.57) при к\ < 0. Обобщенное достаточ- ное условие устойчивости для случая устойчивой ли- нейной части. Если линейная часть дискретной системы устойчива, т.е. все полюса FF*(z) расположены внутри единичного кру- га, нелинейность удовлетворяет условию (2.6.57) и к\ < 0, то нелинейная дискретная система устойчива, если АФЧХ FF*(jo) расположена внутри окружности (2.6.58) (рис. 2.6.17). Более подробно вопросы анализа абсо- лютной устойчивости дискретных систем из- ложены в [44]. Глава 2.7 ПРИНЦИП БИНАРНОСТИ И НОВЫЕ ТИПЫ ОБРАТНОЙ СВЯЗИ 2.7.1. СТРУКТУРНЫЙ СИНТЕЗ НЕЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ На простом примере демонстрируются методы синтеза и возможности нового класса нелинейных регуляторов, робастно стабилизи- рующих объекты с неточно известными опера- торами. Проблема робастной стабилизации. Рас- смотрим стабилизацию в нуле следующего объекта (*1 =*2> |х2 = ах\+и с неизвестным параметром a(f), где |а(Г)| £ а0- Константа а$ известна, но сколь угодно велика. Проблема робастной стабилизации: воз- можна ли стабилизация такого неопределенного объекта, меняющего свои свойства в широких пределах, и достижение при этом заданного качества переходных процессов ? Для сравнения рассмотрим возможность известных приемов стабилизации. Стандартная линейная обратная связь и = - kx Xj - к2х2 ни при каких ограниченных параметрах к\, к2 не решает поставленную задачу, так как для изменяющегося a(f) не гарантируется даже устойчивость замкнутой системы управления. Теоретически задачу решает устремление коэффициента к обратной связи и = -k(dxx +х2) в бесконечность, где константа d > 0 задает требуемую степень устойчивости. Это прямо следует из анализа второго дифференциаль- ного уравнения замкнутой системы управле- ния Х1 =х2, х2 = axi - k(dxi +х2), которое при £ -» оо вырождается в алгебраиче- ское уравнение dbq + х2 = 0. После разрешения последнего относи- тельно х2 и подстановки результата в первое дифференциальное уравнение замкнутой сис- темы управления находим уравнение движе- ния вырожденной системы в следующем виде: %! + dx^ = 0. Откуда с очевидностью следует, что по- ставленная выше задача стабилизации решена (рис. 2.7.1).
СТРУКТУРНЫЙ СИНТЕЗ НЕЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ 273 Рис. 2.7.1. Фазовый портрет системы с глубокой обратной связью Рис. 2.7.2. Фазовый портрет системы переменной структуры Практически, однако, и это хорошо из- вестно, задачу нельзя считать решенной, так как существует критическое значение коэффи- циента ксг, превышение которого (т.е. при к > к^) влечет неустойчивость замкнутой сис- темы управления. Более того, с ростом коэф- фициента усиления все более активную и, как правило, негативную роль играют амплитуд- ные ограничения сигналов. Указанные обстоя- тельства качественно меняют ситуацию, делают практически невозможным использование глубокой обратной связи. Для преодоления указанных трудностей можно попытаться использовать адаптацию, однако, последняя гарантирует решение задачи только при стационарном объекте (т.е. при а = const), но даже при этом условии требуе- мое качество переходных процессов не гаран- тируется, как не гарантируется и устойчивость при структурных возмущениях. Для решения рассматриваемой задачи пригодны методы теории переменной структу- ры, когда обратная связь и = -fclxJsgnOfri +х2) терпит разрыв на прямой ст = dxx + х2 =0. Если параметр к > Oq + d2, то на пря- мой ст = 0 (рис. 2.7.2) возникает скользящий режим и заключительная фаза переходного процесса описывается требуемым по условию задачи уравнением X\+dx\ = 0. Практическое использование разрывных обратных связей связано с биениями, быстрым выходом из строя механических элементов приводов, трудностями применения в реаль- ном масштабе времени компьютеров в обрат- ной связи. Таким образом проблема робастной вы- сококачественной стабилизации неопределен- ных объектов не исчерпывается применением традиционных средств. Принцип бинарности и новые типы обратной связи позволяют пред- ложить механизм генерации робастных мето- дов стабилизации, и тем самым поставить син- тез регуляторов в условиях неопределенности на регулярную основу. Координатно-операторное пространство. Последующие преобразования сводят рассмат- риваемую проблему стабилизации к стандарт- ной задаче теории регулирования - задаче о компенсации внешнего (т.е. аддитивного) воз- мущения. Проблему стабилизации с заданным ка- чеством переходного процесса объекта 1*1 = х2> [х2 = ах1 + и можно скаляризовать путем введения новой переменной ст = dx± + х2, d = const > 0. Действительно, в переменных (xj, ст) движение объекта описывается уравнениями {Xi = -dxx + ст, ст = (а - d2 )Xi + cfcr + и и, если ст стабилизирована в нуле, то автома- тически обеспечена экспоненциальная стаби- лизация переменной Xj в нуле. Поэтому впредь имеем дело со скаляр- ным объектом CT = db + « + (a- d2)xb где последнее слагаемое можно считать воз- мущением. Рассмотрим стабилизацию "в малом”, т.е. при выполнении неравенства 1’1 * 8|*1|.
274 Глава 2.7. ПРИНЦИПЫ БИНАРНОСТИ И НОВЫЕ ТИПЫ ОБРАТНОЙ СВЯЗИ где 5 > 0 - достаточно малое число, и введем новую (параметрическую) ошибку стабилиза- ции При £ -» 0 переменная ст также убывает, т.е. ст -» 0. Поэтому можно заменить ст на £ и перейти к стабилизации скалярного объекта Х1 Если принять обозначение где ц - новая независимая переменная и огра- ничиться первым приближением (т.е. когда 5 - мало), то из предыдущего легко получить уравнение - 2dE> + ц + а-d2, которое описывает линейный стационарный объект с аддитивным возмущением а - d2 и новым управлением ц. Но это - стандартная задача классической теории регулирования ! Следовательно, сложная проблема стаби- лизации параметрически неопределенного объекта указанными преобразованиями сведе- на к стандартной проблеме стабилизации ли- нейного объекта с известными параметрами и неизвестным возмущением а - d2. Последнее дифференциальное уравнение вместе с уравнением х, = -А1 + 5*1, дает описание объекта в (Х|, 5) - координатах. Соответствующее пространство естественно назвать координатно-операторным пространст- вом, так как Xj - регулируемая координата, а £ - параметр, или, более общо, оператор, оп- ределяющий наклон прямой ст = £Xj в исход- ных переменных (Xf, Х2). Более того, поскольку в выражении и - pXj переменную ц можно считать пара- метром (оператором), определяющим преобра- зование сигнала Xj в управление и, то ее есте- ственно назвать операторной переменной или сигналом-оператором. Управления вида и = pxj, где независимо могут меняться обе переменные, впредь называем бинарным управ- лением, а систему с таким управлением - би- нарной системой. Координатно-операторная обратная связь. Выбор обратной связи, стабилизирующей ^-объект, £ = 2d£ + ц + a- d2 зависит от информации о функции a(t). В общем случае она неизвестна и поэтому естественной стабилизирующей обратной свя- зью является релейная обратная связь ц = -k sgn £, к > 2| = «о + ^2- В системе с такой обратной связью в точке £ = 0 возникает скользящий режим, а среднее значение разрывного сигнала ц дается выражением Це, = d2-a, т.е. зависит от неизвестной функции a(t). Управление и в исходных переменных имеет следующий вид: и = pxj = -AXjSgn^ = = -кхх sgnl — I = -fc|xi|sgn<y j и совпадает со стандартным СПС-ным управ- лением. Следовательно, рассматриваемый под- ход охватывает теорию СПС. Важно подчерк- нуть, что указанным методом алгоритм пере- менной структуры синтезирован формальным и естественным для теории управления путем, а не угадан эвристически, как это было на самом деле. В рассмотренном случае скользящий ре- жим в замкнутом контуре является неизбеж- ной платой за отсутствие информации о возмущении a(t). Если, однако, имеется ка- кая-либо информация, например, а = 0 (т.е. а = const), то при стабилизации ^-объекта можно обойтись линейной обратной связью. В самом деле, стандартный ПИ - закон ц = -Л15-Л2|5Л решает задачу. Действительно, уравнение 5 + Л25 + Л15 = о описывает в координатах систему управления с такой обратной связью. Нетрудно распоря- диться параметрами к\, к% так, что стабилиза- ция ^-объекта в нуле имеет место.
СТРУКТУРНЫЙ СИНТЕЗ НЕЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ 275 Отметим, что в исходных переменных рассматриваемая обратная связь описывается выражением и = -Л1а-Л2Х1|-^-Л, которое непохоже ни на одну из известных в теории управления обратных связей. Наличие операции деления под знаком интеграла ус- ложняет реализацию такой обратной связи, поэтому без ущерба ее можно упростить до следующей: и = -к\<з - k2xi J sgn(<yxi)d/. Это управление также является стабили- зирующим, что прямо следует из устойчивости соответствующего уравнения замкнутой систе- мы ( + (*1 + *2 Sgn^ = 0. В рассмотренных вариантах финитная стабилизация наступала при разрывном ц-управлении. Часто разрывы управления не- приемлемы и потому естествен вопросе о том, а нельзя ли добиться финитной стабилизации при непрерывном управлении ? Положитель- ный ответ на этот вопрос весьма важен, так как при подобном управлении повышается робастность системы и появляется возмож- ность использования в реальном масштабе времени дискретных регуляторов. Ограничимся указанием двух способов решения этой проблемы для а = const. В первом способе используется инфор- мация о знаке Ё, либо £ = £ - g(£) , где нели- нейная функция g(Q такова, что g(0) = 0 и нуль уравнения <=«€) финитно достижим из любого начального по- ложения £(0). Если известен знак sgn£, то финитную стабилизацию в нуле обеспечивает алгоритм ц = -кг j sgn %dt-k2f sgn Соответствующая замкнутая система управления описывается уравнением £ + к2 sgn£ + к\ sgn£ = о. Если имеется знак функции е(£,£)» то финитно стабилизирующим при достаточно большом коэффициенте к > 0 является алго- ритм ц = -fcjsgned/. В этом случае система управления опи- сывается уравнением 4 + *sgn[£-g(O] = о и можно убедиться, что за конечное время на кривой £ = 0 возникает скользящий режим с уравнением движения Ё, = g(£). Для послед- него нуль финитно достижим, что и обеспечи- вает финитность стабилизации в нуле (рис. 2.7.4). Привлекательность рассмотренных ц-алгоритмов управления в том, что они за конечное время обеспечивают выполнение и в дальнейшем точное движение вдоль прямой с = х2 + flki =0, что означает стабилизацию исходного неопре- деленного объекта с требуемым качеством пе- реходного процесса. Рас. 2.7.3. Фазовый портрет каскадной релейной системы и при к\ > ко, > 0 в режиме переключений происходит скручивание фазовых траекторий в нуль за конечное время (рис. 2.7.3). Рас. 2.7.4. Фазовый портрет релейной системы с финитной стабилизацией в нуле
276 Глава 2.7. ПРИНЦИПЫ БИНАРНОСТИ И НОВЫЕ ТИПЫ ОБРАТНОЙ СВЯЗИ Достоинство рассмотренных алгоритмов стабилизации также в том, что первая произ- водная от функции ст, задающей прямую скольжения ст = О непрерывна, а разрывы пре- терпевает только вторая производная ст . На- помним, что в режиме стандартного скольже- ния разрывна уже первая производная ст . Подобный новый режим движения назван скользящим режимом второго порядка. Практи- ческое преимущество его перед стандартным скользящим режимом в его более высокой прочности. Именно, если т > 0 - временная задержка в переключениях разрывных элемен- тов, то отклонение траекторий от линии скольжения ст = О имеет при классическом скольжении первый порядок, т.е. |а| ~ 0(1); а при новом режиме скольжения порядок т2, т.е. |а|~О(т2), |с|~О(т), |а|~0(1). Следовательно, при "малых" запаздыва- ниях в переключениях скользящий режим 2-го порядка обеспечивает более точное скольже- ние по прямой ст = 0. Практическое значение этого результата еще более возрастает при организации сколь- зящего режима 2-го порядка только по ин- формации об отклонениях изображающей точки от линии скольжения, т.е. только по информации о Эта задача решается, в част- ности, алгоритмом Н = -*1 J sgn t,dt - J |§| 2 sgn tjdt. Из анализа соответствующего уравнения движения i+-^H+*isgn^ = o, № можно установить, что при выполнении нера- венства все переходные процессы успокаиваются в нуле за конечное время. С физической точки зрения эффект финитной стабилизации обу- словлен неограниченным возрастанием силы трения при пересечении изображающей точ- кой линии скольжения £ = 0 (рис. 2.7.5). Рис. 2.7.5. Фазовый портрет фянятной стабвлпзяружицей системы с нелинейным трением Можно, конечно, придумать массу дру- гих ц-алгоритмов стабилизации. Вопрос, одна- ко, в том, нельзя ли синтез таких алгоритмов поставить на регулярную основу. Вот почему прагматично сведение проблемы выбора алго- ритма стабилизации к известным операциям. Оказывается, что синтез управления можно упорядочить, если воспользоваться структур- ным представлением динамической системы. Последнее весьма характерно для классиче- ской теории управления и накопленный в ней потенциал позволяет продвинуть развиваемую теорию. Новые типы обратной связи. Разовьем систему базовых понятий. В рассмотренных примерах управление имело вид и = рх, который является частным случаем бинарной операции и = ₽(ц,х), где переменные ц и х равноправны. Системы, нелинейности которых могут быть описаны с помощью бинарных операций, названы бинарными. Частным случаем бинар- ной системы является СПС, когда бинарная операция разрывна и описывается следующим выражением Р(ц,х) = |х| sgnp. Бинарной можно считать релейную сис- тему ₽(ц,х) = sgn(gx). К этому классу относятся и билинейные системы, в которых р(ц,х) = рх. Бинарную операцию можно описать с использованием понятия оператора, именно:
СТРУКТУРНЫЙ СИНТЕЗ НЕЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ 277 и = р(ц,х) = Р^Х = где Рц и Рх — операторы преобразования вхо- дов х и ц в сигнал управления и\ эти операто- ры полностью определяются переменными ц и х. Следуя традициям классической теории регулирования, операторному описанию, по- ставим в соответствие следующие динамиче- ские звенья (рис. 2.7.6, д, 6). На рис. 2.7.6, а сигнал ц определяет опе- ратор Ри преобразования сигнала х в управле- ние и и поэтому его называют сигналом- оператором, с тем чтобы отличить его от пре- образуемого сигнала х, который называют сигналом-координатой. Рис. 2.7.6, б иллюстри- рует обратную ситуацию. Впредь, для закреп- ления интерпретации переменной, участвую- щей в том или ином преобразовании, на ри- сунках двойной стрелкой обозначаются сигна- лы-операторы и одинарной стрелкой - сигна- лы-координаты. Таким образом, при всей условности обозначений, они довольно полез- ны при анализе и синтезе нелинейных систем. Покажем это, но прежде разовьем понятий- ный аппарат. Введем, помимо обычного звена (рис. 2.7.7, а), новые типы звеньев (рис. 2.7.7, б - г), возникающие при различной интерпре- тации их входных и выходных переменных. Сигналы-операторы, как и сигналы- координаты, можно подвергать стандартным преобразованиям, например, формировать их с помощью обратной связи. Если за основу взять стандартную схему следящей системы (рис. 2.7.8, а), где S - задатчик, R - регулятор, Р - объект, то можно ввести три новых типа обратной связи: координатно-операторную (КО) (рис. 2.7.8, б), операторную (О) (рис. 2.7.8, в) и операторно-координатную (ОК) (рис. 2.7.8, г). г 3 р ___ - ц р а б Рис. 2.7.6. Нелинейные динамические звенья а) б) Рис. 2.7.7. Четыре типа динамических звеньев Рис. 2.7.8. Четыре типа обратной связи
278 Глава 27. ПРИНЦИПЫ БИНАРНОСТИ И НОВЫЕ ТИПЫ ОБРАТНОЙ СВЯЗИ Рис. 2.7.9. Структурная схема следяще* системы Используем введенные понятия для син- теза структуры системы управления неопреде- ленным объектом. Структурный синтез сястем стабнлнзации. Пусть требуется для объекта Р (рис. 2.7.9) подобрать регулятор R так, чтобы выход объ- екта у воспроизводил задание а ошибка регулирования е удовлетворяла бы следующе- му уравнению Se е = е. Особенность постановки задачи в том, что объект подвержен неконтролируемому существенному параметрическому влиянию а е А. Откажемся от прямого выбора опера- тора R по априорной информации и возло- жим этот выбор на обратную связь по схеме рис. 2.7.10. Это важное место. В методическом отношении отказ от априорного выбора опера- тора R и переход к автоматическому его фор- мированию полностью аналогичен переходу от программного регулирования (когда все из- вестно) к регулированию по обратной связи (когда информация о возмущении неполна). Поэтому предлагаемый переход вполне вы- держан в традициях классической теории управления. Если регулятор 7^ выбран правильно, то после окончания переходного процесса спра- ведливо равенство ст = 0, и поставленная зада- ча решена, так как при этом выполнено тре- буемое соотношение Se е = е. Заметим, что вид оператора R теперь совершенно не важен. Таким образом, использование КО-обратной связи не только скаляризует задачу управления (ст - скаляр), но и сводит сложную проблему компенсации параметрического возмущения а е А к стандартной проблеме компенсации координатного возмущения для ОК-объекта е = Ре(а)ц. Заметим, что в требуемом состоянии, т.е. при е = 0, имеет место равенство Ре(а)ц = 0, из которого следует, что сигнал ц содержит информацию о неизвестном возмущении а (см. пример, где было = (Р - а. Естествен- но попытаться использовать згу информацию о параметрическом возмущении для улучше- ния свойств системы управления, например, для упрощения КО-регулятора R^t либо для соблюдения ограничения |ц| £ const, когда параметр а меняется в широком диапазоне. Рве. 2.7.10. Стружтурная схема сястемы с двумя тяпамн обратной свезя
СТРУКТУРНЫЙ СИНТЕЗ НЕЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ 279 Заметим, что соблюдение ограничения |ц| < const сугубо важно, так как ц можно рассматривать как коэффициент усиления регулятора и = и, следовательно, по соображениям устойчивости замкнутой систе- мы управления он не должен превышать кри- тических значений. Более того, для повыше- ния робастности целесообразно уменьшать диапазон изменения Ц. Использовать информацию о параметре а можно, например, следующим образом. Пусть d - параметр оператора Поскольку параметр а меняется в широких пределах, то для достижения эталонного качества, очевид- но, могут потребоваться "сильные" ц- управления, чего необходимо избегать. Ясно, что ресурсы ц-управления будут сэкономлены, если выбор d связан с а. Но параметр а неиз- вестен, а так как в желаемом режиме ц = ц(а), то можно заменить зависимость d(a) подхо- дящей зависимостью d (ц). Так возникает структура системы управ- ления с О-обратной связью (рис. 2.7.11), где Др - оператор О-связи, р = ЛрЦ. ее выходная переменная, меняющая параметр d(p). Выбор оператора Др произволен, поэто- му в схеме рис. 2.7.11 еще достаточно степеней свободы, распоряжаясь которыми можно вли-. ять на переходные процессы. Можно, напри- мер, вспомнить, что оператор Se ответственен за переходные процессы, поэтому части его параметров с(/) можно навязать требуемое изменение во времени Для этого необхо- димо организовать дополнительное ОК- воздейсквие v(f) на объект управления по схе- ме рис. 2.7.12. Изложенные соображения позволили традиционными для теории управления путем ввести еще два новых типа обратной связи: О- и ОК - связь. Операторная обратная связь. Вновь зани- маемся стабилизацией объекта Х1 =х2> х2 =ахх +и, |а| <, а0> но теперь введем координатную ошибку соот- ношением стр = х2 + dpxi = х2 + (d + р)хь в котором учитывается наличие О-связи. Для простоты возьмем О-связь статической, т.е. р = 01, q = const. Тогда, для операторной переменной gP *1 в области О5 = ||х||стМЫ} при достаточно малом 5^0 рассматриваемый объект можно описать уравнениями Ряс. 2.7.11. Структурам схема системы с тремя типами обратной связи
280 Глава 2.7. ПРИНЦИПЫ БИНАРНОСТИ И НОВЫЕ ТИПЫ ОБРАТНОЙ СВЯЗИ = -(d + q\L)xx + £хь U = 2(d + q№ + (1 - 2qd)ii + q{k + a, гае ц - Х’О-управление, выбор которого теперь и надлежит сделать. Положим 1 - 2qd > 0 и пусть ц - решение уравнения qji + (1 - 2qd))i = -к sgn тогда второе уравнение примет вид £ = 2(<7 + 0i)£ + a-fcsgn£. При к > Oq координата финитно стаби- лизируется в нуле при любой функции |а(/)| Ад. В нуле возникает скользящий ре- жим, функция ц непрерывна и удовлетворяет уравнению ЯЛ + (1-2ф/)ц = -а. Для упрощения положим а = const, то- fl гда в установившемся режиме р» =---------~ 1 - 2qd и предельное движение по основной перемен- ной описывается уравнением Xi = - d----L—- bq. 1 I 1 - 2qd) 1 Таким образом, введение статической О-связи р = 01 позволяет добиться финитной стабилизации в нуле при ограниченном и непрерывном ц-управлении, а также при меньшем, по сравнению с предыдущими ц-алгоритмами, коэффициентом передачи к. Правда, при этом показатель экспоненты фи- нальной фазы движения отличается от задан- , aq кого значения а на ------. \-qd Статизм неизбежно сопровождает всякую статическую обратную связь и поскольку в данном случае она введена в параметрическом пространстве, то и статизм также оказался параметрическим. Для его устранения (помимо очевидной возможности оо) можно использовать интегральную обратную связь, но только (Ж-типа. Об этом подробнее ниже, а здесь поясним физический эффект, лежащий в основе рассмотренного способа стабилизации. Так как стр = , то после возникновения скользящего режима £ = 0 и, следовательно, ар = х2 + <&1 + рх( = а Но р = 01, поэтому в режиме скольже- ния (кстати, 2-го порядка) имеем равенство *2 +<&, МХГ=-------—.
СТРУКТУРНЫЙ СИНТЕЗ НЕЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ 281 Теперь вспоминаем, что и = pjq, и, сле- довательно, применяемое управление эквива- лентно линейному управлению « = -~(х2 +dxi) Ч с большим коэффициентом усиления —, что Q и проясняет ситуацию с традиционных для теории регулирования позиций. Однако, дан- ная обратная связь не использует больших коэффициентов, что делает ее более прочной по сравнению с глубокой обратной связью. Операторно-координатная обратная связь. Для устранения параметрического статизма управление сформируем в виде и = pxr +V, где v - дополнительный сигнал, призванный компенсировать статизм. Положим v = Л*Ь что позволяет свести синтез надлежащего (Ж-управления v к стандартной проблеме выбора интегрально q-алгоритма. Уравнения замкнутой системы управления таковы: Х1 =-(d + ?n)x1 + Едь (= = 2(d + + (1 - 2qd)\x + + a, и если выбор ц-управления подчинить огра- ничению + (1 - 2qd)p = -к sgn а т|-алгоритм взять интегральным то поведение замкнутой системы управления описывается уравнениями = 2(d + - fcsgn£ + а + л, П =eiL В положении равновесия этой системы £ = О, ц = 0, л = -а и поэтому финальная фаза переходного про- цесса описывается требуемым уравнением X, = -Ар Это так, если указанное равновесие ус- тойчиво. Можно убедиться, что в его окрест- ности при достаточно большом к > 0 в точке £ = О финитно возникает скользящий режим. При этом "в среднем" имеет место равенство fcsgn^ £, = а + л и, следовательно, в скользящем режиме дейст- вуют уравнения + (1 - 2?<7)ц = -(a + r)), f| = ец. Равновесие этой динамической системы ц = 0, л = асимптотически устойчиво, если гурвицев полином (p(s) = qs2 + (1 - 2qd)s + е, что нетрудно обеспечить выбором параметров q, е. Таким образом, сочетание предлагаемых методов синтеза структур нелинейных систем с известными стандартными методами компен- сации возмущений образует новые возможно- сти по построению высококачественных роба- стных систем стабилизации при параметриче- ской неопределенности. Произвольный линейный конечномерный объект. Рассмотрим задачу стабилизации по состоянию неопределенного /1-мерного объекта х = (А + ДА)х + Ьи, где параметрическая неопределенность ДА удовлетворяет условию согласованности ДА = Ьа, здесь а - неизвестная вектор-функция со зна- чениями в компактном множестве. Требуется построить робастную обратную связь, стабили- зирующую объект в нуле с заданным набором характеристических чисел {Xi, Х2, — > Хл}. Для управляемой пары {А, Ь} существует вектор £ такой, что спектр матрицы А/ = А - Ы совпадает с набором {Xj, Х2, Хл}. Пусть d - левый собственный вектор матрицы А/ , отвечающий нулевому собственному значе- нию, т.е. dAt = О Пусть для простоты л-ая компонента вектора d равна 1, т.е. d = (d\ 1). Введем новую переменную
282 Глава 2.7. ПРИНЦИПЫ БИНАРНОСТИ И НОВЫЕ ТИПЫ ОБРАТНОЙ СВЯЗИ ст = dx = хп + cf х', где х - вектор из первых (л - 1)-ой компонен- ты вектора х, и произведем замену хп на и. В координатах (х'9 ст) рассматриваемый объект управления описывается следующими уравне- ниями: х* = Л'х' + Яст, ст = аост + Их' + и + а'х', где спектр матрицы А' совпадает с предъяв- ленным набором {Xj, Х2, ..., Хл-1}, а' - укоро- ченный на последнюю компоненту вектор а; Ос, а’ - некоторые неопределенные параметры системы; Ну h - известные векторы. Нетрудно видеть, что в результате такой замены задача скаляризована, ибо теперь достаточно обеспе- чить стабилизацию в нуле переменной ст, так как при ст = 0 поведение системы управления описывается уравнением х' = А'х’, которое обладает требуемыми свойствами. Таким обра- зом, далее при решении задачи стабилизации следует иметь дело со скалярным объектом ст = аост + и + а'х', (здесь для удобства произведена замена и = и + Их'), для чего применимы описанные выше методы. 2.7.2. НЕСТАНДАРТНЫЕ ДИФФЕРЕНЦИРУЮЩИЕ СИСТЕМЫ В следящих дифференцирующих систе- мах выбор оператора Я-связи Ry (см. рис. 2.7.13) направлялся на обеспечение и поддержание равенства Z = g, из которого при надлежащей гладкости и по- лучалась оценка производной У = Z=g. Точное равенство удается обеспечить только с помощью глубокой (к -> оо) или разрывной обратной связи. Во всех случаях оценка производной формировалась из выход- ного сигнала Я-регулятора Ry. При наличии аддитивной помехи в обрабатываемом сигнале и амплитудного ограничения на входе ^-регулятора это снижает помехозащищен- ность дифференциатора и, как следствие, ухудшает оценку производной. Кроме того, гарантированное качество дифференцирования в системах с разрывным Х-регулятором Ry ухудшается с ростом амплитуды разрывного (коммутируемого) сигнала. Следовательно, важно изыскать новые средства и методы построения дифференци- рующих систем, в которых влияние этих фак- торов ослаблено. Рассмотрим два новых вода дифференцирующих систем. Дифференциатор с "малой" амплитудой разрывов. Принцип построения рассматривае- мого дифференциатора основан на достаточно очевидной идее, которую поясним на примере релейного дифференциатора. Если выделить среднюю составляющую разрывного сигнала на входе интегратора, например, с помощью инерционного звена, а результат прибавить к выходному сигналу релейного регулятора (рис. 2.7.14), то среднее значение разрывного сигнала у в режиме стабилизации, когда е = О, будет равно нулю. Последнее означает, что скользящий режим в этом случае может под- держиваться сколь угодно малой величиной коммутируемого сигнала. Формально это следует из уравнений {ё = g - и, и = у + х, tx + x = w, y = fcsgne. Если в точке е = 0 возникнет скользя- щий режим, то е=0и эквивалентное значе- ние управления Рис. 2.7.13. Структурная схема следящей ,ивффгргйцируа1пм И системы Рве. 2.7.14. Структурная схема релейного .циффцняцнчоре
НЕСТАНДАРТНЫЕ ДИФФЕРЕНЦИРУЮЩИЕ СИСТЕМЫ 283 Р—> 2.7.15. Снижи—* схема мсммоога вемАмге явДАемяиватим Но тх + х = и и, значит, сигнал х(1) доставляет асимптотическую оценку производ- ной g, Следовательно, среднее значение сиг- нала У eq = ueq “ х “> 0 ПРИ 00 • Для более точного исследования данного дифференциатора удобно его структурную схему преобразовать к виду, изображенному на рис. 2.7.15. Помимо ошибки слежения е, введем ошибку дифференцирования e = g-x и запишем уравнения движения дифференциа- тора в переменных (е, е): 6 = g-x = g-^- = g- -sgne, ё = е-у = е -кsgnе. Если |g| £ Af, М = const, то, по крайней мере, для начальных условий к2 через конечное время в точке е = 0 возникает скользящий режим. В этом случае эквивалент- ное значение разрывного сигнала определено равенством fcsgn^ е = е, после подстановки которого в первое уравне- ние системы получаем уравнение для ошибки дифференцирования те + е = xg. Поэтому справедлива следующая оценка погрешности дифференцирования Это позволяет установить неравенство, ограничивающее снизу величину разрывов к > хМ. Выводы: 1) амплитуда разрывов в идеале может быть сделана сколь угодно малой; 2) в реальной схеме постоянного фильтра т £ х^ где определяется неидеалъностями переключений, поэтому амплитуда разрывов не может быть меньше k# £ х^М; 3) в рассмотренном дифференциаторе класс допустимых сигналов характеризуется ограниченной g. Нестандартный бинарный дифференциа- тор. Если предыдущий дифференциатор осно- вывался на следящей системе, то рассматри- ваемый ниже дифференциатор базируется на принципиально иной идее. Суть ее проясняет рис. 2.7.16, из которого видно, что в качестве оценки производной сигнала g(l) предлагается использовать ошибку "слежения** е = g - z. Смысл идеи можно пояснить следующим образом. В стандартной следящей системе е = 0 и выход регулятора Ry совпадает с про- изводной g. Если к сигналу gffi "примешена"
284 Глава 2.7. ПРИНЦИПЫ БИНАРНОСТИ И НОВЫЕ ТИПЫ ОБРАТНОЙ СВЯЗИ помеха q sin о/, то на выходе регулятора будет сигнал g + qo cos®/, причем может быть, что qco »1. А поскольку на выходе регулятора всегда имеются амплитудные ограничения, то они будут постоянно нарушаться и оценка производной будет искажаться. Поэтому воз- никает идея о "снятии" производной до регу- лятора, так как в этом случае можно рассчиты- вать на уменьшение негативного влияния ам- плитудных ограничений. Проведем предварительный анализ схемы на рис. 2.7.16, ее описывает следующее опера- торное соотношение: Ry e=g-z=g——е. S Здесь 5 - символ операции дифференци- рования. Следовательно, 5 e = TTR~g' S + Ку Для того, чтобы дифференциатор давал сколь угодно малые фазовые и амплитудные искажения, необходимо выполнение равенства 5 е =-----g xs +1 при назначенной по произволу постоянной времени т = const > 0. Из сравнения соотно- шений находим требуемое для этого выраже- ние для оператора Ry = (т - 1)5 4- 1, откуда видно, что для решения этой задачи (т.е. задачи дифференцирования) линейными средствами требуется оператор "чистой" произ- водной. Получается порочный круг, разорвать который можно только использованием эф- фектов, наблюдаемых в нелинейных системах. Здесь уместно напомнить, что ранее воз- никала сходная ситуация, когда в результате использования 3-х типов обратных связей (К-у КО- и О-связей) удавалось получать оператор, преобразующий ошибку регулирования Xj во взвешенную сумму ошибки и ее производной, т.е. "Ч“г’=гг>+Л,>’ но и = ЦХ] и из сравнения этих выражений находим, что действие ц эквивалентно дейст- вию оператора Воспользуемся рекомендациями бинар- ного управления, в результате получим струк- турную схему рис. 2.7.17. Рис. 2.7.17. Структурой схема неставдартного бинарного дифференциатора
НЕСТАНДАРТНЫЕ ДИФФЕРЕНЦИРУЮЩИЕ СИСТЕМЫ 285 В этой схеме следует задать операторы КО- и О-регуляторов Rp и Rp, соответственно, а также бинарную операцию By, и задатчик Sg. Если интересоваться лишь принципиаль- ными возможностями исследуемой схемы, то естественно воспользоваться результатами О-теории и выбрать операторы Rp, Rp, Se и бинарную операцию By в следующем виде ц = fcsgn(oe), ст = es - е, к = const > 0, (Лц) р = 01, q = const > 0, (Лр) 7ef+cpef = е, (5е) тде ср = с + р, с = const > О, У = Вуе = це. (By) В соответствии с этим выбором струк- турная схема дифференциатора конкретизиру- ется и принимает вид, показанный на рис. 2.7.18. Указанный выше выбор продиктован следующими соображениями. Если ошибка ст = 0, тое=егииз урав- нения задатчика Se получаем Те + сре = е. Но Ср = с + 01, поэтому последнее уравнение может быть переписано так: Те + (с - 1)е = -01С. Последнее означает, что "действие" опе- раторной переменной ц по эффекту эквива- лентно "действию" оператора 7Х + (с — 1) у Я Сравнивая это выражение с требуемым Ry = (т - 1)5 + 1, получаем соотношения для расчета параметров схемы которые нетрудно удовлетворить. И, следова- тельно, имеем требуемое уравнение те + е = g. Перейдем к анализу дифференцирующей системы. Указанные выше последствия наступают только в том случае, если с некоторого момен- та времени ст ® 0. Для получения условий, гарантирующих этот факт, запишем уравнение изменения ошибки ст. Рис. 2.7.18. Структурная схема нестандартного бинарного дифференциатора с выделенными КО- н О-обратнымв связями
286 Глава 27. ПРИНЦИПЫ БИНАРНОСТИ И НОВЫЕ ТИПЫ ОБРАТНОЙ СВЯЗИ Так как ст = е* - е, то имеем сначала . е j e-(c + qp.)es ° = е -% =------------------+ Но е* = ст + е, поэтому (•) 1-с c + ai = ~^~е------zr^-CT -g + gd 1--^ . Т Т V Т) Из указанных выше соотношений следу- ют равенства: 1-с 1 с 1-q Т ”1-т’ Т~я(?-хУ ,i_ = L_. g _ 1 T 1-т’ Т 1-т’ поэтому (*) можно переписать в виде а , -f— йгДЛУН _ х _ _Е_ 1-т $(1-т) * *1-т Так как ц = fcsgn(CTe), то окончательно получаем следующее уравнение Таким образом, если выполнены указан- ные соотношения, то при начальных условиях ИЗ некоторой окрестности нуля ст - 0 через конечное время возникает скользящий режим, поддерживающий требуемое равенство ст = 0. Вследствие этого наступают описанные ранее благоприятные последствия. Коммеятарий обобщения. Использова- ние разрывной стабилизирующей обратной связи не влечет необходимости использования в данном случае "сглаживающего" выходного фильтра Бою, что является обязательным в других разрывных дифференцирующих систе- мах. Ограничения на класс дифференцируе- мых сигналов |g| £ const, |g| £ const могут быть ослаблены до |g| £ const, если воспользоваться сочетанием идей, поло- женных в основу построения двух рассмотрен- ных нестандартных дифференцирующих сис- тем (рис. 2.7.19). Этот же прием позволяет уменьшить амплитуду коммутируемого сигна- ла. Подробности опускаем. Результаты «слепого моделировапя. Дифференцирующий сигнал g(l) = sin t + + e sin(10000 содержит полезный сигнал sin t и помеху esin(1000 0. Параметры в схеме дифференциатора на рис. 2.7.18 таковы: Заметим теперь, что ничто не препятст- вует выбору параметра q достаточно малым, например, таким, что q(k +1) < L Тоща коэффициент (напоминаем, что Н s к) 9(1 - *) и для того, чтобы в точке ст - 0 существовал скользящий режим, следует позаботиться о выполнении неравенства ст(е - S + “ fcr|e|sgn ст) £ а По крайней мере, в малой окрестности точки ст = 0 это условие очевидно выполнено, если и<*. поскольку при этом е g. При этих значениях т " 0,01. Разностная схема построена методом Эйлера с шагом h - 0,001 и А = 0,0001. Результаты моделиро- вания приведены на рис. 2.7.20. Финитный бинарный дифференциатор. Обобщенная структурная схема финитного регулятора ничем не отличается от схемы стандартного бинарного дифференциатора (рис. 2.7.21). Специфика его в том, что ис- пользуется К-, либо стабилизирующий бинар- ный КО- регулятор гарантирующий воз- никновение скользящего режима 2-го порядка, т.е. такого режима, коща не только е, но и ё непрерывна, а претерпевает разрывы только ё. С начала такого скольжения, конечно, тождественно выполнены равенства е = 0, ё = 0, и с этого момента времени (рис. 2.7.22) Я0 = Я0.
НЕСТАНДАРТНЫЕ ДИФФЕРЕНЦИРУЮЩИЕ СИСТЕМЫ 287 Рис. 2.7.19. Структурная схема обобщенного нестандартного бинарного дифференциатора Рис. 2.7.20. Результаты дифференцирования в рамках некласонеско* схемы при номанщ нестандартного бинарного д ифференциатора
288 Глава 2.8. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА Рис. 2.7.21. Обобщенная схема финитного бинарного дифференциатора Ряс. 2.7.23. Фазовый портрет финитной стабилизации при конечном скручивании скользящем режиме В качестве такого алгоритма стабилиза- ции, может быть использован любой алгоритм, описанный в п. 2.7.1; алгоритм конечного скручивания, оптимальный по времени или дрейфа. В качестве примера опишем принцип построения алгоритма конечного скручивания. Как установлено выше, задача стабилизации замкнутого контура может быть сведена к за- даче стабилизации в нуле скалярного объекта ф = а - А3ц, |а| £ у, у = const. Положим для простоты а = const и пусть известны знаки переменной ср и ее про- изводной ф. Тоща финитно стабилизирует объект в нуле алгоритм ц = sgncp - к2 Звпф, = const > а Это видно из уравнения ф + к$к2 sgn ф + sgn ф = О, фазовые траектории которого - параболы, определяемые уравнениями Ф = ±а = ±А3(А2 + ^1); ф = ±₽ = ±к3(кх - *2), и если а > р > 0, то в режиме скручивания (рис. 2.7.23) фазовая точка за конечное время попадает в ноль. Отметим, что в нуле возникает скользя- щий режим 2-го порядка. Это означает, что при наличии малой задержки т в переключе- нии отклонение ф от нуля имеет второй поря- док малости по т, т.е. |ф| ~ О(т2), а не пер- вый порядок (|ф|~О(т)), как при обычном скольжении. СПИСОК ЛИТЕРАТУРЫ 1. Емельянов С. В. Бинарные системы автоматического управления // М.: Мир, 1987. 296 с. (на англ, языке) 2. Емельянов С. В., Коровин С. К. Новые типы обратной связи. Управление при неопреде- ленности. М.: Физматлит. Наука, 1997. 352 с. 3. Emelyanov S. V., Korovin S. К., Mame- dov I. G. VARIABLE-STRUCTURE SYSTEMS: DICKRETE AND DIGITAL. Mir publ. house & CRC, Moscow-New-Yoik, 1996, 303* p. Глава 2.8 ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА НЕЛИНЕЙНЫХ СИСТЕМ 2.8.1. ОПИСАНИЕ НЕЛИНЕЙНЫХ СИСТЕМ С ПОМОЩЬЮ РЯДОВ ВОЛЬТЕРРА Определение нелинейной системы в кон- цепции "вход - выход". В предыдущих разделах нелинейные системы описывались дифферен- циальными уравнениями, полученными в ре- зультате математического описания элементов
ОПИСАНИЕ НЕЛИНЕЙНЫХ СИСТЕМ С ПОМОЩЬЮ РЯДОВ ВОЛЬТЕРРА 289 системы, среди которых встречались как ли- нейные, так и нелинейные элементы. Возмо- жен и другой подход, при котором математи- ческая модель системы определяется как опе- ратор, посредством которого входные сигналы преобразуются в выходные. Если система опи- сывается дифференциальными уравнениями, такой оператор характеризует их решение. Однако теперь можно включить в состав сис- темы объекты, математическая модель которых заранее неизвестна. Если входные сигналы, имеющие смысл внешних воздействий или управляющих сиг- налов у(0> принадлежат линейному простран- ству У, а моменты времени t - пространству Tj: y(f) g У, t g Tj; соответственно выходные сигналы, определяющие реакцию системы х(/) g X t G Т2» то системой называется би- нарное отношение Я, заданное на прямом произведении пространств УиХ: RcYxX. В том случае, когда каждому y(f) G У соответ- ствует единственная функция x(f) g X, гово- рят, что отношение R функционально. В этом случае ему можно поставить в соответствие оператор х = F(y), который определен на У и принимает значения в X, т.е. отображает про- странство входов в пространство реакций. В общем случае реакция системы на* входной сигнал зависит от начального состоя- ния системы, которое определяется парамет- рическим вектором 5, который принадлежит пространству начальных состояний S. Теперь систему можно определить как отношение Ду с У х S х X. Если оно функционально в том смысле, что каждой паре у(/) соответ- ствует единственное х(/), то введенному отношению соответствует оператор х(0 = F(s,y(0), 5 g S, у g У В том случае, коща система описывается дифференциаль- ным уравнением, 5 - это вектор начальных условий. Предполагается, что реакция системы в момент времени x(/j) зависит только от состояния 5 при t = tQ и значений у(/) при /е [ф, ^11 и не зависит от "будущих" значений ХО ПРИ f > ^1- Это свойство называют свойст- вом причинности или неупреждаемости. Если выполняются условия: а) оператор x(t) = F(s,y(t)) линеен по s и у(/) для всех ус У, 5 е 5; б) этот оператор удовлетворяет свойству разложения: F(s,y(t))~F(es,y(t)) + F(s,er), 10 Зак 1023 где 05, Оу - нули соответствующих про- странств, то система линейна. Если же хотя бы одно из этих условий не выполнено, то систе- ма нелинейна. Широкий класс нелинейных систем об- разуют такие системы, для которых выполня- ется свойство разложения, позволяющее ис- следовать независимо собственные и вынуж- денные движения. В этом случае обозначим FQs,y<t)) = F(y(t)). Оператор Ду(0) может зависеть от вре- мени. Если такая зависимость отсутствует, т.е. х(/ + ст) = F(y(t + ст)), систему называют стационарной. Оператор Ду(/)) может описывать как систему в целом, так и ее нелинейную подсис- тему. В последнем случае для описания нели- нейной системы необходимо ввести следую- щие действия над операторами: суммирование (F + G)y = F(y) + G(y); композицию (F*G)y = Д6(у)); произведение (f’ G)y = F(y) G(y), которые соответствуют структурным соедине- ниям на рис. 2.8.1, а - в. Если элементы этих соединений удовлетворяют свойству причин- ности, то и соединение удовлетворяет этому свойству; если элементы стационарны, то и соединение стационарно. Подробнее см. [12, 19, 32]. Полиномиальные системы. Вводится по- нятие однородного оператора, т.е. такого опера- тора, для которого F(a.y(t» = a"F(y(/)), где a = const, а п - число, определяющее степень однородного оператора. Однородный оператор, действующий в пространстве непре- рывных функций Q0, 7], может быть записан в виде *(0 = Фи(у(0) = » » п о о '=1 (2.8.1) t е[0,Г]. В частности, непрерывная линейная сис- тема описывается однородным оператором первой степени:
290 Глава 28. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА Рис. 2.8.1. Типовые соединения нелинейных подсистем t X<t) = Ф1(у(0) = J kx(t,x)y(x)<h. о Функция £л(/,Т1,...,хл) - ядро опера- тора Фл(у(0)* Условие причинности будет выполнено, если ^л(^,т1,...,тл) s 0 при X/ > /, 1 = 1,...,л. Отсюда, в частности, следует, что в качестве верхнего предела интегрирования в (2.8.1) можно указать величину t. Во многих случаях этот оператор задается на полупрямой; тоща верхний предел равен «. Оператор Фл(у(0) является стационар- ным, если М'Л1......*n) = kn(t-xx.....t-xn). Таким образом, для стационарного опе- ратора Фл условие причинности можно запи- сать в виде *»(т1»—»тл)“0 При Ту <0, у = 1.......п. Если ядро оператора не меняется при произвольной перестановке переменных X/, i = 1,...,л, т.е. оно имеет симметричный вид по отношению к этим переменным, то опера- тор Фл(у(0) называют регулярным однород- С помощью регулярных однородных операторов может быть построен функцио- нальный полином степени N: N ^(К0)-£ф,(И0Х <2-8-2> Л=1 который носит название полинома Волътерра. Подобно тому, как обычные полиномы ис- пользуются для аппроксимации непрерывных функций, функциональные полиномы исполь- зуются для аппроксимации операторов, опи- сывающих нелинейные системы. Нелинейную систему, оператор которой может быть пред- ставлен функциональным полиномом, назы- вают полиномиальной. Пример 2.8.1. На рис. 2.8.2 показана сис- тема, включающая три линейных элемента, описанных своими весовыми функциями fc/(f,x), i = 1, 2, 3, а также элементы пере- множения и суммирования сигналов. Ее мате- матическое описание имеет следующий вид: t *(0 = /*1(0Ф(т)Л + о t t +J J оо т.е. это полином Волътерра второй степени. Пример 2.8.2. На рис. 2.8:3 дана струк- турная схема системы, представляющей собой последовательные соединения двух линейных и нелинейного элементов, причем статическая характеристика последнего допускает полино- миальное представление: *1(0 = ^(z(0) = «1Z + «2Z3. Рае. 2.8.2. Немнкйвая система парей стеаеав у (Л г(<Л ЬЮ. x(t) ным. Рве. 2ЖЗ. Ппиная!< система третьей стеаеав
ИДЕНТИФИКАЦИЯ НЕЛИНЕЙНЫХ СИСТЕМ В ФОРМЕ РЯДОВ ВОЛЬТЕРРА 291 В этом случае t X(t) = «if + О tit з +eJ ООО ы где t £1('л) = J *2(*Л1)*101Л)Л; 0 r 3 ^зЛт1Л2>тз)=|^(^т)ПД:1(т’ТУ)Л- 0 ;=1 Таким образом, система является поли- номиальной третьей степени. Аиалипнесоде сястемы. Роды Вольтерра. Рассмотрим теперь ряд, образованный поли- номами Вольтерра, который равномерно схо- дится к оператору ДХ0): F(y(0) = Um FX(KO) = У>п (И'))- (2.8.3) Оператор ДХО) в этом случае называют аналитическим. Ему можно сопоставить систе- му, которую также называют аналитической. Ряд (2.8.3) называют рядом Волыперра. Для аналитического оператора ДХО) в окрестности точки у*(0 е Y может быть по- строен ряд Тейлора, совпадающий с рядом Вольтерра. Последний можно построить, вы- числяя производные ДХ.0) в окрестности y\f) (см. [32]). Для этого необходимо знать аналитическую функцию ДХО)- Условия, при которых оператор может быть представлен в виде рада Вольтерра, сле- дуют из теоремы М. Фреше*. Если оператор определен в пространстве непрерывных функций ХО е Л и непрерывен в этом простран- стве, то разложение (2.8.3) справедливо на лю- бом ограниченном подмножестве R с. Q4), 7]. Примером нелинейной системы, описы- ваемой рядом Вольтерра, может быть система, содержащая линейные элементы и нелинейно- сти, представленные в виде степенного ряда. В более общем случае, когда система задана не- линейным дифференциальным уравнением, например, • Доказательство теоремы приведено в работе [32]. п/ л-1 л У . _ X atxw +'£с1 (Г) £ rj (Z)x0) = y(t), /=0 /=2 Ь=о с помощью рекуррентной процедуры могут быть найдены ядра ряда Вольтерра [32]: *(')=Z J • • • f<'• xi > • • • ’х" >П у(ъ > А< > л=1о 0 /=1 описывающие такую систему. Ограничиваясь конечным числом членов ряда, можно при- ближенно представить ее как полиномиаль- ную. Если же система представляет собой "черный ящик", структура которого неизвестна то, при определенных допущениях, о которых будет сказано ниже, для нее может быть по- строена процедура идентификации, позво- ляющая приближенно описать ее с помощью ряда Вольтерра. 2.8.2. ИДЕНТИФИКАЦИЯ НЕЛИНЕЙНЫХ СИСТЕМ В ФОРМЕ РЯДОВ ВОЛЬТЕРРА Если математическое описание отдель- ных элементов или системы в целом заранее неизвестно, требуется решить задачу иденти- фикации, подавая на вход системы определен- ные тестовые сигналы и наблюдая соответст- вующие ей реакции. Экспериментальное определение рода Вольтерра с помощью тестов в форме 8-импульсов. Этот способ, предложенный М. Шетценом, предполагает априорную ин- формацию о том, что система стационарна и может быть представлена в виде полинома Вольтерра степени N. Если N = 1, т.е. система линейна, то ядро Aj(O определяется как реак- ция на 8-функцию: при ХО = ДО получим х(0 = ^1(0 В случае N = 2: x(t) = к2(Х0) = Ф1(И0) + ф2(у(0) = t = (2.8.4) 0 t t лгЫ' - - t2)Aith2- oo Введем билинейный однородный оператор ФгО'КО.З’гЮ) = t t = >Т2)У1(^ - ~ Т2>Л1Л2- 0 0 (2.8.5) 10*
292 Глава 2.8. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА Операторы Oj и И2 связаны следую- щим соотношением: Ф20’1(0,У2(0) = у fcO-i (0+y2(D) - -Г2(У1(0)-И2(у2(0)], (2.8.6) так как ф1(У1 +У2) -1’10'1) - Ф1 <Уг) = 0; ф20'1, У2> = = ^-[ф2(^1 + Уг) ~ ф2(У1) - ФгСиг)]- Положим Л(О = 8(О; ^2(0 = 8^-Г), где Г - параметр, принимающий различные чис- ленные значения: Т е [0, , т.е. определим экспериментально К2 (8(/)) , И2 (8(f “ ТУ) > И2(5(/)+8(/-7)) и вычислим Ф2<8(1),8(/-7)) по формуле (2.8.6): Поскольку Ф2(8(/),8(/- Г)) = t t = J J *20i,t2)8(/ - т,)8(/ - Т - t2)AjA2 = о о = Л2(/,/-Т), то тем самым будет определено ядро второго порядка fc2(Tl»T2) при Т2 = х1_^т» Те^Тщдх], Tj £ Г. В частности, при Т= 0 получим &2(т,т), что позволяет найти И *1(0: *1(0 = И2(8(/))-Л2(/,/). Аналогичный подход может быть исполь- зован для определения ядер полинома Воль- терра любого порядка. Например, при N = 3 фзО'1(О,?’2(О.Уз(О) = = у!^зО'1(О+ У2(1)+3'з(О) - -Из(и(0+У2(0) - ?зШ)Оз(0) - -»гзО'1(О+3'з(О)+Из(у1(О) + +*зб'2(О) + *зО'з(О)- (2.8.7) Полагая yv(t) = 8(/), y2(t) = 8(/ - T2), Уз(О = 8(/-7з) и вычислив эксперимен- тально слагаемые в правой части последнего равенства, найдем Ф3(8(/),8(/-Т2),8(/-Т3)) = = 3!Л3(/,/-Т2,/-Т3). Изменяя параметры Т2 ^[0, ЛпахЬ Т3 el°»7maxl > определим ядро fc3(?i, т2, т3), т2 = Т1 - т3 = xi - Т3, после чего задача сводится к идентификации системы второго порядка, поскольку Г2(Я0) = >№('))-Ф3(Я0) для любых y(f). При произвольном п формула (2.8.7) приобретает вид [108] Ф„(УьУ2,- -.Уп) = +J'2+ -+J'»)- -^У'п(Уп+-+Ут-1)-^'п(Уп+- -+У1П-2)-- +(-0" ’^ФлО,) /=1 (2.8.8) Проблема, связанная с приближенным формированием 8-функций преодолевается, если вместо них в эксперименте применять единичные ступенчатые функции 1(1). При этом добавляется процедура численного диф- ференцирования получаемых эксперименталь- но функций, которая вносит свои погрешно- сти [32]. Из приведенных формул следует, что в том случае, когда выбранный порядок N\ больше реального N, то экспериментально получаемые ядра порядка N + 1, ..., N\ долж- ны быть равны нулю. Таким образом, выбрав N\ достаточно большим, можно оценить и порядок N системы. Существуют специальные способы, позволяющие оценить порядок сис- темы. Так, используя в качестве тестового гар- монический сигнал y(t) = a sin со/, проводят спектральный анализ выходного сигнала x(f). Если максимальная частота содержащихся в нем гармоник равна mN, то можно предполо- жить, что система описывается функциональ- ным полиномом порядка N [18]. Изменяя амплитуду а, можно установить диапазон зна- чений уровня сигнала y(fi, в котором такое предположение справедливо.
ИДЕНТИФИКАЦИЯ НЕЛИНЕЙНЫХ СИСТЕМ В ФОРМЕ РЯДОВ ВОЛЪТЕРРА 293 Метод ортогональных моментов. Пусть входной сигнал нелинейной системы пред- ставлен в виде конечной суммы ряда Фурье по системе функций <ру(О« ортогональной иа [О, Л: М Zel°-rl- <2-89> Здесь Т Cj =|у(Г)фД0р(0Л (2.8.10) о - коэффициенты Фурье, р(1) - весовая функ- ция, соответствующая выбранной ортогональ- ной системе. Применяются системы ортого- нальных функций Лежандра, Чебышева, Хаа- ра, которые выбираются исследователем с уче- том особенностей реальных воздействий иа систему. С учетом (2.8.9) выражение полинома Волътерра (2.8.2) имеет вид N t t *(') = £] л=10 0 л М /=1 у=о N М М "=1Л=0 А=0 где t t ° I f • Ля) х 0 0 /е1°’Г1 (2.8.12) /=1 - ортогональные моменты ядер Волътерра. Выражение (2.8.11) описывает нелинейную систему как оператор, отображающий после- довательность коэффициентов Фурье {Q/} входного сигнала ХО в пространство реакций X. Для задания такого оператора достаточно определить ортогональные моменты Из формулы (2.8.12) следует, что эти моменты представляют собой регулярные од- нородные функции ФЛ0'1»*'*»3'л) ПРИ У/(т) = Ф/ СО 1» •••> л- Следовательно, для определения (/) можно использовать изложенный выше способ. Так, для полино- миальной системы второго порядка нужно вычислить правую часть формулы (2.8.6), по- лагая >>,(/) = <ру1(0 , y2(t) = <ру2(0 . Тоша УгСО) = t t = Jf *2(*Л1 Лг)Ф Д Сч)ф./2(*2)А1А2 = 00 что позволяет определить и t = J *1((л)фу(г)Л = 0 Если рассматриваемая система стацио- нарна, а система функций фу(1) ортогональна иа полупрямой: t € [0, оо), то можно прибли- женно определить и ядра ...» тя) опера- тора Волътерра, описывающего систему. Соот- ношение (2.8.12) в этом случае можно пред- ставить в виде ОО 00 НА?„у,(О = f-Jkn(t - - z„) X О о хПфЛ<Т/)Л/ = J- -]*л(*»т1> •• >тл) х Ы О О (2.8.13) Ы т.е. оно определяет коэффициенты Фурье по той же системе ортогональных функций ядра £„(/,Т1,...,Тя) = = А:я(/-г1,...,/-тя)Пр’1(^)- /=1 Для устойчивой системы |А^(Т1,...,тя)|->0 при Т/ —► оо, вследствие чего при достаточно большом значении t > Т ортогональные мо- менты приближенно равны постоянным чис- лам
294 Глава 2.8. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА Т Т~ п О 0 /=1 (2.8.14) Следовательно, ядро кп можно прибли- женно восстановить в виде ряда Фурье п *л(ч, -Лл)« х Л.-.А-1 <2-815> /=1 При использовании полиномов Лагерра в этих формулах надо положить p(t>=e“x. Поскольку определению кп предшествует процедура вычисления моментов , опи- санная выше, то заранее могут быть определе- ны. и значения Т, начиная с которых А econst- Идепвфикащш нелинейно! сястемы в ус- ловиях нормальной работы. Пусть основная информация, необходимая для построения математической модели системы, определяется в процессе работы системы, т.е. путем измере- ния и запоминания входных сигналов и соот- ветствующих им выходных. Некоторые пред- варительные сведения о системе все же долж- ны быть известны. Это степень полинома Вольтерра, стационарность системы и величи- на максимального времени переходных про- цессов Т. Для экспериментального определе- ния этих данных используются специальные тесты [47], о которых упоминалось выше. Та- ким образом, задача состоит в определении полинома Вольтерра степени N, описываю- щего стационарную систему N * t п x(t) = EJ-J л=10 0 /=1 (2.8.16) по измеренным на интервале [0, 7] значениям х(/), y(t) соответствующих сигналов. Выражение (2.8.16) можно рассматривать как интегральное уравнение, в котором неиз- вестными являются ядра кл(Т1,...,тл), п - 1, ..., N. Ищется такое решение этого уравнения, которое минимизировало бы сред- нюю квадратическую ошибку приближения на интервале [0, 7]: 7Т N t t o L"=1о о п ' х П ?(/ -1/ )Л< - х(0 Л. (2.8.17) Ы Необходимые условия минимума функционала (2.8.17) записываются в виде следующей сис- темы интегральных уравнений [32] N Т Т л=1о О п 1 • * х ПЛ/ = TJ (2.8.18) /=1 2 о г=1 / = 1,...,АГ. Функции, стоящие в фигурных скобках в правой части уравнения (2.8.18), могут быть вычислены по результатам экспериментально найденных измерений входного и выходного сигналов. Таким образом, получена система из N уравнений относительно неизвестнък кл(т},...,тл). Для ее решения пользуются следующей итеративной процедурой [32]. По- лагая ki = 0, / = 2, ..., N, из первого уравне- ния определяют k[V. При ki = k^, kt s О, i - 3, ..., N, из второго уравнения находят к2 - к^ и т.д., вплоть до к$. Подставляя теперь в первое уравнение к^, / = 1, ...» Nt находят второе приближение к^, из второго уравнения - к^ при ki = к^, к/ = к^, / = 3, ..., N и т.д., вплоть до к^. Показано, что при г -► оо к^ -► к/, т.е. итерационная процедура сходится. Такая процедура не снимает трудностей, связанных с тем, что на каждом шаге необхо- димо решать интегральное уравнение Фред- гольма первого рода. Некорректность задачи [38] проявляется в том, что при незначитель- ных отклонениях в ее условиях (в задании известных функций) могут возникнуть сущест- венные отклонения в ее решении. Чтобы из-
ИДЕНТИФИКАЦИЯ НЕЛИНЕЙНЫХ СИСТЕМ В ФОРМЕ РЯДОВ ВОЛЬТЕРРА 295 бежать этого, применяется процедура регуля- ризации. В рассматриваемом случае регуляризация может быть достигнута, если вместо функцио- нала (2.8.17) минимизировать функционал /а (к) = J(k) + аЯ(к), (2.8.19) где N Т Т t a£X*) = Лг /=1 о 0 r=1 (2.8.20) - стабилизирующий функционал, введенный для регуляризации задачи; а/ - коэффициенты регу- ляризации, подбираемые экспериментально с учетом требуемой точности приближения. Система интегральных уравнений, опреде- ляющая необходимые условия минимума функционала (2.8.19), имеет вид N Т Т л=10 0 х [ Г п I т J П >П м - °' w 1 0 /=1 г=1 х п X fjA/ +а/Л/(о1,...,о/) = /=1 Т i = “ J *(0П У« - (2.8,21) 1 0 г=1 / = 1,...,#. т.е. она состоит из интегральных уравнений Фредгольма второго рода, задача о решении которых хорошо обусловлена. Применяя опи- санную выше итеративную процедуру к систе- ме (2.8.21), получают приближенное решение ^П,Л‘ Ввиду того, что исследуемая система мо- жет не описываться в точности полиномом Вольтерра степени N, найденная модель обес- печивает необходимую точность приближения только для входных сигналов y(f), мало отли- чающихся в среднеквадратическом от y(t) и может потребовать уточнения для других ха- рактерных входных сигналов. Эта трудность пре- одолевается, если x(t), y(t) являются случай- ными стационарными и эргодическими процес- сами. Функционал (2.8.17) приобретает смысл оценки средней квадратической ошибки, а уравнение (2.8.18) примет следующий вид: NT Т ^|...|ля(ть...,тя)х л=1 о 0 = (2.8.22) /=1 =о/); / = 1,...,JV. где m^n+i^ и - оценки автокорреляци- онных и взаимнокорреляционных моментов соответствующего порядка: = M{y(t - ч)...y(t - t„)y(t - a,)... ...jty-<»/)}; m^+1) = M{x(f)y(t - ai)..,y(t - a,)}. Полученная модель справедлива для тех процессов y(f), у которых совпадают значения моментов вплоть до порядка 2N. Если процесс гауссов, то, как известно, достаточно совпадения моментов до второго порядка. Другим способом преодоления трудно- стей, связанных с численным решением сис- темы интегральных уравнений (2.8.18), являет- ся параметризация этой задачи с помощью многомерных рядов Фурье. Предполагая, что искомые ядра ряда Вольтерра могут быть ап- проксимированы по системе функций {<₽/*)} , ортогональных на [0, 7]: Мп Мп П Лв(П»-.,гя)»£...£сЛ„.лР1фЛ(гД Л=о Л=о г=1 (2.8.23) запишем уравнение (2.8.18) в виде: N & М* «=1>1=о j,=a (2.8.24) i = где Т п I а1..лл...л=7/Пч(оП^«л; 0 г=1 Г=1 Т 1 h,j, 1 0 г=1
296 Глава 2.8. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА Т о Выбор значений Мп осуществляется в соответствии с требованиями точности, т.е. с учетом фактических значений функционала (2.8.17) и уровня погрешностей задания и вычисления неизвестных функций. Решение полученной алгебраической системы может быть найдено, например, проекционным ме- тодом Галер кина. Определив коэффициенты Фурье Cj j*, запишем полином Волътерра, описывающий исследуемую нелинейную сис- тему в виде N М„ п *(') = £z-2c71 «=1.4=0 4=0 г=1 (2.8.25) Параметры Cj^ могут быть получены и путем использования стандартных методов численной оптимизации для функционала (2.8.17), который записывается в виде 12 /(Л) = /(СЛ...Л) = ТГ N М. М п I2 . .лПчю-жо л. 0[л=14=0 4=0 Г=1 (2.8.26) При использовании метода наискорей- шего спуска коэффициенты Cjv находят в результате рекуррентной процедуры, описы- ваемой следующими соотношениями: p(m+l) _ p(m) _ dJ(k) _ л-л - Ч- л Y асл...л = C1M)A ’ у2J(k)flzJr <')’ (2-8-27* Г=1 где у - масштабный коэффициент, выбирае- мый в зависимости от требуемой скорости спуска. 2.8.3. МЕТОД ВИНЕРА Метод Винера является универсальным и эффективным средством идентификации не- линейных систем с неизвестной структурой. В качестве тестовых сигналов здесь использу- ются случайные процессы определенного типа. Сам метод основан на использовании проце- дуры интегрирования функционалов по мере Винера [32]. Ортогональные полиномы Винера. Поло- жим, что входными сигналами нелинейной системы являются реализации стационарного гауссова процесса y(f) с нулевым математиче- ским ожиданием и корреляционной функцией Ку(т). Введем пространство операторов Ду), заданных на множестве реализаций у(/), для которых определена норма ||.F(y)|| как мате- матическое ожидание /^(у), т.е. ||F(y)|| = Л/{Г2О»)}. Такое пространство является Гильберто- вым L^( У) и, следовательно, в нем содержится полная ортогональная система операторов Gn(y\ » = 1..... оо. Используя эту систему, любой оператор F € £г( Л можно представить в виде ряда по системе функций (7я(у), кото- рый является обобщением ряда Фурье. В этом состоит основная идея метода. В качестве системы ортогональных нор- мированных полиномов в Gn(y) может быть использована система ортогональных полино- мов Волътерра; эту систему строят с помощью процедуры ортогонализации Грама-Шмидта [32]: боОО = 1; т ^1(у) = J (т)^(г - т)А; о тт £200 = JjMTbT2>x о о (2.8.28) ТТТ ^3(У) = JJJ^3<TbT2»T3)x ООО 3 13 х П^/_Т^-3^"Т1^(т2-тз) ПЛ/; .r=l J/=l Условие ортогональности имеет следую- щий вид:
МЕТОД ВИНЕРА 297 M{Gt(y)Gj(y)} = О при / # J, Т Т . о о / */)]"[ "хг)^г^г при * = Л Г=1 (2.8.29) Выражения Gn(y) принято называть ор- тогональными полиномами Винера. Любой опе- ратор из !/}( У) можно представить в виде ряда по системе полиномов Винера: 00 Лу) = £<?л(У), (2.8.30) л=0 который сходится в среднеквадратическом. Этот ряд называют рядом Винера. Если y(f) - белый гауссов шум, интен- сивность которого равна С и, следовательно, ^(т) = С8(т), формулы (2.8.28) принимают более простой вид: Т О ТТ 2 G2(y) = j/МЧЛ2)ГР('"Т')Лг " О 0 г=1 т -Cjk2(x,z)dz; (2.8.31) О ТТТ 3 ('зО') = Jf J *з(я»т2Лз)П^_ ООО r=1 ТТ -зеЦ о о Оператор Gn зависит только от ядра соответствующего порядка обозначая &п ~ Gn[kn, у], можно получить рекуррент- ную формулу для вычисления Gn. Для опера- торов (2.8.31) имеем Т Т п Gnlk„, у) = j... j ЛЛп,. •• _ тг)Лг " О О г=» у- »!Г (л - 2v) !2vv! (2.8.32) m = — при n четном, m = (n - 1) / 2 при n нечетном. Удобная для практических приложений формула, определяющая полиномы Винера через многомерные полиномы Эрмита Н1(у), была предложена в [117]: я0 (у) = 1; н'(у) = у«У, H2(y(h),y(t2)) = y(h)y(t2) - КУ(Ь - t2y (2.8.33) Я3(у(Л)> y(t2),y(t3)) = y<h)y(t2)y(t3) - -y(f\)Ky^2 ~h) ~y(h)Ky<h "*з)“ -y(f3)Ky(h -z2); Для этих полиномов выполняется усло- вие ортогональности М{Н‘ (у«1)... y(tt ))HJ (у(<ц)... у(о J))} = О при i * j; i! П ку ~ при '= J' (2’8’34) . Г=1 Ортогональные полиномы Винера (2.8.28) могут быть выражены через полиномы Эрмита (2.8.33) по формуле
298 Глава 2.8. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА О о •••>^-гя))ПА<" (2-8.35) Определение ядер Винера. Задача иден- тификации нелинейной системы методом Ви- нера, т.е. задача построения аппроксимирую- щего ряда Винера (2.8.30) сводится к опреде- лению функций &л(Т1,...,тл), которые на- зывают ядрами Винера. Способ вычисления этих функций следует из ортогональности полиномов Винера <7л[£л,у]. Действительно, если сходится в среднеквдцрашческом ряд (2.8.30), то ввиду ортогональности функций Gn M{Gn\k„,y]F(y)} = М {<?л[*л, Л}- (2.8.36) Отсюда с учетом (2.8.29) определяются неиз- вестные ядра. Например, при N = 2 ТТ J f кЖьЪУМ^уЦ ~ b)y(t- т2)}Л1Л2 = 00 тттт = 2f f f f кг(ц,хг)кг(р1,аг)Ку(а1 - x 0 0 0 0 xXy(o2 - t2)dt\dT2d^id^2- Поскольку это равенство должно соблюдаться ПРИ ЛЮбЫХ А^(Т1,Т2)»ТО ТТ А/{х(0Х'- " *2>} = 2J f *2(*1 >ст2) х 0 0 -Т1)/Гу(о2 -T2)<fci<fc2- (2.8.37) Вычислив экспериментально взаимно корре- ляционный момент в левой части этого инте- грального уравнения, нужно решить его отно- сительно ^2(01,02) • Общая формула для определения ядер Винера получена с использованием полиномов Эрмита (2.8.33) т т л!|...|лл(а1,...,ая)П<>,(^ -О*», = 0 О /•=! = ,тл), п = 1,2,... Л. (2.8.38) гае = м{х(/)Я"(у(/ - Ti)...(y(( - тл))|. При п = 1 это уравнение Винера-Хопфа, определяющее весовую функцию оптималь- ного в среднеквадратическом линейного фильтра. При п = 2 оно имеет вид (2.8.37) (с учетом того, что М{х} = 0). Каждое после- дующее уравнение позволяет определить ядро кп, п = 3..N независимо от остальных ядер, т.е. изменение порядка аппроксимирующего полинома не влияет на вид ядра (в отличие от процедуры, рассмотренной в п. 2.8.2). Это существенно упрощает процедуру идентифи- кации нелинейной системы. Если у(0 ~ белый гауссов шум с интен- сивностью С, то из полученных формул следует Лл(аь...,ал) = -^-уХ хМ{х(0Я"(у(Г-а1)...у((-а,,))), (2.8.39) т.е. ядра Винера могут быть вычислены непо- средственно, без решения интегральных урав- нений (2.8.38). Из (2.8.33) следует, что правая часть (2.8.39) содержит 8-функции. Чтобы облегчить вычисление функции на ЭВМ обычно записывают формулу (2.8.39) при ус- ловии 04 # 02 * * ал» тогда она принимает вид [114] ^(аь...,ал) = -^-ух * Щх(!)у(! ~ <*«)}• (2.8.40) Этот теоретический результат, однако, трудно использовать на практике. Предпочти- тельным в реальных условиях эксперимента является использование общих уравнений (2.8.38). Поскольку их решение плохо обу- словлено, вводится стабилизирующий функ- ционал £2(Л) = ^алл!]| ...р2(ть...,тл)П Аг> л=1 о 0 r=1 1 > ал > 0. (2.8.41) Записывая необходимые условия минимума функционала M4*) = L(0-£(?«[Aw]| + «(*), I '=» l^r) (2.8.42) вместо (2.8.38) найдем
МЕТОД ВИНЕРА 299 Гт т п ••>сл)]”[^у(тг -сгМстг + Г=1 +аЛ(Ч,-Ля)] = Лл), (2.8.43) П = 1,2,... Полученные уравнения Фредгольма вто- рого рода могут быть решены численными методами. Физический смысл функционала (2.8.41) - дисперсия реакции системы на бе- лый шум. Таким образом, при регуляризации к полезному сигналу у(0 аддитивно примеши- вается белый шум, имитирующий погрешность измерений. Качество аппроксимации можно повы- сить, если использовать тихоновскую регуля- ризацию первого порядка, т.е. ввести стабили- затор Т Т ЭД = £л!1 "1 {“"0*л 01 ч) + Л=1 о О л Г 5 ? " +Х“~- [Пл'; ало £ 0; > 0. Такая регуляризация приводит к близо- сти сигналов системы и ее модели в равно- мерной метрике [47], т.е. не только в средне- квадратическом, но и для каждой реализации входного сигнала y(f). Интеграл в левой части (2.8.43) имеет вид интеграла свертки. Это позволяет доста- точно просто записать решение задачи в фор- ме многомерного преобразования Фурье [32]: Jg(A»i,•••>,)- У”1........>л)у лЩ5?(/ог)+ал| V=1 ) (2.8.44) где Sy - спектральные плотности, соответ- ствующие Яхн(т1»-’-»тл)» *yW, а К?(/01,...,/»л) - преобразование Фурье ядра Винера Л£(т1,...,тл) порядка л. Аналогично для регуляризации первого порядка получим п\ П^<Аг)+а„Ё<Ол2| \г=1 г=1 / (2.8.45) Практически спектральные плотности в правой части выражений (2.8.44), (2.8.45) вы- числяются по оценкам соответствующих кор- реляционных функций на конечном интервале времени [0, 7]. Так S,U<i>)-j;YU«>,T)Y(-J«>,Ty, где Т Y(Jv,T) = 1Гт{у(!)} = J о Аналогично, используя (2.8.33), можно вычислить Аи(Л>1,-.*„)} « 1 { п « уХ ;£«>„т хг{я"(иП)...Ятв))}, * \ 1—1 где Ъ\ия(у(Ч)...у(хп))} = Т Т п = |...|е .... 0 0 '=1 х , у - реализации соответствующих сигна- лов. Вычисления в соответствии с этими фор- мулами проводят с помощью алгоритмов бы- строго преобразования Фурье [28]. Ошибку аппроксимации с помощью по- линома Винера порядка N вычисляют по формуле 8лг = At - 2j»!J -J- * л=1 о 0 х П Ку(&г ~ ^r)drr(for. (2.8.46) г=1 Ее также можно определить с использованием обобщенной формулы Парсеваля:
300 Глава 2.8. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА N 1 = DX -Ул!—X N £1 (2«)” оо оо д х f • •• f - -оо -оо Г = 1 Недостатком метода регуляризации явля- ется необходимость экспериментального под- бора коэффициентов регуляризации, что прак- тически приводит к необходимости много- кратного решения рассматриваемой задачи. Обычно параметр регуляризации подбирают только для N = 1, т.е. для линейной задачи, а затем полагают а/ = 04, / = 2, ..., N. Указанный недостаток отсутствует при определении ядер Винера с помощью рядов Фурье. Применение рядов Фурье. Ядра Винера можно искать в виде многомерных рядов Фу- рье по ортогональной системе функций {ф/(х)}: (2.8.47) По этой же системе строят ряды для представления корреляционных функций, входящих в уравнение (2.8.38) для определе- ния ядер Винера: Ку(х-ч)= Y (2.8.48) ...хп) = ..лП^Л <*»•)• л=о у„=о '•=1 (2.8.49) В приведенных формулах Cj{.........у ; Уj\j2; - это коэффициенты много- мерных рядов Фурье, используемых для пред- ставления ядер Винера и соответствующих корреляционных функций. Из выражений (2.8.47), (2.8.48), (2.8.49) и (2.8.38) следует система алгебраических уравнений относительно неизвестных коэффи- циентов Фурье Cj jh : М„ М. п я!Ё"ХСЛ.-.aFIUJ, = 8А................. j,=0 г=1 (2.8.50) п = 1, 2, ..., N. Верхний предел суммирования Мп вы- бирают с учетом уровня погрешности задания известных функций, что и позволяет преодо- леть трудности, связанные с плохой обуслов- ленностью исходной задачи. Получаемая погрешность может быть оценена по формуле п Г=1 (2.8.51) Для решения системы (2.8.50) можно также применить регуляризацию нулевого порядка с определением параметра регуляри- зации по невязке линейного приближения. Коэффициенты Фурье 5 .....д практи- чески вычисляют непосредственно в ходе ста- тистического эксперимента, минуя промежу- точное определение взаимно корреляционных функций, используя формулу 8Л..................А <4 (2-852) где т т Ч....л (0 = J.. J П ФЛ (V)Я"(У(7 - г,)... О О г=1 п Г=1 полиномы Эрмита Н* вычисляют по форму- лам (2.8.33). Коэффициенты у j определяют по виду корреляционной функции входного сиг- нала, которая обычно известна заранее. В слу- чае, когда тестовым сигналом является белый шум, коэффициенты Фурье ядра определя- ют в соответствии с (2.8.40) непосредственно по формуле Т Т ...Jn п * Г=1 (2.8.53) где
МЕТОД ВИНЕРА 301 а ошибку аппроксимации - по формуле n а* а* 5лг=д* - ^л!С*л ...л- Л=1 71=0 Л=0 (2.8.54) При использовании рядов Фурье (как и в случае, рассмотренном в п. 2.8.2) математиче- ская модель системы представляется в виде ряда N Мя Мя *(') = £ л!Ё - Z С1.,ЛгЛ.-.А Я=1 у1 = 0 Л=0 (2.8.55) слагаемые которого зависят только от коэф- фициентов Фурье Cj , т.е. вообще не требуется определение ядер Винера Недос- татком такого представления является отсутст- вие связи между набором коэффициентов и физическими свойствами рассмат- риваемой нелинейной системы. В качестве ортогональной системы {фу(О| в большинстве работ использовалась ортогональная система полиномов Лагерра [18, 32, 47[ Ряды Фурье-Эрмита. Другой подход к использованию рядов Фурье для вычисления ядер Винера состоит в том, что в форме ряда Фурье представляется не ядро (2.8.47), а вход- ной сигнал ХО* Применяя полиномы Лагерра £п(/), будем иметь: М 1=0 где а, (г) = jdt; i = 0,1,...,M. 0 Оператор системы становится функцией переменных Л/: х(0 = F(y(0) = FM(an,ai,...,aM,t). Полагая по-прежнему, что он принадле- жит гильбертову пространству £2(4» строят систему полиномов Эрмита от многих пере- менных Oq, ..., для его аппроксимации в этом пространстве. Общая формула для вы- числения полиномов Эрмита имеет вид: (-1)” Л dn dzn е“г' Я„(г) = Оператор /м аппрок- симируется конечной суммой ряда по системе полиномов Hn(at), который является рядом Лагерра-Эрмита: N N М fm(°o....ам>0= £••• . Л=о Jn=0 г=0 (2.8.56) Коэффициенты разложения определяют по формуле СЛ.Jm = <Ым,г ’ х М М ( М \ х(Г)Пял(вг)ехр . г=0 \ 2 /=0 ) (2.8.57) Это модификация общей формулы (2.8.30), в которой ортогональную систему функций Gn(y) выбирают в виде <Ыу)‘°Л..jM(y) = м (т л = П f r=0 ко > Погрешность аппроксимации определяют по формуле Парсеваля N 5ЛГ=2>х- Хсл........1м- (2858) При использовании этого метода на практике усреднение по множеству в (2.8.57) обычно заменяется усреднением по времени, т.е. предполагается эргодичность процесса х(1). При достаточно большом интервале на- блюдения Т
302 Глава 2.8. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА СЛ,,/м «у(2’)М/2{г(0х о хПЯл(а'^^ехР|“7^5/2^ dti r=0 V 2 /=0 / (2.8.59) t гае ar(t) = jy(f)Ll(f)e-ldt-, y(t), x(t) - о реализации входного и выходного процессов. Практические способы и схемы вычисле- ния этого выражения в процессе эксперимента см. [18, 28, 32]. Недостатком метода является необходи- мость вычисления коэффициентов Лагерра, число которых должно быть достаточно велико для получения приемлемой точности аппрок- симации. Цель всех рассмотренных выше методов - построение ряда Вольтерра для нелинейной системы. Ядра Винера, однако, отличаются от ядер Вольтерра, поскольку в получаемом вы- ражении могут быть однородные функции одного порядка. Их можно сгруппировать, тогда получится выражение, связывающее ядра Винера и ядра Вольтерра. Для аппроксимации с помощью полиномов Винера (2.8.35) эта связь для ядер четного и нечетного порядка выражается формулами [18]: kw(a а 1 V 2w!CW~" г СО 0 •<*2лМЧ...Жж_л; (2.8.60) *Ll(ab ><*2л+1) = = у (2т + 1)1Ст~п Г ~,(2л + 1)!(т - л)!2ж-л • 1ЯА. НЕЛИНЕЙНЫХ СИСТЕМ, ПРЕДСТАВЛЕННЫХ В ФОРМЕ ФУНКЦИОНАЛЬНЫХ радов Вычвслеме ядер Вольтерра для сястемы с заданной структурной схемой. Описание нели- нейных систем в форме функциональных ря- дов позволяет практически осуществить дейст- вия над ними,, определенные в п. 2.8.1, т.е. суммирование, композицию и произведение систем. Эго дает возможность описать слож- ную систему, если получены описания в фор- ме рядов Вольтерра для ее компонент. Определим ядра Вольтерра для каждого из типовых соединений (см. рис. 2.8.1), пола- гая известными описания элементов. Исполь- зуя сокращенные обозначения для многократ- ных интегралов, запишем М I <м*>=2L J .........х')П y^rWr- 1=1 Et '=1 Сумма этих систем представляет собой оператор (рис. 2.8.1, с): R Ну(х) = (F + G)^(t) = £ JММ1.........х /=1£( Г = 1 (2.8.61) для которого ^(/,Tb...,T/) = //(/,T1,...,t/)+g/(/,T1,...,T/); i = 1,...., Д R = max(^ М). Для композиции систем (рис. 2.8.1, 6) порядок полинома Ну(х) = (G* соста- вит J? = N + М, а ядра будут: •а2л+1)Л1 - Жт-п* где kw - ядра Винера; кУ - ядра Вольтерра. Эти формулы получены для случая, когда у(0 - белый гауссов шум с интенсивностью С. ММ1Л2) = = |«2('Л1.?2)/1Й1,Я)Л«2Л2)^1*2 + Е2 + |«1(/Л)/2Й,я,х2)^; 5
АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ, ПРЕД СТАВЛЕННЫХ В ФОРМЕ ФУНКЦИОНАЛЬНЫХ РЯД OB 303 А(АЧ.’2.’3> = J ftC'.ll.fc.Wlfcl.’l) X Д 3 X /1Й2.Т2)/1(§зЛз)П*1 + /=1 Д + р1(Л0/з«Л1Л2Лз)*; д (2.8.62) В случае произведения систем (рис. 2.8.1, в) ядра оператора Ну(х) = (F • G)y(x) порядка R - NM будут иметь вид Д('л) = 0; »з(ГЛ1,«2) = /1(*Л1)«1(*Л2); *з(М1Л2»*з) = Я(М1)л(М2,<з) + +Л(Атз)/2(АЯЛ2);... (2.8.63) Введем в рассматриваемом множестве систем единичный оператор и обратный оператор F~l такой, что Г-*А(г) = Жг). Теперь можно ввести и оператор системы с обратной связью (рис. 2.8.4). Если эта связь отрицательна, то уравнение системы имеет вид (Е + G* F)e(x) = у(т); следовательно, оператор системы с обратной связью может быть записан как х(т) = Фу(т) = F(E + G* F)-1y(t), (2.8.64) или e(tj Рве. 2Л4. Неявяейявя сяпсма с •братм* связью Ф = ГЯ, где Н = (Е + G* F)~l - оператор системы по ошибке, т.е. е(0 = Яу(/). Обозначая, как и выше, А/ - ядра опера- тора Я и вводя обозначение kj для. ядер опера- тора F ♦ (г, имеем следующую систему урав- нений для определения ядер hf. = 8(Г - т) - J Д ДНМзЛз)- =-f Л2)*1«1 ло^аг.хг^^г - д -f*i(/>O*2a.ti,x2)^; Д (2.8.65) Лз(ЛЯ,т2,тз) = "J М^М^Ь^зХ^ “ з /=1 “ /^Л^1Л2)А1Й1Л1)Л2Й2Л1,г3)^1^2 - - /Л2а,^1,^2)Л2Й1,И,^2)Л1Й2,Хз)*1*2; Структура этих уравнений имеет вид АО. я.....тл) = = - j A(AOA(t«i>->«aX+<ри0> я.....ч)> Д тде функция <рл зависит от ядер А/, / = 1, 2, ..., л - 1. Таким образом, эта система интеграль- ных уравнений Фредгольма (второго рода) относительно Ал(/, Xi, ..., х„) может быть ре- шена последовательно. На конечном интервале [0, 7] решение может быть найдено с помо- щью квадратурных формул. Для стационарной системы интегралы в правых частях полученных формул (2.8.61 - 2.8.65) являются интегралами свертки, что дает возможность воспользоваться многомерным преобразованием Лапласа для описания слож- ной системы [32]. Это преобразование опреде- ляется как
304 Глава 2.8. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА = /У(Л> -Л)<»Ф ПЛ" Е; V /=1 А=1 (2.8.66) ще St - комплексные переменные, а Е„ - по- лупространство 0 £ tt < оо, / = 1, п. Функ- ция fit\y tn) должна удовлетворять условию |7('i ( п ' /„)|s Мехр Y,cth , 4=1 / Ct = const; tt g[0,qo). Свойства многомерного преобразования Лапласа см. [32, 47]. В описании нелинейных элементов надо перейти к функциям нескольких веществен- ных переменных t\.tn> т.е. вместо N х(/) = F(y(t)) = X Jм-ti.•••><- *л) * п=1£л Х П Г=1 ввести N ) = У, J fn(h ~ ~ тл) х »=1£, *Пу(Тг)А, • (2.8.67) Г=1 В области изображений по Лапласу по- лучим N п ...*#>=............. л=1.................г=1 где X(51,...)5Af) = LJV{x(Z1>...>ZjV)}; /•„(51,...,5n) = £"{/B(Z1)....Zn)}; Y(s) = £{)-(r)}. Таким образом, оператор Ду(О) в облас- ти изображений по Лапласу определяется на- бором изображений ядер Волътерра n = l,...,N. Для соединения, показанного на рис. 2.8.1, а, оператор, описывающий систему в области изображений, определяется набором изображений ядер ...sB) = F„(st,...,s„) + +Gn(slv..,Sn), (2.8.68) где GB(51>...>5B) = L"{gB(Z1>...,ZB)}. Для композиции систем (рис. 2.8.1, 6) с учетом (2.8.62) имеем ffi(si) = Я2(5Ь52) = /j(5j +s2)G2(*i,s2) + +F2 (5], s2 )G| (Si )Gi (i2); Я3(5|;52,53) = Ffa + 52 +53)б!3(51,52,53) + +^2(s2>^2 + s3^2(s2ys3)^l(sl) + +F2 (51 + 52,52 )G2 <5, , 52 )<?! (53 ) + +F3 (5j, 52,53 )(q (5j )G3 (52 )G] (53 ). (2.8.69) В случае произведения систем, преобра- зуя выражения, соответствующие (2.8.63), по- лучим: Я1(51) = 0; Я2(5Ь52) = Fi(5i)Fi(52); (2.8.70) я3(51(52,53) = F1(51)G1(52,53) + +</1(53)Г2(51,52). Для замкнутой системы со стационарны- ми операторами F и G из (2.8.65) следует сис- тема уравнений для определения изображений неизвестных ядер Нп (s\,..., sn): ^(5) = 1-^1(5)^(5); я2(5Ь52) = - -ЛГ1(51+52)Я2(51,52); (2.8.71) Я3(5Ь52,53) = -Я1(51 +52 + 53)Я3(51,52,53) - -Я3(51,52,53)Я1(51)Я1(52)Я1(53) - -A"2(5i,52 + 53)Я1(51)Я2(52,53) - -X2(5j +52,53)Я2(5Ь52)Я1(53).
АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ, ПРЕДСТАВЛЕННЫХ В ФОРМЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ 305 Оригиналы, определяющие ядра системы во временной области, находят по формуле обращения многомерного преобразования Лапласа If ( п "I п ..... (2.8.72) где Вп - область в пространстве комплексных переменных $i, ..., 5Л, удовлетворяющая усло- виям Re Sj = с{, Im 5/ < оо , ct > , / = 1, ..., л, причем ..., sn) - аналитиче- ская при Re > c{q . Вычисление оригинала сводится к последовательному применению формулы обращения одномерного преобразо- вания Лапласа [32]. Частотный анализ нелинейной системы. Если ядра Вольтерра нелинейной системы обладают свойством абсолютной интегрируе- мости, т.е. •Л)|ПЛ/ <», (2.8.73) £, /И /(/) = 1 (2«)" X ( п А « ,>„)ехр П \ /=1 ) 1=1 п Полагая здесь to = со / , представим /=1 это выражение в виде обычного преобразова- ния Фурье: 00 /(0 = ± J= /--‘{ФО)}, -ОО (2.8.76) где Ф(» = ]____ \л—1 J F 7®ь- 5,-1 л-1 ГИ /=1 (2.8.77) Процедуру перехода в изображении по Фурье к одной переменной обозначим то для них определено преобразование Фурье как Ф(» = X X ( Л-1 Y V /=1 /7 ..../„)} = ( п п = JZC'l»- -Л)ехЛ - ["[Л,. Е, К >=1 Л=1 (2.8.74) В частных случаях решение этой задачи упрощается: = F(Ja>); (2.8.78) Обратное преобразование Фурье имеет симметричный вид: /(0 = У-'{ЛЯ}’; (2«)" ( п X |/7(/<о1,...,>я)ехр П4*0/- Еп V Ы Л-1 (2.8.75) п I Л Г2(Л>1 = F10){F20««>i,...J<on)}*; (2.8.79) Свойства многомерного преобразования Фурье обобщают свойства обычного преобра- зования Фурье [32]. При исследовании сигналов, которые яв- ляются функцией одной переменной (2.8.80)
306 Глава 2.8. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА где знак * обозначает свертку соответствующих функций; следовательно, fit) = X-’ ЛОИ grit) = Z-’{Gr(jto)}. Например, __________________1_______________ (со2 +а2)((0 2 +Ю2)2 +с2 __________а + Ь_______ 2аЬ^(и2 + c2j((o2 + (а + d)2j Обратимся к уравнению стационарной полиномиальной системы, записанной в фор- ме (2.8.67). Преобразуя обе его части по Фу- рье, будем иметь ХЦч>1...Ja>N) = л = £Л.О1^.,Л»„)ПУОД л=1 /=1 При этом преобразование Фурье сигнала х(/) на выходе системы JTO) = Z{x(0) = определяется по формуле N Г п Л=1 I /=1 Выражения Л1О1.—ОД Л = 1, —,N, являются амплитудно-фазовыми частотными характеристиками нелинейной системы, соот- ветствующими л-м составляющим ряда Воль- терра. Они характеризуют "вклад" л-го слагае- мого в реакцию на гармоническое воздействие. Однако они не имеют столь же определенного физического смысла, как частотные характери- стики линейных систем. Пример 2.8.3. Рассмотрим реакцию по- линомиальной системы третьего порядка 3 п *(0 = £*л(ч...... Л=1 Г=1 (2.8.81) на гармонический сигнал y(t) = y(e^°r +e_^°r) = a cosco Г. Подставляя это выражение в уравнение системы (2.8.81), применяя формулу преобра- зования Фурье (2.8.74) (при со i = со2 “ <03 = со) и группируя члены, соответствующие одина- ковым гармоникам, получим с учетом симмет- ричности ^Л(/Ю1,... ,/сол) относительно своих переменных. x(t) = 0^0)1 jcos (со/ + 318^000)) + з х cos(co/ + aig ^3 (-/со,/со,/00)) + I I + —|tf3 »|x x cos(co/+ argX’3(-/m,-/m,/m)) + 2 + —|ЛГ2(ло,У(о)|ср8(2со/ + arg Л*)) + 2 3 + ^-|r3O,>,»|x x cos (3(0 Г + arg K3 (/do, jto, jto)) + д2 . . + — |tf2(-A>®)|cos(aig tf2(-/®,/®))- (2.8.82) Таким образом, реакция содержит посто- янную составляющую, зависящую от ядра вто- рого порядка, а прохождение первой гармони- ки через систему зависит не только от первого, но и от третьего ядра. Полученное выражение определяет три гармоники на выходе системы третьего порядка при гармоническом сигнале на входе. В общем случае можно аналогично рассчитать л гармоник на выходе нелинейной системы л-го порядка. Авалю устойчиво! in. Пусть рассматри- ваемая система описывается оператором х = Fy, отображающим пространство Y в X.
АНАЛИЗ НЕЛИНЕЙНЫХ СИСТЕМ, ПРЕДСТАВЛЕННЫХ В ФОРМЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ 307 Полагаем относительно этого оператора, что от отображает ноль пространства Y в ноль пространства X и ограничен, т.е. каждое огра- ниченное множество пространства B(Y) он отображает в ограниченное множество D(X), а также непрерывен. В этом случае система яв- ляется равномерно устойчивой по отношению ко входному сигналу [32] в том смысле, что для любого 8 > 0 можно указать такое 5(e) > 0, что из условия ||У1(0-№(0|г *8(6) следует 11*1 (0 - х2 </)|| х = Ц/У1 (0 - РУ2 (0|| х < е- Из этого определения следует, что для устойчивости линейной системы в указанном смысле необходимо и достаточно ЦГЦ = sup J |/(/, т)|Ж = С[ < оо. (2.8.83) teE>Et Если, в частности, |/(Г, т)| 2 В, ехр[- cq (/ - т)], т 2 t, то может быть определена и константа Сд: С\ <. sup ГВ\ ехр[- ai(t - т)1Ж = —. Д ai (2.8.84) При этом Их ‘ИН ^||Я')||Г, что позволяет определить отклонение выход- ного сигнала по отклонению входного (задача о накоплении возмущений). Для однородной системы степени / будем иметь в качестве необходимого и достаточного условия устойчивости И = sup = С> < “°- /б£1 Е, г=1 (2.8.85) Если существуют такие числа cq, ..., а/, что для всех -ц, ..., Т/, t выполняется нера- венство / )| S в, exp -£аг(Х-тг) , Г = 1 xr^t; г = 1, то Ci <;sup f^exp -^аг(/-тг) I"]**' = Е/ L r=l Jr=l “ I 9 ГК r=l следовательно ||x(r)|x <-^K. ГЬ r=l Для полиномиальной системы порядка N, которая представляет собой сумму N одно- родных систем, L-rHb'Wly- Г=1 (2.8.86) Наконец, для аналитической системы вопрос об устойчивости сводится к исследова- нию сходимости ряда EqK- /=1 Его радиус сходимости определяется по формулам Коши-Адамара или Даламбера: ГС Г° limbi' i->«> Cf При этом ML s S-rHMIr 'ТЬ Г=1 Последнее неравенство дает решение задачи о накоплении возмущений для аналитической системы. Если теперь имеются две аналитические системы, причем они устойчивы при |[у(0||у П и ||зЧО|у - Г2» то система, обра- зованная путем параллельного соединения (суммирования) или перемножения систем,
308 Глава 2.8. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА также устойчива при ||у(0||у г > где г = min(ri,r2). Если эти системы соединены последова- тельно и z(t) - сигнал на выходе первой сис- темы (на входе второй), то сложная система устойчива, если ||z(0|| < r2 J ||у(0|| < П • Сложнее решается задача об устойчиво- сти системы с обратной связью, описываемой оператором (2.8.64), в частности при G— Е: Ф = (E + FY'F' (2.8.87) Пусть оператор F удовлетворяет условию Липшица с константой а < 1: ||Fq - Fe2||% <“h -е2||. Тогда уравнение (Е + F)e(t) = y(t) имеет единственное решение в X причем опе- ратор (Е + F)~l также удовлетворяет условию Липшица, откуда следует устойчивость систе- мы с обратной связью, соответствующей опе- ратору (2.8.87) [32]. Если оператор F дифференцируем, то .в качестве константы Липшица можно выбрать а = зирЦГ'еЦ^, ееХ где F' - его производная (по Фреше). Полагая, что оператор /’описывается функциональным полиномом и применяя прежние обозначения, получим следующую оценку: N N iD - r=l (2.8.88) Величина ||e(/)|| заранее неизвестна. Од- нако, положив здесь ||е|| = у , можно рассмот- реть уравнение N £/С,г'-' = 1, (2.8.89) ы наименьший положительный корень которого у определяет границу области устойчивости по отношению к сигналу ошибки. Показано [32], что число N r = y-'^iCtyl (2.8.90) /=1 дает оценку нормы входного сигнала, соответ- ствующую у , определяя тем самым границу области входного сигнала, при котором систе- ма остается устойчивой. Другой подход к анализу устойчивости нелинейной системы основан на рассмотрении ее математической модели в изображениях по Лапласу: п ....s„) = Hn(s{...$„)["[ Y(st). /=1 Так, если Hn(Sl,...,sn)=P(Sn'...5"> П<2(5/) /=1 и Ху - нули полиномов Q(Sj)y то в соответст- вии с (2.8.85) система устойчива, если ReXv <0, v= Анализ более слож- ных случаев можно найти в [32]. 2.8.5. СИНТЕЗ НЕЛИНЕЙНЫХ СИСТЕМ Определение желаемого оператора. При синтезе нелинейных систем, описываемых рядами Вольтерра, может быть применен тот же подход, который применяется при синтезе линейных систем. Требования, предъявляемые к системе, формализуются с помощью ’’желаемого" оператора системы, после чего решается задача аппроксимации фактического оператора системы к желаемому путем изме- нения ее параметров, структуры, введения корректирующих устройств. Примером определения желаемого опе- ратора полиномиальной системы является задача оптимальной в среднеквадратическом фильтрации случайного сигнала. Входом систе- мы является аддитивная смесь полезного сиг- нала s(t) и помехи n(t)\ оба сигнала стацио- нарны (в узком смысле) и стационарно связа- ны. Надо найти такое преобразование F*(j(/)) сигнала y(t) = s(t) + л(/), при кото- ром * (НО) - Ф(Х0)]2| = min, (2.8.91) где Ф($(0) - заданное преобразование полез- ного сигнала.
СИНТЕЗ НЕЛИНЕЙНЫХ СИСТЕМ 309 Решение этой задачи в классе полиноми- альных систем приводит к системе интеграль- ных уравнений, которые могут рассматривать- ся как обобщение уравнения Винера -Хопфа: N X ............5т)х т=°£; ...Я -ГлД! -$!....Г] -$т) х xf]^r=ffIg,;1)(Ti>...>Tn). (2.8.92) Г=1 Здесь - ядра искомого поли- номиального оператора F*(y) степени Ny л„)-м -.(я+1)/_ Мфу Пь п ф(хо)П^_т<> /=1 В частности, если Ф - единичный оператор, т.е. Ф($(/)) s(t), то правая часть уравнений (2.8.92) будет иметь вид ш^+1\т1,...,тя). Этот случай соответствует задаче оптимальной фильтрации полезного сигнала [28, 32, 47[. Уравнение (2.8.92) дает также оптималь- ное в среднеквадратическом решение задачи полиномиальной идентификации нелинейной системы. При этом y(t) - случайное воздей- ствие, подаваемое на вход системы, a s(t) - случайный сигнал на ее выходе. В качестве тестового сигнала обычно используется нор- мальный стационарный процесс с нулевым математическим ожиданием [28]. Синтез корректирующих устройств. Пред- полагается известной структура системы, а также неизменяемые ее элементы, которые описываются полиномами Вольтерра. Требует- ся путем введения корректирующих устройств обеспечить аппроксимацию желаемого опера- тора системы. Наиболее простой случай - это последо- вательная коррекция (см. рис. 2.8.1, б). Кор- ректирующее устройство находится в цепи входного сигнала и описывается оператором Z(O = GMy(t) = М п = £ — ,»«)["[ 0=1 ж; /=1 неизменяемая часть системы - оператором х(() = FNz(t) = N п = £(/л('.Ч.....*л)Пг(т<)А'- «=1ж; Желаемый оператор системы задан как *(Л = HNy(t) = N п = Х /м'ль- •лп)П-’,(т<)л'- Л = 1££ / = 1 Таким образом, должно выполняться уравне- ние х(П = HNy(f) = (FN*GM}y(t)- В соответствии с правилом композиции опера- торов (см. п. 2.8.4) получаем систему инте- гральных уравнений вида = <Ри«Л1,-Лл>) + + //1(А0«тЙ>тЬ">тл|)^. "1=1.....N, О (2.8.93) где <рш(/,Т1 »•••♦*«) - функции, определяе- мые по результатам решения предыдущих т - 1 уравнений, т.е. по функциям 8/ЙЛь-Л/)» / = 1» 2....т - 1. Используя численные методы решения этих уравнений (первого рода), найдем ядра полинома, опи- сывающего корректирующее устройство. В случае стационарной системы решение может быть найдено в аналитической форме. В этом случае уравнение (2.8.93) записывается в виде *£(*) = J(2.8.94) О где Л^(т) = Лт(т) - фот(т), теЕ*, причем gm(^-^) = gm(^l -^,т2 - О- Применим регуляризацию нулевого по- рядка со стабилизатором ^(gm) = fвт(*)П Л/ = |gmfr)|^>- ж; /=1 Необходимое условие минимума функционала
310 Глава 2.8. ПРИМЕНЕНИЕ ФУНКЦИОНАЛЬНЫХ РЯДОВ ДЛЯ ИССЛЕДОВАНИЯ И РАСЧЕТА M“(gm) = ГЛ£)«т(* - 5)^ - *m(t) + «2O(«m) (2.8.95) имеет вид J F&gmb ~ = -00 = f *m 0 + П)/1 (пМп. (2.8.96) О где со Л5) = J /1(п)/1Й + п)Л1; тах[0,-£] Применяя многомерное преобразование Фурье к обеим частям уравнения (2.8.96), по- лучим Чтобы найти оригиналы, соответствую- щие физически реализуемым устройствам, применяют метод факторизации изображений. Для первого из уравнений системы (2.8.98) вычислим 51а(/ю) = #iO)^aO)> где ДхО®) = 1 Ч'(-Л) |ч/(Л)|2 = |/1(Л)|2 +<Х, а знак [ ]+ означает, что в выражении, заклю- ченном в квадратные скобки, надо отбросить целую часть и слагаемые, соответствующие полюсам в нижней полуплоскости. Если >Га(О = /-|(ЛхОЬ)}, ТО со «1а (0 = J - t)ra(t)<ft О - ядро первого порядка, удовлетворяющее условию физической реализуемости: X я£0©1,...,/ют), т = 1,...,Я, (2.8.97) где F(», ^(Ль.-.^и), ЛОО. Яда(/(01,...,/»т) - изображения по Фурье ядер соответственно Fft), gm(^i,...,^m), /1(0* ^gb...,^m). Предполагается, что все эти ядра абсолютно интегрируемы по всем переменным. Из последнего уравнения полу- чаем изображения по Фурье искомых ядер: ( т ] х А /У'.а>1 > т = 1, 2> •••> (2.8.98) \ /=1 ) где Ла (/и) = Л(->) |Л0“)|2 + “ gla(0»0 при '<0. Теперь можно определить и ядра высших порядков, также удовлетворяющих условию физической реализуемости. Так как то эти ядра определяются по формуле ^maU®0!,...,jbw) - «та (0 = J Лт (' - ’)?а W*. t € Ет. О (2.8.99) Пример 2.8.4. Неизменяемая часть систе- мы описывается полиномом второго порядка, и ядра ее имеют изображения ^U“) = O)2 +4Л»+3;
СИНТЕЗ НЕЛИНЕЙНЫХ СИСТЕМ 311 (-1) ДО1)/)О2)Г(/(.1 + а>2)) • Желаемое преобразование также описывается полиномом второго порядка с ядрами ^(т) = ОДехр(-ОДт); Л2С4» ^2) = О,О1ехр(-ОД(т! + т2)). Полагая параметр регуляризации а = 0,001, получим |ч>О)|2 * = |Л(Л>)|2 + а = 0,01(а>4 + IQto2 +1009) (<в2 + 1)(<о2 + 9) чЧ-» J ___________________100_________________ - [и» + 1)0"» - 0964J - 5.6)Ца> + 0$MJ - 5,6) J 2,99 /о + ОД ’ (до)2 + 11,2/0 + 32,4 Таким образом, ядро первого порядка корректирующего устройства имеет вид GteO) =-------------------------------- (до + О,1)((/о)2 +11,2/о + 32,4) Для ядра второго порядка получим ^2аО) = Я2(/О1,/О2)ДхО‘(®1 +®2)) = _ О,2999(/(со 1 + ш2) + 1)(/((о 1 + со 2 ) + 3) [(/(^l + о®2))2 +11ДУ(<»1 + со 2 ) + 32,4 J(0 Д + /01)(ОД + /о2) 8100 2 П[(л, + ОД)((/0/)2 +11,2/0/ +32,4)^7(00! +(02)2 +11Ду((о| +(02) + 32,4)| Рве. 2.8.5. Структура корректарукхцего устройства
312 СПИСОК ЛИТЕРАТУРЫ Найденные формулы определяют и структуру корректирующего устройства. Его схема показана на рис. 2.8.5, где 01 29 9 ($) = ———, И^2(5)=-5-------—--------, S + 0,1 S2 +11,25 + 32,4 ГГ(з) = ^(j). Если задан желаемый оператор для замк- нутой системы, то задача коррекции распада- ется на два этапа. На первом определяется желаемый оператор разомкнутой системы, а на втором синтезируется разомкнутая система с помощью методики, изложенной выше. В п. 2.8.4 показано, что уравнения, связываю- щие ядра желаемого оператора замкнутой сис- темы hi и ядра соответствующей разомкнутой системы имеют вид т - + Е* / = 1 +Фт(/,ть...,тт); m = 1,2,...,7V, (2.8.100) где функция (pm(/,Tj,...,Tm) зависит от при п = 1, 2, ..., т - 1. Таким образом, задача перехода от желаемого оператора замкнутой системы к оператору разомкнутой заключается в решении хорошо обусловленной задачи (интегральные уравнения (2.8.100) - второго рода). Для стационарной системы эта задача решается в аналитической форме с помощью многомерного преобразования Лапласа (см. п. 2.8.4). Этот подход применим и для систем с более сложной структурой, например с внут- ренними контурами обратной связи, так как последовательно решая соответствующие сис- темы интегральных уравнений, в которые вхо- дят ядра неизменяемых частей системы, мож- но определить желаемый оператор для ра- зомкнутого внутреннего контура и вновь при- менить рассмотренный подход к синтезу кор- ректирующих устройств. Аналогичный подход применяется при идентификации сложных систем [18]. При этом, задавшись структурой сложной системы и определив ее модель в целом, а также моде- ли ее отдельных частей, доступных идентифи- кационной процедуре, получают математиче- ское описание и тех подсистем, которые такой процедуре подвергнуты быть не могут. СПИСОК ЛИТЕРАТУРЫ 1. Арнольд В. И., Варченко А. Н., Гусейн- заде С. М. Особенности дифференцируемых отображений. М.: Наука, ч. I, 1982, ч. II, 1984. 2. Баркин А. И. Оценки качества нели- нейных систем регулирования. М.: Наука, 1982. 3. Боголюбов Н. Н., Митропольский Ю. А. Асимптотические методы в теории нелиней- ных колебаний. М.: Наука. 1974. 4. Бойков Ю. А. Численный расчет нели- нейных регуляторов. Л.: Энергоатомиздат, 1984. 5. Брекер Т., Ланлиер Л. Дифференци- руемые ростки и катастрофы. М.: Мир, 1977. 6. Бутенин Н. В., Неймарк Ю. М., Фу- фаев Н. А. Введение в теорию нелинейных колебаний. М.: Наука, 1976. 7. Веретенников В. Г. Устойчивость и ко- лебания нелинейных систем. М.: Наука, 1984. 8. Воронов А. А. Основы теории автома- тического управления. Особые линейные И нелинейные системы. М.: Энергоиздат, 1981. 9. Воронов А. А. Устойчивость, управляе- мость, наблюдаемость. М.: Наука, 1979. 10. Гаушус Э. В. Исследование динами- ческих систем методом точечных преобразова- ний. М.: Наука, 1976. И. Геращенко Е. И., Геращенко С. М. Метод разделения движений нелинейных сис- тем. М.: Наука, 1975. 12. Дезоер Ч., Видьясагар М. Системы с обратной связью: вход-выходные соотноше- ния. М.: Наука, 1983. 13. Емельянов С. В. Бинарные системы автоматического управления. М.: МНИПУ, 1984. 14. Емельянов С. В., Коровин С. К., Си- зяков В. И. Векторное управление нелиней- ными объектами в классе бинарных систем // Итоги науки и техники. Техническая киберне- тика. М.: ВИНИТИ, 1985, т. 18. 15. Крутько П. Д. Обратные задачи ди- намики управляемых систем. Нелинейные модели. М.: Наука, 1988. 16. Кунцевич В. М., Лычак М. М. Син- тез систем автоматического управления с по- мощью функций Ляпунова. М.: Наука, 1977. 17. Лоскутов А. Ю., Михайлов А. С. Вве- дение в синергетику. М.: Наука, 1990. 18. Мармарелис П., Мармарелис В. Ана- лиз физиологических систем. М.: Мир, 1981. 19. Месарович М., Такахара Я. Общая теория систем. М.: Мир, 1978. 20. Методы автоматизированного проек- тирования нелинейных систем. М.: Машино- строение, 1993. 21. Методы исследования нелинейных систем автоматического управления. М.: Нау- ка, 1975.
СПИСОК ЛИТЕРАТУРЫ 313 22. Наумов Б. Н. Теория нелинейных ав- томатических систем. М.: Наука, 1972. 23. Неймарк Ю. И. Метод точечных ото- бражений в теории нелинейных колебаний. М.: Наука, 1972. 24. Нелинейные корректирующие устрой- ства в системах автоматического управления. М.: Машиностроение, 1971. 25. Новогранов Б. Н. Расчет частотных характеристик нелинейных автоматических систем. М.: Машиностроение, 1986. 26. Пальтов И. П. Качество процессов и синтез корректирующих устройств в нелиней- ных автоматических системах. М.: Наука, 1975. 27. Петров В. В., Гордеев А. А. Нелиней- ные сервомеханизмы. М.: Машиностроение, 1979. 28. Попков Ю. С. и др. Идентификация и оптимизация нелинейных стохастических систем. М.: Энергия, 1976. 29. Попов Е. П. Прикладная теория про- цессов управления в нелинейных системах. М.: Наука, 1973. 30. Попов Е. П. Теория нелинейных сис- тем автоматического регулирования и управ- ления. М.: Наука, 1988. 31. Постон Т., Стюарт И. Теория катаст- роф и ее приложения. М.: Мир, 1980. 32. Пупков К. А., Капалин В. И., Ющен- ко А. С. Функциональные ряды в теории не-' линейных систем. М.: Наука, 1976. 33. Солодовников В. В., Плотников В. Н., Яковлев А. В. Теория автоматического управ- ления техническими системами. М.: МГТУ, 1993. 34. Справочник по теории автоматиче- ского управления / Под ред. А. А. Красовско- го. М.: Наука, 1987. 35. Старикова М. В. Исследование авто- матических систем с логическими управляю- щими устройствами. М.: Машиностроение, 1978. 36. Сю Д., Мейер А. Современная теория автоматического управления и ее применение. М.: Машиностроение, 1972. 37. Техническая кибернетика. Теория ав- томатического регулирования. Кн. 3, ч. 1, 2 / Под ред. В. В. Солодовникова. М.: Машино- строение, 1978. 38. Тихонов А. Н., Арсенин В. Я. Методы решения некорректных задач. М.: Наука, 1979. 39. Точные методы исследования нели- нейных систем. М.: Машиностроение, 1971. 40. Уткин В. И. Скользящие режимы и их применение в системах с переменной структурой. М.: Наука, 1974. 41. Хакен Г. Синергетика. М.: Мир, 1980. 42. Хлыпало Е. И. Расчет и проектирова- ние нелинейных корректирующих устройств в автоматических системах. Л.: Энергоиздат, 1982. 43. Цыпкин Я. 3. Основы теории автома- тических систем. М.: Наука, 1977. 44. Цыпкин Я. 3., Попков Ю. С. Теория нелинейных импульсных систем. М.: Наука, 1973. 45. Черников С. А. Динамика нелиней- ных гироскопических систем. М.: Машино- строение, 1981. 46. Шахтарин Б. И. Квазигармонический метод и его применение к анализу нелиней- ных фазовых систем. М.: Энергоатомиздат, 1987. 47. Эйкхофф П. Основы идентификации систем управления. М.: Мир, 1975.
Раздел 3 МЕТОДЫ Н°°-ТЕОРИИ УПРАВЛЕНИЯ В практических задачах конструирования регуляторов модели, описывающие объекты управления, как правило содержат неопреде- ленности. В этом случае основной является проблема обеспечения требуемых характери- стик замкнутой системы (устойчивости и каче- ства) в условиях присутствия неопределенно- стей. Такую проблему называют проблемой робастного управления. Теория робастного управления возникла в конце 70-х годов, когда стало ясно, что во многих случаях существовавшая теория Вине- ра-Хопфа-Калмана не дает возможности син- тезировать робастные регуляторы. Одно из наиболее перспективных на- правлений теории робастного управления ос- новано на методах //“-оптимизации [1, 2]. Вариант теории робастного управления, ис- пользующий указанные методы, получил на- звания //“-теории управления [3]. Глава 3.1 ПОСТАНОВКА ПРОБЛЕМЫ 3.1.1. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ Пространства Харди Н2 и Н21 состоят из квадратично-интегрируемых функций на мнимой оси с аналитическим продолжением соответст- венно в правую и левую полуплоскости плоско- сти комплексного переменного. Пространство Харди //“ состоит из О1раниченных функций с аналитическим продолжением в правую полу- плоскость. Пространства Лебега L2 = /?(-оо, оо); Z2 = /?[0, оо) и £? = Z2( - оо, 0] определяют- ся стандартным образом. Будем считать, что и Z? состоят из функций времени, L2 и Z“ - как из функций времени, так и функций частоты, где пространство £“ состоит из огра- ниченных на интервале (-оо, оо) функций. Изоморфизм гильбертовых пространств L2 временной и частотной областей устанавли- вается через преобразование Лапласа и теоре- му Пели-Винера стандартным способом. При этом справедлива диаграмма L2 = £2 Ф £2 n Т4. П L1 = Я2 Ф Я2± 3.1.2. НОРМЫ СИГНАЛОВ И СИСТЕМ Пусть 1/(1) - сигнал временной области, являющийся функцией из (-оо, оо) в R (поле вещественных чисел) и u(f) е L2, тогда L2 - норма определяется выражением Н2:= • к- 00 > Сигнал l/(f) е L2 может быть интерпре- тирован как сигнал с ограниченной энергией. В случае, когда 1/(1) е £“, его норма определяет- ся выражением Н®:= sup|«(/)|. Сигналы из Z“ являются сигналами с ог- раниченной амплитудой. Определим среднюю мощность сигнала //(/) на интервале (- Т, 7) выражением Т lim -^7 f u(t)2dt. IT J v ’ Сигнал //(/) называют сигналом с ограни- ченной мощностью, если указанный предел существует. В этом случае полунорма //(/) обознача- ется через T Мр:= • К -Т / Определим нормы передаточной функ- ции некоторой системы G. £2-норма системы G задается выражением
СТАНДАРТНЫЙ ОБЪЕКТ 315 ( . лХ |G|2:= j 1гасе^б(/ю)*С(/ш)|л> I . ще * - комплексное сопряжение и транспони- ч ГЛ I В рование. Обозначим через G{s) = | передаточную функцию системы G. Если Lc - грамнан управляемости пары (Л, В), a Lo - грамиан наблюдаемости пары (С, Л), тогда в случае устойчивой G(s) LCi Lo удовлетворяют паре уравнений Ляпунова: 3.1.1. Нормы передаточных функций Выход Вход Иг к н, Иг И, 00 00 Ы.0 *Мг Ml 00 и, 0 Ф1. м„ ALC + L<A' + ВВ' = 0; Л'£о+ LoA + С'С = 0, a Цб^ задается выражением |G||2 = tracefCij-C') = tracef/f'Z,,/»), 3.1.3. СТАНДАРТНЫЙ ОБЪЕКТ Проблема /Г-оптимизации обычно формулируется в терминах стандартного объ- екта. Суть данного понятия поясняется при- мером. Рассмотрим проблему смешанной чув- ствительности. (рис. 3.1.1). Связи между сиг- налом w и сигналами Zb %2 определяются вы- ражениями: где' - знак транспонирования. Е° / Н° - норма G задается выражением где 5[фо)] = ^шах [gCao/go®)]* - мак- симальное сингулярное значение (ХтятС) - максимальное собственное значение). Норма 12 в отличие от нормы 12 вычисляется с ис- пользованием итерационной процедуры. От- метим, что 12 - норма системы G конечна тогда и только тогда, когда передаточная функция G - строго правильная (ОДх>) = 0] и не имеет полюсов на мнимой оси, а £°° - нор- ма G конечна тогда и только тогда, когда G - правильная (число G(j<x>) конечно) и не имеет полюсов на мнимой оси. Пусть у = Gu, где и - вход системы G, а у - ее выход, (табл. 3.1.1) устанавливает связь норм сигналов и систем. Из табл. 3.1.1 следу- ет, что 12 / Б2 - норма передаточной функции является коэффициентом усиления системы G по энергии {мощности). Zi = W\SVw; Z2=-^2^, где S = —- функция чувствительности; 1 + Рл и = — \ + РК - функция чувствительности Z1 1/2. Т -Г ' lzw [- Wjuv ' входу. Пусть z = , тогда z = по где Рас. 3.1.1. Проблема смешанной, чувсгаггелыюстя: Р - объект управления; К - регулятор; IF], V- весовые функции (выбираются разработчиком для придания большего или меньшего веса регулируемому выходу в соответствующем частотном диапазоне); w - внешний вход; и - управление; у - измеряемый выход; Zi, Z2 ~ регулируемые выходы
316 Глава 3.2. ПОДХОД ПРОСТРАНСТВА СОСТОЯНИЙ К ПРОБЛЕМЕ Н “-ОПТИМИЗАЦИИ Рас. 3.1.2. Замкнутая система со стандартным объектом Проблема смешанной чувствительности состоит в минимизации Н°- нормы передаточ- ной функции от внешнего входа w к регу- лируемому выходу Z- При этом, как и в любой проблеме /Г-оптимизации, внешний вход w известен с точностью до принадлежности классу сигналов с ограниченной энергией, т.е. ||w||2 < 1 (см. табл. 3.1.1). На диаграмме (рис. 3.1.2) G - обобщенный или стандартный объект. Определим передаточную функцию G в явном виде. Имеем Zi = IPiVw + KqPi/; Z2 = у = -Vw - Pu, тогда Преимущество задания проблемы Н°- оптимизации в виде диаграммы со стандарт- ным объектом состоит в выделении регулятора в отдельный блок. При этом объект управле- ния, весовые функции и связи входят в состав стандартного объекта. При решении произ- вольной проблемы Н°- оптимизации предпо- лагается, что исходная постановка приводится к эквивалентной, описываемой диаграммой со стандартным объектом. 3.1.4. ПРОБЛЕМА Я “-ОПТИМИЗАЦИИ Предположим, что передаточные функ- ции G и К (см. рис. 3.1.2) являются рацио- нальными и правильными, а К выбирается из множества регуляторов, обеспечивающих внутреннюю устойчивость. Под внутренней устойчивостью понимается свойство стремле- ния всех состояний Gn К замкнутой системы (см. рис. 3.1.2) к нулю из произвольного на- чального состояния при w = 0. Регуляторы, обеспечивающие внутреннюю устойчивость, далее называются допустимыми. Нетрудно видеть, что в терминах обоб- щенного объекта передаточная функция определяется выражением тгн,=//с, К), Где F^G, К} = (гц + (од-Щ " б22^)-1^21 - нижнее дробно-линейное преобразование. Проблема Н°- оптимизации состоит в на- хождении допустимого К, такого, что (311) При строгом неравенстве имеем субоп- тимальный случай, при допущении равенства - оптимальный случай. Если предположить, что внешний вход имеет ограниченную энергию Flh * • • то проблема (3.1.1) обеспечивает ограниченность управляемого выхода величи- ной у. Глава 3.2 ПОДХОД ПРОСТРАНСТВА СОСТОЯНИЙ К ПРОБЛЕМЕ /^-ОПТИМИЗАЦИИ Основой подхода пространства состоя- ний к проблеме //“-оптимизации являются два фундаментальных результата. Первый ос- нован на связи операторов сжатия и Риккати, соответствующих данной системе G. Указан- ная связь может быть использована для полу- чения необходимых и достаточных условий существования решения проблемы Н°-опти- мизации. Второй результат базируется на структурных свойствах линейных систем: можно показать, что произвольная линейная система, удовлетворяющая некоторым стан- дартным допущениям, разделяется на две не- зависимые подсистемы таким образом, что решение проблемы Н°- оптимизации выража- ется в терминах этих подсистем. 3.2.1. ОПЕРАТОРЫ СЖАТИЯ И РИККАТИ Рассмотрим передаточную матрицу G с реализацией G(s) = (3.2.1) и устойчивой матрицей А. Пусть A, Q, R - вещественные матрицы размерности п х л, кроме того, матрицы Q и R - симметричные (Q = Q, R = R). Определим гамильтонову матрицу Н размерности 2п х 2п следующим образом:
СВОЙСТВА ОПЕРАТОРА Лс 317 A R ' .Q -< Предположим, что матрица Н не имеет собственных значений на мнимой оси, тоща она (по построению) имеет ровно п собствен- ных значений в Re s < 0. Сформируем два и-мерных спектральных подпространства Х(Н) и Х+(Н), соответствующих собствен- ным значениям вКв$<0иКе$>0. По- скольку Х(Н)(Х+(Н)) - инвариантное под- пространство, соответствующее собственным значениям матрицы Н в Re s < 0 (Re s > 0), то оно может быть представлено в следующем виде: *_(Я)=1т f1 , 1*2 J ще Х\, X} е ДО х л - базисные векторы, запи- санные в виде матрицы, линейной оболочкой для которых является Х(Н). В соответствии с теоремой Шура об унитарной триангуляриза- ции имеет место равенство 1*11 Г*> ТХ, Rel/(Tjr)<0,V/. Если Ад несингулярна или, что то же са- мое, если следующие два подпространства (3.2.2) являются взаимно дополняющими, то можно положить X:- A^Aff1. В этом случае матри- ца X единственным образом определяется мат- рицей Н, т.е. Н -+ X есть оператор, который далее обозначается через Ric и имеет место равенство X — Ric(H). Область определения оператора Ric обозначается через dom(Ric) и состоит из всех гамильтоновых матриц Н, обладающих следующими двумя свойствами: матрица Н не имеет собственных значений на мнимой оси, и два подпространства в (3.2.2) являются взаимно дополняющими. Эти свой- ства далее определяются как свойства устойчи- вости и дополняемости [3]. Следующие результаты характеризуют свойства оператора Ric. матрица R либо положительно палуопределена, либо отрицательно палуопределена и пара (А, R) стабилизируема. Тогда Н е dom(Rfc). Свойство IL Допустим Н е dom(Jtic) и X е Ric(H). Тогда (а) X - эрмитова матрица, (б) X удовлетворяет следующему алгебраи- ческому уравнению Риккати: АХ + ХА + ЛЯАГ- 0 =0; (в) А + RX - устойчивая матрица. Свойство Ш. Допустим, что матрица Н имеет вид -ВВ’~ -А' пара (А, В) стабилизируема и гапк[А' 4->1 С] = п, Vco. Тогда Н е dom(Ric), X е Ric(H) £0 и Кег(А) е %, где х - устойчивое ненаблюдаемое подпространство. Если пара (С, А) наблюдае- ма, то Ric(H) > 0. Связь операторов сигая и Ric. Опреде- лим гамильтонову матрицу Н, соответствую- щую матрице G в (3.2.1) с устойчивой матри- цей А: Н: = Г A + S/r'D’C BR~lB' 1 [- C'(I - DDy'C - (А + Д/НЯ'С)']’ (3.2.3) ще R = I - D' D. Имеет место следующий результат. Пусть o(D) < 1, тогда эквивалентны ус- ловия: («) 1 (G - сжатие); (б) Н не имеет собственных .значений на мнимой оси; (в) Н е бош(Л’с); (г) Н е dom(Rrc) & Ric(H) £ 0 (Лс(Л) >0, если (С, А) наблюдаема). Поясним приведенный результат. Из равенства 3.2.2. СВОЙСТВА ОПЕРАТОРА Ric Свойство I. Попустим, что матрица Н не имеет собственных значений на мнимой оси, А 0 -В' i-G*c)(s) = -СС -А' СР (3.2.4) 1 /' 7 DC В' R
318 Глава 3.2. ПОДХОД ПРОСТРАНСТВА СОСТОЯНИЙ К ПРОБЛЕМЕ Я*-ОПТИМИЗАЦИИ непосредственно следует, что Н является Л-матрицей для передаточной матрицы (I - Сг’б)"1. Реализация (3.2.4) не имеет не- управляемых и ненаблюдаемых мод на мни- мой оси. Таким образом, Н не имеет -собст- венных значений на мнимой оси тоща и толь- ко тоща, коща (I - G*G)~l не имеет полюсов на мнимой оси, т.е. (I - G ’б)"1 € RE° (RL° - пространство рациональных функций из Е°). Отсюда для доказательства эквива- лентности (а) и (б) достаточно доказать, что Если IHL < 1 => I - <?(>)*G(Jg>) >0, Vco и, следовательно, (I - G *б)-1 € RL°. Если ЦбЦ^ £ 1 => о[б(/оо)] = 1 для некоторой со, и 1 - собственное значение матрицы б(/оо)*б(/оо), т.е. I - б(/оо) б(/оо)‘ сингулярна, откуда (а) (б)- Эквивалентность (б) и (в) следует из свойства II, а эквивалентность (в) и (г) следует из свойства I. Приведенные результаты являются осно- вой эффективных методов вычисления Я°-нормы системы G. 3.2.3. ПРОБЛЕМА ПОЛНОЙ ИНФОРМАЦИИ. ПРИНЦИП АЛГЕБРАИЧЕСКОЙ ДУАЛЬНОСТИ Рассмотрим две специальные системы, связанные с системой G. Gsr(s)‘ у~ Goi^)= с - Система G называется стабилизируемой, если существует регулятор F, такой, что замкнутая система F]{Gsf> F) устойчива. Необходимые и достаточные условия стабилизируемости G состоят в выполнении условий стабилизируе- мости систем Gsf и Gqi (в последнем случае существует регулятор L, такой, что система F^Gqi, L) устойчива). Свойство детектируе- мости системы G определяется из соображе- ний дуальности. Поясним данное утверждение подробнее, используя принцип алгебраической дуальности [5, 6]. Рассмотрим следующие диаграммы. Пра- вая диаграмма (рис. 3.2.1) получается из ле- вой путем замены матриц G и К, а также со- ответствующих им входов и выходов, на транспонированные. Нетрудно видеть, что РасЗЛ.1. Дужяыше структуры = IWy,K'} = TzV, л так- же что К стабилизирует G тоща и только то- ща, коща К' спбжлмэжрует G'. Говорят, что две заданные выше LFT (дробно-линейное преобразование - Ипеаг fractional transformation - £Р7)-структуры алгебраически дуальны и, в частности, G' и К' дуъпыпяе по отношению к G и К объекты. Таким образом: если некоторое свойство установлено для системы G, то оно может быть также установлено для системы G ' из принципа дуальности. Принцип алгеб- раической дуальности носит общий характер, по крайней мере, для случая линейной теории управления. 3.2.4. СПЕЦИАЛЬНЫЕ ПРОБЛЕМЫ Допустим, цию G(j) = ЧТО 1 А объект G и В1 в2 иеет реализа- , (3.2.5) С1 с2 Ai Аг А1 Аг. пара (Л, В?) стабилизируема, пара (Q, А) детектируема, реализация пространства со- стояний матрицы ЛГесть и является стабилизируемой и детектируемой. Рассмотрим следующие специальные проблемы, связанные с общей проблемой ста- билизации или проблемой обратной связи по выходу {output feedback - OF). Это будет про- блема полной информации {fitU information -FI), проблема прямой связи по возмущению {disturbance feedforward - DF), проблема полного управления {faU control - FC) и проблема оцени- вания выхода {output estimation - ОЕ). Соответ- ствующие этим проблемам объекты (специальные системы) имеют следующие реализации:
СПЕЦИАЛЬНЫЕ ПРОБЛЕМЫ 319 = Gm(s) = А A-BiC2 Bl B2 Fdf(s) - 0 0 I . Г I ] 0 Fol . L-aJ I L°J В этом случае Ьд =F№df, W>Df, Ъд\. gfc(s)= G _4 goe(s) = G A в, Ai Ai I о о I о 0 А B2 Ai i Ai ° Из определений непосредственно следует, что FI- и FC- (DF и ОЕ) системы алгебраически дуальны. Рассмотрим свойства LFT, объектами управления для которых являются специаль- ные системы. Допустим, что заданы две диа- граммы (рис. 3.2.2). Пусть, кроме того, пара (Д Bq) стабилизируема (гарантирует стабили- зируемость (7/т), пара (C2i А) детектируема (вместе со стабилизируемостью (Д В^ гаран- тирует стабилизируемость Gj)p). Эквивалентность F7- и PF-структур. Име- ет место следующий результат [6]: (1) Если матрица обратной связи Кт стабилизирует DF-структуру, то матрица Л может быть использована в качест- ве матрицы обратной связи для стабилизации FI-структуры. При этом F^Gdf, Кт) = НОи, KdACi Л)- (2) Допустим, что А - В\С2 устойчива. Для некоторой стабилизирующей матрицы об- ратной связи Kfi для FI-структуры стабилизи- рующий регулятор в виде обратной связи для Ответь F^Pm, Крй, где Если задан регулятор Кт для DF- струкгуры, то соответствующий 77-регулятор может быть получен из результата (1) с помо- щью выражения Кт\С2 I]. Используя резуль- тат (2), матрицу Кт можно представить в виде Кт = F^Pm> ^Df)[C2 Л- Из аналогич- ных рассуждений Ку/ = F^Pm* Af/)IG I]. Таким образом, выше по сути утверждается, что если матрица А - В\С2 устойчива, то FI- п. DF-проблемы эквивалентны в указанном выше смысле (данную эквивалентность можно назвать эквивалентностью по входу-выходу). Эквивалентность FC- и ОЕ'-структур. Рас- смотрим две диаграммы (рис. 3.2.3). Справед- лив следующий результат [6]: (1) Если матрица обратной связи Kqe стабилизирует ОЕ-структуру, то стабилизи- рующий FC-регулятор может быть выбран в виде матрицы ’А1 j КОЕ и справедливо равен- ство Fi(Gqe> Fqe) = Gpc, j *ое! • (2) Допустим, что А - В2С\ устойчива. Для некоторого стабилизирующего FC-регуля- тора Кус* стабилизирующий ОЕ-регулятор может быть выбран в виде ЩРоЕ* Крс), ^е Pqe(s) - А - В2С\ с2 м о о] Кроме того, выполняется равенство F^Gfc, Kfc) = FAGoe, FAPqe, Рве. 3.2.2. Эквивалентные FI- DFcrpynypu Рве. 3.23. Эквивалентные FC- О£-структуры
320 Глава 3.2. ПОДХОД ПРОСТРАНСТВА СОСТОЯНИЙ К ПРОБЛЕМЕ Н ’’-ОПТИМИЗАЦИИ а регуляторы Крс и Кое могут быть.представ- лены в виде К = Ft М, где КОЕ = РОЕ, ГМ I КОЕ a + b2f ° I1 -B2 M(s) = -F 0 0 I] 1 с I 0 0] что приводит к Принцип разделения. Временно положим D22 = 0- Поскольку (А, В2) стабилизируема (по определению), существует матрица F, та- кая, что матрица А + fyF устойчива. Матрица [Т7 0] является в то же время стабилизирую- щим //-регулятором. Пусть V. = и - Fxy (х - состояние системы и - управление). Тогда исходная система G распадается на две под- системы: Р и G^p, как показано на диаграмме (рис. 3.2.4), ще А 4- B2F 4- LC2 ~ L р,а = Г A + B2F Bi В2 <'-|ci+a2/Hai a2J устойчивая матрица и *1 В2 Gtmp(s) ~ -F 1с2 0 I ^21 0 > Несложно показать (см. [6, 9]), что регу- лятор К стабилизирует объект G тоща и толь- ко тоща, коща он стабилизирует объект G^p (система Р устойчива по определению). По- скольку Gpnp имеет структуру ОЕ-объекта, то найдется матрица L, такая, что матрица А + Последнее выражение задает структуру центрального регулятора, которая повторяется в различных вариантах постановки проблемы конструирования стабилизирующего регулято- ра с линейным объектом G [7]. Суммируя приведенные выше утвержде- ния и отбросив предположение о том, что D22 = 0, получим следующий результат [6]. Рассмотрим OF-проблему. Пусть матрицы F и L таковы, что матрицы А + В2Е А + + LC2 устойчивы. Тогда регулятор А 4- B2F 4- LC2 4" LD22F ~ F I 0 (3.2.6) стабилизирует заданный объект G. Покажем, что регулятор, задаваемый вы- ражением (3.2.6), удовлетворяет принципу разделения. Обозначим вектор состояния объ- екта G через х, а вектор состояния регулятора К через хк. Вектор состояния замкнутой сис- темы с передаточной функцией + LC2 устойчива. Тоща, в силу дуальности, регулятор L 0 регулятором для FC-проблемы, и требуемый регулятор для OF-проблемы задается выраже- нием Рвс.3.2.4. Представление системы G в виде двух подсистем является стабилизирующим T?w(s) - A -lc2 b2f A 4- B2F 4" LC2 Bx ~LD2i L c( DX2F Ai J есть x = X _хк _ Используя преобразование подобия х-> 1 Пс = X хк-X с т = ’I О' -I I > получим реализацию вида - a + b2f 0 b2f А 4- LC2 В1- »1 *А1 1 Cl- т>12/ 7 d12f Ai J Таким образом, замкнутая система разде- лилась на две устойчивые подсистемы, и син-
РЕШЕНИЕ ОБЩЕЙ ПРОБЛЕМЫ Я “-ОПТИМИЗАЦИИ 321 тез регулятора для OF-проблемы может быть сведен к решению двух независимых проблем: FI- и FC-проблемы. Структура регулятора (3.2.6) не изменит- ся, если помимо решения проблемы стабили- зации он должен доставлять минимум функ- ционалу типа Я2-нормы передаточной функ- ции замкнутой системы [7]. При этом в (3.2.6) изменятся только матрицы F и L. В И2-случае их следует заменить на матрицы F} и £2» ко- торые могут быть выражены в терминах поло- жительно полуопределенных, симметричных решений пары управлений Риккати Х2, ¥2, соответствующих реализации объекта ' A Bl B2 <?(*) = Cl Ai A2 , c2 Ai A2. т.е. F2 = -В2Х2', L2 = “KjCJ. Данное свой- ство инвариантности структуры регулятора в линейном случае распространяется на другие проблемы оптимизации, такие, как Н°- проблема [8]. Этот факт вместе с рассмотрен- ными выше структурными свойствами линей- ных систем используется для решения общей проблемы Н° -оптимизации. 3.2.5 РЕШЕНИЕ ОБЩЕЙ ПРОБЛЕМЫ Н “-ОПТИМИЗАЦИИ Условия разрешимости проблемы №°- оптимизации [9]: (1) Допустимый регулятор К», такой, что 11^1 < 7 > существует тогда и только то- гда, когда выполнены следующие условия: (а) Я„:=[ Л У-2^{-В2В^ - C[Ct -А' Н» е dom(Jtic) <£ Х> ж £ 0; j -[ А’ у'2с^-ас2 (б) ~Л J’ Л» е dom(F/c) & К» я Я/с(Л») £ 0; (в) р(Х> К») < у2. (2) Если условия части (/) выполнены, то центральный Н°-регулятор задается формулой *«>(*) = А+у + ZaoLaoC2 - ZaoLao Fa^ 0 (3.2.7) ще F^-BiX», Za: = (l • Поясним смысл приведенных выше ус- ловий. Заметим, что (1. а) есть необходимое и достаточное условие разрешимости FZ-проб- лемы, а (1.6) есть необходимое и достаточное условие разрешимости FC-проблемы. Для того чтобы уяснить смысл условий разрешимости проблемы //“-оптимизации, приведем некоторые предварительные резуль- таты. Параметризация множества всех решений //-проблемы. Все решения Fl-проблемы зада- ются следующими условиями [10]: (1) Допустимый регулятор K(s), такой, что < Y » существует тогда и только тогда, когда НЛ е dom(Fj'c) и £ 0. (2) Если условия части (1) выполняются, то все допустимые регуляторы параметризуют- ся следующим выражением: KFI = FLMn, Q), где MFJ(s) = А + ^Foo 0 -1 0 [0 А] И» о] I -y-2BiXa F„=-BiXa>, Q=[Qi Q2]<eRH“, K?2L<y Аналогичные результаты справедливы для наиболее простой из специальных проблем - проблемы обратной связи по состоянию (state feedback - SF). В этом случае объект управле- ния имеет реализацию вида A Bi Gsf(s)= A Ai в2 Dn 0 I 0 II Зак 1023
322 Глава 3.2. ПОДХОД ПРОСТРАНСТВА СОСТОЯНИЙ К ПРОБЛЕМЕ И "-ОПТИМИЗАЦИИ При тех же предположениях, что и в случае FZ-проблемы, множество всех допусти- мых регуляторов, удовлетворяющих условию ll^wIL < 7 > в этоь< слУчае может быть пара- метризовано в виде Ksf = FIMsf, С), где MSF(s) = А + у + ^2-^co 0 -®2 = о Fw I -I I о РнсЗ.2.5. Параметрнзацвн множества всех РЕрмуляторов Рвс.3.2.6. Параметрнзацвя множества всех ОЕ-регулягоров Q G ЛЯ° и + B2Fa В данном случае центральный регулятор имеет вид K°SF = Fa = -BiXa. Параметризация множества всех решений PF-проблемы. Ранее было показано, что FI- проблема эквивалентна PF-проблеме для слу- чая проблемы стабилизации (см. разд. 3.2.4). Данный факт справедлив и в случае проблемы /Г-опгимизации. Пусть имеется регулятор KFF тогда регу- лятор Kj)F может быть получен из выражения MDr(s) = KDF= F^Pj)Fi KFfr, ?df(s) = Поскольку центральный FZ-регулятор является статическим, т.е. KFj = [Fw о], то центральный PF-регулятор имеет реализацию А ~ ^1^*2 + Bi rv ’ K*DF(s) Необходимыми и достаточными усло- виями существования PF-регулятора будут Я» е dom(Fic) & X» = £ 0, а мно- жество всех PF-регуляторов задается диаграм- мой (рис. 3.2.5), где А + 2?2-^со “ -®1^2 FK Bi О I *2 I 0 Параметризация множества всех решений ОЕ-проблемы. Поскольку ОЕ-проблема дуаль- на PF-проблеме, то можно выписать множе- ство всех ОЕ-регуляторов, которое задается диаграммой (рис. 3.2.6), где M0E(s) = Л — + ВтС2 С1 С2 -Вг-<Г'Т& о I I о С = ЛЯ“, |0|„<у. Центральный ОЕ-регулятор при этом имеет реализацию вида а необходимыми и достаточными условиями существования допустимого ОЕ-регулятора будут Л> е dom(Fic) & К = Лгс(Л>) £ 0. Эквивалентность систем и по /Г- норме. Проведем замену переменных в OF- проблеме г =.w - у~2В{Хтх, v = и + В$Хюх . Рассмотрим две диаграммы (рис. 3.2.7), где
РЕШЕНИЕ ОБЩЕЙ ПРОБЛЕМЫ Я “-ОПТИМИЗАЦИИ 323 РнсЛ.2.7. Системы с равными Я*-нормамм A + i^BtB^ *1 Jl -F„ 0 I . С2 ^21 0 (3.2.8) Справедлив следующий результат [9]: предположим, что матрица X» = RicfHao) £ О существует; К - допустимый регулятор для объекта G и < 7 тогда и только то- гда, когда К - допустимый регулятор для объек- Gan, и H^w-IL <1 • Условия устойчивости и детектируемости объекта G—p. Определим гамильтонову мат- рицу, соответствующую объекту G^p Jfmp ~ 4тр y-2FiFK-CiC2 “ ^tmp rjifi Atnpi = A + у 2BlB[X00. Тоща справедлив следующий результат [9]: (а) если Ню € dom(JWc), то матрица Afap + B^Fao устойчива; (б) если Jfnp е dom(&c) & Y^ = = Ric^J^ £ 0, то пара ((?2> Д>яр) детекти- руема. Центральный ОЛрегулягор. Покажем, используя результаты п. 3.2.5, что условия разрешимости OF-проблемы являются необ- ходимыми и достаточными. Достаточность. Структура системы Gfmp аналогична структуре Gqe, причем имеет место соответствие А -> А^ В\ -> By В} —> By —► В*» C*2 ~► Cy D —► 2), Yoo -> Ytmp, Lao -> Yt/npC'2- Отсюда имеем ^tmp “ ^F^ + YYtmpCi т т Допустим условия разрешимости про- блемы ZT-оптимизации выполнены. Восполь- зуемся преобразованием подобия I -г’2Х» 0 I U Тоща T’xJtmpT Lo и XiJtjnp) TX(Joo) = Ytmp = RicUtnp) = Ko(I - y2X>Ko)-1 = ZooYao и p(X>Ko) < у2 означает, что Y^p £ 0. По усло- виям устойчивости и детектируемости объекта GtmpKtmp - допустимый ОЯ-регулятор, а по результату эквивалентности систем и ТУГ по №°-норме Ktmp есть в точности ® -регу- лятор, т.е. г® = Л + у 2BiB{XK + Д2Л0 + F„ ~Z„L, 0 Необходимость. Заметим, что если К - допустимый //“-регулятор, такой что l^loo < то У0710®* 1^ разрешимости про- блемы //“-оптимизации (1), (2) (см. выше) выполняются [9]. По результату эквивалентно- сти систем и Tvr по //“-норме, поскольку Ktnip стабилизирует G^ и ИТ^ < у, то Kfmp стабилизирует Gh < у . Параметризация множества всех OF- регуляторов задается диаграммой (рис. 3.2.8), Рис.3.2.8. Параметризация множества всех {ДО-регуляторов
324 Глава 3.3. ПРОБЛЕМА РОБАСТНОЙ СТАБИЛИЗАЦИИ А + у + ^2-^со + -ZaLx Ло 0 I ~С2 I 0 Глава 3.3 ПРОБЛЕМА РОБАСТНОЙ СТАБИЛИЗАЦИИ Во многих проблемах конструирования регуляторов объекты управления содержат неопределенности. Предполагается, что поня- тие неопределенности интуитивно понятно. Проблемы конструирования с неопределенно- стями рассматриваются в рамках робастной теории управления. Одной из важных частных проблем теории робастного управления явля- ется проблема робастной стабилизации, в ко- торой требуется найти ретулятор в виде обрат- ной связи, обеспечивающий устойчивость замкнутой системы при наличии неопределен- ностей в объекте управления. Если неопреде- ленности относятся к классу неструктуриро- ванных (представимых в виде немоделируемой динамики), то проблема робастной стабилиза- ции в точности эквивалентна проблеме Н°- оптимизации. К такому типу неопределенно- стей, помимо немоделируемой (отброшенной) динамики, относятся резонансы, временные запаздывания, нелинейности и т.п. 3.3.1. НЕСТРУКТУРИРОВАННЫЕ НЕОПРЕДЕЛЕННОСТИ Пусть G и бд -передаточные функции соответственно номинального и возмущенного (с учетом неопределенностей) объектов. Разли- чают следующие типы неструктурированных неопределенностей. 1. Аддитавная неопределенность представ- ляется выражением Сд=6 + Дл, |дл|в<е. 2. Мультипликативная (пропорциональная) неопределенность представляется выражением Ga=(i + Ap)g, |др||и < е. Для описания третьего типа неопреде- ленностей потребуются некоторые сведения из теории факторизации Видьясагара [11]. 3. Взаимно простые факторизации. Допус- тим матрицы М, N е RH™ и имеют одина- ковое число строк. Матрицы М и N назы- ваются левыми взаимно простыми тогда и толь- ко тогда, когда существует пара U, V е RH°t такая что MV - NU = I. Пара [n. Л/j, где М, N е RH™ составляет левую взаимно про- стую факторизацию (Left Coprime Factorization- LCF) матрицы Ge R, где R - множество ве- щественных рациональных матриц, тогда и только тогда, когда: (а) М - квадратная, det( М ) * 0; (б) G = M~lN ; (в) N и М - левые взаимно простые. Важным преимуществом теории факторизации Видьясагара является возможность представле- ния неустойчивой передаточной матрицы G в виде произведения двух передаточных матриц M-',N. Квадратная, обратимая передаточная матрица U, такая что U, е RH°, называ- ется единицей в RH°. LCF (n, Л/j матрицы G е R единственна с точностью до левого умножения на единицу в RH*. 4. Неопределенность взаимно простых факторов. Пусть пара (n, м} составляет LCF матрицы (7, тогда матрица [Адг, Ад/], такая, что || [A , представляет неопределенность взаимно простых факторов, если (7д =(ЛГ + Ajj/) (n + &n). 5. Стандартное представление неструкту- рированных неопределенностей. Пусть М - пе- редаточная матрица, разделенная на блоки следующим образом: м2 ы |_ЛУ21 ^«22j Верхнее дробно-линейное преобразование задается выражением FU(M, А) = М22 + Л/21А(1 ~ Л/цА)_^Л/12 при условии, что det(I - Л/цА) * 0, А - мат- рица с размерностью, совместимой с разбив- кой матрицы М на блоки. Покажем, что для неопределенностей 1 - 4 передаточная функция возмущенного объекта представима в виде верхнего LFT, т.е. бд = FU(P, А), где Р - стандартный объект.
ПАРАМЕТРИЗАЦИЯ МНОЖЕНСТВА РЕГУЛЯТОРОВ В НОРМАЛИЗОВАННОЙ ПРОБЛЕМЕ 325 Стандартный объект всеща содержит но- минальный объект и определяется следующим образом: 1) аддитивная неопределенность Ai рп 0_ I _Г G А = Ал ; 1Л1 L 2) мультипликативная неопределенность п ГА1 Аг] 0_ I G л = лр; ’ 1ЛГР£] ’ . 3) неопределенность взаимно простых факторов Ai __ 1лГР£Г Рп _ 0 I G 1 G А = [Ааг-дл/]. Во всех случаях номинальный объект за- дается выражением G = FU(P, 0). 3.3.2. КРИТЕРИЙ РОБАСТНОЙ УСТОЙЧИВОСТИ Для формулировки критерия робастной устойчивости при наличии неструктурирован- ных неопределенностей определим класс до- пустимых неопределенностей. Допустимой называется неопределенность А, такая, что А € Д, ще De = D$t и Duz > |А: A € RHX, ||д|л < e}; Dut:= Д g RC, п[Ги(Р, О)] = = п[А<(Л А)]. Н» < e}, ще i](«) - число полюсов в замкнутой правой полуплоскости. Множество Ds содержит устойчивые ограниченные неопределенности, а множество D[f^ содержит ограниченные, но не обязатель- но устойчивые неопределенности. Критерий робастной устойчивости фор- мулируется следующим образом [11]: Регуля- тор К стабилизирует множество объектов FU(P, A), VA € D* и некоторого стандартного объекта Р тогда и только тогда, когда: (1) К стабилизирует номинальный объект FU(P, 0); W 5 8‘*’ В (1) под устойчивостью понимается внутренняя устойчивость. 3.3.3. ЭКВИВАЛЕНТНОСТЬ ПРОБЛЕМ РОБАСТНОЙ СТАБИЛИЗАЦИИ И ^-ОПТИМИЗАЦИИ Из условий критерия робастной устойчи- вости непосредственно следует, что для любого типа неструктурированных неопределенностей проблема робастной стабилизации в точности эквивалентна проблеме //“-оптимизации с уровнем толерантности у = 8"1. 3.3.4. НОРМАЛИЗОВАННАЯ ПРОБЛЕМА РОБАСТНОЙ СТАБИЛИЗАЦИИ Пусть м} - LCF номинального объекта G и факторы N, М удовлетворяют дополнительному условию АГАТ* + ММ* =1. (3.3.1) Тоща LCF [Й, М] ной. Если G(s) = называется нормализован- - минимальная реализация номинального объекта, то матрица [АГ, М] (s) имеет реализацию [11] ще R = I + DD'; L = -(УС + BD')Rrl; Y- единственное положительно определенное решение уравнения Риккати (А - BS-iD'C)Y+ Y(A - BS-'D'C)' - - YC'R-'CY+BS-lB' =0, 5 = 1 + D'D. Проблема робастной стабилизации с не- определенностью 4 (см. п. 3.3.1) для случая, коща пара Мj удовлетворяет условию (3.3.1), называется нормализованной. 3.3.5. ПАРАМЕТРИЗАЦИЯ МНОЖЕСТВА РЕГУЛЯТОРОВ В НОРМАЛИЗОВАННОЙ ПРОБЛЕМЕ РОБАСТНОЙ СТАБИЛИЗАЦИИ Используя стандартное представление неопределенностей взаимно простых факторов (см. п. 3.3.1), можно показать, что передаточ-
326 Глава 3.3. ПРОБЛЕМА РОБАСТНОЙ СТАБИЛИЗАЦИИ ная функция FU(P, К) замкнутой системы в нормализованной проблеме робастной стаби- лизации имеет вид FU(P,K) = к(1-оку1м-х (т-вку'м-1 Несложно видеть, что решение нормали- зованной проблемы робастной стабилизации эквивалентно решению следующей проблемы //"-оптимизации: Справедлив следующий результат [11]: 1) Допустимый регулятор К, удовлетво- ряющий неравенству ное сингулярное значение) матрицы (У, М) . 3) Максимальный запас робастной устой- чивости задается выражением Перепишем выражение (3.3.2) в виде |A + dw<a, (3.3.3) обозначив В (3.3.3) R - заданная антиустойчивая матрица (по определению факторы N и М устойчивы); Q - неизвестная устойчивая мат- рица. Проблема, задаваемая выражением (3.3.3), называется проблемой продолжения Не- хари [3, 11]. В случае, когда a > ||и*|^., мо- жет быть получена следующая параметризация всех решений проблемы Нехари [11]: Q = Я|йФ], существует тогда и только тогда, когда К = = UF\ U,VeRH°u 2) Оптимальные решения нормализованной проблемы робастной стабилизации задаются выражением ще хц{Ф] - дробно-линейное преобразование вида хц{Ф] = (И-уФ + (И^Ф + + де1(И*21Ф ^22) * 0, матрица при этом может быть выражена через матрицу R, Ф е RH“, < 1. Если воспользоваться данным результатом для случая нормализован- ной проблемы робастной стабилизации, то все допустимые регуляторы, такие, что И(* * V, ганкелева норма (максималь- можно представить выражением где .^21 ^22. -Sq-'w.-'yc'R-K Q~XD'R~K - - ---Т*---
ПРОЦЕДУРА ГЛОВЕРА-ДОЙЛА 327 С= (У2 - 2)1/2; ^ = [1+ (*Г-У21)Г; 'А В' Фе/НГ; |<1£ £1; 67 = [^j; S = I + D'D; F = -S-ЦВ'Х + D'Q; А = A + BF, X > 0 - решение уравнения Риккати (A-BS-WCyX + X^A-BS-WC) - - XBS^B'X + C'R'XC = Q\ Y > 0 - решение уравнения Риккати (Л - BS^D'C)Y + Y(A - BS^D'C? - - YC'R^CY + BS^B* = Ъ. Положив Ф = 0 (предполагается также, что D - 0), получим центральный ретулятор = wnw£ с реализацией „ [а + BF + у fy-'YC'C у 21К-1ГС'' А. л — _________1___________1____ . Рпс.3.4.1. Стандартная проблема: Z е , у е , w е Л'4', и е R”*2, х е Rn, /Я] £ Р2, р\ £ (ЛЗ) О|2 = (Л2) rank(Z>12) = m2f rank(/>2i) = Рг- m2 x (pi - m2) ’° I .1/Я2. Ai = L J И х к - Рг) разделена на блоки Глава 3.4 АЛГОРИТМЫ Я°-ОПТИМИЗАЦИИ Алгоритмы //“-оптимизации являются. по сути модификацией алгоритмов Н2- оптимизации, используемых в теории Винера- Хопфа-Калмана. Их можно подразделить на алгоритмы верхнего и нижнего уровней. Среди последних наиболее важное место занимают алгоритмы, связанные с алгебраической про- блемой собственных значений, поскольку к указанной проблеме сводится решение алгеб- раического уравнения Риккати, а пару уравне- ний Риккати необходимо решать на каждом шаге процедуры //“-оптимизации. Предпола- гается, что алгоритмы решения уравнения Риккати, в частности алгоритмы Шура, хоро- шо известны, поэтому основное внимание далее уделяется алгоритмам верхнего уровня. ^21 = Р2 Аш Ain Лц21 А122. конформно с />12 и Z>2i. А - jnl I Cl (Л4) rank А = п + ту. A2J Vco с R. (Л5) rank А - Jal I с2 А] Л =Л + ^2, D2\ J Vco g R. Введем обозначения: v2/ 0 /?:= />{•/>!• - где />!.:= [2>ц, /)12]; R:=D^D^ - V2 / 7 2 А 0 3.4.1. ПРОЦЕДУРА ГЛОВЕРА-ДОЙЛА Пусть задан стационарный объект реализацией G(i)= С1 А Ai С2 А1 В2 Аг ^22 П*е Аь= р11 • LAiJ Определим две гамильтоновы матрицы: Замкнутая система с передаточной функцией Fffi, К) описывается диаграммой (рис. 3.4.1). Предполагаются выполненными следую- щие допущения: (А1) пара (Л, By) стабилизируема, пара (С2, А) детектируема. -С{СХ -АА В -Ci А.. я-Ча'.а.Л'], о о о о G с о о о 0 - B]Dli С
328 Глава 3.4. АЛГОРИТМЫ Яв-ОПТИМИЗАЦИИ Определим решения пары уравнений Риккати Х>, К, (в предположении, что они существуют) = Ric(IL>) > 0; К» = А/с(Л>) > > 0, а также коэффициенты усиления ^12 = -А-,[Л(.С1+В'Ха,]; Я = [ЯП Я12 Я2] = [в1л;1 + Ya>C']R~l, где F и И разделены конформно соответствен- но с Л{. и . Условия существования допустимого peiy- лягора. Для системы G, удовлетворяющей допущениям (А1) - (Л5), допустимый регулятор К, такой, что ||/}(G, < у, у > = = inf||F/(G, А)|| существует тогда и только К тогда, когда: (а) у > yi, У! =тах(а[Л111ь ЛП12], ®[А111. А'ш] J ; (б) существуют Ха = Лс(Но) > 0, Ко = = Ric(Joo) £ 0, такие, что р(Х> К>) < у2. Параметризация множества всех допусти- мых ретулягоров Если условия (а), (б) предыдущего пункта выполняются, то все допустимые К задаются выражением К = //(А^Ф), где А Ka(s) = А С2 а Ai Ai А Аг о ФеЯЯ“хй, ЦФ^у, Al = ~Ai2iAhi(y2^ - АшАш) х х А112 “ А122> Д2 вЯ'"2*'"2, - некоторые матрицы, удовлетворяющие разло- жению Холесского А2А2 = 1 ~ A121(y2^“ AlllA'lll) ^{121, А1А1 = AiiiA'111) А112» B2 = (B2 12)^12 > C2 = -Л21(С2 + /hJZoo, A = -H2 + B2D^Dn, A = F2ZX + A 1A/A > A = A + НС + B2 Аз^А , ze=(z-f44j‘‘ Приведенные выше результаты носят конструктивный характер, т.е. на их основе может быть построена процедура вычисления множества допустимых Н° - регуляторов, кото- рая называется процедурой Гловера-Дойла [11]. Квадратично сходящийся алгоритм верхнего уровня, реализующий процедуру Гловера- Дойла, состоит из следующих шагов: 1. выбрать число у, удовлетворяющее ус- ловию (а), т.е. у > у/; 2. проверить, что для выбранного у су- ществует Х>, Ко, удовлетворяющие условиям (б): если условия (б) выполняются, положить уи = у и у = 1 ; если условия (б) не выполняются, ПОЛОЖИТЬ У/ = У, у = 2у и по- вторить шаг 2; 3. для полученного у проверить выпол- нение условий (б); если условия (б) выполня- У/ + ются, положить уи = у и у = и если Уи ~ У > е, повторить шаг 3; если условия (б) не выполняются, положить у/ = у и у = 1 и повторить шаг 3. 4. пусть у^ = уи - оценка у^ с тре- буемой точностью е; вычислить Ка. ЗАЛ. БЕЗЫТЕРАЦИОННЫЙ ВАРИАНТ ПРОЦЕДУРЫ ГЛОВЕРА-ДОЙЛА Для упрощения выкладок положим, что реализация номинального объекта G имеет вид В 6(5) = А_ С , тогда реализация стандарт- ного объекта в нормализованной проблеме робастной стабилизации имеет вид
СПИСОК ЛИТЕРАТУРЫ 329 Р(5) = где L = -УС". В соответствии с процедурой Гловера-Дойла из п. 3.4.1 необходимо найти два положительно полуопределенных решения пары уравнений Риккати Хо[Л + (1 - у2)-1£С| + + [А + (1 - у2)-1£еГХ> . Х>[(1 . у2)-1££' + + ВВ)ХО - у2(1 - у2)“1С'С=0, Ко(Л + LC? + (A+LC]Y<>- Y^C'C Ко =0. Из двух последних уравнений непосред- ственно следует, что Х> = -у2У'Х, Ко = 0, где Y - решение уравнения Риккати из п. 3.3.4, а X - решение уравнения Риккати (А - BS-'D' С) 'Х + Х(А - BS-'D C) - - XBS-1 В' Х + CRr*C = b R = I + DD’. Из условия (а) п. 3.4.1 следует, что у > 1. (3.4.1) Поскольку Ко = 0, ТО р(Х>Ко) = 0. Условие X* > 0 обеспечивается, если -У2^')"1^ >0, откуда у2(1 + *Г-у21)-^0. Из условия X > 0 имеем Y2 > 1 + XmaxGW- (3.4.2) Комбинируя (3.4.1) и (3.4.2) получаем Ymin = 1 + ^тахС^Э* Таким образом, Ущ^ вычисляется точно с использованием одношагового алгоритма верхнего уровня. Матрицы коэффициентов усиления из п. 3.4.1. в случае нормализован- ной проблемы робастной стабилизации имеют вид Г-с(1 + гаг)‘ [г2Л'ХИ'Г1]’ L = [О 0-ГС']. При этом центральный регулятор, полу- чаемый из безытерационного варианта проце- дуры Гловера-Дойла, имеет вид „ . . Гл + LC +i2BB’XW^ \ - L *"<>[—I ° Г Воспользовавшись преобразованием по- добия с матрицей Т = у2^”1, получим цен- тральный регулятор из п. 3.3.5 Го(*) = A + BF + ^W^YC'C 4ZW^YC'' F 0 ’ Заключительные замечания. Благодаря ис- следованиям последних лет методы //“-опти- мизации распространены на классы дискрет- ных [12], нестационарных [13] и нелинейных [14] систем. Удалось также построить вариант //“-теории управления для случая, когда внешний вход принадлежит классу случайных процессов [15]. Созданные на основе Н°- методологии программные продукты позволя- ют говорить о реальной возможности ее вне- дрения в инженерные приложения [16]. Таким образом, можно констатировать, что в сово- купности с методами Н 2-оптимизации, методы /Г-оптимизации составляют основу для реше- ния многих классов проблем конструирования систем управления сложными техническими системами. Повсеместное внедрение указан- ных методов позволит создавать более совер- шенные образцы перспективных технических систем. СПИСОК ЛИТЕРАТУРЫ 1. Zames G. Feedback and optimal sensi- tivity: model reference transformations, weighted seminorms, and approximate inverses // IEEE Auto. Control. 1981. V. 26. P. 301 - 320. 2. Себряков Г. Г., Семенов А. В. Проек- тирование линейных стационарных многомер- ных систем на основе вход-выходных отобра- жений. Методы Н°-теории управления // Изв. АН СССР. Техническая кибернетика. 1989. № 2. С. 3 - 16. 3. Francis В. A. A course in ff° control theory // LNCIS. 1987. V. .88. 4. Glover K., Doyle J. C. State-space ap- proach to H° optimal control // LNCIS. 1989. V. 135. P. 179 - 218. 5. Калман P., Фалб П., Арбиб M. Очерки по математической теории систем. М: Мир, 1971.
330 СПИСОК ЛИТЕРАТУРЫ 6. Lu W. М., Zhou К., Doyle J. G Stabili- zation of LFT systems I I Proc. 30 th CDC, Brighton, Engl., Dec. 1991. P. 1227 - 1232. 7. Себржов Г. Г., Семенов А В., Фурле- тов М. Ю. и др. Принцип обратной связи в линейной теории управления: перспективы единой теории обратной связи Ц Тезисы 1-го Совещания "Новые направления в теории систем с обратной связью", Уфа, 30 мая - 2 июня, 1993. Уфа: УГАЕУ. 1993. С. 17 - 19. 8. Семенов АВ., Фурлетов М. Ю., Меще- ржов О. Г., Морзеев Ю. В. Структурные свой- ства линейных законов обратной связи // Те- зисы докладов 1-го Совещания "Новые на- правления в теории систем с обратной свя- зью", Уфа, 30 мая - 2июня 1993. Уфа: УГАТУ. 1993. С. 73 - 74. 9. Doyle J. С, Glover К., Khatgonekar Р. Р., FYands В. A State-space solutions to standard Я2 and №° control problems // IEEE Trans. Auto. Control. 1989. V. 34. № 8. 10. Zhou K. On the parametrization of H° controllers // IEEE Trans. Auto. Control. 1992. V. 37. № 9. 11. McFarlane D. G, Glover K. Rubust controller design using normalized coprime factor plant descriptions // LNCIS. 1989. V. 138. 12. Iglesias P. A, Glover K. State-space ap- proach to discrete-time №° control II Int. J. Control. 1991. V. 54. № 5. 13. Ravi R, Nagpal К. M., Khargonekar P. P. №° control of linear time-varying systems: a state- space approach // SIAM J. Contr. Optimization. 1991. V. 29. № 6. 14. Ball J. A, Helton J. W., Walker M. L. №° control for nonlinear systems with output feedback // IEEE Trans. Auto. Control. 1993. V. 38. № 4. 15. Semyonov A V., Vladimirov I. G., Kurd- jukov A P. Stochastic approach to №°-optimi- zation // Proc. 33rd IEEE CDC, Lake Buena Vista, FL, USA, Dec. 1994. V. 3. P. 2249 - 2250. 16. Glover K. Progress in applied robust control. Trends control. A european perspective / A. Isidori (ed.). Roma: Springer, 1995. P. 141 - 150.
Раздел 4 ОБРАТНЫЕ ЗАДАЧИ ДИНАМИКИ В ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Глава 4.1 СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ МЕТОДОМ ОБРАТНЫХ ЗАДАЧ ДИНАМИКИ 4.1.1. СИММЕТРИЯ В СИСТЕМАХ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ И МЕТОД ОБРАТНЫХ ЗАДАЧ ДИНАМИКИ Свойства симметрии в теории систем ав- томатического управления можно установить, рассматривая задачу осуществления назначен- ной траектории движения системы, модель которой задана уравнением [1] = р = ^ л-1 (4.1.1) к=0 ще х(/) - выходная переменная; u(f) - управ- ляющая функция; b известны. Далее при- нимаем ап — 1. Для системы (4.1.1) рассмотрим задачу об осуществлении назначенной траектории движения. Сформулируем ее следующим обра- зом. В начальный момент времени t = 0 со- стояние системы характеризуется значениями Х(О) = Х0, *(°) = *01,-,*"'*(0) = *0л-1- (4.1.2) Построим такое управление и*, при ко- тором движение системы из точки (4.1.2) про- ходит по траектории, определяемой равенст- вом х(/) = 0 £ t < Т1<х>. (4.1.3) Предполагаем при этом, что х*(/) как функция времени дифференцируема необхо- димое число раз. В таком случае искомое управление «*(/) = (4.1.4) Отсюда следует, что искомая управляю- щая функция может быть найдена в результате выполнения конечного числа операций: диф- ференцирования, умножения, сложения и др. На основании соотношения (4.1.4) мож- но сформулировать общие положения, в соот- ветствии с которыми следует строить управле- ние, реализующее назначенную траекторию. Рассмотрим структурные схемы модели управ- ляемого объекта и алгоритма формирования управляющей функции согласно (4.1.4). Соот- ветствующие схемы представлены на рис. 4.1.1 для случая п = 2. Операции, составляющие содержание алгоритма формирования управляющей функ- ции, обратны соответствующим операциям, составляющим содержание математической модели управляемого объекта: интегрированию в математической модели соответствует диф- ференцирование в алгоритме, вычитанию со- ответствует суммирование, коэффициенту Ь интенсивности управления отвечает обратная величина /г1. Наконец, входная х* и выходная I/* переменные структурной схемы алгоритма представляют собой соответствующие обра- щенные переменные х, и математической мо- S) Рве. 4.1.1. Структурные схемы моделн объекта (а) алгоритма (б)
332 Глава 4.1. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ Рве. 4.1.2. Схема прямого соединения алгоритма управления и модели объекта Рис. 4.1.3. Схема обратного соединения алгоритма управления и модели объекта дели объекта. Каждая из структурных схем может быть получена одна из другой в резуль- тате обращения операций и соответствующих переменных. На рис. 4.1.2 приведена общая структур- ная схема системы, Входной переменной явля- ется назначенная функция х*(/). Выходом системы является фактическая переменная х(/). Можно выполнить обращение соответст- вующих операций, а также обратить перемен- ные х*(0 и *(0> tow общая схема системы не изменится. Поменяется лишь направленность схемы: вход системы станет ее выходом и на- оборот (рис. 4.1.3). Таким образом, можно сформулировать следующее положение: алгоритм нормирова- ния управляющей функции строится по прин- ципу симметрии структуры и обращения опе- раций по отношению к структуре и группе операций, соответствующих математической модели управляемого процесса. Следователь- но, свойства симметрии, присущие объекту и системе управления, однозначно определяют структуру и параметры алгоритма формирова- ния управляющей функции: для назначенной траектории движения х*(/) структура и пара- метры алгоритма управления вполне опреде- ляются структурой и параметрами математиче- ской модели объекта. Это положение составляет методическую основу для построения алгоритмов управления движением динамических систем. При этом, по сути дела, задача конструирования алго- ритма управления представляется как обратная задача динамики: требуется найти такую управляющую функцию (силу) w*, которая реализует предписанную траекторию движения х*. 4.1.2. СХЕМА СИНТЕЗА УПРАВЛЕНИЙ МЕТОДОМ ОБРАТНЫХ ЗАДАЧ ДИНАМИКИ На основе концепций обратных задач динамики оказывается возможным синтезиро- вать такие алгоритмы управления, которые обеспечивают системе наперед заданные дина- мические свойства. Схема синтеза алгоритмов заключается в следующем. Предписанную тра- екторию определим равенством п *’(/) = £<^(0, (4.1.5) V=1 где cv - постоянные величины, выбор которых производится из условия, чтобы траектория х*(|) начиналась в точке, соответствующей начальному состоянию системы; T]V(Z) - из- вестные функции времени. В результате подстановки выражения (4.1.5) в (4.1.4) получаем п u'(t) = b~l c1^altni*)+•••+ к=0 п k=Q (4.1.6) что соответствует программному управлению. Практическая ценность программных управлений состоит в том, что на их основе синтезируются законы управления с обратной связью. Для этого необходимо выразить функ- ции времени cvT)v*40 через измеряемые
СХЕМА СИНТЕЗА УПРАВЛЕНИЙ МЕТОДОМ ОБРАТНЫХ ЗАДАЧ ДИНАМИКИ 333 переменные состояния управляемого объекта. Такая задача легко разрешима, если в качестве функций T|v(0 в (4.1.5) принимать такие функции, для которых выполняются равенства d Л у (0 _ (f\ v _ 1 9 п — Pvfc4vv/, v — 1,2,...,п. (4.1.7) Сомножители р^ в (4.1.7) могут быть либо постоянными, либо функциями времени. Пусть T|v(0 в (4.1.5) обладают свойствами (4.1.7). Тогда программное управление (4.1.6) принимает вид п «*(0 = *’1Xl'vCv4v(0. <4-1.8) V=1 где коэффициенты к=0 *=0 Пользуясь программным управлением (4.1.8), построим закон управления с обратной связью. Для этого выразим функции cvT]v через переменные, характеризующие состояние сис- темы. Пусть такими переменными являются х(и)(/), Ц = 0, 1, ..., л - 1. Тогда из условия x*(f) = x(f) из (4.1.5) получаем следующие равенства п ^Cv4v(0 = x(f); V=1 (4.1.9) £ W,(0 = j = 1,2,...,n - 1. V=1 Рассматривая (4.1.9) как систему уравне- ний относительно cvT]v и решая ее, находим л-1 £vnv (0 = £ (0, v = 1,2,..., л. ц=0 (4.1.10) Здесь rVil - постоянные числа либо функции времени, однозначно определяемые в процессе выполнения соответствующих преобразований. Подстановка найденных выражений (4.1.10) в (4.1.8) разрешает задачу построения закона управления с обратной связью. Выполняя та- кую подстановку, можно найти л-1 и*(х,х,...,хп~1\ = F1 РцХ^ (0, ц=0 (4.1.11) где параметры закона управления л Рр =^Yvrv(1’ Ц = 0.1.—.Л-1- (4.1.12) V=1 Таким образом, назначенная траектория движения, заданная в виде равенства (4.1.5), реализуется управлением (4.4.11). Управление получено в замкнутой форме; иначе говоря, коэффициенты (4.1.12) закона управления явно выражаются через параметры математи- ческой модели объекта. В зависимости от вида функций cvT]v(/), а также от граничных условий, назначаемых на правом конце траектории, в рамках рассмат- риваемых идей могут быть синтезированы алгоритмы терминального управления, алго- ритмы стабилизации относительно заданных траекторий и др. При этом можно синтезиро- вать как стационарные, так и нестационарные алгоритмы. Изложим схему синтеза алгоритма управления, при котором замкнутая система асимптотически устойчива и обладает задан- ным спектром. В качестве математической модели управляемого объекта принимаем уравнение (4.1.1). Искомый алгоритм строим на основе общего соотношения (4.1.4), при- нимая функции T]v(/) в (4.1.5) такими, что т|v(0 -► 0 при t 0. Определим эти функции следующим образом: r]v(O = eXv/; ReXv < 0, v = 1,2,...,л. Для простоты предполагаем, что числа Xv различны. В рассматриваемом случае равенства (4.1.7) имеют вид — к = 0,1,..., dtk поэтому программное управление (4.1.8) будет «’(0 = Г1[л(Х,1)с1ех''4-...+Л(Хи)сие,^| (4.1.13) Здесь постоянные числа Л(1у) определяются следующими равенствами л-1 4М== хг + £=0 (4.1.14)
334 Глава 4.1. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ Закон управления с обратной связью строится на основе (4.1.13). Для этого необхо- димо функции выразить через пере- менные . Подстановка найден- ных таким образом выражений в (4.1.14) дает искомый закон управления. Чтобы найти вы- ражения для функций суе^ , воспользуемся системой уравнений (4.1.9), которая для рас- сматриваемого случая имеет вид =х(0; V=1 (4.1.15) ^Х^е^ =х^(0, J =*1,2,...,л-1. V=1 По условию Ху различны. Поэтому опре- делитель матрицы 1 1 ... 1 Xi Х2 ... Хл лЛ-1 лЛ-1 лЛ-1 _Х1 ^2 ••• Хи (4.1.16) отвечающий системе (4.1.15), отличен от нуля.. Следовательно, система (4.1.15) относительно Подставляя выражения для суе^ из (4.1.17) в (4.1.13), получим закон управления с обратной связью л-1 «(х,х,...) = Л’1 £(а* + rk)xk(t). (4.1.18) Jt=O Входящие сюда постоянные коэффици- енты гк будут: ги. 1 = Xi + + ••• + Гп-2~ -ААг+ + — + - Ал); (4.1.19) П) = (-0»-Ч1х2...хп. Процессы в замкнутой системе описыва- ются дифференциальным уравнением л-1 х(») (f) - (0 = а *=0 С учетом (4.1.19) можно установить, что это уравнение имеет частные решения Поэтому синтезированная система является асимптотически устойчивой и обладает задан- ным спектром Xi, Х2, ..., Хл. Движение замк- нутой системы к положению равновесия осу- ществляется по назначенной траектории л х*(0 = ^cveXv/, Г £ 0. V=1 Рассмотрим особенности синтезирован- ных алгоритмов на примере системы второго порядка. Пусть движение управляемой систе- мы подчиняется дифференциальному уравне- нию х + а\Х + аох = Ьи. (4.1.20) В начальный момент времени состояние системы характеризуется значениями х(О) = хо, х(О) = хо. (4.1.21) Пусть х*(/) есть осуществимая для (4.1.20) траектория. Тоща в соответствии с общим положением управляющая функция u'(t) = Л-1рс’(О + aix(t) + аох' (Г)] (4.1.22) реализует движение х(/) = х*(/), Потребуем, чтобы движение системы из точки (4.1.21) в начало координат проходило по траектории, на которой выполняется равен- ство х*(0 = qeXl' + с2№, t £ 0. (4.1.23) Входящие сюда постоянные Ci, с2 опре- деляются из условий: х*(0) = х0, х*(0) = х0. Числа Х>, Х2 принимаются различными и такими, что ReXfc < 0. Чтобы найти искомое управление </*(/)> необходимо в (4.1.22) подставить выражение для х*(/) из (4.1.23). Выполняя такую подста- новку, будем иметь
АЛГОРИТМЫ СТАБИЛИЗАЦИИ СТАЦИОНАРНЫХ СОСТОЯНИЙ 335 u(t) = + Л(Х2)с2е^], (4.1.24) где приняты обозначения +#0, к = 1,2. (4.1.25) Управление (4.1.24) является программ- ным; на его основе строится закон управления с обратной связью. Для этой цели следует функции времени выразить через пе- ременные состояния управляемого объекта, т.е. через х, х . При х(/) = х*(/) из (4.1.23) имеем сле- дующие уравнения для искомых функций: qex,/ + с2еХ2' = х; (4.1.26) + Х2с2еХ2/ = х. По условию Xj # Х2, поэтому уравнения (4.1.26) имеют единственное решение С|См ^ix~x .cw_ М-* 1 x2-V 2 "Xj-x,- (4.1.27) ’ Выражения (4.1.27) устанавливают связь между функциями , входящими в (4.1.24), и переменными состояния х, х. Подстановка этих выражений в (4.1.24) приво- дит к закону управления с обратной связью 1/(х,х) = рхх + р2Х. (4.1.28) При этом коэффициенты х2л(Х1)-М(х2) а(х2 - Xj) (4.1.29) - ^0 ~ ^2) Исследуем структуру закона управления. Принимая во внимание выражения (4.1.25) для Л(Х^), можно записать: Мао - М(х2) = = X1X2 (Xj - Х2) + Оо(^2 " М; л(Х1) - л(х2) = (а,? - х2)+q(Xi - х2). Поэтому формулы (4.1.29) для коэффи- циентов рк принимают вид Pl = «0 ’ *4^2; Р2 = а\ + (*4 + М- (4.1.30) Закон управления (4.1.28) с учетом (4.1.30) можно записать в окончательной фор- ме и(х,х) = 6-1[(а0 - XiX2)* + (а1 + М + хг)*]« (4.1.31) Из (4.1.31) следует, что управляющую функцию можно представить в виде суммы двух составляющих. Первая из них «1(х,х) = 6-1(аох + qx) расходуется при управлении на компенсацию движения, вызванного наличием в уравнении модели объекта слагаемых AqX, а^х. Вторая составляющая и2(х,х) = £-1[- XjX2x + (Xj + Х2)х] расходуется на управление движением ском- пенсированного объекта, заставляя его пере- мещаться по предписанной траектории. Полученный результат вполне согласует- ся с требованиями, предъявленными к процес- су управления. Математически они сводятся к тому, чтобы дифференциальное уравнение замкнутой системы имело частные решения вида . Следовательно, реализовать пред- писанные требования можно только в том случае, когда с помощью алгоритма управле- ния замкнутой системе придается соответст- вующая структура, отвечающая виду назначен- ной траектории. Отмеченное свойство алгоритмов ком- пенсировать движения управляемого объекта, которые не соответствуют назначенной траек- тории, остается справедливым для систем лю- бого (конечного) порядка [1]. Задание траектории движения проекти- руемой системы в виде (4.1.5) равносильно назначению дифференциального уравнения для х*(/) порядка л, частными решениями которого являются линейно независимые функции Т] 1(0» •••» Пл(0- 4.1.3. АЛГОРИТМЫ СТАБИЛИЗАЦИИ СТАЦИОНАРНЫХ СОСТОЯНИЙ Управление по переменным состояния. Уравнения движения принимаем в виде
336 Глава 4.1. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ £=1,2,...,л; /=1 (4.1.32) х = Я1У1+я2У2+-+дпУп> где У1, уп - переменные (координаты) со- стояния; х - управляемая величина; и - управ- ляющая функция. Коэффициенты а^, Ь^, Як> характеризующие динамические свойства сис- темы, принимаются постоянными. Предпола- гается, кроме того, что изучаемая система вполне управляема и наблюдаема. Для систе- мы (4.1.32) будем рассматривать задачу по- строения такой управляющей функции и = = и(уь ..., уп), при которой осуществляется стабилизация заданного значения выходной переменной х = х = const. Потребуем при этом, чтобы в процессе стабилизации величина отклонения 8х(/) = х-х(/) изменялась в соответствии с решением дифференциального уравнения 8?)(О + Рл-18?-,)(О+-+ + Р18х(О + ₽о8х(О = О, (4.1.33) где постоянные числа ро, pi, ..., рл . i таковы, 410 0 при t -> оо. Чтобы найти требуемый закон управле- ния, необходимо подставить в (4.1.33) выра- жения для производных 8«(0 , вычисленных согласно уравнениям движения (4.1.32). В результате будет найдено соотношение для дифференциального выражения, записанного относительно управляющей функции и. Ука- занные преобразования удобнее провести применительно к иной форме уравнения (4.1.33), которая получается с учетом того, что &x\t) = ^у(х “ х) = ~х^ (0» . Имея в виду эти равенства, вместо (4.1.33) будем рассматривать л-1 Х(я) (() + £ Р JX^ (/) = р0Х. (4.1.34) /=0 Поскольку коэффициенты ро, ..., рл _ i уравнения (4.1.34) выбираются такими, чтобы отклонение -> 0 при / -> оо, то решение этого уравнения при любых начальных усло- виях будет стремиться к назначенной величи- не, т.е. х(/) -> х при t оо. Запишем уравнения (4.1.32) в компакт- ном виде У(0 = Ау(() + bu(l); х(Г) = qTy((), (4.1.35) где приняты обозначения А = |aw|; b = q = [?*], а знак ”т" означает операцию транспонирова- ния. Выполним необходимые вычисления по определению искомого закона управления. Согласно (4.1.35) можно записать сле- дующие равенства: х = qTy = qT(Ay + Ьм); х = qTAy + qTbw = qT^A2y + АЬи + Ьй); (4.1.36) х^ = qT^A"y + А"’1Ьи + Ал-2Ьй+...+ С учетом этих равенств из уравнения (4.1.34) находим дифференциальное уравнение для управляющей функции. Оно имеет вид = pox-dTy. (4.1.37) J=0 Здесь приняты обозначения: ру = qTRy+1b, j = 0,1,...,л - 1; (4.1.38) dT=qIR0=[rfI d2 ... d„]. При этом (л х л)-матрицы: Ro = Pol + Р1А + ... + РлА"; R1 = pjl + р2А + ... + р„А"-1; R2 = р21 + рзА + ... + РпА" - 2; (4.1.39) Кл -1 = Рл - 1® + РлА; = Р«1. Для симметрии здесь принято рл = 1. Единичная матрица I имеет размеры п х п.
АЛГОРИТМЫ СТАБИЛИЗАЦИИ СТАЦИОНАРНЫХ СОСТОЯНИЙ 337 Итак, в общем случае, когда рл. i = q^b * # 0, искомая управляющая функция и опреде- ляется решением неоднородного дифференци- ального уравнения (4.1.37). Порядок этого уравнения на единицу ниже порядка управ- ляемой системы (4.1.32). В правую часть урав- нения входят слагаемые dj yj. Поэтому для реализации алгоритма (4.1.37) необходимо оценивать переменные состояния уj, уп. В частном случае, когда системе (4.1.32) соответствует равносильное дифференциальное уравнение порядка л, не имеющее оператора в правой части, коэффициенты pi = р2 = ... = = р„ . 1 = 0. Управляющая функция определя- ется конечным соотношением “(у) = Р0'(рО* - dTy) • (4.1.40) Построим дифференциальное уравнение для управляющей функции в случае системы третьего порядка. Процесс изменения регули- руемой переменной подчиним уравнению Х + Р2Х + Р1Х + РоХ = Ро*- (4.1.41) В соответствии с (4.1.37) имеем р2й + р[й + рои = Рох - dTy, <Г = [</1<Мз1. Постоянные коэффициенты определяют- ся согласно (4.1.38): ро = qTRib; pi = qTR2b; Р2 = qTb; (Г = qTRo- (4.1.42) В данном случае Ro = р01 + PiA + р2А2 + рзА3, р3 = 1; R1 = P1I + р2А + рзА2; (4.1.43) Rz = P2I + РзА. Структурная схема замкнутой системы приведена на рис. 4.1.4. Она содержит алго- ритм оценивания вектора состояния у(/) по измерениям регулируемой выходной перемен- ной х(/). Предполагается при этом, что систе- ма (4.1.32) вполне наблюдаема. В противном случае рассматриваемая задача осуществления назначенной траектории не может быть реше- на практически. Управление по выходной переменной. Дифференциальное уравнение (4.1.37), опре- деляющее управляющую функцию, содержит в правой части линейную комбинацию п 0(0 = £4№(') к=1 координат состояния управляемой системы. Выразим переменные у к через регулируемую величину х и ее производные. Проведем необ- ходимые преобразования. Согласно (4.1.35) и (4.1.36) можно запи- сать следующие уравнения относительно век- тора состояния: qTy = х; qTAy = х - qTb«; qTA2y = х - qTAbu - qTbw; (4.1.44) л-2 qTA”-1y = х(л-1) - У^дтАи~2~иЬи^\ ц=0 Обозначим (л x л)-матрицу qT Ч*А =к УА"1, (4.1.45) и, кроме того, [л х (л - 1)]-матрицу Рис. 4.1.4. Структурная схема замкнутой системы
338 Глава 4.1. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ 0 0 ... 0 ’ qTb 0 ... 0 qTAb qTb ... 0 = Q. qTA"-2b qW’b .?. qTb (4.1.46) Далее определим векторы Х= XX ... U = [и й ... и*" 2^ . л-1 Л-1 (4.1.50) Рп - 1 = Рп - Ь Рк = Рк ~ ск> к = 0, 1...........П - 2. Дифференциальное уравнение (4.1.50) является искомым. Оно определяет управляю- щую функцию и в зависимости от значения регулируемой величины х и ее производных до порядка п - 1 включительно. Напишем дифференциальные законы управления вида (4.1.50) для частных случаев. При л = 3 согласно (4.1.45) и (4.1.46) имеем Тоща уравнения (4.1.44) можно записать в компактной форме Ку(/) = Х(0 - QUO). (4.1.47) Для системы (4.1.32), обладающей свой- ствами полной управляемости и наблюдаемо- сти, матрица К неособая и для нее, следова- тельно, существует обратная матрица К"1. На этом основании из уравнения (4.1.47) находим уО) = КЧХ(/) - K-1QU(/). (4.1.48) Соотношение (4.1.48) устанавливает ис- комую связь между вектором координат со- стояния у(/) и переменными х, х,..., х^"-^. Подставляя у(/) из (4.1.48) в дифференциаль- ное уравнение (4.1.37), будем иметь Z₽y^r=iJoi-',TK'1[x-Qu]- J=Q at (4.1.49) q1 0 0 к = q а лтА2 q А Q = ЧТЬ qTAb 0 qTb Тоща векторы X, U и уравнение (4.1.47) при- мут вид: Х = [х х х]т, U = р ц]т; 0 0 qTb В данном случае №* - lfo/1/2); «-iQ-focil. Следовательно, дифференциальный за- кон управления (4.1.50) записывается так: р2й + рхй + р^и = рох - /ох - Дх - /2х; Введем следующие обозначения № = Vofi -А-11 -Г; <№*(} = [со q ... сп. 2[ = ст. (4.1.51) Р2 = P2i Рк = Рк ‘ ск> к - 0, 1. В случае системы второго порядка №‘-(4/1); <№*(} = од В таком случае Л-1 (ГК-1Х = пх = у=о djx dtJ ’ п-2 «МС-IQU = cTU = £cv v=0 dvu dtv С учетом принятых обозначений из (4.1.49) получим окончательно к = q‘ . .qTAj ; Q = о Уь Дифференциальное уравнение (4.1.50) для управляющей функции будет рхй + р^и = Ро* - fa - fa; (4.1.52) Pi = pg po = po - Для вычисления u(f) по дифференциаль- ному закону управления (4.1.50) необходимо
АЛГОРИТМЫ СТАБИЛИЗАЦИИ СТАЦИОНАРНЫХ СОСТОЯНИЙ 339 Рве. 4.1.5. Схема аппаратной реализации алгоритма (4.1.54) иметь информацию о производных управляе- мой переменной до л - 1-го порядка включи- тельно. Необходимость измерения производ- ных высокого порядка может исключаться, если системе (4.1.32) соответствует передаточ- ная функция, у которой степень многочлена числителя на одну или две единицы меньше степени многочлена знаменателя. При таком условии дифференциальный закон управления допускает преобразование к интегральной форме и для его реализации оказывается дос- таточно информации об управляемой пере- менной и скорости ее изменения. Рассмотрим эти вопросы применительно к системе третьего порядка. Пусть ее уравне- ния в переменных состояния (4.1.32) соответ- ствуют передаточной функции вида У0(5)= 3 ‘V*1*— = 5 + a2s + ^5 + а0 u(s) (4.1.53) В этом случае в уравнении (4.1.51) коэффици- енты pj *$>j = 0, 1, 2. Следовательно, можно записать Рг“ = рох - /ох - fix - f2x - рои - ptii. Выполним интегрирование по времени обеих частей этого равенства, принимая рав- ными нулю начальные значения соответст- вующих переменных. Имеем Р2" = V - fix - f2X - PiU и после повторного интегрирования “ = — \{y~f\X-pxu)dt-f2x ; P2Lo t '/ = \(i>ax-fQx-pau)dt. о (4.1.54) Соотношения (4.1.54) представляют со- бой интегральный алгоритм управления. Для вычисления управляющей функции в данном случае не требуется информация о производ- ных управляемой переменной х. Структурная схема замкнутой системы, соответствующая (4.1.54), изображена на рис. 4.1.5. Для аппа- ратной и программной реализации такой сис- темы достаточно измерять только выходную величину х. Пусть теперь уравнениям (4.1.32) систе- мы третьего порядка соответствует передаточ- ная функция -----г----------- + а2з* + ах s + а0 u\s> (4.1.55) В данном случае в уравнении (4.1.51) ко- эффициент р2 = 0. Следовательно, дифферен- циальный закон управления имеет вид PtU + рои = рох - fox - f\X - f2X. Отсюда находим 1 р «=— |(М-/о*-Ро*0Л"Л*-/2* • Lo (4.1.56) Структурная схема замкнутой системы, соответствующая (4.1.56) изображена на рис. 4.1.6. Для вычисления управляющей функции здесь необходимо иметь информа- цию о выходной переменной х и скорости ее изменения х. Аналогично изложенному преобразуется к интегральной форме дифференциальный закон управления общего вида (4.1.50), соот- ветствующий управляемой системе порядка п. Для аппаратной или программной реализации такого алгоритма необходимо иметь следую- щую информацию: х, х, ..., х^п~т~1^ . Здесь
340 Глава 4.1. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ Рис. 4.1.6. Схема аппаратной реализации алгоритма (4.1.56) л-порядок дифференциального уравнения (4.1.50). Если п - т > 3, то в системе нужно измерять производные второго и более высо- кого порядка. 4.1.4. АЛГОРИТМЫ УПРАВЛЕНИЯ СЛЕДЯЩИХ СИСТЕМ Определение структуры и расчет пара- метров корректирующих цепей следящей сис- темы традиционным частотным методом вы- полняется по сути дела путем проб и ошибок: проверяется возможность применения после- довательной, параллельной и комбинирован- ной последовательно-параллельной схем. Ме- тод обратных задач динамики позволяет синте- зировать алгоритм управления следящей сис- темы в результате выполнения регулярной процедуры. Структура алгоритма и его пара- метры определяются непосредственно по уравнениям неизменяемой части системы и модели эталонного процесса. Постановка задачи. Общая схема синтеза. Структуру проектируемой следящей системы будем строить по схеме (рис. 4.1.7), не выде- ляя последовательные и параллельные коррек- тирующие цепи. Передаточная функция Wq(s) характеризует динамику неизменяемой части. Принимаем - СУ) • - «(f) - Л(5) ’ (4.1.57) л-1 т ЯО) = s” + £ avsv; C(s) = £ W». Рис. 4.1.7. Структурная схема проектируемой системы По функциональному назначению систе- ма должна воспроизводить с необходимой точностью входные воздействия опреде- ленного вида. В практике проектирования следящих систем в качестве типовых сигналов принимают гармонические колебания Хвх(0 = = JsincOpZ постоянной амплитуды А и рабочей частоты С0р, числовые значения которых отве- чают условиям работы системы. При этом в техническом задании на проектирование ука- зываются следующие данные: допустимая величина амплитуды ошибки Лбдоп, характеризующая динамическую точ- ность воспроизведения х^; требуемый порядок астатизма проекти- руемой системы; длительность f переходного процесса и допустимое перерегулирование ст*, определяе- мые по реакции на постоянный скачкообраз- ный сигнал. Приведенные данные используются при построении логарифмической амплитудной частотной характеристики (ЛАХ) эталонной системы, динамика которой соответствует тре- бованиям задания на проектирование. Пусть каким-либо способом такая ЛАХ построена. Тогда процедуру синтеза алгоритма управле- ния следящей системы выполняем в такой последовательности: по виду ЛАХ записываем передаточную функцию и дифференциальное уравнение эта- лонной системы, динамика которой соответст- вует техническому заданию; по уравнениям неизменяемой части формируем дифференциальный алгоритм управления из условия совпадения процессов в проектируемой и эталонной системах; уравнения дифференциального алгоритма управления преобразуем к интегральной фор- ме, что позволяет реализовать их аппаратными или программными средствами при мини- мальном объеме измеряемой информации. Обозначим через И^(5) и K3(s) переда- точные функции разомкнутой и замкнутой эталонной системы. Далее будем рассматри- вать случай, когда эталонная система имеет такой же порядок, как и неизменяемая часть. Поэтому запишем Кэ(5) = x*(j) y(s) *bx(s) ₽(*)’ (4.1.58) л—1 I p(s) = s" +£pvsv; v=0 ц=0 !< П - 1.
АЛГОРИТМЫ УПРАВЛЕНИЯ СЛЕДЯЩИХ СИСТЕМ 341 Если система обладает астатизмом порядка г, то справедливы равенства у к = р*, к = 0, 1, г - 1. Порядок астатизма определяет число интеграторов в прямой цепи эталонной систе- мы, не охваченных обратными связями. Итак, согласно постановке задачи необ- ходимо синтезировать такой алгоритм управ- ления, при котором в установившемся движе- нии величина |М')| = |х вх <0-х(0| не пре- вышает допустимое значение Лвдол- По по- строению эталонная система отвечает требова- ниям задания на проектирование, т.е. для нее выполняется неравенство |*вх(0“х*(0|< < Лацоп- Следовательно, заданная динамиче- ская точность будет реализована, если алго- ритм управления синтезируется из условия х(/) = х*(/) методом обратных задач динами- ки. Синтез алгоритмов управления. Структуру и параметры алгоритмов будем определять по методике п. 4.1.3. Для этого необходимо мо- дель движения неизменяемой части системы представить уравнениями в переменных со- стояния. Передаточной функции (4.1.57) соот- ветствует дифференциальное уравнение л-1 т Х(п) + $^avx(v) = (4.1.59) v=0 1=0 Введем переменные yi, уз, ..., уп, опре- деляемые уравнениями У1 = У2; (4.1.60) >л-1 =^л; Уп = -«0У1 " ЩУ2-^ -ап-1Уп + В таком случае выходная переменная системы X = СйУ1 + С1У2 + ... + С1У1 + J. (4.1.61) Введем следующие обозначения: ’ 0 1 ... 0 л о о ... о Л = ; _-а0 -ах ... -Дл-1 Тогда (4.1.60), (4.1.61) можно записать в век- торной форме У = Ау + е„и; х = сту, (4.1.62) где У = [У1 У2 — Ул]т • л-мерный вектор переменных состояния. Уравнения (4.1.62) будем использовать при синтезе алгоритма управления. Далее потребуется дифференциальное уравнение эталонной системы. В соответствии с (4.1.58) можно записать (4.1.63) Выведем уравнение алгоритма из усло- вия, чтобы выходная переменная х(/) следя- щей системы совпадала с решением х*(/) дифференциального уравнения (4.1.63). Для этого подставим в (4.1.63) вместо х*, х , ... соответственно х = сту; х = ст (Ау + ели); (4.1.64) х(л) = ст (длу + дл - 1елМ + дл - 2ел й + + ... + елгХл 1>). В результате найдем dlxm т dt1 8 • (4.1.65) где aj = ст Ry + ie„,j = 0, 1, ..., т; (4.1.66) gT = Igi g2 = ст «о- Матрицы Ro, Ri, ..., Rn размером n x n вычисляются по формулам (4.1.39). Итак, управляющая функция в общем случае является решением дифференциального уравнения (4.1.65). Его порядок равен степени т полинома числителя передаточной функции
342 Глава 4.1. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ (4.1.57) неизменяемой части системы. В част- ном случае при т = 0 управляющая функция определяется из конечного соотношения 1 “0“ = —тр- - gTy- (4.1.67) /=о at Представим теперь закон управления (4.1.65) в иной форме, выразив переменные состояния уу ..., уп через выходную перемен- ную х и ее производные. С этой целью вос- пользуемся методикой, изложенной в п. 4.1.3. Составляя систему уравнений, аналогичную (4.1.44), и решая ее относительно у, найдем у(/) = Р-1Х(/) - P-IGU(I). (4.1.68) Здесь обозначения векторов X, U соот- ветствуют ранее принятым; (п х л)-матрица ст стА (4.1.69) кроме того, матрица G = 0 0 ...О' стел 0 ... 0 стАел стел ... 0 стА"-2е„ стА"-3ел ... стел • (4.1.70) С учетом (4.1.66) - (4.1.70) можно пока- зать, что справедливо равенство gTPxG = e[fl0 -Ро • а1 -Р1 ! ••• I вл-1 -Рл-1]’ (4.1.71) Принимая во внимание (4.1.71), после подстановки (4.1.68) в (4.1.65) найдем ;=0 /=0 v=0 (4.1.72) Уравнение (4.1.72) является искомым. Его особенность состоит в том, что дифферен- циальный оператор левой части в точности соответствует полиному числителя передаточ- ной функции (4.1.57) неизменяемой части системы. По принятому условию нули W'q(s) расположены в левой полуплоскости, поэтому алгоритм управления (4.1.72) как динамиче- ская система устойчив. Далее, в правой части (4.1.72) содержатся слагаемые в>х<*), которые компенсируют соответствующие слагаемые в дифференциальном уравнении (4.1.59) неиз- меняемой части системы. Согласно этому замкнутая система описывается дифференци- альным уравнением v=0 /=0 которое в точности совпадает с уравнением (4.1.63) эталонной модели. В этом можно убе- диться в результате подстановки дифференци- ального выражения для и из (4.1.72) в (4.1.59). Реализация алгорипюа управления. Во- просы реализации изложим применительно к системе третьего порядка. Рассмотрим сначала случай, когда передаточная функция неизме- няемой части о (4.1.73) 5° + a2s + в^ + во В соответствии с принятым ранее усло- вием считаем, что нули FFo(s) расположены слева от мнимой оси на комплексной плоско- сти. Это имеет место в том случае, когда С/ > >0. Пусть требованиям задания на проекти- рование соответствует эталонная система, уравнение которой имеет вид X* + Р2Х* +Р1** + Ро** = = Г2*вх + Y1*bx + Yo*bx- (4.1.74) Необходимо синтезировать алгоритм управления, при котором в замкнутой системе реализуются динамические характеристики, соответствующие (4.1.74). В обозначениях (4.1.57) и (4.1.58) для принятых моделей (4.1.73), (4.1.74) имеем: п - = 3, т = 2, / = 2. Следовательно, согласно (4.1.71) алгоритм управления в дифференци- альной форме будет иметь вид 2 2 с2й + Ciu + сои = £1 - X > /=0 v=0 (4.1.75) где обозначено А, = Ov - pv. Выполним дву- кратное интегрирование по времени обеих частей (4.1.75), принимая равными нулю на- чальные значения переменных. В результате
АЛГОРИТМЫ УПРАВЛЕНИЯ СЛЕДЯЩИХ СИСТЕМ 343 получим уравнения алгоритма управления в интетральной форме: “ = ~(ч'1+У2хвх-Л2Х); t ъ=<[(ч'о+гля-л1*-с1“)л; (4.1.76) о t Vo = f (го*вх “ A#* “ Co") Л. о Для практической реализации замкнутой системы с алгоритмом (4.1.76) (рис. 4.1.8) достаточно измерять только выходную пере- менную х Пусть теперь передаточная функция не- изменяемой части имеет вид = ~3---------------• (4.1.77) s + a2s +a{s +а0 В данном случае степень полинома чис- лителя на две единицы меньше степени поли- нома знаменателя. Принимаем, что CqC\ > О, т.е. нуль передаточной функции есть отрица- тельное число. По-прежнему требуется синте- зировать алгоритм управления, реализующий в системе динамические характеристики, опре- деляемые эталонной моделью (4.1.74). В рас- сматриваемом случае п = 3, т = 1, / = 2. По- этому на основании (4.1.71) имеем дифферен- циальный алгоритм управления 2 2 qi/ + coi/ = /=0 v=0 (4.1.78) Разделив обе части (4.1.78) на q и про- интегрировав по времени, получим уравнения алгоритма управления в интегральной форме: и = ^-(то + Г1*вх + Г2*вх - *1* - м); t Vo =/(yoxbx -h^X-C^u)dt. (4.1.79) о Структурная схема замкнутой системы, соответствующая (4.1.79), изображена на рис. 4.1.9. Для вычисления управляющей функции необходимо иметь информацию о по- ложении х и скорости х. Кроме того, в вычис- литель системы необходимо вводить первую про- изводную входного воздействия. Рас. 4.1.8. Схема аппаратной реалвацни алгоритма (4.1.76) Рас. 4.L9. Схема аппаратной реализации алгоритма (4.1.79)
344 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ Если порядок дифференциального опера- тора правой части уравнения (4.1.74) равен единице (/ = 1), т.е. 72 = О, то при тех же Ус- ловиях дифференциальный алгоритм управле- ния будет иметь вид 2 qu + c0U = То*т + Т1*вх " 2Xx<V>- v=0 (4.1.80) Ему соответствуют уравнения алгоритма в интегральной форме: “ = “('•'о + У 1хвх - *\х - h2x); t Vo =f(roxBx-*ftX-cou)A (4.1.81) 0 Отсюда следует, что для вычисления управ- ляющей функции не требуется выполнять опе- рацию дифференцирования над входным воз- действием х^. Рассмотрим еще один случай, относя- щийся к системе третьего порядка. Пусть пе- редаточная функция неизменяемой части ^0 W = • (4.1.82) s +a2s +ais + aQ Модель эталонной системы принимаем, по-прежнему, в виде уравнения (4.1.74). По- скольку в данном случае п = 3, т = 0, / = 2, то из (4.1.72) находим (4.1.83) Отсюда следует, что для вычисления управ- ляющей функции требуется информация не только о скорости х, но и об ускорении х. Кроме того, в системе необходимо выполнять двукратное дифференцирование входного воз- действия. Поэтому практическая реализация алгоритма (4.1.83) затруднительна. На основании выполненного анализа мож- но сделать следующие выводы. Для реализации алгоритма управления (4.1.72), синтезированного для системы с передаточной функцией (4.1.57), в вычислитель необходимо вводить: информацию о выходной переменной х и ее производных х, х, ...; порядок старшей производной равен п - т - 1; информацию о входном воздействии х^ и его производных хт, хт, ...; порядок старшей производной равен 1-т. Наиболее неблагоприятными с точки зрения реализации являются ситуации, когда степень полинома числителя передаточной функции неизменяемой части системы суще- ственно меньше степени полинома ее знаме- нателя. Такие ситуации встречаются сравни- тельно часто в практике проектирования авто- матических систем. Методика синтеза алго- ритмов управления для систем такого типа рассматривается в п. 4.2.3. Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ 4.2.1. АЛГОРИТМЫ УПРАВЛЕНИЯ ПО УСКОРЕНИЮ. ЗАДАЧА СТАБИЛИЗАЦИИ Пусть модель управляемого движения представлена уравнением х + а^х + аох = Ь0и9 (4.2.1) bo, aj = const, где х - управляемая переменная; и - управ- ляющая функция. Состояние системы в на- чальный момент времени t = 0 определено значениями х(0) = хь, х(0) = х0. Требуется синтезировать такой алгоритм стабилизации (управления) и = и(х, х) , при котором замк- нутая система переходит из начального со- стояния (хо, *о) в окрестность стационарной точки х = Х° = const, х - 0 (4.2.2) и продолжает оставаться в этой окрестности бесконечно долго. Потребуем при этом, чтобы переходный процесс х(/) -> х° с необходимой точностью следовал за процессом х*(/) —> Х°, который определяется дифференциальным уравнением второго порядка х* +Р1** +Рох* = Рох°, Ро, Pi= const, (4.2.3) х*(0) = х0, х*(0) = х0. Коэффициенты Ро, Р1 определяют харак- тер переходного процесса х*(/) —> х° и его параметры: длительность / *, перерегулирова- ние о*, степень колебательности и др. Число- вые значения Ро, Pi назначаются с учетом
АЛГОРИТМЫ УПРАВЛЕНИЯ ПО УСКОРЕНИЮ. ЗАДАЧА СТАБИЛИЗАЦИИ 345 динамики управляемого объекта и условий физической реализуемости характеристик, которые формулируются в задании на проек- тирование (имеются в виду ограничение управляющих функций, инерционность объек- та и др.). Определим структуру алгоритма, кото- рый соответствует требованиям рассматривае- мой задачи. Запишем уравнение (4.2.1) в виде х = w(x, х, и); (4.2.4) w(x, х, и) = Ь$и - а$х - щх. Равенство x(t) = x*(f), / > О выполняется теоретически точно, если в процессе движения ускорение управляемого объекта равно уско- рению эталонной модели, т.е. х(/)=х*(/), t > 0. Обозначим через и* управляющую функцию, которая реализует указанное усло- вие. Понятно, что и* удовлетворяет уравнению и^х, х, и*) = w*(x, х), t > 0, (4.2.5) ще W* есть требуемое значение ускорения м>‘(х, х) = Ро(х° - х) - р(х. (4.2.6) Соотношение (4.2.6) следует из уравне-' ния эталонной модели (4.2.3) с учетом того, что х*(/) = х(1). Таким образом, если управляющая функция определяется из (4.2.5), то процесс х()) -> х° в точности совпадает с процессом х*(/) -> х°. Принимая во внимание выраже- ния для w и w*, из (4.2.5) находим «’ = ^- ₽0*°+ £(«./ • (4.2.7) В соответствии с принятой терминологи- ей [2] соотношение (4.2.7) представляет собой алгоритм управления компенсационного типа. Практическое применение таких алгоритмов о1раничено теми ситуациями, когда параметры объекта (aj, Ад) известны и остаются неизмен- ными. При изменении параметров в широких пределах динамика замкнутой системы (4.2.1), (4.2.7) может не удовлетворять заданным тре- бованиям и, более того, система может ока- заться неустойчивой. Чтобы построить эффективный алгоритм управления, уравнение (4.2.5) будем решать с помощью следящего контура по ускорению. С этой целью управляющую функцию определим уравнением u(f) = - xj, к = const, (4.2.8) signA; = sign/\), которое будем называть дифференциальным законом управления первого порядка. Уравнение (4.2.8), дополненное соотношением (4.2.6), составляет содержание дифференциального алгоритма управления. Структурная схема замкнутой системы с этим алгоритмом изображена на рис. 4.2.1. Управляемый объект здесь представлен моде- лью (4.2.4). На вход системы поступает задан- ное значение Х°, которое должно быть отрабо- тано в процессе управления. Структура систе- мы содержит три контура. Внешний контур замыкается по управляемой координате х, т.е. по положению. Следующий, внутренний, кон- тур замыкается по скорости х. Сигнал, выра- батываемый этими контурами, представляет собой требуемое значение ускорения w*, соот- ветствующее (4.2.6). Реализация w* обеспечи- вает переход системы в окрестность стацио- нарной точки (4.2.2). Это достигается с помо- щью третьего контура, замкнутого по ускоре- нию х. Необходимая степень приближения управляемого процесса х(/) —> Х° к эталонно- му процессу х*(/) —> Х° достигается в том слу- чае, когда быстродействие контура ускорения существенно выше быстродействия контура положения. Будем считать это условие выпол- ненным. Рис. 4.2.1. Структурная схема системы с дифференциальным законом управления
346 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ Ряс. 4.2.2. Структурная схема системы с интегральным законом управления Рассматриваемый алгоритм удерживает выходную переменную х в окрестности задан- ного постоянного значения Х° = const. На этом основании алгоритм (4.2.6), (4.2.8) име- нуется алгоритмом стабилизации. Этот алго- ритм обеспечивает выход объекта на новый режим работы, например, перевод электро- двигателя в режим вращения с некоторой иной угловой скоростью. Поэтому алгоритмы такого типа правомерно называть также алго- ритмами управления. Принципиальной особенностью синтези- рованного алгоритма является то, что он при- дает замкнутой системе естественное свойство адаптивности. Физической основой такого свойства служит то обстоятельство, что управ- ляющая функция и вычисляется по информа- ции об ускорении управляемой координаты. Величина х в случае ее измерения известна в любой момент времени t £ 0. Это означает, что известно численное значение функции w(x, х, к) в уравнении движения (4.2.4). Значит, любые изменения функции w(...), вызванные отклонением переменных х, х от • . • эталонных значений х , х или отклонением параметров Лу, До от их расчетных значений, или, наконец, действием внешних возмущаю- щих сил, учитываются при формировании управляющей функции в соответствии с алго- ритмом (4.2.6), (4.2.8). Если энергетические ресурсы исполнительного элемента системы достаточны, то дополнительная величина управляющей функции Ди, обусловленная указанными факторами, вызовет такое движе- ние объекта, при котором фактическая траек- тория (х, х) возвратится в окрестность траек- тории (х*, х*| эталонной модели. Для вычисления !/(/) по (4.2.8) необхо- дима информация об ускорении х управляе- мой координаты. Алгоритм управления по ускорению можно представить в интетральной форме. Тогда для его практической реализации не будет необходимости измерять вторую про- изводную х. Выполним интегрирование по t обе части (4.2.8). Принимая начальные значе- ния к(0), х(0) равными нулю, будем иметь t u(f) = fcjw*(x, x)dt - kx. (4.2.9) 0 Соотношения (4.2.6), (4.2.9) составляют содержание алгоритма управления по ускоре- нию в интегральной форме. В данном случае для вычисления управляющей функции доста- точно иметь информацию об х, х. Сущест- венно однако, что система с интегральным алгоритмом обладает такими же динамически- ми характеристиками, как и система с диффе- ренциальным алгоритмом. Структурная схема, соответствующая алгоритму (4.2.6), (4.2.9), приведена на рис. 4.2.2. Интегральный алгоритм можно предста- вить в другой форме. Подставим в (4.2.9) вы- ражение для w* из (4.2.6) и проинтегрируем. Принимая начальное значение х(0) = 0, полу- чим t u(t) = Лр0 J(*° - x)dt- Л(рхх + х). о (4.2.10) Структурная схема замкнутой системы, соответствующая (4.2.10), представлена на рис. 4.2.3. В этой системе измеряется выход- ная переменная х и скорость ее изменения х. Системы, структурные схемы которых изображены на рис. 4.2.1 - 4.2.3, имеют иден- тичные динамические характеристики. Такое заключение следует хотя бы из того, что их передаточные функции одинаковы. На этом основании будем изучать свойства системы с дифференциальным алгоритмом управления. Ее движение описывается уравнениями х(/) = w(x, х, и); (4.2.11) ii(t) - Ajw*(x, х) - xj; (4.2.12) w‘(x, х) = Ро(*° - *) - ₽!*• (4.2.13)
АЛГОРИТМЫ УПРАВЛЕНИЯ ПО УСКОРЕНИЮ. ЗАДАЧА СТАБИЛИЗАЦИИ 347 Управляемый объект Рве. 4.23. Сгрртпурим схема сястемы с алгоритмом управления (4.2.10) Исключим из этих уравнений управляю- щую функцию. С этой целью продифферен- цируем обе части (4.2.11) по времени, а затем подставим в полученное равенство выражение для й из (4.2.12). Выполняя указанные опе- рации и принимая во внимание (4.2.4), най- дем x+(ai +fcft&)x + (eo +А01Ао )х + + = ЛРо^Ох°« (4.2.14) Таким образом, процесс в замкнутой системе описывается дифференциальным уравнением третьего порядка. Согласно поста- новке задачи синтезируемый алгоритм дол- жен обеспечивать приближение переходного процесса х(/) -► х° к эталонному процессу х*(/) —► Х°, определяемому дифференциаль- ным уравнением (2.10.3) второго порядка. Необходимая точность приближения х(/) -► -> х*(/) достигается путем повышения быстро- действия контура ускорения, т.е. увеличением коэффициента усиления к. Покажем, что при неограниченном уве- личении к переходный процесс в системе асимптотически приближается к процессу в эталонной системе. Разделим обе части (4.2.14) на коэффициент усиления: Ао(х + 01Х + Рох) = До0О*° + xf х), (4.2.15) 1Де у(х, х, х) = --i-(aox + а{х + х). К Для устойчивой системы справедливо предельное соотношение lim ш(х, х, х) = 0. Поэтому после выполнения предельного перехода в (4.2.15) получаем уравнение X + pix + РоХ = Арх0, (4.2.16) которое в точности совпадает с уравнением эталонной модели (4.2.3). Следовательно, при неограниченном увеличении усиления в кон- туре ускорения (к -> оо) дифференциальное уравнение третьего порядка (4.2.15) вырожда- ется в уравнение второго порядка (4.2.16). Это означает, что управляемый процесс х(/) —► Х° асимптотически приближается к процессу х*(/) —► х°. Такая возможность обусловлена замечательными свойствами системы, управ- ляемой по ускорению, - не терять устойчи- вость при неограниченном увеличении коэф- фициента усиления в контуре ускорения. Этот важный результат можно установить, напри- мер, с помощью критерия Гурвица [2]. Далее будет показано, что достаточная для техниче- ских приложений степень приближения х(/) —► х*(/) достигается при конечных и весьма умеренных значениях коэффициента усиления к Исследуем теперь установившиеся про- цессы в замкнутой системе. В соответствии с (4.2.14) передаточная функция для управляе- мой переменной х ЛГХ(«) = • л< \ Р ы? Д/ ч = <4-217> &ф) + &Ро0(5) х°($) me x(s), х°($) - изображения по Лапласу функций х, X® а многочлены Л($) = s1 + + оо; РО) = s2 + + р0. Пусть х° = const. Тоща установившееся значение выходной переменной х(оо) = lim sKx(s)xQ(s) = j->0 v° = lim sKx(s) — = x°. j-*o * s Таким образом, система не имеет устано- вившейся ошибки при постоянном входном воздействии. Пусть теперь
348 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ х° = vx/; x°(s) = н*-; vx = const. Передаточная функция для ошибки £ = = х° - х по определению АГ£(5)=1-АГх(5) = [Л(д) + ^0(д + Р!)р ф) &4(s) + A*oP(j) ”x°(s)’ ще s(s) - изображение по Лапласу функции £(/). С учетом этого выражения находим уста- новившееся значение с(оо) = lim sKe(s)^4- = j-0 eV s2 Po Следовательно, система обладает аста- тизмом первого порядка по отношению к за- дающему воздействию Х°, что соответствует свойству эталонной модели, порядок астатизма которой также равен единице. Итак, установлено, что алгоритм управ- ления по ускорению позволяет реализовать заданные динамические характеристики про- ектируемой системы. Это достигается при высоком усилении контура ускорения. Методику расчета параметров изложим, применительно к модели системы, описывае- мой уравнениями (4.2.11) - (4.2.13). Неизвест- ными являются три коэффициента усиления: 00» Рь Вначале найдем Ро, 01, числовые значения которых определяют динамику эта- лонной модели, а затем рассчитаем коэффици- ент усиления контура ускорения. Исходными данными для расчета Ро, Pi являются: назначенная длительность ? пере- ходного процесса х*(/) -> х° и перерегулиро- вание ст*. Запишем уравнение (4.2.3) эталон- ного процесса в стандартных формах: TqX* + 2^т0х* + х* = х°; (4.2.18 а) х* + 2£<оох* + ® ох* ~ ® 0*°> (4.2.18 6) ще т0 = “О1- Далее будем считать, что дина- мика эталонной системы должна соответство- вать наиболее предпочтительному переходному процессу минимальной длительности ? ~ 3tq. В этом случае £ = V2/2 , а перерегулирование ст « 4,3 %. Сравнивая (4.2.3) и (4.2.18), имеем Ро = ®0 = “Ti Р1 = = 2 — . (4.2.19) *0 т0 При указанных значениях параметров пред- почтительного переходного процесса из (4.2.19) находим искомые коэффициенты эта- лонной модели ₽о=4; ₽1 = т-; То то 3 (4.2.20) Определим теперь коэффициент усиления к контура ускорения. Основное требование, по которому выполняется расчет к, заключается в том, чтобы быстродействие контура ускорения было существенно выше быстродействия кон- тура положения. Обозначим через xw постоян- ную времени контура ускорения. Тогда ука- занное требование выражается соотношением tw « то- Найдем формулу для т^. Для этого рассмотрим структурную схему (рис. 4.2.4). Входной величиной контура является требуе- мое ускорение W*, а выходной - фактическое ускорение х = w . Сигналы а$х, а^х высту- пают в роли внешних возмущений. При такой интерпретации рассматриваемая структура характеризует динамику контура ускорения по отработке задающего воздействия W*. Переда- точная функция прямой цели ^(•5) = —- (4.2.21) Поэтому передаточная функция замкнутого контура ^w(j) = -^- =----------1---, (4.2.22) s + kbg tws + 1 ще постоянная времени Д' (4.2.23) Динамические характеристики синтези- руемой системы будут мало отличаться от ха- рактеристик эталонной системы, если (4.2.24) Рас. 4.2.4. Структурная схема контура ускорения
АЛГОРИТМЫ УПРАВЛЕНИЯ ПО УСКОРЕНИЮ. ЗАДАЧА СТАБИЛИЗАЦИИ 349 Примем, что то = Nt*» N » 1. Тоща на основании (4.2.24) получаем следующее соот- ношение N к = ----, N»l. (4.2.25) Мо Из (4.2.25) можно заключить, что коэф- фициенты к, До должны иметь одинаковый знак, т.е. выполняется правило sign£= signify, указанное в (4.2.8). Изучим влияние к на устойчивость сис- темы. Согласно критерию Гурвица система будет устойчива, если выполняется неравенст- во 01 + fclfy) 0о + Л01До) > (4.2.26) при условии, что коэффициенты уравнения (4.2.14) положительны, т.е. а\ + кЬц >0; oq + Afblfy > 0; &Ро^о > 0* Для устойчивого объекта (oq > 0, а\ > 0) неравенство (4.2.26) выполняется при любых значениях к > 0, в том числе и при неограни- ченном увеличении 0 —> оо). Действительно, представим (4.2.26) в виде -777 +(а0 + Л1Р1) + *ЗД1 >Ро- KZfy Отсюда непосредственно следует до + aiPi = const; -> 0, к -► оо. Следовательно, при увеличении к нера- венство только усиливается, что свидетельству- ет о повышении устойчивости. В том случае, когда объект неустойчив, замкнутая система с алгоритмом управления по ускорению сохраняет устойчивость, если laJ + O^Pi —LL, (4.2.27) Й) в том числе и при к -> оо. Пример. Синтезировать алгоритм управ- ления по ускорению движением объекта, пе- редаточная функция которого имеет вид А) s2 + ^1$ + а0 ’ (4.2.28) fll = -2; Оо — 1; До = 1. Параметры алгоритма рассчитать из ус- ловия, чтобы процесс х(/) —> х° перехода сис- темы из произвольного начального состояния в стационарное состояние (4.2.2) проходил в малой окрестности решения х*(/) дифферен- циального уравнения (4.2.3). Длительность процесса должна быть равна ? = 1,5 с, а пере- регулирование ст* < 5 %. Рассчитаем сначала коэффициенты урав- нения эталонной модели. По формулам (4.2.20) находим то=4~ = О,3 с; Р0=Д- = 4 с-2; 3 ч ₽!= — = 2^2 с'1. (4.2.29) т0 Эти значения соответствуют наиболее предпочтительному переходному процессу минимальной длительности « 0,9 с. С уче- том (4.2.29) уравнение (4.2.3) принимает вид х* + 2^2х* + 4х* = 4х°. (4.2.30) На основании (4.2.6), (4.2.8) записываем уравнения алгоритма u(t) = - х); (4.2.31) w* = 4^х° - х) - 2-/2Х или в интегральной форме (4.2.10) t u(t) = 4кj (х° - х) dt - 2^2кх - кх. (4.2.32) о Числовое значение коэффициента усиле- ния контура ускорения назначается согласно (4.2.25). В рассматриваемом случае объект неустойчив 01 < 0), поэтому величину к сле- дует оценить по (4.2.27). С учетом числовых значений параметров, указанных в (4.2.28) и (4.2.29), из соотношения (4.2.27) находим, что при любом к > 2 + V2 замкнутая, система устойчива. Это условие выполняется, если в формуле (4.2.25) принять N = 2. В этом слу- чае получаем к = 4. Величину к можно уточ- нить с помощью математического моделиро- вания. Приведем результаты исследования син- тезированной системы, которые иллюстрируют адаптивные свойства алгоритмов управления по ускорению. Исследование выполнялось по схеме рис. 4.2.5. Здесь в качестве эталонной системы выступает модель, описываемая урав- нением (4.2.30). Синтезируемая система пред- ставлена уравнениями
350 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ Рве. 4.2.5. Схема нсследовамвя двшимвп састемы х + а^х + а$х = Дои; (4.2.33) t и = 4к j (х° - xjdt - 2<Jzkx - кх. о Сравнение динамических характеристик систем проводится по интегральной квадра- тичной оценке о записанной для отклонения ДА переходных функций. Варьируемым параметром является отношение N = то / Для заданного значе- ния N вычисляется коэффициент усиления к по формуле (4.2.25), при котором затем вы- полняется моделирование и вычисляется квад- ратичная оценка J(k). В табл. 4.2.1 приведены данные, характеризующие зависимость Дк) от АГ для случая, когда управляемый объект неус- тойчив. Числовые значения параметров для этого случая указаны в (4.2.28). Из табл. 4.2.1 следует, что при N = 3 величина J(k) умень- шается на два порядка по сравнению с тем значением, которое имеет место при соотно- шении то / = 1. Это свидетельствует о том, что переходная функция А(1) синтезируемой системы практически совпадает с переходной функцией А*(/) эталонной системы. В табл. 4.2.2 приведены данные, характе- ризующие динамику системы при нейтраль- ном объекте управления. Уравнение движения имеет следующие параметры: Oq = 0, = 0, До = 1. В данном случае синтезированная сис- тема обладает высокими динамическими свой- ствами, если постоянная времени контура ускорения в три раза меньше постоянной вре- мени то эталонной системы. Наконец, в табл. 4.2.3 приведены результа- ты моделирования системы, управляемый объект которой устойчив: Oq = 1, = 2, Ьц = 1. С та- кими значениями параметров замкнутая сис- тема, управляемая по ускорению, устойчива при любых к > 0. 4.2.1. Значения интегральной квадратичной оценки переходного процесса для неустойчивого объекта N к Дк) 1 2 0,89 2 4 0,017 3 6 0,76 • 10-2 5 10 0,27 • IO-2 4.2.2. Значения пггаральной квадратичной оцеп» переходного процесса для нейтрального объекта N к J(A) 1 2 0,98 2 4 0,025 3 6 0,86 • IO-2 5 10 0,25 • IO'2 4.23. Значения интеграпиой квадратичной оценки переходного процесса для устойчивого объекта АГ к ДА) 0,1 0,2 1,00 1 2 0,08 2 4 0,022 3 6 0,54 • IO'2 6 12 0,23 • IO'2
АДАПТИВНЫЕ АЛГОРИТМЫ УПРАВЛЕНИЯ СЛЕДЯЩИХ СИСТЕМ 351 4.2.2. АДАПТИВНЫЕ АЛГОРИТМЫ УПРАВЛЕНИЯ СЛЕДЯЩИХ СИСТЕМ Применительно к задачам стабилизации и управления рассматриваются методические вопросы синтеза алгоритмов, в соответствии с которыми управляющие функции вычисляют- ся по старшим производным управляемых координат. Системы с такими алгоритмами нечувствительны к изменению параметров и действию возмущающих сил, т.е. обладают естественными свойствами адаптивности. Су- щественно при этом, что аппаратная реализа- ция таких алгоритмов не связана с необходи- мостью измерения производных высокого порядка [3, 4, 8]. Постановка задачи. Неизменяемая часть системы, включающая исполнительный эле- мент и объект управления, задана передаточ- ной функцией • ° A(s) u(s)’ (4.2.34) л-1 т Л($) = j" + £avsv; B(s) = £ b^, v=0 ц=0 т <> п - 1. ще x(s), u(s) - изображения по Лапласу вы- ходной переменной х(/) и управляющей функции «(/). Далее примем, что нули переда- точной функции W(s) расположены слева от мнимой оси комплексной плоскости. Требует- ся синтезировать алгоритм управления, при котором замкнутая система обладает заданны- ми динамическими характеристиками и вос- производит входные воздействия х^(/) с необ- ходимой точностью. Динамика проектируемой системы назначается с помощью эталонной модели, передаточная функция которой имеет вид _ х fo) • ’° «(*) (4.2.35) r-1 / a(s) = sr + assv; ₽(s) = £ Py*7- v=0 y=0 Здесь x*(s), x^s) - изображения по Лапласу выходной переменной x*(/) и входного воз- действия хвх(/). В зависимости от числовых значений коэффициентов cty, Ру эталонная система может иметь различный порядок аста- тизма. Так, если Ро = ссо, то порядок астатиз- ма будет первым; в случае Ро = Оф и Pi = сц порядок астатизма второй. При формировании структуры алгорит- мов управления будем исходить из требования, что для вычисления управляющей функции u(f) достаточно минимального объема изме- ряемой информации: х(/)> x(f) или только x(f). Кроме того, структура алгоритмов должна быть такой, чтобы исключалась необходимость выполнения операции дифференцирования задающего воздействия xBX(f). Указанные тре- бования могут быть реализованы в том случае, если порядок эталонной модели п + I - 1. Степень / многочлена 0(s) определяется при формировании модели. Передаточная функция (4.2.35) модели может быть найдена, например, по логариф- мическим амплитудным частотным характери- стикам, построенным с учетом заданных тре- бований к динамической точности, быстро- действию, степени колебательности и по- рядку астатизма. Практические рекоменда- ции по формированию эталонных моделей см. п. 4.2.3. Для решения задачи необходимы диффе- ренциальные уравнения, характеризующие динамику неизменяемой части системы и эта- лонной модели. В соответствии с (4.2.34) име- ем л-1 т х^ + (4.2.36) v=0 ц=0 Аналогично на основании (4.2.35) записываем По построению модели эталонной сис- темы в установившемся движении величина отклонения |хю (/) - х* (f)| с необходимостью меньше допустимого значения, указанного в задании на проектирование. Следовательно, требуемая динамическая точность будет дос- тигнута, если алгоритм управления синтезиру- ется из условия x(f) — х*(/). Для этой цели используем процедуру метода обратных задач динамики, дополненную идеей управления движением по старшим производным [3 - 5]. Структура алгоритмов управления. Асим- птотические свойства управляемых систем. Сна- чала рассматриваем систему, неизменяемая часть которой описывается уравнением л-1 х(л) + £ avx(v) = bQU. (4.2.38) v=0
352 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ Модель эталонной системы принимаем в виде уравнения (4.2.37). Согласно (4.2.38) х(л) = т]л(х, х, и\ (4.2.39) где л-1 Пл (А х....и) = - £avx<v). v=0 Следуя [3], управляющую функцию оп- ределим дифференциальным законом управ- ления первого порядка = А^л - х(л>], к = const, (4.2.40) где т]л = т]л(х, х, ..., /) - производная по- рядка п, характеризующая движение эталон- ной модели, т.е. х*(/) -► хвх(/). Переменная t ♦ в числе аргументов функции т|л отражает тот факт, что требуемое значение старшей произ- водной зависит от хвх(/). Отметим также, что для коэффициента усиления к должно выпол- няться правило знаков signA: = signify что необходимо для обеспечения устойчивости процесса управления. Формирование управляющей функции по уравнению (4.2.40) означает, что в струк- туру системы вводится контур управления старшей производной управляемой перемен- ной. Задающим сигналом этого контура явля- ется требуемое значение л-й производной цл = dnx /dtn . Величина т]л сравнивается с фактическим значением т]л = dnx*jdtn и по рассогласованию т|л - х^ вычисляется ско- рость изменения управляющей функции u{f), которая затем интегрируется. Требуемое зна- чение т]л определяется по уравнению (4.2.37) эталонной модели с учетом состояния управ- ляемого объекта. Для определенности изложения далее принимаем /= 2, поэтому порядок модели г = = л + 1. В таком случае из (4.2.37) следует 'У1 dtJ hs (4.2.41) Выполним в (4.2.41) замену Х = х^, s = 0, 1, ..., л, dts а затем проинтегрируем обе части этого равен- ства по времени, принимая равными нулю начальные значения соответствующих пере- менных. В результате найдем выражение для требуемого значения старшей производной t Пл = J (₽0*вх - “0*) dt + ₽iXBX + р2хи - о л-1 -Xa<+I*<j). (4.2.42) j=0 Соотношения (4.2.40), (4.2.42) составля- ют содержание алгоритма управления. Струк- турная схема замкнутой системы с этим алго- ритмом изображена на рис. 4.2.6. Здесь при- нято л = 4. В этом случае требуемое значение старшей производной т|4 =d^x*ldt^ вычис- ляется по соотношению t Пл = J (0Охвх - + ₽1хвх + ₽2*вх - 0 - oqx - a2x - a3x - a4x. (4.2.43) Рас. 4.2.6. Структурная схема системы с алгоритмом управления (4.2.42)
АДАПТИВНЫЕ АЛГОРИТМЫ УПРАВЛЕНИЯ СЛЕДЯЩИХ СИСТЕМ 353 Для вычисления Т]л по (4.2.43) необхо- димо иметь информацию о производных управляемой переменной до третьего порядка включительно. Кроме того, нужно выполнять операцию дифференцирования входного воз- действия Хвх(/). Не обсуждая пока вопросы практической реализации алгоритма (4.2.40), (4.2.42), исследуем свойства замкнутой систе- мы. Управляемый процесс описывается урав- нениями (4.2.39), (4.2.40) и (4.2.42). Запишем их в операторной форме. Обозначая диффе- ренциальный и интегральный операторы будем иметь Л(р)х(0 = Ло«(О; pu(t) = (0 - P"x(Z)]; (4.2.44) Пл = р ~ ’ где л-1 Жр) = р” + v=0 2 Р(р) = ^РуРу; (4.2.45) )=0 <*'(P) = ^a-sPs- s=0 Третье уравнение в (4.2.44) соответствует (4.2.43), записанному в виде t 2 л Пл(0 = | о|_у=О J=o dt. Исключим из уравнений (4.2.44) управ- ляющую функцию. С этой целью продиффе- ренцируем первое уравнение по времени и подставим затем в него выражение для pu(J) из второго. Принимая во внимание, что со- гласно (4.2.45) справедливо равенство л +а'(р) = рл+1 + = а(/>), j=0 после выполнения указанных операций полу- чим уравнение замкнутой системы 12 Зак 1023 [рМр) + t>oka(p)] х(р) = = МР(р)*вх(0- (4.2.46) По условию степень полинома а(р) рав- на г = п + 1, поэтому порядок уравнения (4.2.46) на единицу больше порядка эталонной модели. Это обусловлено тем, что управляю- щая функция определяется не по конечному, а по дифференциальному уравнению (4.2.40) первого порядка. Итак, управляемый процесс х(/) подчи- няется дифференциальному уравнению поряд- ка л + 2, а процесс x*(f) в эталонной модели есть решение дифференциального уравнения порядка п + 1. Необходимая степень прибли- жения х(/) к х*(/) достигается при соответст- вующем усилении в контуре старшей произ- водной х<л). Покажем, что при неограничен- ном увеличении усиления (к -> оо) управляе- мый процесс асимптотически приближается к процессу в эталонной модели. Прежде всего отметим следующее: для устойчивой модели с передаточной функцией (4.2.35) при любых динамических характеристиках управляемого объекта можно указать такое конечное значение коэффициента усиления к = к*9 при котором замкнутая система будет устойчива, а при к > к* ее устойчивость сохраняется. Считая это усло- вие выполненным, разделим обе части уравне- ния (4.2.46) на Ьцк и вычислим пределы при к —> оо. Для устойчивой системы справедливо предельное равенство lim — £->» Ь^к Поэтому после выполнения указанных операций получим уравнение п 2 х(Я+1) = J=o у=о (4.2.47) которое в точности совпадает с уравнением эталонной модели (4.2.37). Таким образом, в асимптотике (к -> оо) при неограниченном увеличении усиления в контуре старшей про- изводной выходная переменная х(/) управляе- мой системы асимптотически приближается к выходной переменной х*(1) эталонной модели, т.е. справедливо х(/) -> Отмеченная формально-математическая особенность вырождения дифференциального уравнения (4.2.46) в уравнение (4.2.47) мень- шего порядка отражает замечательные свойства систем, управляемых по старшим производ- ным. Они заключаются в следующем: при
354 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ достаточных энергетических ресурсах испол- нительных элементов динамические характе- ристики систем остаются неизменными при параметрических и координатных возмущени- ях. Это достигается без применения каких- либо специальных алгоритмов идентификации параметров, измерения или оценивания воз- мущающих сил, алгоритмов самонастройки и др. На этом основании можно считать, что алгоритмы управления по старшим производ- ным придают системам естественные свойства адаптивности. Физический смысл свойств адаптивности заключается в следующем. Согласно (4.2.40) управляющая функция u(f) вычисляется по информации о производной которая из- меряется непосредственно (теоретически) или вычисляется. Это означает, что в любой мо- мент времени известно числовое значение функции Лл(—) в уравнении (4.2.39). Поэтому отклонение параметров объекта от расчетных значений, координатные возмущения, вызван- ные внешними силами, непосредственно учи- тываются при вычислениях u(f). Дополни- тельные движения, обусловленные этими фак- торами, парируются системой управления, если достаточно энергетических ресурсов ис- полнительных элементов. Полная независи- мость управляемого движения от параметриче- ских и координатных возмущений имеет место теоретически при бесконечном усилении (к —> -> оо) в контуре старшей производной. Прак- тически, однако, стабильность динамических характеристик сохраняется при конечных и весьма умеренных значениях к. Эти вопросы исследуются в п. 4.2.3. Изложим методику синтеза алгоритмов управления для случая, когда неизменяемая часть системы имеет передаточную функцию общего вида (4.2.34). Как и в предыдущей задаче, требуем, чтобы синтезируемый алго- ритм обеспечивал реализацию в системе дина- мических характеристик, соответствующих эталонной модели (4.2.37). В данном случае управляющую функцию u(f) нельзя непосред- ственно определить дифференциальным зако- ном управления вида (4.2.40), так как уравне- ние управляемой системы (4.2.36) содержит в правой части дифференциальный оператор порядка т. Поэтому поступим следующим образом. Обозначим £/>rIA*(0 = v(0 (4.2.48) н=о и вместо (4.2.36) будем рассматривать диффе- ренциальное уравнение л-1 х(л) + ^avx(v) = v. (4.2.49) v=0 Понятно, что рассматриваемую задачу теперь следует решать для объекта, описывае- мого уравнением (4.2.49). В данном случае V выступает в роли вспомогательной управляю- щей функции. Определив v = v(x, х, из условия реализации в замкнутой системе требуемых динамических характеристик, фак- тическую управляющую функцию и можно найти из дифференциального уравнения (4.2.28). Аналогично (4.2.40) запишем = ®[лн - х(л)], ® = const > 0. (4.2.50) В данном случае коэффициент усиления ае > 0, что соответствует отмеченному ранее правилу знаков для закона управления (4.2.40). ♦ Требуемое значение старшей производной Лл вычисляется, как и в предыдущей задаче, по уравнению эталонной модели с учетом состоя- ния управляемого объекта. Уравнение для фактической управляющей функции получим в результате дифференцирования обеих частей (4.2.48) и последующей подстановки выраже- ния v из (4.2.50). Выполняя эти операции, будем иметь 22 М(И+1) = «К - *(Л)1 <4.2.51) ц=0 или в операторной форме Л(р)«(0 = - Xм (/)], (4.2.52) где В(р) — B(s)s - р. Согласно принятой тер- минологии соотношение (4.2.51) будем назы- вать дифференциальным законом управления порядка т +1. Структурная схема замкнутой системы, соответствующая (4.2.52), изображена на ♦ рис. 4.2.7. Алгоритм вычисления Лл пред- ставлен блоком (лл)> Здесь реализуется соот- ношение (4.2.42). В структуре системы содер- жится оператор В~1(р), соответствующий об- ратному оператору числителя передаточной функции IF(<y). Это означает, что синтезиро- ванный алгоритм управления содержит опера- цию сокращения полинома B(s). Такая операция
АДАПТИВНЫЕ АЛГОРИТМЫ УПРАВЛЕНИЯ СЛЕДЯЩИХ СИСТЕМ 355 Рве. 4.2.7. Структурная схема системы с алгоритмом управления (4.2.52) Рис. 4.2.8. Структурная схема системы с интегральным алгорггмом управления допустима только в том случае, когда нули B(s) расположены в левой полуплоскости Res < 0. В противном случае система не будет обладать свойствами грубости и может ока- заться неустойчивой, если в схему аппаратной или программной реализации алгоритма вво- дятся числовые значения Ь^, отличающиеся хотя бы на малые величины от их фактических значений. Синтезированные алгоритмы основаны на дифференциальных законах управления (4.2.40) и (4.2.51). Принимая во внимание, что по определению = dnx*/dtn , их можно записать в интегральной форме. Выполним интегрирование по времени обеих частей (4.2.40). Принимая равными нулю начальные значения переменных, будем иметь 1/(0 = к = const. (4.1.53) Требуемое значение производной (л - 1)-го порядка т^_! = dn~lx*/dtn~l вы- числяется по соотношениям = J (ч<0 + ₽1*вх - + ₽2*и - 0 п-2 ~^as+2xM'. s=Q (4.2.54) t Vo = J (₽O*BX - a-ox)dt, 0 которые получаются в результате интегрирова- ния по времени обеих частей (4.2.42) без учета начальных значений переменных. Структурная схема замкнутой системы с интегральным алгоритмом управления (4.2.53), (4.2.54) изображена на рис. 4.2.8. В блоке (/) реализуются вычисления /(х, х,х<"’2>) = £а,+2х('>. j=0 Структура соответствует тому случаю, когда эталонная система имеет астатизм вто- рого порядка, так как Ро = °Ч)> Pl = а1- При таком условии из (4.2.54) следует 12*
356 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ t Лл-1 = J[vo+а1(хвх -*)]<* + 02*вх - О л-2 j=0 (4.2.55) t VO = «о/(*и -x)dt. о В прямой цепи содержится два интегра- тора, не охваченных обратной связью. Следо- вательно, порядок астатизма замкнутой управ- ляемой системы также равен двум. Особен- ность интегрального алгоритма (4.2.53), (4.2.54) состоит в том, что порядок производ- ной управляемой переменной, необходимой для вычисления управляющей функции, сни- жается на единицу по сравнению с дифферен- циальным алгоритмом управления. Кроме того, для вычисления требуемого значения * Ли—1 нет необходимости выполнять операцию дифференцирования входного воздействия. Существенно отметить, что динамиче- ские характеристики системы с интегральным алгоритмом управления остаются такими же, как и у системы с дифференциальным алго- ритмом. Это следует непосредственно из того, что передаточные функции систем с диффе- ренциальным и интегральным алгоритмами одинаковы. Действительно, так как t Чп-1 = = *(я) =pnx(t), о р то уравнения замкнутой системы с интеграль- ным алгоритмом управления можно записать в виде Л(р)х(0 = 6о«(Г), u(t) = J[пл (0 - ; Пл (0 = j[₽(P)*iot (0 - а'(р)х(О]. Исключая отсюда управляющую функ- цию и(1), получим дифференциальное уравне- ние (л + 2)-го порядка, которое в точности совпадает с уравнением (4.2.46) системы с дифференциальным алгоритмом управления. Обратимся теперь к дифференциальному закону управления (4.2.51). Интегрируя по времени обе части этого уравнения при нуле- вых начальных значениях переменных, полу- чим I J ~ (4.2.56) °т ц-0 В том случае, когда т = л - 1, в резуль- тате m-кратного интегрирования (4.2.55) най- дем: “(О = т^-(х’ - х) - -г— «п-г(0; °п-1 ' ' *л-1 t М0 = +М)Л> * = 1, 2,..., л-2; О (4.2.57) «0 (0 = «(0^- 0 или в другой форме: “(0 = Т^-(х’ -*)-*— ЕЛ-2-jxV *л-1 ' ' *л-1 t vy=jvy_1<*, У = 1, 2,...,Л-2,- (4.2.58) 0 t v0 = j udt. 0 Расчетные соотношения для х = Ло можно получить, (л - 1) раз интегрируя обе части (4.2.54). Они имеют вид: t X* = -а„х)Л; 0 t Vy = J(vy-1 + ₽jxm - ajx)dt; (4.2.59) 0 j = 1, 2, ..., л - 1; p* = 0, t VO =f(₽O*BX -»ох)л- 0 Таким образом, для вычисления управ- ляющей функции 1/(1) по (4.2.57) или (4.2.58) достаточно иметь информацию только о по- ложении управляемой системы (х) и эталон-
АДАПТИВНЫЕ АЛГОРИТМЫ УПРАВЛЕНИЯ СЛЕДЯЩИХ СИСТЕМ 357 ной модели (х*). Если передаточная функция W *(s) управляемой системы порядка п не имеет нулей, т.е. т = 0, то для вычисления управляющей функции согласно (4.2.53), (4.2.54) необходимо знать производные управ- ляемой переменной до (л - 1)-го порядка включительно. На этом основании заключаем, что наличие полинома B(s) в передаточной функции управляемого объекта снижает требо- вания к объему измеряемой информации в системе. В общем случае, когда степень поли- нома B(s) равна /л, в системе необходимо измерять производные управляемой перемен- ной до (л - т - 1)-го порядка включительно. В качестве примера выведем уравнения алгоритма управления применительно к моде- ли управляемого объекта вида x<4)+X^(v) = Хм(и)- v=0 ц=0 (4.2.60) В данном случае л = 4, т = 3. Пусть мо- дель эталонной системы имеет минимальный порядок г = л + 1 = 5. Примем, кроме того /=г-л + 1=2. Тогда уравнение (4.2.37) будет иметь вид (4.2.61) Как и ранее, не будем конкретизировать порядок астатизма модели (4.2.61). Для приня- тых условий дифференциальный закон управ- ления (4.2.51) будет tv,g+1)=»k-x^i, ц=0 (4.2.62) или в ином виде 2 М J Го (4.2.63) Уравнение (4.2.63) получается в результа- те однократного интегрирования (4.2.62). Требуемое значение старшей производной т)3 = d?x* /dP вычисляется по соотношени- ям t Пз = J(ч»0 + ₽1хи - + ₽2хвх - 0 2 -ZaJ+2XW; j=0 (4.2.64) t VO =f(0O*BX -“0*)Л> 0 которые следуют из (4.2.61) и соответствуют (4.2.54) при л = 4. Преобразуем теперь дифференциальный закон управления (4.2.63) к виду (4.2.58). Трижды интегрируя обе части при нулевых начальных значениях, найдем 2 (4.2.65) t t у J = J V j-idt, v0 = j udt, J = 1, 2. о o Переменная x* вычисляется по общим формулам (4.2.59). Для рассматриваемых кон- кретных моделей (4.2.60), (4.2.61) они имеют вид: t t *’ = f(*3 - a4x) V3 = J (v2 - a3x) <*; о 0 t V2 = J (vi + ₽2*вх - a2x) dt> 0 (4.2.66) t Vl = J (vo + ₽1*BX - alx) dt> 0 t VO = J(₽O*BX 0 На рис. 4.2.9 приведена структурная схе- ма модели формирования управляющей функ- ции по уравнениям (4.2.65). В схему вычисле- ния вводятся значения х, х* и и. Структурная схема вычислителя, реализующего соотноше- ния (4.2.66), представлена на рис. 4.2.10. Для вычисления х* вводятся переменные х, х^.
358 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ хь Рве. 4.2.9. Струпуриая схема модела формировала управлпмце* фуикцаж по (4.2.65) Рас. 4.2.10. Схема аппаратно# реалазацнж алгоритма управления Как показано ранее, порядок старшей производной управляемой переменной, ис- пользуемой для вычисления управляющей функции, снижается при повышении порядка Дифференциального закона управления. В тех случаях, когда степень полинома B(s) сущест- венно меньше степени полинома Л(<у), т.е. т « п - 1, порядок дифференциального за- кона управления можно преднамеренно по- вышать. Рассмотрим эти вопросы сначала приме- нительно к задаче управления движением сис- темы, описываемой уравнением (4.2.38). Урав- нение эталонной модели принимаем в виде (4.2.37). Синтезируемый алгоритм должен обес- печить приближение процессов х(1) —► х’(0 с необходимой точностью. Вместо (4.2.40) рас- сматриваем дифференциальный закон управ- ления второго порядка й + hit = р[т)* - Л, р = const, (4.2.67) signp = sign/)o- Ему соответствует интегральная форма t «(0 = pfnZ-2 - 2) ] - AJ “<*• (4.2.68) 0 Сравнивая (4.2.68) и (4.2.53), замечаем, что для вычисления управляющей функции по (4.2.68) нужно иметь информацию о про- изводной х^п ~ 2\ порядок которой на единицу меньше, чем в (4.2.53). При этом вычисляется по соот- ношениям: г я"3 ni-2 = J (vi + 02*ВХ - а2х)Л - 22«1+3х(,); о 1=0 t Vl = J (ч<0 + - “!•*) (4.2.69) о t Ч<0 = J(₽O*BX -«0х)Л> 0 которые получаются из (4.2.54) в результате однократного интегрирования. С учетом свойств астатизма необходимые формулы, аналогичные (4.2.69), могут быть получены из (4.2.55). По методике, изложенной в п. 4.2.1, можно показать, что система, управляемая дифференциальным законом второго порядка (4.2.67), обладает асимптотическим свойством: при неограниченном увеличении усиления в
АДАПТИВНЫЕ АЛГОРИТМЫ УПРАВЛЕНИЯ СЛЕДЯЩИХ СИСТЕМ 359 контуре старшей производной (р —► оо) про- цесс х(1) Xguffi асимптотически приближает- ся к процессу х*(1) —► в эталонной моде- ли. Достаточная для технических приложений степень приближения х(1) —► х*(0 достигается при конечном значении р. Методика расчета параметров hy р изложена ниже. Для управляемого объекта с передаточ- ной функцией общего вида (4.2.34) дифферен- циальный закон управления строится по урав- нениям v(r) + Av(r) = р{т]л - х(л) j, Л, р = const > О, (4.2.70) = v(0- ц=0 Исключим из (4.2.70) вспомогательную управ- ляющую функцию v(l). Обозначим дифферен- циальный оператор т т+1 (р2+д?)2 V* = ц=0 ;=0 где коэффициенты bj однозначно выражают- ся через h, Ь^. Определив из первого уравне- ния (4.2.70) производные v, v и подставив затем эти выражения во второе уравнение, с учетом принятых обозначений найдем ж+1 X = plri’ - х<">1 (4.2.71) 7=0 Это уравнение представляет собой диф- ференциальный закон управления (т + 2)-го порядка. Интегрируя обе части (4.2.71) по времени, получим ж+1 £ bjuW> = - Х<"-»I (4.2.72) 7=0 Сравнивая (4.2.71) и (4.2.51), заключаем, что для вычисления управляющей функции по (4.2.72) используется старшая производная, порядок которой на единицу меньше, чем в (4.2.51). Это обусловлено тем, что вспомога- тельная управляющая функция v определяется в данном случае дифференциальным законом управления второго порядка. Аналогично тому, как выведены уравне- ния (4.2.57) и (4.2.58), можно привести к ин- тегральной форме уравнения (4.2.72). Расчет параметров алгоритмов управления. Выполним расчет параметров алгоритмов, синтезированных на основе дифференциаль- ных законов управления первого и второго порядков. Необходимая степень приближения управляемого процесса х(1) —► к эталон- ному х*(|) —► Xggffi достигается при достаточно высоком быстродействии контуров управления старшими производными т]л = d*x / dtn. Чем более высокий уровень усиления этих конту- ров, тем выше их быстродействие. Рекомен- дуемые здесь расчетные соотношения установ- лены по результатам обширных численных экспериментов. Определяемые по этим соот- ношениям значения параметров подлежат уточнению при математическом моделирова- нии. Рассмотрим сначала алгоритмы, синтези- рованные на основе дифференциальных зако- нов управления первого порядка (4.2.40) и (4.2.50). Обозначим через Тц постоянную вре- мени контура т]л. Для реализации заданных динамических характеристик проектируемой системы коэффициент усиления контура т]л •необходимо рассчитывать из условия выпол- нения соотношения 1 1 т- =---т*. =------j—г» $1*0, 4 3...5 *’ * max|s*|’ (4.2.73) где ~ полюсы передаточной функции FP(s) управляемого объекта. Найдем формулу для постоянной времени тл в случае, когда урав- нение объекта имеет вид (4.2.38). Рассмотрим структурную схему, изображенную на рис. 4.2.11. Она соответствует уравнениям (4.2.38), (4.2.40). Из схемы следует, что прямая цепь контура старшей производной т)л имеет передаточную функцию z{x(B)) м S (4.2:74) Сигналы -Ц0Х, ..., -ап . \Жп ' выступа- ют в роли возмущающих воздействий для кон- тура х<"), поэтому при определении переда- точной функции Ш|($) другие цепи схемы не учитываются. Согласно (4.2.74) передаточная функция замкнутого контура к (s\ _ _________L_ S + bQk~ v + 1’ 1 (4.2.75)
360 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ Рас. 4.2.11. Структурная схема контура старшей производной В соответствии с (4.2.73) и (4.2.75) для расчета коэффициента усиления получаем следующее соотношение **^“аф* (4.2.76) В том случае, коща передаточная функ- ция W(s) управляемого объекта имеет полю- сы, вспомогательная управляющая функция v определяется дифференциальным законом управления (4.2.50). Расчетным параметром является коэффициент усиления ае. Сравнивая (4.2.38) с (4.2.49) и (4.2.40) с (4.2.50), заключа- ем, что числовое значение ае может быть най- дено по формуле (4.2.76), ще следует принять До = 1, т.е. в = (3...5)max|ty|. (4.2.77) Найденные по (4.2.76) и (4.2.77) число- вые значения коэффициентов усиления не- сколько завышены, поэтому их необходимо уточнить по результатам математического мо- делирования. Выведем теперь расчетные формулы для параметров Л, р закона управления (4.2.67) второго порядка. Их числовые значения долж- ны быть такими, чтобы быстродействие конту- ра было существенно выше быстродейст- вия контура положения. Аналогично (4.2.74) имеем ' s(s + h) Поэтому передаточная функция замкну- того контура рАа s2 + hs + рйо (4.2.78) *,(*) = Параметры Л, р найдем из условия, что- бы процессы в контуре с передаточной функ- цией (4.2.78) были апериодическими или поч- ти апериодические. Запишем передаточную функцию разомкнутого контура старшей про- изводной в виде tr w = Л 1р<|р1 , т = л-’. л' ' s 75 + 1 Потребуем, чтобы асимптотическая лога- рифмическая характеристика Д» = 20^ («>)] = = 20 lg(/l *рА») - 201g а> - 201g 7b при пересечении оси частот имела наклон -20 дБ на декаду. Это требование будет вы- полнено в том случае, если постоянная време- ни инерционного звена Т <(0^ , ще сос - частота среза. В рассматриваемом случае сос = = Л_1рДо. Произведение Л-1р выполняет роль коэффициента усиления к в законе управле- ния первого порядка. Поэтому на основании (4.2.76) примем С учетом обозначения (4.2.73) из этих соотношений находим (9...25) 1 Р = ----1 ; Ч =--------i—Г > у < 1. (4.2.80) Так как по определению Т = Л"1, то из второго равенства (4.2.79) получаем Л = (3...5)у 1 maxpjJ, у < L (4.2.81)
АДАПТИВНЫЕ АЛГОРИТМЫ УПРАВЛЕНИЯ СЛЕДЯЩИХ СИСТЕМ 361 Параметр у представляет собой отноше- ние постоянной времени Т к величине Тс = (Ос1 > те- У = Т/ Тс= Тшс. В табл. 4.2.4. приведены данные, характеризующие зависи- мость перерегулирования <т и длительности переходного процесса /п в системе с переда- точной функцией вида (4.2.78) от величины у. Коэффициенты передаточной функции вычис- лялись по формулам (4.2.80), (4.2.81). Дли- тельность переходного процесса указана в без- размерных единицах. Поэтому количественные данные табл. 4.2.4 справедливы для любых конкретных значений pb$. В натуральном масштабе времени длительность переходного процесса = 6i^(p^o) Из табл. 4.2.4 следует, что наиболее предпочтительным является значение у - = 0,4 ч- 0,5. В этом случае перерегулирование не превышает 4,3 %, а длительность переход- ного процесса минимальна. 4.2.4. Значения показателей переходного процесса Y = Т/ Тс о, % 4 1 16 5,3 0,8 12 4,7 0,6 7 3,9 0,5 4,3 2,0 0,4 1,7 2,1 0,3 0 2,6 Информационное обеспечение алгоритмов управления. Особенность синтезированных алгоритмов управления заключается в том, что для их аппаратной или программной реализа- ции необходимо иметь информацию о стар- ших производных управляемой переменной. Понижение порядка старших производных достигается путем повышения порядка диффе- ренциального закона управления. Так, в слу- чае, когда передаточная функция W(s) управ- ляемого объекта не имеет нулей (т - 0), уравнения алгоритма управления (4.2.53), (4.2.54), синтезированного на основе дифферен- циального уравнения (4.2.40) первого порядка, содержат производные X, х, х^я”^. Если для такого же объекта алгоритм управления синтезируется на основе дифференциального закона управления второго порядка, то поря- док старшей производной в уравнениях алго- ритма снижается на единицу. Это следует из уравнений (4.2.68), (4.2.69), соответствующих Дифференциальному закону управления (4.2.67). Повышая порядок дифференциаль- ного закона управления, можно снизить поря- док старшей производной до необходимого значения. Такому способу, однако, не реко- мендуется отдавать предпочтение. В этом слу- чае контур старшей производной оказывается многопараметрическим, вследствие чего воз- никают затруднения в обеспечении требуемых динамических характеристик. Предпочтитель- ными являются алгоритмы управления с вычис- лением производных стфших порядков по соот- ношениям, которые непосредственно выводятся из дифференциальных уравнений эталонной модели и управляемой системы. Вывод этих со- отношений выполним применительно к алгорит- му (4.2.53), (4.2.54), который соответствует наи- более неблагоприятной ситуации с точки зрения информационного обеспечения. Сначала выведем расчетные соотношения для старшей производной х<л * Исходным является уравнение (4.2.38). Будем считать, что в системе измеряются выходная переменная X и ее производная X. Разрешая (4.2.38) отно- сительно х<л), будем иметь л-1 х(я) = bou - avx(v). (4.2.82) v=0 Интегрируя обе части (4.2.82) при нуле- вых начальных значениях переменных, полу- чим л-2 = /0 - ]Ta„iX(v>, (4.2.83) v=0 где t /о = J (*D" - a»x) dt. (4.2.84) 0 Производные меньших порядков опреде- ляются следующим образом: , . л-Х-1 v=0 (4.2.85) t A-l = J(A-2 - <>x-\x)dt, X = 2, 3....n - 2. 0 Эти рекуррентные соотношения получе- ны в результате последовательного интегриро-
362 Глава 4.1 АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ вания (4.2.83). Здесь также принимаются рав- ными нулю начальные значения переменных. В отличие от измеряемых величин х, х, вы- числяемые величины обозначим: хв,хв,..., х^п~1). С учетом этого формулы (4.2.83) - (4.2.85) запишем в следующем виде: 4"'М = А-1 - «хх - амх - £ av+xx<v); v=2 t fx-1 = f (A-2 - ax-lx) dt, 1 = 1,2,...»n - 2; 0 t fQ=\(b^u-aQx)dt. о (4.2.86) Таким образом, производные управляе- мой переменной до (л - 1)-го порядка вычис- ляются по (4.2.86). Входной информацией схемы вычислений являются данные измере- ний х, х и текущие значения управляющей функции и. Существенно, что в алгоритме вычисления производных не выполняются операции дифференцирования. Особенности организации вычислений по соотношениям (4.2.86) рассмотрим на при- мере системы четвертого порядка (п = 4). В данном случае необходимо вычислять произ- водные х, х. Принимая 1 = 1, 2, из (4.2.86) находим: *в = А - «1* - «2* - а3*в; *в = /1 " а2х - аЗх', (4.2.87) г t fo-j (м - аох) dt, fi = J (/о - «1*) dt. о о Уравнения (4.2.87) могут быть реализо- ваны как на аналоговых моделях, так и про- граммными средствами на цифровых вычисли- телях. Схема решения уравнений (4.2.87) на аналоговой модели показана на рис. 4.2.12. Она соответствует тому случаю, коща произ- водная хв получается интегрированием хв. Менее предпочтительна другая схема, которая основана ца непосредственной реализации уравнений (4.2.87). Производные управляемой переменной мохуг быть вычислены только по измерениям х, и. Аналогично изложенному для этого слу- чая можно получить следующие рекуррентные соотношения: п-Х-1 4"'х) = А-i ~ахх - v=2 t А-1 = J(A-2 - <h,-\x)dt, X = 1,2.....n -1; 0 t h=\(bQU-aQx)dt. о (4.2.88) Итак, используя * соотношения (4.2.86) или (4.2.88), можно вычислить старшую производную управляемой переменной х(»-1) _ хвл-^. Следовательно, закон управ- ления (4.2.53) можно записать в виде «(О = *[пл-1 - Х<"-1)]. (4.2.89) Рассмотрим теперь вопросы, связанные с вычислением требуемого значения старшей производной. Исходными являются соотноше- ния (4.2.54). Будем считать, что в системе из- меряются переменные х, х. Заменим в (4.2.54) производные х, ...,х^л“2^ вычислен- ными значениями хв,..., х^л’2^. В результа- те получим Рве. 4.2Д2. Схема алгормтма аиф го обеспечеяп
ИССЛЕДОВАНИЕ ДИНАМИКИ УПРАВЛЯЕМОЙ УПРУГОЙ СИСТЕМЫ 363 t Пл-1 = f (vo + Мвх - <*1*) dt + 02*вх - О л-2 -азх-азх-^а^зх^; j=2 (4.2.90) t VO =/(₽0*ю -“0*)Л- О В том случае, когда в системе измеряется только переменная х, из (4.2.54) находим t Пл-1 = J (vo + " «1*) dt + Мвх " О л-2 -азх-^а^^. (4.2.91) з=2 Величина \|/q определяется как и в (4.2.90). Таким образом, алгоритм управления с полным информационным обеспечением строится по уравнениям (4.2.89), (4.2.90) или (4.2.89), (4.2.91). Они должны быть дополнены соответственно уравнениями (4.2.86) или (4.2.88). Вычисление требуемых значений Лп-1 по (4.2.90) и (4.2.91) осуществляется с учетом полной информации о текущем состоянии управляемого объекта. Действительно, в схему вычислений вводятся данные измерений х, х, а также производные хв, ..., х£п'2>. Благодаря этому синтезируемые алгоритмы обеспечивают высокую стабильность динамических характери- стик систем при изменении их параметров в широких пределах. Для вычисления требуемых значений старшей производной Лп—1 можно вывести формулы, в которых состояние управляемого объекта учитывается только двумя переменны- ми х, х. При этом вместо х , ..., х^п'2^ в схему вычислений поступают производные / dt2, ... из модели эталонной системы. Так как текущее состояние управляемого объ- екта учитывается в данном случае по ограни- ченной информации, то система с таким алго- ритмом будет (хотя и незначительно) отли- чаться по своим динамическим характеристи- кам от системы с алгоритмами (4.2.90) или (4.2.91). Этот вопрос рассматривается в п. 4.2.3 при исследовании динамики управляемой упругой системы. Вопросы информационного обеспечения алгоритмов управления рассмотрены для мо- дели (4.2.38) управляемого объекта, передаточ- ная функция которого не имеет полюсов. Ана- логично выводятся расчетные соотношения для вычисления старших производных управ- ляемой переменной объекта с передаточной функцией общего вида. Исходным уравнением в данном случае является (4.2.49). Сравнивая (4.2.38) и (4.2.49), заключаем, что необходи- мые расчетные соотношения получаются в результате замены Ьци(/) на вспомогательную функцию v(Z) в формулах (4.2.84), (4.2.86) - (4.2.88). Поэтому нет необходимости рассмат- ривать эти вопросы подробно. 4.2.3. ИССЛЕДОВАНИЕ ДИНАМИКИ УПРАВЛЯЕМОЙ УПРУГОЙ СИСТЕМЫ* Эффективность предложенных алгорит- мов управления и особенности динамики оце- ним на примере двухмассовой упругой элек- тромеханической системы (рис. 4.2.13). Такие модели типичны для систем с упругими меха- низмами передачи движения. Динамические свойства двигателя постоянного тока с незави- симым возбуждением характеризуются пара- метрами кт, кш, индуктивностью L и актив- ным сопротивлением R якорной цепи, а также моментом инерции Ja. Момент инерции на- грузки обозначен через JH, коэффициент пере- дачи редуктора - л, а его упругие свойства характеризуются коэффициентом упругости с. Движение системы описывается дифференци- альным уравнением пятого порядка 4т + S = (4.2.92) dt j=0 где ф - угол поворота вала нагрузки. Коэффициенты уравнения выражаются через параметры модели системы следующим образом: оо=0; «1-y-fwa)'1; •'н УдИ2+Ун с 2 *^д*^н Л2Т~ д н п тэ (4.2.93) "3=^77—Т-+Ьэ3т) ; а4 = Ъ1» *0 = * Синтез алгоритмов управления и математиче- ское моделирование выполнено Г. А. Чхеидзе.
364 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ Рве. 4.2.13. Схема мелела упруго* састемы Принимаем такие числовые значения: *У = 5,4; к£ = 0,043 Н-м-А’1; JH = 100 кгм2; L = 0,001 Гн; ко = 0,073 В-с-рад’1; л = 100; R = 0,1 Ом; /д = 2,94-Ю-4 кгм2; с = 3-10’5 Н-м-рад'1. (4.2.94) С учетом (4.2.94) по формулам (4.2.93) вычисляем: Д1 = 232,6-105; а2 « 104,7-105; а3 = 111,6-104; 04 = 100; bQ = 172,1-Ю5. (4.2.95) Соответствующий этим значениям харак- теристический многочлен, отвечающий (4.2.92), можно представить в ваде Л(5) = (0,445 + 1) (1,09-10-25 + 1) х х (9,02-Ю’6^ + 5,08-10’5<У + 1) S, Первый сомножитель характеризует ди- намику исполнительного двигателя с учетом нагрузки. Его механическая постоянная вре- мени хт = 0,44 с. Второй сомножитель отра- жает инерционность электрических процессов в якорной цепи. Электрическая постоянная времени тэ = 1,09 • Ю’2 с. Динамические свой- ства подсистемы, включающей упругую меха- ническую передачу и нагрузку, характеризует- ся третьим сомножителем. Частота и коэффи- циент затухания собственных колебаний этой подсистемы будут соответственно ©со = 300 с'1; £ « 0,02. Таким образом, управляемый объект представляет собой слабодемпфированную колебательную систему. Вследствие этого син- тезировать алгоритмы управления движением традиционными методами затруднительно. Применительно к модели (4.2.92) синтезируем алгоритмы управления по старшим производ- ным и исследуем их эффективность. Задачу формулируем следующим обра- зом. Пусть требуется синтезировать систему, которая имеет астатизм первого порядка и обеспечивает слежение за входным сигналом Фвх(0 с точностью, характеризуемой неравен- ством |фвх(0"ф(0|<5 = °>3 * 1°’2 РВД- Пе- реходный процесс в системе должен заканчи- ваться по истечении интервала времени » « 0,6 с, а перерегулирование не должно пре- вышать величины о = 20 %. Этим требовани- ям задания на проектирование соответствует эталонная система с передаточной функцией (в разомкнутом состоянии) вада ^(s)^0’2;2/199’34^13;6. (4.2.96) Я52 + 1Д45 + 1,361 Частота среза, соответствующая 1Кэ(мо) , со- ставляет сос « 30 рад • с'1. В соответствии с рекомендациями разви- той процедуры синтеза эталонная модель должна иметь порядок г, по крайней мере, на единицу больший порядка п управляемого объекта (г £ п + 1). В этом случае при вычис- лении управляющей функции не требуется выполнять операцию дифференцирования входного сигнала Фвх(0- Так как п = 5, а по- рядок эталонной модели (4.2.96) равен трем, вместо FK3(s) принимаем модель с переда- точной функцией И'эМ = , * .3 (4.2.97) (Z5 + If Числовое значение постоянной времени т следует назначать таким, чтобы процессы в
ИССЛЕДОВАНИЕ ДИНАМИКИ УПРАВЛЯЕМОЙ УПРУГОЙ СИСТЕМЫ 365 замкнутых системах с передаточными функ- циями (4.2.96) и (4.2.97) практически не отли- чались. Для этого достаточно принять т = = 1 / Юшсо « 0,003 с. В таком случае полиномы 0(5), a(s) передаточной функции эталонной системы (4.2.35) будут: 0(5) = 30,2s2 + 199,345+ 1316; a(s) = 2,7 • 10-8 л6 + 2,703 • 10'5 J5 + + 9,03 • 10-3 Л4 + 1,0 153 + 31,3525й + + 200,75+ 1316. (4.2.98) Дополнительный множитель 1/(0,003 5 + + l)3 в передаточной функции (4.2.97) дефор- мирует частотную характеристику в диапазоне частот о > 330 рад • с"1. Это не оказывает су- щественного влияния на динамику системы, так как составляющие переходного процесса е-333/ fe-33* fie-ЗЗУ соответствующие трехкратному полюсу 1/0,003, затухают по истечении времени по- рядка 0,01 с. Обозначив через ф* выходную перемен- ную эталонной модели, ее уравнение запишем в ваде (4.2.37) (4.2.99) Коэффициенты а^, 0/ соответствуют полино- мам (4.2.98). Согласно постановке задачи алгоритм управления должен обеспечивать выполнение условия |ф* (0 - ф(/)| < 5 в установившемся движении системы. Синтезируем алгоритм управления по старшей (пятой) производной. Алгоритм будем строить на основе дифферен- циального закона управления первого порядка вида (4.2.40). Записываем его в интегральной форме (4.2.89). В обозначениях рассматривае- мой задачи он имеет вид 1/(0 = dr]} - ф<4>], к = const > 0, (4.2.100) (4) - тле фр - вычисленное значение четвертой производной управляемой угловой координа- ты. Далее принимаем, что в системе измеря- ется только выходная переменная ф(/). С уче- том этого запишем расчетные соотношения для ф£*) и т|4. Формулы для ф£*) получают- ся из (4.2.88) в результате замены х = ф, XgV) = фз^ . Принимая здесь л = 5, будем иметь: 4-Х Фвч) = А-1 - V=1 t А-1 = J(А-2 " аХ-1ф)Л, = 1,2,...,4, 0 / /о = ^dt, о (4.2.101) При выводе (4.2.101) принято во внима- ние, что Oq = 0. Требуемое значение четвертой производ- ной Т|4 для принятых условий вычисляется по соотношениям: / П4 = f (V0 + 01Фвх " а1ф)Л + 02Фвх " а2Ф " 0 3 - j=0 (4.2.102) t Ф0 = /(РоФвх -“офИ> 0 которые следуют из (4.2.91) после подстановки хт = Фвх > х = Ф, xbJ) = Фв} • ДРУГОЙ вари- ант алгоритма информационного обеспечения соответствует тому случаю, когда для вычисле- ния т|4 используются производные (Ftp* / dF, 5 = 1, 2, 3 вместо ф^. Эти соотношения получаются непосредственно из (4.2.102). Итак, алгоритм управления строится по уравнениям (4.2.100) - (4.2.102). Расчетным параметром в алгоритме является коэффици- ент усиления к контура старшей производной ф(5). Числовое значение к определяется по формуле (4.2.76). В данном случае корни 5^ характеристического уравнения, соответст- вующего (4.2.92), при указанных в (4.2.95) значениях параметров будут: 51 = 0; S2 = -2,28; 53 = -92,08; 54>5 « 28,22 ± /330,46. Следовательно, тах|5^|« 332, и по (4.2.76) с учетом (4.2.95) находим к s 5,78 • 10'5.
366 Глава 4.2. АЛГОРИТМЫ УПРАВЛЕНИЯ С ЕСТЕСТВЕННЫМИ СВОЙСТВАМИ АДАПТИВНОСТИ В табл. 4.2.5 приведены числовые дан- ные, характеризующие зависимость домини- рующих полюсов передаточной функции син- тезируемой системы от коэффициента усиле- ния к. В последней строке табл. 4.2.5 указаны числовые значения доминирующих полюсов передаточной функции эталонной модели. Чтобы не загромождать таблицу, остальные полюсы не приводятся. Из анализа следует, что при увеличении к шесть полюсов переда- точной функции синтезируемой системы при- ближаются к соответствующим полюсам пе- редаточной функции модели. При этом седь- мой полюс удаляется от мнимой оси в область бесконечных отрицательных значений. На- пример, при к = 10'3 значение этого полюса Sy = -1,635 • 104. 4.2.5. Значения корней характеристического уравнения к 10-4 *1,2 *3 0,2 -3,000 ± / 6,585 -40,735 -133,716 0,6 -2,997 ± i 6,583 -39,264 -153,651 1,0 -2,996 ± i 6,583 -38,992 -140,992 2,0 -2,995 ± i 6,583 -38,794 -135,983 6,0 -2,995 ± / 6,582 -38,663 -133,440 10,0 -2,995 ± / 6,582 -38,637 -132,983 Эталон -2,995 ± i 6,582 -38,598 -132,326 При расчетном значении коэффициента • усиления к = 5,78 * 10’5 степень приближения процессов ф(/) —> (р*(0 в эталонной и проек- тируемой системах характеризуется величиной интегральной квадратичной оценки 2 J= J[<p*(/)-<p(/)] Л-310-6, о1 что свидетельствует о высокой динамической точности системы, управляемой по старшей производной. Существенно при этом, что ука- занные характеристики сохраняются при из- менении момента инерции нагрузки JH в 5 раз при неизменных значениях параметров алго- ритмов информационного обеспечения. Это является следствием проявления адаптивных свойств системы. Исследование динамики выполнено так- же и в том случае, когда при вычислении тре- буемого значения производной л 4 по (4.2.102) вместо ф^ используются производ- ные =ds<?*/df, s = 1, 2, 3, определяе- мые по уравнениям эталонной модели. В этом случае динамические характеристики системы, аналогичные предыдущим, достигаются при более высоком (на порядок) усилении в кон- туре старшей производной. Выполним теперь расчет параметров дифференциального закона управления вто- рого порядка вида (4.2.67). В обозначениях рассматриваемой задачи согласно (4.2.68) он записывается в интегральной форме t “(0 = р[п»-2 - Ф(И"2)] - л/ «Л. (4.2.103) 0 Параметры А, р рассчитываем по формулам (4.2.80), (4.2.81), ще принимаем у в 0,5. Так как ?£ = 0,003, то по (4.2.80) и (4.2.81) вычис- ляем р = 0,118, А = 1990. Закон управления (4.2.103) с этими значениями параметров реа- лизует в системе такие же динамические ха- рактеристики, как и алгоритм (4.2.100) - (4.2.102). Таким образом, результаты исследования динамики управляемой двухмассовой упругой системы полностью подтверждают теоретиче- ские положения о том, что алгоритмы управ- ления по старшим производным реализуют в системах высокую динамическую точность и придают им свойства естественной адаптивно- сти, т.е. слабой чувствительности к изменению параметров и действию возмущающих сил.
АЛГОРИТМЫ СТАБИЛИЗАЦИИ СТАЦИОНАРНЫХ СОСТОЯНИЙ 367 Глава 4.3 СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ ДВИЖЕНИЕМ МНОГОМЕРНЫХ СИСТЕМ Изложенные в этой главе методы синтеза алгоритмов основаны на применении схем управления по ускорениям и старшим произ- водным управляемых координат [5]. Для аппа- ратной или программной реализации синтези- рованных алгоритмов достаточно измерять в системе выходные переменные и скорости их изменения. Алгоритмы управления по ускоре- ниям и старшим производным можно синте- зировать по сепаратным моделям, соответст- вующим отдельным степеням свободы много- мерной системы. 4.3.1. АЛГОРИТМЫ СТАБИЛИЗАЦИИ СТАЦИОНАРНЫХ СОСТОЯНИЙ Рассматриваем систему с п степенями свободы, возмущенное движение которой опи- сывается уравнениями 7^[gvu*u. + + ~ uv> м=1 (4.3.1). v = 1, 2, ..., л, ще Хц - выходные переменные - управляемые координаты, характеризующие положение системы; и? - управляющие функции. Пара- метры Оуц, Ьущ и - постоянные числа либо медленно меняющиеся и ограниченные функ- ции времени в области определения уравнений (4.3.1). В векторной форме эти уравнения записываются в виде Ах + Вх + Сх = и, (4.3.2) где (п х л)-матрицы А = [avJ; В = [Д,и]; С = = [CvJ; л-мерные векторы uT = [i/i ... ил], х7 = pq ... хл]; х, х - производные вектора х по времени. Матрица А определенно положительна, поэтому существует обратная ей матрица А-1. Следовательно, умножая все члены уравнения (4.3.2) слева на А-1, разрешим его относитель- но вектора ускорений: х = w(x, х, и), (4.3.3) ще w(...) = А"1 (и - Сх - Вх). (4.3.4) Векторному уравнению (4.3.3) соответст- вует система уравнений в координатной форме xv = wv(x, х, и), v=l,2,...,n, (4.3.5) где wv есть компоненты w. Будем рассматривать следующую задачу. В начальный момент времени / = О состояние системы характеризуется значениями Xv(0) = *v0! *v(°) = Xv0. (4.3.6) Требуется найти такие управляющие функции Uy, = Uy,(Xy х) , которые переводят систему (4.3.5) из произвольного начального состояния (4.3.6) в окрестность стационарной точки xv = xj = const, Ху, = 0 (4.3.7) и удерживают ее в этой окрестности бесконеч- но долго. Необходимо при этом, чтобы в про- цессе перехода xv (/) —> xj управляемые ко- ординаты с требуемой степенью точности сле- довали за решениями xv(f) -> xj дифферен- циальных уравнений второго порядка + У vl^v + У vfr^v = У vO^v ’ (4-3.8) v = 1, 2, ..., л. Начальные условия для этих уравнений xv(O) = xvo, xv(O) = xvo соответствуют на- чальному состоянию системы. Уравнения (4.3.8) выступают в роли эталонных моделей, которые определяют динамику проектируемой системы по каждой степени свободы. Назначая соответствующим образом числовые значения параметров yvi, yvo моделей, можно задавать требуемые показатели переходных процессов: длительность, перерегулирование и др. Структуру алгоритмов будем определять по методу обратных задач динамики, сущест- венно используя принцип управления по ускорениям. Движение системы из произ- вольного начального состояния (4.3.6) в окре- стность точки (4.3.7) будет проходить по пред- писанной траектории |x*(f), **(0}, если для каждого t £ 0 выполняются равенства xv(Z) = x*(Z). Согласно (4.3.8) требуемые ускорения *v(0 = У vO^v “ “ У vl^v> (4.3.9) а фактические значения ускорений определя- ются по (4.3.5). Обозначим через i/v управ- ляющие функции, которые создают движение,
368 Глава 4.3. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ ДВИЖЕНИЕМ соответствующее эталонным моделям, с уско- рениями wv(xv, xv) = yv0(xv-xv)-YviXv. (4.3.10) С учетом (4.3.5) и (4.3.10) для uv нахо- дим следующие уравнения: wv(x, х, u*j = w*(xv, xv), v= 1,2,...,л. (4.3.11) Непосредственное решение (4.3.11) с учетом (4.3.4) приводит к алгоритму компен- сационного типа. Чтобы синтезировать алго- ритмы управления по ускорениям, уравнения (4.3.11) будем решать с помощью следящих контуров, процессы в которых описываются соотношениями МО = Spv/(wj " Xj)f pvj = const, J=1 (4.3.12) v = 1, 2, ..., n. Соотношения (4.3.12) представляют со- бой дифференциальные законы управления по ускорениям. Определяемые по (4.3.12) управ- ляющие функции i/v являются приближенны- ми решениями уравнений (4.3.11), т.е. uv # i/v. Поэтому переходные процессы xv (/) -> xj не будут совпадать с эталонными процессами x*(t) -> xj . Отклонения коорди- нат 6xv = xv - xv будут тем меньше, чем меньше отклонения управляющих функций uv - uv. При этом степень приближения Mv (0 -► Mv (0 будет тем выше, чем более высоким быстродействием обладают контуры ускорения. Это достигается, в свою очередь, соответствующим выбором параметров pw в (4.3.12). Для вычисления управляющих функций по (4.3.10), (4.3.12) необходимо иметь инфор- мацию об ускорениях xv управляемых коор- динат. Чтобы исключить эту необходимость, преобразуем уравнения алгоритма к инте- гральной форме. С этой целью проинтегриру- ем по времени обе части (4.3.12). Принимая равными нулю начальные значения перемен- ных, будем иметь На рис. 4.3.1 изображена структурная схема замкнутой системы с алгоритмом (4.3.13), (4.3.10). Она соответствует векторной форме уравнений u(0 = Р j w*(x, х)Л - х .0 (4.3.14) w*(x, х) = Г0(х° - х) - I^x. Здесь (л х л)-матрицы р = [pvj, Го = = diag{Yvoh П = diag{Yvi}. Требуемые уско- рения вычисляются по (4.3.10). Управляемая система представлена на схеме моделью (4.3.3). В данном случае для вычисления управляю- щих функций не требуется информация об ускорениях управляемых координат. Алгоритм управления в интегральной форме можно представить другими уравне- ниями. Подставив выражение для w* под ин- теграл в (4.3.14) и выполнив интегрирование, найдем и(0 = р t r0J(х° - xjd/ - Г|Х-х о (4.3.15) Рис. 4.3.1. Структурная схема системы с алгоритмом управления (4.3.14)
АЛГОРИТМЫ СТАБИЛИЗАЦИИ СТАЦИОНАРНЫХ СОСТОЯНИЙ 369 Рис. 4.3.2. Структурная схема системы с интегральным алгоритмом управления Структурная схема замкнутой системы, соответствующая (4.3.15), изображена на рис. 4.3.2. Изучим свойства многомерной системы, управляемой по ускорениям. Ее динамика описывается следующими уравнениями: х = w(x, х, и), й = p(w* - х); (4.3.16) w* =Г0(х°-х)-Г1х. Из системы (4.3.16) выведем одно урав- нение путем исключения вектора управляю- щих функций U. Для этого необходимо про- дифференцировать первое уравнение по вре- мени, а затем подставить в полученное равен- ство выражение для й из второго уравнения. Выполним указанные операции. По условию, параметры модели управляемой системы - медленно меняющиеся функции времени. Будем считать, что за время переходных про- цессов xv (/) -> х® они остаются постоянны- ми. В таком случае из (4.3.16) найдем х + А-1(р + В)х + А-1(рГ1 +С)х + + А-1рГ0 х = А-1рГ0 х°. (4.3.17) Так как размерность вектора х равна л, то уравнению (4.3.17) соответствует система ска- лярных уравнений порядка Зп. Из (4.3.17) следует, что по каждой степе- ни свободы система обладает астатизмом пер- вого порядка, т.е. в установившемся движении система не имеет статических ошибок при воздействии на ее входы постоянных задаю- щих сигналов Ху = const. Действительно, при t -> оо производные х$^ (/) -> 0, поэтому из (4.3.17) находим xv(oo) = xj . Чтобы синте- зировать систему, обладающую астатизмом более высокого порядка, нужно повысить по- рядок астатизма эталонных моделей. При постановке задачи синтеза сформу- лировано требование, чтобы управляемое дви- жение по каждой координате xv (t) -> xj с необходимой степенью приближения следова- ло за решениями x*(O~>xJ дифференци- альных уравнений второго порядка. Однако переменные Xv(0 являются решениями систе- мы Зп взаимосвязанных уравнений. Практиче- ский интерес поэтому представляет определе- ние условий, при которых может быть достигнута требуемая степень приближения xv(0 -> х’(0. При исследовании одномерных систем было установлено, что теоретически точная реализация назначенных траекторий движения достигается при бесконечно высоком быстродействии контуров ускорения. Аналогичное положение справедливо также и для многомерных систем, управляемых по ускорениям. Чтобы установить эти асимптоти- ческие свойства, поступим следующим обра- зом. Умножим каждый член уравнения (4.3.17) на квадратную диагональную матрицу О = А)1» 1 Рпл а затем выполним предельный переход при Pw -> оо, v = 1, 2, ...» п. Указанная операция означает, что каждое уравнение (4.3.18) v = 1, 2, ..., п умножается на pvJ , а затем вычисляются со- ответствующие пределы при pvv —> Симво- лом ЬЬ обозначена v-я строка матрицы,
370 Глава 4.3. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ ДВИЖЕНИЕМ стоящей в скобках. Опустим подробности вы- числений, ограничившись указанием отдель- ных соотношений, которые связаны с их вы- полнением. Будем считать, что числовые значения параметров pvy назначены такими, что замкну- тая система, описываемая уравнением (4.3.17), имеет устойчивое состояние равновесия в точ- ке Ху = const, х® = 0 . При вычислениях принимаем во внимание равенства lim ^М0, V*y’ Pw-*00 Pw I1, V = 1. Кроме того, справедливо Pw если pw —> оо, Pjj —> оо, v # j. Имеют место также предельные соотно- шения: lim [р-1А-1р] = А"1; lim [р‘1А‘1рГ11 = А^Гь pw->«* J (4.3.19) lim [р-1А-1в] = lim Гр-1 А-1с] = 0; . pw->®L J Pw->«A J plimJp-’A^pFo] = А-’ГО. Указанные здесь пределы вычисляются при условии, что одновременно все pvv —> оо, v = 1, 2, ..., п. После умножения слева всех членов уравнения (4.3.17) на pjj1 и выполнения пре- дельных переходов с учетом (4.3.19) найдем Х + Г1Х + Г0Х = ГоХ°, (4.3.20) или в скалярной форме Xv + Yvl*v +YvOXv =YvOXv, (4.3.21) v = 1, 2, ..., n. Уравнения (4.3.21) в точности совпадают с уравнениями (4.3.8) эталонных процессов, которые определяют динамику проектируемой системы по каждой степени свободы. Полученный результат позволяет сделать заключения, имеющие важное практическое значение для решения задачи синтеза алгорит- мов управления движением сложных систем. 1. При неограниченном увеличении чи- словых значений диагональных элементов pw матрицы р = [ру/] коэффициентов усиления в алгоритме управления по ускорениям (4.3.12) уравнения (4.3.18) замкнутой системы порядка Зп переходят в п независимых уравнений (4.3.21) второго порядка, определяющих эта- лонные процессы x*(Z) —> х® по каждой управляемой координате. Следовательно, алго- ритмы управления по ускорениям реализуют в асимптотике (pw —> оо) предписанные траек- тории движения многомерной системы. 2. Так как величины pw характеризуют уровень усиления в контурах ускорения и их быстродействие, то практически необходимая для технических приложений степень прибли- жения управляемых процессов xv(/) —> xj к эталонным х*(/)->х® достигается при ко- нечных значениях коэффициентов pw. 3. Контуры управления ускорениями- по каждой степени свободы можно строить неза- висимо один от другого в соответствии с урав- нениями: й(0 = Pw(wv - Xv); Pw = const; (4.3.22) v = 1, 2, ..., л, или в интегральной форме МО ~ Pw Ху , .0 V = 1, 2, ..., п. (4.3.23) При этом требуемые ускорения wv вычисля- ются по формулам (4.3.10). Таким образом показано, что назначае- мые переходные процессы x*(f) -> х®, опре- деляемые дифференциальными уравнениями второго порядка, теоретически (pw -> °°) реа- лизуются с помощью управляющих функций, формируемых для каждого канала независимо от других, т.е. управление движением по каж- дой степени свободы осуществляется автоном- но. Практически же необходимая для техниче- ских приложений степень приближения Ху(/)->Ху(0 достигается при конечных значениях коэффициентов усиления pw, но таких, чтобы выполнялись неравенства |pv/(*; - *;)|« М*’ -J * v-
АЛГОРИТМЫ СТАБИЛИЗАЦИИ СТАЦИОНАРНЫХ СОСТОЯНИЙ 371 Физически это означает, что диагональ- ные элементы pw матрицы р должны быть такими по сравнению с элементами pvy, чтобы отклонения ускорений (wj -Ху) не оказыва- ли существенного влияния на процессы в ка- налах управления. Следовательно, алгоритмы управления по ускорениям позволяют осуществить динамиче- скую развязку управляемой системы по каж- дой степени свободы, т.е. осуществить ее де- композицию. Это означает, что синтез алго- ритмов можно выполнять по сепаратным мо- делям. Изложим методику расчета параметров алгоритмов управления. Их числовые значения должны быть такими, чтобы быстродействие контуров ускорения было существенно выше быстродействия контуров положения по каж- дой управляемой координате. В практике про- ектирования автоматических систем степень приближения управляемых координат к назна- ченным эталонным xv (/) —> xv (/) удобно оценивать по величине перерегулирования uv и длительности /у протекания переходного процесса. По этим инженерным критериям будем рассчитывать параметры алгоритмов. На основании доказанного положения о возможности синтеза алгоритмов по сепарат- ным моделям матрицу р принимаем диаго- нальной, т.е. р = ро = diag{pw}. В этом слу- чае уравнения (4.3.10), (4.3.22) будут содер- жать Зп параметров. Из них 2п параметров - коэффициенты усиления yvo, Yvi внешних кон- туров и п параметров - коэффициенты усиле- ния pw контуров ускорений. Параметры yvo, Yvi рассчитываются с учетом инерционных характеристик управляемой системы, чтобы назначаемые динамические свойства эталон- ных моделей (4.3.8) были физически реали- зуемыми в проектируемой системе. Расчет параметров yvo, Yvi выполним по методике п. 4.3.2. Пусть в результате анализа управляемой системы определена достижимая (наимень- шая) длительность tv переходного процесса xv(/) “> 1,0 каждой координате. Обозна- чим через Тч постоянные времени эталонных систем. Их уравнения (4.3.8) запишем в стан- дартной форме: •.*_!.* 1 * 12 *v + 2£ Xv + 2 Ху> ~ ’ rv т; т$ (4.3.24) v = 1, 2, ..., л, гае - коэффициенты затухания собственных колебаний. Сравнивая (4.3.8) и (4.3.24), находим Y v0 = ~=2 ’ Y vl = 2 •—, / v I v (4.3.25) v = 1, 2, ..., Л. Для наиболее предпочтительного пере- ходного процесса х*(/) —> xj в (4.3.25) следу- ет принять £v = V2/2. В этом случае дли- тельность процесса tv « 3TV, а перерегулиро- вание av < 5 %. Далее будем считать, что чи- словые значения yvo> Yvi вычисляются по (4.3.25) при указанном условии. Обратимся теперь к расчету коэффици- ентов усиления pvv. Обозначим через 7^ по- стоянные времени контуров ускорения. Тогда числовые значения pw должны быть определены из условия выполнения неравенств « Ту. Для этого необходимо найти соотношения, связывающие 7^ с коэффициентами усиления pw. С этой целью рассмотрим уравнения дви- жения по отдельной степени свободы: avvxv +Ь^Ху, = +ч\(х, х’, х'); «V = Pw(^v “*v)> (4.3.26) wv = Y v()(*v “ *v) “ Y vl^v Первое уравнение описывает динамику по координате Ху. Здесь функция \|/v характе- ризует влияние других каналов. Штрихом от- мечены векторы, которые не содержат компо- нент с номером v. Структурная схема сепарат- ного канала, соответствующая уравнениям (4.3.26), изображена на рис. 4.3.3. Принимая, как и ранее, производные avv » 0, Z>vv » 0, из (4.3.26) получим уравнение для ускорения: z . * flw & + (^w +Pvv)wv “Pw^v + (4.3.27) Отсюда следует, что быстродействие кон- тура определяется величиной . (45М) t>W + Pw которая выступает в роли постоянной време- ни. Величина Tw может лишь условно назы-
372 Глава 4.3. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ ДВИЖЕНИЕМ Рис. 4.3.3. Структурная схема сепаратного канала системы ваться постоянной времени, если avv и Ь™ переменные. Поэтому при расчетах следует принимать наибольшие значения avv и наи- меньшие значения Ь™, возможные в области определения уравнений (4.3.1). С учетом изложенного коэффициенты усиления pw рекомендуется рассчитывать по соотношениям maxT^pw) = (0,2 - 0,25) Tv, (4.3.29) v = 1, 2, ..., п. Расчетные значения pvv уточняются по результатам математического моделирования. 4.3.2. АЛГОРИТМЫ УПРАВЛЕНИЯ МНОГОМЕРНЫХ СЛЕДЯЩИХ СИСТЕМ ВЫСОКОЙ ДИНАМИЧЕСКОЙ ТОЧНОСТИ Уравнения неизменяемой части системы принимаем в виде (4.3.1). Считаем, что ее параметры могут быть медленно меняющими- ся функциями времени, ограниченными в области определения уравнений. Примени- тельно к этой модели будем рассматривать задачу синтеза алгоритмов, обеспечивающих слежение за входными задающими сигналами с высокой точностью. Алгоритмы будем стро- ить на основе схем управления по ускорениям по методу обратных задач динамики. Пусть по техническому заданию на про- ектирование сформированы математические модели эталонных систем, динамика которых отвечает требованиям к проектируемой систе- ме по каждой степени свободы. Для опреде- ленности принимаем, что уравнения этих мо- делей имеют третий порядок: +Yv2x* + Yvl** + Y vO*C =/wvljv (4.3.30) v = 1, 2..n. Здесь yv - входные задающие сигналы. Будем считать, что mvo = YvO> т»\ ~ Yvi- Вследствие этого эталонные системы (4.3.30) обладают астатизмом второго порядка. В конкретных задачах проектирования уравнения эталонных процессов, назначаемые для различных степеней свободы, могут иметь различный порядок. Более того, автоматиче- ская система может проектироваться с различ- ными функциональными назначениями кана- лов управления: по одним из них должна вы- полняться стабилизация заданных состояний, а по другим - слежение за входными сигналами. В таких случаях алгоритмы стабилизации син- тезируются на основе сепаратных моделей по методике п. 4.3.1, а синтез алгоритмов управ- ления, обеспечивающих слежение, осуществ- ляется по методике, которая рассматривается ниже. Основываясь на методических положе- ниях п. 4.3.1, эти вопросы изложим без де- тальных построений и доказательств. Итак, требуется синтезировать алгоритмы управления, которые реализуют в многомер- ной следящей системе динамические характе- ристики, определяемые эталонными моделями (4.3.30). Алгоритмы будем строить на основе дифференциальных законов управления по ускорениям 7=0 (4.3.31) kyj = const, v = 1, 2, ..., п. * Требуемые значения ускорений Wj вы- числяются по уравнениям (4.3.30). Принимая во внимание, что Yv/ = mv/, v = 0, 1, из усло- вия выполнения равенств xv (/) = xv (/) в соответствии с (4.3.30) можем записать ~ У vo(.Fv _ xv) + У vl(^v “ *v) “ У v2*v» (4.3.32) v = 1, 2...п. Интегрируя обе части (4.3.32) по време- ни при нулевых начальных значениях соответ- ствующих переменных, найдем
АЛГОРИТМЫ УПРАВЛЕНИЯ МНОГОМЕРНЫХ СЛЕДЯЩИХ СИСТЕМ 373 W*(xv, Xv, /) = t = Y vO J(yV — xv) dt + y vl(.Xv — *v) “ Y v2 xv> 0 (4.3.33) v = 1, 2, ..., n. Таким образом, управляющие функции следящей системы вычисляются по уравнени- ям (4.3.31), (4.3.33). Запишем их в векторной форме й(0 = K^w* - xj; (4.3.34) w (х, х, t) = t = Г0|(у-х)Л+Г1(у-х)-Г2х. О Здесь (л х л)-матрицы К = [Aty], Г/ = [yvJ, / = О, 1, 2; вектор ут = [yj ••• уя]. Другие обозначения соответствуют ранее принятым. Для вычисления управляющих функций по (4.3.34) необходимо иметь информацию о выходных переменных Ху и производных xv, xv. Чтобы исключить необходимость измерения ускорения управляемых координат, эти уравнения следует преобразовать к инте- гральной форме. Выполняя интегрирование в (4.3.34), найдем: t u(/) = K Го|<Рол + гоФо "Г2Х"* » о (4.3.35) t Ч>о(') = /(у-х)Л. О Структурная схема замкнутой системы с алгоритмом (4.3.35) изображена на рис. 4.3.4. Неизменяемая часть системы представлена на схеме моделью (4.3.3). В данном случае вы- числение управляющих функций выполняется по информации об х, х. Измерять ускорения управляемых координат нет необходимости. В структуре системы по каждой степени свободы содержится два последовательно включенных интегратора, не охваченных об- ратными связями. Следовательно, каждый канал управления обладает астатизмом второго порядка, что соответствует структуре эталон- ных моделей (4.3.30). Процессы в замкнутой многомерной системе описываются уравне- ниями: х = А '(и-Вх-Сх), u = k(w*-x), (4.3.36) t w* = Го j(y- х)^+Г1(у- х)- Г2х. о По условию параметры системы ауц, cvil - медленно меняющиеся функции времени. Будем считать, что на интервале времени, имеющем порядок длительности переходных процессов в эталонных моделях, производные A(Z) « 0, B(Z) « 0, C(Z) « 0. В таком случае из (4.3.36) можно получить одно векторное уравнение Ах7^ + Вх + Сх + К [х + Г2х + Пх + Гох] = = К[Г1у + Г0у]. (4.3.37) Справедливо следующее: при неограни- ченном увеличении числовых значений диаго- нальных элементов Л™ матрицы К — [А\у] уравнение (4.3.37) четвертого порядка перехо- дит в уравнение третьего порядка х + Г2х + Пх + Гох = Г1У + Гоу. (4.3.38) Так как по условию yvi = myj, уУо = Л1Уо, то векторному уравнению (4.3.38) соответствует система независимых скалярных уравнений xv + Y v2xv + Y vlxv + Y vOxv = = mvlyv +mvOyv, v = 1, 2..л, которые в точности совпадают с уравнениями эталонных моделей. Диагональные элементы A\,v являются ко- эффициентами усиления контуров ускорений. Поэтому сформулированный результат можно интерпретировать следующим образом: при неограниченном повышении уровня усиления в контурах ускорений (kw -> оо) многомерная и многосвязная система распадается на п неза- висимых одномерных систем третьего порядка, динамика которых в точности соответствует динамике эталонных моделей. Следовательно, при достаточно высоком усилении в контурах ускорений управление многомерной системой можно осуществлять по каждой степени сво- боды независимо с помощью алгоритмов «v(o-*v),
374 Глава 4.3. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ ДВИЖЕНИЕМ Рис. 4.3.4. Структурная схема сястемы с алгоритмом управления (4.3.35) t wv = Y vO J (Уу “ *v) + Y vl(^v — *v) — Y v2*v 0 или в интегральной форме wv(/) = = ^VV Y vO JVvO^ + Y vlVvO Y v2xv xv » 0 (4.3.39) t 4>v0(O = J(yv -xv)dt. о Структурная схема сепаратного канала управления аналогична схеме рис. 4.3.4, где следует выполнить замену: Г/ ~ yv/> К ~ kyVt а векторные переменные заменить скалярными функциями. Параметры yvy алгоритма (4.3.39) опреде- ляются в процессе формирований моделей эталонных систем (4.3.30) по требованиям технического задания на проектирование. Если система (4.3.1) нестационарна, то коэффици- енты усиления куу контуров ускорений рассчи- тываются по соотношениям Д W max = (0,2-0,25)Tv, (4.3.40) Tv = 1 /^/y vo , v = 1, 2, ...» л, которые аналогичны (4.3.28), (4.3.29). В левую часть (4.3.40) подставляются наибольшие зна- чения <7Vv и наименьшие значения Ьуу, воз- можные в области определения уравнений движения (4.3.1) 4.3.3. СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ С УЧЕТОМ ДИНАМИКИ ИСПОЛНИТЕЛЬНЫХ ЭЛЕМЕНТОВ Управляющие функции Uy в уравнениях (4.3.1) представляют собой силы и (или) мо- менты, с помощью которых создается движе- ние системы. В предыдущих разделах синтез алгоритмов выполнен в предположении, что требуемые значения управляющих сил и мо- ментов устанавливаются мгновенно. В техни- ческих системах подобные ситуации имеют место в тех случаях, когда инерционность ис- полнительных элементов не оказывает сущест- венного влияния на динамику системы в це- лом. В этом параграфе рассматриваются про- цедуры синтеза алгоритмов по моделям, учи- тывающим инерционные свойства исполни- тельных элементов. Уравнения движения управляемой сис- темы запишем в виде п ] = Cv» Ц = 1 ^vQv + Qv ~ *vinv — ^v2*v> (4.3.41) v = 1, 2, ..., п. Первая группа уравнений аналогична (4.3.1). Здесь Qy - обобщенные силы, разви- ваемые исполнительными элементами (приводами) системы. Вторая группа уравне- ний характеризует процесс установления сил. Здесь Tv - постоянные времени; куу ку2 - ко- эффициенты усиления. Управляющими функ- циями являются Т]у В данном случае динами- ка исполнительных элементов представлена моделями первого порядка. Такая аппрокси- мация применяется сравнительно часто в рас- четных схемах, используемых при синтезе алгоритмов управления. В частности, в такой форме записываются уравнения вращательных моментов на валу исполнительных двигателей постоянного тока с независимым возбуждени- ем. Такими уравнениями (при ку2 = 0) описы- вают процесс установления тяги двигательных систем. Методику синтеза алгоритмов подроб- но изложим для моделей (4.3.41), а затем от- метим, как она применяется в тех случаях, когда исполнительные элементы описываются уравнениями более высокого порядка. Применительно к модели (4.3.41) рас- смотрим задачу стабилизации стационарных
СИНТЕЗ АЛГОРИТМОВ СТАБИЛИЗАЦИИ И УПРАВЛЕНИЯ С УЧЕТОМ ДИНАМИКИ 375 состояний по всем степеням свободы. Форму- лируем ее следующим образом: найти управ- ляющие силы Qv = Cv(x, х) и управляющие функции T]v = T]v(x, х), при которых система переходит из произвольного начального со- стояния (4.3.6) в окрестность стационарной точки (4.3.7) и остается в этой окрестности бесконечно долго. Необходимо при этом, что- бы переходные процессы xv (/) -> х J с тре- буемой точностью следовали за решениями x*(Z) -> xj дифференциальных уравнений (4.3.8) при соответствующих начальных усло- виях. При такой формулировке задачу следует решать в два этапа: сначала определить силы при которых реализуется требуемое дви- жение, а затем найти функции T]v, управляю- щие исполнительными элементами системы. Задача определения Qv аналогична зада- че, рассмотренной в п. 4.3.1. Поэтому на ос- новании (4.3.22) записываем алгоритм вычис- ления требуемых значений управляющих сил Cv(0 = Pw(wv- = У vo(*J - *v) - У vl*v, (4.3.42) v = 1, 2, ..., п. Параметры yvo> Yvi и р™ рассчитываются соответственно по формулам (4.3.15) и (4.3.29). Теперь необходимо получить расчетные соотношения для управляющих функций T]v. В соответствии с уравнениями исполнительных элементов имеем = ТГ-GvOv + *v2*v + 2v). (4.3.43) Подставляя сюда выражения для Qv из (4.3.42), находим *vj + fcv2Xv (4.3.44) При этом согласно (4.3.42) Qy(XVf Xv} — Таким образом, алгоритм стабилизации стационарного состояния строится по уравне- ниям (4.3.44) и (4.3.45). Для вычисления управляющих функций T]v требуется информа- ция об ускорениях управляемых координат xv. Причем в данном случае нельзя какими- либо преобразованиями этих уравнений ис- ключить из них вторые производные. Такая особенность алгоритма по сравнению с алго- ритмами, рассмотренными в предыдущих за- дачах, обусловлена тем, что модель управляе- мой системы дополнена уравнениями, харак- теризующими инерционность процесса уста- новления управляющих сил. Построим теперь алгоритм стабилизации на основе законов управления второго поряд- ка: я z . +*v<?v = ~*i\ (4.3.46) v = 1, 2..Л, ще wj вычисляются по (4.3.42). Можно пока- зать, что при достаточно высоком усилении в контурах ускорений управление по каждой степени свободы можно осуществлять незави- симо от других. В таком случае на основании (4.3.46) имеем Qv 4" = ®w(^V ~ XV j, (4.3.47) v = 1, 2..Л. Отсюда находим Qv = ®w(VvO _ Y vl-^v — ^v) _ hyQvi (4.3.48) t VvO = Y voj(*v_*v)^ О и после повторного интегрирования 2V = 't = ®vv J (vvO — Y vlxv)dt — X, .0 ~ Pw t _ \ j Qvdt. о (4.3.49) Yvof(x? 7 vlxv Xv (4.3.45) v = 1, 2.........п. При выводе (4.3.48) и (4.3.49) начальные значения переменных, приняты равными ну- лю. Подставим выражения для Qv из (4.3.48) в (4.3.43), в результате найдем искомые управ- ляющие функции О
376 СПИСОК ЛИТЕРАТУРЫ T)v(xv, *V) - L Rv®w('PvO - 7 vlxv) + *vl + (*v2 - 4®w)*v +(1 “ tv*v)Cv]. (4.3.50) Таким образом, алгоритм стабилизации, основу которого составляют дифференциаль- ные законы управления второго порядка (4.3.47), строится по уравнениям (4.3.49), (4.3.50). Его параметры hy, aew рассчитываются из условия, чтобы быстродействие контуров ускорений по каждой степени свободы было существенно выше быстродействия контуров положения. Изложенная методика непосредственно применяется для синтеза алгоритмов стабили- зации в том случае, когда модели исполни- тельных элементов имеют более высокий по- рядок. В таких ситуациях необходимо повы- шать соответственно и порядок дифференци- альных законов управления. Например, если динамика приводов характеризуется уравне- ниями второго порядка +2?tvev +QV = k^v, то дифференциальные законы управления должны иметь третий порядок: Gv +^Qv + ^QV = ®w(WV - *v)- В таком случае для вычисления управляющих функций достаточно информации о координа- тах и их производных. В заключение отметим, что в [9, 10] раз- виты теоретические основы синтеза алгорит- мов управления движением методом обратных задач динамики применительно к математиче- ским моделям многомерных нелинейных сис- тем, в том числе и при ограничениях управ- ляющих функций. СПИСОК ЛИТЕРАТУРЫ 1. Крутъко П. Д. Обратные задачи дина- мики управляемых систем. Линейные модели. М.: Наука, 1987. 2. Крутъко П. Д. Обратные задачи дина- мики управляемых систем. Нелинейные моде- ли. М.: Наука, 1988. 3. Крутъко П. Д. Новые структуры адап- тивных алгоритмов управления автоматических систем // Изв. АН СССР. Техническая кибер- нетика. 1990. № 1. 4. Крутъко П. Д., Чхевдзе Г. А. Алгорит- мы управления автоматических систем высо- кой динамической точности // Изв. АН. СССР. Техническая кибернетика. 1994. № 4. 5. Крутъко П. Д. Оптимизация много- мерных динамических систем по критерию минимума энергии ускорения // Изв. РАН. Техническая кибернетика. 1994. № 1. 6. Крутъко П. Д. Управление движением Эйлеровых систем. Синтез алгоритмов мето- дом обратных задач динамики // Изв. РАН. Теория и системы* управления. 1995. № 1. 7. Крутъко П. Д. Управление движением Лагранжевых систем. Синтез алгоритмов мето- дом обратных задач динамики Ц Изв. РАН. Теория и системы управления. 1995. № 6. 8. Чхевдзе Г. А. Синтез алгоритмов управления движением упругих механических систем И Изв. АН СССР. Техническая кибер- нетика. 1991. № 1. 9. Крутъко IL Д. Симметрия и обратные задачи динамики управляемых систем// Изв. РАН. Теория и системы управления. 1996. № 6. 10. Крутъко П. Д. Задачи гашения энер- гии и алгоритмы управления движением ди- намических систем. Нелинейные модели Ц Изв. РАН. Теория и системы управления. 1999. № 6.
Раздел 5 ИССЛЕДОВАНИЕ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Глава 5.1 МАТЕМАТИЧЕСКИЕ МОДЕЛИ СИСТЕМ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ 5.1.1. ПОНЯТИЕ СТОХАСТИЧЕСКОЙ МОДЕЛИ СИСТЕМЫ Функционирование системы автоматиче- ского управления (САУ) происходит при дей- ствии различных случайных факторов как со стороны внешней среды, так и естественно возникающих внутри нее случайных возмуще- ний. Внешняя среда, в которой функциониру- ет система, может вносить неопределенность, случайность исходных данных, ситуаций, слу- чайным образом изменять характер взаимо- действия между ее составными частями. Внут- ри системы могут также возникать случайные возмущения, представляющие собой погреш- ности измерения, преобразования информа- ции вследствие проявления принципиально неучтенных объективно действующих причин. Таким образом, реальные процессы, проте- кающие в системе автоматического управле- ния, вследствие неопределенности ситуаций и возмущений, следует рассматривать как слу- чайные (стохастические) [13, 20]. Математическая модель системы автома- тического управления, описывающая ее функ- ционирование на основе информационного взаимодействия между составляющими частя- ми с учетом случайного характера процессов, называется стохастической. Общей математи- ческой моделью системы является ее оператор N, определяющий связь между входными и выходными сигналами х(/) = Mv, /}. (5.1.1) ще х(/) - выходной процесс (сигнал); v(l) - входной процесс (сигнал). В стохастических системах различают операторы N детерминированные и стохасти- ческие. При детерминировацном операторе каждой реализации входного процесса v(l) ставится в однозначное соответствие выходной процесс. Вследствие случайности входного процесса выходной процесс также является случайным. Такие модели систем называют стохастическими в широком смысле. При сто- хастическом операторе N данному детермини- рованному входному процессу ставится в соот- ветствие множество выходных процессов с определенным распределением. Стохастиче- ским оператором, в частности, является такой, у которого структура детерминирована, а па- раметры случайны. Модели систем со случай- ным оператором называют стохастическими в узком смысле. Процессы x(l), v(l) в (5.1.1) могут быть скалярными и векторными, а опера- тор N - скалярным, векторным или матрич- ным. 5.1.2. СТОХАСТИЧЕСКАЯ НЕПРЕРЫВНАЯ МОДЕЛЬ САУ В ПРОСТРАНСТВЕ СОСТОЯНИЙ Понятие состояния системы можно оха- рактеризовать как минимальную информацию о системе, необходимую для определения ее эволюции в будущем. Пространством состоя- ний называют метрическое пространство, каж- дый элемент которого полностью определяет состояние рассматриваемой системы. Элемен- тами пространства состояний могут быть ко- нечные упорядоченные совокупности действи- тельных чисел или случайных величин (конеч- номерные векторы). Подобный вектор записы- вается в виде матрицы-столбца х = [*i, ..., хл]т, где "т" - символ транспонирования, а [X], ..., хл] - матрица-строка. Случай конеч- номерного пространства состояний наиболее типичный. Им будем в дальнейшем пользо- ваться. При этом пару (Z, х), ще / € Т, х € X, называют случайным событием или фазой, а множество (Т9 X) - пространством событий или фазовым пространством системы [11]. Параметр t может быть непрерывным или дискретным, а множество Т - конечным или бесконечным. Вектор х также может прини- мать непрерывные или дискретные значения на конечном или бесконечном множестве X. Для описания динамики стохастических автоматических систем управления использу- ются различные математические модели в за- висимости от степени детализации процессов в них и задач исследования.
378 Глава 5.1. МАТЕМАТИЧЕСКИЕ МОДЕЛИ СИСТЕМ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Сгохастичекая непрерывная модель в фор- ме Ито имеет вид dk = а(х, u, f)dt + В(х, (5.1.2) где х е Rn; а(») - векторная нелинейная функция; В(*) - матричная нелинейная функ- ция; w(f) - л-мерный винеровский случайный процесс; и(1) - детерминированная функция. Уравнение (5.1.2) эквивалентно инте- гральной форме г2 г, x(Z2) - х(*!) = | а(х,и,/)Л + J B(x,Z)dw(Z). (5.1.3) Второй интеграл в правой части (5.1.3) есть стохастический интеграл, который требует особого обращения и имеет обобщенный не- классический смысл. В зависимости от спосо- ба его вычисления, т.е. приближения инте- гральными суммами различают несимметризо- ванный интеграл Ито и симметризованный интеграл Сгратоновича [23, 26, 29]. Стохастическая линейная модель в фор- ме Ито следующая: dk = hffixdt + C(/)urf/ + B(/)dw(/), (5.1.4) ще А(»), С(»), В(») - матрицы размера п х п. Стохастическая непрерывная модель в' форме Ланжевена х= а(х, и, Z) + В(х, (5.1.5) ще £(/) - л-мерный векторный гауссовский белый шум. Стохастическая линейная модель в форме Ланжевена следующая: х = А(/)х + С(/)и + В(/)£(0, (5.16) ще А, В, С - матрицы, зависящие от времени. Винеровский процесс и белый гауссовский шум. Винеровским называют гауссовский ска- лярный или векторный действительный про- цесс w(l) с независимыми приращениями [23]. Он удовлетворяет следующим условиям: все реализации w(l) непрерывны, w(0) = 0, одно- мерное распределение - гауссовское, матема- тическое ожидание M[w(/)] = 0, а корреля- ционная* функция имеет вид min(r,r') fv(T)A, о ще v(t) - неотрицательная функция - интен- сивность процесса. Белый гауссовский шум £(/) есть произ- водная от винеровского процесса 5(0 = w(/). Он представляет собой обобщенную случай- ную функцию с равным нулю математическим ожиданием M[w(/)] = 0 и корреляционной функцией вида К&, /') = М|«0 ?(,-)] = V0 8(, . /-), ще v(l) - матрица интенсивности белого шума. Это разрывный процесс при любом моменте времени /, имеет бесконечную дисперсию, поэтому он физически нереализуем. В строгой трактовке уравнения (5.1.2), (5.1.4), (5.1.5), (5.1.6) являются условными обозначениями соответствующих интегральных уравнений типа (5.1.3). Однако ввиду практически огра- ниченной полосы пропускания реальных ди- намических систем вместо белого шума можно рассматривать широкополосный шум (с ин- тервалом корреляции, намного меньшим всех временных характеристик этих систем, и с конечной дисперсией). Широкополосный шум называют физическим белым шумам. Для такого широкополосного шума стохастические инте- гралы имеют обычный смысл. Если формально вычислять стохастический интеграл по обыч- ным правилам, используя понятие физиче- ского белого шума, то результат совпадает с точным расчетом стохастического интеграла в смысле Сгратоновича [10, 13]. Винеровский процесс можно также ин- терпретировать как интеграл от гауссовского белого шума. Винеровский векторный процесс и векторный гауссовский белый шум в стохас- тических моделях САУ в пространстве состоя- ния присутствуют как входные процессы. Если реальные входные процессы - небе- лые шумы, то путем расширения пространства состояния с помощью так называемых форми- рующих фильтров удается преобразовать модель к рассмотренному виду. Допустим, что шум v(l) в уравнении (5.1.5) небелый У = «1(у. U> 0 + в(у, />(0 и сам выражается через белый шум £(/) урав- нением v = a2(v, /) + £(/). (5.1.7) Уравнение (5.1.7) называют формирую- щим фильтром. Вводится расширенное пространство со- стояний вида X = У V а = 0 А * Применяют и другое название этой функции- ковариационная.
ПОЛНАЯ ВЕРОЯТНОСТНАЯ ХАРАКТЕРИСТИКА НЕПРЕРЫВНОГО ПРОЦЕССА 379 Рассматриваемый процесс в расширен- ном пространстве состояний описывается стандартным уравнением Ланжевена х = а(х, и, /) + £0), ще £(/) - белый гауссовский шум. Каноническое представление случайных функций. Любую случайную функцию можно представить в виде 00 x(f) = mx(f) + '^tVv<pv(f), (5.1.8) V=1 ще mx(t) - математическое ожидание функ- ции х(0; К - некоррелированные случайные величины, математические сукидания которых равны нулю, а дисперсии равны Д; <pv(l) - детерминированные координатные функции разложения. Координатные функции фу(0 определя- ются как собственные функции интегрального уравнения, ядром которого является корреля- ционная функция [5, 36] или произвольные функции, удовлетворяющие условиям биорто- гональности [20]. Неканоническое представление случайной функции состоит в следующей формуле: + <p(Z, X,.Х„), (5.1.9) ще mjfy - математическое ожидание случай- ной функции х(/); ф(е) - детерминированная функция; 1], ..., Хл - независимые случайные величины с заданными законами распределе- ния. Чтобы получить представление (5.1.9), требуется определить функцию ф и законы распределения величин Xj, ..., Хл при выпол- нении условий: M<PU Xi, Хл)] = 0; Мф(6, Ьь •••» Ья) ф(*2> , М] = = *^1, /2), ще t?) - корреляционная функция. 5.1.3. ПОЛНАЯ ВЕРОЯТНОСТНАЯ ХАРАКТЕРИСТИКА НЕПРЕРЫВНОГО СТОХАСТИЧЕСКОГО ПРОЦЕССА Случайный непрерывный процесс х(1), представляющий собой вектор состояния сис- темы или ее математической модели, полно- стью характеризуется конечномерными функ- циями плотности вероятности распределения его значений Дх(Г1), х(Г2), ...» x(fm)] при т —► оо. Для одного фиксированного момента времени t полной характеристикой вектора х(1) является функция плотности вероятности Лх(1)] =Лх, /). Если известно, что векторный процесс х(1) в последовательные моменты времени tj, ..., tm _ j принимал значения х(/]), ..., х(/т . ]), то для оценки вероятности значения вектора х(/т) в момент времени tm применяется условная функция плотности вероятности I Х(Л)...х«п - 1)1- Безусловная и условная функции плотности вероятности связаны соотношением Л*(»1)...*«><-1)1 = =Л*«1)1Л*(4) I *«i)l х хЛ*Й) I x(li),x(^)] ... •••Лхйв) I *('1), -*«» -1)1- (5.1.10) Вектор состояли! непрерывной системы - марковский процесс. Векторный процесс х(/), являющийся интегралом уравнения моделей (5.1.2) - (5.1.6), представляет собой марковский случайный непрерывный процесс первого порядка (табл. 5.1.1). Марковские процессы - частный вид случайных процессов, широко и успешно применяющийся при решении прикладных задач в современной технике. Рассмотрим определение и некоторые важные для практи- ки свойства этих процессов. Векторный непрерывный процесс х(1) называют марковским (марковским первого порядка), если закон распределения его значе- ний в любой будущий момент времени зави- сит только от значений в данный момент вре- мени (непосредственно предшествующий бу- дущему) и не зависит от того, какие значения принимал этот процесс в моменты времени, предшествующие данному. Иными словами, векторный'процесс х(/) является марковским, если закон распределения случайного вектора х(/т) в момент tm при условии, что в момент tm _ 1 он имел значение x(tm. i), не зависит от того, какие векторные значения он принимал в моменты времени, предшествующие tm _ i, т.е. Л*«л) I х«1), •••*(««-1)1» Л*«т) I Х«м-1)1- (5.1.11) Для марковского процесса формула (5.1.10) с учетом (5.1.11) принимает вид Лх«1)....Х«т)] = =Лх(6)1Лх(6) I Х«1) - Лх^т-1) I Х^т -а)! х хДхЙн) | x(lm.i)], (5.1.12)
380 Глава 5.1. МАТЕМАТИЧЕСКИЕ МОДЕЛИ СИСТЕМ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Таблица 5.1.1 Прост- ранство состояний Значении, аргумента дискретные непрерывные Непрерывное Дискретное хЩ х«>------ Дискретная последо- вательность (цепь) х(Ю кТ„ Непрерывнозначная последовательность процесс x(t) Непрерывный процесс Следовательно, для марковского вектор- ного случайного процесса плотность распреде- ления вероятности полностью определяется двумя функциями - первой функцией плотно- сти вероятности состояния Дх, I) = Дх(/)] в данный момент времени t и условной функци- ей плотности вероятности ') | х(/)] ~ = Дх', Г | х, I), которую называют плотно- стью вероятности перехода. На основании теоремы полной вероятно- сти плотность вероятности состояния Дх, I) векторного марковского процесса в момент времени t определяется формулой оо Дх, t) = J/(x',f')/(x,/|x',/')*', (5.1.13) -00 если известны Дх',/') и /(х,фс',г). Марковский непрерывный процесс пол- ностью описывается также локальными харак- теристиками [10, 26, 23]: «М = Пт ^-А/[(х(1 + Д1) - х^х,^ (5.1.14) D(x,r) = lim — Л/ х v 7 дг->0 ДГ х £(x(f + ДО - х(ОХх(* + АО - x(0)T|x, • (5.1.15) Эти локальные характеристики могут быть вычислены на основании уравнений (5.1.2) или (5.1.5). При трактовке стохастических интегралов как симметризованных они имеют вид: <х(х,/) = a(x,u,/) + -—^G(0B(x,/); (5.1.16) D(x, /) = В(х, О G(Z) IF(x, /), а для стохаотических несимметризованных интегралов выражаются формулами
ПОЛНАЯ ВЕРОЯТНОСТНАЯ ХАРАКТЕРИСТИКА НЕПРЕРЫВНОГО ПРОЦЕССА 381 а(х, Г) = а(х, и, 0; (5.1.17) D(x, /) = В(х, /) G(/) ВТ(х, /). Уравнения Фоккера-Планка-Колмогорова. Стохастические модели (5.1.2) - (5.1.6) описы- вают каждую реализацию случайного процесса x(f). Для описания эволюции статистической характеристики - плотностей вероятностей Дх, /) и /(х,/|х',г) - в стохастических дина- мических системах применяются принципиально другие уравнения в частных производных: 4vl[vj(Z>’(x,r)/(x,0)]\ (5.1.18) при заданной начальной плотности вероятно- сти fix, /q). Здесь Vl=gradJ = а ’ахл 5 = -V£[a(x,/)/(x,r|x',r)] + +1 V’[V» (pt(x, ()/(x, Г|х’, f))]T. (5.L19) при /(x,Zo|x'Jo) = 8(x-x'). Граничные условия для этих уравнений могут быть разными. Решения этих уравнений удовлетворяют условиям нормировки оо |/(x,()dx = 1; -СО СО j’/(x,/|x’,r)dx = 1. -ОО Характеристическая функция. Столь же полной вероятностной характеристикой слу- чайного процесса является характеристическая функция, связанная обратным преобразованием Фурье с функцией плотности вероятности. Для марковского процесса х(1) рассматриваются две характеристические функции, которые соответствуют двум функциям плотности веро- ятности: оо 4М= fe'x’V(x,z)rfx; (5.1.20) -СО «(Мх1>'1) = |е'х',7(Мх1>/1)Л- (5.1.21) Эти функции при 1 = 0 имеют значение 1. Уравнения Пугачева В. С. для характери- стических функций. Характеристические функ- ции удовлетворяют интегро-дифференциаль- ным уравнениям [23]: dg(Kt) dt = J ilTa(x,f)-ylTD(x,f)l /(x,r)dK; (5.1.22) ag(i,r|x1,r1) = dt = Je/x’xplT<x(x,f)- -00 - i XTD (x,f) X /(x, () A, (5.1.23) где a(x, 0 - вектор сноса; D(x, f) - диффузи- онная матрица. Начальные условия для этих уравнений следующие: 00 g(Mo) = fe'Vx«/(x0,(0)A0; -00 g(Mo|xo>'o) = e'X’,<'> так как /(*о»'о|*1>'о) = 8(*о-*1)- В практических расчетах применяется также натуральный логарифм характеристиче- ской функции ®(1, I) = In g(l, I)- Для логарифмической характеристиче- ской функции существует уравнение [23] Sto(X,Z) di ~ = je'Vx-“<M)[a’a(x,r)- -оо - i XTD (х, /) X /(х, () А. (5J.24)
382 Глава 5.1. МАТЕМАТИЧЕСКИЕ МОДЕЛИ СИСТЕМ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Начальное условие для этого уравнения ®(А, /Ь) = lng(X, А))- 5.1.4. СТОХАСТИЧЕСКАЯ ДИСКРЕТНАЯ МОДЕЛЬ САУ В ПРОСТРАНСТВЕ СОСТОЯНИЙ Динамическая система является дискрет- ной, если в ней есть хотя бы один дискретный элемент, осуществляющий квантование сигна- ла по времени или по уровню. Различают дис- кретные системы, если в них все сигналы дис- кретные, и дискретно-непрерывные, если часть сигналов непрерывна (в системе имеются дискретные и непрерывные блоки). В пространстве состояний дискретные и дискретно-непрерывные системы описываются разностными или рекуррентными уравнениями. Общая дискретная векторная разностная мо- дель в рекуррентной форме имеет вид [10, 15] x(k + 1) = a[Jt + 1, х(к), и (А)] + + B[Jt + 1, х(к) 15(A), (5.1.25) где х(к) л-мерный вектор; и(к) - детермини- рованный r-мерный вектор (г <. п)\ к - дис- кретный аргумент - номер дискретного интер- вала, полная формула которого есть 4 = А7^; Тп - малый временной интервал (шаг дис- кретности); а(») - нелинейная векторная функция; Е,(к) - входная дискретная векторная случайная последовательность (гауссовский белый шум), имеющая Af[5(A)] = 0 и ковариаци- онную матрицу М[Е,(к) £Т(Л)] = G(A)8^, - символ Кронекера, 8^ = 1 (А = А), 8jy, = О (А # к); G(A) - корреляционная* матрица моментов случайных гауссовских импульсов с компонентами Gpq(k), p,q = 1, п. Стохастическая линейная дискретная векторная модель в рекуррентной форме сле- дующая: х(к + 1) = А(А + 1, к) х(к) + С(к + 1, к) и(А) + + В(к + 1, к) 5(A), А = 0, 1,...,, (5.1.26) где А(А + 1, к)у В(к + 1, к)у С(к + 1, к) - дискретные переходные матрицы состояния. * Применяют также название "дисперсионная матрица". Разностные уравнения могут быть запи- саны также для первых прямых разностей Дх(А) = а[А + 1, х(А)1 + + С[А + 1, x(A)J и(А) + + В[А + 1, х(А)1 «А), А = 0, 1.......... (5.1.27) где Дх(А) = х(к + 1) - х(А) - первая прямая разность вектора х(А). Линейное разностное векторное уравнение имеет вид Дх(А) = [А(А + 1, к) - 7] х(А) + + С(А + 1, к) и(А) + + В(А + 1, к) 5(A), А = 0, 1, ...,, (5.1.28) где Z - единичная матрица. Вектор состояния дискретной системы * марковская последовательность. В соответствии с классификацией дискретные марковские процессы делят на непрерывнозначную после- довательность, дискретную последовательность (марковскую цепь), дискретный разрывный процесс (см. табл. 5.1.1). Векторная непрерывнозначная случайная марковская последовательность представляет собой процесс с дискретным временем и не- прерывными значениями по уровню. Такой процесс представляет собой вектор состояния дискретной системы, характеризуемой уравне- ниями (5.1.19) или (5.1.20) при непрерывных значениях х(А). В частности, при мелком шаге дискретности по уровню и большой разрядной сетке вектор состояния автоматической систе- мы с цифровой машиной в контуре при дис- кретном белом шуме на входе является мар- ковской непрерывнозначной последовательно- стью. Дискретная последовательность описы- вает состояние системы при дискретном вре- мени и дискретных значениях (марковская цепь). Множество моментов времени и значе- ний процесса может быть конечным или бес- конечным. Такие процессы имеют место при цифровой обработке информации, в радиоте- леграфии, радиолокации в других системах, где применяется квантование по уровню и где нельзя пренебречь этим квантованием. Раз- рывный дискретный марковский процесс с непрерывным временем и дискретными значе- ниями описывает поведение некоторой систе- мы, имеющей дискретный рад состояний (конечный или бесконечный). Полная вероятностная характеристика дискретного процесса. Дискретный процесс и
СТОХАСТИЧЕСКАЯ ДИСКРЕТНАЯ МОДЕЛЬ САУ В ПРОСТРАНСТВЕ СОСТОЯНИЙ 383 дискретная последовательность также полно- стью определяются заданием конечномерных вероятностей того, что вектор х(к) в моменты времени к =1,т может принимать конечные значения xW(l), х^(т): Ajxw(l)»х«(т)], т = 1, 2,.... Если известно, что в предыдущие момен- ты времени 1, т - 1 дискретный процесс принимал значения х^(1), х^(т - 1), то значение х^(т) векторного процесса х(к) в момент т > т - 1 определяется с помощью условной функции перехода р{х№(т) | х^(1), xW(m - 1)J. Тогда Л,[х«(1).....х«(т)| = =Р11х<')(1)1Ях<')(2) I xW(l)]... ... pfxM(/n) I xto(l),..., xW(m - 1)|. (5.1.29) Для марковского дискретного процесса Pm(xW(l),..., xW(m)| = =/>i[xW(l)|p|xW(2) I xW(D) x x/>[x«(3) | x«(2)]... ... - 1) | xW(m - 2)J x x Ях<^(т) I xW(m - 1)]. (5.1.30) Таким образом, марковский дискретный процесс полностью характеризуется вероятно- стью состояния р[хЮ(£)), к = 1, 2, ... , и ве- роятностью переходов | хС^(Лг)1. Рекуррешные модели дм верояпюстей пе- реходов. Для дискретных случайных марков- ских процессов вероятности переходов опре- деляются с помощью итеративных процедур. Эти рекуррентные процедуры зависят от типа дискретного процесса. Для марковской непрерывнозначной по- следовательности плотность вероятности пере- хода Дх, h | х*, к), h £ к, к = 0, 1, 2, ... , определяется так: Дх, h + 11 х*, к) = =Дх, h | х*, к) - - A/Vj[<x(x, Л)Дх, h | х*, Jt)] + + |azVJ[VJ(ZX(x, Л)Лх, л | X», *)Г, h £ к, h, к « 0, 1, 2, ... ; АГ = Тп. (5.1.31) Для стационарной дискретной непре- рывнозначной марковской последовательности в установившемся режиме (А -► оо, к -► оо) плотность вероятности перехода приобретает установившееся значение Дх | X*) и опреде- ляется уравнением -?И«(х)Лх | Х»)1 + + I vJ(vJWx)/(x I х*))Г = 0. (5.1.32) Дискретный разрывный марковский процесс при непрерывном изменении времени и дискретных значениях уровня характеризует- ся вероятностью переходов p[x<v), t | X<r), 4)1 £ 0 и определяется из уравнений £Хх<ЧМ = = -"то(0ХХ<'’),/|Х<Г>’/о) + N . ч + X <’av(OXX<°>’^X<r)’,o), 0=1 (oxv) v,r=ijV, (5.1.33) где Осу 0 - интенсивности переходов при начальных условиях Хх<^'о|х<г)’'о)={£ vZr <5L34) Справедлива также обратная (сопряжен- ная) система уравнений: ^Х^ЧМ = = -«n-(/o)XX<VMx(r>’/°) " - S aav('o)XX<V>’Z|x(<’>’,o)’ 0=1 (oxv) v,r=ljV. (5.1.35) Для однородного дискретного марков- ского процесса вероятность перехода зависит только от разности времен т = t - 4)> т.е. pfxP) | xW, т), Oov — const и уравнение (5.1.30) принимает вид
384 Глава 5.1. МАТЕМАТИЧЕСКИЕ МОДЕЛИ СИСТЕМ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ ^-/^x(v)|x(r), т) = -а^р^х^^х^,^ + N Z . к + £ 0=1 (o*v) r,v=ijV. (5.1.36) Если система стационарна и существует установившийся режим, то для рассматривае- мого марковского процесса предельные значе- ния вероятностей перехода р(х№ I хЮ) опре- деляются из уравнений -aw/>(x(',)|x(r)) + £ aavXx(V>|x<a>) = 0> 0=1 (o*v) r,v=lJV. (5.137) Дискретная простая марковская цепь (дискретное время, дискретные значения) характеризуется вероятностями переходов р(рР\ h | хЮ, А), для которых определены итерационные уравнения p(x<v),A+ 1|х<г),а) = p(x<v\A|x<r\A) - - Ataw(A)p(x(v), а|х(г), fc) + N + Д'5 0=1 (o*v) V,r=ijv, A,fc = O,l,..., h^k. (5.1.38) Для дискретной марковской последова- тельности, т.е. для простой марковской цепи в установившемся режиме, если такой существу- ет, имеет место уравнение (5.1.37). Рекуррентные модели для вероятностей со- стояний. Для марковской векторной непре- рывнозначной последовательности, характери- зующей систему (5.1.19), (5.1.20), плотность вероятности Дх, к) состояния вычисляется на основании рекуррентной формулы Дх, h + 1) =Дх, Л) - - A/VjHx, Л)Дх, Л)] + + 1дЛ?1Р1(/Х(х,Л)Лх> А))1, h = О, 1, ... . (5.1.39) при заданной Дх, 0) в начальный момент. Для дискретного (разрывного) марков- ского векторного процесса имеет место урав- нение, определяющее p(x<v), I): Sp(x(v) ,4 , . . х ™ dt =-аи'Их »0+ N 0=1 (o*v) v= ijv. (5.1.40) Установившиеся равновесные значения вероятностей состояний дискретного процесса получаются из уравнений -avvp(x('',) + Х^р(х(а>) = 0. 0=1 (o*v) (5.1.41) Для дискретной марковской последова- тельности (простой марковской цепи) имеет место рекуррентная формула, определяющая h) : p^v\h +1) = p(x<v), а) - - Atavv(A)p(x(v),A) + N + АГ £а^(АЦх(о),А), 0=1 (o*v) A = 0,1,..., V=ijv, (5.1.42) при заданных начальных значениях р(х?\ 0). 5.1.5. ОДНОМЕРНЫЕ МОДЕЛИ СТОХАСТИЧЕСКИХ СИСТЕМ В ряде задач уравнения систем автомати- ческого управления записываются относитель- но одной выходной переменной в виде ["л (Ор" +• • +«1 (Ор]х + ао (0<р(х) = = $2 [*Ли 0)/’"’ +...+A/O(O]v/, л £ т, (5.1.43) где ср(х) - нелинейность; V/(/) - входные слу- чайные процессы с заданной статистикой,
ОДНОМЕРНЫЕ МОДЕЛИ СТОХАСТИЧЕСКИХ СИСТЕМ 385 Для линейной автоматической системы уравнение (5.1.43) принимает вид [a„(Op"+—+ei(OP +«о(0]ж = (5.1.44) Для стационарной системы все коэффи- циенты big, к = а,п, Z = 1,л, q = 0,/л постоянны. Тогда входные V/(/) и выходные х(/) переменные связаны между собой переда- точными функциями ф /пЧ ^/>w+-+z’/o 1 Щ Ф/(Р) =--------------, л £ Ш, / = 1,Л. апрп+...+а0 (5.1.45) Модель непрерывной автоматической сис- темы с интегральным оператором. Полной ха- рактеристикой линейной системы (5.1.44) яв- ляется также интегральный оператор t *(‘) = g(t, 'o)Xfl + f g(t> t)v(T)4ft, (5.1.46) *0 IM vW = X(W"+--+*Zo)V/(O; g(t, t) - весовая (импульсная переходная) функция; хф - случайное начальное условие. Для многомерной линейной системы ти- па (5.1.5) интегральный векторно-матричный оператор следующий: t х(0 = g(.t,tQ)Xo' + jg(/,T)B(t)v(T)A, *о (5.1.47) где x(Z) - вектор выходного сигнала; g(Z, т) - матрица весовых (импульсных переходных) функций; v(t) - вектор случайного входного сигнала в частном случае - белый шум £(т). Одномерные модели дискретных стохасти- ческих систем. Для дискретной автоматической системы аналогом уравнения (5.1.37) является разностное уравнение </„(*)A"X(A:)+...+do(*)<pfx(fc)] = = S[ctatWA'"vZ (*)+• -+czo(^)vz (*)] > (5.1.48) где к = 0, 1, ...» Длх(£) = Ал - lx(k + 1) - - Ал bc(fc) - п-я прямая разность дискретной выходной переменной х(к); d^k), Су{к) - коэффициенты, зависящие от момента време- ни; N^k) - дискретные входные случайные последовательности с заданной статистикой, в частности дискретные белые шумы; <р(«) - нелинейная векторная функция. Одномерное разностное уравнение в ре- куррентной форме, соответствующее (5.1.48), следующее: [ап(к)х(к + л)+...+во(*)ф[х(Л)]] = = Sl^Wvzf* + »»)+• • -+ЬЮ (fc)v;(fc)]. Z=1 (5.1.49) Если автоматическая система линейна и стационарна, то разностные уравнения (5.1.42) принимают вид d„^nx(k}+...+dt)x(k) = = X [**"AmVz(£) + *ZOvzW] > (5.150) где drM by - постоянные коэффициенты. Разностному уравнению (5.1.50) соответ- ствуют Z-передаточные функции от каждого входа Z ф. = b^z-i^+.-.+bto _rf„(z-i)"+... ’ Z = l,«, т^п, (5.1.51) где (z - l)rx(z) - Z-преобразование r-мерной прямой разности функции Рекуррентное разностное уравнение ли- нейной одномерной дискретной стационарной системы записывается в форме а„х(*+л)+...+аох(Л) = = X [*»»*(* + т)+- • •+Ь'О v(*)] • <5Ш) 1=1 Коэффициенты аг и by постоянны. Уравнению (5.1.47) соответствуют z-пе- редаточные функции ф;(г) = anZn+...+0o I = М, т <> п, (5.1.53) 13 Зак 1023
386 Глава 5.2 КРИТЕРИИ КАЧЕСТВА СИСТЕМ Для одной и той же автоматической сто- хастической системы уравнения (5.1.48) и (5.1.49) и соответственно (5.1.50) и (5.1.52), а также формулы (5.1.51) и (5.1.53) могут быть взаимно преобразованы. Модель дискретной САУ с интегральным оператором. Аналогом интегрального оператора для дискретной одномерной системы является выражение вида к х(к +1) = ]"[ g(i +1, i) х(0) + /=0 к к +S П g(‘+*’ О £(г+!’r)v(r)’ г=0/=г+1 к = 0,1,2..., (5.L54) ще g(i + 1, i) - весовой коэффициент; В(г + 1, г) - дискретная переходная функция входного сигнала; v(r) - входная дискретная случайная последовательность. Для многомерной системы формула (5.1.54) записывается для выходного вектора х(к + 1) так: к х(к +1) = fj g(* +1» i) х(0) + /=о к к + Z Пе('+1’/)в(^+1,r)v(r), (5.L55) г=0/=г+1 где g(i + 1, i) - матрица весовых коэффици- ентов; B(r + 1, г) - переходная матрица вход- ного сигнала. Для описания динамики дискретно- непрерывных систем применяются те же са- мые модели, как и для дискретных, не зави- сящие от дополнительного параметра 8^1, характеризующего смещение времени относи- тельно дискретных моментов t = (к + e)7Jj (е = АТ/Тп, АТ<; Тп). Все соотношения с использованием ^-преобразования переносятся на дискретно- непрерывные системы. Основные затруднения возникают при нахождении передаточных функций для решетчатых функций в связи с появлением дополнительного параметра 8. Глава 5.2 КРИТЕРИИ КАЧЕСТВА СИСТЕМ 5.2.1. ПОСТАНОВКА ЗАДАЧИ АНАЛИЗА Анализ автоматической системы при слу- чайных воздействиях состоит в изучении ее свойств, определяющих качество функциони- рования и выполнение основного назначения. Такими свойствами являются характер процес- са управления и изменения фазовых коорди- нат системы, устойчивость, точность, быстро- действие. Количественная оценка качества системы составляет основу задачи анализа и инженерного расчета. Для количественной оценки качества системы применяются показа- тели качества. Показатель качества - это число, характеризующее в принятой системе единиц свойство системы. Этот показатель зависит от характеристик системы, ее структуры и пара- метров, входных функций, возмущений и не- определенных факторов. Полной вероятност- ной характеристикой стохастической системы является закон распределения вектора состоя- ния (или выходной переменной) в каждый текущий момент времени. Знание закона рас- пределения вероятностей вектора состояния позволяет вычислить вероятностные показате- ли качества. Различают анализ по априорным и по апостериорным данным. Анализ по ап- риорным данным состоит в определении пока- зателей качества по известным заданным веро- ятностным характеристикам (закона распреде- ления) входных переменных и параметров исследуемой системы. Анализ по апостериор- ным данным состоит в определении показате- лей качества на основании вероятностных характеристик (законов распределения) вход- ных переменных и параметров системы, полу- ченных после измерения. В данном разделе рассматривается анализ по априорным дан- ным. Анализ по апостериорным данным по- зволяет уточнить априорную неопределенность в процессе наблюдения и обеспечить более точное решение задачи оценивания. Оценка устойчивости системы является важным предварительным этапом исследова- ния детерминированной системы. При слу- чайных воздействиях проводится проверка устойчивости системы на конечном интервале функционирования и асимптотической устой- чивости цо вероятности на бесконечном ин- тервале. Важной характеристикой качества авто- матической системы является и эффектив- ность, оцениваемая вероятностью выполнения поставленной задачи. 5.2.2. ВЕРОЯТНОСТНЫЕ ПОКАЗАТЕЛИ УСТОЙЧИВОСТИ СТОХАСТИЧЕСКИХ СИСТЕМ Наибольший практический интерес пред- ставляют следующие виды устойчивости некото- рого решения х(4 уравнения (5.1.5) при началь- ном условии *0Ь) = если известно решение х*0) того же уравнения при другом начальном условии х*(/0) = Xq .
ВЕРОЯТНОСТНЫЕ ПОКАЗАТЕЛИ КАЧЕСТВА 387 1. Система устойчива по вероятности при t £ /о, если ДО* любых /о и 8 > 0 выполняется равенство lim p|sup|x(/) - х*(/)| > е| = L (5.2.1) 2. Система устойчива асимптотически, если она устойчива по вероятности и, кроме того, справедливо соотношение liip ^p|lim|x(r) - х*(0| = е| = L (5.2.2) 3. Система /J-устойчива при / /о, 607151 для любого е > 0 найдется г > 0 такое, что при |х0 - Xq I < г выполняется равенство М |х(/) - х’(/)|' < 8. (5.2.3) 4. Система асимптотически р-устойчива, если для достаточно малых |xq — jCq | выпол- няется равенство = 0. (5.2.4) 5. Система экспоненциально p-устойчива при t £ /Ь» 607151 существуют постоянные А > О, а > 0 такие, что Af|x(O - х*(г)|Р <, я|х0 - хо|? ехр{- oft - /0)}. (5.2.5) 6. Система асимптотически устойчива в целом, если она устойчива по вероятности и, кроме того, для любых /о, Xq, xq выполняется равенство 7. Система устойчива с вероятностью единица в том или ином смысле, если все траектории, кроме множества траекторий с вероятностью ноль, устойчивы в соответст- вующем смысле. Между различными видами стохастиче- ской устойчивости существует тесная связь [28]. Из асимптотической р-устойчивости следует асимптотическая устойчивость по вероятности. Сравнение различных видов p-устойчивости можно осуществить, вос- пользовавшись тем [14], что функция ”**(0| ПРИ Р > 0 не убывает с возрастанием р. Результаты сравнения по- казывают, что из (асимптотической) р-устой- чивосги при больших р следует (асимптотичес- кая) р- устойчивость при меньших р. Наиболее распространенными в технике являются понятия асимптотической р-устой- чивосги при р = 1 и р = 2, которые называют- ся асимптотической устойчивостью в среднем и среднеквадратичном. 5.2.3. ВЕРОЯТНОСТНЫЕ ПОКАЗАТЕЛИ КАЧЕСТВА Показатели качества динамических сис- тем базируются на понятии ошибки. Ошибка системы - это отклонение е(1) фактического вектора состояния х(1) (или выходных пере- менных) от теоретического хт(/) (в частности, нулевого хт = 0) в текущий момент времени е(0 = х(0 - xT(Z). (5.2.7) В некоторых задачах рассматривается ошибка только по одной координате еХО = хХО - Xfr(0- (5-2.8) Ошибка есть случайная функция време- ни, а при фиксированном времени - случай- ная величина. Математическое ожидание ее называют средней ошибкой системы тМ = т(1) - «,(/), (5.2.9) где те — М[е], т — А/[х], т, = Лфс,]. Центрированное ее значение называют случайной ошибкой системы е«(/) = е(|) - ШеО). (5.2.10) На основании понятия ошибки вводится функция потерь /[е(1)1 = Z[x(O, *г(01, харак- теризующая потери в качестве динамической системы в текущий момент времени /. Выбор вида этой функции зависит от назначения системы. Функция потерь также случайная. Поэтому за показатель качества принимают математическое ожидание функции потерь - средний безусловный риск, определяемый для текущего t или для конечного момента вре- мени р = м[/(х(/),хт(0)] = 00 = |/(х(0,хт(0)/(х,хт,г)АЛт, (5.2.11) 13*
388 Глава 5.2. КРИТЕРИИ КАЧЕСТВА СИСТЕМ гае /(х,хт,/) - функция плотности вероятно- сти векторов х, хт. Для дискретной системы формула (5.2.11) принимает вид р= X £4х«.хтда>дх)?г(хт). k=-ao Г=-<х> (5.2.12) ще Рк(х)> <7г(хт) - вероятности реализаций векторов соответственно х(к) и хт(£). При различных формах функции потерь Z(x, X]-) получаются конкретные показатели качества. В практических инженерных задачах широко применяют следующие показатели качества и соответствующие им функции по- терь: 1. Средний квадрат ошибки, который основывается на квадратической функции потерь, 4х(1), хт(/)| = [х(0 - х^0Г[х(1) - хт(1)| = = ет(0 е(0, гае "т" в показателе - знак транспонирования вектора. Средний риск при такой функции потерь представляет собой средний квадрат ошибки Р0 = /Щет(1) e(z)l- (5.2.13) Принимая во внимание, что е(1) = шХО + + е»(1), имеем рО) = mJ ШеО) + trMO, (5.2.14) ще tr0ee(/) = е°(/)] - след матрицы GeeO) = а 0ее(/) - ковариаци- онная матрица ошибки. Ковариационная мат- рица ошибки выражается через ковариацион- ные матрицы векторов х(1) и хт(1) формулой 0ее(О = 0«(О + 0^ (0 - 20^ (О- (5.2.15) Скалярную величину среднего квадрата ошибки можно также записать в виде р(1) = trHeeW, (5.2.16) ще Нее(0 = m/omj + - матрица вто- рого начального момента ошибки. 2. Обобщенный средний квадрат ошиб- ки. Этот показатель вычисляют на основании функции потерь вида /1x0, х,01 = [Х0 - ХД0РГ|Х0 - XX0J, гае Г - положительно определенная матрица. Обобщенный квадрат ошибки р(() = tr|r[me0 rnj(z) +е„(о]| = = tr{rHee(z)}; (5.2.17) 3. Вероятность превышения ошибкой за- данного значения. Функция потерь выражает- ся формулой |х - хт| > 0; jx-Xjl < 0. (5.2.18) Средний риск представляет собой веро- ятность превышения ошибкой заданной вели- чины а р = Р{|х - хт| > = Л/[/(х, хт)]; (5.2.19) 4. Показатель накопления ущерба. При выборе экспоненциальной функции потерь вида Z(x,xT) = 1 - е’(х’Хт)’г(’1'’4) средний риск превращается в показатель на- копления ущерба р=1-М е (х’х’),г(х-«т) ; (5.2.20) 5. Показатель правдоподобия. Выбором функции потерь в виде /(х, хт) = с - 8(х - хт), гае с = const, средний риск превращается в функцию правдоподобия р(0 = с - М5(х - Хт)1; (5 2.21) 6. Число выходов ошибки из интервала. Пусть задан интервал [a(l), для одно- мерной ошибки е(/) = х(/) - Хг(1). При выбо- ре функции потерь в виде функционала /[х(0,хт(0] = т = J {[в(0 - ё(/)| 1[в(0 - ё(Г)] 8[в(0 - «(/)] + о + [«(/) - 6(0] 1[ё(0 - *(/)] 8[e(Z) - 6(/)])л (5.2.22) средний риск превращается в показатель числа выхода ошибки из интервала [а(/), b(f)\ в течение времени Т р = М[1(х, Хг)]. (5.2.23)
СТОХАСТИЧЕСКАЯ УСТОЙЧИВОСТЬ 389 При а = const и b = const формула для р принимает вид Т р=М Jje(Z)[l(«(/))8(e(O-Z>)- .0 -1(-ё(0)8(в-е(0)]}Л; (5.2.24) 7. Обобщенный средний функционал. В ряде задач требуется оценить конечный ре- зультат и переходной процесс, тогда применя- ют функционал вида Д>к = б[х0к)>хт((к)] + J ^2[х(0’Хт(0]^’ (5.2.25) где Zj(x, Xf), /2(х, хт) “ Функции потерь. В частности, А(х, Xj.) = ефк)Ге(4); Z2(x, Xr) = eT(/)Le(l), где Г и L - положительно определенные мат- рицы. Средний риск, или средний функцио- нал потерь имеет вид Р = Шок1- (5.2.26) 5.2.4. ОБЩИЕ ВЕРОЯТНОСТНЫЕ КРИТЕРИИ ЭФФЕКТИВНОСТИ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Под эффективностью системы управле- ния понимают успешность выполнения по- ставленной задачи. Показателем эффективно- сти является критерий эффективности - веро- ятность получения заданного результата. Различают два класса задач управления. Первый характеризуется тем, что управление осуществляется с целью достижения опреде- ленного результата Л, который может быть получен или не получен. Функция потерь в этих задачах имеет вид ./ ч [1, х е А; l(x) = Z ’ (5.2.27) v ' [0, х t А, где х - случайное событие - результат работы системы управления. Критерий эффективно- сти - вероятность достижения результата р = Р(х). (5.2.28) Если задача управления решается в усло- виях статистической неопределенности, то на основе принципа получения гарантированного результата следует применять в качестве кри- терия р = minP(x/z), (5.2.29) где z - неопределенные факторы. Эффективность системы оценивают по минимальному значению вероятности выпол- нения поставленной задачи, которое возможно при наихудших значениях неопределенных факторов. Второй класс задач управления характе- ризуется тем, что управление осуществляется с целью получения наилучшего (экстремального) значения некоторой величины, оценивающей конечный результат (эффект) при наличии неопределенных факторов Z. Если функция потерь Z(x, хт) имеет общий вид, то критерий эффективности (показатель качества) следую- щий: р= nunJf[Z(x,xT)/z]; р= max3/[z(x, xT)/z]. (5.2.30) В частном случае Z(x, хт) = ет(/)е(/). Глава 5.3 УСТОЙЧИВОСТЬ СТОХАСТИЧЕСКИХ СИСТЕМ 5.3.1. СТОХАСТИЧЕСКАЯ УСТОЙЧИВОСТЬ В теории устойчивости детерминирован- ных систем широкое применение находит первый метод Ляпунова, основанный на непо- средственном изучении свойств решений дифференциальных уравнений, и второй метод Ляпунова, основанный на построении и ана- лизе некоторых функций, обладающих опре- деленными свойствами и гарантирующих ус- тойчивость изучаемой системы. Оба метода обобщены на стохастические системы. Обоб- щение первого метода Ляпунова основано на развитии теории непосредственного изучения вероятностных свойств решений стохастиче- ских дифференциальных уравнений и связан- ных с ними уравнений Фоккера-Планка- Колмогорова для плотностей вероятностей фазовых координат системы. Обобщение вто- рого метода Ляпунова основано на развитии способов построения функций с определен- ными свойствами, обеспечивающими устойчи- вость, для стохастических уравнений. Сказанное относится и к дискретным стохастическим системам. Стохастическая устойчивость представ- ляет собой устойчивость возмущенного движе- ния при случайных начальных условиях. В частности, асимптотическая устойчивость воз-
390 Глава 5.3. УСТОЙЧИВОСТЬ СТОХАСТИЧЕСКИХ СИСТЕМ мущенного движения Дх = х - х* в точке равновесия Дх s 0 означает концентрацию распределения вероятности в начале коорди- нат, т.е. стремление плотности вероятности к 5-функции с течением времени. Необходимое условие асимптотической устойчивости для свободного движения стохас- тической системы при случайных начальных условиях вытекает из уравнения Фоккера- Планка-Колмогорова (5.1.18) с учетом (5.1.16). Для свободного движения = 0 на осно- вании (5.1.16) D(x, 0 = 0, <х(х, 0 = а(х, и, /)• Уравнение (5.1.18) принимает вид ^7^ = U. О /(*> 0] = = -/(х, u> 0 - а(х»0 vJ/(x» 4 (5.3.1) Для устойчивости тривиального движения х* = 0 в точке равновесия х = О, а(0, u, /) = О это уравнение принимает вид dt 71х=о (5.3.2) Плотность вероятности в начале коорди- нат будет неограниченно возрастать, если бу- дет выполнено Vla(x,u,/)Lo <0. (5.3.3) Это условие является необходимым для асимптотической стохастической устойчивости положения равновесия х = 0. 5.3.2. ОЦЕНКА УСТОЙЧИВОСТИ ПО ФУНКЦИИ ЛЯПУНОВА Второй метод оценки устойчивости сто- хастической системы базируется на исследова- нии производной некоторой функции Ляпу- нова F(x, /)• Функцию F(x, I) выбирают так, чтобы она была положительной во всем про- странстве фазовых переменных, кроме начала координат, где все переменные и сама функ- ция обращаются в нуль. Пусть полная произ- водная от функции F(x, /) по времени (в вы- ражения которой вместо производной х под- ставлено значение из уравнения системы) принимает отрицательное значение везде кро- ме начала координат, где она обращается в нуль. Тогда при любом значении х функция К(х, /) убывает по времени. Это означает, что координаты системы с увеличением времени стремятся к нулю, обеспечивая устойчивость тривиального движения. Стохастическим аналогом полной произ- водной по времени сложной функции К(х, /)» определяемой уравнением (5.1.17) и отражаю- щей усредненные характеристики случайного процесса, является выражение [5, 23] + vj a(x,/)K(x>/)-lvj(DT(x>/)r(x,/)j , (5.3.4) ще a(«) - вектор сноса; D(«) - матрица диф- фузии для процесса. Формула (5.3.4) представляет производ- ную условного математического ожидания функции F(x, /) при фиксированном значе- нии процесса х(1) [6] 4ГМ = Л/|и(х( t + А/), Г + дг) - К(х, /)| х, rj д/->0 Д/ (5.3.5) Для оценки устойчивости функция F(x, /) должна определяться решением приве- денного однородного стохастического уравне- ния, т.е. при входном сигнале £ = 0. Однако если принять £(/) за параметрическое возму- щение в автоматической системе, то уравнение (5.1.18) следует считать приведенным одно- родным. Доказано [5] следующее утверждение. Если в некоторой области, содержащей мно- жество х е №, t > 0, существует положитель- но определенная функция F(x, /), дважды непрерывно дифференцируемая по х и 1 раз по /, кроме множества х - 0, удовлетворяю- щая при х # 0 условно Z[ V(x, /)] ^ °> то три- виальное решение системы (5.1.18) устойчиво по вероятности. Исследование устойчивости с помощью второго метода Ляпунова связано с выбором подходящей функции F(x, /)• Пусть система описывается уравнениями: Xi =х2; х2 = -^(qx2 cosxj + qc2 sinxj + P^(0x2), где q, с2, р, к - некоторые положительные постоянные; £(/) - параметрический шум с нулевым математическим ожиданием и интен-
ОЦЕНКА УСТОЙЧИВОСТИ ПО ФУНКЦИИ ЛЯПУНОВА 391 сивностью G. Вычислим для этой системы компоненты вектора сноса и матрицы диффу- зии: (Xi=x2; а2 = ксх cosxj + ^А:2р2(^х2 - - кс\с2 sinxj; Ai ~ А2 - Ai - °; Да = k^Gxl. Рассмотрим положительно определенную функцию Ляпунова вида V(х, 0 = kctc2 (1 - cos xt)+i . Вычислим Z[K(x, /)], используя уравне- ния системы Z[K(x,0] = а.\ксхс2 sinjq + а2х2 = = [k2fl2G - кс2]х2. При kft2G < С\ тривиальное решение системы устойчиво по вероятности. Экспоненциальная устойчивость характе- ризуется экспоненциальным убыванием произвольного решения системы. При изуче- нии экспоненциальной устойчивости триви- ального решения рассматривают моменты различного порядка, так как для стохастиче- ских систем из того, что М|х(0|Р —> 0, не следует Л/|х(0|Л -> 0 при р\ > р. Для экспоненциальной р-устойчивости тривиального решения стохастической систе- мы типа (5.1.18) с параметрическими возму- щениями достаточно, чтобы существовала по- ложительно определенная функция К(х, /), дважды непрерывно дифференцируемая по х и непрерывно дифференцируемая по кроме точки х = 0, и удовлетворяющая при некото- рых положительных ку к2, к$ неравенствам fcjx^ <. К(х,/)^ fc2|x|p; 4г(х>')] * -*з|х|р- (5.3.6) Отсюда следует [17] М|х(<)|'’ 2 у- К(х0, Zo) exp - (t -10) . *1 L л2 . к2 (5.3.7) В практических исследованиях большое значение имеет p-устойчивость в среднем квадратическом (р = 2). Для линейных стохас- тических систем с параметрическими шумами широко применяется оценка экспоненциаль- ной устойчивости, основанная на следующем утверждении: для экспоненциальной р-ус- тойчивости четного порядка (р = 2, 4, ...) сто- хастической системы необходимо, чтобы для любой, и достаточно, чтобы для какой-нибудь положительно определенной функции w(x, О порядка ру коэффициенты которой - непре- рывные ограниченные функции времени, на- шлась положительно определенная функция К(х, О того же порядка, удовлетворяющая условию Д 01 = -w(x, /)• (5.3.8) Для стационарных систем эти функции w(x), К(х) имеют постоянные коэффициенты. Устойчивость линейных стохастических систем. Для линейных стохастических систем с параметрическими шумами получен эффек- тивный критерий устойчивости в среднеквад- ратичном (р = 2), основанный на теореме Рауса-Гурвица. Рассмотрим линейную стационарную систему вида У») + [q + 51(01 У” " *) + ... • + К + 5л(01 у = о. (5.3.9) Введем обозначение у = Ху ..., jX» - 1) = = хп. Пусть случайные шумы имеют постоян- ные математические ожидания и взаим- ные интенсивности Gy, i,j = 1,л. Для вектора х(0 получаем уравнение х - СХу 0 1 о ... о 0 0 1 ... о 0 0 0 ... 1 ~ сп ~%п ......................... ~ С1 “ 51 (5.3.10) Для устойчивости в среднеквадратичном стохастической системы (5.3.10) необходимо и достаточно, чтобы система уравнений вторых начальных моментов Ну — ЛДх/ Ху] была ус- тойчива в соответствующем смысле.
392 Глава 5.4. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ НЕПРЕРЫВНЫХ ЛИНЕЙНЫХ СИСТЕМ Для вторых начальных моментов Ну имеют место уравнения [6, 29] Ну = Ht_\j - an_i+iHjy + Ну_\ - ~an-j+\Hni + Gn-l+l,n-J+lHnn> = (5.3.11) гае ол_д:+1 - cn_k+1 -у^л-А:+1,1 • Для асимптотической (экспоненциаль- ной) устойчивости в среднеквадратичном сис- темы (5.3.10) необходимо и достаточно, чтобы выполнялись условия Рауса-Гурвица д2 *1 1 Оз 02 >о; Д1 = а\ > 0; 0 0 0 ... ап гае Qn 1 Qn-1 • Q\ 02 ... О «1 ... О О 0 ... ап Як ~ 0” JGn-i+l, n-J+V i+J=2k 1 £ /, j £ П. Если параметрические возмущения от- сутствуют (£/ = 0), то условия (5.3.12) соответ- ствуют устойчивости детерминированной сис- темы. Некоторые методы построения функций Ляпунова. Универсальных приемов построения функций Ляпунова К(х, /) для произвольных систем не существует. В методическом отно- шении приемы построения функций Ляпунова наиболее отработаны для конкретных систем. В зависимости от конкретной задачи можно задаться вспомогательной функцией V(x, /, а), зависящей от некоторого векторного парамет- ра. Вычислив L[V(x, /, а)] = -w(x, /, а) и подбирая значение а так, чтобы w(x, /, а) > О, можно получить эффективные условия устой- чивости. В отдельных задачах можно применить следующий подход. Задается функция w(x) > > 0 желаемого вида и по ней определяется К(х) для которой L[V(x)] = w(x). Глава 5.4 КОРРЕЛЯЦИОННЫЙ АНАЛИЗ НЕПРЕРЫВНЫХ ЛИНЕЙНЫХ СИСТЕМ 5.4.1. КОРРЕЛЯЦИОННАЯ ТЕОРИЯ СТОХАСТИЧЕСКИХ ЛИНЕЙНЫХ СИСТЕМ Корреляционная теория стохастических систем охватывает круг задач анализа первых двух вероятностных моментов: математиче- ского ожидания и корреляционной (ковариа- ционной) функции. Для векторного случайного процесса это соответствует определению вектора математи- ческого ожидания и матрицы ковариационных функций. Корреляционная теория линейных сис- тем базируется на линейных преобразованиях переменных и дает точное и полное решение задачи определения вероятностных моментов для линейных систем. Математическое ожидание вектора со- стояния в любой текущий момент времени определяется выражением и(0 = g('.'o)mo + t + J g(', t)[B(t)iiiv (t) + С(т)и(т)]й, (5.4.1) *0 где m(0 = 4*0 = A/fXfll; n>v(t) = = MvWL В скалярной форме для компонентов mXO вектора из (5.4.1) следует п Г=1 л Г Г +S J т)[^(тК W+с<»(т)“«т / = 1,л. (5.4.2) Для одномерной динамической системы, имеющей один выход и п входов, из (5.4.2) следует
КОРРЕЛЯЦИОННАЯ ТЕОРИЯ СТОХАСТИЧЕСКИХ ЛИНЕЙНЫХ СИСТЕМ 393 mAf) = + п t г _ +Е J *1Л'’4МФч(т)+Мт)иф 4=Ь0 (5.4.3) ще g\q(t,x) - весовые функции системы от всех входов q = 1, п. Корреляционная* матрица вектора выход- ных переменных определяется формулой 9(') = g('>'o)9og(Vo) + +J J g('- ^')R(T' > T")sT(/> П4*1'Л" *0 *о (5.4.4) ще R(f, т") = B(t')Kv(t', х")Вт(т"); Kv(t', т") - матрица корреляционных функций входной векторной переменной; Оо ~ корреля- ционная матрица начальных условий Хф. В скалярной форме (5.4.4) имеет вид М*) = + л t t г’4=1/0/0 (5.4.5) Если v(/) = £,(/) - белый гауссовский шум интенсивности G(f), то формула (5.4.4) принимает вид e(') = g('>'o)OogT(',*o) + + j в('> t)b(t)g(t)bT(t)8t ('. t)A. (5.4.6) Матрица корреляционных функций вектора выходных переменных. Для матрицы корреля- ционных функций многомерной системы слу- жит формула = g(Wo)°OgT(Wo) + 6 h + J J g('l, t")gT(/2, т")Л'Л". (5.4.7) ♦ Эту матрицу называют также ковариа- ционной и дисперсионной. В скалярной форме формула (5.4.7) име- ет вид p,q=i +J J gip(h л')ли(т', xn)gjg(t2/e')dede'}. f0 k (5.4.8) Если v(/) = £(/) - белый гауссовский шум с матрицей интенсивностей G(/), то (5.4.7) принимает вид 1ф1, h) = 8О1Ло)во£Т(*2>*о) + + Jg(<l,T)B(T)G(T)BT(T)gI(Z2,T)A. (5.4.9) Можно также определить матрицу корре- ляционных функций K(/i, /2)» исходя из вы- ражения К(/1./2) = 1('1-/)8(/’,2)в(/2) + + 0(Z1)gT(/,/1)l(/2-/), (5.4.10) ще 1(// - /) - единичная функция; 0(t/) - кор- реляционная матрица вектора состояния (/' = = 1, 2). Одним из общих методов корреляцион- ного анализа линейных динамических систем, описываемых стохастическими уравнениями типа Ланжевена (5.1.6), является метод момен- тов [10, 13, 20]. Существо метода заключается в составлении дифференциальных уравнений для вероятностных моментов вектора состоя- ния системы и интегрировании их при задан- ных начальных условиях. Данный метод по- зволяет получить точные дифференциальные уравнения для вероятностных моментов всех порядков линейных нестационарных систем. Эти уравнения для каждого момента к-го по- рядка содержат моменты только Л-го порядка входных переменных. Практически наиболее важной задачей является определение матема- тического ожидания вектора состояния и кор- реляционной матрицы из соответствующих уравнений. Математическое ожидание вектора фазо- вых координат. Для определения ш = Л/[х(/)] математического ожидания вектора состояния линейной системы (5.1.6) служит векторное уравнение [10, 14] m = A(/)m + В(/)пц(/), m(/b) = mo, (5.4.11)
394 Глава 5.4. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ НЕПРЕРЫВНЫХ ЛИНЕЙНЫХ СИСТЕМ 1деПЦ(/) = Ж(0]. В скалярной форме это уравнение пре- вращается в систему линейных уравнений 7=1 ^ОЬ) = ^0> (5.4.12) где / = 1,л . Коррелздионная матрица фазовых коорди- нат. Для определения 0(1) = Л/{[х(/) - ш(/)1 х х [х(/) - m(Z)]T} корреляционной матрицы фазовых координат системы (5.1.6) служит матричное уравнение [10, 14] ё = А(г)е+9Ат(г)+B(z)G(z)BT(l), O(ro) = 0o, (5.4.13) где G(/) - матрица интенсивностей белого гауссовского шума. В скалярной форме уравнение (5.4.13) имеет вод +ау(№}к) + 7=1 PJ=1 = e«('o) = e«o- Вследствие симметричности корреляци- онной матрицы 0(/) справедливо 0# = 0#. Поэтому число независимых уравнений (5.4.14) равно п(п + 1) / 2, ще л - порядок исходной системы. Уравнение для матрицы корреляцюнных функций вектора состояния. Для определения матрицы корреляционных функций K(/i, /2) вектора состояния (фазовых координат) систе- мы (5.1.6) служит уравнение ^l = A(r)K(r)4 K(z-,z') = e(z'), (5.4.15) ще 0(/ *) -ковариационная матрица, опреде- ляемая из (5.4.13). 5.4.2. ТОЧНОСТЬ ЛИНЕЙНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ Вышеприведенные формулы для вероят- ностных моментов фазовых координат автома- тической системы справедливы также для оп- ределения моментов координат теоретической модели. После определения этих моментов вероятностные моменты ошибки 0е и р реальной системы определяют по формулам (5.2.9), (5.2.14), (5.2Д5). Если ошибка е = х - X]. включена в чис- ло фазовых переменных автоматической сис- темы и получены дифференциальные уравне- ния для е(/)> то задача оценки точности реша- ется изложенным путем с помощью уравнений (5.4.11) и (5.4.13). Корреляционный анализ стационарных систем можно проводить по вышеприведен- ным уравнениям. Однако для стационарных устойчивых систем одним из характерных ре- жимов их функционирования является режим, установившийся при действии стационарных случайных возмущений. Для определения ве- роятностных моментов в установившемся ре- жиме можно применить метод моментов и метод передаточных функций. Математическое ожидание вектора фазо- вых координат в установившемся режиме. Уста- новившееся значение математического ожида- ния вектора фазовых координат определяется из линейного алгебраического векторного уравнения, получаемого из (5.4.7) при m = 0 Am + Впц = 0. (5.4.16) В скалярной форме уравнение (5.4.16) принимает вод п п ___ Yaymj=°> / = 1’л- 7=1 (5.4.17) Математическое ожидание выходной пере- менной одномерной системы в установившемся режиме. Для стационарной одномерной ли- нейной системы, заданной передаточной функцией Ф(р) (рис. 5.4.1) математическое ожидание т(/) выходной переменной х(/) в установившемся режиме определяется форму- лой т = £-^ф(г)(0)Дг), (5.4.18) г=0Г’ ще Ф(|Д0) - г-я производная передаточной функции по р при р = 0; nty - r-я произ- водная математического ожидания входного сигнала ~v(/). Рве. 5.4.1. Одномерная стационарная система
ТОЧНОСТЬ ЛИНЕЙНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ 395 Если на систему действует несколько возмущений vX/), (/ = 1,<?) > то формула (5.4.17) принимает вид да=£Х;дф')(0)4')« <5-419> 1=1 г=0 где ФХр) - передаточные функции от соответ- ствующих входных возмущений. Систематическая (динамическая) опмбка в установившемся режиме. Если задана переда- точная функция Фт(р) теоретической модели одномерной замкнутой системы, то АфСг(/)] = = !»].(/) в установившемся режиме можно определить по формуле, аналогичной (5.4.18) тт = ^-^фН(0)4г), (5.4.20) г=0Г' где Ф^О) - r-я производная функции Фт(р) по р при р = 0. Математическое ожидание ошибки ре- альной системы те = т - т? в установив- шемся режиме вычисляют по формуле (5.4.21) где сг - коэффициенты ошибок стационарной системы в установившемся режиме. Если на систему действует несколько возмущении vX/)> / = l,g , то формула (5.4.21) принимает вид те = £XcrtwW > /=1г=0 с* = л[ф'Г>(°)-ф<тМ’ (5.4.22) где ФХр) и ФтХр) - передаточные функции от соответствующих входов. Связь между коэффициентами опивок и параметрами системы. Если передаточная функция сложна, то пользоваться формулами для коэффициентов ошибок, вычисляемых через производные Ф^(р), нецелесообразно. Практический способ вычисления коэффици- ентов ошибок состоит в следующем. Представим передаточную функцию Фе(р) на основании (5.4.21) в виде 00 Фе = £crZ. Однако задана Фе(р) в форме г=0 дробно-рациональной функции Фе(р) = ЬтРп + , пЪ.т. anpn+...+aQ Из сравнения этих выражений вытекают рекуррентные формулы для коэффициентов: С°=Т'; С1 =“"[*!-alc«b «О в0 с2 =~[Z>2 ~а1с1 -а2Со]; •••> = 7- *в-Уо/Сг-/ ; г = о,1, ... ал СГ ' Z» а0 /=1 (5.4.23) Астатизм непрерывных стационарных сис- тем. Непрерывную систему называют астатиче- ской r-го порядка, если коэффициенты оши- бок со = Cj = ... = сг _ 1 = 0. Система с аста- тизмом r-го порядка воспроизводит входной полиномиальный сигнал вида ту = к$ + + + kr _ \ f ’ 1 без систематической (динамичес- кой) ошибки. Систематическая (динамическая) оливка следящей системы. Математическое ожидание т? ошибки е* = v - х = -е стационарной одномерной следящей системы, заданной пе- редаточной функцией W(p) разомкнутой цепи (рис. 5.4.2, а), определяют по формуле те. = ^77фе-(о)4’’)(0. г=0 Формулу (5.4.24) записывают также в ви- де а) б) Рас. 5.4.2. Стационарные линейные системы с отрицательной обратной связью: а - непрерывная; б - дискретная
396 Глава 5.4. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ НЕПРЕРЫВНЫХ ЛИНЕЙНЫХ СИСТЕМ me. = ^сг4г)(/), сг = -^Ф^о), г=0 (5.4.25) где сг - коэффициенты ошибок стационарной следящей системы в установившемся режиме. Первые три коэффициента имеют назва- ния: Cq - коэффициент ошибки по положе- нию, С\ - по скорости, С2 - по ускорению. Для того чтобы следящая система имела статизм г-го порядка, необходимо, чтобы РК(р) имела вид и'(р) = 4^)’ »И<0) *0. р Устойчивость замкнутой системы обеспе- чена благодаря выбору структуры ^(р). Математическое ожидание выходной пере- менной многомерной системы в установившемся режиме. Вектор математического ожидания ш выходной переменной в установившемся ре- жиме многомерной устойчивой системы опре- деляют по формуле mW=Ё А ф(г) (o),,,’r, w - (5л2б) г=0Г’ где m(t) - л-мерный вектор; Ф<г)(0) - r-я про- изводная матрицы передаточных функций; ~ г-я производная входной векторной переменной. Для многомерной стационарной систе- мы, заданной матрицей Ф(р) передаточных функций, вектор математического ожидания ошибки Ше в установившемся режиме вычис- ляют по формуле (5.4.21), где Сг - матрица коэффициентов ошибок, а Ф(р). Фт(Р) - матричные передаточные функции. Корреляционная (дисперсионная) матрица выходных переменных системы в установившем- ся режиме. Установившееся значение корреля- ционной матрицы стационарной многомерной линейной системы, заданной дифференциаль- ным векторным уравнением (5.1.6), определя- ют из алгебраического уравнения А© + 0АТ + BGBT = 0. (5.4.27) Если стационарная многомерная линей- ная система задана матрицей Ф(р) передаточ- ных функций, а на систему действует вектор входных случайных возмущений (белых гаус- совских шумов), то корреляционная матрица выходных переменных в установившемся ре- жиме 0 = |ф(/<о)у-Фт(- ko)dio, (5.4.28) где G - матрица интенсивностей белых шумов; Ф(/<о) - матрица частотных функций системы. Если вектор внешних случайных возму- щений v(/) - небелый шум, то формула (5.4.28) принимает вид 0 = J Ф(/<о)8у(<о)Фт(- /<o)do, (5.4.29) -ОО где Sv(o) - матрица спектральных плотностей вектора v(t), S(<o) = Ф(ло)8у(<о)Фт(-ло) - матрица спектральных плотностей выходного вектора x(Z). Для одномерной системы, заданной пе- редаточной функцией замкнутой цепи Ф(р), дисперсию выходной переменной определяют по формуле 0= J |Ф(/<о)|2 5v(co)do. (5.4.30) -оо Интегралы, выходящие в эти формулы при дробно-рациональных частных функциях Ф(/<о) и спектральных плотностях 5у(<о), вы- числяют с помощью табличных интегралов. Формулы для интегралов от дробно- рациональных функций 1п = — [ \dw’ (5 4.31) где Л„(х) = вохя +eix"'1 +... + ая; g„(x) = *0х2"’2 +M2"’‘* +...+V1- Все корни hn(x) лежат в левой полуплос- кости, *0 . 2а0в! ’ -*0+^- а2 . 2в0«1 h -a2bQ+aQbl-a-^ °3 2ао(°овз ~ aia2)
ТОЧНОСТЬ ЛИНЕЙНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ 397 Ьд(-а{а4 + л2«з) -аоаз+<Whb2 + ^^-(aQa3 -а{а2) 2ло(лолз +aia4 -а^а^ I М* 5 2ao^5 М5 =^o(_flOfl4fl5 +fllfl4 +a2fl5 -a2fl3a4)+ fl0^1(_fl2fl5 + a3a4) + а0^(а0а5 -alfl4) + fl0M"fl0fl3 +fll*2)+^1(-fl0fllfl5 +fl0fl3 -fli2fl4 -л1л2°з); A5 =QqoI -200010405 -0Q020305 -0Q0304 + ala4 +ala2a5 ~ a1^2a3a4’ Общая формула dmr = <»2m-n as = 0 (5 < 0, S > л), где N„ - определитель, полученный из D„ заменой элементов первого столбца величина- ми Ьц9 Ьь ..., />л_1. Точность автоматической многомерной системы в установившемся режиме оценивается величиной корреляционной матрицы ©ее ошибки е и может быть рассчитана по форму- ле (5.2.15). Чтобы воспользоваться этой фор- мулой, необходимо определить матрицы 0г г , ©ххт по формулам: = JФ(ло)8у(<о)Фт(- /со)do; -00 00 ®х,х, = f ®t(«»)Sv(<»)®T(- «»)<*>; (5.4.32) -ОО оо 0«, = /ф(й>)8у(<о)Ф*(-й>)Л>; -оо где Ф(ю), Фт(ло) - матрицы частотных ха- рактеристик реальной и теоретической систем; Sv(co) - матрица спектральных плотностей вектора v°(/). Для одномерной автоматической системы формулы (5.4.32) принимают вид скалярных выражений оо 6» = ||Ф(«в)|2уу(<о)Л>; -00 00 6Г|Г1 = J |Фт(ло)|25у(<о)^о; (5.4.33) -00 00 -00 Точность одномерной следяцей системы, заданной передаточной функцией Л^(р) ра- зомкнутой цепи (рис. 5.4.2, 6), в установив- шемся режиме оценивается величинами мате- матического ожидания /ле* и дисперсии 0е*е* ошибки по формулам: г=0~ ’ (5.4.34) 00 0е*е* = J|®e«(«»)|2 iy(<o)<*O, гае Ф(/(в) = Т7Йо - частотные характе- ристики; .Sy(со) - спектральная плотность вход- ного сигнала v°(/); mv(/) - математическое ожидание входного сигнала v(/). Для вычисления интегралов в (5.4.34) следует воспользоваться формулой (5.4.31).
398 Глава 5.5. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ 5.4.3. МЕТОД КАНОНИЧЕСКИХ ПРЕДСТАВЛЕНИЙ СЛУЧАЙНЫХ ПРОЦЕССОВ В данном методе используется канониче- ское представление случайных процессов в виде произведения случайных некоррелиро- ванных величин и неординарных функ- ций времени av(/)« Так, векторная входная случайная функция v(/) представляется в виде [20] v(0 = mv (0 + £ K®av(0, (5.4.35) V где mv (/) - вектор математического ожидания функции v(/); Kv° - случайные некоррелиро- ванные величины, имеющие дисперсии = 1 V’ V <**(0 - заданные L J [0, v # ц неординарные векторные функции времени. Вектор фазовых координат х(/) также пред- ставляется в виде канонического разложения х(0 = ш(0 + (0 (5.4.36) V с неизвестным вектором ш(/) и координатны- ми векторными функциями <Pv(0- Неизвестный вектор математических ожиданий ш(/) фазовых координат определя- ют из уравнения m = Am + Bmv(/), mo(O = mo, (5.4.37) а неизвестные векторные координатные функ- ции - из уравнений: <pv = Aq>v + Bav(/); <pv(/o) = 0. (5.4.38) Если поведение системы рассматривается при случайных начальных условиях, то реше- ние системы согласно принципу суперпозиции можно рассматривать как сумму х(0 = ш(Г) + rv°q>v(O + х’(0, (5.4.39) V где х (/) - вектор, связанный со случайным начальным условием x°(/q) = X(j, определяе- мый из уравнения х*=Ах*, х*(/о) = Хо- (5.4.40) Матрица корреляционных функций и корреляционные матрицы вектора х(/) опре- деляют по формулам: К(/, f) = Y Dvq>v(r)4>;(r-) + Kx.x.(t,t’); V (5.4.41) ®(0=X а«моф1('') V (5.4.42) Если автоматическая система задана лю- бым другим линейным оператором N X = М, (5.4.43) то m(/), <pv(/)> х*(0 представляют собой ре- зультаты преобразований рассматриваемым оператором функций соответственно Шу(/) av(/) и начального условия Xq. Глава 5.5 КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ 5.5.1. МЕТОД ДИСКРЕТНЫХ ПЕРЕХОДНЫХ ФУНКЦИЙ СОСТОЯНИЯ Математическое ожидание вектора со- стояли определяется по рекуррентный фор- муле [10] m(fc +1) = A*(fc + l,O)mo + k + A*(k +1, r +1) C(r +1, r) u(r), (55.1) r=0 где k A*(fc +1,0) = J"| A(/ +1, /); /=0 k К*(к + \,г + 1^ = JJa(/ + 1,Z), fc = 0,l,.... /=r+i В скалярной форме этот алгоритм имеет вид л mt(k +1) = £ + l,0)my0 + J=1 к n + X Av(k + l’r + OS Са(г + r=0 v=l / = M, = 0,1,2,.... (55.2) Коррелярюнная матрица &(k + 1) векто- ра состояли! определяется итерационной про- цедурой по рекуррентной формуле
РЕКУРРЕНТНОЕ УРАВНЕНИЕ ДЛЯ ВЕРОЯТНОСТНЫХ МОМЕНТОВ 399 ®(к +1) = A*(fc + +1,0) + к + ^A*(fc + l,r +l)B(r + l,r)G(r) х г=0 х BT(r + 1,г)А*т(£ + 1,г +1), к = 0,1,.... (5.5.3) В скалярной форме формула (5.5.3) при- нимает вид М*+1> = £р^(*+1,о)4^(Л+1,0)0^0 + РЛ=1 к + £Л^(£ + 1,Г + 1)х г=0 х S5Ai(r + 1’r)G!uv0-8v,(r + l,r) M,v=l х Л^(*+1,г+1)|, ',/ = 1,л, к = 0,1,2,.... (5.5.4) Матрица корреляционных функций вектора состожия дискретной системы определяется рекуррентной формулой [10] К(£ +1,0 + 1) = A*(fc + 1,О)0оА*т(£ +1,0) + к + ^Г A*(fc + l,r +l)B(r + l,r)G(r) х г=0 х BT(r +1, г)А*т(0 +1, г +1), М = 0,1,2,.... (5.5.5) В скалярной форме формула (5.5.5) при- нимает вид ^(£ + 1,Л + 1) = п = S{Ap(^ + 1»°)®p«o^(^ + 1»o) + Р.«=1 к + £Л^(*+1,Г + 1)х г=0 х Е В» (Г + *>Г) GV» ^В9> (Г + !’Г) H,v=l хЛд(Л + 1,г + 1)}, /,;=1,л, к,h = 0,1,2,.... I х (5.5.6) Матричная корреляционная функция дискретной системы может быть также опре- делена на основании следующей формулы: К(к + 1, h + 1) = = l(fc - Л) к\к + 1, h + 1) 0(Л + 1) + + 0(Л + 1) А^(к + 1, h + 1) 1(к - Л), к, h = 0, 1, 2....... (5.5.7) где 1(к - Л) - единичная функция, равная нулю при к < h и единице при к > Л. При к— h она равна 1/2. Так как функция К(к + 1, Л + 1) сим- метрична, то можно использовать первый или второй члены формулы (5.5.7). Например, если воспользоваться первым членом, то с учетом обозначения для А?(к + 1, Л + 1) имеем к K(fc + 1, Л + 1) = J”[ A(r +1,г)©(Л +1), г=/+1 к, h = 0, 1, 2.. 5.5.2. РЕКУРРЕНТНОЕ УРАВНЕНИЕ ДЛЯ ВЕРОЯТНОСТНЫХ МОМЕНТОВ Применение метода моментов для анали- за нестационарных линейных дискретных сис- тем более эффективно, чем применение мето- да переходных функций, так как рекуррентная процедура вычисления вероятностных момен- тов проще. Рекуррентное уравнение для вектора мате- магического ожидания. На основании рекур- рентного уравнения (5.1.26) для определения вектора математического ожидания т(£ + 1) получаем m(fc + 1) = А(к + 1, к) т(к) + + С(к + 1, к) u(fc), т(0) = то- (5.5.8) В скалярной форме эго уравнение пред- ставляет собой систему разностных итератив- ных процедур п m^k + l) = ^Ag(k + l,k)mj(k) + /=1 п + ^iv(k + l,k)uv(k), V=1 /Л/(0) = /л/0, / = 1,л. Рекуррентное уравнение для корреляцион- ной матрицы. Корреляционную матрицу векто- ра фазовых координат дискретной системы определяют из рекуррентного уравнения
400 Глава 5.5. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ ®(к + 1) = А(к + 1, к)® (к) А?(к + 1, к) + + В(к + 1, к) G(k) 1Р(к + 1, к), 0 (0) = 0 о» к=0, 1, 2... (5.5.9) В скалярной форме матричная итераци- онная формула (5.5.9) представляет собой сис- тему уравнений вида Ы*+1) = = iiAlp(k+i,k)Aql(k+i,k)eM(k) + + YB‘r(.k + ^ к) вАк +1. k)Gri<k>, г, 1=1 = к = 0,1,2,.... (5.5.10) Матричная корреляционная функция дис- кретной системы. Разностное уравнение для матрицы корреляционных функций дискрет- ной многомерной системы следующее [10]: При к £ I К(к + 1,1 + 1) = ’A(fc + 1, к) К(к9 I) А?(1 + + 1, /) + В(к + 1, к) G(k) Ьн Вт(/ + 1, /) + + А(к + 1, к) А\к + 1, к) В(/ + + 1, /) G(/) Вт(/ + 1, /), к, I =0, 1, 2, ... , (5.5.11) ще - символ Кронекера. При к< I в силу симметричности K(fc + + 1, I + 1) K(fc + 1, I + 1) = А(/ + 1, /) К(£, /) Щк + + 1, к) + В(/ + 1, /) G(k) Ьп W(k + 1, к) + + А(/ + 1,1) к + 1) В(к + + 1, к) G(k) Вт(* + 1, к), k,l=Q, 1, 2, ... . (5.5.12) При к = I из (5.5.11) или (5.5.12) полу- чаем ®(к + 1), т.е. (5.5.9), так как A*(fc, к + + 1) = 0. 5.5.3. СТАЦИОНАРНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Корреляционный анализ стационарных дискретных систем можно проводить по вы- шеприведенным формулам. Однако для анали- за установившегося режима при к -> оо в ста- ционарной дискретной системе при действии стационарных случайных сигналов существуют другие расчетные методики, как и для непре- рывных систем. Математическое ожидание выходной пере- менной и ошибки одномерной дискретной систе- мы. Для стационарной дискретной линейной одномерной системы, заданной Z-передаточ- ной функцией W*(z) разомкнутой цепи, ма- тематическое ожидание т выходной перемен- ной х в установившемся режиме определяют по формуле [10] »(*) = (5.5.13) г=0Г< где Hr = —— Ф*(еГпР)| , z = еГпД, dp |Р=0 Первые три момента вычисляют по фор- мулам: но = ф*(0; Н1=ТпФ,<1>(1) = Тп^Ф*(г)|г=1; Н2 = 7’п[ф’<2)а)+ф,<1)(о]; из = г’[ф,(3)(1) + ЗФ*(2>(1)+Ф*(,)(1)]. Математическое ожидание mg»(k) ошибки одномерной линейной стационарной дискрет- ной системы в установившемся режиме те" <*> = X С''"’° (5-5'14) г=0 Коэффициенты ошибки сг (г = 0, 1, ...) вычисляют по формулам: г=еГпД, <D*(z) = W У . 1 + FF (Z) В частности, с0=ф;.(1); С1=-ТПФ’<2)(1); с2=|7-п2[ф;<2’(1)+ф;(.,)(1)];
СТАЦИОНАРНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ 401 с3=-1т’ [ф;<з>(о+зф;<?(1)+ф^о], Если система имеет q входных сигналов vXO> то формула (5.3.14) принимает вид ««•(*) = (5.5.15) /=1г=0 где cri - коэффициенты ошибок, Связь между коэффициентами опшбки и параметрами передаточной функции. Передаточ- ная функция одномерной дискретной разност- ной модели типа (5.1.44) для ошибки при одном входе имеет вид ф.(;)-цг(SS16) dn(z-l) +...+d0 Представим выражение установившейся ошибки также в разностном виде те(к) = ^сгЛгту(к), г=0 (5.5.17) Фе*/() * передаточные функции от /-го вхо- да. Астатизм дискретной стационарной систе- мы. Дискретная система имеет астатизм v-ro порядка, если с<) = Q = ... = cv - 1 = 0. Такая система воспроизводит без ошибки входной сигнал вида ту(к) = oq + a^Tn + ... + + о». i (kT„y - Дискретная следящая система, содержа- щая в прямой цепи v интеграторов z-переда- точную функцию J 1 1 T^zJXz) lH (Z-1)V и дискретную часть с передаточной функцией Wj (z), имеет разомкнутую z-передаточную функцию (Z-1)V ще Dv.t(z) = aiz' 1+...+flv-i (v-1)! ак = ^(.-Л*"1 J=1 Так как z-передаточная функция замкну- той дискретной следящей системы ф’.(х) = 1 то при (1) # 0 данная система имеет Cq = = ... = cv . i= 0 и обладает астатизмом v-ro порядка. где Armv(fc) - прямые разности r-го порядка. После ^-преобразования выражения (5.5.17) получим ту же передаточную функцию Фе(х) ошибки в виде 00 4>e(z) = ZC'-(Z-1)r- <5S18> r=0 Приравнивая (5.5.16) и (5.5.18), получим формулы для коэффициентов ошибки Сг - — Ьг У* ^icr-i <4 лн г = 0,1, (5.5.19) Откуда следует с2 = ^[^2 " dlcl ~ ^2co]i ••• • Математическое ожидание вектора со- стояния дискретной многомерной стационарной системы в установившемся режиме. Для стацио- нарной многомерной дискретной системы заданной матрицей z-передаточных функций Ф*(х) вектор математического ожидания со- стояния определяется формулой [10] mW = S (S-5-20) г=0Г_ где ш^ (к) - r-я производная вектора Шу (Л), а Hr =
402 Глава 5.5. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ Дисперсия выходной переменной одномер- ной системы в установившемся режиме. .Если задана z-передаточная функция дискретной одномерной системы Ф*(?)> то спектральная плотность случайной составляющей выходного сигнала определяется так [10] «(«>) = |ф’(е*“г")|2^(а>), (5.5.21) ще Sy (со) - спектральная плотность дискрет- ного входного случайного стационарного сиг- нала Ч®(кТ^). В частности, спектральная плотность стационарной последовательности некоррелированных импульсов постоянна 5v ' 2п ’ ще D - дисперсия импульса. Так как частотная характеристика Ф*(е/“7°) является периодической функцией частоты с периодом Тп = 2тс(0о, то для Дис- персии 0 выходной переменной в установив- шемся режиме служит формула е = I |ф*(е/т7")|\у (“М»- (5.5.22) _____л Та Перейдем к переменной z = 0 = 7Г" f n|z|=l v п 7 (5.5.23) Интегрирование в (5.5.23) осуществляют по окружности единичного радиуса. Для того чтобы вычислить интеграл, удобно провести 1 + W ГТ замену z =-----, I = ч -1 : 1-w 2 1- W2 ще 1 Л 1 . 1 + w =—5у -5^-In----- т„ Ч»Тп 1-*. = р‘'(а>). Заменяя w — /X, окончательно получаем -^pd(№k, 1 + X (5.5.24) ще Ф*(х) - передаточная функция ошибки одномерной дискретной системы. Интетрал вычисляется по таблицам после приведения к табличному виду. Подынтегральное выражение представле- но в виде 2 2 od(!k\ = 1+х2р 1 ’ ЫЫЫ-ЬУ гае Л„(х) = вох* + ... + а„; &,(«) = 4ох2"-2+... + ^.!. Тогда формулу (5.5.24) можно привести к виду, известному для непрерывных систем: в = 2х/п, /„ =— J (5.5.25) Корреляционная матрица вектора состоя- ния многомерной системы. Для дискретной многомерной стационарной системы, заданной матрицей Ф*(х) передаточных функций, мат- рица спектральных плотностей вектора со- стояния в установившемся режиме имеет вид S(cd) = Ф‘(е-^^п) Sy (со) Ф*(е/“Гп), (5.5.26) где Sy (ш) - матрица спектральных плотно- стей вектора входных возмущений. Корреляционная (дисперсионная) мат- рица вектора состояния я Т в = | ф‘(е'*“г" ) Sy (<о) Ф*(е*°7’" )*>. Л ~Тп (5.5.27) С помощью замены переменных по ме- тодике, изложенной ранее, получаем ’>! — ОО (5.5.28) где pd(ik) - матрица.
ЛИНЕАРИЗАЦИЯ НЕЛИНЕЙНОСТЕЙ ПРИ СЛУЧАЙНОМ ВХОДНОМ СИГНАЛЕ 403 Интегралы, входящие в матричную фор- мулу (5.5.28), вычисляют по таблицам [23]. Глава 5.6 КОРРЕЛЯЦИОННЫЙ АНАЛИЗ НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ НЕЛИНЕЙНЫХ СИСТЕМ Стохастические процессы в нелинейных системах качественно и количественно значи- тельно отличаются от процессов в линейных системах. В отличие от линейных для произ- вольных нелинейных систем не существует общего точного метода решения задач вероят- ностного анализа. Корреляционный анализ нелинейных систем проводят приближенными методами. К ним относят методы линеаризации путем разложения в ряд функциональных нелиней- ностей, метод статистической линеаризации, метод эквивалентных возмущении, интерполя- ционный метод, а также метод статистических испытаний. 5.6.1. ЛИНЕАРИЗАЦИЯ НЕЛИНЕЙНОСТЕЙ ПРИ СЛУЧАЙНОМ ВХОДНОМ СИГНАЛЕ Линеаризация дифференцируемых нели- нейностей. Если безынерционная нелинейность. у = <р(х) описывается однозначной диффе- ренцируемой функцией, то при малом изме- нении входного сигнала она может быть при- ближенно заменена линеаризованной зависи7 мостью относительно центрированной состав- ляющей х°(0> имеющей малую дисперсию [20] (5б1) ще х°(1) = х(/) - Для многомерной нелинейности у = - <р(Х], ..., хл) линеаризованная зависимость I \ ...о '”Ь.......ЧЬЕ а=, 1 = 1 (5.6.2) Векторная нелинейная зависимость в ли- неаризованном виде следующая: У = ф(тх) + ^^Х0, (5.6.3) „ Эф где ф - векторная нелинейность; —— - дтх матрица. Статистическая линеаризация. Если нели- нейности недифференцируемы, имеют неод- нозначные характеристики или изменения входного процесса превышают зону, в которой нелинейная функция может быть заменена линейной, применяют статистическую линеа- ризацию. Статистическая линеаризация состо- ит в аппроксимации с минимальной диспер- сией ошибки нелинейного безынерционного преобразования линеаризованной зависимо- стью, эквивалентной исходной в вероятност- ном смысле [8] в предположении, что закон распределения процесса на входе в нелиней- ность гауссовский. Многомерная нелинейность у = ф(х, I) аппроксимируется зависимостью п (5-6.4) 1=1 ще Фо(ш, в, I) = Л/[ф (х, 1)|, а А/ определя- ются двумя способами: л/(1)(ш,ед) = °" дтг Эфр] xsign-^- onii У sign^; i = r«; 1 v ' dmt Оф=А/[(у-ф0)2]; eri = A/[x®x®], A4x]=m; 0 - корреляционная матрица векторного про- цесса Хо(1) с компонентами 0^ (г,1 = 1,л) . В частном случае одномерной нелиней- ности у — ф(х, I) У = Фо(ш, 0, Ь + (5.6.5) где 00 4>о(«, 6> О = м |ф(х, 01 = J 9(x)f(x,i)dx, -СО
404 Глава 5.6. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ к1^(к1+к2); 00 Dv= /ф2(м)/(*>О<&-фо; -00 0= j X2 f(x,f)dx - т2 ; т = ^xf(x,t)dx. -00 -00 Для многих нелинейностей составлены таблицы [6] при гауссовском законе распреде- ления. Если нелинейность одномерная одно- значная нечетная симметричная, то функция срО может быть представлена так: <ро(/и, 0, I) = Ао(/и, 0, f)m$. (5.6.6) Формально метод статистической линеа- ризации распространяется на векторные нели- нейности у = ф(х, t), где ф( ) - векторная нелинейность; х - вектор. Статистически эквивалентная векторная линеаризованная зависимость имеет вид [10] у = фо(ш, в, /) + К(ш, в, /)х°, (5.6.7) где ф( ) - векторная статистическая харакгери- * стика нелинейности; К( ) - матрица статисти- ческих коэффициентов усиления. 5.6.2. МЕТОД ВЕРОЯТНОСТНЫХ МОМЕНТОВ Метод вероятностных моментов при корреляционном анализе нелинейных систем может быть применен при предварительной обычной или статистической линеаризации безынерционных нелинейностей. Метод ы Моментов при обычной линеариза- ции и аддитивном белом шуме. При аддитивном белом шуме стохастическая система (5.1.5) имеет вид X = а(х, и, 0 + B(0!j, x(%) = Хо- (5.6.8) После линеаризации нелинейностей уравнения для первых двух вероятностных моментов следующие: m = а(ш, и, 0 + В(/)пц, ш(Го) = то; (5.6.9) 5a(m,u,f) (да(т,и,/)У e = —ai-e+e[ ат ) + + B(0G(0BT(0, 6(/o) = 6o> 5a(m,u,f) где —------- - матрица производных. 5т Эти уравнения интегрируются последова- тельно или совместно при заданных начальных условиях. В скалярной форме уравнения (5.6.9) следующие: й* = ак(т, u,t)^ 7=1 (5.6.10) . dak(m,u,t) п п daAm9u9t\\ dmJ J 4 dmJ / + (0^/(0^ (0, = QkKh k9l = 1,л. Число таких уравнений для равно л, а для 0ju их число равно п(п + 1) / 2. Метод моментов при обычной линеариза- ции и мультипликативном белом шуме. При мультипликативном белом шуме, как в равен- стве (5.1.5), после обычной линеаризации по- лучаем уравнения для первых двух моментов [10, 26] m = a(m,u,f) + В(ш,0пц + + м[к’(т,0хо(0$о(0]; (5.6.11) 5a(m,u,f)^ f5a(m,u,/)V 5т 5т ) + В(т, /) G(r) ВТ (т, г), т(Г0) = т0, в(/о) = ®о, __ . . 5В(т,/) где К р (т, О = ——— - вектор матриц, 5т каждая из которых составлена из производных матрицы В(т,0 по одной из компонентов /И/ (/ = 1,л). Вектор Л^К^(т,0х°(0^°(0] имеет вид
МЕТОД ВЕРОЯТНОСТНЫХ МОМЕНТОВ 405 Л/[к^(т,/)х0(05°(о] = Ш) г) п onij (m,<)g (<) dmj JP ич (5.6.12) ще Gpq(f) - компоненты матрицы; G(/) - ин- тенсивности белого шума 4°(/). Уравнения (5.6.11) следует интегрировать совместно. В скалярной форме уравнения (5.6.11) можно записать так: п тк = ak(m,u,t) + '£вЦ<т>‘)ть + /=1 т* = акй(т,Ъ, , 7=1 л»*(/0) = тк0; (5.6.15) ®к! = /=1 + ®*/(*о) = ®*/о- М=1 Пусть нелинейная система имеет струк- туру, изображенную на рис. 5.6.1, и уравнения вида: х = х^ xj = х2; х2 =х3; £ 2 п I ЛРЛ=1 отj 9«-^-а^-е»+е*/ Эд/(т,/) З/Иу п ____ + к,1 = 1,п, к . . i 2 , к = - 7Te<xi> - 7*2 - 7хз+ где а(х\) = I signal; 4(0 - белый гауссовский шум, имеющий математическое ожидание и интенсивность (г, b = const; к — const; Т = = const; / = const. После статистической линеаризации не- линейности линеаризованная зависимость имеет вид mkW ~ mk(h &kl<M = ®kl0- (5.6.13) Метод моментов при статистической ли- неаризации и аддитивном белом шуме. Для мо- дели (5.6.8) с аддитивным белым шумом £(/) после статистической линеаризации уравне- ния, определяющие вектор ш и матрицу 0, следующие: m= ao(m, u, t) + В(/)пц, m(/b) = “MJ (5.6.14) в = Кд(ш, 11,/)® + ® КТа (ш, @,11,/) + + В(/) G(/) №(/), ®(/b) = ®o, ще ao(m, @, и, /) = Л/[а(х, и, 1)1 - статисти- ческая векторная функция нелинейности; Kfl(m, 0,и,/)- матрица статистических ко- эффициентов усиления, зависящая от Ш, @. Уравнения (5.6.14) интегрируются только совместно. В скалярной форме уравнения (5.6.14) имеют вид где a(xi) = ао(ть 0ц) + ^(ть вп)*}*, flo(wl0ll) = Рве. 5.6.1. Нелинейная система третьего порядка
406 Глава 5.6. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ Л<2)(т1>0п) = 0ц = M^(xi - mt)2 j. Уравнения для вероятностных моментов: mi = m2; т2 = mj; JU> ©и = 0i2 =02? +0в; 013 =023 -^7*1('я1’0и)-у2-012 - 023 =0зз - *1(»«1,011)012 ~~2 е22 “ -|02з; 022 =2023; 033 =_“у<:1(в’1,011)033 -•^023 “ Ф й . Ь2к2 -у033 + -Л G. ТА Интетрирование этой замкнутой системы должно проводиться при начальных условиях w10. Ш20, Шзо, Оно, Э120. 0130. 0230, 0220- Метод моментов при статической линеа- ризации и мультипликативном белом шуме. Для модели (5.1.5) с мультипликативной нелиней- ностью после статистической линеаризации получаются следующие уравнения: m = а0(ш, в, и, /) + В0(ш, в,/)пц + + М[(к;(ш,в,/)х0)?0]; (5.6.16) 6 = Ка(т, в, и, /)в+вК^(т, в,и,Г) + + В0(т, e,/)G(/)Bj(m, в,/), те Чо = и, 1)1; Во = 3flB(x, I)]; Kj(m, 6, I) - вектор матриц Кд(т, 0t I). составленных из коэффициентов статической линеаризации по /-й переменной; ^(к;(т, в, r)x°(z))^° (/)]= 4 s ................................. М, v= 1 К щ (т, 0, /) В(т, 0, /) Gvk (/) (5.6.17) Уравнения (5.6.16) должны интетриро- ваться совместно. В скалярной форме уравне- ния (5.6.16) записываются так: тк =at0(m,e,u,/) + £Bg0(ni,e,f)m^ + 7=1 2 p.9=i (5.6.18) + 7=1 + ^(m,e,u,f)0#) + ;,y=i к,l = 1, n. Если в нелинейной системе коэффици- ент b(xy t) считать зависящим от Ху т.е. Ь(Х1), то уравнения принимают вид Х1 =х2; х2 =х3; *з=-ух3-А-х2-^ф1) + afxj) = / sign xi. Применяя статистическую линеаризацию нелинейностей а(х0 и Ь(х\) получим: ФО = eo(»»i. 0п) + 0и) х®; ЬЫ = Ao(mi, 0ц) + kb(mt, 0ц)х1°.
ТОЧНОСТЬ НЕЛИНЕЙНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ 407 Уравнения для вероятностных моментов имеют вид: = m2; m2 = m3; «3 =-yw3 -^-eo(wl,0ll) + +^(т1,вц)^ Присоединяя к этим равенствам конкрет- ные выражения для 0> и), К^Ш, 0, и), имеем замкнутую систему нелинейных урав- нений для определения m и 0. Эта задача ре- шается численно методом последовательных приближении или трафически. Для системы третьего порядка в устано- вившемся режиме получим следующие урав- нения и соотношения: 911=2912; 012 =022 +013> 022 =2023> 013 = 023 М1”!»0»)0!! “yf0!* “ -у0в; ®23 = 033 М^Ь0!!^ “^022 “ т2 ~ 0; т3 ~ 0> 012 ~ 0> 023 ~ 0; 013 ~ ”022i 033 = “2"022i Я0(т1» 011) = ~^== Т kV0ii> MOTi>0u) = +*i2)(mi>0ii)]; 1 Т0!? 1_4Ф2(-£к I V0n > л 033 = -^yfce(wl»0ll)033 “^f023 “ 2 -у033 +“4“Ао(/и1,011)<3!- 5.63. ТОЧНОСТЬ НЕЛИНЕЙНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ Оценка точности нелинейных систем проводится по формулам (5.2.9), (5.2.14), (5.2.15) при определении вероятностных мо- ментов т(/), 0(1) по формулам (5.6.9) - (5.6.17). В установившемся режиме, если такой в системе существует, следует считать m = 0, 0 = 0. Из полученных уравнений определяют- ся ш и 0. Ояределемие вектора математического оццанвя коррелжцкмпой матрицы фаэошх коортпат в успыкммвшемся режиме. Для опре- деления вектора математического ожидания Ш и корреляционной матрицы 0 фазовых коор- динат устойчивой нелинейной системы в уста- новившемся режиме достаточно приравнять нулю производные m = 0 и 0=0 в соответ- ствующих уравнениях (5.6.9) - (5.6.18) и ре- шить полученные конечные уравнения. На- пример, из уравнений (5.6.14) в установив- шемся режиме следуют: ао(ш> 0, и) + Впц = 0; (5.6.19) Ко(т, 0, и)0+0К; (т, 0, u) + BGBT=o. _ «L- 20И ’ *i<2)(«i.0ii) = 21 72я0и ехр floOwb0ll) = MWl’0llH + +уМть011)Мть011)С!» ^MW1>011)011 =2Т022; 2Д^1(т1,0ц)022 = ^2^o(wl»0ll)^ “ 022- Решение этих уравнений возможно толь- ко численно. В частности, при = 0 и d(*i) = b = — const из этих уравнений получаем: къ = 0; т\ = 0; Из последнего уравнения имеем М2(0п) + ^М011)-а2*с = °- К? Выбираем положительное решение квад- ратного уравнения
408 Глава 5.6. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ Подставляя в левую часть выражение для kl(Q ц) при т\ = 0, получаем Математическое ожидание выходной пере- менной одномерной нелинейной системы в уста- новившемся режиме при обычной линеаризации. Для стационарной одномерной устойчивой системы, заданной дифференциальным урав- нением с одной однозначной нечетной сим- метричной нелинейностью, эффективен метод передаточных функций, который применяется после линеаризации нелинейности. Пусть уравнение имеет вид + ... 4- аоф(х) = Zfv(I), (5.6.20) где Д/ = const, i = 1,л, b = const, v(l) - ста- ционарный случайный процесс, имеющий A/[v(/)] = и спектральную плотность $,(<»). Применяя линеаризацию нелинейности, запишем <р(х) = кц(т)т + fci(m)x°, (5.6.21) , / ч 1 . ч ч дф(/и) где *o(m) = — <p(w); ^(w) = m от После линеаризации уравнение (5.6.20) принимает вид а^пУ + ... + аокц(т)т + + aoki(m)xP = Ь(ту + v°). (5.6.22) Передаточная функция для (5.6.22) по математическому ожиданию Фо(р,/и) =------------------------. апрп+...+а1р + айкй(т) (5.6.23) Математическое ожидание т vxojjjh пе- ременной в установившемся режиме и опреде- ляется формулой = Z 77 < (°’т) ’ (5б-24) г=0 где ,/и) - r-я производная функции (5.6.23) по р при р = 0. Используя формулы (5.6.24), (5.6.23) и (5.6.22), определяют т чис- ленно или трафически. Если на систему действует несколько / стационарных возмущений /уу = , то /=1 формула (5.6.24) принимает вид w = ZS77<I>c»)(0’w)wv')’ (5б25) /=1г=0Г’ где Фо/(Р,т) =-----Z~-----------------• апрп+...+а1р + аоко(т) (5.6.26) Окончательные вычисления проводят с использованием формул (5.6.25) и (5.6.26). Систематическая динамическая опшбка системы в установившемся режиме. Если задана передаточная функция Фт(р) теоретической модели одномерной системы, то, воспользо- вавшись формулами (5.4.20) и (5.6.24), систе- матическая динамическая ошибка определяет- ся по формуле т‘= (5.6.27) Дисперсия выходной переменной нелиней- ной одномерной системы при обычной линеари- зации. После обычной линеаризации нелиней- ности в уравнении (5.6.22) передаточная функция системы по случайной составляющей определяется формулой Ф1(р,/и) =------------------------. апР +...+а1р + а0А:1(т) (5.6.28) Дисперсия в установившемся режиме 0 = ||ф|(ю,т)|%у(ф)4Ь. (5.6.29) -00 Так как т определено из (5.6.24), то Ф1(йо, т) - известная функция. Интеграл вычисляется путем сведения к табличному (5.4.29). Математическое ожидание и дисперсия выходной переменной одномерной нелинейной системы при статистической линеаризации. Для стационарной одномерной нелинейной систе- мы, заданной уравнением (5.6.20), при произ- вольной, но нечетной симметричной нелиней- ности <р(х) после применения статистической линеаризации
ТОЧНОСТЬ НЕЛИНЕЙНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ 409 <р(х) = Ло(/и, 0)m + 0)х° (5.6.30) имеет место линеаризованное уравнение + ... Q)m + + ao^i(m, 0)x° = b(my + v°), (5.6.31) где кц(т, 0), ki(m, 0) - коэффициенты стати- стической линеаризации. Передаточная функция для (5.6.31) по математическому ожиданию т фо(а^,о) = ___________b____________ anpn+...+aip + eoA:o(m,0) (5.6.32) и по случайной составляющей Ф1 (р, т, 0) =--------------------------. алрл4-...4-а1р + аоА:1(т,0) (5.6.33) Рас. 5.6.2. Графическое ранение уравнений (5.6.34) и (5.6.35) Математическое ожидание т выходной переменной в установившемся режиме опре- деляют по формуле "* = S Tt фоГ) (°’ е) ’ (5-634) г=0 а дисперсию - по формуле 00 0 = ||ф1(до,т,0)|^у(ш)Л). (5.6.35) -00 Интеграл в (5.6.35) вычисляют путем све- дения к табличному (5.4.29). Численными расчетами методом последовательных прибли- жений или графически из этих выражений определяют т и 0. Изложенная процедура применима в том случае, когда в системе отсутствуют автоколе- бания, т.е. система устойчива. Для решения уравнений (5.6.34) и (5.6.35) графическим способом заменяют уравнение (5.6.34) равноценной системой (рис. 5.6.2): П = т, т] = £^Ф<ог)(о,т,0)т<г). г=0,<’ (5.6.36) Первому из этих уравнений соответствует биссектриса координатного угла в декартовых прямоугольных координатах (т, т]). Второму уравнению (5.6.36) соответствует семейство кривых в координатах (т, т]) с параметром 0. Построив кривые, соответствующие второму уравнению (5.6.36), для ряда значений пара- метра 0 и определив точки пересечения их с биссектрисой координатного угла (рис. 5.6.2, а), находят значения абсцисс т кривой (5.6.34), соответствующие выбранным значениям орди- нат 0. По найденным точкам строят кривую (5.6.34) в координатах (т, 0) (кривая 1 на рис. 5.6.2, б). После этого строят в тех же ко- ординатах (т, 0) кривую 2, соответствующую уравнению 00 Q = ||ф1(«в,т,0)|%у(ш)Л), (5.6.37) -00 откладывая £ по оси 0 и вычисляя правую часть (5.6.37) для точек кривой 7. Кривая 2, соответствующая (5.6.37), пересечет кривую ’7 в точке, удовлетворяющей уравнениям (5.6.34) и (5.6.35). Поэтому эта точка, является реше- нием уравнений. Точность нелинейной следяцей системы в установившемся режиме. Если в нелинейной следящей системе имеется одна однозначная симметричная нечетная нелинейность, вклю- ченная, как показано на рис. 5.6.3, то оценка точности в установившемся режиме осуществ- ляется с использованием формул (5.6.34) и (5.6.35): "»е = Ё7?Фл(°>л’е>ве)',4'’); '’°0 (5.6.38) 00 ве = f |Фе1(‘м.'пе>0е)|\(<в)Л>> -00
410 Глава 5.6. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ Рве. 5.6.3. Нелинейная следящая система ще Фео(А«е,0«) + ’ .X Фе1(р,Ме,ЪЛ = -----“---7----S к$, к\ - коэффициенты статистической линеа- ризации нелинейности <р. Если в нелинейной следящей системе нелинейность включена, как показано на рис. 5.6.4, то предварительно после статисти- ческой линеаризации определяют математиче- ское ожидание т и дисперсию 0 переменной х на входе в нелинейность и ее статистические коэффициенты усиления к$(т, 0) и к\(т, 0). Затем по структурной схеме линеаризованной системы определяют передаточные функции по математическому ожиданию те и флуктуа- ционной составляющей £ ошибки ф«°(') = рх +fy(p)ko ’ Фа^= px^(p)ki Далее с помощью формул (5.4.23) и (5.4.28) вычисляют те и 0 g. Одномерные многомерные системы со многими нелинейностями. Совершенно анало- гично метод статистической линеаризации применяют к одномерным и многомерным стационарным системам с несколькими нели- нейностями. Заменив нелинейности линейны- ми усилителями с соответствующими стати- стическими коэффициентами усиления и вы- разив при помощи формул (5.6.34), (5.6.35) математические ожидания и дисперсии вход- ных переменных всех нелинейностей, получим соответствующее число уравнений для опреде- ления неизвестных ‘ математических ожиданий и дисперсий. Однако при числе нелинейно- стей больше двух процедура решения сильно усложняется. Целесообразно в этих задачах воспользоваться методом моментов, излажен- ным в п. 5.6.3. Корреляцюнный анализ автоколебатель- ной системы в переходном режиме. Метод мо- ментов эффективно применяют также для анализа автоколебательных систем при дейст- вии на них случайных возмущений в виде случайных функций времени (шумов). Автоко- лебания, возникающие в нелинейной стацио- нарной системе, изменяют свои параметры при наличии шума и превращаются в широ- кий спектр хаотических колебаний [10, 21]. Пример 1. Пусть нелинейная система (рис. 5.6.5) описывается уравнениями xi = х2; х2 =х3; 2 1 к t \ к *3 = - у *3 - ^2 *2 - ^2 ф1) + ^2 V, где (p(xj) = Zsignxi; v(l) = т? + v°(/); = = const; v°(/) - белый гауссовский шум интен- сивности G. В рассматриваемой системе при отсутст- вии помехи v(l) = 0 возникают автоколебания ~ 1 ~ НТ с частотой ©о = •—• и амплитудой а = —у=-. Т После статистической линеаризации не- линейности <p(xj) = Aomj +А^хр имеем уравнения для первых двух моментов: пц = т2; ш2 = 1 1 kkQ к ^ =-Г w3-уу w2+Т2-^^ 0ц =2012; 912 = 022 +013; 013 = ©23 - С^Оц “ 12 “ С3013 J Рве. 5.6.4. Нелинейная следящая система Рве. 5.6.5. Автоколебательная система
ТОЧНОСТЬ НЕЛИНЕЙНЫХ АВТОМАТИЧЕСКИХ СИСТЕМ 411 023 = 033 - 12 - ^2 9 22 ” с3923> 022 = 2023; 033 = -20^033 - 2с2023 - 2С3033 + ^G, _ * . „ _ 1 . „ _ 2. 2 ’ ^2 —2 ’ с3 > JT/ jt/ J’ Эти уравнения должны интегрироваться совместно. В частности, в установившемся режиме при mv = О л л Cifci л ^=т2 = тз=о; 0i3 = __L_L0ib ®12 = 9> 923 = Ф 922 =~^91Ь 933 = 0П; сз сз мт G + -T= Среднее квадратическое отклонение ^0]7 переменной Х\ имеет две составляю- щие. Первая связана с внешним возмущаю- щим сигналом, вторая - с автоколебательным процессом. При G = 0 система находится на транице устойчивости и в ней возникают автоко- лебания, интенсивность их оценивается средним al к212Т2 Wpsrm амплитуды 0i i = —=-----------. 2 2я Корреляцияньй1 анализ стационарной ав- токшкбягелыюй сястемы в устамонпшемся режвк. Приближенный анализ установивше- гося режима в нелинейной, в том числе авто- колебательной системе, может быть произве- ден с помощью вычисления спектральных плотностей выходного стонала. Спектральные плотности выходных сигналов в нелинейных системах зависят от вероятностных моментов И, 0 и фазовых координат. Матрица спектральных плотностей стоти- спгески линеаризованной нелинейной системы S(©, ш, в) = = Ф(ло, ш, в) SV(®) Фт(-и>, ш, ®), (5.6.39) где Ф(/со, ш, в) - матрица частотных характе- ристик статистически линеаризованной нели- нейной системы; 5^(©) - матрица спеюраль- ных плотностей входного возмущения. В част- ности, при наличии в системе одного входного случайного возмущения для одной fc-й выход- ной переменной имеем скалярную величину спектральной плотности 5^(©,т,в) = |ф^(ад,т,в)|25у(©). (5.6.40) Характер 5^(©,т,в) изменяется при изменении т и 0 в нелинейной системе. Цример. Спектральная плотность выход- ной переменной системы (см. рис. 5.6.5) при sv = — G м. Шу = ту = 0 следующая: к212Т2 и V 6 ~ 4 V - 7 2 4 Zb +2Z4 +-------Z2 +~------? v + 1 /.. . Л2 xG — где v = z = ©T. 212Т В автоколебательной системе в устано- вившемся режиме при наличии шума возника- ет непрерывный спектр колебаний с резонанс- ной частотой, зависящей от уровня интенсив- ности шума. Совместная гармоническая и статистиче- ская линеаризация нелинейностей. При вероят- ностном анализе автоколебательных систем, находящихся под воздействием случайных возмущений, для определения амплитуды и частоты автоколебаний используют также ме- тод совместной гармонической и статистиче- ской линеаризации. Предполагают, что на входе однозначной нелинейности у = <р(х) в автоколебательной системе действует сигнал u(f) = mx + x°(l) + asin©oA (5.6.41) где m* - постоянная составляющая; х°(1) - слу- чайный центрированный процесс с дисперсией D& а - амплитуда; ©о - частота автоколебаний. После применения статистической и гармонической линеаризации нелинейности ф(м) линеаризованная зависимость представ- ляется в виде [8, 19]
412 Глава 5.6. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ У(0 = Фо + ajasin®o^ + ^1Х° (0, (5.6.42) где 2л Фо = — J ФоО”х + nsin ф, Dx) dy; о 2л =— |Фо(тх + а sin ф, Dx) sin ф<Лр; тш J ' о 1 2я к{ - — Г к\[тх + a sin ф,Рх)<Лр; 2 о (5.6.43) ФО - статистическая характеристика нелиней- ности; к\ - статистический коэффициент уси- ления по случайной составляющей, вычисляе- мый по формуле (5.6.5). Если нелинейность нечетная симметрич- ная, то фо = к$тх, а к$ определяется фор- мулой 1 2я к$ = — J Ло (wx + а sin Ф, Dx ) <Л|/. (5.6.44) О Аналогичные формулы имеют место для неоднозначных нелинейностей у = ф(х + V, х + v), (5.6.45) где х = тх + х9(/); v(/) = asincoo/. Неоднозначная нелинейность (5.6.45) по- сле линеаризации представляется в виде у = фо +ajasin<oo* + а соею о* + + к{ х° + ^2Х°, (5.6.46) Ф°=^Н (тх +asiny,DX9Dx)dw; где 2л Фо О 2л а[ - — j Фо(тх + аsin ф, Dx, Dx) sin ф<Лр; 1U1 * О • 1 2л =—Г ф0(тх + а8П1ф,1>х,1>х)со8фсЛ|/; ха J 2л J ki (тх +asin.y,DX9 Dx)dy; о ♦ 1 2п к2 =—[ к2(тх+asinw,Dx,Dx)dw; 2я о (5.6.47) ki, к2 - статистические коэффициенты усиле- ния по и х°. При теоретических исследованиях вход- ной гармонический сигнал удобно представить в комплексной форме и = х + a Тогда линеаризованная зависимость имеет вид У = Фо^нае/Ю°Г + ^1*х° + ^2Х°> (5.6.48) где кп = + ib[ . В [23] приведены коэффициенты совме- стной гармонической и статистической линеа- ризации для некоторых типовых нелинейно- стей. Исследование автоколебаний методом со- вместной гармонической и статистической ли- неаризации. Задача состоит в изучении условий существования автоколебаний в присутствии случайных возмущений и в определении их амплитуды и частоты. Пусть автоколебательная система описы- вается уравнением F(p)x + Я(р)ф(х,х) = P(p)z, (5.6.49) где Др), Н(р), Р(р) - полиномы относительно р; ф(х,х) - неоднозначная нелинейность; z(0 - стационарный случайный процесс с ма- тематическим ожиданием mz и спектральной плотностью s^co). При наличии автоколебаний в системе процесс представим rf форме х(/) = тх + х°(/> + ае*Ч (5.6.50) Используя совместную гармоническую и статистическую линеаризацию, представим ф(х,х) в виде (5.6.48). Подставляя (5.6.48) в (5.6.49), получим систему уравнений для опре- деления тх, х9 и ае^0*: Л»х + Я(р)фо = ; F(j>)x° + Н(р^х° + к’2рх°} = P(p)z°; Р(р)ае^ + Н(р)1с^а^^ - 0. (5.6.51) В установившемся режиме имеем:
КОРРЕЛЯЦИОННАЯ ТЕОРИЯ СТОХАСТИЧЕСКИХ ДИСКРЕТНЫХ НЕЛИНЕЙНЫХ СИСТЕМ 413 _Р(0)тг Я(0) . х~ F(p) Г(о)ф°1 *’ RepXio) + A'^(mx,a,Z>x,Z>x)fr(«o)] = 0; Im[ F(ia>) + Кд (mx, a, Dx, Dx) #(«»)] = 0; °° 2 Px= ||ф(«в,тх,а,Рх,^)| sz(<s>)du>', — 00 Di = j\Qi(Kmx,a,Dx,Di^\(v№>, (5.6.52) где Фх(и>,«х,а,Рх,Р*) = __________Р(ка)________. F(«o) + Я(йо)р4 + ^2^°] Фх(«»,тх,а,Рх,Рх) = = (й)Фх(кв,тх,а,Рх,РА). Формулы (5.6.52) служат для численного определения т# а, <»о> Д» &х методом по- следовательных приближений. Формулы (5.6.52) позволяют установить некоторые предельные соотношения, характеризующие режим пре- кращения автоколебаний под действием слу- чайных возмущений. Полагая в этих формулах о = 0, получаем уравнения, из которых опре- деляем критические значения тх и соот- ветствующие отсутствию в системе автоколеба- ний. При корреляционном анализе нелиней- ных динамических систем с помощью канони- ческих представлений случайных процессов (5.1.10) проводится линеаризация дифферен- цируемых нелинейностей разложением в ряд Тейлора и интегрирование уравнений для ма- тематических ожиданий и координатных функций. Случайные возмущения могут быть произвольными, но должны быть представле- ны совместными каноническими разложения- ми. Пусть динамическая система характери- зуется уравнениями * = М, Xk(t0) = XM, (5.6.53) где zr (г = 1, и) - случайные возмущения, произвольно заданные совместными канони- ческими представлениями со + X (5-6-54) V=1 где Zrv(O - координатные функции; К - слу- чайные независимые величины с заданными дисперсиями Д. Полагая, что случайные пе- ременные хМ также выражены канонически- ми представлениями, запишем СО Хк = тк + S (5-6.55) V=1 Для определения и координатных функций х^(0 служат уравнения [20]: = т£0, (5.6.56) х*, = X——хп + Й1 дтг **v('o) = *bO, k = l,n, v = l,2, (5.6.57) Уравнение (5.6.56) для интегрирует- ся при начальных условиях Затем после определения всех математических ожиданий ин- тегрируются последовательно уравнения (5.6.57) для всех возможных координатных функций х^(1) при начальных условиях ход Начальные условия Ход Для координат- ных функций определяются из совместных канонических представлений функций х*(1) и начальных условий х^ [24]. Глава 5.7 КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ДИСКРЕТНЫХ НЕЛИНЕЙНЫХ СИСТЕМ 5.7.1. КОРРЕЛЯЦИОННАЯ ТЕОРИЯ СТОХАСТИЧЕСКИХ ДИСКРЕТНЫХ НЕЛИНЕЙНЫХ СИСТЕМ Корреляционный анализ нелинейных дискретных систем также проводится прибли- женным методом моментов, основанным на линеаризации нелинейностей.
414 Глава 5.7. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ДИСКРЕТНЫХ НЕЛИНЕЙНЫХ СИСТЕМ Применение метода моментов при обычной линеаризации и аддитивном белом шуме. При аддитивном белом шуме дискретная стохасти- ческая система (5.1.19) имеет вид х(к + 1) = a[fc + 1, x(fc)] + + C[fc + 1, x(fc)] u(fc) + + B(fc + 1, к) £W, (5.7.1) k = 0, 1, ... . После линеаризации нелинейностей уравнения для первых двух вероятностных моментов следующие: m(fc + 1) = a[fc + 1, mW] + + C[fc + 1, mW] u(k) + + B(k + 1, k) m^(k); 0(fc + 1) = KJfc + 1, mW] e(k) + + e(fc)K£ [fc + 1, mW] + Метод моментов ди обычно* линеариза- ции и мультаиликатпиом белом шуме. При мультипликативном белом шуме, как в урав- нении (5.1.19), после обычной линеаризации получим итерационные формулы для первых двух моментов: m(fc + 1) = a[fc + 1, mW] + + C[fc + 1, mW] u(k) + + B[fc + 1, mW] mg(£) + + Jfl(Kb [k +1, mW] x°W) e(fc + 1) = KJfc + 1, mW] ew + + 0WKTe [fc + i, mW] + + B[fc + 1, mW] G(k) вч* + 1, mW]; к = o, 1,...; m(o) = mo; 0(o) = во, (5.74) + B(fc + 1, k) G(k) &(k + 1, fc); o, 1,...; m(o) = mo; e(o) = во, производных; + l,mWl = ’ a*W производных. Вычисления по формулам (5.7.2) прово- дятся последовательно или параллельно. В скалярном виде формулы (5.7.2) сле- дующие: mh(k +1) = ah\k + 1»ш(£)] + +*,(*>]»« + /=1 /=1 +....dm'j(k).... в*Г + ^^(*: + 1Л)^(Л + 1(Л)вл(Л), /4=1 Л,г = 1^ (5-7.3) Число таких формул для равно л, а для Q/u- равно л(л + 1) / 2. вектор матриц, каждая из которых составлена из производных матрицы В[£ + 1, mW] по одной из компонент m/W> / = 1>л следую- щего вида: ITjJfc + bmW]» 'дВи[Л4-1,т(Л)] dBuJfc + bmW] dmt(k) dmt(k) " ♦!,«(*)] ♦!»(*)] dmt(k) dmt(k) (5.7.5) В скалярной форме уравнения (5.7.4) следует записать так: »»л(* + 1) = в*[* + 1>,и(*)] + +S lfc+*> (*>+ /=1 + С\[*: + 1,Ш(Л)] «;(*:)} + £ у, +1, ш(^)] х + i,m(A)](7w(fc);
КОРРЕЛЯЦИОННАЯ ТЕОРИЯ СТОХАСТИЧЕСКИХ ДИСКРЕТНЫХ НЕЛИНЕЙНЫХ СИСТЕМ 415 е*(к+1) - 2^м*)+ а^[*+1,1п(*)] 1 dntj(k) J + + 1,ш(*)]х л^=1 *6%(А); (5.7.6) Шл(0) = Шло; 0лХ°) = влло; А,г = 1, л; А = 0, 1,.... Метод моментов • при статистической ли- неаризации и дддитавном белом шуме. При ад- дитивном белом шуме в дискретной нелиней- ной системе (5.7.1) после статистической ли- неаризации уравнения для вероятностных мо- ментов в гауссовском приближении следую- щие [5.7]: m(A + 1) = «о[А + 1, т(А), 6(A)] + + Со[А + 1, т(А), 6(A)] и(А) + + В(А + 1, А) пц(А); 0(А + 1) = KJA + 1, т(А), 6(A)] 6(A) + + 6(A) KJ [А + 1, т(А), 6(A)] + + В(А + 1, A) G(A) ВГ(А + 1, А); (5.7.7) А = о, 1,...; т(о) = то; 6(0) = 60, ще ао|А + 1, т(А), 6(A)]*, Cq[A + 1, т(А), 0(A)] - статистические векторная и матричная характеристики нелинейностей а[А + 1, х(А)] и С[А + 1, х(А)]; KJA + 1, ш(А), 6(A)] - матрица статистических коэффициентов уси- ления для нелинейности а[А + 1, х(А)]. Вычисления по формулам (5.7.7) прово- дятся параллельно. В скалярном виде итераци- онные формулы (5.7.7) имеют вод: +1) = аА0[* + l,mW,6(*)] + + ЁС*4* + 1,т(*),0(*)]иу(*) + /=1 +5^ (* + !,*)»%(*); 7=1 еь.(*+1) = = Ё М+W + /=1 + Кщ[к + l,m(*),0(*)]ew(*)} + ;,«=i (5.7.8) шл(о) = m/ю; ОлДо)= вдю; А,г = 1, л; А =0, 1,... . Метод моментов при статистической ли- неаризации и мультипликативном белом шуме. При мультипликативном белом шуме, как в уравнении (5.1.19), после статистической ли- неаризации получаем итерационные формулы для первых двух моментов в гауссовском при- ближении: m(A + 1) = ао|А + 1, m(A), 6(A)] + + ОДА + 1, m(A), 6(A)] и(А) + + МЦКЪ [А + 1, m(A), 6(A)] х°(А)) ф(к)} + + Во[А + 1, m(A), 6(A)] пц(А); 6(А + 1) = KJA + 1, ш(А), 6(A)] 6(A) + + 6(A) Кв[А + 1, ш(А), 6(A)] + + Во[А + 1, ш(А), 6(A)] G(A) Во|А + 1, ш(А), 6(A)]; (5.7.9) А = 0, 1, ... ; Ш(0) = Шо; 6(0) = 6о, где ао[А + 1, ш(А), 6(A)], ОДА + 1, ш(А), 6(A)], Во[А + 1, m(A), 6(A)] - статистические характеристики нелинейных векторных функ- ций а[А + 1, х(А)], С[А + 1, х(А)], В[А + 1, х(А)]; Ка[А + 1, ш(А), 6(A)] - матрица стати- стических коэффициентов усиления нелиней- ности а[А + 1, х(А)] по случайным компо- нентам; 1ОДА + 1, m(A), 6(A)] - вектор мат- риц, каждая из которых составлена из произ- водных матрицы Во[А + 1, Ш(А), 6(A)] по одной из компонент Л1^А) следующего вида:
416 Глава 5.7. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ДИСКРЕТНЫХ НЕЛИНЕЙНЫХ СИСТЕМ ~aJno[H-l,m(fc),0(*)] dmt(k) dmt(k) Хл[* + 1,т(*), ©(*)] = дд,1о[*+1,'т(*),е(*)| мяя0[*+1,111(*),е(*)] dmt(k) dmt(k) В скалярной форме уравнения (5.7.9) за- писываются так: mh(k +1) = aw[* +1, m(£),6(£)] + + X +1, m(fc),0(fc)] (к) + + сл/о[* +1, e(fc)]«j (*)} + 1 A 3JMpt + l, >(*),»(*)] х_ х m(fc)> ®(fc)] GMW, h = l,n; 0*,^ + !) = = X {*«*/[* + + 7=1 + K^k +1, а(Ц0(^ (*)} + n + + !,“(*),6(fc)] X 7^=1 xB^[k + l9m(k)9e(k)]GJg(k); (5.7.10) пц(о) = шло; вл/o) = Оля), А,г = 1, л, к = 0, 1, .... 5.7.2. СТАЦИОНАРНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ Определение вектора математического ожидания и корреляционной матрицы фазовых координат в установившемся режиме. Для опре- деления вектора математического ожидания т и корреляционной матрицы в фазовых коор- динат устойчивой дискретной системы в уста- новившемся режиме следует приравнять ш(А + + 1) = ш(А) и 6(А + 1) = 6(A) в соответст- вующих уравнениях (5.7.3) - (5.7.10) и решить полученные конечные уравнения с учетом формул для статистических характеристик Яд, Q), Во и соответствующих статистических ко- эффициентов усиления в матрицах. Решение этих уравнений возможно толь- ко численным методом последовательных приближений или при одной нелинейности графически (как для непрерывных нелинейных стационарных систем). Математическое ожидание и дисперсии выходной переменной нелинейной дискретной одномерной системы в установившемся режиме. Обычная линеаризация. Пусть нелинейная сис- тема описывается рекуррентным уравнением с„х(к + л) + ... + с\х(к + 1) + + <fyp[x(A)] = dv(k)9 (5.7.11) где С/= const; i = 1, л; d-const; v(A) = /иу(А) + + v°(A); v°(A) - стационарная случайная по- следовательность со спектральной плотностью 5у(ш); ф[х(А)] - дифференцируемая одно- значная нелинейность. Применяя линеаризацию <р( ) относи- тельно математического ожидания тл(А) = = Лфс(£)1> имеем ф[/л(А)] = Ао[/л(А)]/л(А) + + (5.7.12) где к Immi - . х°(А) = х(к) - т(к). После линеаризации уравнение (5.7.11) принимает вид с,рс(к + л) + ... + С\х(к + 1) + + со{Ао[/л(А)] + кх[т(к)^(к)\ = = dmy(k) + сМ>(к). (5.7.13) Дискретные Z-передаточные функции по математическому ожиданию т(к) и случайной составляющей х°(А) следующие:
СТАЦИОНАРНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ 417 _____________d______________ c„z"+...+qz + cofco[m(fc)] ’ Z = Ф J[z, /и(*)] = ______________d_____________ Cnzn +.. .+C1Z + cQk{ [m(fc)] Математическое ожидание выходной пе- ременной в установившемся режиме mW = £-7-77фо[еГп/,> '”(*)] "4г) W- 1 Vo (5.7.14) Это уравнение, из которого методом по- следовательных приближений определяют т(к). Дисперсию выходной переменной в ус- тановившемся режиме вычисляют по формуле 0(£) = J |®i[etoTn,m(fc)| Sv(co)do. (5.7.15) . „ ЛоТ- 1 + W После замены е п = Z, Z =----------, w = 1- w а = ik (5.7.15) имеет вид еда= J ; -^тр,'(Л)Л, |_ 1 - a J 1 + V (5.7.16) <//Л\ 1 / 1 I 1 + ^1 'Г шер (Л) = — Ц— In—J; Г„-ин- тервал дискретности. Подынтегральное выражение приводится к виду 2 4^’4 T^pdw- g„[iA,,m(*)] Лв[й,т(*)]Лп[-й,т(£)]’ &,1й, mW) = Ш)2" -2 + ... + Ьп. и йя|й, mW) = ao(W" + ••• + «п- Интыралы (5.7.16) приводят к таблич- ным (см. пп. 5.5.4, 5.5.8) и вычисляют при известном т(к), определенном из (5.7.14). Математическое ожидание и дисперсия выходной переменной нелинейной дискретной системы в установившемся режиме. Статистиче- ская линеаризация. Если нелинейность недиф- ференцируема, то в уравнении (5.7.11) следует применить статистическую линеаризацию <р[х(*)] = ко[т(к), 0(*)] т(к) + + fciHfc), 0(fc)] ifl(k), (5.7.17) ще Ло[тл(£), 0(fc)], &i[m(£), 0(£)] - коэффи- циенты статистической линеаризации. После линеаризации уравнение системы принимает вид (5.7.18). Дискретные z-передаточные функции по математическому ожиданию т(к) и случайной составляющей jfi(k) такие: ®J[z,m(*),ew] = =--------------, Z = ; Cnzn +.. .+C1Z + с^[т(к), 0(fc)] Ф!>,т(*),0(*)] = =______________d______________ Cnzn +.. .+C1Z + СО*1 [т(^)Э (*)] (5.7.18) Математическое ожидание и дисперсия выходной переменной в установившемся ре- жиме: т(к) = = ХА‘77ф«[еРГп,'”(*:),0(Л)1 туг)(к> ^ordP 1 1 (5.7.19) в(й) = m(fc),0(fc) 1 + X Интетрал в формуле (5.7.19) приводят к табличному и вычисляют. В результате форму- лы (5.7.19) превращаются в уравнения, связы- вающие величины т(к) и 6(к). Их определе- ние производится численным решением мето- дом последовательных приближений или ipa- фически. 14 Зак 1023
418 Глава 5.8. АНАЛИЗ ВЕРОЯТНОСТНЫХ МОМЕНТОВ ВЫСШИХ ПОРЯДКОВ Глава 5.8 АНАЛИЗ ВЕРОЯТНОСТНЫХ МОМЕНТОВ ВЫСШИХ ПОРЯДКОВ Подставив (5.8.3) в (5.8.2), получим сле- дующую систему уравнений для начальных моментов: 5.8.1. ОДНОМЕРНОЕ РАСПРЕДЕЛЕНИЕ ВЕКТОРНОГО ПРОЦЕССА Более полный и точный анализ нелиней- ных САУ можно осуществить, исследуя веро- ятностные моменты высших порядков, для которых получены обыкновенные дифферен- циальные уравнения. Ограничившись некото- рым моментом порядка N имеем замкнутую систему N уравнений. Начальные моменты выражаются через характеристическую функцию формулами [10, 20, 23] N N _____ = ФОг + Г = 0, N9 к=31=к (5.8.4) где ФОг w(x,z)dbc; vr = vAr..,r. И + ... + гл = г, г = 1, 2, 3, ..., N. (5.8.1) Дифференцируя формулу (5.8.1) по t с учетом (5.1.21), получим уравнения: J L/ И&Т|М- -оо -±KTD(V)K X > (5.8.2) х=о Система уравнений (5.8.2) бесконечна. Чтобы получить конечную систему уравнений, следует аппроксимировать плотность вероят- ности Дх, /) конечным радом ортогонального разложения, включающим моменты до поряд- ка N =(-'•)'J -00 pr(x)w(x,t)dx. дг Уравнения (5.8.4) линейны относительно моментов vr выше второго порядка (г = 3, Nj и нелинейны относительно моментов первого и второго порядков. Разложение (5.8.3) может быф по поли- номам Эрмита. В этом случае коэффициенты Ci называют квазимоментами. Можно также пользоваться отрезком ряда Эджуорта [20]. Центральные моменты выражаются через характеристическую функцию g(k9 /) форму- лами [10, 20, 23] f(x9t) = w(x9t) 14- АГ N ^CtPl(X) к=31=к (5.8.3) где Цх, /) - функция, для которой существуют все моменты и первые два момента совпадают с моментами функции Дх, /); pfoc) - ортого- нальные полиномы с весом w(x, /); С/ - коэф- фициенты разложения, выражающиеся через линейную комбинацию моментов V/ (/ = 1, JVJ случайной величины х [20, 23], а также через ц = qfa). m = MxWb Дифференцируя формулу (5.8.5) по t с учетом (5.2.21), получим уравнения для мате- матического ожидания и центральных момен- тов: i"h = f “*(*, t) Дх, t)dx, h = й~п; -00 (5.8.6)
АНАЛИЗ СЕМИИНВАРИАНТОВ ФАЗОВЫХ КООРДИНАТ САУ 419 Йг =(-»К J д Приняв в качестве аппроксимирующей Дх, I) функцию (5.8.3), приведем уравнения (5.8.6) и (5.8.7) к виду 5.8.2. АНАЛИЗ СЕМИИНВАРИАНТОВ ФАЗОВЫХ КООРДИНАТ САУ Иногда за параметры распределений принимают семиинварианты (кумулянты) вме- сто моментов. Объясняется это тем, что в про- тивоположность моментам семиинварианты не растут с увеличением порядка. Это дает воз- можность аппроксимировать распределения, пренебрегая семиинвариантами выше задан- ного порядка. Одномерное распределение векторного процесса. Семиинварианты. Семиинварианты выражаются через характеристическую функ- цию следующими формулами [23]: N N ____ «л = Фол + £ £фл9/(у)> л = i> к=31=к (5.8.8) п Йг = ФОг “ + Л=1 ®г=(-1)Г д' lng(M> К=о (5.8.10) г = и + ... + гп, г-1, 2. N N Г п + ХХ -^Wlh^r-lh л=1/=л|_ А=1 г = 2JV; Дифференцируя формулу (5.8.10) по t с учетом (5.1.23), получим уравнения для семи- инвариантов ®г = (5.8.9) дг дХ\...д^ еЛ’х-«,(М^тф ОО Фол = -00 (5.8.11) 00 Фл - f“лМлООЧМ*; -00 - у XTD(x, /)х! еа (*") I w(x, 2 J Jx=o У ас?...ах* pXT<x(x,f) - Ф/г =(-'/J -1} Pz(x) w(x, t)d]L Аналогично rm. 5.8.1, 5.8.2 получаются приближенные уравнения для моментов мно- гомерных распределений. Аппроксимирующая функция плотности вероятности также зависит только от моментов до N-ro порядка. где ш(Х, /) = In g(k, I); г = 1, 2, ... . Система уравнений (5.9.2) также беско- нечна. Чтобы получить конечную систему уравнений для семиинвариантов, следует ап- проксимировать Дх, 0 отрезком ортогональ- ного ряда типа (5.8.3), например Эджуорта, по полиномам Эрмита до N-ro семиинварианта включительно. Подставив (5.8.3) в (5.8.11), получим следующую замкнутую систему для семиинвариантов до N-ro порядка включительно: N N ____ *г = ФОг + ££фО/4е(®), Г = N> к=3!=к (5.8.12) где ФОг = = (-/)' Г----------[ей’х-в(х’')(йта(х,г) - -±VD(x,/)x) w(x,/)dk; х=0 14*
420 Глава 5.8. АНАЛИЗ ВЕРОЯТНОСТНЫХ МОМЕНТОВ ВЫСШИХ ПОРЯДКОВ Ф/г = -ОО 5 ATx-co(X,z)/_ т ( ------------ е v pr(x)v(x,/)dx. х=о Семиинварианты первого порядка пред- ставляют собой математические ожидания фазовых координат системы, семиинварианты второго и третьего порядков совпадают с соот- ветствующими центральными моментами, а семиинварианты высших порядков связаны с центральными моментами взаимно однознач- ными зависимостями [22]. Одномерное распределение векторного процесса. Семиинварианты. Рассмотренная в п. 5.9.1 методика определения семиинвариан- тов может быть упрощена, если воспользовать- ся аппроксимацией функции плотности веро- ятности Дх, I) в виде [10] + А<г’я8 Г = 1, л, (5.8.14) где полиномы Чебышева-Эрмита /4(z) опре- деляются формулами . dk ЯНг) = (-1)*е’* к = з,4,..., dz а коэффициенты [к = 3,4,...) выража- ются через семиинварианты : ДМ* ПЛ*'’0 х Г=1 (5.8.13) ще 9й(/) = - mfr)]2}, = = ММО - mtf] \xj(f> - Одномерные функции плотности вероят- ности Д(хл /) для каждой фазовой координаты хг, г = 1, п, выражаются отрезком одномер- ного ряда Эджуорта по семиинвариантам В^ = Для определения семиинвариантов , к = 1, N, г = 1, л, служат формулы к = 1, N, -(') - хк ~ вида fr(xr,t) = 1 2 X (5.8.15) +В<г’я4 Подставив в (5.8.15) формулу (5.8.13) с учетом (5.8.14) до N = 8, получим замкнутую систему уравнений 8 к = 1, 8, г = 1, л, где
МЕТОД СТАТИСТИЧЕСКИХ ИСПЫТАНИЙ 421 m(r) - 00 ь «чу -оо X [xj <Ч(,) = gy(0 4п °г, (5.8.18) х=о и i-2 л + ууА_х dx, где Dy (0 = ву (0 - фактическая дисперсия. В качестве характеристик точности оце- нок рассматривают их относительные средние значения: ст*;(0 1 gz>;(0 (0 Dy (/) (5.8.19) Для более полной оценки точности по- лучаемых результатов можно вычислить дове- рительные вероятности для заданных границ оценок при законе распределения ошибок, близких к гауссовскому [22]: * (*»• - *1’)(*./ «1 = Bepf|mJ (!) - < ej 2Ф 5.8.3. МЕТОД СТАТИСТИЧЕСКИХ ИСПЫТАНИЙ Метод статистических испытаний оценки . точности автоматических систем при воздейст- вии случайных возмущений применяется при исследовании реальных образцов или матема- тических моделей. При исследовании моделей систем их работа моделируется в условиях, близких к реальным. На все входы модели или реальной системы подаются одновременно реализации случайных возмущений. Проделав п опытов в одинаковых условиях и получив п реализаций выходной переменной (или вы- ходных переменных для многомерной систе- мы), можно вычислить оценки ту и Dy математического ожидания ту и дисперсии Dy выходной переменной y(fi9 пользуясь форму- лами математической статистики [22]: ^(0 = ^у,(0, Г=1 (5.8.17) Dy Е [•’'<•" "у Точность получаемых результатов можно оценить средними квадратическими отклоне- ниями оценок ту (Z), Dy (t) [22]: а2 = Bepj|D*(Z) - Dy(O| < е2 2Ф (5.8.20) где Ф(х) - функция Крампа. Подставив в (5.8.20) выражение (5.8.19), получим оц = 2ф[у14пj; <х2 = 2Ф (5.8.21) ще V1 = ^(0; V2 = P^)' В табл. 5.8.1 и 5.8.2 приведены зависи- мости требуемого числа испытаний л от за- данных доверительных вероятностей cq, а2 и точности vi, v2. 5.8.1. Требуемое число испытаний п дм определения математического ожидания «1 vi 0,2 0,15 0,10 0,05 0,01 0,6 18 31 70 281 7000 0,7 27 47 108 431 10 800 0,8 41 73 164 651 16 400 0,9 68 121 272 1090 27 200
422 Глава 5.9. МЕТОД ЭКВИВАЛЕНТНЫХ ВОЗМУЩЕНИЙ 5.8.2. Требуемое число испытаний п для определения дисперсии «2 v2 0,2 0,15 0,10 0,05 0,01 0,6 37 63 141 563 14 000 0,7 55 95 217 863 21 000 0,8 83 147 239 1300 32 800 0,9 137 243 545 2180 54 400 Глава 5.9 МЕТОД ЭКВИВАЛЕНТНЫХ ВОЗМУЩЕНИЙ 5.9.1. ОСНОВЫ МЕТОДА ЭКВИВАЛЕНТНЫХ ВОЗМУЩЕНИЙ Метод эквивалентных возмущений состоит в том, что математическое ожидание, диспер- сия и другие вероятностные характеристики решений системы дифференциальных уравне- ний определяются путем соответствующего суммирования результатов интегрирования исходных уравнений при определенным обра- зом выбранных неслучайных начальных усло- виях и неслучайных эквивалентных возмуще- ниях вместо случайных. Для его применения необходимо, чтобы все случайные возмуще- ния, действующие в системе, были представ- лены совокупностью случайных величин, на- пример, отрезком канонического разложения [7, 10] до k-т члена. Таким образом, уравнения динамической системы должны быть представлены в виде У/ (5.9.1) ще /К ) - произвольные нелинейные функ- ции; Vi, ..., Ук - случайные величины. Реше- ния этой системы зависят от случайных вели- чин Vi, ..., vm, которые включают случайные возмущения vb ..., v* и случайные начальные условия Ук + Ь •••> vm- Эти решения предста- вим так: У = vtt V1..v„), (5.9.2) ще индекс i у координаты и функции \|/ опу- шен для упрощения записи. Выражение для уР запишем так: уР = п(6 V!..vm). (5.9.3) В формулах (5.9.2) и (5.9.3) случайные величины V/, i = 1, т имеют равные нулю математические ожидания AflvJ = 0. Матема- тические ожидания исходных случайных воз- мущений и начальных условий учтены видом функций у и Т). Основная идея метода эквивалентных возмущений состоит в том, чтобы определять математическое ожидание любой выходной переменной у по формуле N my(f) = ^sys^ (5-9.4) 1=1 любой начальный момент р-го порядка - по формуле N = (5-9.5) 1=1 и дисперсию - по формуле N Dy(t) <5-9б> 1=1 В этих формулах - весовые коэффици- енты; хХО ~ реализации случайного процесса ХО при определенно выбранных значениях Sir, •••» ^тз случайных величин vb ..., vm, входящих в (5.9.2); N - число ^реализаций. Для определения коэффициентов и эквивалентных возмущений необходимо решить систему уравнений [7] N N Р j = = ’ 1=1 1=1 к = Г?; n, — ,rk е 1, т, (q * г2 #...# г*), (5.9.7) ще q - степень полинома, аппроксимирую- щего (5.9.2) или (5.9.3) по величинам V/. Величины Ц4...4 заданы и гъ--'*гк е 1, т • Общее число различных уравнений (5.9.7) равно c^+qt а общее число неизвест- ных величин равно N(m + 1). Следовательно, выбирая N>—-—cl+at можно обеспечить т + 1 * решение системы (5.9.6).
ОПРЕДЕЛЕНИЕ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ И ДИСПЕРСИИ 423 Решение этой системы упрощается, если случайные величины некоррелированы. При решении этих уравнений в конкретных случа- ях при различных значениях q целесообразно задавать комбинации £>Г/Сз, так, чтобы часть коэффициентов обращалась в нули. 5.9.2. ОПРЕДЕЛЕНИЕ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ И ДИСПЕРСИИ Определение ту и Dy при q = 2. При ис- пользовании метода эквивалентных возмуще- ний прежде всего надо выбрать вид аппрокси- мирующей зависимости функций \|/ (5.9.2) и л (5.9.3) по входным случайным величинам V/ в ваде полинома степени q. Первые три аппроксимации q = 1, 2, 3. При q = 1, что соответствует линейной зави- симости, математическое ожидание my(f) оп- ределяется однократным интегрированием при vr = 0, г = 1, т. Второй и последующие на- чальные моменты определяются ар = т$. Этот случай практически мало информативен. При q = 2 удается получить простые формулы для определения математического ожидания и дисперсии. Целесообразно применить каноническое разложение случайных возмущений, привести их к системе некоррелированных величин vn г = 1, т, Vj] = ~ J’ В этом случае система уравнений (5.9.7) принимает вид: Л N y^Pj^rr = $ j=i i=i N ____. r = m> <5-9-8) 1=1 N ___ £₽j5v5v =°. = «• 1=1 Рекомендуется [7] при решении этой системы уравнений выбрать N = т + 2 вари- антов комбинаций неслучайных величин fys (г = 1, т, 5 = 1, n}, указанных в табл. 5.9.1. 5.9.1. Значения величин при q = 2 S г 1 2 т -1 т 1 0 0 0 2 0 0 0 3 0 0 0 0 т 0 0 0 £>т т+1 51 52 - 1 %>т т+1 -51 -52 ~%>т - 1 ~%>т Система уравнений (5.9.8) имеет сле- дующее решение: = o’rVw; Рг = —; Pm+i = Рт+2 = <5-9-9) 2т Математическое ожидание и дисперсия переменных у определяется по формулам: т+2 Dy = = J=1 (5.9.10) " .2 . ^2-^11 _2 \j=l 2 Рассмотрим конкретную систему попе- речной стабилизации аэродинамического лета- тельного аппарата и определим математиче- ское ожидание и дисперсию ошибки стабили- зации. Уравнения рассмотренной системы (7jp2 + р)у = ЛЦр(х) + Z1, х = Л(7> + 1)y, где 7j, Т, Л1, к - постоянные величины; <р - нелинейная функция. Случайное возмущение представлено ка- ноническим разложением Zi(0 = mz(r) + ^w/z/(0- /=1 Случайные величины W/ имеют диспер- сии erf. Случайное начальное условие при t =
424 Глава 5.9. МЕТОД ЭКВИВАЛЕНТНЫХ ВОЗМУЩЕНИЙ = т1<,> М (го-^о)2 = 0: у(0) =У(ь у(0) = 0. При этом Л/[уо1 = . Полагая W/ и Уо У0 независимыми, перенумеруем все случай- ные величины и введем новые обозначения: Vi = ну,v„ = w„, V„+1 = у°. Всего случай- ных величин т = п + 1. Примем аппроксима- цию выходной переменной у по случайным ве- личинам полиномом степени q = 3. Тоща число вариантов интегрирования исходной системы N=n +3. Эти варианты следующие: 1) г(о) ='»Го и Z1 = Zs(t)Jn + las + + mz , s = 1, п. Всего п вариантов; 2)7(0) = ^+аТо7л+Г, Zi=mZ|; Л 3) = Z1 = ±V« + 1 /=1 После интегрирования перечисленных п + 3 вариантов получим: 1 ** 1 «-’=^т1ь+^щ(гя+2+гв+з); 1 1 =7Й £у2 + 2(ГИ)^"+2 +Yn+3)- Определение Dy при q — 3. Предпо- лагая как в п. 5.9.1, случайные величины vr независимыми, к уравнениям (5.9.7) добавится еще одно: N ____ £ РЛ ^5 V5V = °. П > П > Ъ = 1. «• J=1 (5.9.11) Рекомендуется [7] при решении этой системы уравнений выбрать N = 2т вариан- тов комбинаций неслучайных величин (г = 1, т; s = 1, n}, указанных в табл. 5.9.2. Система уравнений (5.9.7), (5.9.11) имеет решения: В.. = —; = crrVw; 5 = 1, 2m; г = 1, т. ™ 2т г (5.9.12) Математические ожидания и дисперсии переменных у определяют по формулам: 5.9.2. Значения величин при q = 3 j r 1 2 m -1 m 1 51 0 0 0 2 -5i 0 0 0 3 0 52 0 0 4 0 -52 0 0 2m-1 0 0 0 %>m 2m 0 0 0 ~%>m 2т 2т J=1 J=1 (5.9.13) Дальнейшее повышение степени аппрок- симирующего полинома приводит к увеличе- нию числа необходимых интегрирований ис- ходной системы уравнений, особенно при большом числе т случайных величин vr (г = 1, т). Наиболее экономичные варианты комбинаций эквивалентных величин до степени полинома q = 5 приведены в [7]. Од- нако для определения необходимого числа интегрирований исходной системы в общем случае простых рекомендаций нет. 5.9.3. ИНТЕРПОЛЯЦИОННЫЙ МЕТОД Интерполяционная формула. Дальнейшим развитием и обобщением метода эквивалент- ных возмущений является интерполяционный метод, в котором общий расчетный алгоритм сохраняется тем же, но варианты эквивалент- ных возмущений выбирают определенным единственным способом [30]. Также предпо- лагают, что интегралы yt = 1, «j системы уравнений* могут быть аппроксимированы интерполяционными полиномами по случай- ным в общем коррелированным величинам вида У- ...v«*.)x xfi-----------------V <5-9.15) ai V?"
ИНТЕРПОЛЯЦИОННЫЙ МЕТОД 425 В формулах (5.9.15) опущен индекс / у интегралов у£). Суммирование выполняют по всем возможным комбинациям индексов = 1> Я\, • • •, кт - !» Ят, п₽и которых про- интегрированы уравнения (5.9.1) и получены интегралы ,... • Величины называют узлами интегрирования, q\, qm - некоторые постоянные числа, определяющие число членов суммы и число интегрирования исходной системы N — q\, qm. Функции <o^(vy) - интерполяционные полиномы сте- пени qj относительно случайной величины Vy: <»?>h) = (v/-v/a)"(vy-vA>); (5.9.16) ще со (v jj^. j - производная от полинома по переменной Vy, вычисленная в точке V;=W В узлах интерполирования формула (5.9.15) обеспечивает совпадение интерполя- ционного полинома и реализации случайной функции, т.е. интеграла v ,..., v j , так как в этих точках ГТ Определение вероятностных моментов. Ес- ли применить операцию математического ожидания к правой и левой частям формулы (5.9.15) при заданной функции />(vb vm) распределения вероятности случайных величин Vj, ..., vw, то получим тУ = • >Vm*.)x xpilr..,*.(vl*1.--.vm*„), (5.9.17) *1=1, Ч, -,кт =1, qm, ще Pk,r...k„ = Jp(vi,..,vm)x Величины называют числами Кристофеля, они зависят от вида полиномов (0^ выборки случайных величин vr и закона их распределения />(vb —» vm)- Таким же образом можно определить ма- тематическое ожидание любой произвольной функции решений, например, начальный мо- мент р-ю порядка аР= ..кт ..к„ (5.9.19) и другие вероятностные характеристики. При соответствующем выборе аппрокси- мирующих полиномов и узлов интерполиро- вания Vy^ р = 1, т, kj = 1, ^у) можно добиться необходимой точности расчетов. Рекомендуется выбирать ортогональные полиномы ®ty(vy) с весом p(v), равным плотности вероятности случайных величин vn а за интерполяционные узлы принимать корни этих полиномов [30]. Если случайные величины V), ..., vm не- зависимы, то расчетная формула для произ- вольной вероятностной характеристики имеет вид м *1...,*. 7=1 (5.9.20) где плотность распределения случайной величины Vy; ay, Ру - интервал распределения случайной величины Vy. Рекомендации по выбору ортогональных аппроксимирующих полиномов и выбору ин- тервалов интегрирования см. [30]. Там же рас- смотрены практические приемы реализации интерполяционного метода.
426 Глава 5.10. СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Глава 5.10 СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ С ПАРАМЕТРИЧЕСКОЙ И СТРУКТУРНОЙ НЕОПРЕДЕЛЕННОСТЯМИ 5.10.1. ОБЩЕЕ ОПРЕДЕЛЕНИЕ Системы автоматического управления практически функционируют при частично или полностью параметрической и структур- ной неопределенности. Различают стационар- ную и нестационарную параметрическую и структурную неопределенности. Стационарная неопределенность пара- метров и структуры объекта управления и ав- томатической системы в целом имеет место в начальный момент и не изменяется в процессе функционирования (система с постоянными, но неопределенными параметрами и структу- рой) [29]. Стационарная неопределенность практически встречается во всех динамических системах. Система функционирует и выполня- ет свою задачу, но ее динамика и конечный результат зависят от конкретных значений случайных параметров и структуры, которые они имеют в конкретной ситуации. Эти слу- чайные параметры и структура подчиняются статистическим закономерностям и к моменту начала функционирования могут принимать определенные значения и вид на дискретном или континуальном множествах. Нестационарная параметрическая и структурная неопределенность состоит в рез- ком скачкообразном изменении их в процессе функционирования системы. Характерной особенностью их является структурная или параметрическая неопределенность (смена структуры и параметров) в процессе функцио- нирования и стохастичность процессов в них. К таким системам применимо название дина- мические стохастические системы со случай- ной сменой структуры. 5.10.2. СИСТЕМЫ СО СТАЦИОНАРНОЙ НЕОПРЕДЕЛЕННОСТЬЮ Математической моделью таких систем являются дифференциальные или разностные уравнения со стационарной параметрической неопределенностью с заданной функцией рас- пределения [29]. Для непрерывных систем математическая модель такова: х = а(х, /, X) + В(х, /, A.)u + F(x, /, (5.10.1) ще x(Z) - мерный вектор состояния; а( ), В(), F( ) - заданные векторная и матричные функ- ции; £(/) = + £°(0 - белый гауссовский шум с матрицей интенсивностей G(Z). Вектор А. неопределенен и представляет собой вели- чину с заданной функцией распределения ДХ). Вектор X неизменен во времени. При фикси- рованном А. начальное состояние Xq не зависит от £(/) и имеет условную плотность вероятно- стиДхо / *•)• Для вероятностного исследования таких систем разработан [29] метод разделения. Он состоит в декомпозиции (разделении) решения каждой задачи на множество более простых элементарных условных задач при фиксиро- ванном векторе А.. Решение условных задач достигается известными изложенными мето- дами, а решение исходной задачи при стацио- нарной параметрической неопределенности получается как взвешенная суперпозиция эле- ментарных решений с весовой функцией, рав- ной плотности вероятности распределения параметра А.. Так, вероятностные моменты первого и второго порядков определяют соот- ветственно: оо «х('>'о)= f “«(VolM/W А; -ОО (5.10.2) 00 ех(л/0)= /ех(лф)/(МА, -00 гае тх(/,/0|1), ех(/,/о|*-) - условные веро- ятностные моменты, получаемые на основании исходных уравнений при фиксированном век- торе параметров А.. 5.10.3. СИСТЕМЫ С НЕСТАЦИОНАРНОЙ НЕОПРЕДЕЛЕННОСТЬЮ Уравнение динамических систем. Системы со случайной сменой структуры (ССС) в про- цессе функционирования также описываются моделями в виде дифференциальных или раз- ностных уравнений со скачкообразно изме- няющимися параметрами и структурой. Скач- кообразное изменение параметров системы также рассматривается как спонтанная смена структуры. Число возможных детерминирован- ных структур предполагается счетным конечным множеством, а момент их смены случайны. Такие системы на случайных неперекрывающих- ся интервалах времени имеют определенную детерминированную структуру [9].
СИСТЕМЫ С НЕСТАЦИОНАРНОЙ НЕОПРЕДЕЛЕННОСТЬЮ 427 Система со случайной сменой структуры характеризуется номером структуры 5 = 1, п и пх -мерным вектором состояния х(/)- Вектор х(1) может быть непрерывным или дискрет- ным случайным процессом, a s(f) - случайным дискретным скалярным процессом. Непре- рывную нелинейную систему со случайной структурой можно записать в виде х = a<J)(x, /) + B(J)(x, /)и + F^(x, x(/b) = xo. (5.10.3) ще a^(-), F(J)( ) - известные векторная и матричные функции для каждого номера s = 1, п. Остальные обозначения те же, что и в (5.10.1). Дискретная нелинейная система описы- вается математической моделью вида х(к + 1) = х(к) 4- a<J)(x, к) + 4- B(J)(x, fc)u(fc) 4- F(j)(x, к)^(к), (5.10.4) ще £(А) - центрированный гауссовский белый шум с корреляционной матрицей G(A). Систему со случайной сменой структуры удобно характеризовать рассмотренным сме- шанным вектором состояния [х*, s]T. Классификация ССС. Общим признаком классификации систем со случайной сменой структуры является характер связи процессов ХО и х(/)- Если протекание процесса 5(1) сме- ны структуры зависит только от времени и не зависит от фазового вектора х, то такие систе- мы носят название систем с независимой сме- ной структуры. В системах с зависимой сме- ной структуры существует два варианта связи процессов 5(1) и х(/)- В первом взаимодейст- вие проявляется статистически - моменты смены структуры случайным образом зависят от X. Это системы с распределенными перехо- дами. Во втором варианте - моменты смены структуры функционально связаны с х, т.е. смена структуры происходит, когда процесс х(1) достигает некоторых границ. Такие систе- мы называют системами с сосредоточенными переходами. Математическим моделям (15.10.3) и (15.10.4) при фиксированном s соответствуют марковские процессы х(1) и последовательности х(А). Совместное описа- ние функционирования динамической систе- мы со случайной структурой сводится к изуче- нию смешанного стохастического разрывного процесса [^(1), X0F И, 9]. Подобные задачи также рассматривались в статистической радиотехнике. Общая теория систем со случайной сменой структуры по- строена для марковских разрывных процессов [4, 9]. Обзор современного состояния теории систем со случайной сменой структуры дан в [25]. Вероятностные характеристики процессов в системах случайной структуры. Стохастиче- ский марковский разрывный векторный про- цесс [хт(/)> ХО] полностью характеризуется априорными функциями распределения плот- ности вероятности Дх, s, f) фазовых коорди- нат х(1) и номера структуры 5(1), условными функциями распределения плотности вероят- ности Дх, 5, t I х', 5, t') и вероятностями состояний (структур) Эти функции подчинены условиям: Дх, 5, I) = /А)(|)/»)(х, I); Epw(0 = i; J=1 л 00 £ j/(x,s,/)A = l; — 1—аО П 00 | /(x,5,/|x',5,/')dx = 1. J = 1 -со (5.10.5) Функция распределения плотности вероят- ностей Дх, 5, I) удовлетворяет обобщенному уравнению Фоккера-Планка-Колмогорова [4, 9] - ₽(х,*,0 + + у(х,5,/), 5=1, л, (5.10.6) при начальном Дхо, 5, to) и граничных усло- виях Д±оо, 5, I) = 0, где х(х, 5, /) - вектор плотности потока вероятности, х(х, 5, /) = a(J)(x, /) Дх, s, /) - -|jvl[D(f”’(x>/)/(x,5,r)]}T, a(J)(x, I) - вектор сноса; D(J)(x, I) - матрица диффузии системы в 5-м состоянии; 0(х, 5, /) - функция поглощения; у(х, 5, /) - функция восстановления реализаций случайного про- цесса в 5-м состоянии. Функция плотности вероятности перехо- да Дх, 5, t | х', 5, /') удовлетворяет тому же уравнению (5.10.6), но при начальном условии
428 Глава 5.10. СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ fix, S, Г | Хо, S, f) = 8(x - Xo). Условные функции плотности вероятно- сти I) удовлетворяют уравнениям [2,9] S = 1, п, (5.10.7) я (х, t) = —— я(х, s, t), ' 1 pM(t) v ’ РрГ)(О= jp(ra)(x,/)A, -ОО V(/r)(0 = -00 а функции pfa’Hx, /)> У^(х» 0 связаны c P(x, 5, /), y(x, s, f) зависимостями p(x,5,/)= ^р«(/)р(”>(х,/); r=l (r*j) Y (x, 5, t) = £ P(,) (Y)y (sr) (x, t). r=l (r*s) Функции поглощения из 5-го состояния в r-e Р^\х, t) и восстановления из г-го со- стояния в 5-е y(jr)(x, t) имеют различный вид при распределенных и сосредоточенных пере- ходах. При распределенных переходах функции имеют вид [9] 0(")(х, /) = v(")(x, Г) /^(х, г); (5.10.8) у(х, 0 = J v(jr) (*'» 0/(г) (х', 0 х * q(sr\x,t\x',f)dx', где v('y)(x, f) - интенсивность переходов (смены структур); ^г)( ) - условная вероят- ность восстановления фазовых координат. При сосредоточенных переходах р(")(х,/) = ^Я(,)(х,г)|б(х-х(га)|; (5.10.9) Y<'”’)(x,/) = = J [п“,я(r) (х, /)] q W (х, /|х', /) dx'. -ОО Вероятности состояний (структур) определяются из уравнений [2, 9] п р{з}=-р^ ^р^’ю* Г=1 (r*j) л + (5.10.10) Г=1 (r*j) 5 = 1, П. Выписанные уравнения полностью опре- деляют динамику систем со случайной сменой структуры. Анализ линейных систем с распределенны- ми переходами (отказами, перерывами информа- ции, сбоями). Практический анализ ССС со- стоит в определении вероятности состояний, в котором находится система и в опреде- лении вероятностных моментов фазовых коор- динат. Рассмотрим линейную систему со слу- чайной структурой х = А^)(г)х + B(')(/)u + FW(0^(0. (5.10.11) Уравнение для условных вероятностных моментов: вектора математического ожидания m^(t) и корреляционной матрицы 0^(1) сле- дующие в каждом 5-м состоянии [2, 9]: rh(j) =А«(1)т« + BW(l)u + F«(Y)nu - Г=1 (r*j) ^(0 V I (5.10.12) @(j) = A<J)(/) © (J) + © + + F<')(0 G(/) FC^(/) - n - z r=l (r*j) A') o'(') V(jr>(/) X
СПЕКТРАЛЬНЫЙ МЕТОД, ОСНОВАННЫЙ НА ПЕРЕДАТОЧНЫХ ФУНКЦИЯХ 429 х ©^ - |. (5.10.13) ще учтено, что р<")(х, Г) = v(")(0 /г)(х, /); у(^(х, /) = v(^)(/) /')(х, /), a v(w)(l) - интенсивности смены структур (отказов, сбоев, перерывов информации). Уравнения для вероятностей p№(f) в данном случае следующие: (0+ r=l (r*s) п r=l (r*s) PW('o) = Pq} , s = ^n. Безусловные вектор математического ожидания и корреляционную матрицу вычис- ляют по формулам: m(') = J=1 (5.10.14) 0(0 =^р(,г)Г©^(0 + j=1 L + (m(j)(0-m(0)(in(j)(0-m(0)T • При вероятностном анализе нелинейных систем со случайной сменой структуры следует применять методы линеаризации, изложенные раньше для одноструктурных систем. Глава 5.11 СПЕКТРАЛЬНЫЕ МЕТОДЫ РАСЧЕТА ЛИНЕЙНЫХ НЕСТАЦИОНАРНЫХ СИСТЕМ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ 5.11.1. СПЕКТРАЛЬНЫЙ МЕТОД, ОСНОВАННЫЙ НА ПАРАМЕТРИЧЕСКИХ НЕСТАЦИОНАРНЫХ СПЕКТРАЛЬНЫХ ПЕРЕДАТОЧНЫХ ФУНКЦИЯХ Спектральные характеристики нестацио- нарных систем и функций времени. Спектраль- ный метод расчета основан на использовании нестационарных спектральных характеристик функций 1фемени и нестационарных спек- тральных плотностей случайных функций [25]. Все характеристики спектрального аппарата определены в общем случае для конечных переменных интервалов времени относительно нестационарных ортонормированных функций (базиса). Для нестационарной линейной системы определены следующие спектральные неста- ционарные характеристики [25]. Нестационарная нормальная передаточ- ная функция по базису \|/(А, 0) Я(Л,/,х) = t j \|/*(A,r,0)g(0,x)dB, (5.11.1) где g(0, x) - импульсная переходная (весовая) функция системы. Нестационарная сопряжен- ная передаточная функция t Я(/,Г,0) = f \|/(f,r,T)g(0,T)A. Щ * * t-T(t) (5.11.2) Двумерная нестационарная передаточная функция t t = j d® $q*(h,t,tyx q,P t-T(t) X p(i, t, x)g(0, x)fifc, (5.11.3) где р(/, t, x), q(h, t, x) - системы ортогональ- ных функций (базисы). Первая нестационарная спектральная плотность случайного процесса v(l) = my(f) + + vO(/) t Sv(i,t)= j p'(i,t,x)mv(i)dt. (5.11.4) p l-T(t) Вторая нестационарная спектральная плотность или просто нестационарная спек- тральная плотность случайного процесса h Sv(h,i,ti,t2)= Jdti x №' h-TW h-T(t2) X p(h,t2,T2)Km(xl,t2)dt2, (5.11.5) ще -АГууСч, T2) - ковариационная функция процесса v°(l).
430 Глава 5.11. СПЕКТРАЛЬНЫЕ МЕТОДЫ РАСЧЕТА ЛИНЕЙНЫХ НЕСТАЦИОНАРНЫХ СИСТЕМ Слписпнескне характеристики выходного процесса нестационарной системы при нулевых начальных условиях. Пусть линейная неста- ционарная система задана уравнением. л *к + Xa/(/)*<0 = (5.11.6) /=0 Известна g(t, т) - весовая функция сис- темы. Входной процесс v(l) = + ^vv(^b (2) - ковариционная функция процесса. Расчет вероятностных характеристик вы- ходного процесса проводят по следующим формулам [25]. Первую нестационарную спек- тральную плотность определяют по любой из формул: t Sx(h,t) = j (5.11.7) q P (5.11.8) Математическое ожидание выходного процесса вычисляют по формуле 1^(0) =£Я(М,9)5,(1,0 (5.11.9) i V или по формуле обращения «xW = У Sx(i,f)p(i,t,x), I Р (5.11.10) t - T(t) Ковариционную функцию выходного процесса вычисляют по формуле с использо- ванием нестационарной передаточной функ- ции х St(h,ittbt2) (5.11.12) w‘ или в матричной форме К„(61,62) = я(/1,е1)(5.(/1,72)я1(/2,е2). (5.11.13) Другая формула для определения Лхх(®Ь 62) базируется на использовании дву- мерной нестационарной передаточной функ- ции к„(е1,е2) = ^^5х(й,1,е1,е2)х к i (5.1114) ще 5x(*,i,e1,e2) = ^^»:(*,v,e1,e2)x v Н * х FK(i,n,e1,e2)5v(v,n,ej,e2). * рр’ (5.11.15) Статистические характеристики выходного процесса нестационарной системы при ненулевых начальных условиях. Система опи- сывается тем же уравнением (5.11.1), но на- чальные условия, соответствующие левому концу t - 7\f), ненулевые: Х(0)1е=/-Г(п “ xo(0v, “° е=/-Г(о Расчетные формулы для определения ве- роятностных характеристик приведены ниже [25]. Матрица первой нестационарной спек- тральной плотности выходного процесса 5x(0=^(M)5v(0 + Р РР Р Л-1 + (5Шб) *=о РР Матрица второй нестационарной плотно- сти выходного процесса Sx(t,t) = + рр’ рр рр’ рр л-1 + w^^p^p^wa^ k=Q РР рр (5.11’17) ще Др(/) = p*[h, t, t, - Д/)]; - матема- тические ожидания; D^) - дисперсии на- чальных условий. Математические ожидания mJJ) и кова- риационную матрицу KxJjy I) выходного про- цесса вычисляют по формулам обращения (5.11.10) и (5.11.14). Для многомерной нестационарной сис- темы приведенные формулы также справедли- вы, но передаточные функции должны быть
СПЕКТРАЛЬНЫЙ МЕТОД, ОСНОВАННЫЙ НА ИНТЕГРАЛЬНОМ УРАВНЕНИИ ФРЕДГОЛЬМА 431 определены для соответствующих входов и выходов. Рассмотренные алгоритмы решения задач статистического анализа нестационарных ли- нейных непрерывных систем обобщаются на дискретные непрерывные системы, для кото- рых должны быть определены параметриче- ские спектральные передаточные функции [25]. 5.11.2. СПЕКТРАЛЬНЫЙ МЕТОД, ОСНОВАННЫЙ НА ИНТЕГРАЛЬНОМ УРАВНЕНИИ ФРЕДГОЛЬМА 2-ГО РОДА Интегральное представление нестационар- ной одномерной системы. Пусть линейная не- стационарная система описывается дифферен- циальным уравнением п т * = Xav(Z)X<V> = X*v(/)V<V)(0 = v=0 v=0 (5.11.18) Это уравнение может быть представлено в эквивалентной форме инте1рального уравне- ния Фредгольма 2-го рода [25] t X(Z) = j Rx(f,T) = f(f). (5.11.19) О ще ядро Дирихле; t f(0 = |Лу(Г,т)у(т)А; О = Z 7^7г[М')(' ’ т)М-11 ^0 уп - 1)! dx L J Если разложить решение этого инте- фального уравнения по ортогональному бази- су Ф = [<рk (0, к = 1, /] на промежутке [О, 7], то выходную переменную можно пред- ставить интегралом Дирихле [25] Т xi(t) = j Z>/(/,t)v(t)A, (5.11.20) 0 ще / / Ms) = X Zfl*v(0<p*(0<Pv to; *=0v=0 [flb] = (A^AX = A; (5.11.21) A* - спектральная характеристика инерцион- ной части системы - матрица Ах = » АХ - спектральная характеристика форсирую- щей части системы Ау = : Т OfM = j *x(fto<P*(O<Pv W<ft; 0 (5.11.22) Т <&(*) = / Лу(Г,т)<р^(0<ру(т)Л. 0 Спгшсппеский анализ нестационарной непрерывной системы. Математическое ожида- ние выходной переменной на основании (5.11.20) вычисляют по формуле [25] Т mx(t) = j 2)/(Г,т)/Пу(т)Л + 0 л-1 + £,4*(0»»xt(0). (5.1L23) к=0 ’ Интырал, входящий в формулу (5.11.23), Т I j Р,(/;т)ту(т)Л = £ *5v(A;,0<₽*(/). 0 4=1 * Тогда расчетная формула приобретает вид / «х(0 = + к=\ Ф л-1 + ^Ak(t)mXk(0). (5.1124) к=0 Корреляционная функция tj) I I =zz. J.(v, h,h) Фу(Л )<₽и('2) + v=lp=lw Л-1Л-1 + Z Z KW, (°>°) Лк ('1 )ЛР<'2). <5.11.25) Л=0р=0 если начальные условия некоррелированы с входным процессом.
432 Глава 5.12 АНАЛИЗ СРЫВА УПРАВЛЕНИЯ (СЛЕЖЕНИЯ) В САУ Данный метод обобщается на многомер- ные системы, заданные в пространстве состоя- ний [25]. Слписпнеский анализ нестационарной дискретной системы. Для реализации второго спектрального метода анализа дискретной системы последняя предварительно приводит- ся к разностному уравнению 2-го рода с опе- ратором суммирования (дискретный аналог уравнения Фредгольма 2-го рода) [25]: N-l N-1 х(л)= £D(zi,/)v(/) + £D(n,Z)x(«o), /=ль l=tlQ (5.11.26) где D(h, /) = 1(и - 1 - /)g(tt, 0 - матричное ядро Дирихле [30] для исходной системы х(л + 1) + А(л) х(л) = В(л) у(л), п е (ло, N - 1); g(n, I) - импульсная переходная функция дис- кретной системы. Математическое ожидание выходного процесса N-1 тх(п) = £В(л,/)ту(/)4- /=Ло N-1 + £В(л,/)тх(л0). (5.11.27) /=Ло Корреляционная функция выходной пе- ременной К*(»1.»2) = N-l N-1 = Е SD("l’/l)K’(/'>/2)DT(”2,/2) + А=л0 /2=я0 N-l N-1 + 2ЩлЬ/1)^Ю(Л2,/2)К*(ЛО,Ло) /|=Ло 4=ло (5.11.28) при отсутствии связи между процессом у(л) и начальными условиями. Глава 5.12 АНАЛИЗ СРЫВА УПРАВЛЕНИЯ (СЛЕЖЕНИЯ) В САУ 5.12.1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ Фазовые координаты САУ в процессе ее нормального функционирования должны на- Рис. 5.12.1. Дискриминационная (пеленгационная) характеристика ходиться в определенных пределах, т.е. внутри некоторой области Ж Выход этих переменных за границу S области FK приводит к наруше- нию функционирования системы, к срыву слежения, т.е. к размыканию цепи управления. В следящих системах под срывом слежения (управления) следует понимать выход фазовой координаты х(/) за пределы апертуры дискри- минационной характеристики (рис. 5.12.1). Срыв слежения (управления) - явление статистическое. Строго говоря, под срывом слежения следует понимать первый выход координаты x(f) за пределы апертуры 2А. За- дача о срыве слежения является частной. Более общей является задача срыва процесса управ- ления в автоматической системе. В общем случае срыв управления характеризуется пер- вым выходом вектора x(f) за границу S облас- ти В процессе статистического анализа ав- томатических систем могут решаться следую- щие задачи: определение вероятности срыва или бессрывности управления в функции вре- мени или за заданный промежуток времени; определение закона или моментов распределе- ния времени бессрывного управления, опреде- ление условных закона или моментов распределения фазовых координат и вероятно- стей состояния системы. Вероятность срыва слежения (управле- ния) за заданное время, т.е. вероятность пер- вого достижения границы S обозначается так: Р(хо, О> где Хо - начальное состояние систе- мы. При этом предполагается, что в началь- ный момент t = 0 система находилась в облас- ти FK ограниченной поверхностью S: Хо(0 = Хо е W. (5.12.1) В зависимости от характера задачи началь- ное состояние Хо может быть детерминирован- ным или случайным. Если начальное состояние динамической системы с распределением Jb<XQ, f) случайно, то вероятность первого достижения границы определяется выражением
ПРИМЕНЕНИЕ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ 433 Л(0 = J Л(хО,О/о(хо)Ло- (5.12.2) S Вероятность Pi(xq, f) можно рассматри- вать как интегральный закон распределения времени до срыва слежения. Для характери- стики срыва используется также производная . Л dJ»l(xo,O fxa (0 = —£. > представляющая собой dt плотность распределения вероятности времени до срыва. Вероятность несрыва управления» т.е. не- достижения границы S и невыхода из области Ж вычисляют по формуле PQ(t) = j f(x,t)dx, (5.12.3) w где /(x,/) - плотность распределения вероят- ности фазовых координат системы в области W бессрывного управления при заданной ве- роятности начального распределения ТоОО))- Величины Ро(/) и P\(f) связаны между собой зависимостью Л(0 = 1 - Ро(О- (5.12.4) Приближенно явление срыва управления (слежения) можно характеризовать и оцени- вать по поведению математического ожидания и дисперсии ошибки управления (слежения) в автоматической системе. 5.12.2. ПРИМЕНЕНИЕ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ И УРАВНЕНИЯ ФОККЕРА-ПЛАНКА-КОЛМОГОРОВА Знание плотности вероятности распреде- ления Дх, /) фазовых координат системы» в том числе ошибки слежения» позволяет вычис- лить вероятность бессрывного управления и другие вероятностные характеристики. Функ- ция плотности вероятности Дх, /) многомер- ного марковского процесса х(/), который опи- сывает поведение САУ» удовлетворяет уравне- нию Фоккера-Планка-Колмогорова = (5.12.5) где я(х, 0 = а(х, t)f (х, t) - -|[vJ(pt(x,O/(x,o)]T; (5.12.6) а(х, /) - вектор сноса; Л(х, 0 - матрица диф- фузии стохастической системы управления. Уравнение (5.12.6) следует интегрировать при заданной начальной функции 7о(хо) и граничных условиях на поверхности S [9» 18]. Поверхность S разбивается на регулярную часть Sp, для которой граничное условие n^x) D(x, /) п°(х) #0,х е Sp, (5.12.7) и нерегулярную часть 5^, для которой гранич- ное условие D(x, /) п°(х) = 0, х е 5^, (5.12.8) где П°(х) - единичный вектор к поверхности. С учетом формулы (5.12.4) для определе- ния Ро(О следует проинтегрировать уравнение [9] Л = - J/(x>0«T(x,0 п°(х)А + •У. + 2 I[вга4/’<х»0 П°(х)А (5.129) при начальном условии Ро(4)) = 1 и уравнение (5.12.6) при заданных граничных условиях. Точное решение задачи возможно только в простейших случаях в основном для одно- мерных систем. Практическое значение имеют приближенные методы решения этих уравне- ний» основанные на аппроксимации плотно- сти вероятности /(x,Z) [9]. В ряде случаев для простейших систем первого и второго порядков при допущении малости вероятности срыва управления Pi — = 1 - Pq < 0,1 ... 0,2 с помощью теории мар- ковских процессов получены приближенные конечные формулы» по которым определяется вероятность срыва. Приведем формулы для расчета вероят- ности срыва управления Pi(/) (слежения) в следящих системах (рис. 5.12.2) с дискрими- национной характеристикой Р(х) типа» пред- ставленного на рис. 5.12.1 при крутизне ли- нейной части I и при Х(/) = Xj ТJ18].
434 Глава 5.12. АНАЛИЗ СРЫВА УПРАВЛЕНИЯ (СЛЕЖЕНИЯ) В САУ 1. Система первого порядка ^(/>) = — Р -1 Ч»(г)- \-Jz-Q(x)F'(x)dx; X(z) ч»(г)= |«о7г-С(х)А; Л(1) А. J* Лх)-£ <&; *iL J ™ dQ^ где —т— = 2. ^G») = Лх)-^ Система к Хч>+0 * Х»1 Хн = Т7 • н kl второго порядка kli 1 Т ~ 2Т X х ехр Т 2Т х 4ТС2 ХСХР"Т2 кл8ц ГДе ci=|j F(x)-¥ 1 * л *0 к л к * л Хф xi = тах[Хн, Ai]; х2 = minfo, Д2], x„ определяют из условия dF(x) дх £(х)-^ = 0; > о; h (2) - крутизны Дх) в точках Xj и х2. 3. Система с астатизмом второго порядка JF(p) = при X = К2£ Р А ('и) = ~ ф(0и) х Qm 47i е <p(z) . хехр - —L I ; к Jy(?) C(x) = *J[f(0-^-l<; * I Л хн R(z) - область значений х, где z > Q(x), Z2 = х^ = ^- + Q(x). Для отыскания решения уравнения Фок- кера-Планка-Колмогорова в области FK огра- ниченной границей S, в более общих случаях многомерных систем может быть применен метод компенсирующих источников [18]. Этот метод основан на анализе решения для плот- ности вероятности перехода Дх, t / Хо, А))- Искомая вероятность срыва управления A(O = l-f/(«.'/Хо.^о)*» (5.12.10) W а решение уравнения должно быть определено при начальном Дх, А) / *0» А)) = 6(х - Хо) и граничном Дх, t / Хо, А)) I х « j> “ ° условиях. Для реализации этого метода фазовое пространство задачи расширяется до беско- нечного. Решение задачи. Коши для функции плотности вероятности перехода при началь- ном условии имеет вид Дх, А) / Хо, А)) = = 5(х - Хо) с нулевыми граничными условия- ми в бесконечность. Если исходная система линейна в пределах апертуры дискриминатора, то это решение расширенной задачи является гауссовской Jo(x> Хо, А)) функцией, и нахо- дится элементарно, например, методом кова- риационной теории. Если исходная система нелинейна, то после линеаризации для расширенной задачи также можно записать гауссовскую функцию плотности вероятности. Полученная функция не является решением исходной задачи, так как на границе Sp решение не обращается в нуль. Для компенсации плотности вероятности на Sp следует расположить за пределами об- ласти W дополнительные источники так, что- бы в начальный момент А)
ОПРЕДЕЛЕНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ВРЕМЕНИ 435 Дх, А)/хо, А)) = б(х-хо)- N -£a,6(x-Xf), (5.12.11) /=1 где щ - неизвестные коэффициенты. Вследствие линейности уравнения Фок- кера-Планка-Колмогорова (для линейной или линеаризованной системы) с учетом (5.12.11) его решение имеет вид Дх, Г/хо, to) = Дх, Г/ хо, 4») - N -^^(х^/Хь/о). (5.12.12) ы Коэффициенты в/ выбирают так, чтобы результирующая плотность вероятности на регулярной части границы стремилась нулю Zo(x, / / х0, г0) - / xt,to) /=1 Po(O = | ^(/,4>>хо)Л(хо)ло- w Граничные условия для управления (5.12.14) так же, как и для уравнения Фокке- ра-Планка-Колмогорова, формулируются для ретулярной Sp и нерегулярной 5^ границ. Если система стационарна,* то вектор сноса а(хо) и матрица диффузии D(xq) не зависят от времени, а вероятность P(t - 4), Xq) зависит от разности т = / - Zq времени: = aT(x0)gradX(|P(-t,x0) + + ytr[j)(xo)gradJ(j|P(T,xo)]. (5.12.15) Уравнение Понтрягина в общем случае также трудно решить. Однако во многих зада- чах требуется получить вероятностную инфор- мацию о времени бессрывного управления. X eSp. (5.12.13) Полученное приближенное решение (5.12.12) с учетом формулы (5.12.10) служит для определения Pi(l) вероятности срыва управления. 5.12.3. ПРИМЕНЕНИЕ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ И УРАВНЕНИЯ ПОНТРЯГИНА При исследовании процесса срыва управления распределение плотности вероят- ности базовых координат системы часто не представляет интереса, а требуется только оп- ределить вероятность срыва или несрыва управления. Такая задача решается на основе интегрирования уравнения Понтрягина [9, 18] для вероятности P(t, Iq, Xq) несрыва управле- ния, т.е. недостижения векторным процессом х(/) к моменту времени t границы S области Внесли в момент 4) он имел значение Xq: SP{t,to,xo) = _ат(Хо>/о) grad^ P(t,t0,x0) " OJq -ytr ^(xo./oJ^-grad^Pjr./o.xo) (5.12.14) 5.12.4. ОПРЕДЕЛЕНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ВРЕМЕНИ БЕССРЫВНОГО УПРАВЛЕНИЯ Такими характеристиками являются: ма- тематическое ожидание Wc(xq) и дисперсия Д(хо) времени бессрывного управления. Для стационарных систем такие уравне- ния имеют вид [9] a2mt(x0) ! - / J=l dxoidxoj + SMxo)^ + i = o; /=1 ^0/ п (5.12.16) 1 у П . 2/^1 " 1=1 dx0i * <5-12.17) i,J=l ^Oj При интегрировании этих уравнений должны быть учтены граничные условия при ЛА)» А), «о) s 1. Если начальное состояние Xq случайно и имеет плотность распределения /о(хо),то вероят- ность несрыва управления к моменту времени t В частном случае одномерной системы уравнения имеют вид:
436 Глава 5.12. АНАЛИЗ СРЫВА УПРАВЛЕНИЯ (СЛЕЖЕНИЯ) В САУ 1п(Хо)^ф1 + а(Хо)^Ы+1 = О; 2 Ло Ао (5.12.18) 1D(x«)£^o)+(X(Xo)^^ + 2 ^0 Л0 + D(xofeM\o. I л0 > Если границами области существования процесса управления являются величины 6 < < х < А, то граничные условия следующие: /Пт(6) = /Пт(А) = 0; Д(5) = Д(Д) = 0. Уравнения (5.12.14) имеют решения [31]: тДхо) = X А х ..5 5 V ' 5 5 ЛЬ'*”** А х Je-<p(x)dbc хь |е’ф(х)Л: .5 (5.12.19) Xb Z J е~ф<г) J x\(y)e^dydz - 5 5 Х0 A Z - с J e~^dz - J е_ф(г) J т\(у)е^ dydz х 5 5 5 -М'ТГ'ЛИж*. В общем случае для решения уравнения Понтрягина успешно применяется метод Буб- нова-Галеркина, который является дальней- шим развитием метода разделения [18]. Метод Бубнова-Галеркина позволяет эф- фективно отыскивать только первые главные члены приближенного ряда. Для старших чле- нов ряда используются асимптотические раз- ложения собственных функций [16]. 5.12.5. ПРИМЕНЕНИЕ ТЕОРИИ ВЫБРОСОВ СЛУЧАЙНЫХ ПРОЦЕССОВ. СТАЦИОНАРНЫЕ СИСТЕМЫ Распределение выбросов случайного процесса над порогом подчиняется закону Пуассона P(«JH) = ^-e‘v'H, (5.12.21) где Р(п, /н) - вероятность появления за время /н ровно п выбросов; v - частота выбросов» т.е. среднее число пересечений с определенным знаком производной процесса х(/) уровня А в единицу времени. Вероятность появления хотя бы одного выброса процесса над уровнем А за время /н определяется формулой (5.12.22) Отождествляя срыв управления с дости- жением процессом х(/) одной из границ апер- туры дискриминационной характеристики Д( и Д2 и учитывая, что достижение правой и левой границ - события взаимно независимые, имеем л(^)=л(1)('н)+л<2)('н)- - Aa>('«)A<2>('«)’ <512-23> где Р1<1),(2)(/н) = 1-«ф[*1,(2Ин] - вероят- ность достижения процессом х(/) границ Ai и Д2; vl(2) ~ частоты выбросов процесса х(/) за уровни Ai и Д2. Для малых вероятностей срыва (< 0,1... 0,2) формула (5.12.23) принимает вид AGh) « (VI + V2)/н. (5.12.24) Расчет вероятности срыва управления при сделанных допущениях сводится к опре- делению частоты выбросов v. Формулы, опре- деляющие v для типовых стационарных систем при крутизне / линейной части и пороге А дискриминационной характеристики F[x) и гауссовском белом шуме с постоянной сп- ектральной плотностью % приведены ниже. 1. Система с идеальным интегратором к! Л/ 2/ 2 v = — ехр----------А 2л |_ Icsq 2л
ПРИМЕНЕНИЕ ТЕОРИИ ВЫБРОСОВ СЛУЧАЙНЫХ ПРОЦЕССОВ 437 2. Система с интегрирующим фильтром 1 + к1 -----ехр 2 л Т 2&2Т(1 + к1) 50Л2 3. Система с интегратором и про- порциональным интегрирующим фильтром W(p) = 1 к! (1-п- к0)2 + kQ 2л | ?2 1 + &0 х ехр - too(l + *о) п = ^-, к0 = к1Т2п2. Т2 4. Система с астатизмом второго порядка Р2 1 (1 + мт2)2 v = — W-i-------Ц- X 2 л 1 Г ,fI^4212 х ехр 2Д2/2Т j0(l+WT2) ’ 5. Система с астатизмом первого порядка к И фильтром И'(р) = —;-----77-------7 . p(l + TlP)(l + T2p) 1 к! х 2 л । Т\ + Т 2 Г 2b2l(Tl+T2-klTlT2) кз0(Т1+Т2) 6. Система с астатизмом второго порядка к 1 + Т \р р2 1 + Т2р и фильтром FK(р) = 1 + мт? 1 + к!Т? х ехр - 2Д272(7[ - Т2) So(l + k/T2) п - т2 При наличии в системе (рис. 5.12.2) ре- гулярного сигнала Х(/) следует в формулах для v величину А заменить эквивалентным поро- гом Аэ = А - т*, где тх - математическое ожидание х(/). Нестационарные системы. Вероятность срыва управления в нестационарной системе на основании теории выбросов при двух по- рогах Ai и А2 определяется зависимостью />(/„) = 1 - ехр О •f[vi(0 + v2(0p/. (5.1225) О Зависимость (5.12.24) получается из (5.12.25) при vi = const и V2 = const. Частота выбросов в системе с двумя гра- ницами Vl(0 + V2(0 = 00 = J T)2<0Z[A2 (0. Д2(0 + П2(0рП2(0 - о о - Jш(П/[Д1('),А1(0 + m(/)]Л|1 (Z). -00 (5.12.26) где чХО - *(0 ‘ АХО» / = 1, 2. Непосредственный расчет частоты срывов по формуле (5.12.26) затруднителен, так как обычно двумерная плотность вероятности /(х,х) неизвестна. В литературе описан ряд частных случаев, когда удается получить точ- ное решение [1]. Приближенное решение можно получить, если принять гауссовскую аппроксимацию плотности вероятности. Срыв управления в нелинейной системе - явление статистическое, он проявляется поте- рей устойчивости при определенном уровне шума. Срыв управления сопровождается рос- том дисперсии ошибки управления. Усреднен- ное описание динамических свойств системы позволяет оценить устойчивость ее в среднем и выявить условия, при которых наступает срыв управления. Усредненное описание поведения нели- нейной стохастической системы состоит в
438 СПИСОК ЛИТЕРАТУРЫ составлении уравнений для первых двух веро- ятностных моментов: вектора математического ожидания и ковариационной матрицы. Такие уравнения составляются после статистической линеаризации нелинейностей (дискриминаци- онной характеристики Дх)) в предположении гауссовского закона распределения фазовых координат системы. Затем эти уравнения ис- следуются на устойчивость при различных уровнях шума или численным, в частности, графическим путем определяется критическое значение входных воздействий, при которых наступает рост дисперсии ошибки управления. Примеры таких расчетов приведены в [18]. СПИСОК ЛИТЕРАТУРЫ 1. Андреев Г. А. О выбросах нестацио- нарного случайного процесса. Изв. вузов, Ра- диофизика, 1967, № 8. С.45 - 52. 2. Артемьев В. М. Теория динамических систем со случайными изменениями структу- ры. Минск: Высшая школа, 1979. 3. Бессекерский В. А. Цифровые автома- тические системы. М.: Наука, 1976. 4. Гренацдер У. Случайные процессы и статистические выводы. М.: ИЛ, 1961. 5. Дуб Дж. Л. Вероятностные процессы. М.: ИЛ, 1956. 6. Евланов Л. Г., Константинов Системы . со случайными параметрами. М.: Наука, 1976. 7. Казаков И. Е., Доступов Б. Г. Стати- стическая динамика нелинейных автоматиче- ских систем. М.: Физматгиз, 1962. 8. Казаков И. Е. Статистическая теория систем управления в пространстве состояний. М.: Наука, 1975. 9. Казаков И. Е. Статистическая динами- ка систем с переменной структурой. М.: Нау- ка, 1977. 10. Казаков И. Е., Мальчиков С. В. Ана- лиз стохастических систем в пространстве со- стояний. М.: Наука, 1983. 11. Калман Р., Фалб П., Арбиб М. Очерки по математической теории систем. М.: Мир, 1971. 12. Кушнер Г. Дж. Стохастическая устой- чивость и управление. М.: Машиностроение, 1968. 13. Ленннг Д. X., Бетгин Р. Г. Случайные процессы в задачах, автоматического управле- ния. М.: ИЛ, 1958. 14. Лоев М. Теория вероятностей. М.: ИЛ, 1962. 15. Медич Д. Статистически оптималь- ные линейные оценки и управление. М.: Энергия, 1973. 16. Моисеев Н. Н. Асимптотические ме- тоды нелинейной механики. М.: Наука, 1969. 17. Невельсон М. М., Хасьминский Р. 3. Об устойчивости стохастических систем. Про- блемы передачи информации, 1966,. т. 2, № 3. 18. Обрезков Г. В., Резевич В. Д. Методы анализа срыва слежения. М.: Сов. радио, 1972. 19. Первозванский А. А. Случайные про- цессы в нелинейных автоматических системах. М.: Физматгиз, 1962. 20. Пугачев В. С Теория случайных функций и ее приложения к задачам автома- тического управления. М.: Физматгиз, 1960. 21. Пугачев В. G, Казаков И. Е., Евла- нов Л. Г. Основы статистической теории авто- матических систем. М.: Машиностроение, 1974. 22. Пугачев В. С Теория вероятностей и математическая статистика. М.: Наука, 1979. 23. Пугачев В. G, Синицын И. Н. Стохас- тические дифференциальные системы. Анализ и фильтрация. М.: Наука, 1990. 24. Росин М. Ф., Булыгин В. С Стати- стическая динамика и теория эффективности систем управления. М.: Машиностроение, 1981. 25. Солодовников В. В., Семенов В. В. Спектральная теория нестационарных систем управления. М.: Наука, 1974. 26. Сгратонович Р. Л. Новая форма запи- си стохастических интегралов и уравнений. М.: Вестник МГУ, Сер. Матем. и мех., 1964, № 1. 27. Тихонов В. И. Выбросы случайных процессов. М.: Наука, 1970. 28. Хасьминский Р. 3. Об устойчивости траекторий марковских процессов. Приклад- ная матем. и мех. 1962, № 6. С. 37 - 45. 29. Хасьминский Р. 3. Устойчивость сис- тем дифференциальных уравнений при слу- чайных возмущениях их параметров. М.: Нау- ка, 1969. 30. Чернецкий В. И. Анализ точности не- линейных систем управления. М.: Машино- строение, 1968.
Раздел б МЕТОДЫ ОПТИМИЗАЦИИ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Глава 6.1 ПОНЯТИЕ ОПТИМАЛЬНОСТИ. КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ Оптимизационными критериями САУ могут служить частные и общие показатели качества процессов управления, надежности, безопасности, эксплуатационной технологич- ности, стоимости, экономической эффектив- ности и др. Обычно в качестве основного критерия (целевого функционала) выбирают один пока- затель или группу показателей, объединенных (в значительной мере искусственным образом) в один обобщенный (комплексный) критерий. На другие показатели накладываются ограни- чения. Именно такая оптимизация рассматри- вается в данном разделе. 6.1.1. МОДЕЛИ ОПТИМИЗИРУЕМЫХ ПРОЦЕССОВ И СИСТЕМ Помимо критерия и ограничений исход- ной предпосылкой оптимизации является мо- дель оптимизируемой системы или процесса. Эта модель может быть не только математиче- ской (представленной на универсальном языке математики), но и имитационной (представ- ленной только в виде компьютерных про- грамм), полунатурной (содержащей реальные аппаратные звенья, физические модели, моде- ли человека-оператора). Здесь используются в основном математические модели с непрерыв- ным временем. Такой выбор сделан не только из соображений компактности и наглядности алгоритмов, но и общности. Методы оптими- зации и оптимального управления, разрабо- танные для систем с непрерывным математи- ческим описанием, в большинстве случаев могут быть перенесены на дискретные системы посредством стандартных приемов вычисли- тельной математики. Это именуется синтезом по оптимальному непрерывному аналогу. Конечно, при таком синтезе дискретных алгоритмов имеют место некоторые потери в качестве управления, а иногда могут получать- ся и неработоспособные алгоритмы. В таких случаях в тексте содержатся соответствующие пояснения. Кроме того, и это главное, приво- дятся ссылки на литературные источники и пакеты прикладных программ (ППП), охваты- вающие как непрерывные, так и дискретные задачи оптимизации. Модели в пространствах состояний и за- дачи оптимизации САУ. Для непрерывного (с непрерывным временем) динамического объ- екта с сосредоточенными параметрами наибо- лее компактным и распространенным является описание посредством векторного обыкновен- ного дифференциального уравнения вида х = /(х,М,£), (6.1.1) где х е Rn - вектор состояния; и 6 Rr - вектор управления; £ е R? - вектор возмуще- . dx г ния; t - время, х = — ; f - векторная функ- dt ция векторного аргумента. В уравнении управляемого объекта (6.1.1) в явном виде не фигурирует вектор постоянных параметров а = const. Это соот- ветствует случаю, когда эти параметры извест- ны и заведомо не подлежат изменению в про- цессе проектирования САУ. Оба эти условия не всегда выполняются. При проектировании САУ, особенно адаптивных, приходится учи- тывать, что не все параметры управляемого объекта известны с достаточной точностью (т.е. функция f не задана с достаточной точно- стью). Кроме этого в ряде приложений полу- чают развитие методы интегрированного про- ектирования, когда комплекс "управляемый объект + управляющая автоматическая систе- ма" оптимизируется как единое целое. Это означает поиск на стадии проектирования оптимальных значений параметров как управ- ляющей системы, так и управляемого объекта. При решении подобных задач вместо (6.1.1) целесообразно использовать уравнение х = /(х,и,а,ГЛ), (6.1.2) где а € Rn° - вектор параметров, как прави- ло, постоянный (а =0). Для стационарных систем время как аргумент функции /в явном виде отсутствует х = /(х,и,о,0. (6.1.3)
440 Глава 6.1. ПОНЯТИЕ ОПТИМАЛЬНОСТИ. КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ Сама функция f может быть задана в аналити- ческой, численной (табличной) или численно- аналитической формах. Уравнения в форме Коши (6.1.1) - (6.1.3) зачастую являются наиболее естественным способом описания объекта управления, так как непосредственно выражают физические законы (законы природы), определяющие процессы в динамической системе. Пример. Иллюстрацией модели (6.1.3) могут служить уравнения пространственного движения твердого тела в инерциальной сис- теме координат. Уравнения вращательного движения: (6.1.4) Кинематическое уравнение для поступа- тельных скоростей в инерциальной системе координат (в матричной форме) (6.1.7) Если в качестве вектора состояния х принять 18-мерный вектор х = [a&jPzWyVfll ••• W&lТ, (6.1.8) то уравнения (6.1.4) - (6.1.7) примут вид (6.1.3), точнее, его частную форму. Для кон- кретизации этой формы следует указать, что принимается за управление, от каких компо- нент вектора состояния зависят силы и момен- ты, действуют ли возмущения. Так, принимая относительные моменты и силы в качестве управлений: где со*, (az - компоненты абсолютной угло- вой скорости в связанных осях, ориентиро- ванных по главным центральным осям инер- ции твердого тела; J# Jy, Jz, М» Му, Mz - моменты инерции и моменты сил относитель- но тех же осей. Уравнения поступательного движения: vx = VyWz-Vz<ay+L-. Fv Ку = Vz(ax - Vxoaz + ; > (6.1.5) f7 Кг=КхОу-Ку(ох+-^, где Vy, Vz, Fx, Fy, Fz - проекции вектора абсолютной скорости и вектора силы на свя- занные оси; т - масса тела. Уравнения направляющих косинусов ме- жду связанной и инерциальной системами координат (уравнения Пуассона) в матричной форме: c = cQT; с = е11 е12 с13 е21 е22 с23 е31 е32 с33 (6.1.6) 0 Q = -QT = -<ог (Оу (ог -(Оу 0 (ох 0 Jx Jy Jz т т т (6.1.9) представляем (6.1.4) - (6.1.7) в форме х = /(х)+<ри, (6.1.10) где Jx (Jy Jz )^2^з Jy'Vz --fX)XlX3 JZ 1 X - J У )X1 X1 ^(6 x 6) - единичная матрица размера 6 x 6; 0 - нулевые матрицы тех же размеров; Дх) - мат- рица-столбец 18 х 1. Уравнение (6.1.10) является частным ви- дом (6.1.3), где вектор параметров а и вектор возмущений в явном виде не фигурируют, а управление и входит линейно. Задачи оптимизации САУ. Постановки задач оптимизации САУ даже в рамках описания в пространствах состояний довольно разнообразны. Пусть управляемый объект описывается уравнением типа (6.1.1) без аргументов t, £: х = /(х,и). (6.1.11) Уравнение (6.1.11), как и уравнения (6.1.1) - (6.1.3), могут соответствовать так на- зываемому обобщенному управляемому объек- ту, включающему помимо собственно объекта
МОДЕЛИ ОПТИМИЗИРУЕМЫХ ПРОЦЕССОВ И СИСТЕМ 441 управления исполнительные устройства САУ, датчики и др. Допустим, что собственно САУ или вы- числитель САУ, точнее, их аналоги с непре- рывным временем, описываются следующей векторной функцией векторного аргумента: и = fu(Hx,a). (6.1.12) Здесь z - Нх - выходной векторный сигнал измерительной системы (шумы измерения пока не учитываются); а - вектор постоянных параметров, подлежащих определению в ре- зультате решения задачи оптимизации (синтеза); fu - известная векторная функция указанных векторных аргументов. Подставляя (6.1.12) в (6.1.11), получаем х = f(x,fu(Hx,a)). (6.1.13) Функции f, fub большинстве случаев таковы, что уравнение замкнутой системы при задан- ных ау Н и фиксированных начальных усло- виях x(t$) = Хф имеет единственное решение х(0 = Для этого решения назначается показа- тель качества управления /, например, показа- тель качества переходного процесса. При про- чих заданных величинах и функциях он зави- сит от начальных условий и варьируемых (оптимизируемых) параметров: I(xq9o). Детерминированная задача параметриче- ской оптимизации формулируется следующим образом: х = f(x,ftt (Нх, в)); х(/0) = ХО, <7 = 0, а = argmin/(x0,<7), (6.1.14) а т.е. требуется найти значение вектора парамет- ров, соответствующее экстремуму показателя качества процесса в замкнутой системе. Задача синтеза оптимального управления. Функция и(х) здесь не задана даже по форме, а подлежит определению в результате синтеза. Синтез осуществляется на основе минимиза- ции целевого функционала, выражающего качество процессов управления. Таким функ- ционалом может служить известный в класси- ческом вариационном исчислении функционал Больца 1(х,и). Здесь для функционала, "аргументами" которого являются функции x(Z), и(/), применяется такое же обозначение, как и для функции, аргументами которой яв- ляются величины х, и. На самом деле разница здесь принципиальная, такая же, как между конечномерными и бесконечномерными про- странствами. Формулировка рассматриваемой задачи синтеза оптимального управления теперь име- ет вид х = /(х,и); и = argmin/(х,и), (6.1.15) и т.е. требуется найти управление и — и(х), со- ответствующее экстремуму целевого функцио- нала I. Модели в обобщенных координатах и за- дачи оптимизации САУ. Описание динамиче- ских систем в пространствах состояний по- средством обыкновенных дифференциальных уравнений в форме Коши (6.1.1) предполагает, что исходные дифференциальные уравнения могут быть представлены в виде, разрешенном относительно старших производных. Однако это не всегда возможно осуществить аналити- ческим путем. Часто это имеет место при опи- сании динамической системы в обобщенных координатах посредством уравнений Лагранжа второго рода. Так, если q = ••• ЯпГ» Я = Й1 Я2 • • • Яп Г " векторы обобщенных координат и обобщенных скоростей; L = L(q, q9t) = T(q, q,f)-U (q) - функция Лагранжа; T> U - кинетическая и потенциаль- ная энергии, то уравнение Лагранжа в вектор- ной форме имеет вид d dL dL „ = ^об’ (6.1.16) dt dq oq о dL Здесь — dq dL dL dqi dq2 dL dL dqnJ dq dL dL dL^ dqx dq2 dqn - векторы-строки произ- водных; Fqq - вектор-строка обобщенных сил. Если ввести обозначение х = |^т^т ]т , и - Л>б> то (6.1.16) можно привести к виду \р(х,х,0 = и, (6.1.17) являющемуся частным случаем более общего уравнения Т(х,х,и,Г) = 0. (6.1.18) Часто уравнения (6.1.16) - (6.1.18) в общем виде не разрешаются относительно старших производных: q для (6.1.16), х для (6.1.17), (6.1.18). Об этом свидетельствует следующий пример.
442 Глава 6.1. ПОНЯТИЕ ОПТИМАЛЬНОСТИ. КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ Пример. На схеме довольно простого че- тырехзвенного (включая основание) механизма с тремя степенями свободы (рис. 6.1.1, а) углы <Р1, q>2, Фз соответствуют трем степеням свобо- ды и служат обобщенными координатами, прямоугольные координаты ориентированы по главным центральным осям инерции трех под- вижных звеньев. На основе общеизвестных правил меха- ники и очевидных допущений получаем вы- ражение для кинетической энергии механизма Т = 0,5ап(ф2,Фз)ф1 + °>5а22(фз)ф2 + + О^аззф| + <х>2з(фз)<Р2ФЗ» (6.1.19) где а11(ф2,Фз) = +Лс28*п2Ф2 +^2 0082 Ф2 + + /х38т2(ф2 +фз)+Лз СОв2(ф2 +Фз) + 9 О + /И2^ ц2 cos Ф2 + + /»3(^2 СО8ф2 - *ц3 СО8(ф2 + Фз))2i а22<Фз) = Jy2 + Jy3 + /Л2*ц2 + + т3(*2 -*цЗ совфз)2; «33 = Jy3 +/я3^цЗ- Здесь Zx3> /у2> /уЗ> /?2> ~ главные центральные моменты инерции соответствую- щих звеньев; £ц2» /цз - массы звеньев и расстояния до центров масс этих звеньев (рис. 6.1.6, 6); /2 - длина второго звена. Уравнение Лагранжа второго рода (6.1.16) в данном случае в скалярной форме принимает вид следующей системы уравнений: а11(ф2,Фз)ф1 = «22(ФЗ)Ф2 + «2з(фз)ф3 +(а22(фз))фзФ2ФЗ + + («2з(фз))фзФз = М21 «ЗЗФЗ +«23(ФЗ)Ф2 +(а2з(фз))фэФ2ФЗ = ^3, где Mi, М2, М3 - моменты, создаваемые при- водами в шарнирах (см. рис. 6.1.1, а) и силой тяжести. Рас. 6.1.1. Схема четырехзвенного механизма
МОДЕЛИ ОПТИМИЗИРУЕМЫХ ПРОЦЕССОВ И СИСТЕМ 443 Вводя обозначения х = [ф1Ф2ФзФ1Ф2Фз]Т, w = [Л/1Л/2Л/3 000]т, получаем уравнения в форме (6.1.17): а11(*2,*з)*4 “22<*з)*5 + «23<*з)*6 +(“22(*3))*,*5*6 +(<Х2з(хз))жэх6 М,(х.х)= «33X6+a23(X3)i5+(«22(X3))^X5X6 = (/ (<_ д х4 х5 х6 Математические модели механических систем с многими степенями свободы могут быть весьма сложными, а их вывод - утомительным, со значительной вероятностью ошибок. По- этому хотя в целом получение математической модели, адекватной задаче, требует участия интеллекта проектировщика, исследователя, оправдано обеспечение компьютерной под- держки при формировании таких моделей в интерактивном режиме. Задачи оптимизации. Ме- тоды численного интегрирования обыкновен- ных дифференциальных уравнений вида (6.1.17), (6.1.18), не разрешенных относитель- но старших производных, отличаются от мето- дов интегрирования уравнений в форме Коши. Только этим могут определяться отличия в постановке и решении задач синтеза САУ для объектов вида (6.1.17), (6.1.18), с одной сторо- ны, и объектов (6.1.1) - (6.1.3), - с другой. Задача параметрического синтеза. Ищется экстремум показателя качества /, вычислен- ного на решении уравнения (6.1.18) при u = fu(Hx,a)y т.е. Т(х,х,/и(Ях,а),0 = 0; XW) = *0, ° = 0, а = arg min/(х0, а). а (6.1.21) Задача синтеза оптимального управления. Аналогично (6.1.15) при данном описании обобщенного объекта формулируется в сле- дующем виде: Т(х, х, и, /) = 0; и = arg min Z(x, и), (6.1.22) и где /(х, и) - целевой функционал. Модели вход-выход и задачи оптимизации САУ. Модели вход-выход базируются, как правило, на операторном описании динамиче- ских систем. Оператором (в широком матема- тическом понимании) называют правило (закон), который каждому элементу одного множества ставит в соответствие элемент дру- гого множества. В теории непрерывных дина- мических систем с сосредоточенными параметрами элементами этих множеств явля- ются входная хш (/) е Хт и выходная Хтду (/) е в общем случае векторные функции времени. Соответственно множест- вами Хту Хыт здесь служат функциональные пространства. Операторное уравнение непрерывной динамической системы записываем в виде Хвых (0 = Д*ю(0,(6.1.23) где а, £(/), как и в (6.1.2), - соответственно векторы параметров и возмущающих воздейст- вий; /[♦] - символ оператора. В выражении (6.1.23) не фигурируют в явном виде начальные условия. Для устойчи- вых линейных операторов это оправдано тем, что влияние начальных условий с течением времени стремится к нулю. В других случаях выражение (6.1.23) должно быть доопределено начальными условиями. В линейной теории широко используют преобразования Лапласа, Фурье различных сигналов. При этом дифференциальные и ин- тегральные операторы типа (6.1.23) для ли- нейных стационарных систем уступают место передаточным функциям (в форме преобразо- ваний Лапласа), частотным характеристикам. Связь операторных мо- делей и моделей в про- странствах состояний. Теория построения операторных моделей по моделям в пространствах состояний для линейных сис- тем разработана полностью. Пусть обобщенный линейный стацио- нарный объект управления в пространстве состояний описывается уравнением х = Ах + Виу (6.1.24) где часть элементов матриц А = [а у ], В = [д#] при интегрированном проектирова- нии может варьироваться (изменяться), а при обычном проектировании все коэффициенты этих матриц заданы. Выходной величиной является Xmjy = у = Нху матрица Я задана.
444 Глава 6.1. ПОНЯТИЕ ОПТИМАЛЬНОСТИ. КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ Регулятор (точнее, его вычислитель) опи- сывается уравнением и = -К(Нх-у3), (6.1.25) где К = [£уц] - матрица коэффициентов уси- ления (передаточных чисел), все или часть которых подлежит определению в процессе параметрического синтеза; у3 = y3(f) - задаю- щее воздействие. Подстановка (6.1.25) в (6.1.24) дает х + (ВКН - А)х = ВКу3. (6.1.26) Из (6.1.26) находим у = Я[$£ + ВКН - л]1 ВКу3, где - единичная матрица л х л; 5 - оператор d дифференцирования s = —. dt Таким образом, оператор (передаточная фикция), связывающий выходную величину y(t) с задающим воздействием y3(t)y в данном случае имеет вид <b(s,a) = + ВКН - А]~'ВК. (6.1.27) При скалярных входе и выходе (6.1.27) можно записать в виде <b(S,a)=bo + biS+- + b’-iS'"1 , Oq + QiS +... + anSn где a - вектор варьируемых элементов матриц К, А, В. Коэффициенты знаменателя flo, аЪ ..., ап и коэффициенты числителя Ь$у Ь\у ..., являются функциями компонент вектора а. При практическом вычислении переда- точных функций, особенно при высоких п (системы большой размерности), возникают две проблемы: соблюдение условий управляе- мости и наблюдаемости и снижение вычисли- тельных затрат при требуемой точности опре- деления коэффициентов fl/, />/. Если матрицы Ау ВКН не являются сильно разреженными, то обращение указанной в (6.1.27) матрицы размера п х п по методу Гаусса требует при- мерно л3 элементарных арифметических опе- раций. Это число, умноженное на количество значений вектора параметров fl, используемых для параметрической оптимизации САУ при операторном описании (см. ниже), может быть весьма значительным. Для получения операторных моделей ти- па (6.1.27) из моделей в пространстве состоя- ний в [33] на основе вычислительных алгорит- мов линейной алгебры предложены алгоритмы и программа (подпрограмма) TRANSF, обла- дающие достаточно высокой вычислительной устойчивостью. Задачи оптимизации при операторном описании легко формулируются по аналогии с предыдущим. Задача параметрического синтеза. При описании замкнутой системы в форме (6.1.23) д и £,(/) = О параметрическая оптимизация по критерию, зависящему от х^ Хеш, соответст- вует формулам *вых(0 = Лхю(0,<М1, а = о; (6.1.28) а = argmin/(xBX,xBbIX). а Задача синтеза оптимальных управлений. При операторном описании обобщенного управляемого объекта детерминированная за- дача может иметь следующую формулировку: *вых (0 = (6.1.29) и = argmin7[xBUX(0,ii(0l> и где Л*вых(0»и(0] - целевой функционал. Области устойчивости и параметрическая оптимизация. В любой задаче синтеза САУ возникает вопрос о грубости, робастности, параметрической чувствительности синтезиро- ванной системы. При параметрическом синтезе грубость спроектированной САУ может оцениваться по запасам устойчивости. В классической инже- нерной линейной теории регулирования ши- роко используются запасы устойчивости по фазе и амплитуде частотных характеристик разомкнутой системы. Однако для многосвяз- ных многомерных систем, тем более систем с нелинейными элементами, эффективность подобных оценок грубости недостаточна. Ме- тоды теории параметрической чувствительно- сти ориентированы на малые отклонения па- раметров и для сложных систем трудоемки даже в численной реализации. Достаточно универсальным показателем грубости является положение изображающей точки в области устойчивости пространства параметров. Удаленность этой точки, соответствую- щей вектору выбранных параметров, от границ области устойчивости свидетельствует о пара- метрической грубости синтезированной систе- мы. Однако само построение областей устой- чивости в параметрических пространствах для сложных систем представляет непростую зада- чу. Это построение для рассматриваемого
ЧАСТНЫЕ, ОБЩИЕ И ГЛОБАЛЬНЫЕ КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ 445 применения в параметрической оптимизации должно согласовываться с методом поиска экстремума целевой функции или целевого функционала. Аналитические необходимые и достаточ- ные критерии устойчивости известны лишь для линейных стационарных систем. Для сис- темы с передаточной функцией (6.1.27) в ска- лярном случае характеристическое уравнение имеет вид ansn + an_\Sn~x + ... + 00 =0. Для численных исследований устойчивости при высоких п рекомендуется критерий Рауса [1, 33]. Для записи алгоритма Рауса в общеиз- вестной форме используем традиционную (хотя и неудобную) обратную нумерацию ко- эффициентов характеристического уравнения ацзп +a\sn~l +... + ап =0. (6.1.30) В алгоритме Рауса четные коэффициенты этого уравнения обозначены Сц, нечетные - с/2: С11 = С21 = а2> С31 = (6.1.31) С21 = *1, с22 = fl3> с32 = *5,— Остальные вспомогательные величины с у (г = 1,2,...,л + 1; j = 3,4,...,Л + 2 при п _ „ л п + 1 четном; у = 3,4,..., при п - нечетном) вычисляют по формуле СУ - с/+1 J-2 c\j-2 c\J-\ (6.1.32) и при ручном счете обычно представляют в виде таблицы Рауса. При ац > 0 необходимым и достаточным условием устойчивости являет- ся положительность величин C\j (j = 2, 3, ...). Общее число элементарных арифметических операций, необходимое для однократной про- верки на устойчивость по алгоритму Рауса, составляет примерно 2л2 + л (из этих опера- ций около половины - длинные). Это сравни- тельно немного. Однако при определении границ областей устойчивости в задачах мно- гопараметрической оптимизации к этому не- обходимо добавить трудоемкие вычисления самих коэффициентов характеристического уравнения (6.1.30) и все это умножить на большое число "пробных точек". Проверку на устойчивость (в частности, с целью определения границ области устойчиво- сти в параметрическом пространстве) можно осуществлять путем прямого численного ин- тегрирования исходных уравнений в простран- стве состояний, хотя это зачастую требует вы- соких вычислительных затрат. Модели ограничений. Все приведенные выше в данном подразделе формулировки задач оптимизации записаны без учета ограни- чений типа неравенств, накладываемых на переменные состояния или другие перемен- ные. Отсутствуют и ограничения типа закреп- ления траектории на правом конце, т.е. требо- вания строгого выхода в заданную точку про- странства состояний. В то же время ограничения типа нера- венств далеко не всегда адекватно отражают реальные потребности и возможности, т.е. далеко не всегда являются удачными моделями реальных ограничений. Так, ограничения типа неравенств, на- кладываемые на фазовые координаты или управляющие воздействия, обычно соответст- вуют жестким упорам, ограниченным измене- ниям. Однако при наиболее прогрессивном интегрированном проектировании сами эти границы могут меняться в процессе комплекс- ного конструирования и оптимизации. Более адекватными реальным потребностям оказы- ваются удачно подобранные штрафные функ- ции, вводимые в целевые функционалы. При этом использование штрафных функций вме- сто ограничений типа неравенств резко упро- щает решение задач оптимизации. Сходное положение имеет место и в от- ношении граничных условий "на правом кон- це". Строгое выполнение этих условий невоз- можно из-за наличия шумов измерения и других возмущений. Выбор соответствующей терминальной функции целевого функционала (играющей роль функции штрафа на правом конце) обычно обеспечивает решение задачи вывода в заданную точку с необходимой точ- ностью. При этом вычислительные затраты с использованием так называемых неклассиче- ских функционалов (см. ниже) также могут быть резко сокращены. 6.1.2. ЧАСТНЫЕ, ОБЩИЕ И ГЛОБАЛЬНЫЕ КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ Критерии оптимальности связаны с ре- шаемыми САУ задачами. Можно выделить четыре класса таких задач: стабилизация, сле- жение, терминальное управление, управляемая операция. Эти классы задач в условной форме ил- люстрирует рис. 6.1.2. Здесь представлена про- екция (сечение) пространства состояний САУ или некоторое преобразование этого про- странства.
446 Глава 6.1. ПОНЯТИЕ ОПТИМАЛЬНОСТИ. КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ В задаче стабилизации система должна находиться вблизи заданного неизменного положения (см. рис. 6.1.2, окрестность 1 нача- ла координат). В задаче слежения компоненты вектора состояния или выходной величины ХО = должны повторять произвольные входные (задающие) воздействия с определен- ной точностью (см. рис. 6.1.2, трубка 2). В задаче терминального управления система должна переходить из произвольного или до- пустимого начального состояния в конечное состояние (его достаточно малую окрестность) в фиксированное или не фиксированное время (трубка траекторий 3). Наконец, задача, услов- но названная выше управляемой операцией, может состоять из одной или нескольких по- следовательно выполняемых перечисленных здесь простых задач, осложненных дополни- тельными ограничениями. Решение задачи управляемой операции условно показано на рис. 6.1.2. в виде трубки траекторий 4. Критерии качества переходных процессов и стационарной точности слежения. Эти крите- рии в роли частных показателей могут фигу- рировать при оптимизации различных режи- мов (задач) САУ. Наиболее характерно их применение для режимов стабилизации и сле- жения. Точность непрерывного слежения может характеризоваться мгновенным значением некоторой нормы разности выходной величи- ны и ее заданного значения ||у(0 - ь(<)| = IPW) -Уз(')|| (61.33) или функционалом, например, интегральным функционалом этой разности |йх(б),0]л = Jpb(e)-уэ(е)||л. (6.1.34) т т Здесь интегрирование ведется по не- которому интервалу времени: скользящее (0 е[/,/+ Т]), с заданным правым концом (0е[/,/к]), бесконечному с началом в мо- мент возбуждения переходного процесса, в частности, приложения ступенчатого задаю- щего воздействия (0 е [0, оо]) и др. Нередко в качестве нормы в (6.1.34) ис- пользуется положительно определенная квад- ратичная форма J0x(e),6]« = т = О^|[Ях(0) -y3(0)f₽[/fe(0) -Уэ(0)]Л, т (6.1.35) где р - заданная положительно определенная матрица, являющаяся в общем случае матрич- ной функцией времени 0. Для стохастических систем рассматрива- ются безусловные и условные математические ожидания величин (6. 1.33) - (6.1.35). Для задач стабилизации начало коорди- нат обычно выбирают в точке желаемого со- д стояния и Уз(0=°- Качество переходных процессов, вызванных типовым (обычно сту- пенчатым или импульсным) воздействием у3(/), может характеризоваться наряду с инте- гральным показателем типа (6.1.34), (6.1.35) перерегулированием, длительностью ("время срабатывания"), числом колебаний за время переходного процесса, и все это - для каждой компоненты вектора рассогласования ХО - Уз(0- Это заведомо частные показатели качества переходных процессов. Однако к частным показателям следует отнести и функционалы типа (6.1.34), (6.1.35), главным образом вследствие того, что они никак не учитывают энергетику процессов регулирования. Задачи оптимизации по част- ным показателям качества без учета ограниче- ний могут не иметь решения, приводить к неправильным выводам. Рассмотрим следующий пример. Пусть для линейного стационарного объекта (6.1.24) при заданном х(0) = JCq * 0 требуется выбрать матрицу коэффициентов усиления регулятора и - -Кх (частный случай регулятора (6.1.25) для задачи стабилизации состояния х 0), минимизируя квадратичный функционал типа (6.1.35), а именно функционал
ЧАСТНЫЕ, ОБЩИЕ И ГЛОБАЛЬНЫЕ КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ 447 min | хт (0)рх(0)Л. (6.1.36) К о Эта задача не имеет практически осуществи- мого решения. Действительно, функционал (6.1.36) стремится к нулю при неограниченном увеличении диагональных элементов матрицы К. Однако это означает неограниченное уве- личение коэффициентов усиления контуров регулирования, для чего требуется неограни- ченное увеличение мощности в любой реаль- ной системе. В механической или электромеханиче- ской системе, описываемой уравнениями Ла- гранжа (6.1.16), мгновенная мощность, разви- ваемая обобщенными силами, равна Fo§q (/’об - вектор-строка обобщенных сил; q - вектор-столбец обобщенных скоростей). Если «(1) = /’Jg рассматривать как управление, а q - Х(2) субвектор вектора состояния, то мгновенная мощность выразится формулой и(1) (0*(2) (0 ’ а Работа за время Тбудет равна: J«(I1)(0)*(2)(6)<®. (6.1.37) т Эго частный вид более общего выражения /0(х(е),и(е))Л. (6.1.38) т Пусть рассматривается простейший (скаляр- ный) случай перемещения и успокоения оди- ночной свободной массы m на расстояние qm за минимальное время Тп при ограниченном ускорении (силе). Оптимальным в смысле минимума Тп является разгон с постоянным ускорением в течение времени 0,5 Тп и тормо- жение с постоянным ускорением в течение второй половины интервала Тп (рис. 6.1.3). Максимальная необходимая реактивная мощ- ность при этом имеет место в середине интер- вала и составляет (6.1.39) * п Зависимость мощности Рт от Тп при указанных различных значениях m и qm пока- зана на рис. 6.1.4. Она распространяется на вращательное движение, при котором m заме- няется на момент инерции, a qm - на угол поворота, и на процесс пропускания количест- ва электричества qm через индуктивность m за время Тп. Графики (см. рис. 6.1.4) показывают, на- сколько прочен "энергетический барьер" на пути убыстрения процессов управления в реальных системах. Так, если для перемеще- ния массы 1 кг на расстояние 0,1 м за вре- мя 0,01 с требуется максимальная мощность Рт = 80 кВт, то при qm = 1 м, Тп = 0,001 с для перемещения той же массы потребуется Рт = 8-106 кВт. Энергетические ограничения обязательно должны учитываться при оптимизации боль- шинства САУ. Они имеют важное значение при интегрированном проектировании самих объектов управления, машин и механизмов. Для машин с многими степенями свободы (см., например, рис. 6.1.1),.предназначенных для выполнения сложных движений, опера- ций, энергетически выгодно совершить все частные движения не последовательно, а па- раллельно, одновременно (как у высокоразви- тых животных). При этом, конечно, усложня- ются алгоритмы управления, но при заданном общем времени выполнения сложного движе- ния сильно сокращаются необходимые мощ- ности приводов всех степеней свободы. Пусть имеется линейная механическая система с несколькими степенями свободы, кинетическая, потенциальная энергии которой и диссипативная функция следующие: Т = О,5^т/И0; U = 0£qTcq; F = 0,5qTrq, (6.1.40) где m, с, г - симметричные матрицы масс, жесткостей и коэффициентов вязкого трения. Рас. 6.1.3. График разгона торможения с постоянными ускорениями
448 Глава 6.1. ПОНЯТИЕ ОПТИМАЛЬНОСТИ. КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ Для каждой степени свободы одновре- менно осуществляется процесс типа, показан- ного на рис. 6.1.3. Тогда максимальная сум- марная мощность в процессе перевода систе- мы в новое состояние выразится формулой J’m = «Г, 39mWm + ^‘Зт'Чт + Л'<1т<Чт При произвольном движении данной системы суммарная мгновенная мощность, развиваемая обобщенными силами, р = 0’54(«1я’4')+?1'1? + at' * at \ ! Противоположность знаков первого и третьего членов правой части последнего выражения используется в резонансных манипуляторах, цикловых машинах [4]. Итак, энергетические затраты помимо функционалов вида (6.1.3?) могут описываться функционалами вида J ОэМедл», (6.1.41) Т. где Q3(x) - заданная, как правило, неотрица- тельная скалярная функция вектора состояния. Часто как энергетические затраты, так и "расход управления", т.е. интенсивность управляющих воздействий в процессе управ- ления, удается описать функционалами типа J 173[и(0),0]Л, (6.1.42) Т где U3(u$) - заданная скалярная функция вектора управления и времени. Общие критерии оптимальности, класси- ческие целевые функционалы. Критерии, учи- тывающие (объединяющие) совокупность ча- стных показателей, включающих затраты на управление, именуются общими критериями или функционалами качества управления. Множество частных показателей рассматри- ваемых изолированно, нередко называют век- торным критерием. Образование общего ска- лярного критерия из векторного всегда связа- но с решением некоторой задачи компромис- са. Для этого требуется участие интеллектуаль- ной системы старшего уровня, в частности, проектировщика-конструктора (интерактив- ный режим САПР) [44]. Соответствующая технология будет пояснена ниже. Как для за- дач параметрической оптимизации (6.1.14), (6.1.21), так и задач синтеза оптимальных управлений (6.1.15), (6.1.22) общий классиче- ский целевой функционал может быть пред- ставлен в виде функционала Больца h I = v3M‘2)]+fЦх(0),«(0),0|л>. <6.i.43> '1 Этот функционал может использоваться для оптимизации как стабилизации и слежения, так и терминального управления и выполне- ния этапа операции и операции в целом. Здесь У3 - заданная скалярная функция конечного состояния (терминальный член), L - заданная скалярная функция текущих значений векто- ров состояния и управления, а также времени.
ЧАСТНЫЕ, ОБЩИЕ И ГЛОБАЛЬНЫЕ КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ 449 В выражении (6.1.43) в явном виде не фигурируют векторы (или матрицы) парамет- ров функционала. С введением этих парамет- ров, а также конечного момента времени * h функционал принимает вид t2 I = Иэ[х(/1С)>р] + |£[х(0),и(0)>0>р,*кй. *1 (6.1.44) Смысл матриц параметров р, 0, к интерпрети- руется ниже. Выражения (6.1.43), (6.1.44) яв- ляются весьма общими формами классических функционалов для непрерывных управляемых процессов. Эти формы используются при па- раметрической оптимизации. Синтез опти- мальных управлений многомерными нелиней- ными системами на основе минимизации классических функционалов типа (6.1.43), (6.1.44) достаточно трудоемок (см. гл. 6.3). Поэтому обычно используют частные формы указанных функционалов, для которых реше- ние задачи синтеза несколько упрощается. Классический функцио- нал с аддитивной функци- ей затрат на управление. Так именуется функционал вида [46] h / = И3[х(/2)] + |оз[х(9),0]Л + '1 h + |(Ци(0),0]Л, (61.45) где И3, <23, U3 - заданные, обычно положи- тельные функции. Задача с функционалом общего вида (6.1.43) может быть приведена к задаче с функционалом (6.1.45) путем расширения пространства состояний. Для этого управление и в (6.1.43) полагают субвектором вектора состояния, а производную по времени й этого субвектора - новым управлением. Другой путь заключается в переходе от модели собст- венно объекта управления к модели обобщен- ного объекта. При этом также расширяется пространство состояний, и мощность или уро- вень входных сигналов (управления) удается описать аддитивной по отношению к Q3 функцией. Классический функцио- нал с аддитивной квадра- тичной функцией затрат на управление. Так именуется функционал вида 7 = K3[x(/2)) + |o3[x(0),0|d0 + *1 г2 + 0,5 J ит(в)к~1и(в)^, *1 (6.1.46) где к - заданная невырожденная матрица, ко- торая в общем случае может быть функцией времени 0 и функцией вектора состояния х(0). Все функции в классическом квадратич- ном функционале (функционале Летова- Калмана) представляют собой квадратичные формы: г2 I = 0,5хт (t2)px(t2) + О»5/ *T(0)P*(0)d9 + '1 г2 + 0,5 J i/T(9)£-1i/(0)d9. '1 (6.1.47) Дискретные аналоги перечисленных здесь целевых функционалов см. [37, 47]. Неклассяческне целевые функцвоиалы. Функционал обобщенной работы. Неклассиче- ским или полуопределенным функционалом [31] в задачах синтеза оптимального управле- ния (задачах типа (6.1.15), (6.1.22)) именуется функционал вида I = / Дх(0),и(0),«оп(0)]Л, *1 (6.1.48) где моп - неизвестное до решения задачи син- теза оптимальное управление, доставляющее минимум функционалу I на решениях уравне- ния управляемого объекта. В случае (6.1.15) этим уравнением является X — f(x,u). (6.1.49) Особенность здесь заключается в том, что ва- риации 8м влияют на / как непосредственно, так и через вызванные ими вариации 8х реше- ния уравнения (6.1.49), а вариации 8моп влия- ют на Z только непосредственно. Это при оп- ределенных свойствах функции L резко упро- щает решение задачи синтеза оптимальных управлений. Общая форма функцио- нала обобщенной работы. Относительно общей из известных форм 15 Зак 1023
450 Глава 6.1. ПОНЯТИЕ ОПТИМАЛЬНОСТИ. КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ функционала обобщенной работы (ФОР) явля- ется форма [30, 31]: А 1 = И3[х(/2)] + /оз[х(0),0]<Я + + jty»(0),0]d9 + jffX,(0),0]Л, (6.1.50) 6 *1 где функции U3t U3 такие, что функция ^з(«,0) + ^з(«оп>0)- т^-^э[«оп>0] и 2 0 (6.1.51) является положительно определенной относи- тельно и, принимающей минимальное значе- ние при и = иоп. Таким образом, ФОР (6.1.50) - это не- классический функционал с аддитивными затратами как на синтезируемое управление и, так и управление в оптимальной системе моп. Что касается названия "функционал обобщен- ной работы", то оно возникло на основе пер- вых публикаций (библиографию по примене- нию ФОР см. в [26, 30]), ще в это название вкладывался определенный физический смысл. Впрочем, он сохранился и в форме (6.1.50), так как добавление в классический функцио- нал (6.1.45) члена и3 [иоп (0),0]d9 можно рассматривать как обобщение выражения воз- можных энергетических затрат на управление. ФОР с аддитивными степен- ными функциями затрат на управление. Данный ФОР имеет вид А / = ^(/2)]+/ез[х(0),е]л+ (6.1.52) где Pjt qj - действительные положительные числа, такие, что pj1 + qjl = 1; - четная функция Ufy kf> 0. Легко проверить, что условие (6.1.51) здесь выполняется, причем левая часть обра- щается в нуль при и = Коп* ФОР с квадратичными ф.у нкциями затрат на управление. При pj = qj = 2 функцио- нал (6.1.52) принимает вид /=И3[х(12)1 + |б3[х(0),0]Л + *1 г2 = Г3[х(/2)] + |(2з[х(0),0]Л0 + *1 г2 + 0,5 f [ит ф)к~1 «(0) + < (0)*-1«/оп (0)]dO, '1 (6.1.53) где к = diag^ ...кг). Это наиболее распространенная в практиче- ских приложениях форма ФОР. Квадратичный ФОР. Если все функции квадратичные: А I = 0^х(/2)рх(/2) + 0»5J хт(0)[3х(0)40 + 'i + 0.51 [и W’«(0) + «от (в)}«> *1 (6.1.54) то ФОР называют квадратичным. Дискретные аналоги ФОР приведены в [37]. Общие критерии оптимальности в стохас- тических системах. Стохастичность привносит- ся в процессы управления шумами датчиков, случайными возмущающими воздействиями, создаваемыми окружающей средой, и другими факторами. При решении стохастических задач оптимизации САУ используют матема- тические ожидания функционалов, применяе- мых в детерминированных оптимизационных задачах. Безусловные математи- ческие ожидания функцио- налов. Пусть для непрерывной динамиче- ской системы существует безусловное распре- деление вероятностей с плотностью р(х, I/, I). Тогда безусловное математическое ожидание функционала (6.1.43) можно записать в виде
ЧАСТНЫЕ, ОБЩИЕ И ГЛОБАЛЬНЫЕ КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ 451 J - M[Z] = J 7(х, и)р(х, и, t)dxdu - -со h И3[х(/2)] + | Дх(0),ц(0),0И0 А (6.1.55) Постановка соответствующей задачи оптими- зации достаточно прозрачна в математическом отношении. Это оптимизация в целом, когда одновременно оптимизируется обработка ин- формации (фильтрация), алгоритмы управле- ния. Однако осуществить решение подобной задачи для многомерной нелинейной стохас- тической системы необычайно трудно. Так, в теории дуального управления А. А. Фельдбау- ма, несмотря на значительное число попыток, точные решения, да и просто конструктивные результаты, удалось получить лишь для про- стейших модельных примеров. Кроме того, в самой постановке задачи есть слабое звено. На практике часто не может быть "ансамбля реа- лизаций" и усреднение по подобному ансамб- лю является искусственным приемом. Далее, управление всегда сопровождается измерением (наблюдением) текущего состояния управляе- мого процесса. Игнорирование соответствую- щей информации при построении минимизи- руемого функционала неоправданно. Запишем, однако, функционал с безус- ловным математическим ожиданием для вари- анта ФОР (6.1.50) h /=MU1 = М[ W2)l]+М J Озк(б),0]л + и + М p3[i/(0>,0]d9 ^Хп(0),0И) (6.1.56) Все остальные варианты критериев с безуслов- ными математическими ожиданиями (МО) получаются из рассмотренных критериев для детерминированных задач очевидным образом. Условные МО функцио- налов. Пусть р(х, щ t | z) - условная (апостериорная) плотность вероятности при наблюдении величины z — h(x) + r|(/) (h - известная функция вектора состояния; т](/) - шум наблюдения) в течение рассматриваемого интервала времени. Вместо функционала (6.1.55) рассматривается условный целевой функционал 00 Jy =Му[/]= JI(x9u)p(x9u9t \z)dxdu = -со = м, h к3[х(г2)]+|дх<0),И(е),е)л 6 (6.1.57) Аналогично условный функционал обобщен- ной работы имеет вид Jy = МДИэ[х(/2)]] + М> +м, h Jt/3(«(0),0]dB /1 h |С3[Х(0),0]Л .'1 h Jt/3'l«on(0),0k« /I (6.1.58) Здесь - символ условного математиче- ского ожидания; U39 U3 удовлетворяют усло- вию (6.1.51). Для ансамбля реализаций х(/), u(f) вели- чины (6.1.57), (6.1.58) являются случайными. Это не мешает решать задачу оптимизации каждой конкретной реализации путем мини- мизации данных функционалов. Самым глав- ным преимуществом такого подхода является точное или приближенное соблюдение прин- ципа разделения (см. гл. 6.5), существенно облегчающего решение задач синтеза стохасти- ческих систем. Однокритернальная и многокритериальная оптимизация, выбор весовых коэффициентов функционалов. Многокритериальная оптими- зация САУ обычно осуществляется посредст- вом образования одного общего критерия из множества исходных частных критериев. Этот процесс допускает лишь частичную формали- зацию и выполняется, как правило, в интерак- тивном режиме. Предварительный выбор коэффициентов целевого функционала. Функция И3|х(У, р] в функционалах (6.1.44), (6.1.48) "отвечает" за выход в заданную точку пространства состоя- ний в заданный момент времени. Приращение этой функции, вычисленное в точке х(/к), с точностью то малых второго порядка относи- тельно Дх = [Axi ... ДХп]т будет ДИэ=[-^-И3[х(/1С))р]К = W*Vk) / л = У*, /=1
452 Глава 6.1. ПОНЯТИЕ ОПТИМАЛЬНОСТИ. КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ Потребуем, чтобы все составляющие этого приращения при максимальных допустимых приращениях координат |Д*/|т = Д*ж/ были одинаковы по абсолютной величине: 1^3X1 l^ml = 1^3X2 |^m2 =•••= |^зхя|^/ял- (6.1.59) Эти соотношения часто именуются условиями равных вкладов максимальных отклонений. Они могут использоваться для предваритель- ного выбора элементов матрицы р, в частно- сти, при ее диагональной форме р = diagfp! ...ря]. Если V3 является квадратичной, как в (6.1.47), (6.1.54), и р - диагональной, то выра- жения (6.1.59) преобразуются к виду А*ж1 _ Д*ж2 _ _ Pl Р2 Рл (6.1.60) При заданных максимальных отклонениях они определяют параметры pj, Р2, ..., ря с точно- стью до общего множителя. Данный способ предварительного выбора значений коэффициентов может быть распро- странен с небольшими изменениями и на по- дынтегральные функции функционалов (6.1.44), (6.1.45). Интерактивная оптими- зация коэффициентов. Практи- ка показывает, что в большинстве случаев ап- риорное задание коэффициентов целевого функционала способно в лучшем случае играть роль лишь первого приближения. После синтеза системы необходима про- верка достигнутого качества и, как правило, коррекция коэффициентов общего функцио- нала [44]. Понятие глобальных крите- риев оптимальности САУ. Объеди- нение таких показателей, как качество, точ- ность процессов управления, безопасность, экономическая эффективность САУ, в единые глобальные критерии представляет сложную, но актуальную проблему. Глобальный крите- рий должен выражать решение комплексной задачи, вероятность достижения конечной цели и получения планируемого эффекта. Повышение качества управления, как правило, связано с усложнением алгоритмиче- ского и программного обеспечения компью- терных средств, входящих в состав САУ. Но усложнение программного обеспечения увели- чивает вероятность скрытых ошибок в этом обеспечении. Эти ошибки в определенных условиях могут приводить к нештатным и аварийным ситуациям. Здесь также необходи- мы оптимальные компромиссные решения. Выбор варианта ФОР в части затрат на управление. Рассмотрим ФОР с аддитивными степенными функциями затрат на управление (6.1.52). Его "неглавную" часть представим в виде (6.1.61) где kj(x) - заданные положительно- определенные функции х; pjy qj - заданные действительные положительные числа, такие, —1 —1 Qi что Pj +4j = 1; иj - четная функция Uj. Выражение (6.1.61) отличается от соответ- ствующего члена в (6.1.52) только тем, что величины к) считаются функциями вектора состояния. Выбор показателей степени qj (не путать с обозначениями обобщенных координат) в функционале (6.1.61) можно осуществлять на основе желаемой формы характеристик нели- нейных звеньев в синтезируемых контурах управления. Действительно, каждый член вида UjJ в функционале (6.1.61) соответствует по- явлению в соответствующем канале оптималь- ного контура управления безынерционного выходного звена вида 1 -4? [*y(x)v)]«j-l = , (6.1.62) где vу = kj(x)N'j - "входная величина" звена. В табл. 6.1.1 приведены графики UjJ , 1 v j при различных значениях qj. При воз- растании qj от « 1 до оо функция UjJ в целе- вом функционале меняется от ~|м/| Д° "прямоугольной щели", а характеристика 1 «;-1 v j - от нечетной прямоугольной с зоной нечувствительности до релейной.
ЧАСТНЫЕ, ОБЩИЕ И ГЛОБАЛЬНЫЕ КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ 453
454 Глава 6.1. ПОНЯТИЕ ОПТИМАЛЬНОСТИ. КРИТЕРИИ ОПТИМАЛЬНОСТИ САУ Рас. 6.13. Схема электрогадрашпнеского всаолввтеямоге устройства Пользуясь подобной таблицей, можно подобрать походящие значения показателей qj. Пусть, например, органы управления какого- либо объекта перемещаются посредством трех- каскадных элекгрогидравлических приводов (рис. 6.1.5). Входным каскадом здесь служит элеюромеханический преобразователь элек- трического напряжения в перемещение за- слонки Уз- Второй каскад составляет гидравли- ческое устройство, выполненное по балансной (мостиковой) схеме с парой управляющих элементов типа сопло-заслонка. Выходной величиной этого каскада служит перемещение золотника У5- Третий (выходной) каскад обра- зует силовой пщроцилицдр с гидрораспреде- лителем. Перемещение штока этого гцдроци- лиццра обозначено yj (см. рис. 6.1.5). Второй каскад имеет статическую харак- теристику, представленную в табл. 6.1.1 для l/у7 и qj = 4. Поэтому, приняв за управление перемещение заслонки и задав qj = 4, получим в синтезированном оптимальном управлении звено с указанной статической характеристи- кой. При больших (например, qj = 10 и выше) штрафная функция, накладываемая на управление, является жесткой, а получаемое оптимальное управление приближается к иде- альному релейному (см. табл. 6.1.1, qj - 10). Таким образом, подбирая показатели степени qj в ФОР, можно получать в оптимальных управлениях звенья с характеристиками, ана- логичными характеристикам существующих реальных аппаратных средств. Однако возможности такого подхода ог- раничены, по крайней мере, в рамках степен- ной формы затрат на управление (6.1.10). Существует другой подход, базирующий- ся на понятиях обобщенного объекта и расши- рения пространства состояний [44]. Он заклю- чается в следующем. За управления принима- ются производные по времени входных вели- чин некоторого обобщенного управляемого объекта, включающего как собственно объект управления, так и исполнительные устройства, датчики и другие взаимосвязанные части сис- темы, принимаемые неизменными при реше- нии данной задачи синтеза оптимальных управлений. Пример. Рассмотрим схему электрогид- равлического исполнительного устройства (см. рис. 6.1.5). Скорость изменения входного на- пряжения обозначим через и\. Тоща при дос- таточно общих предположениях исполнитель- ный привод может быть описан следующей системой дифференциальных уравнений: У1 = «1; (6.1.63) У2 = а11У2 +ЛО'3>)'4); (61-64) УЗ =У41 (6.1.65) >4 =/40'2>3'5>3'4>)'б); (6.1.66) у5=у6; (6.1.67) Уб =/б(Уз< УбУ’ (6.1.68) >7 =>'8» (6.1.69) У8 =ЛО'5>3'8)- (6.1.70) Здесь уравнение (6.1.64) соответствует току У2 в обмотке электромеханического преобразова- теля; ^(Уз, Уа) ~ противоЭДС, возникающая в этой обмотке, и зависящая от скорости движе- ния якоря (заслонки) У4 и его положения у$. Уравнение (6.1.66) описывает движение гидро- распределителя. Ускорение пщрораспредели- теля у 4 = fa = Д зависит от тока в обмотке У2з отклонения гидрораспределителя у$ (за счет пружины и тяговой характеристики преобразователя), скорости отклонения за- слонки У4, скорости движения гидрораспреде- лителя у$. Ускорение пщрораспределителя У5 = Уб ~ /б согласно уравнению (6.1.68) является функцией положения заслонки Уз и скорости движения пщрораспределителя у$.
АЛГОРИТМЫ ПОИСКА ЭКСТРЕМУМОВ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ 455 Ускорение поршня силового цилиндра У1 = У8 = Л в соответствии с (6.1.70) зависит от координаты гидрораспределителя у$ и ско- рости движения поршня. Влияние нагрузки на шток силового цилиндра здесь не учитывается. Уравнения типа (6.1.63) - (6.1.70) вместе с уравнениями исполнительных устройств других каналов добавляются к математической модели собственно управляемого объекта. При этом естественным образом учитываются многочисленные характеристики и ограниче- ния, присущие реальным аппаратным средст- вам. Между тем здесь синтезируемые управле- ния входят линейно в уравнения обобщенного объекта, что значительно упрощает решение задачи оптимизации. В то же время увеличи- вается размерность математической модели, что, естественно, вызывает опасения в отно- шении необходимых вычислительных затрат и устойчивости численных решений. Однако дополнительные математические модели, вво- димые в обобщенный объект, при разумной степени идеализации являются обычно сильно разреженными (немногосвязными). Эго суще- ственно ограничивает необходимую дополни- тельную вычислительную производительность даже при моделировании в режиме реального и ускоренного времени. Этим же можно объяснить эмпирически обнаруженную высокую численную устойчи- вость оптимизации на основе ФОР и прогно- зирующих моделей обобщенных объектов. 4. Другие особенности организации дви- жения к точке экстремума. Задачу глобального поиска экстремума многомодальной функции двух переменных (а € R2) отражает рис. 6.2.1. При параметри- ческой оптимизации САУ область поиска в пространстве параметров может соответство- вать области устойчивости или ее части, опре- деляемой дополнительными ограничениями. Глобальный поиск предназначен для определения всех экстремумов функции в пре- делах заданной области в пространстве аргументов, в том числе главного экстремума min min I (или max max 2). На рис. 6.2.1 функция Ца^аг) отображается линиями равного уровня I = const, точка главного экс- тремума обозначена через а. Каждый экстремум имеет область притя- жения в пространстве аргументов, в пределах которой функция I является выпуклой (или аппроксимируется с достаточной точностью выпуклой функцией). Для главного экстрему- ма а и неглавных экстремумов б, в области притяжения обозначены штриховкой (см. рис. 6.2.1). Чем меньше область притяжения экстремума (в том числе и главного), тем труднее его обнаружить в глобальном поиске. Глава 6.2 МЕТОДЫ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА 6.2.1. АЛГОРИТМЫ ПОИСКА ЭКСТРЕМУМОВ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ Классификация алгоритмов поиска экс- тремумов. Алгоритмы поиска экстремума (АПЭ) функции одной или многих аргументов можно классифицировать по различным при- знакам. К таким классификационным признакам относят: 1. Тип решаемой задачи (локальный, глобальный, одноэкстремальный, многоэкс- тремальный поиски). 2. Вид перемещения в параметрическом пространстве R*0 (непрерывный, дискретный, упорядоченный, случайный, смешанный). 3. Информация о минимизируемой функции 1(d), используемая на каждом шаге или элементе непрерывного движения в про- странстве R^. Рве. 6.2.1. Иллюстрация задача пояска главного экстремума
456 Глава 6.2. МЕТОДЫ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА Самым универсальным, но и трудоемким методом глобального поиска является простой перебор. В этом случае значения функции I определяются в узлах достаточно плотной сет- ки в пространстве аргументов (см. рис. 6.2.1) и выбираются минимальные из этих значений. Если объем области поиска в пространстве аргументов обозначить Ga, а шаги сетки - Aj, Д2, ..., (предполагается, что а е Яп<г ), то общее число узлов (и соответственно шагов простого перебора) будет приблизительно Nz =--- Д1Д2...Д( (6.2.1) При па, составляющем последние едини- цы и тем более первые десятки, поиск мето- дом простого перебора при относительно плотной сетке становится в общем случае не- осуществимым вследствие чрезмерно большого Случайный глобальный поиск (метод статистических испытаний, метод Монте- Карло) сводится к генерации случайных зна- чений координат точки а в заданной парамет- рической области с равномерным законом распределения вероятностей и определению значений 1(a). Если задана вероятность р по- падания в ячейку объемом Ai, Д2, ..., АЛд; содержащую точку глобального экстремума, то необходимое число испытаний выражается формулой Ig(l-P) Is(l-e) ’ (6.2.2) те s = (см. формулу (6.2.1)). При малых 8 и не слишком высокой заданной вероятно- сти р величина N имеет тот же порядок, что и № Еще одним методом глобального поиска может служить покоординатный (покомпо- нентный) поиск. Он заключается в следую- щем. Назначается точка начала поиска в пара- метрическом пространстве (точка Н на рис. 6.2.1) и выполняется одномерный поиск экстремума вдоль направления, параллельного одной из координатных осей, например, оси (точки четырех экстремумов на этом на- правлении обозначены на рис. 6.2.1). Через каждую точку экстремума на данной прямой проводится прямая, параллельная другой оси, например, а2 (для двумерного случая именно 02). В вычислительном процессе "проведение" указанной прямой означает изменение одного параметра при неизменных значениях осталь- ных. Проводится одномерный поиск вдоль каждой из указанных прямых (штриховые вертикальные прямые). Определяются точки одномерных (условных) экстремумов на этих прямых. Подобный процесс продолжается до охвата всех измерений (па > 2) и далее - до получения достаточно устойчивого (достаточно стабильного) положения условных стационар- ных точек в пространстве параметров. Дости- жение глобального экстремума при конечном числе попыток не гарантируется. Трудоемкость метода зависит прежде всего от па и топологии функции I. Для тон- коструктурных многоэкстремальных многоар- гументных функций она может быть чрезмер- но высокой. Для снижения трудоемкости решения за- дач глобального поиска применяют различные приемы и прежде всего сочетание перебора с локальным поиском экстремума. Многие методы локального поиска стро- ят на численном определении градиента функ- ции 1(a): 4- 1(a) = grad 1(a) = VI(a) = - •••а • оа^ 002 ^апа Градиент - локальная характеристика гиперпо- верхности 1(a), выражающая ее наклон. Кри- визну гиперповерхности характеризует матри- ца вторых производных (матрица Гессе) а2 о 1(a) = v2/(a) = да да1 д21 д21 д21 да2 datda2 да^а^ д21 д21 д21 да1да2 да2 Sa2da„t д21 д21 д21 да^да^ да2даПа да^ (6.2.4) Применение градиента и тем более мат- рицы Гессе требует соответствующей степени гладкости функции 1(a). Однако на практике используют разностные схемы величин (6.2.3), (6.2.4), менее критичные к локальным особен- ностям функции 7, чем сами эти величины. На основе использования градиента или его дискретных аналогов в сочетании с други-
АЛГОРИТМЫ ПОИСКА ЭКСТРЕМУМОВ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ 457 ми схемами поиска экстремума построено большое число алгоритмов, которые часто называют градиентными. Самым простым непрерывным градиент- ным алгоритмом является д’* т, ч да (6.2.5) где — 7 - матрица-столбец частных произ- да wijwwi - транспонированный вектор градиен- та; у - постоянный коэффициент или (в более сложном случае) квадратная матрица коэффи- циентов. На рис. 6.2.1 траектории простейшего градиентного поиска (6.2.5) в области притя- жения главного экстремума обозначены циф- рой 1. Они перпендикулярны линиям (в об- щем случае - поверхностям) равного уровня 1(a) = const. К градиентным часто относят и алгоритм Ньютона, непрерывная форма которого имеет вид д21 а ---------- да да* (6.2.6) Алгоритм Ньютона получается из алгоритма (6.2.5) заменой у на обращенную матрицу Гес- се (6.2.4). К градиентным алгоритмам можно отнести и алгоритм "тяжелого шарика" [37], который в непрерывной форме имеет вид I a + dd = -y——, (6.2.7) да где d - положительная скалярная величина; у имеет тот же смысл, что и в (6.2.5). Метод наискорейшего спуска также ос- нован на использовании информации о гради- енте, но его логичнее отнести к комбиниро- ванным или смешанным методам (см. второй из перечисленных выше классификационных признаков). Он заключается в следующем. Определя- ется вектор градиента в исходной точке поис- ка. Вдоль этого вектора (для поиска минимума в обратном направлении) ищется условный экстремум. В точке этого условного экстрему- ма вновь определяется вектор градиента, и операция повторяется. Траектории наиско- рейшего спуска представляют собой ломаные. На рис. 6.2.1 они обозначены цифрой 2. При решении даже локальных задач по- иска экстремума, особенно при большом чис- ле аргументов ла, возникают трудности, свя- занные с вычислительными затратами, неглад- костью минимизируемой функции, наличием у нее особенности типа "узкий овраг" и др. Широкое применение находит метод сопря- женных градиентов, при котором на каждом шаге используется информация о градиенте не только в данной точке, но и в предшествую- щей (предшествующих) точках поиска. Трудности численного определения про- изводных, а также* необходимость выполнения поиска при наличии сложных особенностей минимизируемой функции привели к разра- ботке целого ряда неградиентных или прямых алгоритмов детерминированного и случайного локального поиска. К детерминированным неградиентным методам локального поиска экстремума можно отнести методы конфигу- раций Хука-Дживса и Розенброка, симплекс- метод, метод Неддера-Мида [42, 47]. Во всех этих алгоритмах осуществляется прямое срав- нение значений минимизируемой функции в некотором множестве точек, назначаемых в определенном порядке в параметрическом пространстве, после чего делается следующий шаг. Вполне четкой границы между числен- ными градиентными и неградиентными мето- дами нет, для приближенного определения компонент градиента можно использовать различные разностные схемы. Тем не менее прямые (неградиентные) методы отличает большая универсальность (сохранение работо- способности при сложных особенностях одно- модальной минимизируемой функции), про- стота, но меньшая (в сравнении с градиент- ными) эффективность при "плавной" миними- зируемой функции. Широкое применение получили негради- ентные методы локального случайного поиска [16, 40]. Некоторые программы поиска экстремума. Для каждого вида целевой функции, каждого класса ее топологии, существует наилучший алгоритм поиска экстремума. Однако при практическом решении большинства сажных оптимизационных задач эта топология априо- ри неизвестна. В этом случае используются адаптивные методы поиска экстремума, обес- печивающие накопление информации о целе- вой функции в процессе самого поиска и ее рациональное использование в этом процессе. К таким методам относят "Метод непря- мой статистической оптимизации на основе самоорганизации" (МНСО) И. Н. Егорова. Алгоритм МНСО в целом можно отнести к эври- стическим, допускающим целый рад версий. Характерные особенности МНСО: аппроксимация целевой функции на ка- ждом шаге поиска экстремума более простой функцией; поиск экстремума аппроксимирующей функции; учет полученной на предыдущих шагах информации о топологии целевой функции;
458 Глава 6.2. МЕТОДЫ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА определение области вероятного распо- ложения экстремума и изменение ее размеров в процессе поиска. МНСО имеет преимущества при сложной топологии целевых функций (рис. 6.2.2, 6.2.3). На рис. 6.2.2, а изображены линии рав- ного уровня сечений целевой функции с четы- рехмерным аргументом (jq, *2» х3> *4)- Целе- вая функция является здесь одномодальной, гладкой и имеет простую топологию. а) 6) Рис. 6.2.2. Линии равного уровня целевой функции: а - без особенностей; б - с узким "оврагом" а) Рис. 6.23. Кривые процессов дм целевых функций: а - без особенностей; б - с узким "оврагом". Кривые соответствуют: 1 - методу Хука-Дживса; 2 - покоординатному спуску; 3 - методу Роэенброка; 4 - квазиныотоновскому методу; 5 - варианту метода случайного поиска; 6 - МНСО
АЛГОРИТМЫ ПОИСКА ЭКСТРЕМУМОВ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ 459 Характер процессов поиска экстремума этой целевой функции при различных методах поиска показан на рис. 6.2.3, а. По оси абс- цисс здесь отложено число шагов с начала поиска, по оси ординат - значение целевой функции в текущей точке поиска (в логариф- мическом масштабе). Метод Ньютона в отношении минимума числа шагов является наилучшим, и МНСО существенно уступает ему в этом отношении. На рис. 6.2.2, б представлен "портрет" целевой функции с более сложной топологией (наличие узкого оврага относительно коорди- нат X}, Х2)> На рис. 6.2.3, б представлен харак- тер процессов поиска экстремума этой целевой фикции посредством МНСО (пунктирная кри- вая 6), метода Хука-Дживса (кривая 1), поко- ординатного спуска (кривая 2), квазиньюто- новского метода (кривая 4). МНСО имеет здесь преимущество перед другими указанны- ми методами, по крайней мере, до относи- тельной глубины экстремума 10’2. Некоторые зарубежные программы для отыскания экстре- мумов функций многих аргументов, состав- ленные на языке ФОРТРАН, приведены в табл. 6.2.1. Локальные алгоритмы в многоэкстремаль- ных задачах. Селекгнвно-усредннтельный алго- ритм поиска экстремума. Локальные алгорит- мы, работоспособные в областях притяжения экстремумов, сами по себе не могут обеспе- чить решение задачи глобального поиска. Это подтверждает стохастическое рассмотрение процессов поиска экстремума, основанное на уравнении Фоккера-Планка-Колмогорова (ФПК-уравнении) [27]. При этом начальные условия в области поиска х е G практически всегда произвольны и могут рассматриваться как случайные с некоторым начальным рас- пределением плотности вероятности Ро(х, to) (Iq - начальный момент времени). 6.2.1. Зарубежные ФОРТРАН-программы поиска экстремумов многих переменных Наименование программы Используемый метод Некоторые особенности ADRANS Локальный случайный поиск, затем - метод конфигураций - CLIMB Розенброка Штрафная функция DAVID Ньютона Касательные заменяются се- кущими DFMCG Сопряженных градиентов Штрафную функцию вводит пользователь DFMFP Ньютона FMINO Хука-Дживса GRAD 4 Наискорейшего спуска GRID 4 Поиск на прямоугольной и звездообразной сетках MEMCRD Развитие метода Ньютона Шаг выбирается по результату предыдущего шага NMSERS Нелдера-Мида Штрафную функцию вводит пользователь PATSH Модифицированный метод Хука-Дживса Переменный шаг RANDOM Случайный поиск с сокращени- ем области Содержит штрафную функцию SEEK 1 Хука-Дживса, затем - случай- ный поиск - SEEK3 Хука-Дживса SIMPLX Симплекс-метод
460 Глава 6.2. МЕТОДЫ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА Алгоритмы локального поиска приведе- ны в табл. 6.2.2. Ни один из указанных мето- дов поиска сам по себе не дает решения мно- гоэксгремальных задач. Так, при методе 1 плотность вероятности нарастает во всех ста- ционарных точках, где сумма диагональных элементов матрицы Гессе положительна. Малые, но острые экстремумы - минимумы практически при любом начальном распреде- лении - будут вызывать такие же или даже большие концентрации вероятности, как и глубокие, но пологие экстремумы. Полное "равноправие" экстремумов-минимумов имеет место при методах 2 и 3. Поэтому при этих методах глобальный поиск будет "застревать" на мелких, но острых минимумах целевой функции. Подобные же ситуации имеют место для других локальных методов. 6.2.2. Алгоритмы поиска и выражения для производной по времени логарифмической плотности вероятности № метода Алгоритм Формула Производная по времени 1 Простой градиентный у - скалярная постоянная ( д In /Л 1«J.”» ~ a2r дхдх7 Jc 2 Ньютона • = Гд2у х~ [асах1] 8х 3 Тяжелого шарика y + dy = -y^-V(y), оу d,y - скалярные постоянные д в стационарной точке у = 0 4 Безынерционного броуновского движе- ния * = -Т^- + 5(0 ( д In /Л 1 » J.-'T. дхдх d2V ' axax’j -c + 5 Инерционного бро- уновского движения y+dy = -y^-V(y) + E,(t) оу = (/я + дхдх L. _1С 6 Дискретно- непрерыв- ный вдоль прямоли- нейных направлений xw = ^wjv_ у - скаляр, eW - вектор на- правляющих косинусов (а1прУ*’_ (а^У*’ I ar Jc "4a?Jc Принятые обозначе н*и я : И(х), Vty) - целевые функции; £(1) - процесс типа векторного гауссовского белого шума с матрицей интенсивностей Q; п - размерность вектора аргументов.
АЛГОРИТМЫ ПОИСКА ЭКСТРЕМУМОВ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ 461 Решение многоэкстремальных задач обычно осуществляется путем комбинирован- ного поиска: глобального и локального, при- чем подбор комбинации методов выполняется эвристически или эмпирически. Стохастиче- ское рассмотрение позволяет в определенной степени формализовать синтез алгоритмов решения многоэкстремальных задач. Результа- том такого подхода является селекгивно- усреднительный алгоритм [27]. Селекция главного экс- тремума. Неотрицательная целевая функ- ция V(x) считается произвольной в рамках следующих слабых ограничений: 1. Функция V(x) существует в замкнутой области пространства аргументов с объемом G. 2. Функция V(x) кусочно-дифференци- руема в этой области. 3. Целевая функция имеет главный гло- бальный экстремум (минимум), отличающийся от всех других ее экстремумов наибольшей величиной (глубиной). 4. Существует второй по величине экс- тремум целевой функции V(x). Сечение глав- ного экстремума на уровне второго экстремума имеет объем G$< G, именуемый базовым. Многоэкстремальная целевая функция для одномерного случая показана на рис. 6.2.4, а. Главный экстремум здесь близок к нулю, но не равен нулю. Объемы G, (% в данном случае вырождаются в длины соответ- ствующих отрезков. Селекция главного экстремума сводится к его выделению посредством функциональ- ного преобразования Т = Т[К(х)]. При этом "выделяется" и базовая область главного экс- тремума. В качестве селектирующей функции мо- гут, в частности, применяться: степенная *1 = [V(x)rN, (6.2.8) ще TV - достаточно большой положительный показатель степени; показательная Т2 = (6.2.9) где Vq - уровень второго по глубине ми- нимума; показательно-степенная Т3 = ю"кАГ(х)/квАГ. (6.2.10) Преобразования (6.2.8) - (6.2.10) одномерной целевой функции при N = 6 представлены на рис. 6.2.4, б - г, ще графики построены в лога- рифмическом масштабе по оси ординат (рис. 6.2.4, бу в) и в двойном логарифмическом масштабе по этой оси (рис. 6.2.4, г). Наиболее сильным селектирующим действием обладают преобразования Tj, Т3. После этих преобразований главный экс- тремум превосходит второй по величине экс- тремум не менее, чем на шесть порядков. Усреднение (сглаживание). Усреднение по пространству аргументов рас- сматривается как метод, благоприятствующий решению задач глобального поиска. При ус- реднении малые острые экстремумы сглажи- ваются, что облегчает нахождение главного экстремума. Естественно стремление объеди- нить метод усреднения с методом селекции. При статистическом подходе удается осущест- вить такой синтез в определенном смысле оптимального селекгивно-усреднительного алгоритма [31]. Непрерывный селектив- но - у с р е д н и т е л ь н ы й алго- ритм. При п > 2 непрерывный селекгивно- усреднительный алгоритм глобального поиска экстремума целевой функции V(x) имеет вид х = к ( И (х _ x')<tc'. (6.2.11) J г" (*-*') Здесь интегрирование распространяется на всю область задания целевой функции V; г(х - х') - расстояние между точками х и х (евклидова норма разности векторов). Приведем физическую интерпретацию алгоритма (6.2.11)* для случая трехмерного пространства аргументов (п = 3). Рассматривая у[^(х)] как распределение массы в про- странстве, величину |у[К(х')]г l(x-x')dx' G следует трактовать как ньютоновский потенци- ал в точке Ху а правую часть (6.2.1) - как гра- диент этого потенциала, т.е. как вектор сил притяжения. Преобразование типа (6.2.8) или (6.2.10) позволяет вместо исходной прбиз- вольной целевой функции получить распреде- ление масс, в основном сосредоточенное в точке главного экстремума. В остальном про- странстве распределение масс будет иметь ма- лую плотность и малые всплески в точках ло- кальных минимумов К(х). Сила тяготения, представляемая правой частью выражения (6.2.11), будет в основном направлена в точку главного минимума ("главной массы") и лишь в малых окрестностях локальных минимумов будет отклоняться от направления на главный минимум.
462 Глава 6.2. МЕТОДЫ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА Рис. 6.2.4. Исходная и преобразованные целевые функции
АЛГОРИТМЫ ПОИСКА ЭКСТРЕМУМОВ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ 463 По аналогии с задачей небесной механи- ки (6.2.11) соответствует движению точечной массы в весьма вязкой среде при фиксирован- ных положениях главной массы и возмущаю- щих масс (в точках локальных минимумов). При этом точечная масса движется строго по направлению вектора тяготения, т.е. почти всегда к главному экстремуму. Подобная ин- терпретация с меньшей степенью физической наглядности пригодна и для многомерного случая п > 3. Графически случай двумерного сечения четырехмерного пространства аргу- ментов представлен на рис. 6.2.5. Исходная целевая функция F(xj, Х2, 0, 0) изображена на рис. 6.2.5, а посредством линии равного уров- ня. Здесь главный минимум имеет уровень 0,1; второй по глубине минимум - уровень 1,3. Функцию преобразования выбираем в виде (6.2.8) при N = 6. Главный максимум преобра- зованной целевой функции vil V(xl> х2> °, °)] имеет уровень 106, а второй по величине мак- симум ц/l - 0,22. Рве. 6.2.5. Целевые функции непрерывного селекгивно-усреднтельного метода поиска
464 Глава 6.2. МЕТОДЫ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА Ввиду малости второго и следующих по величине максимумов они на рис. 6.2.5, б не показаны, так что здесь фигурирует лишь один максимум с уровнем 10б. Пренебрегая всеми малыми возмущающими "массами", получаем сглаженную одномодальную потенциальную функцию U(xi, Хз) (рис. 6.2.5, в). Линии рав- ного уровня здесь - практически окружности. Целесообразность применения простого гради- ентного метода к селектированной и сглажен- ной целевой функции не вызывает сомнений. Дискретный селектив- но - у с р е д н и т е л ь н ы й алго- ритм. Алгоритм (6.2.11) не дает абсолютное решение проблемы глобального поиска экс- тремума. Во всех практических задачах функ- ция V(x) не известна априори, а поэтому кратный интеграл в правой части (6.2.11) не может быть вычислен в общем виде. Числен- ное определение многократного интеграла создает определенные ограничения возможно- стей, связанные с вычислительными затратами. Построение на основе (6.2.11) численных алгоритмов сводится к дискретизации в про- странстве и времени [31]. При этом первый этап поиска отличается от последующего, так как его целью является только обнаружение базовой области Gq главного экстремума пре- образованной целевой функции в области за- дания G исходной целевой функции *. Этот этап поиска может реализовываться посредст- вом как регулярного, так и стохастического алгоритмов. При регулярном алгоритме назна- чается равномерная сетка в пространстве аргу- ментов. Элементарной ячейкой такой сетки может быть, например, и-мерный прямо- угольный параллелепипед с объемом, не пре- вышающим Gq. Во всех узлах сетки проводит- ся определение (вычисление) соответствующих значений vlH- Признаком обнаружения базо- вой области главного экстремума является "выброс" ц/, намного превышающий другие значения. Выигрыш от селекции на данном этапе поиска заключается в увеличении "контраста" главного экстремума по отноше- нию к локальным. После обнаружения выброса в какой- либо вершине элементарной ячейки сетки центральная точка этой ячейки принимается за предполагаемую точку главного экстремума. Осуществляется переход ко второму этапу поиска, который в отличие от первого ("слепого") поиска носит направленный харак- тер и строится как дискретный аналог алго- ритма (6.2.11). Здесь возможны как регуляр- ный, так и стохастический варианты. * Области в пространстве аргументов и их объ- емы обозначаются одинаково. Стохастический алгоритм с использова- нием метода Монте-Карло для замены крат- ного интеграла имеет вид [31]: дс[Дг +1] = х[ к ] + - Е ч4К(хи])] <xR]-x '[*]) (6.2.12) где к - номер шага; с - скалярная постоянная; х[£] - случайный вектор, выдаваемый генера- тором случайных величин и принадлежащий области Ggp, несколько превосходящей базо- вую область Gq главного экстремума. Распре- деление вероятностей в области Ggp равно- мерное. Число членов суммы в правой части (6.2.12) равно числу "испытаний" (вычислений ц/) NK на каждом шаге поиска. Точность опре- деления квадратуры методом Монте-Карло растет пропорционально независимо от кратности квадратуры п. Необходимая для поиска точность определения квадратуры, особенно на первых шагах, ограничена, по- этому число испытаний на этих шагах может быть относительно невысоким. Для предот- вращения осцилляционных явлений на заклю- чительных шагах поиска главного экстремума коэффициент с может уменьшаться на этих шагах согласно специальному алгоритму. Вычислительные затраты. Оценки числа испытаний (вычислений значе- ний целевой функции) при дискретном селек- тивно-усреднительном алгоритме поиска (при условиях ае - коэффициент запаса; 4,6 - ко- эффициент, гарантирующий обнаружение Gq с вероятностью 0,99; Nqp - число элементарных ячеек сетки в расширенной базовой области главного экстремума Ggpj - число шагов) определяются выражениями: для регулярного G слепого поиска ае—-; для стохастического G6 G слепого поиска 4,6-—; для регулярного на- G6 правленного поиска NQpNm', для стохастиче- ского направленного поиска Ддя стохастического алгоритма (6.2.12) при G/Gq = 104, = 10, Nu = 400 суммар- ное число испытаний составит 5 • 104.
ПАРАМЕТРИЧЕСКИЙ СИНТЕЗ САУ 465 6.2.2. ПАРАМЕТРИЧЕСКИЙ СИНТЕЗ САУ Параметрический синтез выполняется на стадии проектирования САУ, хотя в отдельных случаях (например, при решении задач авто- матической реконфигурации САУ) может осу- ществляться и в процессе функционирования системы в режиме реального времени. Клас- сификация задач параметрического синтеза САУ проводится в соответствии с формами математических моделей, критериями оптими- зации и другими признаками. Параметрический синтез на основе моде- лей вход-выход. При ручном параметрическом и структурном синтезе линейных стационар- ных систем широко используются асимптоти- ческие и неасимптотические логарифмические характеристики разомкнутых контуров, номо- граммы Чесната-Майера и др. При интерак- тивном компьютерном параметрическом син- тезе линейных систем обычно можно ограни- читься прямым расчетом частотных характери- стик замкнутой системы. Вычисление частотных характеристик. Пусть передаточная функция замкнутой системы для задающего воздействия у3(/) представлена в виде («.в) а0 +а15+... + ал5л где а - вектор варьируемых параметров, ком- поненты которого в частном случае могут сов- падать с коэффициентами числителя и знаме- нателя (6.2.13), а в общем случае эти коэффи- циенты являются сложными функциями изме- няемых параметров: <’/="/(«). *;=*/(“)• (6.2.14) Вещественную и мнимую частотные характе- ристики вычисляют по формулам: . . . АкВк + Ат Вт = НеФ(/со,а) = —Ч-2-; (6.2.15) Ф/(со,а) = 1тФ(/ю,а) = —-у- Л*+Л? где Л* = а0 - а2(о2 +в4(о4 - Л/ = ах -а3со3 + а5со5 -а2(а7 +...; (6.2.16) Вк = Ьц - Z^co2 +Л4Ш4 - Z^(o6+...; В/ = bi - b^(a3 + bs®5 - bj(o7 +.... Для вычисления по формулам (6.2.16) рекомендуется рекуррентная схема Горнера [1], которая применительно к Л^ имеет вид сп* ~ ап*'> ct = а{ - ci+2(°2» (i = п* -2,л ♦ -4,...,0) Л^=с0, (6.2.17) где л* = л, если л - четное, и л* = л - 1, если л - нечетное. Аналогично вычисляют Л/, Вк, Bi. Для прямого расчета по формулам (6.2.16) требуется примерно Зл операций ум- ножения и 2л операций сложения, а расчет по алгоритму Горнера - примерно 2л опера- ций умножения и столько же операций сло- жения при меньшем числе занятых ячеек па- мяти. При относительно высокой частоте со и большом л при расчетах по формулам (6.2.15), (6.2.16) возникает опасность переполнения разрядной сетки. При этом рекомендуется [1] передаточную функцию (6.2.13) представлять в виде ч +£л-25-1+••• +М~Л+1 1 Ф(5,а) = ---_i------------------- ап + an-ls +... + OQS п S и для такой формы передаточной функции использовать формулы, аналогичные (6.2.15) - (6.2.17). Программа FREQ расчета частотных ха- рактеристик линейной стационарной системы представлена в [26]. При параметрическом синтезе замкнутой системы с изменением варьируемых парамет- ров в пределах области устойчивости, как пра- вило, рассматриваются минимально-фазовые системы. При этом достаточно использовать только амплитудную характеристику I Я^ 4- Я^ |ФО,а)| = L (6.2.18) I Ак + А1 Параметрический и,н т е - рактивный синтез при ви- зуальной оценке качества. В частотной области частными показателями качества САУ являются: полоса пропускания или частота среза (соср) по отношению к за- дающему воздействию, величина главного выброса (пика) амплитудной частотной харак- теристики, крутизна ее спада на высоких час- тотах (со > соср), наличие дополнительных ре- зонансных пиков и др. Объединение этих ча-
466 Глава 6.2. МЕТОДЫ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА стных показателей в единый формализован- ный критерий представляет непростую задачу. Между тем оценка частотной характеристики успешно проводится опытным проектировщи- ком визуально. Отсюда следует целесообраз- ность применения интерактивного режима при решении рассматриваемой задачи пара- метрической оптимизации САУ в частотной области. Схема соответствующего алгоритма при- ведена на рис. 6.2.6. Вначале задаются значения оптимизи- руемых параметров. По этим значениям вычисляются коэффициенты передаточной функции в/, Л/ (/ = 1, 2, ...). Число элементар- ных арифметических операций при вычисле- нии этих коэффициентов обозначим N(n, п$). Далее осуществляется проверка на устой- чивость при полученных значениях коэффи- циентов характеристического уравнения. При использовании критерия Рауса для этого тре- буется примерно 2л2 + п операций. При на- личии устойчивости проводится переход к вычислению амплитудной частотной характе- ристики |ф(/со,а)|, при нарушении устойчи- вости - новая попытка назначения начального вектора параметров (см. рис. 6.2.8). Рис. 6.2.6. Схема алгоритма ицраметрпеского шгтеракгвваого спггеза пра вазуальиой оценке качества
ПАРАМЕТРИЧЕСКИЙ СИНТЕЗ САУ 467 При использовании схемы Горнера для определения одного значения АЧХ |ф(/со,а)| по формуле (6.2.18) согласно предыдущему потребуется примерно 2п + 7 операций. Если в среднем для построения АЧХ с необходимой степенью детальности требуется точек (Na значений со), то вычислительные затраты на построение одной АЧХ по известным коэф- фициентам передаточной функции составят около (2п + 7)Na операций. Вычислительные затраты на интерполяцию здесь не учитываются. После построения АЧХ на дисплее опе- ратор-проектировщик оценивает, удовлетворя- ет ли она существующим требованиям. Веро- ятность удовлетворения требований с первой попытки очень мала, и далее следует поиск. Ввиду того что оценка качества АЧХ в рассматриваемом алгоритме строго не форма- лизована и производится человеком (она далее именуется визуальной), здесь возможен лишь ручной покомпонентный поиск (см. рис. 6.2.8). При таком поиске сначала изменя- ется один настраевымый параметр и ищется экстремум визуальной оценки качества АЧХ по этому параметру. Допустим, что для этого в среднем приходится перебрать Na значений параметра. Далее при фиксированном значе- нии первого параметра подбирается экстре- мальное (по визуальной оценке) значение второго параметра и т.д. до настройки послед- него Лд-го параметра. После этого возвращаются к подстройке первого параметра, и циклы повторяются до того момента, когда изменение параметров не улучшает визуальной оценки качества. При одноэкстремальной задаче требуемое количество построений АЧХ можно оценить как qaNana> где коэффициент qa зависит от характера экстремальной зависимости, опыта и искусства оператора и обычно не превышает первых единиц. При наличии мешающих экс- тремумов решение задачи поиска может резко осложниться. И все же именно так работает настройщик любой аппаратуры, снабженной органами настройки и визуальным индикато- ром настройки. Согласно приведенным выше прибли- женным оценкам общее количество элемен- тарных арифметических операций для на- стройки па параметров будет равно [N(n,na) + n + 2n2 + (2n + 7)Nw]qaNana. (6.2.19) При п = 10, па = 10, Na = 20, Na = 20, qa = 3, N(n, ло) = 2иви2 это составит 1,65 * 106 операций. При современных компь- ютерах для этого требуется небольшое время счета, намного меньше, чем при визуальной оценке 600 АЧХ (которые предъявляются опе- ратору в процессе функционирования данного алгоритма при указанных числовых значениях величин) в сумме с временем манипулирова- ния клавиатурой. Параметрический син- тез при формализованной оценке качества. Формализованная оценка качества процессов регулирования по частотным характеристикам в линейных САУ возможна как для детерминированных, так и для стохастических задач. Пусть имеется стационарная линейная САУ: скалярный вход - скалярный выход, для которой как задающее воздействие уз(/)> так и шум измерения рассогласования у(/) - Уз(О = е(0 являются случайными функ- циями. Эти функции принимаются центриро- ванными, стационарными, эргодичными, вза- имно не коррелированными со спектральными плотностями мощности (интенсивностями) c(w) г»(со) Уз ’ еш ‘ Тогда дисперсия ошибки (рассогласова- ния) в установившемся режиме выразится формулой оо 1(a) = Mfs2] = —J|®e 0<o,a)|2^ + к о ОО + ^||Ф(>,а)|25|.ш(0>)<*0> (6.2.20) п о где Фе(5,а) = Ф($,а) - 1. Задача параметрического .синтеза здесь формулируется следующим образом: min 1(a), а = 0. (6.2.21) а В принципе ее можно решать любым из ука- занных выше методов автоматического поиска экстремума. В структурной схеме алгоритма, приведенной на рис. 6.2.6, способ поиска не раскрыт. Хотя данный алгоритм является ав- томатическим, предусмотрена индикация ам- плитудных частотных характеристик Фе(у(о,а) , Ф(/со,а) , позволяющая оператору контроли- ровать процесс синтеза и при необходимости вмешиваться в этот процесс. Вычислительные затраты (точнее, число элементарных арифметических операций) при автоматической параметрической оптимизации (6.2.20), (6.2.21) могут быть приближенно вы- ражены формулой, сходной с (6.2.19):
468 Глава 6.2. МЕТОДЫ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА ^(л, па ) + п + 2п2 + (Зп +11)ЛГЮ |ЛГЯ, (6.2.22) где Nn - общее число шагов поиска по а. В зависимости от характера функции 1(a) и соответственно, алгоритма параметриче- ского поиска, а также размерности па вектора параметров это число может меняться в широ- ких пределах. Значение qa^ana> фигурирую- щее в формуле (6.2.19) для ручного поиска, следует считать его нижней границей. Время автоматического параметрического синтеза во много раз (и даже порядков вели- чин) меньше, чем неавтоматического. Параметрический синтез на основе моде- лей в пространстве состояний. Для моделей САУ в пространствах состояний типа (6.1.2), (6.1.24) изменяемые (настраиваемые) коэффи- циенты обычно входят в модель простейшим образом. Так, для линейной стационарной системы (6.1.26) с изменяемыми передаточны- ми числами регулятора эти числа являются просто элементами матрицы К. Входная _у3(/) и выходная y(i) величины здесь, как правило, векторные, причем раз- мерность у может достигать п (в частности у = х). В этом случае САУ характеризуется множеством скалярных передаточных функ- ций, представление которых в виде отношений полиномов (6.1.27) с общими формулами для коэффициентов а/, Л/, становится нецелесооб- разным. Матрицу комплексных частотных харак- теристик ФО, а) = HljaE + ВКН - АГ'ВК (6.2.23) здесь проще определять целиком численным путем, используя программу комплексной арифметики. Однако расчет множества частотных ха- рактеристик еще не решает задачу параметри- ческого синтеза. Если оператору-проектиров- щику для каждого значения вектора парамет- ров предъявляется множество частотных харак- теристик, то выбор весьма затруднен. При автоматическом параметрическом синтезе задается норма матрицы частотных характеристик ЛФ(Л>,а)|| или функционал 00 1(a) = J ||ф(/о,а)||ЛЬ = о 00 = J ||Я1 JtoE + ВКН - А]-1 BX’lpko. (6.2.24) О Подобная норма и функционал для САУ, воз- мущаемых стационарными шумами измерения и стационарными стохастическими задающими воздействиями, могут строиться по аналогии со скалярным случаем (6.2.20) на основе зна- ния спектральных плотностей шумов. В остальном задача параметрического синтеза сохраняет прежнюю формулировку (6.2.21) и может решаться на основе примене- ния широкого спектра методов поиска экстре- мума (см. п, 6.2.1). Параметрический синтез САУ во времен- ной области сопровождается многократным моделированием при постоянных параметрах процессов управления, возбуждаемых и проте- кающих в реальном, ускоренном или замед- ленном времени. В современных САПР, обладающих ши- рокими возможностями моделирования про- цессов в динамических системах и быстродей- ствующими графическими дисплеями, это наиболее эффективный метод параметриче- ского синтеза. Его преимущества обусловлены универ- сальностью и гибкостью целевых функциона- лов во временной области, органической свя- зью с синтезом оптимальных управлений, наглядностью индикации. Последнее опреде- ляет эффективный контроль и высокую устой- чивость самих процессов интерактивного син- теза. Параметрический син- тез с векторной эксперт- ной оценкой качества пе- реходных процессов. Качество переходных процессов в САУ характеризуется такими частными показателями, как время регулирования (время "срабатывания"), пере- регулирование, число колебаний за время ре- гулирования и другими или интегральными квадратичными оценками качества. При руч- ном синтезе оценка качества переходных про- цессов может осуществляться оператором- проектировщиком визуально, подобно опи- санному выше для синтеза в частотной облас- ти. Такую визуальную оценку можно назвать также векторной экспертной. Численное моделирование динамической системы является основой всех рассматривае- мых методов синтеза. Для непрерывных сис- тем, описываемых дифференциальными урав- нениями в форме Коши (6.1.13), существует целый ряд широко известных методов числен- ного интегрирования. Учет специфики конкретных классов ди- намических моделей обеспечивается двухка- нальным методом быстрого численного интег- рирования динамических систем [25], а также
ПАРАМЕТРИЧЕСКИЙ СИНТЕЗ САУ 469 методами быстрой кусочно-линейной аппрок- симации функций многих переменных на раз- реженной сетке (симплексами) [23]. Они по- зволяют сократить требуемое быстродействие ЭВМ при численном моделировании распро- страненного класса динамических систем на один-два порядка. Структура алгоритма. При ручном па- раметрическом синтезе САУ во временной области (как и в частотной) контроль качества переходных процессов осуществляют визуаль- но, а настройку параметров (параметрический поиск экстремума) - вручную. Структура соот- ветствующего алгоритма при решении детер- минированной задачи параметрического син- теза представлена на рис. 6.2.7. Движение объ- екта, получаемое, как правило, путем числен- ного интегрирования системы уравнений, имеет вид х(О = 1(х(Го),а,Ц)- (6.2.25) Это решение в удобной для визуальной оцен- ки форме индицируется на графическом дис- плее. Оператор-проектировщик визуально оценивает качество полученных процессов. Как правило, при случайно заданном началь- ном векторе параметров это качество оказыва- ется неудовлетворительным. Начинается поиск оптимальных значений настраиваемых пара- метров. Как и в случае параметрического син- теза в частотной области (рис. 6.2.8), при ви- зуальной оценке качества единственным при- емлемым методом поиска здесь является по- компонентный поиск. Необходимое число шагов такого поиска может быть выражено прежней формулой ЯаМоПа> ДО Na - среднее число шагов поиска по одному параметру (одной компоненте а). Рис. 6.2.7. Схема алгоритма параметрического синтеза во временной области пре визуальной оценке качества
470 Глава 6.2 МЕТОДЫ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА Рве. 6.2.8. Схема алгоритма параметрического синтеза при формализованной оценке качества Если число элементарных арифметиче- ских операций, осуществляемых при одно- кратном моделировании (численном интегри- ровании) равно 7У0П, то общее необходимое число арифметических операций составит JVj, = NQnqaNапа. (6.2.26) При qa = 3, Na = 20, па = 10, N0Tl = 104 име- ем Ае = 6 • 106. При Аоп = 5 • 105 и тех же значениях остальных величин Ае = 3 • 108. Синтез во временной области обладает суще- ственными преимуществами. Важнейшим из них является практическая применимость для сложных нелинейных САУ. Вычислительные затраты даже при верх- нем из указанных пределов на современных ЭВМ оказываются меньше суммарного време- ни визуальной оценки предъявляемых опера- тору графиков процессов и нажатий на кнопки клавиатуры. Параметрический син- тез с общим функционалом
МАТЕМАТИЧЕСКИЕ ОСНОВЫ ОПТИМИЗАЦИИ ПРОЦЕССОВ УПРАВЛЕНИЯ 471 качества. Автоматическая оценка качест- ва процессов в синтезируемой системе может осуществляться посредством функционала обобщенной работы типа I = V3[x(tK)]+J Q3[x(0),a,eide + I* +0,5 J [«+«Jn (9)*-1“оП (e)k®, h (6.2.27) отражающего как качество процессов, так и скорость изменения параметров а = и . По- следняя в определенной степени характеризует быстродействие, необходимое для реализации синтезируемого алгоритма параметрической настройки. Алгоритм оптимальной параметрической настройки в данном случае имеет вид а = -к — да р(1) (х(1) (4)), Л)] + + J Оз pQi) (*(i) ('о )> 0, А)), ер9 • г° (6.2.28) Это непрерывная форма алгоритма с прогно- зирующей моделью (см. гл. 6.3). Глава 6.3 СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ 6.3.1. МАТЕМАТИЧЕСКИЕ ОСНОВЫ ОПТИМИЗАЦИИ ПРОЦЕССОВ УПРАВЛЕНИЯ Под оптимизацией непрерывных процес- сов управления (или кратко: оптимизацией управления) здесь понимается решение задачи выбора такого управления: и=и(х,0; ueRr; xeRn; (6.3.1) для динамического объекта x = F(x,w,0; ueRr; xeRn; ^е[/0,/к]; (6.3.2) чтобы на траектории движения объекта х(/), удовлетворяющей заданным условиям началь- ного и конечного состояния ц(х(/о),ха1[),/о.'к) = О. (6.3.3) функционал I = H(xa0),x(tK),t0,tK) + J L(x(t),u(t),t)dt, k I e Л1, (6.3.4) достигал минимума (максимума) или наи- меньшего (наибольшего) значения. Здесь F, ц, Н и L - заданные непрерывные (а часто и дифференцируемые) векторные и скалярные фикции указанных аргументов. Эта задача отличается от упоминавшейся выше задачи (см. гл. 6.1) терминальной частью функциона- ла, зависящей как от конечного, так и началь- ного вектора состояния, а также дополнитель- ным условием (6.3.3). Формулировка задачи (6.3.1) - (6.3.4) яв- ляется достаточно общей для методов вариа- ционного исчисления. Основой этих методов является анализ вариаций различных величин, функций и функционала качества, представ- ляющий собой обобщение анализа дифферен- циалов при исследовании экстремумов функ- ций. Под вариацией функции принято пони- мать некоторую функцию 8 и или 8х, позво- ляющую представить изменение в малой окре- стности исходной функции, а именно: «(/) = u(t) + еб«(О; х(0 = x(t) + е5х(/), (6.3.5) где г - малый скалярный параметр. Естествен- но ожидать, что при соблюдении условий не- прерывности и гладкости решений задачи (6.3.1) - (6.3.4) варьирование управления 8u(f) приведет к варьированию траектории бх(/), и вместе они вызовут варьирование функциона- ла, который можно представить разложением в РЯД Тейлора 7(х, и) = /(х,«) + еб/(х, и) + е2б2/(х, и) + о(г). (6.3.6) Соотношение (6.3.6) учитывает влияние ва- риаций управления 8и и траектории 5х. Ана- логично можно отразить влияние на функцио- нал (6.3.4) вариаций начального и конечного состояний в (6.3.3), а также вариаций момен- тов времени 4) и *к*
472 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ Ключевыми вопросами методов вариаци- онного исчисления являются, во-первых, во- прос о выборе класса функций, внутри кото- рого осуществляется варьирование управления 5м, а во-вторых, вопрос об исследовании по- ведения первой 81 и второй 52Z вариаций функционала на выбранном классе функций. Сложность и многообразие подходов к реше- нию этих вопросов порождают все обилие полученных методов, способов и рекомендаций. Вариационное исчисление принято де- лить на два больших направления. Одно из них получило название классического вариа- ционного исчисления и строится в основном на поиске прямых ответов на поставленные выше вопросы. Другое направление принято называть теорией оптимального управления, ориентировано на учет специфических огра- ничений задач управления и обычно ответ о вариациях функционала дает в косвенной форме. Классический вариационный подход. За- дачу оптимального управления динамическим объектом можно рассматривать как вариант общей задачи классического вариационного исчисления, связанный с введением дополни- тельного ограничивающего условия в виде дифференциального уравнения (6.3.2) и при- ведением минимизируемого функционала к форме (6.3.4). Постановка задачи. Задача (6.3.1) - (6.3.4) в классическом вариационном исчислении носит название задачи Больца. Если в (6.3.4) имеет место равенство Н = 0, то задачу называют задачей Лагранжа, а при L = 0 - задачей Майера. Указанное деление является общепринятым, хотя оно в опреде- ленной степени условно. Специальными пре- образованиями названные задачи приводятся друг к другу. Существенными являются условия на на- чальное и конечное состояния объекта, свя- занные (6.3.3). Можно выделить четыре поста- новки задачи. 1. Задача с фиксированными концами и заданным временем оптимизации. В этом слу- чае (6.3.3) уступит место 2п + 2 соотношениям *1('о) = = ХП<¥.> J (6.3.7) ^0 = ^о.зад> = ^к. зад- При этом включение фикции Н в (6.3.4) теряет смысл, так как она вырождается в кон- станту, не влияющую на минимизацию I. 2. Задача с фиксированными концами и незаданным временем. Первые 2п соотноше- ний учитываются, а моменты времени 4) и /к (или один из них) считаются произвольными. 3. Задача с подвижными концами и за- данным (или незаданным) временем оптими- зации. В такой задаче вместо (6.3.3) задаются НоМ'оМо) = °> (6.3.8) Uk(*('k)A) = <>. НкеЯ₽'. В случае подвижного левого конца рц < л, а в случае подвижного правого конца р* < п. Со- отношения (6.3.8) описывают в неявном виде многообразия (линии, поверхности и пр.), на которых должны начинаться или заканчивать- ся искомые оптимальные траектории. При выполнении условий разрешимости (6.3.8) относительно компонент х(1) размер- ность соответствующих многообразий опреде- ляется формулами Nq = п - ро, N* = п - р*. 4. Задача со свободными концами и за- данным (или незаданным) временем оптими- зации. В данном случае никаких специальных требований к состоянию объекта на соответст- вующем конце не предъявляется и допускается варьирование векторов x(Jq) и х(/к)- В таких задачах иногда вводится отличная от нуля функция Н в (6.3.4), называемая терминаль- ной функцией функционала. Необходимые и доста- точные условия. Основным резуль- татом классического вариационного исчисле- ния являются необходимые и достаточные условия минимума (максимума) функционала в задаче (6.3.1) - (6.3.4). При решении задачи на наименьшее (наибольшее) значение функ- ционала наряду с использованием названных условий должно анализироваться поведение функционала на границах областей задания и(0 И х(|). В классическом вариационном исчисле- нии изучены вариации трех типов: ва риация, малая как по величине, так и по производной (класс Cj); ва риация, малая только по величине (класс Со); вариация, малая по величине, а также по производной в промежутках между точками перелома (класс Dj). Минимум (локальный) функционала, найденный при использовании вариаций первого типа, называют слабым и обозначают min Z, а вариаций второго типа - сильным и обозначают MIN I. Из определения нормы в пространствах Q и Q следует, что сильный минимум является одновременно и слабым, но не наоборот. Кратко роль и место каждого из необхо- димых условий минимума функционала (6.3.4) могут был» представлены следующей схемой:
МАТЕМАТИЧЕСКИЕ ОСНОВЫ ОПТИМИЗАЦИИ ПРОЦЕССОВ УПРАВЛЕНИЯ 473 х(0 - экстремаль Эйлера, условие Клебша, <= min I (6.3.9) условие Якоби на интервале (/fr, ^), <= MIN I. условие Вейерпгграсса. Условие Клебша (Лежандра-Клебша) вытекает из условия Вейерпгграсса. Поэтому, решая задачу на сильный экстремум, не обязательно проверять условие Клебша. Достаточные условия классического вариационного исчисления представляются схемой: х(1) - экстремаль Эйлера, усиленное условие Клебша, => min I (6.3.10) условие Якоби на полуинтервале (*b, Ас)> “=> MIN I. достаточное условие Вейерпгграсса. В случае использования вариаций из класса D\ следует привлекать узловые условия Вейерштрасса-Эрдмана. Помимо названных условий необходимо рассматривать условия еще двух типов: естест- венные граничные условия в случае задания (6.3.7) или условия трансверсальности в случае задания (6.3.8). Исследование первой вариа- ции. Траектория х(1), порождаемая управле- нием м(1), является экстремалью Эйлера, если удовлетворяет дифференциальному уравнению, называемому уравнением Эйлера-Лагранжа. В общем случае это уравнение второго поряд- ка, вытекающее из условия равенства нулю первой вариации функционала. В задачах управления динамическим объектом фигури- рует частный случай этого уравнения. Рассмотрим задачу с фиксированным ле- вым и свободным правым концами. Вводя вектор множителей Лагранжа, преобразуем задачу (6.3.1) - (6.3.4) к задаче на безусловный минимум: I = Я(х(/к),/к) + + J |г(х, и, t) + Хт (/)[F(x, 0 - х] |л *0 (6.3.11) Введем функцию Н(х9 и, X, t) = = L(x, и, t) + Хт (t)F(x, и91) , называемую га- мильтонианом. Интегрируя последнее слагае- мое в (6.3.11) по частям, получим I = Я(х(/к),Гк) + XT(f0W0) - *’(/,№) + + |[я(х,«,Х,0 + Хт(0х(/)рА (6.3.12) Используя последнюю формулу, можно запи- сать первую вариацию функционала 57 = ая(х(гк),гк) . Wk) -Хт(/К)8х(/К) + *oL йг1+Н5х(0+ (6.3.13)
414 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ Анализ (6.3.13) показывает, что первая вариа- ция 81 равна нулю при произвольных вариа- циях 8х(/)> и 8u(f) только в случае вы- полнения соотношений Уравнения (6.3.14) - (6.3.16) являются уравне- ниями Эйлера-Лагранжа для рассматриваемой задачи. Итак, экстремалью будет траектория х(1), порождаемая управлением, вытекающим из соотношения (6.3.16), т.е. При этом требуется решить систему обыкновенных дифференциальных уравнений х(0 = F(x,u,t); (6.3.18) • _ Га/(х,и,/)]т _ Гаг(х,и,о]т () [ dx(t) J () [ ас(/) при п условий х(4)) = *0 на левом конце и rt условий Х(/к ) = [д#(х(/к ), /к ) / Ox(t* )] на правом конце. Такая задача получила название двухточечной краевой задачи, и решение ее в общем случае представляет собой серьезную проблему. В то же время в соответствии с (6.3.9) и (6.3.10) нахождением экстремали решение поставленной задачи не исчерпы- вается. Одним из условий сильного минимума (максимума) функционала (6.3.4) является условие Вейерштрасса [7, 38], которое вытека- ет из анализа приращений функционала в некоторой окрестности экстремали. Формально это условие выражается нера- венством 5Я = Н(х, и9 X, 0 - Н(х, иоп, X, Г) > 0 (6.3.19) для всех /им# моп. Используются и другие представления этого условия, в том числе с так называемой ^-функцией Вейерштрасса [10]. Используя теорему о среднем, из (6.3.19) можно получить dL(x,u,f) 6Я = + Хт (t)F(x, и, f) > и - моп) + + 0,5(М - моп )т Нии и> Ь, 0(« " моп ), (6.3.20) где м - управление в некоторой окрестности моп, Sm(x,u,X,f) = d2H(x,u,X,t) I dur(t)du(t) - матрица вторых частных производных гамиль- тониана по указанным аргументам. Так как на оптимальной траектории выражение в квад- ратных скобках обращается в нуль, то (6.3.19) вырождается в неравенство: ^ии (*, и, X, 0 > 0 в окрестности ХоП, моп. (6.3.21) Исследование второй ва- риации. Используя (6.3.12), можно полу- чить выражение для второй вариации функ- ционала 5^7 — 0,58хт(/к)7Гда(х(/к),/к)8х(/к) + /к + 0^| *о ^хх *хи Т&*(0 .х Них яДНО] • (6.3.22) Если (6.3.22) вычислять на экстремали, доставляющей функционалу (6.3.12), а значит и (6.3.4) минимум, то вторая вариация (6.3.22) будет принимать неотрицательные значения. Будем исходить из того, что положительная определенность первого слагаемого в (6.3.22) гарантирована выбором терминальной функ- ции H(x(t*), t*) в (6.3.4). Тогда положитель- ная определенность (неотрицательность) ва- риации (6.3.22) при произвольных 8х и 8и однозначно связана с положительной опреде- ленностью матрицы Я^^мД,/) Нхи(х,и,Х,1) Hux(xtutktf) Huu(xtutktt) t (6.3.23) для чего, в свою очередь, необходима и доста- точна положительность главных миноров. Это условие частично можно выразить положи- тельной определенностью одного из диаго- нальных блоков, т.е. Huu(x,u9X,f)*0. (6.3.24) Данное неравенство получило название условия Клебша (Лежандра-Клебша) [36], или
МАТЕМАТИЧЕСКИЕ ОСНОВЫ ОПТИМИЗАЦИИ ПРОЦЕССОВ УПРАВЛЕНИЯ 475 условия выпуклости [44]. Усиленное условие Клебша выглядит в виде строгого неравенства и повторяет вытекающее из условия Вейершт- расса неравенство (6.3.21). Дальнейшее иссле- дование (6.3.23) или (6.3.22) проводится двумя путями. Первый из них основан на рассмотре- нии (6.3.22) в качестве нового функционала оптимизационной задачи с выписыванием уравнения Эйлера, теперь уже называемого уравнением Якоби, и с анализом вырожденно- сти решения на интервале (4)» Ас) [36]. Усло- вие, известное как условие Якоби, считается выполненным, если отсутствуют моменты / е (А), Ас) вырождения решения уравнения Якоби. Усиленное условие сводится к отсутст- вию вырождения на полуинтервале. Второй путь связан с анализом решений специально конструируемых матричных уравнений [44], являющихся аналогом уравнения Якоби и допускающих более широкое применение. . Вопросы практического применения. Оптимизация систем управления на основе использования класси- ческого вариационного исчисления может быть представлена последовательностью двух фаз. В первой из них ищутся экстремали Эй- лера, а во второй проверяются необходимые и достаточные условия. Поиск экстремали, как правило, приводит к двухточечной краевой задаче, для решения которой применяются соответствующим образом модифицированные алгоритмы решения задачи Коши [42]. Одним из наиболее эффективных можно назвать чис- ленный метод последовательных приближений. Вторая фаза решения задачи, связанная с проверкой других условий, не обеспечена ре- тулярными алгоритмами и методиками, при- менимыми в сколь-нибудь общем случае. При решении практических задач разработчики используют накопленный опыт. Классическое вариационное исчисление не охватывает задач с ограничениями типа неравенств. Неклассические ограничения. Теория оп- тимального управления как альтернатива клас- сическому вариационному исчислению воз- никла на основе обособления задачи типа (6.3.1) - (6.3.4) из общей теории вариацион- ного исчисления. Принципиальным явилось введение в рассмотрение так называемых сильных ограничений на управление в (6.3.2), т.е. w(0eQcj?r, (6.3.25) где Q - замкнутая (часто замкнутая, ограни- ченная и выпуклая) область значений управле- ния на интервале [А), Ас1* Типовым случаем, например, является покомпонентное ограни- чение вектора u(t), а именно: Щ min ^/(0 Щткг (6.3.26) Изложенный выше аппарат непосредственно неприменим в этих условиях, так как ни одна из указанных вариаций управления не позво- ляет охватить весь класс управлений, удовле- творяющих (6.3.25) или (6.3.26). Для решения задачи (6.3.1)^ - (6.3.4), (6.3.25) Л. С. Понтрягиным разработан метод, получивший название принципа максимума [38, 44]. Игольчатая вариация. Цен- тральным понятием, позволяющим найти не- обходимые условия минимума функционала (6.3.4), в методе принципа максимума являет- ся понятие игольчатой вариации управления, т.е. вариации типа {V при /е[т,т + еЛ; 1 (6 3 27) u(t) при t е[т, T + eZ], где v = const е Q; т - заданный момент вре- мени из интервала [А), Ас!» ~ заданное поло- жительное число; е - произвольное число. Предполагается, что поиск минимума функционала осуществляется на множестве управлений, отличающихся друг от друга функциями (6.3.27), где е может был» неогра- ниченно малым. Будем рассматривать лишь задачу Ла- гранжа (т.е. будем полагать в (6.3.4) Н = 0) с фиксированным левым и свободным правым концами. В дальнейшем целесообразно перей- ти к расширенному объекту управления, полу- чаемому из (6.3.2) присоединением дополни- тельной компоненты хл+10)> удовлетворяю- щей уравнению *л+1 = L(x,u,t). (6.3.28) Тоща вместо (6.3.2) рассматривается объект хр = fp(x9u,t); хр = со!оп(х,хл+1); (6.3.29) xpel?n+1; ueRr; fe[fo,fK], и задача приводится к задаче Майера, где I ~ хп+1 (^к ) • Пусть у объекта (6.3.29) Fp(x9u,f) и dFp (х, и, t) / дхр (/) непрерывны. Тогда опи- сать вариацию траектории, вызываемой вариа- цией управления (6.3.27) можно следующим образом: а) при t < т 8хр =0, б) при t = т скачкообразное изменение (см. (6.3.5))
476 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ бХр(т) = 4Fp(x,v,T) - 1/,т)], (6.3.30) в) при t > т вариация 8хр (/) удовле- творяет уравнению • dF„(x,u,f) <6-3-31> с начальным условием (6.3.30). Принцип максимума*. Пусть иОп0) _ оптимальное управление, a x^n(l) - соответствующая оптимальная траектория. Из необходимых условий минимума критерия качества I = J Цх, и, t)dt, (6.3.32) состоящего в неотрицательности его первой вариации, вызываемой вариациями оптималь- ного управления, получаем 8Хопп+1('к)^а (6.3.33) Принцип максимума связывает вариации (6.3.33) с некоторой функцией, вычисляемой на оптимальной траектории. Известно, что решение однородного уравнения (6.3.31) и решение сопряженной системы dFAx,u,t) м . Ъ (0 -----Тр (0. м-р (0 е Ял+1, (6.3.34) образуют неизменное во времени скалярное произведение, т.е. Х|/J (ОбХр (0 = const, (6.3.35) где ц/р(О - произвольная векторная функция времени, удовлетворяющая (6.3.34). Если выбрать чЧ'к) = 0, Ч-(0 е Л", v„+1 (Гк) = -1, (6.3.36) то неравенство (6.3.33) можно записать в виде ^ак)5Хр(/к)^0. (6.3.37) но согласно (6.3.35) имеет место неравенство ч/;(05хр(0^0, (е[(0АЬ (6.3.38) * Строгая формулировка принципа максимума приведена в [38]. в том числе и в момент t = т. Тогда ч-J (т)Л> (х> v> т> - м-р <T)fp “on л) о. (6.3.39) Воспользовавшись обозначением гамильто- ниана, можно (6.3.39) записать в виде Я(*оп>“оп>Ч',т) = шахЯ(х0П,у,ч/,т). vgQ (6.3.40) Таким образом, если управление иоп(0 и траектория хЬп(0 доставляют минимум (6.3.32) при уравнениях связи (6.3.2), то существует такая непрерывная фикция удовлетво- ряющая уравнению (6.3.34) и условиям (6.3.36), что при каждом Sepo,SK] функция Гамильтона #(хоп, моп, \|/, т) достигает мак- симума по всем i/(l) е Q. Условие (6.3.40) вместе с условием Вей- ерпгграсса составляют необходимые условия сильного минимума функционала (6.3.32) в рассматриваемой задаче. Рассмотрение других постановок задачи (с незаданным временем окончания, с под- вижными концами) связано с некоторым ус- ложнением результатов. Так, при незаданном времени формально вводится помимо (6.3.28) еще одна компонента хл+2(0, удовле- творяющая уравнению Хп+2 = 1, (6.3.41) и соответствующим образом преобразуется (6.3.40). При рассмотрении подвижных концов с условиями (6.3.8) вводится условие трансвер- сальности в виде \|/т(/к)5х(/к) = 0, (6.3.42) которое приводит к замене граничного усло- вия (6.3.36) для сопряженной системы (6.3.34) на условие Ч-('к) = т> ГбЛЛ> (6.3.43) где у - вектор дополнительных коэффициен- тов, определяемых из условия одновременного выполнения (6.3.8) и (6.3.43). Использование принципа максимума сводится к следующим операциям. После вы- писывания гамильтониана
МАТЕМАТИЧЕСКИЕ ОСНОВЫ ОПТИМИЗАЦИИ ПРОЦЕССОВ УПРАВЛЕНИЯ 477 Я(х,1/,хр,0 = wT(t)F(x,u,t) + yn+i(t)L(x,u,t) ^оП(0,0 = Я(хоп(/к),/к) + (6.3.44) определяется управление И = и(х,ц/,0 €Q, (6.3.45) доставляющее максимум (6.3.44). Тоща можно записать систему уравнений х = F(x,u(x,y,t),f), х(/0) = х0; *п+1 = Дх,«(х,ч',0,0, x„+l(t0) = 0; (6.3.46) dFT dL ti . 4' = --'•'»+!’ W = »x; Vo+t’O, Ч'И+1(,К) = Ч'.. Система уравнений (6.3.46) получила на- звание двухточечной краевой задачи. Решение ее весьма затруднительно. Динамическое программирование. Метод динамического программирования, разрабо- танный Р. Веллманом для вариационных задач [5], часто применяется для анализа и синтеза систем оптимального управления. При этом рассматривается задача (6.3.1) - (6.3.4). Принцип оптимальности явля- ется основой динамического программирова- ния и гласит: любой отрезок оптимальной тра- ектории, примыкающий к конечной точке x(t^ также является оптимальным. Другими слова- ми, для любого промежуточного состояния Х0), t е [Zb, Ас] на оптимальной траектории продолжение траектории от х(1) до x(AJ явля- ется оптимальным. При этом ничего не утвер- ждается о начальной части этой траектории. Принцип оптимальности [9] дает доста- точно общее необходимое условие оптималь- ности динамических систем. Из него вытекают совсем нетривиальные необходимые условия оптимальности траектории. Так, анализ траек- тории иа оптимальность в соответствии с этим принципом следует осуществлять, начиная с ее конца и рассматривая участок за участком. Необходимость условия связана с тем, что оптимальность участков следует из оптималь- ности всей траектории, но ни в коем случае не наоборот. Уравнение Веллмана. Пусть для динамического объекта (6.3.2) и функционала (6.3.3) известны оптимальное управление ДоП(0 и оптимальная траектория %оп(0, где t 6 №> AJ- Вводится специальная скалярная функция + J Д*оп (t). “on (т)> Х)А. (6.3.47) t вычисляемая вдоль оптимальной траектории и называемая функцией Веллмана. Интегриро- вание в (6.3.47) осуществляется от текущего t до конечного Ас момента времени. При этом согласно (6.3.47) ^(*оп(Ас)> Ас) = -^(*оп(Ас)> Ас)* (6.3.48) Функцию (6.3.47) можно записать в виде ^оп (0,0 = -^(*оп(Ас)>Ас) + + min [ £(хоп (т),и(т), т)Л. (6.3.49) t Уравнение (6.3.49) получило название функ- ционального уравнения Веллмана. Если рассмотреть два достаточно близких момента времени / и / + АД то значения функции Веллмана в эти моменты времени можно свя- зать между собой следующим образом. С од- ной стороны, согласно принципу оптимально- сти и функциональному уравнению (6.3.49) V (*оп (0.0 = minfr (хоп (/ + д/), / + Д7) + + Дхоп(0,«(/),0Д/] + О1(Д/)> (6.3.50) а с другой стороны, на основе разложения в ряд Тейлора (при непременной дифференци- руемости функции Веллмана) F(xon(/ + + М) = К(хоп(0,0 + + Лх»п(0. и.п(0,0Д/+ *ar(X^----A< + O2(A/). (6-3.51) 01 Теперь, подставив (6.3.51) в (6.3.50) и прини- мая во внимание, что по определению 0 не зависит от и(1), а также полагая А/ -► 0, получим
478 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ ак(ход(р,о । dt + F(xon(/).«(/),t) + ueQ[ ЙХОП(/) +£(хоп(0,«(0,0] = а (6.3.52) Это уравнение известно как уравнение Беллмана (уравнение Гамильтона-Якоби-Бел- лмана). Решение такого уравнения осуществ- ляется в два этапа: на первом этапе ищется управление г/(0, минимизирующее левую часть уравнения, т.е. dV »on(*on(0,0 = a«gnim —— F + L , u L (6.3.53) а на втором этапе решается уравнение в част- ных производных для функции Цхбп(0, О, а именно: dV(x(t),t) dV(x(t),t) , /л л л — л, •+.......L/rt о, о+ dt uxyt) +L(x(f), u(x(t), f), f)-0 (6.3.54) с граничным условием (6.3.48). В методе динамического программирова- ния утверждается, что на оптимальной траек- тории существует такая дифференцируемая функция Р(х(1),1), которая удовлетворяет уравнению в частных производных (6.3.52), или, что то хе самое, (6.3.54), а управление, минимизирующее левую часть уравнения (6.3.52), т.е. определяемое соотношением (6.3.53), является оптимальным. Таким образом формулируется необхо- димое условие оптимальности. Достаточные условия. Ана- логично может быть сформулировано доста- точное условие, но для этого требуется выпол- нение дополнительных предположений. Рас- смотрим случай определения функции Белл- мана в открытой области X с Rn, т.е. вектор состояния x(fi не имеет строгих ограничений. Кроме того: а) частная производная dV(x(t),f) / dt и произведение являются непрерывными функциями времени и состояния на всем интервале [/fo, АсВ б) гамильтониан дости- гает абсолютного (глобального) минимума при оптимальном управлении, а оптимальная тра- ектория единственная. При выполнении указанных условий ре- шение (6.3.52) обеспечивает оптимальность управления. Практическое примене- ние. Метод динамического программирова- ния предполагает осуществление двух этапов поиска решения, т.е. (6.3.53) и (6.3.54). В от- носительно редких случаях удается этого до- биться аналитически. При сколь-нибудь слож- ной задаче неизбежно привлечение численных методов, трудности применения которых для решения многомерных уравнений в частных производных общеизвестны. Поэтому более широкое распространение получило использо- вание динамического программирования для дискретных систем при соответствующем пе- реложении основного результата (6.3.52) [9]. Серьезным ограничением является также требование дифференцируемости функции Беллмана. Для ряда практически важных задач это условие не выполняется. К числу таких задач относится, например, задача на быстро- действие, когда в (6.3.1) - (6.3.4) время окон- чания процесса не задано, а концы закреп- лены или подвижны, при этом L = 1, Н = 0. Отсутствие решения (6.3.54) в классе диффе- ренцируемых функций I) исключает при- менение для этой задачи динамического про- граммирования. Методы динамического программирова- ния являются составной частью методов, ис- пользуемых в исследовании операций, и при- меняются в задачах оптимального планирова- ния (распределение ресурсов, управление за- пасами, замена оборудования, прокладка мар- шрута). В варианте для дискретных систем метод динамического программирования сводит ис- ходную задачу к последовательности более простых задач минимизации функций мень- шего числа переменных. К распространенным численным методам приближенного решения задач динамического программирования отно- сят метод блуждающей трубки и метод локаль- ных вариаций. Метод блуждающей трубки заключается в следующем. Вначале выбирается весьма редкая сетка в пространствах, содержа- щих x(i) и u(fi. На этой редкой сетке в дис- кретном виде строится по шагам оптимальная траектория, соединяющая начальную и конеч- ную точки искомой траектории. После завер- шения этой операции сетка измельчается и в окрестности (в трубке) найденной ранее траек- тории ищется новая оптимальная траектория и т.д. В результате учета все большего числа
МАТЕМАТИЧЕСКИЕ ОСНОВЫ ОПТИМИЗАЦИИ ПРОЦЕССОВ УПРАВЛЕНИЯ 479 внутренних точек формируемые "трубки" блу- ждают, т.е. изменяют положение осевых ли- ний. Прекращение блуждания свидетельствует о том, что найденная траектория может был» оптимальной. Метод блуждающей трубки, как и Другие методы численного решения динами- ческого программирования, существенно со- кращает перебор при поиске оптимальной траектории, но локализует поиск экстремума функционала, так как ограничивает анализи- руемые траектории размерами трубки. Достаточные условия абсолютного мини- мума. Принцип тривиальной задачи . Основой подхода является сведе- ние исходной оптимизационной задачи типа (6.3.1) - (6.3.4) к простейшей или тривиаль- ной. Тривиальной задачей о минимуме функ- ционала [32] называют задачу, в которой тре- буется минимизировать функционал вида 7(х(Г), ы(0) = Ф(*('оМ)) + f R(x,u,t)dt (6.3.55) на множестве независимых друг от друга функций х(1) и . ы(1), определенных для t е №> Таким образом, проблема заключа- ется в построении таких скалярных функций R(x, и, I) и Ф(х(4)), х(/к)), чтобы, с одной стороны, новая задача в смысле значений ц(^п) и х(/оп) была эквивалентна прежней, т.е. (6.3.1) - (6.3.4), а с другой стороны, фор- мально значения функций z/(l) и х(1) не зави- сели друг от друга. Минимизация (6.3.55) или даже опреде- ление наименьшего значения этого функцио- нала заключается в выборе таких последова- тельностей значений и и х для последователь- ности моментов времени t е [Zb, /к], чтобы выполнялись условия Я(*оп > “on > 0 = inf Я(х, U, t), t е (Zo, tK); (6.3.56) ®(*оп('о)>*оп('к)) = inf®(x(Z0),x(/K)), (6.3.57) ще inf обозначает нижнюю границу. Здесь условие (6.3.56) действует на все "внутренние" точки траектории, а условие (6.3.57) - на гра- ничные точки. Условия (6.3.56), (6.3.57) с незначитель- ными замечаниями распространяются на слу- чай отсутствия явного решения, когда оно может был» представлено как предел некото- рой последовательности функций ц/О» хХ0- В общем случае функции R(x, и, f) и Ф(*0Ь), *(*к)) рекомендуется искать в виде п/ л дф(х,0 дф(х,0 с/ л R(x, и, t) = - + I* Г(х, I/, 0 + dt дх +L(x,u,t); (6.3.58) ®(x(Z0),x(ZK)) = Я(х(Гк),/к) + ф(х(/к),/к) - -ф(х(/оМо)> (6.3.59) где ср(х, I) - некоторая произвольная непре- рывная и дифференцируемая скалярная функ- ция. Произвол в задании (р можно использо- вать для того, чтобы лучше приспособиться к специфике конкретных задач. Изложенные здесь достаточные условия оптимальности в форме В. Ф. Кротова полу- чили в дополненном и переосмысленном виде название принципа расширения [13]. Исполь- зование этого принципа базируется на полном или частичном игнорировании связей объекта управления (6.3.2), что собственно и приводит к формальному расширению класса возмож- ных решений иоп(1) и хоп(0 исходной задачи за счет снятия ограничений на ее условия. Решения определяются путем организации минимизирующих последовательностей, кото- рые итерационным образом восстанавливают утраченные связи и одновременно приближа- ют формируемые траектории и/или управле- ния к искомым. В литературе приводятся до- казательства того, что для определенного клас- са оптимизационных задач это направление дает конструктивные результаты. Связь с другими мето- дами. Способ задания функции ср, исполь- зуемой в (6.3.58), (6.3.59), определяет метод решения задачи. Будем для простоты рассмат- ривать задачи с фиксированными концами. В этом случае условие (6.3.57) можно не про- верять. Переход к классическому вариационному исчислению 'осуществляется следующим обра- зом. Пусть выбираемая произвольно в (6.3.58) функция ф дважды дифференцируема и опре- делена на открытых областях задания х(1) и u(f). Тогда условие (6.3.56) можно заменить условием экстремума won> 0» т е- = О, = О (6.3.60) д*ОП dz/on или с учетом (6.3.58) уравнениями
480 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ Э2ф рт Э2ф Эф dF dL dtdx дхдхт дх дх дх (6.3.61) дф 5£+5£ = 0 дх ди ди ’ (6.3.62) выполняемыми при и - иоп и х = х^п. Если воспользоваться уравнением (6.3.2), полагать Эф / дх = Хт (/) и принять во внимание вве- денное обозначение гамильтониана, то из (6.3.61) и (6.3.62) можно получить соответст- венно уравнения (6.3.14) и (6.3.16) - уравне- ния Эйлера-Лагранжа. Решение этих уравне- ний совместно с (6.3.2) дает экстремали. При этом исследование матрицы вторых производных функции ^(ХоП, моп, /)> а именно д2Я д2Я дхдхт дхдит d2R d2R ,дидхт диди1, (6.3.63) как условия минимума Rlx^ won, 0 приводит к условиям Клебша и Якоби (6.3.9). Если полагать, что u(f) определено в замкнутой области Rr, т.е. имеет место (6.3.25), то второе условие (6.3.60) неприемле- мо. Тогда, расширяя размерность объекта управления добавлением уравнения (6.3.28), обозначая Эф / Эхр = yJ(O и принимая во внимание (6.3.36), получим из (6.3.61) уравне- ние (6.3.64), а вместо условия (6.3.62) условие (6.3.40). Так метод приводится к формализму метода принципа максимума. Можно также показать, что уравнение Веллмана (6.3.52) может быть получено из (6.3.56) при специальном задании функции ф(х, /) в (6.3.58). Для этого следует выбирать ф(х, /) такой, чтобы функция (6.3.58) не зави- села от х(1), Тогда условие (6.3.56) выполнится в случае inf^ + ^F + £ =C(t), (6.3.64) ugQ dt дх где C(f) - произвольная кусочно-непрерывная функция. Уравнение (6.3.64) является обобще- нием (6.3.52). Уравнение (6.3.52) соответствует частному случаю для открытой области Q и С(0 = о. Наряду с изложенным к выбору матрицы ф(х, I) можно подходить таким образом, что явных аналогов среди известных методов оп- тимизации не будет. При этом конструирова- ние функции ф(х, I) и формализация различ- ных условий, накладываемых на нее в каждом конкретном случае, допускают использование множества частных рекомендаций и методик, основанных на опыте разработчика. Аналитическое конструирование регулято- ров. Термин "аналитическое конструирование оптимальных регуляторов" (АКОР) охватывает практически все задачи управления динамиче- скими объектами с линейно входящими управлениями х = f(x,t) + q>(x,t)u, (6.3.65) xeR”, ueRr, и минимизацией функционалов с аддитивны- ми функциями затрат на управление (6.1.46) в классическом варианте и (6.1.50) - в некласси- ческом варианте. Аналитическое конструиро- вание обычно понимают как синоним синтеза алгоритма оптимального управления на стадии проектирования САУ [44]. Рассматриваемая задача аналитического конструирования заключается в определении управления (6.3.1) для объекта (6.3.65), достав- ляющего минимум классическому функционалу h / = г3[х(/2)1 + р3[х(е),е1<й + 'I h + i/T(G)fc-1i/(G)dO (6.3.66) П или неклассическому функционалу h / = r3[x(/2)] + jG3[x(e),9i<ie + 'i h h + J lZ3[«(9),9]d9 + J С/з’Кп CO. *1 *1 (6.3.67) при произвольных начальных условиях *('l) = я». По сути постановка оптимизационной задачи сужена следующими условиями: а) уравнения объекта представимы в виде (6.3.65); б) область возможных значений управляю- щих воздействий в Rr является незамкнутой; в) все возможные переходные функции объекта (6.3.65) непрерывно дифференцируе- мы в R п;
РЕШЕНИЕ ЛИНЕЙНО-КВАДРАТИЧНЫХ ЗАДАЧ СИНТЕЗА ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ 481 г) минимизируемый функционал (6.3.66) или (6.3.67) выпукл относительно управления и (а также 1/оп); д) задача формулируется только как зада- ча с закрепленным левым и свободным пра- вым концами. Перечисленным условиям может был» дана физическая интерпретация. В большинст- ве случаев практического синтеза САУ эти условия приводят к несильным ограничениям. Уравнение Беллмана. Ос- новные соотношения аналитического конст- руирования могут был» получены различным образом. Воспользуемся (6.3.52) - (6.3.54). С учетом (6.3.65) и (6.3.66) запишем уравнение (6.3.52) dv . Гак — + mm dt и — (f + cpiz) + С3 + Q^uTk lu =Q. дх (6.3.68) Поскольку управление и следует выбрать в открытой области, то можно воспользоваться необходимым условием минимума, продиффе- ренцировав выражение в скобках по и и при- равняв нулю, т.е. 4“<Р + = 0. (6.3.69) дх Отсюда получаем более конкретную, чем (6.3.53), формулу для оптимального управле- ния »оп = • <63-70) Подстановка (6.3.70) в (6.3.68) дает уравнение Беллмана дУ dt дУ , ЭК . . +17/-05a7ч,*ч, = -0з, (6.3.71) решаемое с граничным условием И(/2) = К3[х(/2)]. Таким образом, метод аналитического конструирования регуляторов при классиче- ском функционале (6.3.66) сводится к реше- нию уравнения в частных производных (6.3.71) и использованию закона управления (6.3.70). Уравнение Л я п у н о в а . Если решается задача минимизации неклассиче- ского функционала (6.3.67), то соответствую- щая подстановка в (6.3.52) приводит к уравне- нию дУ --+ ШШ dt и ^<f + W)+Q3+U3+U*3 = 0. (6.3.72) Учитывая то, что управление ищется в откры- той области, а также используя соотношение (6.1.51) для функций U3 и U3 , получим дУ д — ф ч--- дх т ди и. = о, откуда = (6.3.73) Это относительно общая форма решения рас- сматриваемой задачи, записанного в неявном виде. Привести (6.3.73) к явному виду можно только конкретизировав фикции U и U* в (6.3.67). Так, если эти функции заданы квадра- тичными формами (6.3.74) то (6.3.73) уступает место формуле (6.3.75) совпадающей с (6.3.70). Если (6.3.73) подставить в (6.3.72) и учесть (6.1.51), то получим уравнение в част- ных производных дУ дУ , „ — + — f = -Q3f (6.3.76) dt дх называемое уравнением Ляпунова и решаемое при граничном условии К(/2) = ^зМ^2)Ь Уравнение (6.3.76) проще уравнения (6.3.71) благодаря отсутствию квадратичной формы относительно частных производных дУ / дх . Это определяет существенное упро- щение вычислительных процедур решения оптимизационной задачи. Применение метода предполагает решение уравнения (6.3.76) и использование закона (6.3.75). 6.3.2. РЕШЕНИЕ ЛИНЕЙНО- КВАДРАТИЧНЫХ ЗАДАЧ СИНТЕЗА ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ Линейно-квадратичными принято назы- вать задачи, в которых объект управления представлен линейной моделью 16 Зак 1023
482 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ x = ax + bu, xeRn, ueRr, (6.3.77) где а и b - заданные матрицы коэффициентов, а минимизируемый функционал является квадратичным как по вектору управления, так и по вектору состояния, т.е. имеет вид (6.1.47) или (6.1.54). Задача стабилизации. Основным содер- жанием задачи стабилизации является удержа- ние состояния объекта вблизи некоторого за- данного неизменного состояния. При этом широко распространенным приемом является помещение начала координат пространства Rn именно в точке заданного состояния. То- гда уравнение (6.3.77) описывает отклонения состояния объекта от заданного. Таким обра- зом, задача сводится к "обнулению" компонент вектора состояния. Сравнивая (6.3.65) с (6.3.77) и (6.3.66) с (6.1.47) или (6.1.54), можно убедиться, что для рассматриваемого случая справедливы соотно- шения f = ах; <р = *; V3 = 0,5хт (/2 )рх(/2); (6.3.78) Q3 = 0,5хт₽х. Выбор матриц весовых коэффициентов р и 0 в (6.3.78) осуществляется на основе накоплен- ного опыта или по принципу равных вкладов (5.1.60), когда веса берутся обратно пропор- циональными предполагаемым максимальный значениям соответствующих компонент векто- ра х(1) с последующим уточнением в интерак- тивном режиме. Если задача решается с классическим функционалом, то необходимо (6.3.78) подста- вить в (6.3.70) и (6.3.71). Дополнительно при- нимается предположение о поиске функции Веллмана в виде К(/) = О^х1 (t)A(t)x{t), (6.3.79) гае A(f) - пока неизвестная симметричная матрица. В результате (6.3.70) можно заменить со- отношением «оп = ~kb7Ax, (6.3.80) а уравнение (6.3.71) преобразуется к виду хтЛх + хтатАх + хтАах - xTANcbTAx = -хт0х (6.3.81) при граничном условии хт(/2)Л(/2)х(/2) = хт(/2)рх(/2). Уравнение (6.3.81), как и граничное ус- ловие, может быть удовлетворено только при условии, что матрицы соответствующих квад- ратичных форм удовлетворяют уравнению А + а*А + Аа- AbkbTA = -0 (6.3.82) при граничном условии A(tz) = р. Это мат- ричное уравнение согласно симметрии А со- держит л(л + 1)/2 неизвестных. Уравнение (6.3.82) известно как матрич- ное уравнение Риккати. Оно при единствен- ных граничных условиях всегда имеет единст- венное решение. Интегрирование уравнения (6.3.82) всегда осуществляется в обратном вре- мени. Если интервал оптимизации неограничен справа, т.е. /2 °°> то используют установив- шееся решение уравнения (6.3.82), т.е. реше- ние алгебраического уравнения атА + Аа - Abkt? А = -р, (6.3.83) называемого уравнением Лурье. Это уравнение -имеет множество решений, из которых следует выбирать только положительно-определенное. Численное решение уравнений Риккати и Лурье как составная часть линейно- квадратичной задачи АКОР обеспечена значи- тельным числом отлаженных программ (под- программ) [33]. Значительно проще вычисления, связан- ные с оптимизацией процесса стабилизации объекта (6.3.77) при использовании некласси- ческого функционала ФОР. Действительно, подстановка (6.3.78) и (6.3.79) в (6.3.75) и (6.3.76) дает аналогичный закон управления (6.3.80), но другое уравнение: а* Ах + хтат Ах + хт Аах = -хт0х, (6.3.84) которое на том же основании приводится к матричному уравнению А + атА + Аа = -р, (6.3.85) выгодно отличающемуся от (6.3.82) отсутстви- ем "квадратного члена" AbkbTA. В случае поиска установившегося решения (6.3.85) вы- рождается в линейное алгебраическое уравнение атА + Аа = (6.3.86) имеющее в отличие от (6.3.83) всегда единст- венное решение. Уравнение (6.3.86) часто
РЕШЕНИЕ ЛИНЕЙНО-КВАДРАТИЧНЫХ ЗАДАЧ СИНТЕЗА ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ 483 именуется матричным алгебраическим уравне- нием Ляпунова. Для стационарного случая (6.3.86) при неустойчивом объекте устойчивость замкнутой системы не гарантируется. Различные частные случаи задачи стабилизации с различным зада- нием граничных условий, с наличием контро- лируемых возмущений приведены в [39]. Ли- нейно-квадратичной задаче АКОР по крите- рию ФОР соответствует программа KRAS [33]. Задача слежения формулируется для слу- чая, когда вектор состояния объекта (6.3.77) должен наилучшим образом в смысле квадра- тичного критерия (6.1.47) или (6.1.54) воспро- изводить заданное изменение состояния во времени. В такой задаче целесообразно начало координат выбрать произвольно и полагать, что в функционалах (6.1.47) и (6.1.54) фшури- руют не компоненты х(1), а разности компо- нент Hx(t) - Уз(0, где y3(t) - заданный выход. Таким образом, получаем классический функ- ционал / = 0^-у3)1р(йк-у,) + г2 + 0,5 J (Нх - у3УР(Нх - y3)dd + Г1 г2 А (6.3.87) и неклассический функционал 1 = 0,5(Нх-у3)тр(Нх-у3) + h + О^(Ях-у3)1Р(Ях-уэ)Л + ?г2 uTk~ludQ + 0^| и^к '1 '1 (6.3.88) Воспользуемся опять (6.3.70), (6.3.71) или (6.3.75), (6.3.76), но функцию К(1) в том и другом случаях будем искать в виде V (/) = 0,5хт Ах + Втх + С, (6.3.89) ще В и С - дополнительные матрица-столбец и скаляр. Подстановка (6.3.78) и (6.3.89) в (6.3.70) и (6.3.71 ) дает для случая классиче- ского функционала закон управления «оп = -kbT (Ах + В) (6.3.90) и уравнение 0^хтЛх + Втх + С + 0^5хтатАх + 0^хтЛах + + Втах - QJ5xTAbkbTAx - QJ5xTAbkbTB - - QjBTbkbTAx - 0,5BTbkbTB = = -0^5xTHTpHx + О,5хтЯт0у3 + + O^jpf&c - 0,5г1РГ3 (63.91) при 1раничном условии 0,5хтЛ(/з)х + B'it^x + C(/i) = = 0,5хтЯтрЯх - о,5х1Я1руэ - - 0^у3рНх + (6.3.92) Сравнивая члены с одинаковыми степенями х(0, получим уравнения: А + o’А + Аа - AbkbTA = -ЯтрЯ; B + aTB- Abkb'B = Нт$у3; (6.3.93) С - Ofig'bkti'B = -ОЛ^РУз с траничными условиями A(t2) = ЯтрЯ, B(t2) = Нтру3, C(t2) = 0^УзТруэ. (6.3.94) Решая задачу минимизации неклассиче- ского функционала, следует (6.3.78) и (6.3.89) подставить в (6.3.75) и (6.3.76). После соответ- ствующих преобразований получим “on =-kbT(Ax + B); (6.3.95) А + а1 А + Аа = -ЯтрЯ; В + а'В = НЧ>у3; (6.3.96) С = -ОДу^ру,. Последние уравнения в (6.3.93) и (6.3.96) можно не решать, так как скаляр С не исполь- зуется ни в (6.3.90), ни в (6.3.95), а введен лишь для балансировки соответствующих сла- гаемых в уравнениях Беллмана (6.3.71) и Ля- пунова (6.3.76). 16*
484 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ Анализ (6.3.90), (6.3.93) и (6.3.95), (6.3.96) показывает, что наряду с обратной связью по состоянию (слагаемые Ах) в задаче слежения законы управления содержат допол- нительные слагаемые, определяемые заданным выходом у3. При этом в оптимальной системе заданный выход предварительно фильтруется и-мерным линейным динамическим фильт- ром, определяемым свойствами (матрицами коэффициентов) исходного объекта. В случае неограниченного интервала управления, как и в предыдущей задаче, сле- дует использовать вынужденные решения уравнений (6.3.93) или (6.3.96). Если рассмат- ривается задача оптимизации слежения на скользящем интервале [/, t+ 7], то соответст- вующим образом должны назначаться гранич- ные условия для (6.3.93) или (6.3.96) [44]. Задача терминального управления. Терми- нальной принято называть такую задачу, для которой характерно предъявление специаль- ных условий к конечному состоянию объекта. Поскольку методы аналитического конструи- рования разработаны только для задачи со свободным правым концом, то требования к терминальному (конечному) состоянию зада- ются только соответствующей терминальной функцией функционала. (6.1.47) или (6.1.54). Матрица весовых коэффициентов р определяет "вклад" каждой составляющей штрафа за от- клонение от заданных в момент условий. Очевидно, что в этом случае вынужден- ное решение уравнений (6.3.82) или (6.3.85) не удовлетворит поставленную задачу, как и не удовлетворит оптимизация на скользящем интервале времени. Тогда возникает необхо- димость поиска полного решения соответст- вующих матричных уравнений при фиксиро- ванных в момент (2 граничных условиях. Та- ким образом, решения A(f) классического и неклассического функционалов будут функ- циями времени, а соответствующие законы (6.3.80) - нестационарны. Положение не меня- ет наличие или отсутствие подынтегральной фикции хт(0₽х(0- Эту функцию обычно берут ненулевой для удовлетворения дополни- тельных требований, предъявляемых к пере- ходному процессу. Реализация такого управления предпо- лагает запоминание и последующее воспроиз- ведение либо Л(/), либо матрицы коэффици- ентов закона управления klFAff). Принципиальной особенностью терми- нальных задач является то, что в отличие от задачи стабилизации и слежения устойчивость исходного объекта никак не отражается на решении задачи как при классическом, так и неклассическом функционалах. Задачи с ограниченной наблюдаемостью управляемого объекта. Во многих прикладных задачах нет возможности непосредственно наблюдать (измерять) компоненты вектора состояния х(1) объекта (6.3.77). В этом случае наблюдается так называемый выход объекта, и векторная выходная величина в общем случае связана с вектором состояния соотношением y(t) = Hx(t), xeRn, yeR1, (6.3.97) где Н - матрица заданных коэффициентов, не обязательно обратимая. Тогда решение задачи управления объек- том (6.3.77) сводится к специальным приемам и подходам, так как законы управления типа (6.3.80), (6.3.90) неприемлемы. Существует несколько способов решения задачи в рас- сматриваемом случае. Первый способ (см. гл. 6.4) заключается в том, что используется специальный "наблюдатель" (система восста- новления), позволяющий осуществить оцени- вание всех компонент вектора x(f), а затем реализуется один из полученных выше зако- нов. Второй способ заключается в следующем. Решается вспомогательная задача упрощения структуры регулятора, точнее аннулирования нереализуемых по соображению наблюдаемо- сти связей. Решение этой задачи, в частности, сводится к следующему [44]. Если искомый закон управления представить в виде u(t) = -Kx(t), (6.3.98) где матрица К размером г х п характеризуется тем, что отличными от нуля являются только предварительно указанные элементы, то вво- дится дополнительная матрица Z, элементы которой принимают значения только 0 и 1, и определяется операция поэлементного умно- жения матриц одинакового размера. Тогда u{t) = -[*'* Z]x(0, (6.3.99) где К' - матрица размера г х л, не имеющая ограничений на значения элементов. Выбор матрицы К' осуществляется из условия I(K^n,Z) = minI(K',Z) (6.3.100) или условия I(-^субоп»0 + е)Л)п (6.3.101) с использованием любого метода поиска ми- нимума функции многих переменных (см. гл. 6.2). Аналогичный подход используется при выявлении несущественных связей закона
ОПТИМАЛЬНЫЕ ПРОГНОЗИРУЮЩИЕ СИСТЕМЫ УПРАВЛЕНИЯ 485 управления (6.3.80), которыми можно пренеб- речь. К недостаткам данного подхода относят большой объем вычислений и неединствен- ность решений. Для решения рассматриваемой задачи можно также применять методы параметриче- ской оптимизации (см. гл. 6.2). 6.3.3. ОПТИМАЛЬНЫЕ ПРОГНОЗИРУЮЩИЕ СИСТЕМЫ УПРАВЛЕНИЯ Трудности решения многомерных много- связных нелинейных задач оптимизации при классических целевых функционалах. При оди- наковых предположениях (отсутствие допол- нительных ограничений, накладываемых на u(t), x((z)) задача Больца min и h гэ|х(/2))+/Дх(0),«(0),ем) А (6.3.102) х(0 = /(х(0,и(П,П (6.3.103) при любом методе решения (классическое вариационное исчисление, принцип максиму- ма, динамическое программирование) приво- дит к одинаковым необходимым условиям локального минимума в виде уравнений Эйле- ра-Лагранжа х(0 = /(х(П>«(0,П (6.3.104) ЦО = -fx40 - Lx> (6.3.105) Lu + V (/)/„ = о (6.3.106) при граничных условиях ХГ=Г1 =х(/!), (6.3.107) ЧЬ) = ^[х^)]. (6.3.108) Здесь Уравнение управляемого объекта (6.3.104), где и определяется из алгебраического соотноше- ния (6.3.106), решается совместно с сопряжен- ным уравнением (6,3.105) на интервале ft, У при выполнении двухсторонних граничных условий (6.3.107), (6.3.108). Решение уравне- ний (6.3.104) - (6.3.106) при начальном усло- вии (6.3.107) и каком-либо значении Xft) можно рассматривать как прогнозирование на интервале ft, /J Для системы (6.3.103) - (6.3.106) 2л-го порядка (х е RnД е Rn). Таким образом, задача прогнозирования дви- жения замкнутой системы является составной частью задачи оптимизации при классическом функционале, однако далеко не исчерпывает эту задачу, так как для нахождения оптималь- ного управления здесь необходимо еще удов- летворить граничному условию (6.3.108) на правом конце. Традиционным универсальным числен- ным методом удовлетворения двухсторонних краевых условий является метод многократных решений (последовательных приближений) с минимизацией невязки на правом конце. Это означает многократное решение уравнений (6.3.104) - (6.3.106) с последовательной мини- мизацией нормы разности ||Х(/2) - KaJxfaMjl (6.3.109) Число "попыток" или "прогонов", необходи- мых для такой, минимизации (с заданной точностью), зависит от алгоритма и топологи- ческой структуры функций, входящих в (6.3.104) - (6.3.108), точнее, от топологической структуры зависимости нормы (6.3.109) от начальных векторов xft), Xft) (см. гл. 6.2). Поэтому это число трудно поддается общей оценке. Однако даже в области притяжения главного экстремума это число с увеличением размерности задачи (2л) обычно растет как (2л)<*, где d > 2. При этом одноэкстремаль- ность является исключением. При наличии множества экстремумов число прогонов увели- чивается в GG^ раз, где G - объем области изменения xft), Xft); G^ - объем области притяжения главного минимума нормы (6.3.109). Численное интегрирование уравнений (6.3.104) - (6.3.106) на каждом прогоне ослож- нено неустойчивостью сопряженного движе- ния (6.3.105) при устойчивом (6.3.104) и на- оборот. Для управления в реальном времени чис- ленное интегрирование должно выполняться в ускоренном времени, и необходимое быстро- действие ЭВМ составит Nq (2n)d GG^ v, (6.3.110) где Nq - число элементарных арифметических операций для однократного численного интег- рирования уравнений (6.3.104) - (6.3.106), v - тактовая частота управления. При Nq = 10б, п = 10, d = 2, GG^ =100, v =20 с-1 необхо- димое быстродействие составит 8 * 1011 опера- ций в секунду.
486 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ Придал минимума обобщенной работы. Общая форма принципа минимума обобщенной ра- боты. Приведем наиболее общую из пред- ложенных для одноэкстремальиой задачи формулировку принципа минимума обобщен- ной работы. Предположим, что управляемый объект (обобщенный управляемый объект) описывается дифференциально-операторным векторным уравнением с линейно входящим управлением: х = F[x, /] + Ф[х, /]«, (6.3.111) где F[х, /], Ф[х, /] - соответственно векторный и матричный операторы, действующие из функционального пространства, которому принадлежит x(f). Это более общее описание детерминированной динамической системы, чем описание посредством обыкновенного векторного дифференциального уравнения (6.1.10). В виде (6.3.111) Moiyr описываться системы с последействием (чистым запаздыва- нием), дискретными элементами, конечными автоматами и др. Уравнение (6.3.111) может служить и для описания типа "вход-выход", и для описания в пространстве состояний. В последнем случае операторы F и Ф заменя- ются иа функции/и <р и (6.3.111) принимает вид обыкновенного векторного дифференци- ального уравнения в форме Коши: х = /(х, t) + ф(х, t)u. (6.3.112) Предполагаем, что свободное движение д (и = 0) обобщенного детерминированного динамического объекта х ='Дх,ГГ является однозначным, т.е. полностью опреде- ляется начальным условием x(Iq) = xfr х(О = Х(хо,/,/о), tZtQ. (6.3.113) Предполагаем также, что дифференциально- операторное уравнение с частными производ- ными ^7 + Л X, /] = -Оз (X, 0 (6.3.114) di дх (аналог уравнения Ляпунова) при заданном граничном условии Цх, /2) = ^з(х, (2) и за- данной функции Q^x, f) также имеет единст- венное решение К(х, /)• Функционал обобщенной работы (ФОР) принимается в форме, несколько более общей, чем (6.1.50), а именно: / = И,(х(/2),/2) + +/ {ОэМ0).0)+Дх(0),«(е),иоп(е),е]}л, (6.3.115) где L - заданная функция указанных аргумен- тов, такая что существует единственная век- торная функция-столбец я(х, «оп, I), ПРИ ко- торой Д*.«.«оп,0 - яЧаИоп.Ои = О V и = «оп, > о V и * «оп. (6.3.116) Это условие можно формулировать также сле- дующим образом: должна существовать един- ственная векторная функция л(х, «оп, /), ска- лярное произведение которой на вектор «оп тождественно равно заданной функции £(х, и, «оп, I) при и = «оп и меньше Z(x, и, «оп, 0 ПРИ и * иоп- Все фор (6.1.50) - (6.1.54) являются частными случаями ФОР (6.3.115), (6.3.116). Оптимальное управление, минимизи- рующее ФОР (6.3.115), (6.3.116) для объекта (6.3.111) при упомянутых условиях, определя- ется выражениями dTV “ = «ОП. = -Фт[х,/)—— дх (6.3.117) или « =«оп, Я(х,«оп,0 = + дх1 h +jQ3Wx,e,/),0)d9 t (6.3.118) Одно из наиболее простых доказательств за- ключается в следующем. Полная производная по времени функции К(х, /) - решения (6.3.114) - согласно уравнению (6.3.111) и выражению (6.3.114) будет F =? + |^(Лх,/] + ф[х,/]И) = dt дх = -Оз(^.о+4^-ф1х,/]». дх
ОПТИМАЛЬНЫЕ ПРОГНОЗИРУЮЩИЕ СИСТЕМЫ УПРАВЛЕНИЯ 487 Интегрируя по интервалу [/, У на движении замкнутой системы, получаем И(х(Г2),Г2)-К(х(Г),0 = г г ЗК =- Г(?э(х(е),е)л+ f-^-<D[x(e),e]«(e)do. J J дх t t Из этого выражения, условия И(х(/2),/2) = = ^з(х(^2),^2) и (63.115) следует г2 / = и(х(о,г2) + J £(х(0),«(е), «оп(е),е)л + г + Г^Ф[х(0),е]«(О)Л. (6.3.119) * дх t Полагая в выражении (6.3.115) ti £ /2, ti = /, убеждаемся, что при неотрицательных функ- циях Оз и L К(х(0, /)• Согласно (6.3.116), (6.3.119) / = К(х(0,0 + rf dV 1 + fкт(х(е),Иоп(е),е)+^Ф[х(е),е] «(©)«+ * I дх I t 4 J h + J x|/dO, t где [=0 V« = «on, w < |>0 V«#«on. Таким образом, min I имеет место при “."on dJV u = um, x(x, «оп, t) = - Фт[х, /J ——. dx (6.3.120) Первая часть теоремы доказана. Для до- казательства второй части, т.е. выражения (6.3.118), интегрируем по интервалу [/, /2] уравнение (6.3.114) для свободного движения с учетом условия на правом конце. Используя выражение (6.3.113), получаем Г(х,/) = К,(Х(х,/2,/),/2) + h + |0з(*(х,6,0.0)49. (6.3.121) t Подставляя это выражение в (6.3.12), получаем (6.3.118). Выражение (6.3.118) является общей формой алгоритма с прогнозирующей моде- лью. В отличие от оптимизации по классиче- ским функционалам здесь прогнозируется свободное (неуправляемое) движение объекта и нет двухточечной краевой задачи (решается задача Коши). Это и ведет к резкому^ сниже- нию вычислительных затрат при численной реализации (6.3.118). Частные формы прин- ципа минимума обобщен- ной работы. Если вместо дифференци- ально-операторного описания объекта (6.3.111) используется дифференциальное (6.3.112), то в выражениях (6.3.117), (6.3.118) операторы уступают место функциям dJV и = «оп. ”(*,«оп.О = дх (6.3.122) "(х.Иоп.О = -Фт(х,/)^-[Гэ(Х(х,/2,0,/2) + + |сэ(Х(х,0,0,0)40 Г (6.3.123) Если подынтегральная функция ФОР, отра- жающая затраты на управление, имеет вид £(х,«,«оп) = + />/«%„), /=1 ТО л(х, цоп ) = colon Действительно, подставляя это выражение в (6.3.116), убеждаемся, что это условие выпол- няется. В данном случае оптимальное управле- ние (6.3.120) нагляднее записывать в скаляр- ной форме п - UJ оп ~ 1 dV~\qJ~l J = 1, 2.....г. (6.3.124)
488 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ Это случай наличия нелинейного звена (6.1.62) в каждом канале оптимального управления. Приру= ty = 2(/ = 1, 2, ...» б “ = «ОП = = = -А(х)фт(х,/)^[Из(Х(х)/2,/),?2) + г2 t (6.3.125) Это случай квадратичных затрат на управление, наиболее распространенный при использовании метода обобщенного или рас- ширенного объекта. Различные редакции алгоритма с прогно- зирующей моделью. Если не принимать во внимание таких специфических вариантов, как физические (натурные) маломасштабные про- гнозирующие модели, применимые лишь в некоторых случаях, то практически единствен- ным средством реализации рассматриваемых алгоритмов является ЦВМ. Компьютерная реализация предполагает использование разностных схем непрерывных алгоритмов. Это само по себе порождает раз- личные редакции алгоритма с прогнозирую- щей моделью. Кроме того, возможны и раз- личные варианты непрерывного аналитиче- ского описания этого алгоритма. Для кратко- сти ограничимся исходными формами алго- ритма с прогнозированием. Алгоритм управления (6.3.73), (6.3.76), вытекающий из минимизации ФОР (6.3.67) для объекта (6.3.65), наряду с отмеченными выше невысокими потребными вычислитель- ными затратами обладает еще одним полезным свойством. Решение уравнения в частных про- изводных (6.3.76) может быть построено на сравнительно небольшом числе прогнозов движения объекта (6.3.65). Действительно, из метода характеристик [8] для решения уравнения (6.3.76) вытекает, что искомое решение строится на интеграль- ных кривых, удовлетворяющих обыкновенным дифференциальным уравнениям (6.3.126) х = /(х,0; при граничных условиях /ар \т "ST > (6.3.129) \ дх ) где р = (dV / дх)т - вектор частных произ- водных функции К(х, I) по компонентам век- тора состояния. Уравнение (6.3.127) может быть получено из (6.3.76) непосредственным дифференцированием по х и изменением по- рядка дифференцирования. Кроме того, при вычислении фикции V(x, f) на свободной тра- ектории (т.е. удовлетворяющей (6.3.126) или (6.3.65) при и = 0 ) из (6.3.76) вытекает соот- ношение V = -Q3(x,t). (6.3.130) Уравнения (6.3.126), (6.3.127), (6.3.130) являются основой алгоритмов с прогнозирую- щей моделью. Суть этих алгоритмов сводится к тому, что на основе интегрирования данных уравнений строится решение уравнения (6.3.76) и тем самым решается оптимизацион- ная задача (6.3.65), (6.3.67), (6.3.73). Подоб- ный способ решения задачи ориентирован не на поиск структуры функции V(x, f) в области ее определения пространства №, как это имеет место при реализации многих других спосо- бов, а на вычисление значения функции V(x, f) лишь в некоторой окрестности теку- щего состояния. Размер и топология этой ок- рестности выбираются так, чтобы с приемле- мой точностью можно было вычислить гради- ент dV/dx и использовать его в законе (6.3.73) или (6.3.75). Получили развитие различные варианты (редакции) алгоритмов с прогнозирующей моделью [8, 44]. Алгоритм с численным, дифференцированием. В окре- стности текущего состояния (6.3.128) выбира- ется некоторое множество состояний, число которых превышает размерность вектора управления по крайней мере на единицу |xg j, j = 1,5, s £ г +1J. Из каждого состоя- ния этого множества как из начального осуще- ствляется моделирование движения объекта согласно (6.3.126) и вычисление на получае- мой траектории xfl) функции И(х, I) с ис- пользованием (6.3.130), т.е. h Vj(t) = V3(xj(t2),t2) + J Оэ(ху(е),0)Л; t *('1) = х0; (6.3.128) (6.3.131)
ОПТИМАЛЬНЫЕ ПРОГНОЗИРУЮЩИЕ СИСТЕМЫ УПРАВЛЕНИЯ 489 ^Xy=/(Xy,0), Xj(t) = XOj. (6.3.132) Затем полученные s значений Vj(f) использу- ются для численного приближенного вычисле- ния dV/dx. При относительной идейной простоте алгоритм обладает повышенными вычисли- тельными затратами в случаях многомерных объектов, а также дает приближенное решение. Алгоритм модифициро- ванный. Вместо численного дифференци- рования осуществляется непосредственное вычисление dV/дх или вектора р интегрирова- нием уравнения (6.3.127). Алгоритм реализует- ся за несколько шагов. На первом шаге интег- рируется (6.3.126) с начальным условием (6.3.128) до момента На втором шаге по формуле (6.3.129) рассчитываются компоненты вектора р(&). На третьем шаге совместно ин- тегрируются (вследствие зависимости df/dx от х(|)) уравнения (6.3.126) и (6.3.127) в обрат- ном времени до момента текущего t. Получен- ное значение p(f) подставляется в (6.3.73) или (6.3.75). Алгоритм с матрицей чувствительности. Вводится до- полнительная матрица Z(9,/) = dx(Q) / dx(t), выражающая чувствительность состояния в момент 9 к изменению состояния в момент t (t < 9). Эта матрица удовлетворяет уравнению и начальному условию ^Z(e,z) = ^Z(e,o, z(t,t) = E. 49 дх (6.3.133) Тоща согласно правилу дифференцирования сложной функции, примененного к соотноше- нию типа (6.3.137), получим решение dV/dx формируется на основе моде- лирования движения объекта (6.3.126) с быст- роменяющимися возмущениями состояния 5х(/). Эти возмущения должны удовлетворять дополнительным условиям усреднения 8х(/) = 0, ах(Г)§Хт(О = 4, (6.3.135) ще d - заданная, обычно диагональная, мат- рица. Возмущение 8х(1) рекомендуется созда- вать в виде функций Уолша, т.е. кодовой группы, составленной из прямоугольников. Если результаты моделирования движения объекта (6.3.126) обозначить Х(х(1), А 9), ще t и 9 - моменты возбуждения и наблюдения, то для вектора р(1) можно записать ХО = +М'МД2)^гт + + ffix(r)XT(x(O + fix(O,/,0) ax(9) (6.3.136) Сравнение (6.3.136) с (6.3.134) показывает, что полученные усреднением матрицы с точностью до матричного множителя d аппроксимируют матрицы чувствительности 0 и Zr(9, /)• Алгоритм с аналитиче- ским решением. Если для уравнения (6.3.126) может быть получено аналитическое решение Х(9, /, х(/)), то результат дифферен- цирования (6.3.131) по х можно представить в виде аг(/2,/,х(/)) . МО ХО = ак,д2) . М'2). хо = zT(/2,0 дГ3('2) . МО). аГ(9,/,х(0) . dx(t) аоэ(9) . МО) . 49, ZT(0,O ар,(е) . М0). л. (6.3.134) При интегрировании (6.3.134) требуется одно- временное интегрирование в прямом времени уравнений (6.3.133) и (6.3.126). Итого размер- ность интегрируемых систем уравнений воз- растает в п + 2 раза, но исключено интегриро- вание в обратном времени. Результат вычисле- ния р(0 используется в (6.3.73) или (6.3.75). Алгоритм с синхронным детектированием . Приближенное (6.3.137) ще все составляющие представлены в аналити- ческом виде. Очевидно, это наименее трудо- емкий в вычислительном плане алгоритм, но требуются большие затраты при подготовке. Кроме того, в большинстве практических задач получение аналитического решения не осуще- ствимо. Оценка необходимой вычислительной про- изводительности. Наибольшая вычислительная производительность характерна для режима реального или ускоренного времени, коща оптимальные управления синтезируются и
490 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ реализуются в самом процессе управления. Необходимая вычислительная производитель- ность управляющей ЦВМ зависит при этом от размерности и степени сложности модели управляемого процесса, его темпа, алгоритмов обработки информации и алгоритмов собст- венно управления, уровней шумов и других возмущающих воздействий и ряда дополни- тельных факторов. Управляемый процесс и наблюдение счи- таются детерминированными. В дальнейшем (см. гл. 6.4 и 6.5) приближенно оцениваются вычислительные затраты на реализацию других компонентов полного комплекса алгоритмов оптимального по критерию ФОР управления в реальном времени. Для цифровой реализации необходимо построение разностных схем рассмотренных выше непрерывных алгоритмов. Для дифференциальных моделей управ- ляемых процессов типа (6.3.65) разностные схемы получаются на основе традиционных или специальных ("быстрых") [9] методов чис- ленного интегрирования обыкновенных диф- ференциальных уравнений и интерполяции функций многих переменных, выражающих характеристики обобщенного объекта. Основой алгоритма с прогнозирующей моделью служит численное интегрирование уравнения свободного движения на интервале оптимизации (прогнозирования) [/j, ^1- Здесь характерны два случая: скользящий интервал оптимизации [/, t + Топ], Топ = const и ин- тервал с заданным конечным моментом вре- мени [/, /2]» h = const. В первом случае ин- тервал прогнозирования постоянен, во втором случае, характерном для терминальных задач, он переменный: Топ = /2 - Для того чтобы подчеркнуть то обстоятельство, что в алгорит- мах используется модель реального объекта или процесса, введем индекс "м". В частности, уравнение свободного движения модели запи- шем в виде *м =/m(W)- (6.3.138) Допустим, что для численного интегрирования уравнения модели (6.3.138) на интервале Топ с необходимой точностью требуется Nt ша- •* оп гов; на каждом шаге значение fM должно вы- числяться ави раз (порядок метода); число элементарных арифметических операций при однократном вычислении fM составляет Nf Здесь предполагается, что часть членов (функций), входящих в fM(x, t), могут хра- ниться в памяти в табличной форме. Опера- ции считывания этих величин не учитываются. Пусть тактовая частота повторения (частота прерывания) составляет v Гц. Тогда вычисли- тельная производительность, необходимая для реализации прогнозирования в темпе управле- ния, составит sII7VyWT’onV. Для формирова- ния оптимального управления в варианте чис- ленного дифференцирования необходимо на каждом цикле v-1 вычисление главной части ФОР, численное дифференцирование (числен- ное определение градиента) этой части и ум- ножение на Ахрт (см., например, (6.3.125)). Из всех этих вычислительных затрат при трубой оценке стоит учитывать лишь численное диф- ференцирование. При односторонней схеме численного дифференцирования общая при- ближенная формула необходимой вычисли- тельной производительности будет иметь вид = ^NfNTm (г + l)v, (6.3.139) где г - размерность вектора управления. При ави = 4 (метод Рунге-Кутта четвертого поряд- ка) Nf= 104, NT = 100, г = 3, v = 10 Гц, Nz = 160 • 106 операций в секунду - весьма большая величина. Для сокращения необходимой вычисли- тельной производительности рекомендуются следующие способы: применение быстрых методов интерпо- ляции (интерполяция на разреженных сет- ках) и быстрых методов численного интегри- рования; иерархическая двухуровневая, а в отдель- ных случаях и трехуровневая, оптимизация (декомпозиция задач оптимизации по верти- кали); переменное (адаптивное) время прогно- зирования Топ; синхронное численное дифференцирова- ние. Применение этих способов позволяет резко снизить требование к необходимой вы- числительной производительности, сделав доступным реализацию алгоритма посредством современных микроЭВМ, микропроцессорных средств. Алгоритм с прогнозированием в задаче управления твердым телом. Уравнения про- странственного движения твердого тела (6.1.4) - (6.1.7) при постоянных угловых ско- ростях в связанных осях (<ох = со у = = 0) и постоянных перегрузках в этих осях , пу, nz = const (6.3.140) имеют общее аналитическое решение.
ОПТИМАЛЬНЫЕ ПРОГНОЗИРУЮЩИЕ СИСТЕМЫ УПРАВЛЕНИЯ 491 Это решение, именуемое спиральным [И], имеет следующий вид*. Матрица направ- ляющих косинусов связанной системы коор- динат относительно земной е(1) определяется известным матричным соотношением е(0 = е(0) Е + |ш| = х +(0у +(о%, 0 Шг - Шу Q = -Q1 = 0 . (6.3.142) Шу 0 Положение промежуточной системы коорди- нат относительно связанной в начальный мо- мент времени характеризуется матрицей на- правляющих косинусов вида (6.3.141) ще Е - единичная матрица 3x3, Ец(0) е»2(о) e{j(O)j SH(0)= 8»(0) 8^(0) 8» (0) = Е31<°) s32<°) e33<°>J «>х "х ~ Еп(°)ях(°) М л”(0) ®у Пу ~ Е21(°)лх(°) 1-(811(0)) “(812(°)) 1-(е21(°)) "(822(°)) ‘ 1 ” (831 (°)) ” (832 (°)) (6.3.143) Н л“(0) <ог л, - Е”1(0)л”(0) М л”(0) Здесь Пх (0), Пу (0) - начальные значения соответствующих компонент вектора перегруз- ки в промежуточной системе координат. При |л| # 0, |ш| # 0 *,(0 ^(0 z,(0 ^(0) yg(o)-±gt2 Zg<°) л” (0) = n cos ц; Пу (0) = n sin ц; cosp. = (&хпх +®уПу +<Dznz НН ge(0)eH(0) Скорости и координаты в земной нормальной системе координат определяются выражениями: |л£(0)? |<о(О)|“2л“(О)[1 - сов(|<о|о] |ш(О)|“1л^(°^-|<о(0)|“1 sin(|<o|o] >,(0 .*,(0 Xg(0) zg(°) + ge(0)8H(0)x nJ(O)f n" (0) sin(|<o|O |a>(0)|“'«“(0)[l - cos(|co|o] (6.3.144) (6.3.145) В особых случаях, когда |ш| = 0 и/или |л| = 0, формулы упрощаются. Общее число элементарных арифметиче- ских операций, необходимых для однократ- ного вычисления по формулам (6.3.141) - (6.3.145) значений Еп(0 Еп(0 Е(0 = ®21(0 е22<0 Е31(0 езз(О Еп(0 Е2з(0 Езз(О. *,(0 ^(0 5,(0 х,(0 >,(0 5,(0 * Эго спиральное движение может быть описа- но несколькими способами. Данный вид описания базируется на использовании промежуточной системы координат. В последнее время А И. Наумовым полу- чено строго аналитическое решение без этой системы. (6.3.146) при табличном хранении тригонометрических функций не превышает 240, из них приблизи-
492 Глава 6.3. СИНТЕЗ ДЕТЕРМИНИРОВАННЫХ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ тельно 60 % - длинных. Между тем только для одного шага численного интегрирования (6.1.5) - (6.1.7) четырехточечным методом Рунге-Кутта требуется более 350 арифметиче- ских операций. Если число шагов в интервале прогнозирования равно 100, то выигрыш в вычислительных затратах при использовании аналитических формул превышает два поряд- ка. При этом аналитические формулы дают точные прогнозные значения, а численное интегрирование - приближенные значения. Особенно большой выигрыш имеет место для терминальных задач с большим временем прогнозирования. К таким задачам относятся, в частности, автоматические сближение и при- чаливание в космическом пространстве. Здесь перегрузки «х, пу, nz создаются двигателями управления движением центра масс, а угловые скорости сох, С0у, можно рассматривать как выходные величины контуров угловой ориен- тации. Величины hx = , hy - U2 у nz = 1/3 (для непрерывных двигателей) или скорости изменения входных величин соответствующих релейных элементов (для импульсных двигате- лей), а также юх = 1/4 , = 1/5 , при иерархической оптимизации могут быть приняты за управления (синтезируемые за- дающие воздействия). Помимо терминального члена, отвечаю- . щего за выход космического аппарата (КА) в желаемое конечное относительное положение, могут назначаться функции штрафа и затрат в интегральной главной части ФОР. Если число элементарных арифметиче- ских операций, необходимых для однократ- ного вычисления (6.3.146), И,, Q3, обозначить соответственно NB, Ny^, Nq^\ число шагов вычисления квадратуры методом трапеций - NT; тактовую частоту - V, то при односто- роннем численном дифференцировании необ- ходимая вычислительная производительность применительно к задаче сближения КА при- ближенно выразится формулой + (л'а + ^в)^т]^ +1). (6.3.147) При отсутствии интегрального члена в главной части ФОР и аналитическом прогнозировании это совсем малая величина. Так, при Ny* = 100, NB = 240, v = 10, г = 6 получаем ~ 2 - 103 оп/с. При наличии нетерминальной состав- ляющей ФОР, Nq^ = 100, N? = 500 и тех же значениях остальных параметров N% = 12 • 106 оп/с - реализуемая в современ- ных бортовых вычислительных системах вели- чина. Описываемый подход к синтезу и реали- зации оптимального управления пространст- венным движением твердого тела может иметь широкие области применения. Рабочие дви- жения целого рада погрузочно-разгрузочных, добывающих машин сводятся к пространст- венным перемещениям и поворотам массив- ных грузов. При этом энергетически выгодно для получения максимального быстродействия осуществлять одновременные движения по всем степеням свободы. Оптимизация управ- ления такими процессами наиболее успешно осуществляется путем применения ФОР, прогнозирующего управления. Данный метод, включая спиральное прогнозирование, распространяется и на лета- тельные аппараты (ЛА) в атмосфере [11]. Простое применение получается при ие- рархической оптимизации, когда таким путем синтезируются в реальном времени оптималь- ные траекторные управления - задающие воз- действия в виде скоростей изменения перегру- зок в связанных осях и производных угловых скоростей в этих осях. Здесь справедливы оценки необходимой вычислительной произ- водительности типа (6.3.147). Многомерный вектор состояния, кото- рый с учетом (6.3.146) и пх, пу, nz, со*, С0у, сог имеет размерность 21, позволяет учесть разно- образные ограничения и задавать содержатель- ные целевые функционалы. Аэродинамические углы: угол атаки а и угол скольжения р при пренебрежении ветром выражаются через компоненты земной скорости в связанных осях Vx, Vy, Vz формулами V V а = -arctg —г-; р = arcsin —-г——т. (6.3.148) При заданной модели атмосферы плотность воздуха р и скорость звука а являются опреде- ленными функциями высоты Н= yg р = р(Я), а = а(Я). (6.3.149) Поэтому скоростной напор и число Маха М выражаются через компоненты указанного выше вектора состояния: 0,5рО^)И2 = 0Лр^ж)(Г,2 +и/ +гг2); (6.3.150) М = а-10'ж)^х +г/ +rz2- (6-3.151)
ОПТИМАЛЬНЫЕ ПРОГНОЗИРУЮЩИЕ СИСТЕМЫ УПРАВЛЕНИЯ 493 Таким образом, указанный выше вектор состояния позволяет учесть затраты и ограни- чения, связанные как непосредственно с его компонентами, так и аэродинамическими уг- лами, скоростным напором, числом Маха. Синтезируемые в реальном времени оп- тимальные траекторные задающие воздействия отрабатываются исполнительной (пилотажной) частью САУ ЛА. Эта часть может строиться как на основе традиционных, преимуществен- но эвристических, "законов” управления, так и оптимальных для режима слежения алгорит- мов, построенных на основе принципа мини- мума ФОР. Возможен и прямой, не иерархический синтез оптимальных управлений в САУ ЛА. Общий случай .быстрой к у с очно - л инейной интер- поляции характеристик обобщенного объекта. При оптимальном в смысле минимума ФОР про- гнозирующем управлении определяющие вы- числительные затраты приходятся на числен- ное интегрирование уравнений свободного движения обобщенного объекта Xi =fi(xi,x2,...,x„l), = (6.3.152) в ускоренном времени (при управлении в ре- альном времени). В системе скалярных обык- новенных дифференциальных уравнений (6.3.152) число аргументов функций ft счита- ются, в общем случае, различными и Л/ £ л. Это характерно для многомерных нелинейных моделей. Так, для системы уравнений (6.1.4) - (6.1.7) даже с раскрытием выражений для мо- ментов и сил применительно к ЛА в атмосфе- ре (см. ниже) Л/ не превышает 6-8 при п = 18. При численном интегрировании (6.3.152) вычислительные затраты определяются спосо- бом аппроксимации (представления) ft и мето- дом численного интегрирования. В целом при выборе или разработке ме- тодов аппроксимации функций в интересах моделирования динамических объектов долж- ны учитываться следующие основные факторы: необходимый объем и качество (точность) исходного экспериментального материала; вычислительные затраты и точность ап- проксимации при рассматриваемом методе; вычислительные затраты при воспроиз- ведении характеристик в процессе моделиро- вания; воспроизведение производных, степень гладкости аппроксимирующих функций. В работе [18] предложен способ аппрок- симации функций многих аргументов: кусоч- но-линейная интерполяция на разреженной сетке (симплексах). При однократном вычислении значения соответствующей интерполирующей функции требуется приблизительно 2щ + 1 операций сравнения, 7Л/ + 1 операций сложения и 6л/ + 2 операций умножения и деления, всего около 15Л/ + 7 элементарных арифметических операций. При однократном вычислении правых частей уравнений (6.3.152), интерполирован- ных указанным способом, необходимо п ~ 15 У* Л/ + 7л операций. ^=1 По аналогии с (6.3.139) для оптималь- ного управления с прогнозированием на №гт шагов (скользящий интервал оптимизации) получаем приближенную оценку необходимой вычислительной производительности ^Е = ®и 15^ ", +7/1 ЛТГи|(г+l)v. V /=1 J (6.3.153) Пусть ®и = 4 (метод Рунге-Кутта четвертого п порядка), л = 30, = 120, = 20, /=1 °” г = 3, v = 10 Гц. Тоща согласно (6.3.153) = 6,4 • 106 оп/с. Для дальнейшего снижения необходимой вычислительной производительности можно использовать двухканальный метод быстрого численного интегрирования [25], синхронное дифференцирование [44]. Соответствующую приближенную оценку необходимой вычисли- тельной производительности приведем для прогнозирующей САУ ЛА в атмосфере. Полная система уравнений модели обобщенного объекта в данном случае, при очевидных предположениях состоит из урав- нений (6.1.4) - (6.1.7), где аэродинамические моменты и силы: Мх = ^5>лх(а,р,сох,соу ,ЛГ,8Э,8Н); Му = фЯглу(а,0,(ох,(оу,Л/,8э,8н); Mz = фЯмг(а,р,сог,Л/,8в); Fx = Р- qScx(p&M9b*); (6.3.154) — qSCy (а,р, М,8В); Л =9*г(а,Р,АГ,8н)
494 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ зависят от компонент вектора (6.1.7); аэроди- намических углов (6.3.148), выражаемых через компоненты скорости в связанных осях, яв- ляющихся составляющими того же вектора; скоростного напора q = 0,5р(у^)К2 (6.3.150), числа Маха М = a-1(jg)K (6.3.151); площа- ди крыла 5; тяги силовой установки Рт, а так- же отклонений элеронов 8Э, руля направления и руля высоты (поворотного стабилизатора) 5в, которые считаются выходными величинами уравнений электрогидравлических приводов (6.1.63) - (6.1.70). Общий порядок уравнений модели, включающих 3 группы уравнений моделей приводов 8-го порядка, составляет п = 42. Быструю кусочно-линейную интерполяцию здесь целесообразно применять для коэффи- циентов аэродинамических моментов и сил и характеристик трех однотипных нелинейных моделей электрогидравлических приводов (6.1.63) - (6.1.70). Легко подсчитать, что в 42 данном случае = 70. При ®и = 4 /=1 (метод Рунге-Кутта четвертого порядка), Ntqji = 30, г = 3, v = 30 Гц оценочная фор- мула (6.3.153) с учетом некоторого числа до- полнительных арифметических операций дает N% ~ 30 • 106 оп/с. Это много. Положение еще более ослож- няется при необходимости одновременного оптимального решения как пилотажной, так и навигационной задачи, когда управление должно быть терминальным,, а время прогно- зирования в терминальном члене функционала - весьма большим. В этих случаях рекомендуется применять описанное выше аналитическое спиральное прогнозирование (6.3.141) - (6.3.145) в сочета- нии с быстрой кусочно-линейной интерполя- цией и синхронным дифференцированием интегрального главного члена ФОР при анали- тическом дифференцировании терминального члена. При кусочно-линейной интерполяции наиболее подходящим оказывается во многих случаях метод трапеций в качестве метода чис- ленного интегрирования. Принцип минимума ФОР в сочетании с новыми вычислительными методами позволяет реализовать оптимальное управление ”в боль- шом” в режиме реального времени для весьма сложных нелинейных объектов. Глава 6.4 МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ Применение оценивания и фильтрации позволяет: повысить точность и помехоустойчи- вость; определить непосредственно неизмеряе- мые величины; повысить надежность текущего инфор- мационного обеспечения; прогнозировать (экстраполировать) сиг- налы, их производные. 6.4.1. ПОСТАНОВКИ ЗАДАЧ ОЦЕНИВАНИЯ И ФИЛЬТРАЦИИ Часто оценивание и фильтрацию пони- мают как синонимы [44]. Иногда в эти поня- тия вкладывают следующий смысл. Под оце- ниванием понимают обработку косвенных измерений без шумов, т.е. точных косвенных измерений. Фильтрацией называют обработку как прямых, так и косвенных измерений с шумами и постоянными во времени случай- ными ошибками. Оценивание без шума изме- рения будем называть оцениванием в узком смысле, под оцениванием же вообще будем понимать как фильтрацию, так и оценивание в узком Смысле. Классификация задач алгорит- мического обеспечения оценивания и фильт- рации может осуществляться по различным признакам, объединяемым в две группы: ма- тематическая модель оцениваемого процесса, математическая модель измерительной систе- мы и процесса измерения, критерий качества оценивания (фильтрации). В математических моделях с сосредото- ченными параметрами независимыми пере- менными (аргументами) сигналов служат ска- лярные величины (непрерывное или дискрет- ное время, частота и др.). В системах с рас- пределенными параметрами может проводить- ся оценивание полей, описываемых функция- ми векторных аргументов [44]. Оценивание функций векторных аргументов встречается и в задачах так называемой непараметрической идентификации. Классификация задач оценивания (фильтрации) для непрерывных динамических систем с сосредоточенными параметрами при- ведена в табл. 6.4.1. Частотное и временное описание оцени- ваемых процессов. Математические модели оцениваемых (фильтруемых) процессов могут иметь тот же вид, что и ММ управляемых и оптимизируемых процессов.
ПОСТАНОВКИ ЗАДАЧ оценивания и фильтрации 495 6.4.1. Классификация задач оценивания Математическая модель Шум наблюдения отсутствует аддитивный с известными характеристиками неаддитивный с известными характеристиками с неизвестными характеристиками Заданные функции вре- мени или частоты с неиз- вестными параметрами 1, а 1, б 1, в 1> г Модели в пространствах состояний (типа (6.1.11)) или операторные модели при неизвестных началь- ных условиях 2, а 2, б 2, в 2, г Стохастические модели в пространствах состояний (6.1.2) или операторные модели (6.1.23) с извест- ными интенсивностями шумов 3, а 3, б 3, в 3, г Стохастические модели с неизвестными характери- стиками шумов 4, а 4, б 4, в 4, г Математическая модель оцениваемого процесса неизвестна 5, а 5, б 5, в 5, г Частотное описание применяется пре- имущественно в простых скалярных задачах линейной стационарной фильтрации. Характе- ристиками шумов здесь обычно служат спек- тральные плотности мощности сигналов, яв- ляющиеся преобразованиями Фурье соответст- вующих корреляционных функций. Так, для случайных центрированных стационарных скалярных шумов x(Z), ХО спектральные плотности оо Sx(a) = J Ах(т)ехр(-^т)Л = -00 00 = Rx(i) cos ютЛ; о (6.4.1) 00 SxyW = j А^(т)ехр(->т)Л = -00 00 = 2 J Rxy (т) cos ютЛ, О где Ax, Rxy - соответственно корреляционная функция и взаимная корреляционная функ- ция: Ах(т) = ЛЛх(Г)х(Г + т)]; (6.4.2) Лхх(т) = ЛЛх(О^ + т)Ь Для векторных стационарных случайных функций рассматриваются матричные корре- ляционные функции и матрицы спектральных плотностей, элементы которых вычисляются по формулам типа (6.4.1), (6.4.2). Численное преобразование Фурье прово- дится, как правило, по методу быстрого пре- образования Фурье (БПФ), имеющего общеиз- вестное стандартное программное обеспечение. Практически корреляционные функции опре- деляются приближенно путем усреднения по некоторому интервалу времени Т произведе- ния сдвинутых реализаций соответствующей случайной функции (или двух разных функ- ций). При этом для определения корреляци- онной функции с точностью порядка 10 % необходимо обработать реализации длиной Т« 100тк, где тк - характерное время корреля- ции. Это обусловлено требованием достаточ-
496 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ ной представительности статистической вы- борки. Например, если рассматривается неко- торый технологический процесс, время корре- ляции которого составляет 100 с, то для опре- деления корреляционной функции с 10 %-ной точностью потребуются реализации длительно- стью не менее 3 ч. Но сохранение стационар- ности процесса в течение столь длительного времени зачастую маловероятно. Для корреляционной функции из-за проявления реальной нестационарное™ про- цесса и ограниченной длины используемых реализаций оказывается недостаточно досто- верной область больших значений т (рис. 6.4.1, а). В спектральном представлении мало достоверна в этом случае область низких частот (рис. 6.4.1, б). Частотные представления получили рас- пространение в радиоэлектронике, акустике и других областях с относительно высокочастот- ными шумами и полезными сигналами. При решении многомерных нелинейных задач оце- нивания они недостаточны. Описание оцениваемых процессов во временной области может осуществляться в тех же формах, что и в задачах управления. Оце- нивание в узком смысле в пространстве со- стояний может осуществляться на основе де- терминированной модели типа (6.1.15). При этом управление u(f) обычно считается точно измеряемой величиной. Поэтому уравнение (6.1.15) можно заменить следующим: х = /(х,Г). (6.4.3) Для линейной стационарной системы в задаче оценивания (в узком смысле) использу- ется уравнение свободного движения: х = Ах. (6.4.4) Модель в пространстве состояний в дос- таточно общем случае задачи оценивания име- ет вид (6.1.1) х = Дх,МЛ). (6.4.5) Основное алгоритмическое обеспечение разработано для случая аддитивных шумов: х = /(х, и, t) + \|/(х)£, (6.4.6) где \|/(х) - в общем случае прямоугольная мат- рица. Рис. 6.4.1. Автокорреляционная функция (а) и спектральная плотность (б) при ограниченной длине располагаемой выборки
ПОСТАНОВКИ ЗАДАЧ ОЦЕНИВАНИЯ И ФИЛЬТРАЦИИ 497 Если £ = £(/) в (6.4.5) - стационарный цветной шум с известной матрицей спектраль- ных плотностей £(<о), то модель (6.4.5) может быть, как правило, преобразована к виду (6.4.6) посредством введения формирующего фильтра и расширения пространства состоя- ний. Для этого цветной шум £(/) представляют как реакцию некоторого, как правило, линей- ного стационарного фильтра на белый шум w(/): i = A^+w. (6.4.7) Вводя расширенный вектор состояния Хр = (*,£) > Уравнения (6.4.5), (6.4.7) объеди- няем в одно векторное уравнение вида (6.4.6) хр = /р (хр, и, Г) + vw, (6.4.8) ще /р - 7(хр,«,0 о Е у = Е - единичная матрица q х q\ q - размерность вектора W. Векторные нелинейные стохастические уравнения (6.4.5), (6.4.6), (6.4.8) являются в задачах непрерывной фильтрации весьма об- щими. Если рассматривается задача парамет- рического оценивания (идентификации) или координатного и параметрического оценива- ния одновременно, то модель в пространстве состояний с аддитивным шумом целесообраз- но представить в еще более общем виде х = f(x, и, /, а) + а = О, (6.4.9) ще £ = £(/) - векторный белый шум. В качестве операторного описания оце- ниваемых (в узком смысле) процессов могут быть использованы модели вход-выход типа (6.1.28): Хвых(0 = ^Тхм(/),а,/]. (6.4.10) Общие задачи оценивания при оператор- ном описании могут решаться на основе моде- лей типа (6.1.23). Описание условий наблюдения. Реальные измерительные (сенсорные) системы нередко представляют собой динамические системы не менее сложные, чем сам контролируемый объ- ект. Однако алгоритмическое обеспечение оценивания разработано в основном для безы- нерционных условий наблюдения, описывае- мых функциями, а не операторами. Противоречие удается разрешить путем использования понятия обобщенного объекта, включающего и динамические модели измери- тельных преобразователей (датчиков). При таком подходе непосредственно наблюдаемы- ми величинами становятся выходные сигналы датчиков. В достаточно общем случае для обоб- щенного непрерывного объекта вектор непре- рывного наблюдения Z € R^ может быть представлен в виде функции вектора состоя- ния х е Rn , других аргументов и аддитивного шума ц = ц(/) € R”* : Z = А(х, /, и, а) + т> (6.4.11) В наиболее распространенном случае оценива- ния координат Z = Л(х) + ц, (6.4.12) где ч = ч(0 - векторный белый шум. Для линейной стационарной задачи Z = Hx + i\, (6.4.13) где Н - матрица размера nz х п. Функция А, матрица Н наблюдения и характеристики шума ц(/) считаются обычно точно известными. Это предполагает достаточ- но хорошее метрологическое обеспечение при построении измерительных преобразователей. Для безынерционных датчиков шум т](1) отражает прежде всего собственные шумы та- ких датчиков. Для инерционных датчиков, математические модели которых включены в ММ обобщенного объекта, шум ч(0 может отсутствовать или отражать шумы преобразо- вания (в частности, шумы округления при аналого-цифровом преобразовании). Наблюдаемость и оце- ниванием. На процессы оценивания суще- ственное влияние оказывают свойства, обозна- чаемые общим термином "наблюдаемость". Грубо говоря, наблюдаемость - это такое ото- бражение оцениваемого процесса в наблюдае- мых величинах, при котором по результатам мгновенного или интервального (в течение некоторого интервала времени, предшествую- щего данному моменту) наблюдения можно определить текущее или предшествующее со- стояние процесса. Поскольку понятие отно- сится к принципиальной возможности опреде- ления состояния, оно обычно рассматривается для моделей без шумов. Так, для линейных стационарных систем и уравнения наблюдения х = Ах; z = Нх, xcRn, zeR”1 (6.4.14)
498 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ условие полной наблюдаемости (по Калману) имеет вид гапк[ят:Лт//т:...:(Лт)л-177т] = л (6.4.15) Если ранг матрицы в квадратных скобках (размера п х пп£ равен nz = т < л, то только т компонент вектора состояния х может быть определено путем наблюдения Z- Для нелинейной системы х = /(х,м,Г) (6.4.16) и условия наблюдения Z = h(x,u,t) (6.4.17) с функциями, дифференцируемыми необхо- димое число раз, локальное условие полной наблюдаемости записывается посредством ли- нейного оператора дифференцирования со- гласно уравнению (6.4.16) - оператора Ляпу- нова) где звездочкой обозначены функции-столбцы. Локальное условие полной наблюдаемо- сти имеет вид [44] rank 5ТА дТ Т, dT jn-Xu -----Lh...— Ln h = л, дх дх дх (6.4.18) где все матрицы Якоби вычислены на рассмат- риваемом (оцениваемом) решении xt = x(Z) уравнения (6.4.16) при известном управлении и(0- Более простым является локальное усло- вие, благоприятствующее точному оценива- нию. Оно заключается в линейной независи- dh мости столбцов матрицы ——, вычисленной на дх оцениваемом (или оцененйом) движении. Оно выводится из следующего условия, благопри- ятствующего точному оцениванию [44]: в про- цессе оценивания движения xt равенство h(x) = h(xt), (6.4.19) где х = x(t) - оценка xh должно выполняться тождественно только при х = xt. Если в необходимых и достаточных усло- виях полной наблюдаемости (6.4.15), (6.4.18) фигурируют как уравнение оцениваемого про- цесса (через/ А и др.), так и функция наблю- дения А, то в выражениях, благоприятствую- щих точному оцениванию, в явном виде фигу- рирует только функция наблюдения А. Это делает их более простыми и легко применяе- мыми, но более жесткими, чем необходимые и достаточные условия. Распределение инфор- мации. Для снижения вычислительных затрат, связанных с оцениванием, разработан РЯД способов. Один из них - распределение информации между наблюдением • и управле- нием [44]. Он заключается в следующем. На- блюдаемая величина А и управление и (см., например, (6.4.16), (6.4.17)) измеряются сен- сорами. Конструктор может распределять сиг- налы датчиков между и и Z, т.е. формировать по своему желанию из этих сигналов вектор управления и (при оценивании) и вектор на- блюдения Z- Удачное распределение информа- ции при формировании этих векторных функ- ций позволяет в ряде случаев существенно упростить и сделать более грубыми (робастными) алгоритмы оценивания. Критерии качества оценивания. Группа критериев качества оценивания строится в виде норм |[у - _у|| разности оценки и истин- ного значения оцениваемой величины (локальные критерии) или функционалов от этих норм (интегральные критерии). В целом эта группа критериев подобна той, которая применяется при оптимизации собственно процессов управления (см. п. 6.1.2). Другая группа критериев строится непо- средственно на рассмотрении условных (апостериорных) распределений вероятности. Так, можно рассматривать апостериорную плотность вероятности в пространстве состоя- ний при условии наблюдения величины z в течение некоторого времени p(x|Z) ). Максимум (при неодномодальном рас- пределении - главный максимум) этого рас- пределения соответствует критерию максимума апостериорной вероятности (МАВ): *МАВ = arg max p(x\Z). (6.4.20) х Функция p(xfZ) выражает условную плот- ность вероятности множества измерений при фиксированном х. Критерий максимума прав- доподобия (МП) соответствует выражению *мп = arg max p(Z\x). (6.4.21) X Согласно формуле Байеса p(^Z)p(Z) = p(Z\x)p(x).
РЕШЕНИЯ ЛИНЕЙНЫХ ЗАДАЧ ОЦЕНИВАНИЯ 499 Для экспериментального и численного опре- деления распределений вероятности в много- мерных пространствах требуется огромный статистический материал, который часто не- возможно получить вследствие самой природы оцениваемого процесса. Особо сложно опреде- лить "хвосты" распределения, т.е. ту его часть, которая соответствует малым и весьма малым вероятностям. Широко распространенная ги- потеза нормальности распределения далеко не всегда оправдывается, особенно при наличии сбоев, отказов, выбросов в измерениях. По- этому многомерные распределения вероятно- стей обычно используются как промежуточ- ный математический аппарат. Конечные ре- зультаты описываются на более доступном языке математических ожиданий и вторых моментов. В линейно-квадратично-гауссовских за- дачах (ЛКГ-задачах) результаты оптимизации по квадратичному критерию (метод наимень- ших квадратов, МНК) и критериям МАВ, МП совпадают. 6.4.2. РЕШЕНИЯ ЛИНЕЙНЫХ ЗАДАЧ ОЦЕНИВАНИЯ Линейные задачи оценивания могут ре- шаться как в частотной, так и во временной области, как в детерминированной, так и в стохастической постановке. Фильтр Винера. Прежде чем рассматри- вать фильтр Винера, обратимся к задаче пара- метрической оптимизации по формализован- ному критерию (6.2.28) в частотной области. Система с передаточной фикцией Ф(5, а) име- ет один вход и один выход, причем полезный сигнал y3(f) и помеха &ш(0 приложены в од- ной точке на входе (см. рис. 6.4.2, а). Зная характер спектра полезного сигнала и помехи, нетрудно выбрать структуру фильтра Ф(5, а), подавляющего в той или иной мере помеху, и пропускающего в основном полезный сигнал. Предварительный выбор фильтра осуществля- ется с точностью до вектора изменяемых па- раметров а. Если применить функционал обобщенной работы в частотной области (главная часть функционала вида (6.2.24)), то алгоритм оптимальной настройки параметров (с прогнозирующей моделью по типу (6.2.28)) будет иметь вид а = _^=.^62Ь да да я ||^|Фе(>,в)|25л(«>)Ло + ,0 ° 00 т + /^-|Ф(/«>>а)|25еш(“)^ о (6.4.22) Ф($,л) <0 <0 Рис. 6.4.2. К пояснению алгоритма параметрической оптимизации при операторном описании объекта Вследствие сложности эксперименталь- ного определения спектральных плотностей случайных процессов часто используют при- ближенное значение функционала /, вычис- ленного эмпирически путем усреднения е^/) по некоторому скользящему интервалу време- ни. Градиент функционала можно было бы определять методом синхронного дифферен- цирования. На рис. 6.4.2, б показана схема гипотети- ческой адаптивной системы настройки пара- метров a(f). Такая система неосуществима, так как сигнал е(0 измеряется вместе с'помехой еш(0, а на схеме он используется в чистом виде. Задача синтеза фильтра Винера ставится следующим образом (рис. 6.4.3). Сигнал y3(f) и помеха еш(0 представляют собой стацио- нарные некоррелированные скалярные слу- чайные функции, заданные своими корреля- ционными функциями или спектральными плотностями мощностей. Выходной сигнал ХО синтезируемого фильтра уравнивается здесь в общем случае не с входным полезным сигналом ^(О, а с его преобразованием уп = Фп (5)3,3 > заданным линейным операто- ром. Минимизируется величина М(У “З'п)2]» т.е. используется критерий МНК (хотя для данной Л КГ- задачи такой же результат полу- чится при применении критериев МАВ, МП).
500 Глава 6 4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ Рис. 6.4.3. К постановке задачи синтеза фильтра Винера Синтезируемая передаточная функция обозначена на схеме (см. рис. 6.4.3) через Фс(5). Соответствующую импульсную пере- ходную (весовую) функцию обозначим A^(Z). При Фп($) = 1, т.е. уп = у3 данная задача непараметрической (вариационной) оптимиза- ции является бесконечномерным аналогом только что рассмотренной задачи параметри- ческой оптимизации. Традиционно сначала решается вариаци- онная задача в функциональных пространствах импульсных переходных и корреляционных функций. В результате получается интеграль- ное линейное уравнение ОО Ry^z J *сО1)ЛуЕ 0 " *1)А1> (6.4.23) О где Ryz - автокорреляционная функция сиг- нала ух (t); Rynyz - взаимная корреляцион- ная функция сигналов уп (/) и Ух (/) • Уравнение (6.4.23) допускает следующую интерпретацию: оптимальным (в рассматри- ваемом смысле) стационарным линейным фильтром является фильтр, преобразующий функцию Ryz (/) в функцию RynyL (0 • Усло- вие физической осуществимости для импульс- ной переходной функции А^(т) имеет вид = 0 при т < 0. Известное решение Винера-Хопфа урав- нения (6.4.23) учитывает это условие, и оно выражено в частотной области. Оно связано со следующим преобразованием спектральной плотности Sy^ (со), носящим название факто- ризации: (ю) = \|/(Jco)\|/*(Jco), (6.4.24) где \|/(/ю) - аналитическая (не имеющая полю- сов) функция со в нижней полуплоскости (\|/(s) - аналитическая функция s в правой полуплоскости); \|/* - комплексно-сопряжен- ная функция \|/. Амплитудно-фазовая характе- ристика Ф(/ю) оптимального фильтра Винера- Хопфа выражается формулой оо Ф(» = й—тут!ехр(->0 X 7 Sy у (®) х I ч exp(yco/)dcoJr. (6.4.25) J хр (Л) — 00 В этой формуле сначала должен вычис- ляться внутренний (второй) интеграл, а затем внешний. Из частных версий фильтра Винера рас- смотрим только одну. Пусть поставлена задача собственно фильтрации (сглаживания), так что Фп($) s 1, уп = Уз (см- Рис. 6.4.3). Шум изме- рения имеет высокую интенсивность и прак- тически равномерный спектр в сравнении с полезным сигналом y3(f) и некоррелирован с ним. Тоща в (6.4.25) можно принять \|/*(/ю) = const, SynyL(s) = ^(ю) • Подстав- ляя эти значения в (6.4.25), находим Ф(/о) « J Ry* (т) cosotA - j J Ry* (т) sin ютЛ; о о |Ф(Ую )|2 « J Ry* (т) cos ют (к + ко / <о° V + J Ry* (т) sin ют (к , ко > (6.4.26) ще символом » обозначена приблизительная пропорциональность. Таким образом, в дан- ном случае оптимальный фильтр должен иметь частотную характеристику, в определенном смысле подобную спектру полезного сигнала. Наблюдатели с моделями. Почти все по- становки задач оптимального оценивания ба- зируются на ММ оцениваемых процессов и шумов измерения (см. табл. 6.4.1). Эти ММ в явном или скрытом виде присутствуют в алго- ритмах оценивания. Однако существует группа алгоритмов, в которые модели вводятся зара- нее по существу эвристическим путем. Их и будем называть наблюдателями с моделями. Название "наблюдатель" применяется преиму- щественно в задачах оценивания (воссталов-
РЕШЕНИЯ ЛИНЕЙНЫХ ЗАДАЧ ОЦЕНИВАНИЯ 501 ления) в узком смысле и применительно к линейным стационарным системам имеет сле- дующий смысл. Оцениваемый (восстанавливаемый) про- цесс и условие наблюдения описываются урав- нениями: х = Ах + Ви; z = Нх. (6.4.27) Алгоритм оценивания (наблюдатель) строится в виде модели оцениваемого процес- са, "корректируемой” по сигналу обратной связи разности z - Нх (сигналу невязки), где х(0 - оценка x(t) : х = Ах + Ви + K(z - Нх); (6.4.28) здесь К - матрица коэффициентов усиления, подлежащая определению в процессе синтеза наблюдателя. Таким образом, наблюдатель (6.4.28) представляет собой модель оцениваемого про- цесса, охваченную векторной (в общем случае) обратной связью по сигналу невязки (рассогласования) наблюдаемой величины. Вводя обозначение сигнала ошибки оце- нивания Дх = х - х , из (6.4.28), (6.4.27) на- ходим Дх = (А - КН)Ьх. (6.4.29) Если собственные числа матрицы А-КН имеют отрицательные действительные части, то Дх(/) -> 0 при / -> оо, т.е. ошибки оценива- ния с течением времени стремятся к нулю. Таким образом, синтез наблюдателя с моделью (6.4.28) может выполняться методами так на- зываемого модального управления [44]. На- блюдающее устройство без шумов (6.4.28) имеет порядок, равный порядку модели оце- ниваемого процесса в пространстве состояний. Наблюдатель Люенбергера, являющийся по существу также наблюдателем с моделью, име- ет пониженный порядок, но оценивает (восстанавливает) лишь часть компонент век- тора состояния. Программа OBSL, реализую- щая наблюдатель Люенбергера, приведена в [26]. Неадаптивные наблюдатели с моделями типа (6.4.28), наблюдатель Люенбергера осно- ваны на знании точной модели оцениваемого процесса, т.е. большого объема априорной информации. Этот недостаток, казалось бы, можно исключить путем увеличения коэффи- циентов усиления обратной связи по сигналу невязки (в частности, диагональных элементов матрицы К). Однако при этом возрастает влияние не учитываемых; но неизбежных шу- мов, растет необходимая вычислительная про- изводительность. Одним из перспективных решений явля- ется применение адаптивных наблюдателей с моделью. Обозначим вектор настраиваемых пара- метров через а. Этот вектор может включать все или часть элементов матриц Л, В, К на- блюдателя (6.4.28). Уравнения настраиваемого наблюдателя запишем в виде х = А(а)х + В(а)и + K(a)(z - Нх). (6.4.30) Единственным доступным для непосредствен- ного измерения (вычисления) является вектор невязки z - Нх. Поэтому главную часть функционала обобщенной работы формируем как функционал этого вектора IT(z~Hx). В самом простом локальном случае это может быть даже не функционал, а норма текущего значения вектора невязки, например, положи- тельно определенная квадратичная форма 1Г = o^z(O - - Лх(/)], (6.4.31) тде р = рт - заданная матрица коэффициентов. Для наблюдателя без шумов использова- ние в качестве /г нормы текущего мгновенного значения невязки z(t) - Hx(t) наиболее вы- годно. Однако с учетом наличия малых, но неизбежных шумов, желательно накопление, т.е. целевой функционал интегрального типа. Прогнозирование (экстраполяция) сигнала невязки Z - Нх затруднено вследствие пред- полагаемого наличия у этого сигнала случай- ной составляющей. В этих условиях можно применять функционал с ретроспективным интервалом усреднения [21], в частности, квадратичный: t = °-5 J [z(e> - Ж(0)]тф(е) - Ж(е)]л. t-T (6.4.32) В качестве вектора параметрического управле- ния примем скорость изменения вектора па- раметров а = иа. (6.4.33) Как и в задаче параметрического синтеза с общим функционалом качества, член целевого функционала обобщенной работы t 0,5 Jk(0)«-4(0) + «:(0)оп*’1«<>(е)оп]л t-T
502 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ может в определенной мере характеризовать быстродействие ЭВМ, необходимое для реали- зации алгоритма в реальном времени. В соответствии с выражениями (6.4.30) - (6.4.33) адаптивный непрерывный наблюдатель с моделью процесса (6.4.27) опишется уравне- ниями х = А(а)х + В(а)и + K(a)(z - Нх); (6.4.34) а = -к—-^-, (6.4.35) да Если для вычисления градиента применяется метод синхронного дифференцирования и главная часть функционала имеет вид (6.4.32), то алгоритм может быть представлен в виде х = А(а + Ьа)х + В(а + да)и + +К(а + ba)(z - Нх); (6.4.36) а - -tySkd 1 х J[z(0) - Ж(0)]тр[г(0) - Л£(0)]&1Т(0)Л J-T Адаптивный наблюдатель (6.4.34),. (6.4.35) в отношении процесса настройки яв- ляется в указанном выше смысле оптималь- ным. Это не означает, однако, безусловной сходимости как процессов оценивания, так и процессов адаптации. Все зависит от условия наблюдения (матрица Н), норм начальных отклонений А - А , В-В , уровня шумов (последние в явном виде в указанных уравне- ниях не отражены). Все же применение на- блюдателей с адаптивными моделями пред- ставляет значительный интерес. Такие наблю- датели могут решать одновременно и задачу координатного оценивания, и задачу парамет- рической идентификации объекта. В принципе такие алгоритмы могут со- хранять работоспособность при неизвестных (в отношении значений параметров) моделях оцениваемых процессов и неизвестных харак- теристиках шумов. Таким образом, данные алгоритмы могут сохранять эффективность в наиболее трудных условиях, (см. табл. 6.4.1, варианты 4.а - 4.г, 5.а - 5.г). Непрерывный фильтр Калмана-Быоси. Фильтры, описываемые в пространствах со- стояний (калмановская фильтрация) нашли широкое применение прежде всего в задачах навигации и внешнетраекгорного контроля [6], где измерения проводятся относительно редко. В таких приложениях преимущество имеют алгоритмы с дискретным временем, синтези- руемые для моделей процессов с дискретным временем. Однако при управлении динамиче- скими процессами с малой памятью измере- ния должны следовать часто, почти непрерыв- но. Кроме того, алгоритмы с непрерывным временем, построенные для непрерывных ди- намических моделей, более наглядны и неред- ко допускают выявление аналитическим путем общих закономерностей. Для процесса, описываемого линейным стохастическим уравнением х = A(t)x + B(t)u + (6.4.37) где = £(/) - гауссовский белый шум с корреляционной матрицей М[^(/)^т(/ + т)] = С(/)5(т) со случайным начальным условием x(/q), не коррелирован- ным с ^(0, имеющим нормальное распределе- ние, а также известные математическое ожи- дание До и ковариационную матрицу 0 = М[(х(/о)-хо)(х(/о)-хо)т)], при на- блюдении Z = H(t)x + т], (6.4.38) ще т] = т](/) - также гауссовский белый шум с невырожденной корреляционной матрицей М[т](/)т]т(/ + т)] = Я(/)8(т), не коррелиро- ванный с £(/) (Mfr]T] = 0) и *0Ь), опти- мальная в смысле критериев МАВ, МП, МНК (экстремумы этих критериев в данном случае совпадают ) оценка формируется алгоритмом: i = A(t)x + B(t)u + PHT(t)R~l(f)[z - ff(f)x], (6.4.39) x(t0) = x0 = *o; P = A(t)P + A4T(/) - - PHT(t)R~l(f)H(f)P + Q(f), (6.4.40) P(t0) = p0=e. Этот алгоритм носит название непрерывного линейного нестационарного фильтра Калмана- Бьюси (ФКБ). Он является строгим решением задачи оптимального оценивания в случае (6.4.37), (6.4.38) при указанных условиях. Матрица Р = P(f) является здесь ковариаци- онной матрицей ошибок оценивания вектора состояния
РЕШЕНИЯ ЛИНЕЙНЫХ ЗАДАЧ ОЦЕНИВАНИЯ 503 Р = Рт = P(f) = М[Дх(')Д*Т(')] = = М[(х(/)-х(/))(х(/)-х(/))т]. Она определяется путем решения обыкновен- ного нелинейного матричного дифференци- ального уравнения (6.4.40), именуемого мат- ричным уравнением Риккати. Интегрирование этого уравнения осуществляется при началь- ном условии P(/q) = Ро> задаваемом на основе априорных данных о начальной неопределен- ности вектора состояния ® или произвольно. Интегрирование уравнения (6.4.40) может осуществляться независимо и заблаговременно по отношению к интегрированию основного "модуля" ФКБ (6.4.39), однако по причинам, указанным ниже, решение обоих уравнений часто выполняется параллельно (синхронно). Задание начального условия х(/д) = *о также может осуществляться на основе априорных данных х(/о) или произвольно. При выпол- нении определенных условий наблюдаемости решения уравнений (6.4.40), (6.4.39) при t -> оо в среднем квадратичном всегда сходятся к одному решению независимо от начальных условий. Однако при численной реализации могут иметь место сложные эффекты расходимости процессов оценивания, тем более вероятные, чем больше несоответствия между х(/о) и х(/0), Ро и М1(х(/0) - х(/0))(х(/0) -х(/0))т|. Матрица К = PHr(t)R~\t) в основ- ном модуле (6.4.39) играет роль матрицы ко- эффициентов усиления. При этом (6.4.39) по своему виду ничем не отличается от (6.4.28) (где Л, В также Moiyr зависеть от времени). Линейный непрерывный фильтр К а л м а и а - Б ь ю с и для стационарных процессов. Для системы х = Ах + Ви Z — Нх + т\ (6.4.41) с постоянными матрицами коэффициентов (Л, В, Н = const) и для интенсивностей белых шумов (С, R = const) непрерывный ФКБ (6.4.39), (6.4.40) принимает вид х = Ах + Ви + PHTR~X[z - Ж]; (6.4.42) Р = АР + РАТ - PH'R-'HP + Q. (6.4.43) Если условие полной наблюдаемости (6.4.15) выполнено, то уравнение Риккати (6.4.43) имеет единственное устойчивое установившее- ся решение, к которому сходятся все другие решения, соответствующие произвольным (допустимым для ковариационной матрицы) начальным условиям [41]. Установившееся решение Р = Р = const согласно (6.4.42) удовлетворяет алгебраическо- му матричному уравнению АР + РАТ = Q + PH'R~XHP, (6.4.44) которое носит название уравнения Лурье [44] или алгебраического уравнения Риккати. Для решения матричных уравнений Риккати и Лурье разработан целый ряд программ, на- пример, PICPACK [2]. Линейный стационар- ный фильтр. Для многомерных много- связных моделей наибольшие вычислительные затраты связаны с решением ковариационного уравнения, в случае (6.4.41) -уравнения Рикка- ти (6.4.43). Поэтому естественно стремление решить это уравнение на стадии проектирова- ния и ввести в основной модуль (6.4.42) зара- нее определенную матрицу P(t, fy). Наиболее просто реализовать фильтр с постоянной мат- рицей Р, являющейся решением уравнения Лурье (6.4.44). Такой фильтр х = Ах + Ви + PHTR~X [z - Ж] (6.4.45) ’ часто именуется стационарным линейным ФКБ. По достигаемому эффекту он эквива- лентен фильтру Винера в частотной области. Так, уравнение х = Ах + Ви + £ можно рассматривать как уравнение форми- рующего фильтра полезного сигнала. Если интенсивность белого шума измерения доста- точно высока, то решение уравнения Лурье (6.4.44) практически совпадает с решением матричного алгебраического уравнения Ляпу- нова АР+РАТ =Q, а элементы матрицы коэффициентов усиления К = PHTR~* в (6.4.45) являются малыми. Слабые обратные связи практически не меня- ют мод (собственных частотой), и оптималь- ный стационарный фильтр подобен форми- рующему фильтру полезного сигнала. При аналогичных условиях этот результат получает- ся и для фильтра Винера. Численная реализация стационарного ФКБ в режиме реального времени осуществ- ляется путем численного интегрирования дифференциального уравнения (6.4.45) по мере поступления значений «(/), z(0-
504 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ Соответствующая протрамма FILK опи- сана в [33]. Оценивание детермини- рованных или полустохас- тических процессов. Допустим, что шум £(/), "возбуждающий" оцениваемый процесс, отсутствует, т.е. объект описывается уравнением (6.1.24), ще и = «(/) - точно из- вестная функция времени. При известных начальных условиях это уравнение детермини- рованного процесса, при случайных начальных условиях - полустохастического процесса. В обоих случаях Q = 0 и уравнение (6.4.43) принимает вид Р = АР + РА* - PH*R.'HP, (6.4.46) Умножая это уравнение слева и справа на мат- рицу D = Р"1 и принимая во внимание, что Ь - ~р~1рр~1, получаем b + A*D+DA = H*R~xH. (6.4.47) Общее решение этого линейного матричного уравнения наиболее просто выражается через фундаментальную матрицу Фсо(0 так назы- ваемого сопряженного (по отношению к х = Ах) уравнения: Фео (0 = -Фео ('И, Фео (0) = Е, (6.4.48) где Р - единичная матрица. Общее решение уравнения (6.4.48) имеет вад D(t) = Ф?о(0^0)Фсо(/) + t + f - t)H*R~lSPeo(t - x)dt. 0 (6.4.49) Соответственно этому ФКБ для системы х = Ах + Ви, Z = Нх + т\ (6.4.50) может быть представлен в ваде х = Ах + Ви + D l (t)HTRl (z - Нх), (6.4.51) где D~\t) - обращенная матрица (6.4.49). Циклический ФКБ. В цик- лическом ФКБ [44] время разбивается на цик- лы. В принципе длительности циклов не обя- зательно должны быть одинаковыми, однако здесь будем полагать их равными /ц. На про- тяжении каждого цикла оцениваемый процесс описывается детерминированной моделью х = Ах + Ви, пониженной по отношению к нециклическому варианту размерности. Воз- можность использования упрощенной детер- минированной модели реальной системы для отраниченного промежутка времени состав- ляет одно из главных преимуществ цикличе- ского ФКБ. Однако очевидно, что возмож- ность использования упрощенной модели для большинства задач отраничивает длительность цикла /ц сверху. В то же время длительность цикла ty должна быть достаточной для того, чтобы переходный процесс оценивания на каждом цикле в основном завершался. Соглас- но (6.4.49), (6.4.51) переходный процесс оце- нивания в основном завершается, если норма матрицы Р = становится достаточно ма- лой, а норма матрицы D - достаточно боль- шой. При выполнении условия долгой наблю- даемости диагональные элементы матрицы Ф?о(* “ т)ЯтЛ-1ЯФС0(/ - т) положительны, и поэтому соответственно диагональные эле- менты матрицы D монотонно нарастают в течение всего времени оценивания. Требова- ние затухания переходных процессов отрани- чивает /ц снизу. Длительность цикла отрани- чивает снизу и требование вычислительной устойчивости при численной реализации цик- лического алгоритма в варианте (6.4.42), (6.4.46) или (6.4.51), (6.4.49). Функционирование циклического ФКБ для простейшего скалярного случая (л = 1) поясняет рис. 6.4.4. Время, отсчитываемое от начала каждого цикла (внутр и цикл о вое время), обозначено через 0. Через x(f) обозначена оцениваемая величина, через х(0) - ее оценка внутри каждого цикла и на его конце (волнистые вследствие влияния шума измере- ния линии), через xt - оценка величины получаемая путем интерполяции с учетом зна- чений х(к1ц) (к = 1, 2, ...) и детерминиро- ванной модели оцениваемого процесса на ка- ждом цикле. Величина Р(0) в одномерном случае выражает просто дисперсию ошибки оценивания Дх(&) = х(0) - х(0) внутри цик- ла. Величина Р(0) задается произвольно, но не слишком малой и не слишком большой (для обеспечения численной устойчивости). Что касается величины х(0) , задаваемой в начале каждого цикла оценивания, в первой версии алгоритма она задается произвольно (но также с учетом вычислительной устойчи- вости), а во второй версии - равной значению оценки х(-0) в конце предыдущего цикла.
РЕШЕНИЯ ЛИНЕЙНЫХ ЗАДАЧ ОЦЕНИВАНИЯ 505 Рис. 6.4.5. Пример смены алгоритма фильтрации на различных стадиях оцениваемого процесса Преимуществом циклического ФКБ яв- ляются пониженные требования к точности модели оцениваемого процесса, используемой на ограниченных интервалах времени. Воз- можное применение указанных трех видов линейного ФКБ показано на рис. 6.4.5. Оцениваемый процесс имеет три этапа (зоны) 1-3 (см. рис. 6.4.5). В зоне 1 он имеет явно выраженный нестационарный характер вследствие изменения и интенсивностей шумов ^(0- Здесь целесообразно приме- нение общего нестационарного ФКБ (6.4.39),
506 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ (6.4.40). В зоне 2 шум, воздействующий на оцениваемый процесс, достаточно мал и этот процесс имеет плавный характер. Здесь целе- сообразно применение циклического ФКБ вида (6.4.42), (6.4.46) или (6.4.51), (6.4.49). В зоне 3 оцениваемый процесс и шум измере- ния имеют характер стационарных случайных процессов и допустимо применение стацио- нарного ФКБ (6.4.45), (6.4.44). Дискретный фильтр Калмана-Бьюси. Ли- нейный ФКБ с дискретным временем является оптимальным рекуррентным фильтром для стохастического процесса и наблюдения, опи- сываемых рекуррентными (разностными) уравнениями: х[* +1] = (6.4.52) = Я[£]х(£] + Я*]. (6.4.53) Здесь используются следующие обозначения. Величина у в моменты времени 4 = АД/, к = 0, 1, 2..А/ - заданная величина, обозна- чается ЯЧ- Прогнозируемое (предсказы- ваемое, экстраполируемое) значение у в мо- мент времени 4+1 = (к + 1)А/ при известном ЯЧ обозначается Я^ + 11 £]. Векторные величины v[£], к = 0, 1, 2...- случайные центрированные гауссовские последовательности с некоррелированными значениями: M[w[Jt]] = 0; M[w[A]wTp]] = QH]®^; M[v[fc]] = 0; М[Я^ТИ1 = Д^]®«; M[w[Jt]vT[Z]] = 0, (6.4.54) ще - символ Кронекера: [1 »«=|0 при к = i; при к * L При указанных условиях оцениваемый процесс (6.4.52) и наблюдаемая величина (6.4.53) представляют собой марковские по- следовательности. Матрицы коэффициентов Л[А], /?[£] (последняя в предположении ступенчатого изменения управления в моменты времени 4 = АД/) получаются из модели с непрерыв- ным временем (6.4.37) согласно формулам: 4+1 24*)= |ф(/*+1Л)В(г)А. 4 (6.4.55) Здесь Ф(/,/о) - фундаментальная матрица, удовлетворяющая уравнению d — Ф(/,/о) = Ф(/,/0) = при начальном условии Ф(/о,/о) = Е . Рекуррентный ФКБ для нестационарной системы. Для линейной системы с дискретным време- нем (6.4.52), (6.4.53) ФКБ имеет следующий вид: одношаговое предсказание х[* + 1|*] = д*И*]+д*м*1; (6.4.56) одношаговое предсказание Р[к +1|*] = Д к]Р[ *МТ[ jt] + Qlk], (6.4.57) вычисление матричного коэффициента усиления К[к +1] = Г\к + 1|*]ЯТ[* + 1][Я[£ +1] х х Р1к + 1|*]ЯТ[к + 1] + Щк + 1JF1; (6.4.58) вычисление х{к +1] = х(Л + 1|£] + + Л[£ +1] +1] - Н[к + 1]х[£ +1|£]]; (6.4.59) вычисление РИ +1] = [Г - ЛИ + 1]Я1 к + 1]Р[£ + 1|Ш (6.4.60) Далее следует очередной цикл вычисле- ний. Существует несколько форм записи ре- куррентного ФКБ, трансформируемых одна в другую. Форма (6.4.56) - (6.4.60) отличается относительной компактностью. Алгоритм рекуррентного ФКБ сводится к последовательному умножению и сложению матриц и обращению матрицы Я1Л + 1]Р[Л + 1|Л]ЯтН + 1] + /ЧЛ + 1] разме- рам х т , где т - размерность вектора на- блюдения 4 обычно существенно меньшая размерности вектора состояния п.
ОЦЕНИВАНИЕ ПРОЦЕССОВ В НЕЛИНЕЙНЫХ СИСТЕМАХ 507 Вычислительные затраты при реализации рекуррентного ФКБ растут как л3. Если рекуррентная модель оцениваемого процесса (6.4.52) получена из исходной моде- ли с непрерывным временем (6.4.37), то в промежутках между дискретными измерения- ми оценка x(t) может получаться путем ин- терполяции или экстраполяции в соответствии с детерминированной непрерывной моделью х = A(t)x + B(t)u . Рекуррентный ФКБ для стационарной системы. Для стационарной системы матрицы Л, Д Н, Q, R постоянны и рекуррентный ФКБ получается из (6.4.56) - (6.4.60) простым отбрасыванием аргументов этих матриц: одношаговое предсказание х\к + 1|Л] = Ах[к] + Bifk]; (6.4.61) одношаговое предсказание Р[к + l|jt] = АВ[к]Ат + Q; (6.4.62) вычисление матричного коэффициента усиления К[к +11 = Р[к + ВРУЧАЛ* + + яг1; (6.4.63) вычисление х{к +1] = х{к + l|jt] + + +1] +1] - Н%к + l|jt J J; (6.4.64) вычисление +1] = [£ - К[к + 1]Я]Р[ к +1|*1. (6.4.65) 6.4.3. ОЦЕНИВАНИЕ ПРОЦЕССОВ В НЕЛИНЕЙНЫХ СИСТЕМАХ Задача нелинейного оценивания не имеет строгого исчерпывающего решения даже в условиях точного знания моделей оценивае- мого процесса, наблюдения и шумов. Здесь могут использоваться только субоптимальные алгоритмы оценивания, построенные, в част- ности, на линеаризации функций в окрестно- сти оцениваемого состояния (в более общем случае - на разложении в степенные ряды и учете первых членов) или аппроксимации многомерных распределений вероятностей нормальными распределениями. Прежде чем приводить соответствующие алгоритмы, остановимся на нелинейных на- блюдателях с моделями, пригодных для оце- нивания как стохастических, так и детермини- рованных процессов. К тому же эти алгоритмы сразу могут строиться как адаптивные. Нелинейные наблюдатели с моделями. Пусть нелинейная система и условия наблю- дения описываются уравнениями общего вида (6.4.9), (6.4.11) х = f(x,u,a,t) + £, в = 0; (6.4.66) Z = h(x, м, 0 + т), (6.4.67) где вектор параметров а известен лишь при- ближенно, как и характеристики шумов £, т]. По аналогии с (6.4.34), (6.4.35) адаптивный наблюдатель с моделью опишется уравнениями х = f(x>u&t) + K(a)[z - Л(х,м,/)]; (6.4.68) а = -к^-£*-, к = к\ (6.4.69) да где 1Т - некоторый функционал вектора невяз- ки z - А(х, м,0, например, типа (6.4.32): t 1т = ОД J [z(0) - А(х(0),«(0),0))тр х t-T x[Z(0)-A(x(0),i/(0),0)]d9. (6.4.70) Покажем для детерминированного случая х = /(х,м,а,0, а-=0; (6.4.71) Z = А(х, и, t) (6.4.72) возможность обеспечения устойчивого процес- са оценивания посредством алгоритма (6.4.68), (6.4.69). Вводя обозначения ошибок оценивания Дх = х - х , &а = а-а, вычитая (6.4.71) из (6.4.68), (6.4.69) и считая фикции / h диффе- ренцируемыми, получаем с точностью до ма- лых второго порядка относительно tax, Дх - f^bx + К^а - K(a)h£bx; (6.4.73) ОТ Г Ла = -к—(6.4.74) да
508 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ Путем простых преобразований находим: 4-(АхтАх) = Ахт(Д + f*)hx + Ахт/-Да + dt + &aTfx Ах - Ахт[K(a)h% + AjtfT(a)]Ax; (6.4.75) — (АатАа) = -AflTfcd {г _ dt да да (6.4.76) Уравнение (6.4.76) характеризует процесс па- раметрического оценивания (идентификации), а уравнение (6.4.75) - главным образом про- цесс координатного оценивания. Если параметрическое оценивание про- текает в так называемом квазистационарном режиме, т.е. медленно в сравнении с процес- сами координатного оценивания, то функцио- нал 1Т естественно считать функцией а, имеющей минимум в точке Аа s 0. В окрест- ности этой точки с точностью до малых вто- рого порядка ат/г да д21г 1 dadaTJ - Аа, где первый член в правой части - матрица Гессе в точке минимума. При указанных условиях уравнение (6.4.76) преобразуется к виду — (АатАа) = -Аат| А: — dt V дада* (6.4.77) Если матрица в круглых скобках справа поло- жительно определенная, то процесс парамет- рического оценивания (идентификации) схо- дится (Аа(0 —> 0 при / —> оо ), как и должно быть при традиентном алгоритме поиска в области притяжения экстремума. Обращаясь к уравнению (6.4.73), замеча- ем, что по крайней мере при достаточно больших диагональных элементах матрицы K(a)h% и ее положительной определенности решающую роль в обеспечении сходимости по Ах играет последний член правой части (6.4.73). Соответственно этому из (6.4.75) следует, что если матрица ^(а)Л*+фГт(а) (6.4.78) положительна в течение всего процесса оцени- вания и ее диагональные элементы достаточно велики, то процесс оценивания также сходится асимптотически. Условию положительности матрицы (6.4.78) способствует линейная независимость столбцов матрицы h*, именуемая выше усло- вием, благоприятствующим точному оценива- нию. Наиболее экономичным в отношении вычислительных затрат при численном опре- делении градиента является метод синхрон- ного дифференцирования. При использовании этого метода алгоритм (6.4.68) - (6.4.70) при- нимает форму: х = /(х>и>а + da,t) + К(а + 8a)[z - Л(х,М)], (6.4.79) а = -0,5 far1 j(z(0)-A(x(0),«(0),0)]Tpx t-T X (z(0) - A(x(0),u(0),0)]8aT(0)do}T. (6.4.80) Адаптивные наблюдатели с моделями (6.4.68) - (6.4.70); (6.4.79), (6.4.80) сохраняют работоспособность при наличии шумов £(/), т](/), причем с неизвестными интенсивностями и спектрами. Конечно, эта работоспособность имеет место лишь в определенных пределах. Обобщенный непрерывный фильтр Калма- на-Быоси. Существует большое число вариан- тов алгоритмов субоптимального нелинейного оценивания стохастических процессов [44 и др]. Ряд алгоритмов нелинейной фильтрации получается на основе уравнения условной плотности вероятности в пространстве состоя- ний - уравнения Сгратоновича-Кушнера- Бьюси (СКБ-уравнения). СКВ-уравнение. Для стохасти- ческой системы и условия наблюдения: ХГ =/(хг, 0 + ^(0; (6.4.81) =Л(хг,О + п(Г), (6.4.82) ще индекс t у х введен для обозначения векто- ра состояния, зависящего от времени и яв- ляющегося оцениваемым процессом; £(/), т](/) - некоррелированные между собой век- торные белые шумы с матрицами интенсивно- стей 00), ^(0, СКБ-уравнение имеет вид
ОЦЕНИВАНИЕ ПРОЦЕССОВ В НЕЛИНЕЙНЫХ СИСТЕМАХ 509 dt dp(x^Z) дх л d2p(x,AZ)) -O^tr Q— — = дхдхт = p(x,t\zty(x,,t) - А]ТА-‘(фг(0 - л} (6.4.83) Здесь p(x,t\Z) - плотность распределения вероятности в пространстве состояний при условии наблюдения (6.4.82) в течение интер- вала временит [0, I]; h - условное математи- ческое ожидание h: h= ^h(x,t)p(x,t\Z)dx. (6.4.84) -ОО При А —> оо условная плотность вероятности р(х9 l\Z) обращается в безусловную р(х, t) , а СКЬ-уравнение (6.4.48) - в ФПК-уравнение (6.2.10). СКВ-уравнение (6.4.83) является сто- хастическим (правая его часть содержит шу- мы), а ФПК-уравнение - детерминированным. Обобщенный ФКБ пер- вого приближения. Самым про- стым подходом к оцениванию процесса в не- линейной системе является введение невозму- щенного движения и линеаризация в окрест- ности этого движения. К линейным уравнени- ям в отклонениях применяется обычный ли- нейный ФКБ (6.4.39), (6.4.40). Недостатком такого подхода является прежде всего назначе- ние самого невозмущенного движения, кото- рое может быть неизвестным (неконтролиру- емым) при осуществлении алгоритма в режиме реального времени. Нецелесообразно оцени- вать с возможно высокой точностью отклоне- ния от невозмущенного движения, не контро- лируя само это невозмущенное движение с достаточной точностью. Существенно более широкую область эффективного применения имеет фильтр, ли- неаризованный относительно ошибок оцени- вания. Для системы (6.4.81), (6.4.82) соответ- ствующий алгоритм имеет вид: i = f(x,t) + Phl(x,t)R-\z - h(x,t)\; (6.4.85) - Phi(x, t)R~xhx(x,t)P + Q. (6.4.86) Здесь текущую оценку вектора состояния можно было бы обозначить xt, но для упро- щения записи ивдекс "Г опущен. Широко известный субоптимальный ал- горитм оценивания (6.4.85), (6.4.86) именуется обобщенным (или нелинейным) непрерывным ФКБ первого приближения. Название "обобщенный" связано с тем, что при f = A(t)x, А = H(t)x из (6.4.85), (6.4.86) получается обычный, строго оптимальный линейный ФКБ (6.4.39), (6.4.40). Первое при- ближение соответствует тому, что в разложе- ниях функций/ h в степенные ряды по при- ращениям (ошибкам оценивания) сохранены лишь линейные члены. Запись Р = Рт в (6.4.85), (6.4.86) обо- значает лишь оценку условного математиче- ского ожидания ковариационной матрицы ошибок оценивания и является матрицей со случайными составляющими элементов. Эта матрица определяется стохастическим уравне- нием (6.4.86), взаимосвязанным с основным модулем алгоритма (6.4.85). Связь и стохас- тичность обусловлены зависимостью /$, h- от вектора х, который имеет случайную со- ставляющую, вызванную шумами наблюдения Z- Условия, благоприятствующие точному оцениванию в частности, условие линейной независимости столбцов матрицы rank h% = т£п (6.4.87) действительно благоприятствует оцениванию: при диагональной невырожденной матрице интенсивности шумов измерения R уравнения для диагональных элементов матрицы Р (оценок условных дисперсий ошибок оцени- вания) запишутся в виде (6.4.88) где применены развернутые обозначения про- изводных. При условии (6.4.87) второй член в пра- вой части (6.4.88) всюду отрицателен, что спо- собствует уменьшению Рц. Если хотя бы один шум измерения стремится к нулю (Ry 0) , то установившаяся точность оценивания неог- раниченно возрастает.
510 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ Однако процессы в обобщенном ФКБ могут быть существенно более сложными, чем в обычном линейном ФКБ. Так, в линейном непрерывном ФКБ расходимость процессов оценивания имеет место только при расходи- мости ковариационной матрицы P(t) с тече- нием времени (применительно к одномерному случаю это показано на рис. 6.4.6, а). Для обобщенного ФКБ возможны случаи, когда реализации Дх(/) расходятся, a P(t) - схо- дится (рис. 6.4.6, б). Циклический обобщен- ный ФКБ. Самым сложным для многих приложений, в частности, в области техноло- гических процессов является разработка доста- точно точных (адекватных) математических моделей и определение характеристик шума, воздействующего на оцениваемый процесс. Кроме того, адекватные модели (как правило, высокоразмерные) приводят к значительным вычислительным затратам при работе ФКБ в режиме реального времени. Одним из путей преодоления этих труд- ностей может служить циклическое оценива- ние, базирующееся на упрощенной детерми- нированной или полустохастической (со слу- чайными начальными условиями) модели по- ниженной размерности вида задаваемой на каждом текущем цикле ограни- ченной продолжительности [21].
ОЦЕНИВАНИЕ ПРОЦЕССОВ В НЕЛИНЕЙНЫХ СИСТЕМАХ 511 "Ковариационное" уравнение (6.4.86) на каждом цикле имеет форму P = fiP+ Pfl - РЛТЛ-^Р. (6.4.89) Его общее решение (типа (6.4.49)) в данном случае определить невозможно, и уравнение (6.4.89) должно интегрироваться численно, синхронно с основным модулем (6.4.85), как и при 2*0- В остальном функционирование обоб- щенного циклического ФКБ аналогично дей- ствию линейного циклического ФКБ. Одновременные коор- динатное и параметриче- ское оценивание посредст- вом обобщенного ФКБ. Прак- тическому применению ФКБ во многих при- ложениях препятствует отсутствие достаточно достоверной априорной модели оцениваемого процесса. В этом случае можно применить текущую идентификацию оцениваемого про- цесса, позволяющую построить апостериорную модель в процессе функционирования алго- ритма. Это эквивалентно адаптивному оцени- ванию. Для системы (6.4.66), (6.4.67) рассмотрим обобщенный ФКБ, выполняющий одновре- менно параметрическое и координатное оце- нивание [44]. Вводя расширенный вектор состояния, записываем = f9(x99u9t) + $9; z = h(xp,u,t) + r\, где $ о В соответствии с (6.4.85), (6.4.86) при равно- сильных предположениях имеем Хр = /р(Хр,«,0 + + Рр/^ (хр, и, ffR-'lz - Л(хр,«, 0J; (6.4.90) А=fэхр (*р > и> О'А Ppf(xj, и, t) - - PpAlp(Xp,«,/)J?-1Aip(Xp,«,oA> +Qp, (6.4.91) ше Ср = Q о о о ' Этот алгоритм до матриц-блоков раскрыт в [44]. К числу недостатков алгоритма (6.4.90), (6.4.91) можно отнести весьма большую раз- мерность "ковариационного" уравнения (6.4.91) при большом числе оцениваемых па- раметров. Дальнейшее упрощение задачи свя- зано с ее декомпозицией на основе учета сла- бых связей между отдельными параметрами. Фильтры с эмпириче- скими средними. Существует еще один вид фильтров, адаптивных по отноше- нию к характеристикам шумов. Он ориентиро- ван на такие варианты объектов и датчиков, в которых эти шумы имеют высокую интенсив- ность, относительную стабильность (стацио- нарность) и вызывают ошибки оценивания с относительно малыми временами корреляции. При этих условиях средние по ансамблю уда- ется приближенно заменить средними по вре- мени. Первая версия алгоритма такого класса базируется непосредственно на СКБ-урав- нении (6.4.83), точнее, на уравнении наблюда- теля вида х = /(х,I/, /) + (xh т- xhT)R~\z - А), (6.4.92) вытекающего из СКВ-уравнения [41]. Здесь символом "л" обозначены условные математи- ческие ожидания. Алгоритм (6.4.92) строго нереализуем, так как истинные значения величин х, Л, а стало быть и апостериорные МО f, h , xh т в правой части (6.4.92) по условию задачи неизвестны. На основе следующих допущений /(х,u,t)* f (х,I/,Г); А(х,t) = Л(х,/); xh т« хйт(х,0 = (6.4.93) ще чертой обозначено некоторое среднее по времени, например, выход апериодического фильтра: ТфЬл + Z)rt = хйт (х, /), (6.4.94) (7ф - скалярная постоянная) получается су- боптимальный алгоритм х = /(x,u,Z) + - xftT(x,/)pr*[z - Л(х,0} (6.4.95) Вариант алгоритма с эмпирическим оп- ределением оценки матрицы Р описан в [37].
512 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ Обобщенный фильтр Калманн-Быоси с дискретным временем. Дискретный во времени стохастический процесс (марковская последо- вательность) описывается уравнением x[fc + l] = + w[fc], (6.4.96) где w[fc], (к = 0, 1, 2, ...) - белая центриро- ванная случайная последовательность: ММ*П = о; В отличие от линейного объекта, ще дискрет- ная (рекуррентная) модель (6.4.52) получается из непрерывной модели на основе общих точ- ных формул (6.4.55), общего точного метода получения рекуррентных моделей непрерыв- ных нелинейных объектов не существует. Здесь приходится, как правило, использовать приближенные методы построения разностных схем, в частности, широко известные одно- шаговые методы численного интегрирования обыкновенных дифференциальных уравнений, описывающих непрерывный динамический объект. Шаг численного интегрирования дол- жен быть при этом достаточно малым. Если дискретность измерений соответствует этому шагу, то уравнение наблюдения записывается в виде 4*] = /«*]] +v[*]; (6.4.97) ММ Л] ] = 0; M[v[fcJvT[ fl ] = (6.4.98) Белые последовательности w[£], v[fc] пола- гаются взаимно некоррелированными. Обобщенный рекуррентный ФКБ линей- ного приближения имеет следующий вид [41]: одношаговое предсказание х[к + 1|Л] = ЛШ4ВД; (6.4.99) одношаговое предсказание Р[к + 1|А| = Д[х[*|, «[it], *]Р[*1 х [*[*],«[*],*)+ C[*fc (6.4.100) вычисление матричного коэффициента усиления XI* +1] = Р[к +1|£] х х йТ[х[& + l|fc],w[fc + l],fc +1] х х |л$[х[к +1|£], и[к +1],£ + 1]Р[£ +1|£] х х АТ[х[к + l|fc], +1], к +1]+ +1]}"1; (6.4.101) вычисление 3c(jt + l) = x[jt + l|jt) + Ar[jt + l)x X +1] - О* +1|*],«[к + 1],Л +1]}; (6.4.102) вычисление Р[* + !] = {£- *[* + 1] х х /^[x[fc + l|fc],w[fc +1],£ + + l|fc). (6.4.103) Для линейного объекта и уравнения наблюде- ния из этого алгоритма вытекает как частный случай алгоритм (6.4.56) - (6.4.60). Некоторые вопросы применения ФКБ. К методическим приемам синтеза ФКБ можно отнести распределение информации, совмест- ное координатное и параметрическое оцени- вание, применение упрощенных моделей в режиме циклического оценивания. Использование достаточно простых мо- делей имеет широкое распространение. Одна- ко потери в точности, связанные с упрощени- ем модели, должны быть допустимыми. Чисто эмпирический путь, метод статистических испытаний при выборе модели часто оказыва- ется чрезмерно трудоемким. Проще проанали- зировать варианты путем решения соответст- вующих ковариационных уравнений ФКБ. Этот подход именуется иногда ковариацион- ным анализом. Рассмотрим фильтры с моделями, устой- чивые при отказах датчиков. Результаты руч- ных измерений обычно засорены ложными отсчетами, выбросами, выпавшими точками. При автоматических измерениях подобные же эффекты вызываются помехами, сбоями, отка- зами измерительных преобразователей. Эти явления обусловили создание рабастных фильтров, оптимальных при упомянутых ин- формационных искажениях. Данному направ- лению посвящено много работ, библиография которых приведена в [41]. Однако строгая оптимальность должна базироваться на знании вероятностных законов столь нестационарных и относительно редких явлений, как сбои и выбросы. Эти законы обычно нельзя предска- зать или определить с необходимой степенью достоверности. Поэтому основным остается эвристический подход. Защита от отказов и выбросов может проводиться на уровне пер- вичной обработки сигналов измерительных преобразователей. Однако для наблюдателей с моделями, в том числе ФКБ, использующих сигналы нескольких измерительных преобра- зователей, значительно более эффективной
ОПТИМАЛЬНОЕ АДАПТИВНОЕ ОЦЕНИВАНИЕ 513 является защита от отказов на основе диагно- стики в основном модуле фильтра [44]. Действительно, пусть рассматривается обобщенный непрерывный ФКБ типа (6.4.85), (6.4.86) и матрица интенсивности шумов из- мерения R - диагональная. В развернутой форме матрица-столбец Я-1 [z - h(x,t)\, фи- гурирующая в основном модуле (6.4.85), имеет вид (6.4.104) При отказе какого-либо датчика, напри- мер, датчика с номером v, невязка Zv - hv(x,f), как правило, сильно возрастает. Именно резкое возрастание сигнала невязки можно принять за признак внезапного отказа, помехи, сбоя. При таком возрастании невязки автоматически должно резко увеличиваться Ду как в основном модуле, так и в модуле кова- риаций (6.4.86). Восстановление исходного значения Ду должно происходить при возвращении нормы сигнала невязки zv -hy,(x,t) в пределы до- пуска. 6.4.4. ОПТИМАЛЬНОЕ АДАПТИВНОЕ ОЦЕНИВАНИЕ Основной недостаток фильтра Калмана заключается в том, что для уравнений опти- мального фильтра необходимо точное знание динамических уравнений системы и статистик случайных величин. Однако обычно доступны только их оценки. Разработан целый ряд схем фильтра Калмана, позволяющих решить эти проблемы. Такие схемы называют адаптивны- ми фильтрами. Оптимальное адаптивное оценивание в дискретных линейных системах по критерию минимума средней квадратической ошибки. Исходная постановка задачи сводится к сле- дующему. Заданы линейная дискретная систе- ма х[* +1] = А[к, а М Л] + + *[* ] (6.4.105) и канал наблюдения Z[fc] = Я[МИ*1 + к = 0,1,..., N. (6.4.106) Матрицы объекта А{к, а], В[к, а] и канала наблюдения Н[к, а], а также ковариационные матрицы Q\k, a], R[k, а] центрированных нормальных возмущающих воздействий w[£], v[fc] и параметры априорного начального нормального распределения Р(х[0]|а) зависят от вектора неизвестных параметров а = [Oj... Oq ]т, априорная плотность распре- деления Р(а) которого предполагается извест- ной: M[w[fc]|a] = 0; M[v[£]|a] = 0; М[М*Кт1ф] = 0 Va; ММ*Кт1ф] = J4Jt,a]aew; P(40]|a]eMm(a),G(a)), где ав^ - символ Кронекера; m[a],G[a] - условные математическое ожидание и кова- риационная матрица вектора х[0]. Требуется на основании всех проведенных наблюдений ZN = Izt[0]:zt[1]:...:ZtIAT]]t оценить век- тор состояния x[7V] так, чтобы средняя квадра- тическая ошибка оценивания была минималь- ной. Оптимальная среднеквадратическая оцен- ка х( JVJ и соответствующая ковариационная матрица P[2V] определяются выражениями л(ЛГ1 = J х|ЛГ,а)/’(а|глг)<йт; ЛАГ] = J pW а] + [л(ЛГ] - 3W л]1 х х [£[ЛГ] - x[^a]]T]p(a|zx )da, где х(Я,о] и Р[Д7,а] - оценка вектора со- стояния и ковариационная матрица ошибок, условные по а. Они определяются выраже- ниями специального дискретного фильтра Калмана, согласованного с параметром модели а: уравнения оценок для к = 0, 1, ..., N: х[£,а] = #^£-1,а1 + Х1£,а]Д[£,а], х[0|- 1,а] = т(а)]; (6.4.107) х{к + l|fc, а] = A[k,ajx[k,a] + Д[ к, а] = -1, а]; 17 Зак 1023
514 Глава «А МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ - 1,а]Ят[М1 X х (я[Л,а]Р[*|* - 1,а]Ят[Л,з] + ДЛ,а]} \ уравнения ковариационной матрицы: flit,а] = [£ - Х1М]Я1М]]Л*|* -1>«1. Р[0|-1, а] = G(a); (6.4.108) Р\к +1|*, а] = Ак,а]Г[к,а]Лт[к,а] + (Лк, а]. Апостериорная плотность распределения параметра а при фиксированном 2F определяется рекуррентной формулой Байеса p(alzk} = -----——pLJz*-1), к = 0,1,...; p^Z'1} = р(а), где 1 £[£,о] - 1,о]| 2х Х 4“ Здесь модельно-условный обновляющий про- цесс (невязка наблюдения) Д[£,а] является белым шумом с условной по а ковариацион- ной матрицей PJfcpt - 1,а] = Я[М1ЛМ1ЯТ[М] + +Я[£,а]. Вычислительные затраты оптимального в среднеквадратическом адаптивного фильтра зависят от размерности векторов х, Z и а, а также от природы параметра а. В случае не- прерывного параметра а для точной реализа- ции оптимального адаптивного фильтра необ- ходимо несчетное бесконечное множество фильтров Калмана. Однако весьма рациональ- но и эффективно использование приближен- ных решений, учитывающих параллельно- несвязанную структуру вычислительного алго- ритма. Оптимальное адшггшное оцешпапе в дискретных линейных системах по критерию максимума апостериорной веронгиости. Исход- ная постановка задачи определяется уравне- ниями (6.4.105), (6.4.106). Требуется найти оценку, максимизирующую апостериорную плотность вероятности /^xjivjz^j. Решение этой задачи предполагает предварительное определение p^xfA^Z^j. В вычислительном отношении существенно проще решить задачу оптимального совместного оценивания и па- раметрической идентификации, однако дл^ этого требуются знания совместной апостери- орной плотности вероятности />(дя],а|гя) вектора состояния x[JV] и неизвестных пара- метров а. Вычисление такой плотности связа- но с нахождением интегралов сложного интег- ро-дифференциального уравнения в частных производных, аналитическое решение кото- рого в общем случае невозможно. Имеется также приближенный подход, связанный с трудной в вычислительном отношении так называемой "двухточечной краевой задачей". Для условий (6.4.105), (6.4.106) найдено точ- ное выражение = [(2Я)"/2 х I"1 I X X JЛ(Я,в|ЛЯ,в|’/2 схр(-1 х ЧХ,а]ехр{-1(|4ЛГ]-^а|^1ЛГ(в1 +ДЛГ,а])}. (6.4.109) Используемые здесь величины определяются соотношениями Цк + 1,е] = ЯМ]|ЛМ11/2 х х |Л* + ipt.af 1/2|Д£ + 1,«Г1/2; ЛМ1 = Д*-1,а] + ИЛ,а|2.11м]; Е 1[k,a] = R *[Л,а]-Я '[Л,а]Я[Л,а] х х k = 0,l,...,N начальные условия для которых задаются в виде 40,а] = Р(а)|таГ’/2Ив)Г1/2,
ОПТИМАЛЬНОЕ АДАПТИВНОЕ ОЦЕНИВАНИЕ 515 = о, а Р[£ +1|£, а], Д[£,а] находятся путем решения уравнений (6.4.107), (6.4.108). Наличие явной процедуры расчета а ) позволяет реализовать опти- мальные совместные оценивание и идентифи- кацию по критерию максимума апостериорной плотности. Пусть Хоп, Доп - оптимальные (по рассматриваемому критерию) оценки после проведения наблюдений 2^. После подстанов- ки Хоп> аоп в (6.4.109) получают p(xon>flon|^ ) Е ®ехр| 2||*оп + + /[ЛГ,доп1}. Здесь обозначено = -1 In b[k, а]. Следовательно, наиболее веро- ятная оценка вектора состояния выдается фильтром Калмана (уравнения (6.4.107), (6.4.108)), синтезированным для значения а = аоп; хоп =xt^,aonL а сам наиболее вероятный вектор параметров получается пу- тем минимизации функции J[Nt а] по а: /[ЛГ,ДОп] = min ДАТ, а]. Методы такой ми- fl химизации могут быть различными. Большой интерес представляют подходы, основанные на идеях нелинейного программирования и не использующие производных (прямой поиск Хука и Дживса, поиск по деформированным многогранникам, различные модификации метода случайного поиска и др.). Наряду с этим могут использоваться- также методы ми- нимизации, основанные на вычислении про- изводных dJ[N,а] / да , такие как метод на- искорейшего спуска, метод Ньютона, метод сопряженных градиентов, метод переменной метрики и пр. Воспользуемся соотношением (6.4.35). Тоща процесс оптимизации описыва- ется уравнением а = а[0] = т(а), (6.4.110) да к- симметричная матрица коэффициентов. Если оценивание проводится только один раз по проведении всех запланированных наблюдений 2^, то процедура оптимизации (6.4.110) также осуществляется один раз. Если же осуществляется непрерывное текущее оце- нивание mN- текущий момент времени, то оптимизация (6.4.110) осуществляется после получения каждого нового измерения На основании (6.4.109) можно получить апостериорные плотности как вектора состоя- ния, так и вектора неизвестных параметров: p^Z*) = (6.4.111) = J /^ATLalz^AfAT] = 4Ar,ap>[Ar,al1/2 exp(-1ДЛГ.а]) J exp(-1 ДЛГ.а]^ Знание этих плотностей позволяет осуществ- лять раздельные оптимальные адаптивное оце- нивание и идентификацию по различным кри- териям. В частности, оптимальная адаптивная оценка по критерию максимума апостериор- ной вероятности получается путем оптимиза- ции /(xjAnJz*) по x[2V]. Такое оценивание в качестве промежуточной операции предпо- лагает вычисление интеграла (6.4.111). Поэто- му по упоминавшимся ранее причинам при этом варианте (в сравнении с совместными оптимальным оцениванием и идентификаци- ей) требуется повышенная производительность вычислительных средств. Таким образом, оптимальные адаптивные оценки, обладающие наименьшей дисперсией и представляющие собой апостериорные мате- матические ожидания, определяются соотно- шениями i(jV] = j xfjV]p(xfJv(z'v^JV]; (6.4.112) а = J N }da, причем система уравнений (6.4.107) (6.4.109), (6.4.111) - (6.4.112) дает то же самое значение x(7V], что и процедура, изложенная в п. 6.4.2. 17*
516 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ 6.4.5. ОПТИМАЛЬНЫЕ СОВМЕСТНЫЕ ФИЛЬТРАЦИЯ И ПРОВЕРКА ГИПОТЕЗ Существует большое число задач в облас- тях адаптивного управления, контроля и диаг- ностики, навигации и статистической радио- техники для решения которых необходимо одновременное использование методов теорий фильтрации и проверки гипотез. Известны различные подходы к решению подобных за- дач. Общий подход сводится к решению ин- тегро-дифференциального уравнения в част- ных производных, определяющего совместную апостериорную вероятность вектора состояния динамической системы и произвольного числа распознаваемых гипотез. Вычисление апосте- риорной вероятности позволяет решать разно- образные задачи оптимального и субопти- мального управления с использованием раз- личных критериев оптимизации. Рекуррентно-поисковое оценившие. Ли- нейный вариант. Рекуррентно-поисковое оце- нивание (РПО) основано на комбинировании идей дискретной калмановской фильтрации и теории проверки гипотез. Оно ориентировано на решение задач, в которых существуют сложные дифференциальные зависимости ме- жду последовательно проводимыми измере- ниями Zq, Zb •••> Zk- Пусть имеется конечное множество гипо- тез Q = и заданы априг орные вероятности гипотез Pj = P(Dj), =1- В дискретные моменты времени 7=1 к = 0, 1, ...» N наблюдается сигнал z[fc] = Н[к, Dj ]х[£] + Л к, Dj ] + v[A], (6.4.113) зависящий от вектора состояния x[fc] линей- ной дискретной динамической системы, опи- сываемой уравнением х[^ + 1] = ДА,2)у]х[А] ++ (6.4.114) Матрицы объекта Aj[k] = AfkfDj ], = B[kyDj], канала наблюдения Яу[*] = Я[£,2)у], стати- стические характеристики возмущений w[£], и начального распределения вектора со- стояния х[0] произвольным детерминирован- ным образом зависят от гипотезы Dj, имею- щей место на интервале наблюдения к = 0,N . Наблюдателю априори неизвестно, какая из гипотез выполняется. Случайные возмущения w[£], v[£] - центрированные нормально распределенные дискретные "белые" шумы, их условные ковариационные матрицы: (6.4.115) M[vR]vTR]|Z)71 = Я7[*]®«. Начальные условные распределения вектора х[0] нормальные: ^х(о(о7) еЯ(т7,Я7), J = l,g, (6.4.116) где mj = m(Dj), Gj = G(Dj) - условные математическое ожидание и ковариационная матрица распределения у j * Случай- ные векторы х[0], w[fc], v[fc] взаимно не кор- родированы. Оптимальный в смысле максимума алгоритм фильтрации век- тора состояния x[2V] и выбора гипотеза Dj включает три группы уравнений для к = О, N : уравнения оценок: х7[*;] = х7(ф-1] + Я7(Л]Д7И]; х7|0|-1| = т7; xj[k + l|fc] = Л7[А;]х7[А;] + 57R|4*I; AJ*] = 4*] - я71*|х71*|* - И - </[*]; </[*1 = - 1]Я7т[А:] х х {яj[k]Pj[ф - 1]Я)[*] + Rj[к]}’1, (6.4.117) уравнения ковариационных матриц: PjI*) = [я - Я7[Л]Я7[Л]]/>7[ф -1]; Р7[о|- !] = <?>; (6.4.118) Pjlk +1|Л] = AjtkJRjtkJAjtkl + Qjtk]
ОПТИМАЛЬНЫЕ СОВМЕСТНЫЕ ФИЛЬТРАЦИЯ И ПРОВЕРКА ГИПОТЕЗ 517 и уравнения функционалов *: /,[*] = /,[*)-2 In/>,[*]; bjlk + Ц = bj[fcf/2|РУ[Л + l|fcf1/2 х x|a7[fc + if1/2; *7[0) = p,|Ay[0f,/2|G,r,/2; (6.4.119) /y[-i] = о; £/[*] = я;1!*]- - RflkWj [к}Р}[к}Н}[к]Я^[к]. По формулам (6.4.117) - (6.4119) рассчи- тываются конечные значения функционалов В качестве наиболее вероятной выбира- ется гипотеза Д, минимизирующая функцио- нал J^TV]: Dv = arg min J а оценка xv[AT], выдаваемая соответствую- щим этой гипотезе фильтром Калмана, являет- ся оптимальной оценкой вектора состояния Хц. Равенства (6.4.117) - (6.4.119) полностью определяют алгоритм РПО. Здесь хДЛГ] и PJ7V] имеют смысл условных математиче- ского ожидания вектора и ковариацион- ной матрицы ошибок оценивания ху[ЛГ] = MpAnpJpZ*]; Ру[ЛГ| = = м[[х[ЛП - xj- х7[ЛП]Т|л7, ZN\ соответствующих случаю, когда на интервале наблюдения k = Q,N имеет место гипотеза Dj. В процессе доказательства соотношений (6.4.117) - (6.4.119) получено точное выраже- ние для апостериорной плотности вероятности * Говоря строго математически, //[А] является функцией многих переменных Зо, С1> •••> но физически она ближе по смыслу к функционалу от функции вектора наблюдения, что станет очевидным при рассмотрении непрерывного варианта. р(х1Л), = х exp - |(И*ь*л*Й5--и (6.4.120) являющееся строгим решением для рассматри- ваемой постановки задачи дискретного аналога уравнения Стратоновича Р. JI. Из (6.4.120) следуют апостериорные плотности для вектора состояния х[£] и произвольной проверяемой гипотезы Df. /(xW|2)pZ*) = = [(2я)"|р7[*(]'г ехр(- - XjJ, Апостериорные характеристики и могут служить основой для ис- пользования других критериев оптимизации при оценивании вектора состояния и выборе гипотезы Dj. Алгоритм РПО (рис. 6.4.7) структурно распадается на две час- ти: рекуррентную, где моделируются дискрет- ные фильтры Калмана и рассчитываются зна- чения функционалов и поисковую, в которой отыскивается min /ДЛ]. Этим и объ- ясняется название алгоритма. Непрерывный аналог рекуррентно-поиско- вого оценивания. Линейный вариант. Постанов- ка задачи аналогична дискретному случаю. Имеется конечное множество гипотез Q = {/>!,...,Z)j,...,Z)9} и заданы априорные вероятности гипотез Pj = P(Dj). На интер- вале Т\ наблюдается сигнал
518 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ dv Fq[k] Pec. 6.4.7. Структурная схема алгорнтма рекурреятно-поаскмого оцеянваиня: т - блок единичного запаздывания г(0 = Я/(0х+*)(0 + п, зависящий от вектора состояния х(1) линей- ной динамической системы, описываемой уравнением х = Aj(f)x + Bj(t)u + Матрицы объекта Aj(t) = A(t,Dj)y Вj(f) = = B(tyDj)y канала наблюдения = = H(tyDj), Fj(t) = F(tyDj) , статистиче- ские характеристики возмущения £(/) и на- чального распределения вектора состояния зависят от гипотезы, имеющей место на ин- тервале наблюдения [^, 1\. Наблюдателю ап- риори неизвестно, какая из гипотез выполня- ется. Случайные возмущения £(/), Л (О - Цен- трированные взаимно не коррелированные нормально распределенные "белые" шумы, их условные ковариационные матрицы: М^(ПС(' + ф,] = О7(')8О); м[п(0пт(' + ф7] = Я(0б(т); мр#)г)1О+т)|Л/] = °> Ъ- Начальные условные распределения вектора xfto) нормальные: где mj = m(Dj) и Gj = G(Dj) - условные математическое ожидание и ковариационная матрица распределения pjx(/o)|l)yj. Матрицы Hj(f)y Fj(t)y R(t) непрерывны по t
ОПТИМАЛЬНЫЕ СОВМЕСТНЫЕ ФИЛЬТРАЦИЯ И ПРОВЕРКА ГИПОТЕЗ 519 Тогда оптимальные в смысле максимума j^x(T),Dy|zjJ оценивание вектора состоя- ния х(7) и выбор гипотезы Dj могут быть проведены следующим образом. По соотношениям: ij = Aj(t)Xj + Rj(f)u + + PyJj(/)A-1(/)[z - Hj(t)x - /}(/)], xy(/0) = my; Pj = Aj(t)Pj+PjAj(f)- -PjHTj(t)R-'(t)Hj(t)Pj + Qj(t), Pj(fo) = Gj для каждой из возможных гипотез Dj модели- руется q непрерывных фильтров Калмана и путем интегрирования на интервале [^, 7] уравнений /,[x(o.py|z;]= вхр{-| |х(/) + ';(') } xJ^(/)|exp-l/y(0 G, Zy(0 = lnL'l+ pj + J|z(r) - Hj(x)xj(x) - +tr[24/(/)+ey(/)P71]. Рекуррентно-поисковое оценивание. Нели- нейный вариант. В этом случае предположения о множестве гипотез Dj, возмущениях, на- чальном распределении определяются соотно- шениями (6.4.115), (6.4.116). Уравнения на- блюдения и динамической системы имеют вид: GJ z7(/o) = myi rJ рассчитываются конечные значения функцио- налов В качестве наиболее вероятной выбирает- ся гипотеза Д, минимизирующая функционал Dv = arg min/у (Т), dj а оценка xv(T), выдаваемая соответствую- щим этой гипотезе непрерывным фильтром Калмана, является оптимальной оценкой век- тора состояния х(7). Апостериорная плотность вероятности p^x(/),Dy|z^ j и апостериорные вероятности пшотез будут 4* +1] = /М*), И*), к, Dj ] + М*), к = 0,N. Субоптимальный по критерию максимума апостериорной вероятности алгоритм фильт- рации вектора х[Л] и распознавания гипотез Dj содержит три группы уравнений [6]: уравнения оценок: ху|Л + 1|Л] = /(хДЛ],«|*],Л,Ру); хДЛ) = Xylfcjfc-ll + JijIfclAylA;), хДо|-1] = ту; (6.4.121) А Д Л] = г[Л) -Л(ху(Л|Л - i],k,Dj); Х/Л] = Ру[Л|Л - l]Aj(ху[Л|Л - 1],к,Dj) х х \hx(xj[Л|Л - 1],Л,Ру)Pj[Л|Л -1] х xhl(xj{^k-\},k,Dj) + Rj[k^-,
520 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ уравнения ковариационной матрицы: РД* +1|*) = fx(xj\k\k -1],к,D^Pfik} х X Я(х}\к\к - !],«[*],М>у) + Qj[k]; (6.4.122) РД*] = {£ - Kj[*]МхД*|* - 1],к,Dj)} х хРДЛ|Л-1], Ру[о|-1] = <?у и уравнения функционалов: 7y[fc] = //*]-2 In*/*]; bj[k + 1| = bj[^1/2|Р/1* + *1*Г’/2 * х|яу[А: + 1^1/2; *Д°] = Py|Ay[0f1/2|Gy|’1/2; (6.4.123) /до = Ij[k -1] + |ay[*]|2-1|Jk). /y[-i] = 0; l/И = - «;'[ kVixtxj [ *1* - i],k,Dj) x x Pj[k]hTx(хД£|£ - 1],k,Dj^[k]. В нелинейном варианте уравнения ковариаци- онной матрицы зависят от проведенных на- блюдений. В соответствии с соотношениями (6.4.121) - (6.4.123) рассчитываются конечные значения функционалов J^[2V] и находится минимум J^[2V] по всем проверяемым гипоте- зам. Гипотеза Д, обращающая J^[2V] в мини- мум, выбирается в качестве наиболее вероят- ной: Dv = argimn/y[^, а оценка на выходе калмановского фильтра, настроенного на эту гипотезу, является опти- мальной: Апостериорная совместная вероятность векто- ра состояния и произвольной гипотезы Dj и в данном случае определяется формулой (6.4.120). Непрерывный аналог рекуррентно- поискового оценивания. Нелинейный вариант. В рассматриваемом варианте предположения о гипотезах Z)y, начальном распределении векто- ра состояния x(to) и характеристиках шумов £,(/), Л(0 остаются такими же. Отличие заклю- чается в нелинейном характере зависимостей, определяющих наблюдаемый сигнал и дина- мическую систему x = f(x,t,Dj) + W; Z = h(x,t,Dj) + i^t). Субоптимальные по критерию максимума апостериорной вероятности совместные фильтрация и проверка гипотез определяются следующей системой уравнений: уравнениями оценок: Ху = /<Ху>/,Лу) + + PjhTx (xj, t, Dj )7?(,} [z - h(xj, t, Dj )|, (6.4.124) уравнениями ковариационной матрицы: Pj =fx(xj,t,Dj)Pj + Pjfx(Xj,t,Dj) - - PjhTx(xj,t,Dj)R^hx(xj,t,Dj)Pj +Qj(t), (6.4.125) PjW) = Gj-> выражениями функционалов: 77=|z-/Kxy)/)Dy)||^lw + +tr[2A(x7>/,p7)+ey(OP/1]> /y(z0) = ta^. pj (6.4.126) Дифференциальные уравнения (6.4.124) - (6.4.126 ) интегрируются на интервале наблю- дения [/0, Л и затем любым возможным спо- собом минимизируется функционал 1^1) по Dj. Таким образом определяется наиболее вероятная гипотеза Dv - arg min Ij (T). On- DJ тимальная оценка для момента времени Т вырабатывается на выходе обобщенного
СОВМЕСТНОЕ ОПТИМАЛЬНОЕ ОЦЕНИВАНИЕ, ИДЕНТИФИКАЦИЯ И ПРОВЕРКА ГИПОТЕЗ 521 фильтра Калмана, настроенного на гипотезу Д: x(T) = xv(T). Субоптимальный алгоритм выведен в предпо- ложении, что ошибки оценивания для любого обобщенного фильтра Калмана при условии, что зылолняется гипотеза D/, на которую на- строен этот фильтр, невелики по сравнению с зонами линейности (по аргументу х) вектор- ных функций и h(x9t,Dj). 6.4.6. СОВМЕСТНОЕ ОПТИМАЛЬНОЕ ОЦЕНИВАНИЕ, ИДЕНТИФИКАЦИЯ И ПРОВЕРКА ГИПОТЕЗ В ДИСКРЕТНЫХ ДИНАМИЧЕСКИХ СИСТЕМАХ Постановка залаяв. Заданы полное мно- жество гипотез {Dj,..., априор- ные вероятности этих гипотез Pj = P(Dj}, ^Pj - 1, дискретная динамическая система J x[fc +1] = A[k,a,Dj ]х[Аг] + +Д£,а,1);114£] +w[fc] (6.4.127) и канал наблюдения 4*] = H[k,a,Dj ]4^1 + Flk,a,Dj 1 + v[ Аг], (6.4.128) ще х е Rn , z e Rm, w e Rn , v e Rm , и e Rs, a e Rr. Во время проведения наблюдений на ин- тервале времени к = О, = M(v[k^atDj^ = О, M^w[£JvT[£ja,Z0 = О, M^w[£]wT[^a, Dj } = ОИ,я,Яу]®&, м(у[*Кт[ф,2)у) = Rlk^Djieu’ p(x(0]|a, Dj) е N[m(a, Dj), G(a, Dj)], Va, VDy, ще знак условного математического ожидания, ав^ - символ Кронекера, m(a,Dy), G(a,Dj) - соответственно услов- ные математическое ожидание и ковариацион- ная матрица вектора х(0]. Также предполагаются известными апри- орные характеристики p(a,Dj), j = l,^, имеющие смысл совместной плотности веро- ятности вектора .а и вероятности гипотезы Dj.p(a,Dj) есть вероятность события а <а <>a+da & Dj, причем вектор неиз- вестных параметров а при реализации гипоте- зы Dj принадлежит некоторому замкнутому ограниченному множеству а е Qy. Не исклю- чается вариант, когда для одной или несколь- ких гипотез множества Qy могут оказаться пустыми. Это будет означать, что при таких гипотезах уравнения динамической системы, канала наблюдения и др. не зависят от неиз- вестных параметров. Для упрощения записей далее использу- ются сокращенные обозначения: А^к] = A{k,a,Dj ], В^\к] = B[k9a9Dj]9 Hqj\k} = H{k,a,Dj ], F^[k] = F[k,a9Dj]9 QajW = Q(k9a9Dj]9 lyfc] = ДМ,Лу L maj = m(a,Dj), GaJ = G(a9Dj). Требуется на основании проведенных наблю- дений zN =(zt[O]:Zt[1]:...:Zt[AT]) наи- лучшим образом оценить вектор состояния динамической системы лс[Аг], вектор неизвест- ных параметров а, а также определить гипоте- зу Dj, имевшую место при проведении наблю- дений [6]. Решение может быть получено путем вы- числения семейства апостериорных характери- стик /^x[£],a,Dy|z^), j = \,q, обладающих в отношении векторов х[£] и а свойствами плотности вероятности и вероятности - в от- ношении гипотез Dj. В последующем эта характеристика на- зывается просто апостериорной плотностью. Определение апостериорной плотности ве- роятности. Искомая апостериорная плотность равна произведению = (6.4.129)
522 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ Сначала определим . При фиксации значения вектора параметров системы а и гипотезы Dj эта плотность со- гласно теории оптимального оценивания равна ^(2я)"|/>[л|Я,о,Ру] (6.4.130) здесь xptpV,e,P7]= М^хИр.Лу.г"), р[фг,о,Ру] = М^(х[Л) - х[*|лГ,о,Лу J X x(x[fc]-xJfcpV,o,.Dyp p.-DpZ* В этом пункте в единой постановке рас- сматриваются все три возможные задачи оце- нивания: фильтрация, предсказание и сглажи- вание, для которых хрф\Г,о,Ру] и P^fcpV,o,Py] определяются различными уравнениями. Вариант фильтрации (к = N). В этом случае используются упрощенные обозначения x[/|/,fl,Dy ] = x[z|fl,Dy ] и Р[ф,в(/)у) = уравнения фильтра Калмана для i = 0,к имеют вид: уравнения оценок х[/|а, -О,1 = И - + ^[/]A[l|o,Py], xli +1|1,о.Ру] = ^[i]x[/|e,Py] + AyUWL Д[«|а,Яу] = Ф1 - Яо|- 1,о, Dj ] = mqj; (6.4.131) уравнения ковариаций Д1|о,Лу ] = />[/|/ - l,a,Dj ] - Р[ф - l,a,Dj 1 х х flj[1(яф[/]дф - i,a,Dj}H^[i] + х хЯф1/1Л<|/-1(о,Яу), Л< + if,a,Dj ] = Лф[11Л/|о, Dj Ц£[ л + Q^i], Р[о|-1,0,Ру j = Gq, (6.4.132) тде хр +1|/, a, Dj j = М^х[/ + l^fl, Dj, z* Рр + l|i,fl,Dyj = + 1] - хр + l|i,a,Dyp х х(х[/ + 1]-хр + l|/,fl,Dy|j Вариант предсказания (к > N). Предсказанные значения xJ^JV, fl, Dy j, PprpV,fl,Dyj рассчитываются рекуррентным образом в соответствии с нижеследующими уравнениями [54, 55] для моментов времени i- N, 7V + 1, ...» Л-1 Х(1 + 1|Я,0,Ру] = Лч;[(|х[1|Я,О,Ру j + +^им«], х[я|я,о,Ру] = 4я|в.Яу] л/ + 1|я,о,Ру] = ^шлф^о.Ру MJ [1] + +<М']. ЛЯ|Я,0,Ру1 = Л*|в.Dj ] при этом х[я|о,Ру1, ЛЯр.Яу] определя- ются уравнениями фильтрации (6.4.131), (6.4.132), а и[/] задается в виде программного управления; матрица ^Я.о.Ру] = М^х(1] - a,Djр х х (x[i] - х[/|я>о>РурТ|о>Ру ,zN\ является условной ковариационной матрицей ошибки предсказания х[/].
СОВМЕСТНОЕ ОПТИМАЛЬНОЕ ОЦЕНИВАНИЕ, ИДЕНТИФИКАЦИЯ И ПРОВЕРКА ГИПОТЕЗ 523 Вариант сглаживания (к < N). Сглаженное значение вектора состояния Dyj определяется решением рекур- рентных уравнений оценок и ковариаций в обратном времени i = N - 1, N - 2.. к 154, 55] x[i|y,a,Dy] = x[/|a,Dy ] + + lpV>,/>y] -*[« + l|i,e,Dt]), M’J = P(ipV,e,2)7] = />[<|e,/)7] + r„[i]x х(р[« + 1|лГ,в,Л7]- + l|i,a,P7])^[«], /[ArpV,a,.Dy]= ЛЛг|о,Р7), причем x[/jfl,Dy], P[/|fl,Dy], x[i+l|/,a,Dy], P[i + l|i,fl,Dy] рассчитываются по формулам (6.4.131), (6.4.132). Смысл выражений $|tf,fl,Z)y], P[tyi,a,Dj 1 таков: H^N,a,DJ] = M(4iif>,DJ,zN), P[ipM,P7] = - xfipV.a,Dj]) x X (x|i| - x[jp\r,a,/)7 ])T|n, Dj, zn У Теперь найдем 2>7|z^j, можно no- казать [6], что —p{;^ x 1 Г } p(zk)J(2K)m«+» к Jp[ia,Djl хП t V 1----------------- ( к A хехр[-1^|дф.Л7^.ч, (6.4.133) P(o|- 1,0,Dj J = Gq, - R^U^^iiPl^Dj ]H После подстановки (6.4.130), (6.4.133) в (6.4.129) находим Р х х expi- (6.4.134) N п2 /<>/1*1*1 = е„[фГ] + ^|д1/|а,Л7^.1(/), (6.4.135) где ра7[*|ЛГ] = -21п . J|P[^,e,Z)7]| Д JPpja.Pj =р(п,д7)П / r '—T- Уравнение функционалов (6.4.135) может быть записано и в рекуррентной форме: Ш1 = - и+|ф^Р7-(|’.1((1 + ^1(1, i = 0, 1, ... |fl<i/-i,e,p7R/[d М*]=1П । । j ' > <6-413б> /„[*1-1]= -21пр(а,Р/)+ач,[*|^> а„[Л|АГ]= 1п|р[*|*,в,/>у в чем можно убедиться простой проверкой. Как следует из формул (6.4.136) соотно- шение для функционалов в различных случаях оценивания (фильтрация, предсказание, сгла- живание) отличается лишь составляющей на- чального условия ос^ .
524 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ Оптимальный алгоритм совместного оце- нивания, идентификации и проверки гипотез по критерию максимума апостериорной вероятно- сти. Рассматривается вариант, когда для раз- личных гипотез вектор а может принадлежать разным множествам Qy J = 1, <7, но размер- ность вектора а при этом сохраняется одина- ковой. Вариант с разноразмерным вектором а требует некоторых дополнительных рассужде- ний. Процедура получения оптимального ре- шения предполагает следующую последова- тельность действий. Сначала для каждой гипо- тезы Dj, j = \,q определяется вектор неиз- вестных параметров dj, на котором достигает нижней грани, ay = argjnf /ду[£|ЛГ] и рассчитываются числа IQjj [fcpVJ = = inf . Затем определяется гипотеза А, которой соответствует наименьшее из чи- сел /в„Д*|ЛГ|. /„„v[*|An = mm/e ДЛ|ЛГ]. Оптимальными оценками x\k\,a,Dv по кри- терию максимума апостериорной вероятности являются: Dv[zN ] = arg min Ia y[fcpV], D) 4^] = av, = (6.4.137) Нижняя грань inf Zfly[fcpV] может дос- тигаться либо на границе множества Qу , либо в его внутренней точке. В последнем случае это будет точка минимума. Структурная схема оптимального алго- ритма показана на рис. 6.4.8, где т обозначает блок единичного запаздывания. Рве. 6.4.8. Структурная схема алгоритма совместного оптимального шум—и, идентификации и проверки гипотез
СОВМЕСТНОЕ ОПТИМАЛЬНОЕ ОЦЕНИВАНИЕ, ИДЕНТИФИКАЦИЯ И ПРОВЕРКА ГИПОТЕЗ 525 Частные случав. Частные случаи сформу- лированной выше задачи оптимизации могут возникнуть по двум причинам [6]. Во-первых, они мохуг быть связаны с использованием различных функций потерь (в частности, квад- ратической по x[fc], а) в формуле байесова риска. Во-вторых, они мохуг появиться и при простой функции потерь в связи с тем, что в исходной постановке задачи и в критерии оптимизации присутствовали вектор состояния дискретной динамической системы х[&], век- тор неизвестных параметров а и проверяемые гипотезы Dj, а в частных случаях некоторые их этих объектов мохуг отсутствовать. Если в кри- терии оптимизации, либо в исходной поста- новке отсутствуют один или два из этих объек- тов, то возникает целое семейство важных частных случаев, имеющих самостоятельное значение. Ниже рассматривается именно эта воз- можность, и все исследуемые далее частные случаи в качестве критерия оптимальности используют критерий максимума апостериор- ной плотности вероятности. Будем обозначать рассматриваемые варианты дробной записью, в числителе которой перечислены объекты, участвующие в постановке задачи, а в знаме- нателе - объекты, входящие в критерий опти- мизации. Все возможные варианты иллюстри- рует табл. 6.4.2. а. В постановке задачи присутствуют х, a, D, а в критерии оптимизации • два или один из рассматриваемых объектов. Вариант х, a, D / х, D - совмест- ное оптимальное адаптивное оценивание и проверка гипотез в условиях параметрической неопределенности (в терминах п. 6.4.5 - адап- тивное рекуррентно-поисковое оценивание в условиях параметрической неоххределенности), критерий оптимальности max ’а, Вариант х, a, D / х, а - совместное оптимальное адаптивное оценивание и иден- тификация в условиях структурной неоххреде- ленности, критерий оптимальности sup У р(х(*],в,/)ук*). Вариант х, a, D / a, D - совмест- ная оптимальная идентификация и проверка гипотез (структурно-параметрическая иденти- фикация) в дискретных динамических систе- мах, критерий оптимальности sup fy(xW,e,.Dy|zJV)AI*]- Вариант х, a, D / х - оптимальное адаптивное оценивание в условиях структур- ной и параметрической неопределенности, критерий оптимальности maxS f Xxl*l’e’₽j|zJV)<to- > а) 6.4.2. Частные случаи совместного оптимального оценивания, идентификации и проверки гипотез В постановке задачи присутствуют х, a, D х, а х, D a, D X a D х, a, D х, а, D/x, а, D 1 х, а х, а, D/x, а х,а/х,а к х, D х, at D/x, D x,D/x,D a, D х, а, D/a, D a, D/a,D 1 к X х, а, D/x х,в/х x,D/x x/x & § а х, а, D/а х,а/а a, D/a a/a & со D х, а, D/D x,D/D a, D/D D/D
526 Глава 6.4. МЕТОДЫ ОПТИМАЛЬНОЙ И СУБОПТИМАЛЬНОЙ ФИЛЬТРАЦИИ В САУ Вариант х, a, D / а - оптимальная идентификация параметров дискретной дина- мической системы в условиях структурной неопределенности, критерий оптимальности Вариант х, a, D / D - оптимальная проверка гипотез в дискретных динамических системах в условиях параметрической неопре- деленности, критерий оптимальности ПШХ11 1 °) Входящий в некоторые из критериев ин- теграл равен и определяется соотношением (6.4.133). б. В яостшш задача присутствуют х, а, а в критерии оптимизации • х, а, или х, или а. Этот частный случай получается из об- щего, если предположить , что q =1, т.е. мно- жество гипотез содержит единственную гипо- тезу D\ и вероятность этой гипотезы р\ = 1. В уравнении наблюдения следует положить J[jt,a,Dy] sO и во всех уравнениях опти- мального алгоритма (6.4.131), (6.4.132), (6.4.136) опустить несущественный индекс q = 1. В структурной схеме рис. 6.4.8 исчезнет блок поиска min/e Возникает сле- DJ ' дующая постановка задачи: заданы дискретная динамическая система х[£ + 1] ^4[fc,a]x[fc] + В[£,а]и[£] + w[fc] и канал наблюдения £[*] = Я[ММ*1 + v[*L к = 0,1,... Ковариационные матрицы Q[k,a], центрированных нормальных дис- кретных белых шумов w[fc] и v[£], а также параметры априорного начального распреде- ления зависят от значения вектора неизвестных параметров а, которое имеет ме- сто во время проведения наблюдений; случай- ные векторы w[£] , v(fc] и х(0] взаимно не коррелированны. В этих условиях Вариант х, а / х, а - совместное оптимальное оценивание и параметрическая идентификация в дискретных динамических системах [44], критерий оптимальности sup xf^],aeQ Вариант х, а / х - оптимальное адаптивное оценивание в дискретных динами- ческих системах, критерий оптимальности М J Q Этот и предыдущий варианты для случая оце- нивания-фильтрации подробно рассмотрены в п. 6.4.4 Вариант х, а / а - оптимальное оценивание параметров (параметрическая идентификация) в дискретных динамических системах, критерий оптимальности Sup J = supX®.|?X) = что равносильно требованию inf /д[*р\Г]. aeQ в. В постановке задачи присутствуют х, D, а в критерии оптимальности - х, D, или х, или D. Частный случай получается из общего, если множество возможных значений вектора параметров а превращается в точку. Во всех уравнениях постановки задачи и оптимального алгоритма (6.4.127), (6.4.128) и (6.4.131), (6.4.132), (6.4.136), (6.4.137) надо опустить ненужные в этих условиях вектор а индекс "а", а в структурной схеме (рис. 6.4.8) исчезнет блок поиска нижней грани функционалов /^[fcpVJ. В рассматриваемых условиях
СОВМЕСТНОЕ ОПТИМАЛЬНОЕ ОЦЕНИВАНИЕ, ИДЕНТИФИКАЦИЯ И ПРОВЕРКА ГИПОТЕЗ 527 хехр|-1(|4Л)-ЖК,Ру^.1ИлЛ1 + + /в[*|лг))}. Вариант х, D / х, D - совместное оптимальное оценивание и проверка гипотез в дискретных динамических системах (рекур- рентно-поисковое оценивание) [44], критерий оптимальности Вариант х, D / х - оптимальное оценивание в дискретных динамических сис- темах в условиях структурной неопределенно- сти, критерий оптимальности •*IAJ J Вариант х, D / D - оптимальная проверка гипотез в дискретных динамических системах (как возможный вариант - оптималь- ная структурная идентификация дискретных динамических систем), критерий оптимально- сти шах j pfak], Dj |z *)<&[*] = = max Dj m(Jv+l) что эквивалентно минимизации по Dj функ- ционала Jy =7у[*^]-1п|Р[*^,оД г. В косяимош задачи нрвсутствуют fl, D, а в критерии. оптимальности • fl, Д или fl, км D. В этом случае в постановке задачи не присутствует динамическая система и исход- ные записи принимают вид: Задано множество гипотез j = КЯ и априорные вероятности этих гипотез Pj = P(DjY, множество гипотез полное: = 1. В дискретные моменты времени J k = Q,N измеряется векторный сигнал Z[£] = ЛМ,0;] + У[*], v[£] - нормальный центрированный дискрет- ный белый шум. Сигнал F[k9a9Dj] и ковариационная матрица B[k9a9Dj] шума наблюдения зави- сят как от проверяемой гипотезы, так и от значения вектора неизвестных параметров а. В этих условиях по всем проведенным наблю- дениям zN необходимо либо оценить вектор а и определить имевшую место при проведении наблюдений гипотезу Dj> либо только оценить вектор неизвестных параметров, либо только определить неизвестную гипотезу. Равенство (6.4.134) для апостериорной характеристики превращается в В уравнениях оптимального алгоритма надо положить ZfIfc,fl,Dy]sO и они прини- мают вид: /„[*1 = /„[*-!]+||А[*|а, Dj k = ^N A(*|e,Py) = Z[*jPy), М*1 = 1п|т?ву[Д> /ау[-1] = -21n/>(e,Dy). Вариант a, D / a, D - совместное оптимальное оценивание параметров и про- верка гипотез, критерий оптимальности sup da9Dj\zN J. Вариант a, D / a - оптимальное оценивание параметров в условиях структурной неопределенности, критерий оптимальности sup^/a,^y|zyY лсП. v 1 z
528 Глава 6.5. ОПТИМИЗАЦИЯ СТОХАСТИЧЕСКИХ СИСТЕМ Вариант af D / D - оптимальная адаптивная проверка гипотез, критерий опти- мальности max |p(a,.Dy|zJV)«fa. Di Ъ Если же в постановке задачи (а следова- тельно, и в критерии оптимизации) остается лишь один объект х, а, Д то как частный случай алгоритмов пунктов "б", "в" и "г" полу- чаются широко известные результаты: вариант х / х - фильтр Калмана, вариант а / а - оце- нивание параметров по критерию максимума апостериорной плотности вероятности, вари- ант D / D - проверка гипотез по критерию максимума апостериорной вероятности. Некоторые из рассмотренных частных случаев требуют дальнейшей проработки. Глава 6.5 ОПТИМИЗАЦИЯ СТОХАСТИЧЕСКИХ СИСТЕМ 6.5.1. СТОХАСТИЧЕСКИЕ ЗАДАЧИ ОПТИМИЗАЦИИ САУ По сравнению с задачами синтеза САУ детерминированных объектов аналогичные задачи для стохастических объектов отличают- ся существенно большим многообразием воз- можных постановок. Для многих из этих по- становок характерна значительная сложность методов решения. В качестве управляемого рассматривается стохастический процесс, который формально может быть представлен различным образом. Для процессов с непрерывным временем наи- более распространены форма Ито dx = f(x,u,a,t)at + (6.5.1) и форма Ланжевена х = /(х,«,а,0 + «0, (6.5.2) где х е Rn', и е Лг; а е Rn°; g е Rnxg; wgR*; ^eRi. Важным является вопрос задачи стохас- тической оптимизации о том, в классе каких математических операторов ищется алгоритм функционирования САУ. В результате реше- ния задачи оптимизации управления объектом (6.5.1) или (6.5.2) должны быть сформированы некоторые операторы, которые на основе по- следовательности состояний x(f), t е[Г,Г'] и, возможно, управлений 1/(0» /е[Г,Г'] определяют новое значение управления и. Предшествование интервала [/',/"] текущему моменту времени соответствует обычному ус- ловию физической реализуемости регулятора. Совокупность операторов, связывающих искомое управление с предшествующими со- стояниями (или, в более общем случае, выхо- дами) объекта и = Q(x(0,0, (6.5.3) принято называть алгоритмом, или стратегией управления. В стохастических задачах опти- мального управления различают регулярные и рандомизированные стратегии. В первом слу- чае (6.5.3) однозначно (детерминированно) определяет искомое управление по значениям х(/) и t. При этом само управление вследствие случайности x(f) будет случайным процессом. Во втором случае Q в (6.5.3) отражает некото- рую стохастическую связь. Рандомизированная стратегия (6.5.3), которую следовало бы запи- сать в виде u(f) = Q(x(0,/,n), (6.5.4) где т] - некоторый стохастический процесс, порождаемый в регуляторе, определяет неко- торое распределение вероятностей для нового (для момента I) управления. При этом регу- лярная стратегия является частным случаем рандомизированной, соответствующим вырож- дению плотности вероятности для u(f) в 6-функцию. Чаще в задачах стохастической оптимизации встречаются регулярные страте- гии как более простые и эффективные. Для каждой из рассмотренных выше детерминиро- ванных задач оптимизации можно получить стохастический аналог, введя шумы, случай- ные начальные условия, а в общем случае и случайные параметры, в математическую мо- дель обобщенного объекта и используя соот- ветствующую форму минимизируемого функ- ционала. Управления, оптимальные в смысле безус- ловных и условных целевых функционалов. Минимизация безусловных целевых функциона л'о в . Чтобы показать трудности решения стохастических задач оптимизации в безусловной постановке, рассмотрим наиболее простой класс задач па- раметрической оптимизации. Пусть марковский процесс описывается уравнением в форме Ланжевена (6.2.8): xt = f(xt,a> 0 + «0, (6.5.5) где £,(/) - белый шум с матрицей интенсивно- стей Q, а - вектор параметров. Плотность вероятности р(х, a, f) в пространстве состоя- ний определяется уравнением Фокера-Планка-
СТОХАСТИЧЕСКИЕ ЗАДАЧИ ОПТИМИЗАЦИИ САУ 529 Колмогорова (6.2.10)» которое в данном случае запишем с указанием аргументов фунщий ри/ + tt№-[p(x,a,t)f(x,a,fj ot I ox -O,5td0 d2p(x,fl,Q дхдх7 (6.5.6) p(x,fl,/0) = Po(x,fl)> a ~ const (6.5.7* Минимизируемый функционал задается в форме безусловного математического ожида- ния функционала Больца: minM- а h ^[x(i2)l + /Дх(0),0)Л Л 00 = min f V3 (х)р(х, a,t2)dx + а * -00 +1 J £(х, 0), р(х, fl, &)dxdd /| -00 (6.5.8) Таким образом, задача представлена в форме отыскания минимума по а интегрального функционала (6.5.8) с заранее неизвестной функцией р(х,а,в), определяемой нелиней- ным уравнением с частными производными (6.5.6). Это очень сложная задача. Для много- мерных систем относительно общее точное решение (и то в неявном виде) удается полу- чить только при линейной функции / квадра- тичных функциях V3, L и нормальном распре- делении вероятностей (ЛКГ - задача ). К числу наиболее распространенных ме- тодов приближенного решения нелинейных задач относится метод статистической линеа- ризации, разложение f\x,a,f) в степенные ряды, отыскание моментов через характери- стическую функцию плотности вероятности [39] и др. Все эти приближенные методы име- ют ограниченные области применения, чрез- мерно громоздки и трудоемки для сложных систем. Поиск безусловно оптимальных управ- лений связан с еще большими трудностями [19]. Минимизация целевого функционала, усредненность по всему вероятностному про- странству возможных состояний, что имеет место в (6.5.8), не всегда отвечает практиче- ским потребностям. Зачастую лучшей является система, оптимизированная в окрестности конкретного движения; точнее, множества конкретных движений. Минимизация условных Ц С левых функционалов. Для марковского процесса и уравнения наблюдения (6.4.82) z, =Л(х,,/) + п(О условная плотность вероятности описывается уравнением Стратоновича-Куш- нера-Бьюси (СКБ-уравнением) (6.4.83): др(х, a, t\Z) а(р(х, a, r|z)/) dt + Г дх (6.5.9) (6.5.10) p(x,z|Z) S2p(x,fl,^Z) - 0,5tr Q * 1 ' = дхдх = />(х,я,г|г)[л(хг,г)-й]тя *[z, -л], (6.5.11) 00 h = J/i(x,t)p(x,a,tlZ)dK, (6.5.12) -00 где p(x,a,/j|o) = Po(x,a) - начальная услов- ная плотность распределения, совпадающая с безусловной начальной плотностью. В данной задаче условной параметриче- ской оптимизации целевой функционал зада- ется в виде условного математического ожида- ния функционала Больца: 12 min М, К3[х(/2)) + j Дх(0), 0]Л = в '1 = min а [f'3(x)p(x,a,^z)<ix + где р(х, fl,/|Z) - плотность вероятности при условии наблюдения (6.5.10) на интервале времени Она является случайной
530 Глава 6.5. ОПТИМИЗАЦИЯ СТОХАСТИЧЕСКИХ СИСТЕМ функцией, определяемой стохастическим уравнением с частными производными (6.5.11). Имеется обстоятельство, благоприят- ствующее приближенному практическому ре- шению. Оно заключается в том, что при вы- полнении условий наблюдаемости, в частности условия (6.4.18) или более слабого условия, благоприятствующего точному оцениванию типа (6.4.19), и при достаточно малых интен- сивностях шумов наблюдения, образующих невырожденную матрицу Л, условная плот- ность вероятности "концентрируется" с тече- нием времени в точке х = хР Это положение, имеющее ясный физический смысл, легко подтвердить, анализируя само СКБ-уравнение (6.5.11) при условии, что [h - л) R~^[h - а) - определенно положительная квадратичная форма относительно h-h. Вследствие теоремы о среднем для любой непрерывной функции ^(xft) 4>(х,/) = М-ДЧ'О, /)1 = J 'V(x,t)p[x,^Z)dx = -СО = Т(х,0, (6.5.14) где х - некоторое значение х в области, где условная плотность вероятности р(х, f|Z) отлична от нуля. Знаком л обозначено услов- ное математическое ожидание. При концентрации условной плотности вероятности в точке х, т.е. стремлении Ax>'lz) к 8-функции с "импульсом" в точке х, соотношение (6.5.14) стремится к следую- щему: Т(х,Г) = Му[Т(х,Г)] = Т(х,Г). (6.5.15) Стремление p(x,/|Z) к 8-функции с импульсом в точке х означает неограничен- ное уменьшение флуктуационной ошибки измерения или оценивания. Если при этом дополнительно неограниченно уменьшаются постоянные составляющие ошибок, то х —► xt. Эти закономерности определяют приближенный (для нелинейных систем) и строгий (для ЛКГ задач) принципы разделе- ния, очень удобные в практическом примене- нии. Пранципы разделения при условных целе- вых функционалах. Для всех условных стохас- тических целевых функционалов, являющихся аналогами детерминированных классических (6. М3) - (6.1.47) или неклассических (6.1.50) - (6.1.54) функционалов; можно привести фор- мулировки принципа разделения [44]. Учитывая то, что использование понятия обобщенного объекта обычно позволяет при- вести уравнения к форме с линейно входящи- ми сигналами управления, интенсивность ко- торых в целевом функционале отражается в квадратичной форме, приведем формулировки принципов разделения без доказательств. Разделение для случая классического функционала. Для процесса х = /(х,Г) + ф(х,Г)и + ^(Г), (6.5.16) наблюдаемого, в частности, в соответствии с выражением (6.5.10), и функционала *2 Jy=i = My [К,[х(/2)]] + Jе,(х(0),0]Л + h h + O^jwT(0)^-1W(0)de h (6.5.17) при условии Vx^ » 0 приближенно оптималь- ное управление имеет вид (6.5.18) ще V = V (х, /) есть решение уравнения av aTv - 0Л Ф(х, f)fcpT (x, 0 = -Q3 (x, t) (6.5.19) при условии Vt=ti = K3[x(r2)]. Таким образам, приближенно оптималь- ное (субоптимальное) управление в смысле минимума условного математического ожида- ния функционала I в стохастической системе при указанных условиях может быть получено простой заменой в алгоритме детерминиро- ванного оптимального управления истинного значения х на условное математическое ожи- дание вектора состояния х. Условное математическое ожидание век- тора состояния может быть приближенно (в общей нелинейной задаче) получено на выходе различных фильтров (систем оценивания) [39].
РЕШЕНИЕ ЛИНЕЙНО-КВАДРАТИЧНЫХ ЗАДАЧ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ 531 Таким образом, принцип приближенного раз- деления указывает на то, что субоптимальная система управления обобщенным стохастиче- ским объектом может быть представлена в виде системы субоптимального оценивания, синтезированной для этого объекта при детер- минированных управлениях, и системы опти- мального детерминированного управления для того же объекта без шумов, в которой истин- ное значение вектора состояния заменено на выходную величину системы оценивания. Принцип разделения очень удобен с практической точки зрения. Он позволяет проектировать и реализовывать систему оце- нивания и систему собственно управления как бы независимо, параллельно. Это резко упро- щает решение проблем для сложных много- мерных объектов. Разделение для случая ФОР. Для процесса (6.5.16), наблюдаемого, в частности, в соответствии с выражением (6.5.10), управление, приближенно оптималь- ное в смысле минимума функционала Jy = / = Мд, h [n3M/2)]]+Je,[x(0),0)de + 6 где /д) - решение уравнения (6.5.16) д д при и= 0, %= 0 и начальном условии X(to) = xo. Выражение (6.5.23) есть аналитическая форма алгоритма с прогнозирующей моделью для стохастической системы с применением принципа разделения. 6.5.2. РЕШЕНИЕ ЛИНЕЙНО- КВАДРАТИЧНЫХ ЗАДАЧ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ Линейно-квадратичная задача при класси- ческом функционале. Рассмотрим задачу сто- хастического оптимального управления линей- ной непрерывной системой, возмущаемой гауссовским белым шумом ^(/), х = a(t)x + b(t)u + (6.5.24) при квадратичном минимизируемом функ- ционале типа (6.1.55), но с квадратичными подынтегральными функциями по аналогии с (6.1.47), т.е. + 0,5 J[«W’и(0) + (0)*-4n(0)]<® 6 (6.5.20) J = 0,5М хт(/2)рх(/2) + j xT(0)0(0)x(0)d0 + h + J«T(0)A-1«(0)d0 A (6.5.25) при условии Vx^ « 0, выражается формулой, аналогичной (6.5.18) 1/ = -Лфт(х,Г)^, (6.5.21) дх где V (х, t) есть решение уравнения Ляпунова + ^/(М) = -Q3(x,t). (6.5.22) 01 ох Приведенные выше интерпретации прибли- женного принципа разделения справедливы и для данного случая. Однако кроме (6.5.21) здесь справедливо выражение и = +/е3[А'(х,Ае)]л t (6.5.23) Предполагаются известными следующие моменты случайных процессов £(/) и x(/q) : MU(0) = 0; М|5(Г)^Т СО] - е(/)8(Г - г); М|х(/0)|=0; М|х(/0)хт(/0)] = Хо; М|х(/0Хт(/0)] = 0. (6.5.26) Таким образом, по постановке задачи требуется определить физически реализуемое управление по типу обратной связи, миними- зирующее квадратичный функционал в сред- нем по ансамблю. Случай точного знания состояния.В простейшем случае можно полагать, что в каждый момент времени слу- чайный вектор x(Z) доступен точному изме- рению. Так как невозможно предсказать воз- мущения £(/), оптимальный регулятор оказы- вается эквивалентным детерминированному регулятору (6.3.80), (6.3.82), а именно:
532 Глава 6.5. ОПТИМИЗАЦИЯ СТОХАСТИЧЕСКИХ СИСТЕМ «оп = -kb'Ax; А + а*А + Аа- AbkbJА = -р; Л(Г2) = р. (6.5.27) При этом подстановкой моп в (6.5.24) можно получить уравнение для управляемого движения х = (а - Abkti*А)х + £. (6.5.28) Отсюда получается уравнение для ковариаций вектора состояния Р = М[х(/)хт(/)]: Р = (а - bkb* А)Р + Р(а - bkbTA)T + Q. (6.5.29) Воспользовавшись иной формой записи функционала (6.5.25): J = 0,5 h tr[pX(/2)] + trj рЛЮ + (6.5.30) и выполняя ряд подстановок, можно убедить- ся, что оптимальное управление (6.5.27) обес- печивает значение минимизируемого функ- ционала h J = 0,5tr[H(r1)P(r1)] + 0,5trJ AQdQ. (6.5.31) Следовательно, согласно неотрицатель- ной (по определению) определенности матриц А и Q минимизация квадратичного функцио- нала в среднем для объекта (6.5.24) сопровож- дается увеличением значения критерия по сравнению с детерминированным случаем, когда Q= 0. Случай наблюдения с шумами. Другая постановка задачи преду- сматривает зашумленное наблюдение состоя- ний объекта (6.5.24), описываемое линейным уравнением г(П = Я(0х(0 + п(0, (6.5.32) где H(f) - известная матрица коэффициентов; т](0 - вектор гауссовских процессов типа бе- лого шума с известными моментами Mini = о; Mh(0nT«l = Ш(0пт1 = «(г-т); Mh(O*T('o)l = o. (6.5.33) Требуется найти такое управление моп, чтобы функционал (6.5.25), теперь понимае- мый как условное математическое ожидание при располагаемых наблюдениях z(x), т е[/ь/], приобретал минимальное значение. В данном случае функционал является квадра- тичной версией функционала (6.5.17). Особенностью линейно-квадратичной за- дачи является то, что не приближенным, как в общем случае, а точным является решение, получаемое заменой в детерминированном алгоритме (6.5.27) точных значений х(1) их оптимальными в среднеквадратическом оцен- ками х: «оп = ~kbTAx; А + атА + Аа- AbkbTА = Л(/2) = р, (6.5.34) х = ах + bu + K(z - Нх), К = (РНТ +S)R'; Р = аР + Рат - KRK7 + Q, P(tQ) = Ро. (6.5.35) Этот результат известен в литературе как принцип разделения, или принцип стохасти- ческой эквивалентности. По аналогии с (6.5.31) может быть пока- зано, что минимизация (6.5.25) как условного среднего сопровождается возрастанием функ- ционала по сравнению с детерминированной постановкой на величину h 0,5trJ (AQ + Abkb7 AP)d&. (6.5.36) h Здесь содержатся два слагаемых: одно обусловлено возмущением (как и в (6.5.31)), а другое - шумом наблюдения. Линейно-квадратичная задача при функ- ционале обобщенной работы. Случай точного определения со- стояния. Для объекта (6.5.24) и функ- ционала (6.1.56) с квадратичными функциями по типу (6.1.54) при точном измерении ком- понент вектора состояния х(/) и заданных
САУ С ПРОГНОЗИРУЮЩИМИ МОДЕЛЯМИ И ОПТИМАЛЬНЫМИ ФИЛЬТРАМИ 533 моментах (6.5.26) алгоритм управления при- нимает вид детерминированного алгоритма (6.3.80), (6.3.82). При этом минимизируемый функционал принимает значения, определяе- мые формулой (6.5.31) и превышающие на величину h 0,5trJ AQdQ h значение функционала в детерминированном случае. Случай наблюдения с помехами. Для объекта (6.5.24) и функ- ционала (6.1.56) с квадратичными функциями по типу (6.1.54) при наблюдении за объектом в соответствии с (6.5.32) справедливо разделе- ние задач оптимизации управления и оцени- вания состояния объекта как точное решение исходной задачи. Алгоритм управления имеет вид совокупности алгоритмов (6.5.80), (6.3,82) и (6.5.35). Ухудшение качества управления вследствие возмущений £(/) и помех т](/) оп- ределяется дополнительным слагаемым (6.5.36). При формальном совпадении выражений для "потерь" качества управления в стохастиче- ском случае при оптимизации по классиче- скому функционалу и по ФОР имеется разли- чие в определении матриц А. Для классиче- ского функционала эта матрица является ре- шением уравнения (6.5,27), а для ФОР - урав- нения (6.3.85). Поэтому численные значения "потерь" для этих подходов могут быть раз- личными и определяются конкретными дан- ными решаемой задачи. 6.5.3. САУ С ПРОГНОЗИРУЮЩИМИ МОДЕЛЯМИ И ОПТИМАЛЬНЫМИ (СУБОПТИМАЛЬНЫМИ) ФИЛЬТРАМИ Принцип приближенного разделения по- зволяет строить нелинейные субоптимальные САУ в виде последовательного соединения системы оценивания вектора состояния и сис- темы оптимального управления с прогнози- рующей моделью, синтезированной для детер- минированных условий (рис. 6.5.1). Ввиду того, что существует несколько видов алгоритмов субоптимального оценива- ния нелинейных процессов (см. гл. 6.4), не- сколько версий алгоритма с прогнозировани- ем, а также несколько видов решаемых задач (терминальная, слежения и др.), в рамках ука- занной структуры возможно значительное число конкретных вариантов. Рассмотрим сравнительно общую, рас- крытую до алгоритмов в непрерывной форме структуру, а затем некоторые частные ее виды. Структура прогнозирующих САУ с наблю- дателями (фильтрами). Пусть уравнение обоб- щенного объекта имеет вид, подобный (6.4.81), но с линейно входящим управлением х = /(х, Г) + <р(х, t)u + £(/)• (6.5.37) Уравнение наблюдения аналогично (6.4.82): Z = A(x,0 + n(0- (6-5.38) Критерий оптимизации задан в виде ус- ловного математического ожидания ФОР с квадратичными затратами на управление (6.5.20) Jy =М, h Из[х(/2),/2|+/езк(е),0]Л + h (6.5.39) Математическую модель (ММ) свобод- ного движения обобщенного объекта в соот- ветствий с (6.5.37) записываем в виде х = /(х,Г). (6.5.40) Общее решение этого уравнения имеет форму х(Г) = X(x(tQ),tftQ). (6.5.41) Выбирая в качестве субоптимальной сис- темы оценивания условного математического ожидания вектора состояния обобщенный ФКБ первого приближения, применяя прин- цип разделения и алгоритм с прогнозирующей моделью, получаем следующую систему алго- ритмов САУ: X = /(х, 0 + <р(х, 1)и + + Ph^(xyt)R - А(Х,о]; (6.5.42) р = Л(х,г)Р + ^т(х,0- - Phi (х, t)R~ (х, t)P+Q; (6.5.43) и = -top1 (х, /) {Г3[Х (х, t2, /)] + дх ' л *2 + рзрГ(х,М,0]Л t (6.5.44)
534 Глава 6.5. ОПТИМИЗАЦИЯ СТОХАСТИЧЕСКИХ СИСТЕМ Рас. 6.5.1. Общая структура прогнозирующей САУ Практическая реализация подобного алгорит- мического обеспечения возможна лишь в цифровых САУ. При этом по непрерывному аналогу типа (6.5.42) - (6.5.44) приходится строить разностные или цифровые схемы. Здесь возникает ряд возможных вариантов. Так, разностная схема обобщенного непре- рывного фильтра Калмана-Бюси (6.5.42), (6.5.43) может быть получена путем примене- ния одного из традиционных методов числен- ного интецжрования обыкновенных диффе- ренциальных уравнений, но может (при нали- чии дискретной модели оцениваемого процес- са вида (6.4.95)) сразу записываться в рекур- рентной форме (6.4.97) - (6.4.101). Решение уравнения свободного движе- ния объекта (6.5.40) в ускоренном времени также может выполняться различными путями. При формировании разностной схемы непре- рывного алгоритма с прогнозированием (6.5.44) мотут использоваться перечисленные выше различные способы численного опреде- ления вектора традиента, включая метод син- хронного дифференцирования.
САУ С ПРОГНОЗИРУЮЩИМИ МОДЕЛЯМИ И ОПТИМАЛЬНЫМИ ФИЛЬТРАМИ 535 Рас. 6.5.2. Общая структура цифровой прогаозярующей САУ При описании общей структуры рассмат- риваемых цифровых алгоритмов (рис. 6.5.2) надо иметь в виду следующее. Управляющие воздействия на входе обобщенного объекта обновляются с основной частотой квантования Уш, соответствующей временному шагу Д|щ. Соответственно этому аргументом вектора управления служит дискретное время АД^п, где £ - порядковый номер. Первичные изме- рительные преобразователи либо сами выдают сигналы в цифровой форме, либо их аналого- вые сигналы преобразуются в аналого- цифровых преобразователях (АЦП, см. рис. 6.5.2). Если не учитывать обычно малые вре- менные сдвиги, появляющиеся при этих преобра- зованиях, и сохранял» основной шаг дискретза- ции, то вектор наблюдения можно считал» функ- цией того же дискретного аргумента ^(ЛД/щ).
536 Глава 6.5. ОПТИМИЗАЦИЯ СТОХАСТИЧЕСКИХ СИСТЕМ Система оценивания в виде обобщенного дискретного ФКБ может быть циклической и не циклической. Во втором случае сохраняется прежний отсчет дискретного времени. В пер- вом случае появляются циклы, длительность которых А^ обычно выбирается кратной шагу квантования А/ш. При этом оценка вектора состояния х выдается в моменты времени /А/ц + vA/щ, где / -номер цикла, v - номер шага внутри цикла. Существенной особенностью алгоритмов с прогнозирующей моделью является вычис- ление свободного движения управляемого объекта (6.5.40) в ускоренном времени (второй модуль снизу на рис. 6.5.2). Коэффициент ускорения времени равен произведению числа реализаций, необходимых для определения градиента, на отношение длительности интер- вала прогнозирования к величине шага А(щ. Соответственно этому шаг численного интег- рирования уравнений свободного движения должен быть в ряде случаев в десятки раз и более меньше А£щ. Исключение составляют случаи, когда решение (6.5.41) удается полу- чить аналитическим путем. Цепочку алгоритмов замыкает модуль формирования управления на очередной шаг. Детали построения алгоритмических модулей существенным образом зависят от решаемой задачи. Терминальное управле- ние. Задачи терминального управления яв- ляются весьма распространенными и трудны- ми для оптимального решения. Сюда относят- ся пуск и останов агрегатов различных уров- ней сложности, управление летательными ап- паратами на важнейших этапах полета. Опера- ции, выполняемые многими машинами в ав- томатическом (роботы) и человеко-машинном (подъемные краны, экскаваторы, манипулято- ры и др.) режимах также могут рассматривать- ся как терминальные. Для современных терминальных задач управления обычно характерны динамическая напряженность, нелинейность, высокая раз- мерность, большое число ограничений. Мож- но утверждать, что задачи оптимального управления с такими осложняющими усло- виями становятся доступными для практиче- ского решения только с введением ФОР и разработкой соответствующего алгоритмиче- ского обеспечения. Задачи терминального автоматического управления, даже в их общей постановке, имеют ряд вариантов. Самым распространен- ным является вариант, когда терминальная точка (из-за шумов строго недостижимая) фиксирована в пространстве состояний обоб- щенного управляемого объекта и во времени. Решению терминальной задачи обычно пред- шествует некоторый стационарный режим стабилизации или слежения. Б этом режиме система оценивания в виде обобщенного ФКБ должна быть примерно стационарной с при- близительно постоянной матрицей Р. С мо- мента начала решения терминальной нелиней- ной задачи, т.е. оптимального (субоптималь- ного) управления "в большом", происходит переход к нестационарному ФКБ, точнее, обобщенному ФКБ - типа (6.5.42), (6.5.43), его дискретному аналдгу. При этом в качестве начальных значений х, Р могут использо- ваться значения стационарного фильтра. С целью снижения требований к степени сложности и адекватности модели оценивае- мого процесса может использоваться цикличе- ский обобщенный ФКБ. Применительно к линейному оцениваемому процессу соответст- вующие режимы пояснены ранее (см. рис. 6.4.5). Другие два вида терминальных задач возникают при подвижной в пространстве состояний терминальной точке (цели) с из- вестным или неизвестным в деталях прогнозом движения. В задачах первого вида положение и прогноз движения терминальной точки (цели) поступают обычно из системы старшего уров- ня (метасистемы). Если вектор состояния цели и прогноз его изменения известны, то такая терминальная задача мало отличается от пре- дыдущей (с неподвижной терминальной точ- кой). Просто в терминальной и, возможно, интегральной главной части ФОР используют- ся нормы разности двух векторов состояния, один из которых (вектор цели) является за- данной функцией времени на интервале про- гнозирования. В задачах второго вида используется не- которая гипотеза о движении цели. По суще- ству гипотеза о движении цели представляет собой некоторую модель, которую можно рас- сматривать как формирующий фильтр. В этом фильтре случайными могут быть начальные условия, входные воздействия, а в более слож- ном случае - также параметры. При известных параметрах формирую- щего фильтра движения цели и интенсивно- стях входных шумов задача оценивания и прогноза может ставиться и решаться так же, как в предыдущем случае, и вся задача управ- ления может решаться на основе описанной системы алгоритмов. Существенные особенности возникают при неизвестных параметрах формирующих фильтров и интенсивностях шумов. В этих условиях приходится обращаться к алгоритмам адаптивного оценивания и управления, рас- сматриваемым, в частности, в п.п. 6.4.3, 6.7.3.
САУ С ПРОГНОЗИРУЮЩИМИ МОДЕЛЯМИ И ОПТИМАЛЬНЫМИ ФИЛЬТРАМИ 537 Режим слежения. Задающее воздействие, характерное для режима слеже- ния, может формироваться на следующем (старшем) уровне иерархической системы управления. Если этот уровень функционирует также на основе алгоритмов с прогнозирова- нием, то проблема экстраполяции задающего воздействия решается автоматически. Если этого нет, то для прогнозирования задающего воздействия приходится прибегать к построению гипотезы или формирующего фильтра. С принципиальной точки зрения ситуа- ция здесь такая же, как при терминальном сближении с целью, двигающейся случайным (в некоторой мере) образом в пространстве состояний. Однако ввиду обычной локально- сти режима слежения задачи оценивания и собственно управления решаются здесь проще, чем в режимах терминального управления. Режим стабилизации мож- но рассматривать как частный случай режима слежения при постоянном задающем воздейст- вий. Необходимость прогноза задающего воз- действия здесь отпадает, и в этом отношении задача стабилизации является наиболее про- стой из перечисленных. Совокупность алгоритмов (6.5.42) (6.5.44) (как непрерывный аналог) применяет- ся для задачи стабилизации, однако при скользящем интервале оптимизации (типич- д ный вариант) И3 = 0, /2 = + Тад- Оценки необходимой вычислительной производительности. Некоторые оценки необ- ходимой вычислительной производительности при реализации рассматриваемых алгоритмов в части собственно управления уже были приве- дены выше. В соответствии с принципом раз- деления к ним следует добавить вычислитель- ные затраты на оптимальное (субоптимальное) оценивание состояния в режиме реального времени. Проведем оценивание вычислительной производительности для практически важной, достаточно сложной и типичной задачи. К числу таких задач можно отнести инерциаль- но-дальномерное оценивание пространствен- ного движения твердого тела. Оценивание пространст- венного положения твердого тела при и и е р ц и а л ь и о - д а л ь- номерном наблюдении. Уравнения пространственного движения твердого тела (6.1.5) - (6.1.7) запишем в блочно-матричной форме: х(1)‘ х(2) х(3) v(4) х(5) Q О О О о О О Q О О О Q О О где х(1) = х«) = е11 еп ; 613 е31 ез2; .езз. (6.5.46) Вектор состояния хт = [х(1)тх(2)тх(3)тх(4)тх(5)т] (6.5.47) отличается от вектора (6.1.8) отсутствием ком- понент ©х, ©у, ©х, а также некоторой переста- новкой составляющих. Первое обусловлено тем, что угловые скорости в связанных осях приняты в качестве составляющих вектора управления. В инерциально-дальномерной системе наблюдения они измеряются датчиками угло- вых скоростей, жестко связанными с твердым телом. Составляющие перегрузки п# Пу, nv об- разующие другие компоненты вектора управ- ления, измеряются акселерометрами, также жестко связанными с телом.
538 Глава 6.5. ОПТИМИЗАЦИЯ СТОХАСТИЧЕСКИХ СИСТЕМ Из погрешностей этих датчиков учтем лишь флуктуационные ошибки ScDjXO, 8®//), 8л//), 8л//), 8л//). В матрично-векторной форме /(*) = 8Я(0 = -8®г(/) 8в)у(/) 8»//) О "8®х(0 -8в>у(0 8их(/) О 0 0 0 0 [xOJx^xVF ио = 8лх(/) 8л^(0 8лг(/) (6.5.48) 6Qx(1) 6Qx<2> 6Ях<3> 8Qx(4) + g6n (6.5.50) О С учетом этих шумов уравнение (6.5.45) усту- пает место следующему: х = *(!)' х(2) х(3) 4.(4) х(5) А о О О О О 0 -gE О О О О О °* (ха)х(2)х(э>] О О О О о о + о о 8О(/)х(1) 8О(/)х(2) 8О(/)х(3) 8£Х/)х(4> +«6лх(/) = /(х) + <р(х)и + %*. (6.5.49) Здесь Qg, ng - величины, выдаваемые инерци- альными датчиками, (управления): <р(х)и = Qgx(2) Q,x<3) - gx(2) + Q*x(4) + gng 0 Здесь сигналы инерциальных датчиков в соответствии с принципами распределения отнесены к управлениям в модели оценивае- мого процесса. Собственно наблюдаемой величиной бу- дем считать расстояние между началом земной системы координат и точкой на оси Ох, свя- занной с телом системы координат: Z = Л(х) + п(0, (6.5.51) ще Л(х) = = J(xg + Ч102 +(У, +е2/)2 + (.Zg +е31О2 = = V<x13 + М2 + (*14 + х4<)2 + (х15 + х7/)2. (6.5.52) Учет смещения отражающей точки (или ответ- чика) относительно центра масс тела имеет следующий смысл. Для летательных аппаратов и многих других подвижных объектов возмож- ная величина / обычно мала в сравнении с относительной дальностью Л, и t в выражении (6.5.52) можно пренебречь. Однако для случая применения в робототехнических системах, различных станках и машинах t и h могут быть соизмеримыми, и наличие смещения I jasmsT сигнал дальномера чувствительным к угловой ориентации тела. Эго благоприятству- ет оцениванию угловых координат (направ- ляющих косинусов). Шумы инерциальных датчиков и даль- номера будем считать практически белыми (с малыми временами автокорреляции). Итак, модели оцениваемого процесса и наблюдения приведены к стандартной для непрерывного обобщенного ФКБ форме. Непрерывный обобщенный ФКБ в дан- ном случае имеет форму:
САУ С ПРОГНОЗИРУЮЩИМИ МОДЕЛЯМИ И ОПТИМАЛЬНЫМИ ФИЛЬТРАМИ 539 X = Г(Х) + ф(х)и + РЬТ&уг'Ш) - Л(х)]; (6.5.53) P = F*P + PFT - Ь1(х)К-1^(х)Р + Q. Здесь Лх) = Г(х) + Ф(х)и; (6.5.54) , dF(x,u) _ дх [х(4)00]т ° О ° О - gE 0 [О х(4) 0]т [0 0 х(4) ]т [х(1)х(2)х(3) ]т О О О О О Z(xiZ + x13) О О Z(x4Z + x14) О о Z(x7Z + x15) О (6.5.55) О XjZ + x13 x4Z + Xj4 *7*+ *15 В матрице F* все субматрицы - блоки, включая обозначенные квадратными скобками в нижнем ряду» имеют размер 3x3. Выражения (6.5.53) - (6.5.55) при допол- нительных упрощающих предположениях по- зволяют получить некоторые приближенные простые аналитические формулы для устано- вившихся ошибок оценивания. Методику вы- вода этих формул см. в [24]. Так, при малых углах между земной и связанной системами координат, когда [х^^х^^х^3^ ] « Е, и благо- приятных других условиях угловые отклонения оцениваются с ошибкой (СКО), приблизи- тельно равной °8r = > (6.5.56) где о2г - дисперсия флуктуационной ошибки дальномера; т§г - время корреляции этой ошибки; - дисперсия флуктуационной ошибки датчиков угловой скорости (ДУС); *6® - время корреляции этой ошибки. Для достижения высокой точности могут исполь- зоваться сочетания относительно грубого (с частотной или фазовой модуляцией) и точного (интерферационного) каналов лазерного даль- номера. При этом <г5г может быть весьма малой. Соответственно этому достижимой является высокая точность оценивания коор- динат. Так, при = 10 мкм, =0,1 с, = 10’5 рад • с’1, Т&В = 0,1 с, I = 0,1 м согласно формуле (6.5.56) = 6,5". Для повышения надежности и дальнейшего увели- чения точности оценивания может использо- ваться одновременный контроль расстояний до нескольких реперных точек. По непрерывному аналогу (6.5.53) могут строиться разностные схемы и далее оцени- ваться необходимая вычислительная произво- дительность. Можно также для данного случая сразу записать алгоритмы обобщенного рекур- рентного ФКБ (6.4.97) - (6.4.101) и по ним оценивать необходимые вычислительные за- траты. В обоих этих случаях фигурирующие здесь векторы и матрицы сильно разрежены (содержат большое число нулевых элементов), что сокращает число необходимых арифмети- ческих операций. Так, для однократного вычисления пра- вых частей уравнений (6.5.53) требуется при- мерно 3000 элементарных арифметических операций, из которых около половины - длинные. При шаге 0,05 с и использовании
540 Глава 6.6. УПРАВЛЕНИЕ ПРОЦЕССОМ НАБЛЮДЕНИЯ В СТОХАСТИЧЕСКИХ СИСТЕМАХ метода Рунге-Кутта четвертого порядка необ- ходимая вычислительная производительность модуля оценивания составит порядка 240 • 103 оп/с. Модуль оптимального управ- ления с прогнозированием. В осно- ву построения этого модуля положен спираль- ный прогноз, связанный с использованием 21- мерного вектора состояния: xj =[x(1)Tz(2)T...z(5)Tz(6M]T, (6.5.57) где а остальные субвекгоры такие же, как в (6.5.47). Расширение вектора состояния путем включения в него вектора перегрузок х<6) и вектора угловых скоростей х^7) позволяет ис- пользовать более содержательный ФОР, пол- нее учитывающий цели управления и накла- дываемые ограничения. Совокупность векто- ров х^\ х<7> обозначим через У = ’ (6)‘ х(7) ‘ Производная по времени этого вектора в зада- че совмещенного синтеза траекторных управ- ляющих воздействий рассматривается как управление. Непрерывное описание данного алгоритмического модуля имеет формулу сле- дующего векторного интегродифференциаль- ного уравнения: У + h -t)- х3, t2] + Z2 +$Q3[x(x,y,e,t),tyid t (6.5.58) Численное решение этого уравнения в режиме реального времени синхронно с поступлением оценок вектора состояния из модуля оценива- ния дает оптимальные (субоптимальные) пе- регрузки и угловые скорости в связанных осях. Эти величины поступают в качестве задающих воздействий в исполнительную систему и од- новременно в качестве компонент вектора и направляются в модуль оценивания (6.5.53). Благодаря тому что спиральное движение имеет аналитическое выражение, вычисли- тельные затраты, даже при сложных функциях Из, Сз ФОР и относительно малом шаге, по- лучаются умеренными. Так, согласно формуле (6.3.147) при г +1 = 1 (синхронное дифференцирование) и N* = 240, Ny^ = 100, NQz = 100, NT = 50, v = 20 Гц, Nz » 350 • 103 on/c. Необходимое быстродействие модуля оценивания составит примерно 250 * 103 оп/с. Общая, необходимая вычислительная произво- дительность для указанных условий будет иметь порядок 600 • 103 оп/с. Глава 6.6 УПРАВЛЕНИЕ ПРОЦЕССОМ НАБЛЮДЕНИЯ В СТОХАСТИЧЕСКИХ СИСТЕМАХ Во многих технических задачах опреде- ления состояния движущихся объектов либо практически отсутствуют возможности совер- шенствования измерительной аппаратуры, уточнения структуры и параметров математи- ческих моделей САУ, оптимизации алгоритмов фильтрации [35], либо затраты на проведение подобных мер велики. В подобных условиях оптимизация процесса наблюдения выступает в качестве дополнительного (и часто единст- венного) резерва для повышения точности определения состояния. Суть этой оптимиза- ции состоит в обеспечении наилучших усло- вий наблюдения посредством проведения раз- личных мероприятий, например: планирова- ния режимов работы измерительных средств, выбора состава измеряемых параметров, орга- низации так называемых активных экспери- ментов и др. Традиционно подобные вопросы составляют теорию оптимального планирова- ния экспериментов [35]. 6.6.1. УПРАВЛЕНИЕ ПРОЦЕССОМ НАБЛЮДЕНИЯ КАК ЗАДАЧА ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА В СТОХАСТИЧЕСКИХ ДИНАМИЧЕСКИХ СИСТЕМАХ Рассмотрим задачи оптимального плани- рования в стохастических динамических сис- темах, имея в виду в дальнейшем применение методов планирования для оптимизации САУ. Эта оптимизация проводится в дополнение к методам оптимальной фильтрации в САУ (см. гл. 6.4). Однако, если сравнить по степени развития теории планирования и фильтрации, то можно отметить следующее. В теории фильтрации уже осуществлено распростране- ние результатов классических методов стати- стического оценивания (метод наименьших
МОДЕЛЬ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА В ДИНАМИЧЕСКИХ СИСТЕМАХ 541 квадратов и др.) на класс наиболее сложных динамических систем. В частности, для ли- нейных систем получены уравнения фильтра Калмана, ставшего основой для формирования более общих алгоритмов фильтрации. В тео- рии планирования экспериментов динамиче- ские задачи представлены пока еще в меньшей степени, чем задачи классического регрессив- ного анализа. Это объясняется сложностью модели динамического эксперимента, описы- ваемой системой стохастических дифференци- альных или конечно-разностных уравнений (в частности, использование для отыскания экс- тремумов не только методов математического программирования, но и, главным образом, методов теории управления). Динамические задачи характеризуются и большим многооб- разием постановок, так как в динамической системе процесс наблюдения должен во мно- гих случаях рассматриваться в тесной взаимо- связи с процессом управления. Эта связь про- является двояко. Так, с одной стороны, благо- даря оптимизации управления системой мож- но влиять на точность фильтрации, а с другой, оптимизация процесса наблюдения повышает точность управления. С учетом сказанного динамические зада- чи планирования целесообразно выделить в отдельный класс задач и именовать в даль- нейшем как "задачи управления процессом наблюдения" (УПН ). 6.6.2. МОДЕЛЬ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА В ДИНАМИЧЕСКИХ СИСТЕМАХ (ОБЩИЙ СЛУЧАЙ) Введем модель динамического экспери- мента в достаточно общей форме. Ограничим- ся рассмотрением только дискретной модели. Модель динамического эксперимента включает в себя в качестве первой составляю- щей уравнение управляемой динамической системы типа (6.4.52) х[А +1] = Л[Л^]х[Л^] + Б[А]ы[А] + w[A], (6.6.1) где х[А] - фазовый вектор размером п х 1; и[А] - вектор управления размером г х 1; w[A] - гауссовский вектор возмущений разме- ром п х 1; Л[А], ДА] - детерминированные матрицы размером п х л, п х г, к = 0, 1, 2, ..., N. Начальное состояние (6.6.1) - гауссовский вектор с характеристиками: ММо]] = хо; МЫо]хт]о]] = Ро • Второй составляющей модели экспери- мента является уравнение измерений, форма- лизующее процесс наблюдения за системой (6.6.1): 4^] = ^[p[A],Y[A],A]x(^ + v[A], (6.6.2) где у[А] - вектор измерений размером т х 1; v[A] - гауссовский вектор ошибок измерений размером т х 1; Л] •, А] - детерминированная матрица размером т х п. В уравнениях (6.6.1), (6.6.2) случайные величины ZkxfO] = х[0] - х[0], w(^]> v[A], А = 0, 1, 2, ..., N не коррелированы друг р другом. При этом: мм*)1 = о; мм*]] = о; мм*М<И = л|*]®«. где - символ Кронекера. В отличие от уравнения (6.4.53), приня- того в задаче фильтрации, в уравнении (6.6.2) матрица Н[ •, А] зависит от параметров ц[А], у[А]. Эти параметры определяют условия на- блюдения. Уравнение для их описания являет- ся третьей составной частью модели экспери- мента. Запишем его в достаточно общем виде »4*1 = Др[*-1),г1*],*], ц[-И = цо (6.6.3) при ограничениях Я*)еГ[*], (6.6.4) g](4JV|] £ g. (6.6.5) В соотношениях (6.6.3) - (6.6.5) функции Л • , А], £( * ], величины Цо, g и множество Г[А] являются заданными. Для определенно- сти будем считать, что ц[А] имеет размер х 1, #[ • ] - размер ng х 1. Последовательность у[А], А = 0, 1,2, ..., N выступает в качестве управления процессом наблюдения, или плана эксперимента. 6.6.3. КОНКРЕТИЗАЦИЯ ЗАДАЧ УПРАВЛЕНИЯ ПРОЦЕССОМ НАБЛЮДЕНИЯ В зависимости от конкретного вида управления у[А] будем различать следующие задачи УПН. Выбор программы наблюденш. В этом случае параметры у[А] и ц[А] являются ска- лярными. Множество Г[А] состоит из двух элементов: Г[А] = {0, 1); при этом у[А] = 1, если в момент А измерение проводится,
542 Глава 6.6. УПРАВЛЕНИЕ ПРОЦЕССОМ НАБЛЮДЕНИЯ В СТОХАСТИЧЕСКИХ СИСТЕМАХ у[А:] = 0 - не проводится. Уравнение (6.6.3) принимает вид р[А:] = ~ 1] + » 4-4 = о. Ограничение (6.6.5): N _ к=0 где N% - заданное число измерений. Матрич- ная функция Я[ • , А:] в уравнении (6.6.2): у[А:]Я[А:], где Я] А:] -заданная матрица. Более общим с практической точки зре- ния является случай, когда нужно управлять несколькими каналами наблюдения, при этом у[А:], ц[£] - векторы размером М х 1 (М - число каналов). При этом /-я компонента век- тора у[А:] задает программу работы /-го канала наблюдения, компонента цДА^ - число прове- денных по нему измерений. Уравнение (6.6.3) и ограничение (6.6.5) становятся в общем слу- чае векторными. Дополнительно может быть наложено ограничение на суммарное число измерений по всем М каналам: М М N _ /=1 /=1£=1 В случае многоканального наблюдения матричная функция Я]-, А:] в уравнении (6.6.2) становится блочной: (У1[А^£ЦА^:...:удДА^ЯдДА^, где блоки ЯДА:], / = 1, ..., М, характеризуют информационные свойства каждого из кана- лов. Выбор состава измеряемых параметров. Часто наблюдатель располагает возможностью помимо выбора программы наблюдения выби- рать еще и параметры для измерений. В этом случае уравнение ( 6.6.3 ) формально записы- вается как ц[£] = у [А:], а матричная функция Я]-, А] в уравнении (6.6.2) как Я]-, А:] = ц[£]. Таким образом, матричное управление y[Afl е Г [А:] задает состав измеряемых пара- метров, а множество Г[Дг] - потенциально воз- можный их набор. Запись уравнения (6.6.2) не отражает тот факт, что точность измерений зависит от мат- рицы у[Аг]. Однако потери общности здесь не происходит, так как всегда можно осуществить нормировку уравнения (6.6.2). Планирование активных экспериментов. В некоторых случаях имеются дополнительные возможности для повышения эффективности измерительных средств путем улучшения усло- вий их эксплуатации. Так, например, если за динамическим объектом (6.6.1.) наблюдение ведет движущийся наблюдатель, то можно сформулировать задачу о выборе траектории наилучшей наблюдаемости. Соответственно параметры ц[А:] будут координатами этой тра- ектории, у[А:] - управляющим вектором на- блюдателя. Множество Г [А:] при этом будет характеризовать энергетические возможности наблюдателя. В случае необходимости можно учесть также ограничение и на его суммарный энергоресурс. Для этого достаточно ввести в вектор ц[А:] дополнительную компоненту ц’[Ч> описываемую уравнением ц'[£] ~ = ц’[А: - 1] + 4г1Ч1> ц’1-1] = 0» где функция с[ ] характеризует способ учета энергозатрат. В результате интегральное ограничение будет сведено к терминальному типа (6.6.5). В об- щем случае в фазовый вектор объекта (6.6.1) могут быть включены и координаты наблюда- теля, которые тот оценивает в процессе своего наблюдения. 6.6.4. МОДЕЛЬ ЭВОЛЮЦИИ ХАРАКТЕРИСТИК ТОЧНОСТИ ЭКСПЕРИМЕНТА Выявим зависимость точности определе- ния движения системы (6.6.1) от управления у [А:]. Для этого необходимо уточнить способ обработки измерительной информации (6.6.2), т.е. вид алгоритма фильтрации. Будем считать, что последний - это фильтр Калмана (см. гл. 6.4): P[*|jt -1] = ЛИ - 1]Р[* - 1МТ[* - И + Ок -1|; (6.6.6) -1] = ли - - Ц + Bl* - 1М* - <1; М*| = РН|*-1|ЯТ.*1х х [я[, - 1]ят[ •, *] + ад]1; ад = [Е- КИ]Я[ И1]РН|* - И; ад=хИ|*-11+адх х[хИ1-Я1 ,*Ш|*-11] с начальными условиями х|-1] = *о» Р]-1] = Pq . При этом Л[-1] = Е; (?[-!] = 0; Д-1] = 0; «[-!] = 0.
КРИТЕРИИ ОПТИМАЛЬНОСТИ 543 Рекуррентные соотношения (6.6.6) пред- ставляют собой соотношения (6.4.56) - (6.4.60), записанные для случая, когда измере- ния проводятся с момента к = 0. Ковариаци- онная матрица размера л х п характери- зует апостериорную точность оценивания фа- зового вектора %[£]• При этом вследствие ли- нейности уравнений (6.6.1), (6.6.2), а также гауссовости величин х[0]> v[fc], к = 0, 1, 2, ..., N, апостериорное распределение вектора х[£] является гауссовским с характеристиками ад, /то ад емад,р[*]). 6.6.5. КРИТЕРИИ ОПТИМАЛЬНОСТИ На основе знания апостериорного рас- пределения х[£] е _¥(£(£], Р[£]) можно най- ти оптимальную точечную оценку вектора или некоторой его функции. При этом выбор соответствующего критерия оптимальности может быть осуществлен различным образом. Вероятностный крятерий. Введем его сле- дующим образом. Пусть требуется найти оценку у векторного параметра у = CTx[JV] (у -1 х 1,С - I х л) , которая обеспечивала бы минимум характерного размера 0 критериаль- ной области Уф) = {у:Ф(у - J) £ 0}, содер- жащей в себе истинное значение у с вероятно- стью а, не меньше заданной. В качестве кри- териальной области можно взять, например, /-мерный шар (при Ф(у - у) = = [(у - у)т(у - у)]2 ) или /-мерный куб (при O(y-y) = ^maxjy7 -уу|). Вычисление и минимизация вероятност- ного критерия - непростая задача (ее решение на основе методов статистического моделиро- вания см. [34]). В общем случае оптимальная оценка у не совпадает с апостериорным мате- матическим ожиданием у = М[у ] = . Результат у = у справедлив только при сим- метричной (относительно у ) области У (0). В любом случае значение критерия является сложной нелинейной функцией от апостери- орной ковариационной матрицы P[JV] J = j = <р{ст Р[ ЛТК?}. (6.6.7) Классические критерия как частные слу- чал вероятностного. Запись критерия в виде (6.6.7) подразумевает использование и других критериев оптимальности, например, приня- тых в классической теории планирования экс- периментов: L - оптимальности при = Ру (где у - скаляр), А - оптимальности при } = tr{Pp}, D - оптимальности при = det|Py|, Е -оптимальности при (р{Ру } = ^тах{^у } • В этих выражениях tr - след, det - детерминант, Хщах - макси- мальное характеристическое число матрицы Ру = CTP[7V]C. Однако данные критерии являются менее представительными, чем веро- ятностный критерий, поскольку они лишь косвенно отражают вероятностный характер ошибок оценивания. Действительно, критери- альный областью здесь служит эллипсоид рас- сеивания = {у (у-j>)T771O'-у) < Аа)}, критерием - какой-либо его размер (диагональ описанного вокруг параллелепипеда, объем, максимальная ось). Исключение из сказанного составляет лишь критерий L - оптимальности, так как в этом случае - отрезок и, следова- тельно, в скалярном случае классический кри- терий оказывается эквивалентным вероятност- ному. Критерий планирования в задачах управ- ления. В отличие от предыдущего, когда опти- мизировалась только точность оценивания состояния системы (6.6.1), теперь рассмотрим случай, когда требуется улучшить качество управления этой системой в смысле минимума величины среднеквадратичного критерия: J = Mp),5xT[W + l]pxf N +1] + У *=0 k=l (6.6.8) где p, 0, D"1 - заданные симметрические мат- рицы размерами соответственно п х л, п х л, г х г, 6[&], к - 0, 1, 2, ..., N, - последователь- ность, определяющая моменты включения управления (6[fc] = 1, если управление есть, = 0 - управления нет). Последователь- ность 8[£], к = 0, 1, 2.N, является задан- ной, при этом суммарное число моментов, когда действует управление, равно N% .
544 Глава 6.6. УПРАВЛЕНИЕ ПРОЦЕССОМ НАБЛЮДЕНИЯ В СТОХАСТИЧЕСКИХ СИСТЕМАХ Использование критерия (6.6.8) связано с тем, что решение задачи синтеза управления системой (6.6.1) в условиях неполной инфор- мации (6.6.2) по такому критерию хорошо известно [12]. Здесь используется теорема раз- деления, утверждающая, что процессы фильт- рации и управления можно рассматривать последовательно. При этом оптимальным ал- горитмом фильтрации является фильтр Кал- мана (6.6.6), а оптимальным законом управле- ния - линейный закон ад = -pr1!* ] + 5т[ад* + ИЖ]] 1 х хД£]5[£ + 1]Л[&, (6.6.9) тде х[£] - оптимальная оценка состояния системы (6.6.1), а матрица 5[£] размером л х л определяется из рекуррентного соотно- шения ЭД = Лт[ ОД к + 1]ЭД - + ОДЛ] X X [л-1[*] + 5T[Jt]5[Jt + 1]Д*]] 1 х хлт[адл+1]л[л]+нл] (6.6.Ю) с граничным условием S[N +1] = р. При оптимальном управлении (6.6.9) значение критерия (6.6.8) будет [12]: У J = xJWo + tr{S|o]Po} + Е ^ЮШ} + к=0 + 22*-{а[л1/тл1/»[*ггт[л]}, (6.6.11) к=0 где Г[Л] - матрица п х г, определяемая из условия _1 ад=[/>-’!*]++iiBiJtj] 2х хяадад+цд*)- Поскольку зависимость терминальной точно- сти управления от точности фильтрации про- является здесь лишь в четвертом слагаемом, то представим критерий планирования в виде J = С + £/>-{ададад]гад}, к=0 (6.6.12) где с - сумма первых трех слагаемых. 6.6.6. ЗАДАЧА ПЛАНИРОВАНИЯ КАК ЗАДАЧА УПРАВЛЕНИЯ УРАВНЕНИЕМ ТИПА РИККАТИ Введенные выше критерии представлены как явные функции апостериорной ковариа- ционной матрицы Р. Эволюция этой матрицы описывается дискретным уравнением типа Риккати (см. первое, третье, четвертое соот- ношения из (6.6.6)). Данное уравнение не зависит от процесса оценивания, но зато управляется последовательностью у[Л], к = 0, 1, 2.. N. В результате задачи УПН могут быть формализованы следующим образом. Требуется найти программу управления у[Л], к = 0, 1, 2.N, системой -1] = А[к - - 1]ЛТ[* -1] + 0* -1]; Л-1) = Ро; ад] = Р|л|л - ият[ад, Jt] х х [я[ад,адл]ад|* - и х P[Jt] = [р- адЯ[ад,т[А:],*]]Р(4: - 1]; ад=/[м1*-1]ад,4 ц|-и=но (6.6.13) при ограничениях (6.6.4), (6.6.5), оптимальную по одному из введенных выше критериев J -> min. у[*] (6.6.14) Расширение возможностей управления путем перехода от программы у к стратегии y(z) не приводит к уменьшению значения критерия оптимальности. Возможны постановки задач УПН, отли- чающиеся от перечисленных выше. Так, на- пример, помимо критериев типа (6.6.7), харак- теризующих точность оценивания при задан- ных затратах на изменения, в задачах УПН могут использоваться "энергетические" крите- рии типа J = g[g[7V] ] —► min при векторных ограничениях типа ф{^у} £ ф . Возможны также постановки с максимизируемым крите- рием J —► шах . Соответствующие задачи УПН классифицируют как задачи оптимиза- ции помех [12]. Они возникают в тех случаях, когда объект оказывает активное информаци- онное противодействие наблюдателю (напри-
ЭКВИВАЛЕНТНЫЕ ЛИНЕЙНЫЕ ЗАДАЧИ УПРАВЛЕНИЯ 545 мер, посредством создания на отдельных ин- тервалах времени условий, полностью препят- ствующих работе его измерительных средств). Особым разнообразием отличаются постанов- ки задач УПН, в которых процесс наблюдения осуществляется для повышения точности управления динамической системой. Подобные задачи решались в достаточно общем виде на основе теории условных мар- ковских процессов и метода динамического программирования. Но и для линейно-квад- ратичного случая возможны различные вари- анты постановок задач УПН. Следует перечислить и ряд обобщений задач УПН, возникающих при усложнении модели эксперимента и условий его проведе- ния: например, случай запаздывания в каналах наблюдения и движения [12], задача УПН с вырожденным шумом наблюдения. Возможны обобщения, связанные с модификациями фильтра Калмана для специальных случаев: учет корреляции шумов w[fc] и v[fc] во време- ни, учет взаимной корреляции w[fc] и v[A^], понижение порядка уравнений фильтра, адап- тация к ошибкам вычисления на ЭВМ и др. Несмотря на многообразие рассмотрен- ных постановок, все вышеупомянутые задачи УПН в принципиальном отношении сводятся к задачам управления уравнением типа Рикка- ти. Поэтому в дальнейшем ограничимся рас- смотрением лишь тех задач, которые представ- лены в форме (6.6.13), (6.6.14), (6.6.4), (6.6.5). Традиционно для решения подобных за- дач используются методы математического программирования, принцип максимума и динамическое программирование в различных модификациях, включая эвристические проце- дуры на основе приемов локальной оптимиза- ции. Однако в реальных технических задачах использование данных подходов сопряжено со значительными трудностями. Это обусловлено главным образом нелинейностью как уравне- ния Риккати для Р[£]> так и в общем случае уравнения для ц[£]. Кроме того система (6.6.13) имеет матричную структуру и, следо- вательно, высокую размерность: даже с учетом симметричности ковариационной матрицы P[fc] эта размерность равна 0,5 л(л +1) + лц, ще л - размерность х[Л], лц - размерность ц[£]. 6.6.7. ЭКВИВАЛЕНТНЫЕ ЛИНЕЙНЫЕ ЗАДАЧИ УПРАВЛЕНИЯ Вследствие сложности исходных задач УПН целесообразно найти более простые, эквивалентные им задачи, в частности, линей- ные. Ниже показано, что такая возможность существует. Она является следствием аналити- ческого свойства уравнения Риккати. Смысл этого свойства заключается в существовании линейной гамильтоновой системы уравнений для матричных переменных И[£]-лхл и W\k]-n*n-. F[jt] = Л’1’[Л - 1]Й[* -1] + + G[gW,YHL*]F|*|; (6.6.15) F[Jt] = Q[k - IM'1’!* - 1]K[* - и + + 4к - -1], где фШ.тМЛ] = Ят[цИ],У|*]ЛрГ1[*| X x Я[м|Л],Т[*],4 4-1] = £, О(-1] = о. При начальных условиях ЙК[-1] = PqKI-I], где И[-1] - любая матри- ца, переменные K[fc], И^к] удовлетворяют матричному тождеству = *Й*1, к = 0,1,2,...,ЛГ, (6.6.16) отсюда можно найти матрицу P[fcJ = ЙЧку-'Щ , (detK[Jt]#O). Таким образом, решение уравнения Риккати (6.6.13) сводится к решению линейной гамильтоновой системы (6.6.15). Однако, непосредственное перенесение этого результата на задачи управления не при- водит к желаемому эффекту, поскольку при- сутствует нелинейная связь гамильтоновых переменных V и W в критерии оптимально- сти. Кроме того, размерность задач УПН воз- растает с 0,5 п(п +1) + до 2 л2 + лц. Возможен иной общий подход к реше- нию задач УПН, основанный на нетрадицион- ном использовании аналитического свойства уравнения Риккати. В задачах управления не обязательно вычислять всю ковариационную матрицу /ВД: достаточно найти управление у[Дг], к = 0, 1, 2.АГ, минимизирующее кри- терий оптимальности - некоторую скалярную функцию от Таким образом, для каждой задачи УПН существует специальный набор гамильтоновых переменных, достаточный для формирования критерия оптимальности. При 18 Зак 1023
546 Глава 6.6. УПРАВЛЕНИЕ ПРОЦЕССОМ НАБЛЮДЕНИЯ В СТОХАСТИЧЕСКИХ СИСТЕМАХ этом эквивалентные задачи могут быть сфор- мулированы не в исходной гамильтоновой системе (6.6.15), а в некоторой ее проекции. Для задачи УПН с критерием (6.6.7) не- обходимо ввести проекцию + G[g(*],YW, (6.6.17) Ж[Л] = С[Л - ipr1’]* - i]K[jt -1) + +л(* - -1], где V[k], VK[k] - прямоугольные матрицы размером п х I. Если в системе установить ограничения = 0 при £ = -1; (6.6.18) K[7V] = С при к = N, (6.6.19) то критерий (6.6.7) можно представить в экви- валентном виде: J = <р|стЙК[7V]} -> min. (6.6.20) Действительно, терминальные матрицы V[k], W[k] согласно (6.6.16) удовлетворяют тождеству Р[ 7V]K[ TV] = )K[7V]. С учетом (6.6.19) оно приобретает вид P[7V]C = IK[7V]. Отсюда, CTP[7V]C = CT1K[7V] и, следова- тельно, ^С’ЛЛПС] = <р{ст)ИЛГ]} . Для задачи УПН с критерием (6.6.12) ус- ловия эквивалентности являются более слож- ными. Здееь необходимо ввести в рассмотре- ние N& - связку проекций гамильтоновой системы (6.6.15): (6.6.21) WJ[k] = Q[k - IM'1’^ - 1]И>[* -1J + + А[к - i$VJlk - 1], j = l....N{ где j = - прямоугольные матрицы размером л х г . Далее в системе (6.6.21) нужно задать ог- раничения в момент к = 0: РоИ-И-И^НПо, 7 = 1...........Nl, (6.6.22) а также в моменты к = kj: vJ[kj] = FT[kj], J = (6.6.23) где kj - моменты действия управления </[£]. Эквивалентная запись критерия (6.6.12) будет иметь вид min. (6.6.24) Я*) Доказательство здесь строится по той же схеме, что и в предыдущем случае. Для окончательной формулировки задач, эквивалентных исходным задачам управления в системе (6.6.13), к системам (6.6.17), (6.6.21) нужно присоединить уравнение (6.6.3) с уче- том ограничений (6.6.4), (6.6.5), а также задать цель оптимизации (6.6.14). Таким образом, эквивалентные задачи будут определяться сле- дующими соотношениями: (6.6.17), (6.6.3) - (6.6.5), (6.6.14), (6.6.18) - (6.6.20) - для веро- ятностного критерия (включая его частные случаи - классические критерии); (6.6.21), (6.6.3) - (6.6.5), (6.6.14), (6.6.22) - (6.6.24) - для критерия управления исходной системой (6.6.1). Преимущество сформулированных экви- валентных задач состоит прежде всего в их линейности по фазовым переменным. Не ме- нее важно, что линейные формы сохраняются и в критериях оптимальности: CTP[7V]C -► СОЦАТ], /1*у]Л*у]Г[*у)-> Одновременно снижается размерность эквивалентных задач: с 0,5 л(л +1) + лц до 2л/ + лц (для критерия (6.6.7)) и до 2^£ЛГ + лц (для критерия (6.6.12)). Это об- стоятельство является следствием того, что в реальных технических задачах, как правило, I « п (часто t = 1, если используется крите- рий L - оптимальности), г « л , TVf « N . В последнем случае при достаточно больших значениях TV® размерность задачи может даже увеличиться. Однако это не приводит к усложнению задачи, поскольку после реализа- ции условий принципа максимума в линейной системе (6.6.21) процедура решения возник-
ЧИСЛЕННЫЙ АЛГОРИТМ РЕШЕНИЯ ЭКВИВАЛЕНТНЫХ ЗАДАЧ 547 шей краевой задачи может быть "свернута” в процедуру решения уравнения Риккати (см. п. 6.6.8). 6.6.8. ЧИСЛЕННЫЙ АЛГОРИТМ РЕШЕНИЯ ЭКВИВАЛЕНТНЫХ ЗАДАЧ Продемонстрируем теперь конкретно возможности, возникающие при переходе к эк- вивалентным задачам, упомянутым в п. 6.6.7. Для этого, опуская технику применения прин- ципа максимума или метода динамического программирования, приведем окончательный вид численного алгоритма решения эквива- лентных задач [13]. Он сводится к указанной ниже последовательности действий. 1. Задается начальное управление у°[£], к = 0, 1, 2.N, удовлетворяющее ограниче- ниям (6.6.3) - (6.6.5). 2. При фиксированном управлении к = 0, 1, 2.... N, решается линейная краевая задача, соответствующая выбранному критерию оптимальности. В качестве решения выступают параметры краевой задачи: для критерия (6.6.7) - матрица X® = VK°[N] размером п х для критерия (6.6.12) - после- довательность матриц j = , размером п х г, задаваемая в моменты действия управления </[£]. Операции вычисления X®, , 7 = 1,..., ATf являются линейными: Х° = Ф?^]Р°; Z>° = = с|; (6.6.25) XJ0 = Ф?(Лгу]/>у0; DJ0 = агв{ф«[*у JZ>> = FT[fcy|), где матрицы AVV(-),AVVV(-),AWV (•), ^ww(') являются соответствующими блоками в матри- це Л°[/,0] размером 2л х 2л, представляющей собой фундаментальную матрицу гамильтоно- вой системы (6.6.15): Л°[ *,0] = = ГТ [4^L«rJJ±£°JiL«4 (6.6.28) Нетрудно показать, что = = Ф|[/]Ф2 [/]. Таким образом, параметры краевой задачи Х^ , j = l,...,JVf , можно рассчитывать и на основе непосредст- венного решения уравнения Риккати: х° = Р°[ЛГ|С; X? = p°[kj )Рт(Лу]. (6.6.29) Однако, такой подход слишком сложен для определения параметров X®. Этот подход оправдан лишь для параметров XJ , j = l,...,JVf , когда значение настолько велико, что нецелесообразно решать большое число систем линейных уравнений (6.6.26). 3. Находится управление к - 0, 1, 2.. N из условия максимизации гамильтониана с учетом ограничения (6.6.3). Гамильтониан зависит от выбранного крите- рия оптимальности, и может быть представлен в одном из двух вцдов: J = 1...ATs- (6.6.26) В соотношениях (6.6.25), (6.6.26) вторые запи- си означают процедуру решения систем ли- нейных уравнений соответствующих размерно- стей: л/, пг. Матрицы Ф?[/] и Ф^/] (при / = N, i = kj) вычисляют по формулам: Ф?[Л = л®,и,о] + л0яш|()о|Р0; (6.6.27) ф?[/] = л°ууи,о1 + лилоуэо, Я°[к] = 1} + + (6.6.30) J=Uk) 1 > + (6.6.31) 18*
548 Глава 6.6. УПРАВЛЕНИЕ ПРОЦЕССОМ НАБЛЮДЕНИЯ В СТОХАСТИЧЕСКИХ СИСТЕМАХ где ы= дРу Цк) = < fc}. Имеющиеся в (6.6.30), (6.6.31) гамильто- новы переменные [AfJ, j = 1,...,Ле, рассчитываются в процессе решения справа налево систем (6.6.17), (6.6.21) с граничными условиями FK°[JV] = X°, = . Сопряженная переменная определяется из уравнения X /[14*: - к = 0,1,2,... ,7V, с граничным условием ^14^11 <W1 ’ 4/g[7V] = -XT где X -вектор множителей Лагранжа размером ng х 1. При этом векторы ц/ц[-1] и X подби- раются с таким расчетом, чтобы управление , к = 0, 1, 2, ..., N, удовлетворяло ог- раничениям (6.6.4), (6.6.5). Последняя опера- ция получается наиболее простой, если у[&] является программой наблюдения, т.е. Г[&] = {0, 1}. В этом случае, нужно найти скалярный множитель Лагранжа X из условия N £г'°[*1=ЛГЕ или в последовательности |#'°[&]| выбрать максимальных значений. 4. Находится первое приближение у1[А:], к = 0, 1, 2, ...» N, путем комбинации управле- ний у°[^] и у'°[&], к = 0, 1, 2.N: Г1т = а1^'0Н + (1-а{А;])у0^], к = 0, 1, 2..........N. (6.6.32) При a[fc] = а (0 £ а £ 1) соотношение (6.6.32) представляет собой линейную комби- нацию управлений. Но ее целесообразно при- менять лишь при условии, что множество ог- раничений Г[£] выпуклое. В случае, когда Г[£] таковым не является (например, Г[&] = {0, 1}), последовательность {<х[£]} эффективнее задавать в виде нуля или едини- цы. Соответственно если a[£] = 1, то У 1[^] = Г'°[£]; если <х[£] = 0, то у'[Ar] = Таким образом организуется частичное обнов- ление программы y°[£] программой у'°[&]. Степень этого обновления можно охарактери- зовать с помощью параметра a (0 £ a £ 1), определяющего долю моментов времени к, в которых управление Y°l^l заменяется на управление у'°[Аг]. Во всех рассмотренных выше случаях па- раметр а следует выбирать из условия a = arg min J1 (a'), (6.6.33) (ka'Sl где J1 (a') - эквивалентный критерий опти- мальности: или (р JT* (a')}, ИЛИ C + ^tr{F[A;]Xyl(a')} , где параметры крае- 7=1 ' вой задачи Х^а') , , j = 1,...,7V|, определяются на основе действия 2 при новом управлении у 1[А^], к = 0, 1, 2, ...» 7V, завися- щим от параметра а'. Затем действия 2-4 повторяются цикли- чески с заменой индекса итерации 0 на 1, 1 на 2 и т.д. Условием останова всего итерацион- ного процесса может стать соотношение (Jz -//+1)/// < е , где е - заданная малая величина. Обоснованием сходимости полученного алгоритма служит следующее утверждение, доказанное в [14] для непрерывного случая: J°>Jl lim J1 = J, (6.6.34) /->ОО где J - оптимальное значение критерия. Это утверждение справедливо и для рас- сматриваемого дискретного случая при доста- точно больших значениях N и (при N> 50 $ 60, Nz > 10 ? 20).
ФОРМИРОВАНИЕ ПРОГРАММЫ ОПТИМАЛЬНОГО МАНЕВРА ЛЕТАТЕЛЬНОГО АППАРАТА 549 Приведенный выше численный алгоритм решения эквивалентных задач обладает доста- точно высокой степенью общности. Вместе с тем, в работе [13] отмечалось, что при раде упрощений в постановках исходных задач УПН этот алгоритм вырождается в уже извест- ные. В этом смысле приведенные выше ре- зультаты можно рассматривать как обобщение теории планирования на случай калмановской фильтрации в управляемых динамических системах. 6.6.9. ФОРМИРОВАНИЕ ПРОГРАММЫ ОПТИМАЛЬНОГО МАНЕВРА ЛЕТАТЕЛЬНОГО АППАРАТА С ЦЕЛЬЮ УЛУЧШЕНИЯ УСЛОВИЙ НАБЛЮДЕНИЯ ЗА ДВИЖУЩИМСЯ ОБЪЕКТОМ Рассматривается задача сопровождения ЛА-наблюдателем (А) некоторого неопознан- ного объекта (В). Объект движется в абсолют- ной прямоугольной системе координат Оху вдоль оси Ох с постоянной скоростью vB (рис. 6.6.1). Цель сопровождения состоит в том, чтобы обеспечить наилучшую точность определения и прогнозирования координаты х объекта. Решение задачи фильтрации ЛА-наблю- датель осуществляет по результатам малоин- формативных угловых измерений. Так, на интервале (0, 7) наблюдатель при помощи какого-либо визирующего устройства проводит измерения угла между линией визирования АВ и одной из своих связанных осей, направлен- ных в сторону объекта. Будем считать, что ЛА-наблюдатель знает точную ориентацию своей связанной системы координат в абсо- лютной системе Оху. Следовательно, в качест- ве измеряемого параметра можно принять угол Р между линией визирования и абсолютной осью Ох. Запишем модель измерений в виде \ХВ[к] Яд[л]/ к - 0, 1, 2..N, (6.6.35) где Ха1М = *а1<*1. Га1*1 = УаЫ. хв(£] = хв(4], ^[Л] = УвК* 1 - координа- ты наблюдателя и объекта в момент 4; v[A] - последовательность гауссовских независимых ошибок измерений с дисперсией ст?; N - число разбиений интервала (0, 7) на "кванты" времени » h = *к-1 + Ат (1 / Ат - частота измерений). Линеаризуя (6.6.35) в окрестности опор- ной траектории объекта (хв,Ув) > получаем ДР[А] = Ях[хА,уА,*]ДхвИ] + +Яу[хА,;уА, fc]AyB[fc] + v[A], (6.6.36) где Дхв[*] = хв[*]-хв(/*); Аув[А] = ув[А]- -yB(ffc); АДА] отклонение измерения Р[А] от номинального значения 1*b-*aJ Hxl] = y(tk)/P^(tk); Ну[ •] = (iB -ув(д. -хА (/*))/р®2^*); Р®2 (4) = (1B - v в4 - *а (4 ))2 + УI <tk). (6.6.37) Рве. 6.6.1 К задаче мтшшвого с точка зреем оценкванм дважеям маневрвроватм
550 Глава 6.6. УПРАВЛЕНИЕ ПРОЦЕССОМ НАБЛЮДЕНИЯ В СТОХАСТИЧЕСКИХ СИСТЕМАХ Как следует из (6.6.37), частные произ- водные #х[ • ], Ну[ - ], определяющие усло- вия наблюдаемости, зависят от координат на- блюдателя Хд(/), Уа(0- Это дает возможность улучшения точности фильтрации путем орга- низации маневра, который в дальнейшем бу- дем называть информационным. Будем считать, что уравнения движения маневрирующего ЛА-наблюдателя имеют вид (в системе координат Оху): *а=^д; Уа=*Уа; vXa =acos0; VyA=asin0, te(0,T), (6.6.38) где a(i) - величина управляющего ускорения; 0(1) - угол наклона вектора ускорения к оси Ох. Начальные условия в (6.6.38): хА(0) = 0; уА(0) = о, VXa (0) = Уд; V>A = О. Предполагается, что информационный маневр осуществляется с ошибкой реализации управляющего ускорения a(t). Фактически реализуется ускорение fl'(0 = fl(00 + ^)> (6.6.39) X - мультипликативная постоянная ошибка, являющаяся гауссовской величиной X € <Я^(0,о^). В уравнениях (6.6.38) присут- ствует номинальная величина ускорения a(t). Ошибка же Да(0 = 1а(0 далее будет "присоединена” к уравнениям наблюдаемого объекта. Такой прием обоснован условием а'(0 » «(0 • Управление ЛА-наблюдателем осуществ- ляется с учетом ограничений: т |д(/)| <,а\ G = j a2dt <, G. (6.6.40) о Запишем теперь расширенную модель возмущенного движения объекта, которую далее будем использовать для организации процесса калмановской фильтрации: Дхв=Ду^; Д>в=Д^в; AvXb = [acos0]X; Av>B = [a sin 0]Х; Х = 0, /е(0,Т), (6.6.41) где дхв(0 = хв(П-*£(0; Дув(П = Ув(П-Ув(П; avxb(0 = vXb(0-v$b(0; Av>b(0 = v>b(/)-v »„(/). Уравнения (6.6.41) отражают позицию ЛА-наблюдателя, поэтому в них присутствуют ошибки проведения информационного ма- невра. Предполагается, что в момент t = 0 ЛА- наблюдатель имеет априорную информацию о движении объекта. Так, начальные условия в (6.6.41) Дхв(0), Дув(О), vXb(0), v>B(0), X являются гауссовскими с нулевыми математи- ческими ожиданиями и дисперсиями ох, „2 „2 2 2 оу, oVx , оу, , ох. В соответствии с целью сопровождения введем следующий критерий точности оцени- вания состояния системы (6.6.41) по результа- там измерений (6.6.36): J = o^ -+ min , (6.6.42) •*пр а(г),е(г) 2 где о - дисперсия ошибки оценивания *пр скалярного параметра хпр = AxB(7v') = = ДХв(Т) + (Г' - 7ЭДуХв(7Э ’» Т* - момент времени, на который прогнозируется коорди- ната х объекта. Если провести дискретизацию уравнений (6.6.41), (6.6.38) относительно моментов к = 0, 1, 2, ..., N, то сформулированная выше задача формализуется как одна из задач УПН, а именно как задача планирования активного эксперимента. Планом эксперимента здесь является программа управления траекторией ЛА-наблюдателя (a(i), 0(1)). Решение задачи было получено численно на основе программного комплекса, реали- зующего алгоритм по п. 6.6.10. При этом были приняты следующие гипотетические исходные данные: Т = 100 с, Т ' = 300 с, L = VbT (vb - скорость объекта), ох = 500 м, Оу = 100 м, oVx = 5 м/с, ov^ = 1 м/с, ох = 0,03, a=vB/3T, (7=v£/20T, Qv = 10'4 С’1, Дт = 1 С. В результате была найдена оптимальная программа информационного маневра. Соот- ветствующий вид функций а(1), 0(0 показан
КЛАССИФИКАЦИЯ И ПРЕДЕЛЬНЫЕ ВОЗМОЖНОСТИ АДАПТИВНЫХ САУ 551 на рис. 6.6.2, 6.6.3 (кривые 7). Полученные результаты имеют наглядный физический смысл. Так, до момента 7\ ЛА-наблюдатель разгоняется с максимально возможным уско- рением, чтобы обеспечить в дальнейшем суще- ственное отклонение от траектории объекта (вниз или вверх). При этом ошибки реализа- ции маневра, хотя и являются на этом участке большими, все же не играют значительной роли, поскольку на пассивном участке наблю- дения их влияние будет компенсировано. Од- нако до полного расходывания энергоресурса G существует участок (Ту Т^), где управле- ние выбирается с учетом необходимости, с одной стороны, улучшить условия наблюдае- мости, а с другой - уменьшить ошибки актив- ного эксперимента. Наклон вектора ускорения к оси Ох по программе 0(0 объясняется тем, что угол Р(0 будет увеличиваться быстрее, если ЛА-наблюдатель затрачивает часть управ- ления на "догон" объекта. В качестве начального приближения к оптимальной программе (а (0,0(0) была взята программа a®(t) = a при t<>T* (aQ(t) = 0 при t > Г* ), 0°(0 = я / 2 (см. Рве. 6.6.3. Оптимальное изменение угла наклона вектора ускорения на рис. 6.6.2, 6.6.3 кривые 2). Программа (д°(/),0°(/)) была улучшена за семь итера- ций процедуры последовательных приближе- ний. Для оптимальной программы (д(/),0(/)) значение критерия J = составило 24,5 м, для программы (а°(0,0°(0) - 31,2 м. Если бы информационный маневр не проводился совсем (a(f) = 0), то ЛА-наблюдателю удалось бы спрогнозировать координату х лишь с точ- ностью 489,7 м. Глава 6.7 АДАПТИВНЫЕ САУ 6.7.1. КЛАССИФИКАЦИЯ И ПРЕДЕЛЬНЫЕ ВОЗМОЖНОСТИ АДАПТИВНЫХ САУ Адаптивными САУ (АСАУ) будем име- новать системы управления, сохраняющие работоспособность в условиях неопределенно- сти и изменчивости характеристик (мера до- пустимой неопределенности может быть од- ним из классификационных признаков АСАУ) на основе дополнительной текущей информа- ции, получаемой в процессе работы системы. Классификация адаптивных САУ. В каче- стве одного из классификационных признаков адаптивных САУ можно выбрать признак на- значения, как к для обычных САУ. При этом адаптивные САУ, как и неадаптивные, делят на системы стабилизации, слежения, терми- нального управления и др. Другим классификационным признаком может служить наличие или отсутствие поиска экстремума в смысле, указанном в п. 6.2.1. Так различают поисковые и беспоисковые адап- тивные системы. Все более широкое распространение по- лучают адаптивные системы, основанные на идентификации характеристик объекта. Нали- чие или отсутствие (в явном виде) процессов идентификации может служить классификаци- онным признаком АСАУ. Еще одним показателем АСАУ может быть допустимая неопределенность и измен- чивость характеристик объекта, степень разви- тости адаптивных свойств. Перечисленные классификационные признаки не являются на целесообразном множестве АСАУ вполне независимыми. Так, задача создания адаптивной системы стабили- зации состояния объекта по отношению к задачам адаптивного слежения и особенно адаптивного терминального управления явля- ется более простой, частной. Ее обычно стре- мятся решить посредством беспоисковой адап- тивной САУ без применения идентификатора.
552 Глава 6.7. АДАПТИВНЫЕ САУ Еще более просто решается задача по- строения унифицированных адаптивных регу- ляторов технологических процессов. Для ши- рокого класса процессов с известными физи- ческими регулируемыми величинами (темпе- ратура, давление, частота вращения, расход рабочего тела и др.) требуется создать адаптив- ные регуляторы (параметрические ряды адап- тивных регуляторов) унифицированного типа, пригодные для самых разных объектов. Экономическая целесообразность такой постановки задачи с точки зрения производст- ва регуляторов очевидна. Практическое отсут- ствие использования математической модели (ММ) регулируемого объекта на стадии проек- тирования регулятора в какой-то мере компенсируется настройкой регулятора (например, пропорционально-интегрально- дифференциального - ПИД регулятора) в про- цессе наладки и эксплуатации на реальном объекте. Применение адаптивных регуляторов, в частности, адаптивных ПИД регуляторов, позволяет устранить периодические ручные настройки. Соответствующие вопросы кратко осве- щаются в п. 6.7.2, а теоретическое обоснова- ние в общем виде приведено в [37]. Задача адаптивного слежения сложнее задачи адаптивной стабилизации вследствие того, что модели задающих воздействий обыч- но неизвестны ни в детерминированной, ни в стохастической форме, а сами эти воздействия не поддаются непосредственному измерению. Поэтому в оптимальной (субоптимальной) адаптивной следящей системе должна прово- диться идентификация не только объекта управления, но и вектора задающих воздейст- вий в некотором выбранном классе моделей. Самой сложной является задача опти- мального адаптивного терминального управле- ния нелинейной многомерной системой при наличии множества ограничений. Если пред- шествующие задачи адаптации нередко могут решаться на эвристической основе (см. п. 6.7.2), то задача даже субоптимального адаптивного управления в большом может быть решена только на основе наиболее эф- фективных методов современной теории управления: идентификации и оценивания, оптимизации по неклассическим функциона- лам. В последнее время привлекли значитель- ное внимание самоорганизующиеся оптималь- ные регуляторы с экстраполяцией (СОРЭ) и структурной и параметрической адаптацией. Есть основания считать, что они впервые ре- шают проблему самоорганизующихся САУ на уровне современных требований. Соответствующее алгоритмическое обес- печение практически реализуемо лишь в циф- ровых вычислителях достаточной производи- тельности (см. п. 6.7.3). Предельные возможности адаптивных САУ. Возможности адаптации и управления ограничены объективными информационными законами. Пусть уравнение обобщенного управляе- мого объекта имеет вид (6.1.10) х = /(х) + <р«, где, однако, векторная функция /векторного аргумента х неизвестна. Матрица <р считается известной. Для оптимального управления необходи- мо определение Дх) с той или иной точно- стью. Действительно, располагая большим "ресурсом управления”, что в условной мат- ричной форме записывается в виде Дх) « фи, можно организовать устойчивое управление и при неизвестной функции Дх). Однако при этом управление будет далеко не оптимальным в отношении "расхода энергии" управления. Таким образом, возникает задача иден- тификации характеристик объекта в классе каких-либо моделей. Допустим, что вектор состояния х = х(/) , а также его производная х = х(/) и фМ доступны для непосредствен- ного измерения или оценивания. Тогда задача сводится к идентификации характеристик (функций) , j = [1,«1 в вы- бранном классе моделей. Здесь количество учитываемых аргументов (компонент х) в каж- дой отдельно взятой функции fj (х) обычно значительно меньше полного числа компонент вектора х. Если о fj ничего априори не известно, то речь идет по существу об идентификации "черного ящика". В качестве модели, в классе которой идентифицируется fj, выберем дискретное множество значений fj в узлах равномерной координатной сетки в пространстве аргументов (xVj,..., Хц^) . Для двумерного случая это показано на рис. 6.7.1, а. Если число аргумен- тов функции fj обозначить через Лу, а среднее геометрическое число узлов сетки по одному аргументу - через , то число значений функции составит . Для полной иден- тификации при указанных условиях необхо- димо как минимум п ^изм = 7=1 (6.7.1)
КЛАССИФИКАЦИЯ И ПРЕДЕЛЬНЫЕ ВОЗМОЖНОСТИ АДАПТИВНЫХ САУ 553 измерений. Предполагая, что каждое измере- ние дает 1 байт информации, аналогичную формулу записываем для количества информа- ции при идентификации: п ^изм = ’ <6-7’2) 7=1 Считая, что проводится FH3M в единицу вре- мени и что за время идентификации характе- ристики fj практически не меняются, для вре- мени идентификации записываем оценочную формулу 1 п (6.7.3) *ИЗМ y_j 7 Для одной характеристики (/’ принимает одно значение) зависимости, соответствующие фор- мулам (6.7.2), (6.7.3), представлены на рис. 6.7.1, б. Здесь темп измерений принят достаточно высокий: FH3M = 100 с1. Несмотря на это, время идентификации при значитель- ном числе аргументов nj и значительном сред- негеометрическом числе узлов сетки Nj получается большим. Так, при Лу = 6 и N(nj) = 15 оно составляет 105 с, а соответст- вующее количество информации - 107 бт. Время адаптации не может был» сущест- венно меньше времени идентификации. Осуществление процессов адаптации САУ для сложных нелинейных объектов управления с минимальной априорной ин- формацией (максимальной неопределенно- стью) является сложной задачей. В то же вре- мя отсутствие какой-либо априорной инфор- мации о моделях таких объектов является ред- ким исключением. Именно сложные нелиней- ные ММ нередко обладают высокой стабиль- ностью, допускающей однократную иденти- фикацию многих компонентов или объекта в целом. 6) Ряс. 6.7.1. Нензвестняя хяряктеристякя объекта (а) объем змервтельаой информяцнн (б)
554 Глава 6.7. АДАПТИВНЫЕ САУ Даже в таких сложных режимах, как пуск и останов промышленных агрегатов, простран- ственный маневр летательного аппарата и других используется лишь малая доля объема всего разрешенного (эксплуатационного) про- странства состояний. При идентификации в пределах "трубки траекторий" можно ограни- читься относительно малыми значениями 6.7.2. БЕСПОИСКОВЫЕ АЛГОРИТМЫ АДАПТИВНЫХ САУ Детально исследованным является под- класс адаптивных САУ, в которых процесс идентификации явно не присутствует. Такие системы часто называют системами прямого адаптивного управления. В этих системах зада- ется модель, обладающая желаемой динамиче- ской точностью, а параметры регулятора ос- новного контура настраиваются таким обра- зом, чтобы динамические свойства системы приближались со временем к динамическим свойствам модели-эталона. Модель-эталон может присутствовать яв- но в виде реального динамического звена, вырождаться в некоторые заданные у ставки или просто подразумеваться при синтезе соот- ветствующих алгоритмов изменения коэффи- циентов ре1улятора. В общем случае с целью оптимизации динамических свойств основного контура мо- дель-эталон может меняться, например, в за- висимости от характеристик внешних воздей- ствий, изменяющихся требований к динамике системы на различных режимах работы. Структура классификация систем пря- мого адаптивного управления. Структурная схема беспоисковой системы прямого адап- тивного управления показана на рис. 6.7.2. Объект и регулятор образуют основной контур системы. В накопитель информации, который условно введен в структурную схему, поступает вся доступная измерению информация и рас- пределяется по другим блокам. Модель на основе доступной измерению информации формирует вектор ум. Ряс. 6.7.2. Структурная схема беспоисковой системы прямого адаптивного управления: у - вектор измеряемых координат; и - управление; /и д - соответственно координатное и параметрическое возмущения; g - задающее воздействие
БЕСПОИСКОВЫЕ АЛГОРИТМЫ АДАПТИВНЫХ САУ 555 Анализаторы на основе анализа движе- ний основного контура и модели формируют некоторые показатели динамической точности движений Q и Qu. Принцип работы системы прямого адаптивного управления заключается в том, чтобы с помощью вектора настраивае- мых параметров регулятора г привести показа- тель системы Q к показателю модели QM- Для этого в блоке сравнения вырабатывается неко- торая мера рассогласования Q и Qu. В блоке настройки заложены алгоритмы изменения настраиваемых коэффициентов регулятора г, способных изменять г во времени таким обра- зом, чтобы мера рассогласования Q и приняла нулевое или минимальное значение. По виду показателей динамической точ- ности движения Q и QM беспоисковые адап- тивные системы (БАС) делят на три класса: 1) с информацией о частотных характе- ристиках; 2) с информацией о временных характе- ристиках; 3) с эталонной моделью. В классе 1 в качестве показателей Q и Ом принимаются частотные характеристики. Тогда в качестве меры рассогласования могут быть приняты, например, рассогласования амплитудно-частотных и (или) фазо-частотных характеристик основного контура и модели в определенном числе точек. В классе 2 за Q и QM принимаются не- которые величины, характеризующие качество переходных процессов (например, число пере- сечений импульсной переходной функции с осью времени), или некоторые временные функции (например, текущая и оптимальная импульсные переходные функции). В классе 3 модель (см. рис. 6.7.2) при- сутствует в виде реального динамического звена, анализаторы отсутствуют, т.е. показате- лями динамической точности Q и QM являют- ся сами векторы движений у и ум, а в качестве меры рассогласования принимается, напри- мер, квадрат нормы вектора ошибки рассогла- сования е = у - ум. Синтез основного контура беспоисковой адаптивной системы. Синтез основного конту- ра для АСАУ рассматриваемого класса, как правило, осуществляется на основе линеаризо- ванных математических моделей объекта и исполнительных механизмов. Для управления нестационарным объек- том с применением прямого адаптивного управления синтез основного контура целесо- образно проводить в два этапа. На первом этапе формируется совокупность моделей объ- екта управления, исполнительных механизмов и корректирующих устройств так, чтобы для любых допустимых законов изменения коэф- фициентов модели объекта существовали зако- ны изменения коэффициентов корректирую- щих устройств, при которых вся эта совокуп- ность обладала свойством операторной опре- деленности, т.е. оператор математического описания этой совокупности относился бы к определенному классу операторов. Эту подсис- тему называют обобщенным настраиваемым объектом (ОНО). Свойство операторной определенности включает в себя такие понятия, как парамет- рическая инвариантность; совместимость, где регулятор считается совместимым с объектом, если путем настройки его параметров можно "скомпенсировать" любые вариации парамет- ров объекта, возможные в реальных штатных условиях; адаптируемость [44], где для любых допустимых законов изменения коэффициен- тов объекта должны существовать единствен- ные законы изменения коэффициентов регу- лятора, для которых совокупность объекта и регулятора описывалась бы оператором эта- лонной модели. Эти требования являются очень жестки- ми. Если они не выполняются, то использует- ся приближенная операторная определенность ОНО. Предположим, что адаптивная система может с достаточной степенью точности на- страивать коэффициенты корректирующих устройств и, следовательно, оператор ОНО будет относиться к заданному классу операто- ров, несмотря на неопределенность и неста- ционарность собственно объекта управления. Например, заданный класс операторов может состоять лишь из одного представителя - ста- ционарного оператора эталонной модели. На втором этапе синтезируется основной контур, исходя из заданных требований на динамическую точность его движения, а также на основе предположения, что оператор ОНО относится к заданному классу операторов. В этом случае ставится задача выбора же- лаемого класса операторов ОНО, при котором второй этап синтеза основного контура имеет простейшее решение. Например, если требует- ся синтезировать оптимальную по какому- либо критерию систему для нестационарного объекта, целесообразно сначала организовать стационарный ОНО, и уже для него решать задачу оптимизации. Наиболее просто синтез ОНО можно проводить на основе теории инвариантности. Объект вместе с исполнительными меха- низмами описывается уравнениями вида х = А(1)х + В(1)ц + C(t)f; у = 2)(Г)х, (6.7.4)
556 Глава 6.7. АДАПТИВНЫЕ САУ где хт = [jqХ2 ... хп ] - вектор состояния; цт =[Ц1Н2*"Нт] " вектор входных коорди- нат, поступающих на исполнительные меха- низмы; /т = [/1/2 • • • fr 1 • вектор коорди- натных возмущений; ут = [ Ji у 2 • • . ys 1 - век- тор измеряемых координат движения объекта, на основе которого формируется управление объектом; Л(/), Б(/), С(/), - матрицы с переменными во времени коэффициентами размерности соответственно п х л, п х /л, п х г, s х п. Предположим, что непосредственно из- меряются все компоненты вектора состояния, т.е. D(f) - Е, где Е - единичная п х п - мат- рица. Заданный класс операторов, к которому необходимо свести результирующий оператор ОНО, определяется стационарным дифферен- циальным уравнением вида х° = Л°х° + В°и, (6.7.5) где (х0)1 =[х°...х°], ит =[«!...«„,! - вектор управления, подаваемый на ОНО; Л°, - стационарные матрицы размеров соответ- ственно п х л, п х т. Уравнение (6.7.5) определяет асимптоти- чески устойчивое, полностью управляемое и полностью наблюдаемое движение. Проблема заключается в выборе корректирующего уст- ройства, добавляемого к объекту (6.7.4), при котором ОНО обладает свойством оператор- ной определенности, т.е. описывается опера- тором (6.7.5). Для описания решения этой проблемы представим A(f), B(jy C(f) в виде A(t) = Л° + Д4(Г); B(t) = В° + &В(Г); C(t) = С° + ДС(/), (6.7.6) гдеС° = 0- лхг - нулевая матрица, т.е. ста- вится задача полной инвариантности движе- ния ОНО к координатному возмущению Д/). Искомые корректирующие устройства выбира- ем в виде ц = 50+ (В? и - ДАх - ДД7ц - АДО, (6.7.7) где Б°+ - т х л - псевдообратная матрица для В\ - п х т ~ стационарная матрица; ДХ, ДУ, ДЯ - матрицы размеров соответственно л х л, л х т, п х г, коэффициенты которых и будут настраиваться таким образом, чтобы обеспечить операторную определенность ОНО. Потребуем, чтобы существовала матрица (£ + 2?0+ДАО-1, т.е. чтобы матрица (Е + BQ+&N) была не особенной. В этом случае при выполнении равенств В°В0+ + В? = В°; B°B0+bN з ДЛ(7); В°В0+ДГ = Д 4(Г); В°В0+ЬЛ = ДС(Г) (6.7.8) из (6.7.4) и (6.7.7) получаем х = А°х + В°и, (6.7.9) т.е. при настройке коэффициентов корректи- рующих контуров в (6.7.7) по соотношениям (6.7.8) оператор ОНО (6.7.9) совпадает с за- данным оператором (6.7.5). Если матрица ВР полноранговая и Гр = л (Гд - ранг матрицы 5°), то В0+ = BQT(B°BOry1 (6.7.10) и В°В0+ = Е, тогда соотношения (6.7.8) упрощаются, однако необходимо, чтобы л < т, т.е. размерность вектора управления ц была равна или превосходила размерность вектора состояния объекта. Рассмотренная структура ОНО и приве- денная методика его синтеза предполагают большой объем информации. Как правило, проектировщик системы управления не имеет такого количества информации, поэтому ее следует рассматривать как предельную, а затем от требования х(/) н х9(/) переходить к полу- чению х(/) » х°(/)> гае степень допустимого приближения и определяет степень возможных упрощений структуры ОНО. БАС с информацией о частотных характе- ристиках. В системах данного типа измеряются амплитудно-частотные Л(со) и фазочастотные 0(со) характеристики объекта или системы в достаточном числе точек со/, / = [1, 7V]. По- скольку 0(со) в условиях помех нередко изме- ряется с большими погрешностями, то вместо Л(со), 0(со) целесообразно измерять вещест- венную Р(со) и мнимую С(®) частотные ха- рактеристики. Число точек измерения N опре- деляется числом переменных коэффициентов объекта или системы. Если число переменных коэффициентов л, то N = целая часть числа, заключенного в квадратные скобки. л + 1 2 , где [ • ] -
БЕСПОИСКОВЫЕ АЛГОРИТМЫ АДАПТИВНЫХ САУ 557 В случае, когда измеряется лишь Л(со), N = и. Эвристические алгоритмы перестройки коэффициентов имеют вид t ki = kiQ + kiujcidt + k^i, (6.7.11) о где €/ = Z(co /) - (со /) ; L(co) = Л(со),6(со), Р(со) или Q(co); (со) - значения частот- ных характеристик модели в точках со/; к$, к1и, к& = const. Объект является нестационарным, следо- вательно, применение классических частотных характеристик допустимо только при медлен- ном изменении коэффициентов. "Медленное" означает изменение коэффициентов не более чем на 10 - 15 % за период пробного воздей- ствия, определяемого наименьшей соу. БАС с информацией о временных характе- ристиках. Этот класс адаптивных систем явля- ется весьма разнообразным по типу временной информации, используемой в контурах само- настройки. В большинстве случаев использу- ются импульсные переходные функции систе- мы и модели (&(0Лм(0) и некоторые их характеристики (число пересечений k(i) с осью абсцисс и др.). Однако в связи со слож- ностью измерения А(/) эти системы не нашли широкого применения. На практике применялись два простей- ших подкласса БАС с информацией о времен- ных характеристиках. 1. Системы с информацией о процессах на границе устойчивости. В ряде случаев при- емлемые свойства замкнутой системы удается получить, поддерживая коэффициент усиления регулятора максимально или минимально воз- можным с точки зрения устойчивости замкну- того контура. Информацией о выходе системы на границу устойчивости служат автоколеба- ния. Структурная схема аналоговой системы показана на рис. 6.7.3. Если требуется поддер- живать, например, максимальное значение А, то система работает на верхней границе устой- чивости, при этом величина к зависит от Рис. 6.7.3. Структурная схема аналоговой адаптивной системы с информацией о временных характеристиках: О - объект, включающий в себя исполнительный механизм; БПК - блок перестраиваемого коэффициента; КЗ - корректирующее звено в цепи обратной связи; Ф - узкополосный фильтр, настроенный на частоту автоколебаний; В - выпрямитель; БАА - блок алгоритма адаптации; ц - входная координата исполнительного механизма; /- возмущение; g - управляющее воздействие; к - перестраиваемый коэффициент БАА; &2 - сигнал, пропорциональный амплитуде автоколебаний; - сигнал, задающий допустимую амплитуду автоколебаний
558 Глава 6.7. АДАПТИВНЫЕ САУ параметров объекта. Пусть параметры объекта таковы, что система находится в области ус- тойчивости и автоколебания отсутствуют. То- 1да$2 = 0и8д = Э1-$2>0 через БАД увели- чивает к до тех пор, пока не возникнут авто- колебания. Если амплитуда автоколебаний вырастет сверх допустимой, появится отрица- тельная ошибка efl, которая уменьшит коэф- фициент к. Таким образом, происходит стаби- лизация амплитуды автоколебаний на границе устойчивости системы. БПК представляет собой обычно нели- нейное звено, содержащее линейный участок либо с переменным коэффициентом и посто- янным ограничением, либо с постоянным коэффициентом усиления и перестраиваемой полкой ограничения, либо последовательное соединение нелинейного элемента, перед ко- торым стоит перестраиваемый коэффициент. Алгоритм адаптации, реализуемый в БАА, обычно имеет вид t к = kQ + kuj zadt + kzza, (6.7.12) о где к$9ки9кг = const. Система работает удовлетворительно в том случае, если при изменении параметров объекта частота автоколебаний на границе устойчивости меняется незначительно. В про- тивном случае выбирают фильтр со сравни- тельно широкой полосой пропускания, что снижает помехоустойчивость контура самона- стройки. 2. Системы, основанные на сравнении высокочастотной и низкочастотной состав- ляющих сигнала (рис. 6.7.4, а). В системе под- держивается постоянным значение частоты собственных колебаний (О в основном контуре, которое меняется при изменении параметров в) в) Рас. 6.7.4. Структурная схема (а) и амплитудно-частотная характеристика (б) адаптивно* САУ: У - умножитель; Ф1 - балансировочный фильтр; Фн, Фв - фильтры соответственно низких и высоких частот (остальные обозначения см. рис. 6.7.3)
БЕСПОИСКОВЫЕ АЛГОРИТМЫ АДАПТИВНЫХ САУ 559 объекта. Настройка коэффициента к происхо- дит следующим образом. Если (О = (0q> ®0 заданная величина, то амплитудно-частотные характеристики фильтров Фн и Фв (ДХ®), Лв(со)) выбраны так, что ^(coq) = ^(®о) (см. рис. 6.7.4, б). Тогда = $2 и к не меня- ется. Если при изменении параметров объекта © увеличилась и стала равной ® > ©о» то Лв(<01) > Лн(а)1), в результате появляется ошибка ев = 31 - ^2 < 0, что вызывает умень- шение к до тех пор, пока не будет выполнять- ся равенство (О = ©о (предполагается, что с уменьшением к частота о уменьшается и на- оборот). Фильтр Фх включен для увеличения колебательной составляющей в сигнале е. Ал- горитм перестройки к определяется выражени- ем (6.7.12). БАС с эталонной моделью. Структура ОНО (рис. 6.7.5), в которой коэффициенты корректирующих контуров настраиваются на основе БАС с эталонной моделью, определяет- ся соотношением (6.7.7). БАА - блок форми- рования алгоритмов адаптации. Предположим выполненными следую- щие условия: В?=Вц В°В0+=Е; т = п. (6.7.13) Введем обозначения: ДЛ(') = 1^9 <01; ДА(г) = [ д/>« (01; дс(0 = [Дсл(01; ДАГ=[ДМ01; &N(t) = [Длй(01; ДА = 1Дгй(01; г-|у#(01; z = [z«(0); а = 1Ы01; У#(О = Да#(0-ДЛ#(0; гй(0 = Д*й(0 - Длй(0; »й(0 = Дсй(0-Длй(0; -1^(01; Ъ Ъ =Кл(01; d d ^УЧ ~~dt ^ч =~di d Алгоритмы настройки коэффициентов корректирующих устройств на основе прямого метода Ляпунова имеют вид: d d — tdcv(t) = testxj; —&nu(t) = iBolnt; = <67.14) где ае = const > 0; ст - компоненты вектора Л; e = x - хм - вектор координат движе- ния эталонной модели, в качестве которой принимается звено, описываемое уравнением хм=А°хм+В°и, (6.7.15) Р - \Ру В hJ = [1,л] - симметрическая опре- деленно-положительная матрица, получаемая из равенства Q = A<*P + PA°, (6.7.16) где Q - определенно-отрицательная матрица. Доказано следующее: 1. Алгоритмы (6.7.14) при = = н 0, т.е. при неизвестных, но постоянных параметрах объекта обеспечивают limх(Г) = хм(/); lim(у у,Zu,Sth) = const. /->00 /->ОО Таким образом, в асимптотике движения сис- темы и модели совпадают. 2. Алгоритмы (6.7.14) при £>у= = = = О помимо условия lim х(/) = хм (/) обеспечивают =0. /->00 т.е. lim Ьку = Аа»; lim Ал# = A£tf; lim ДгЛ = АсЛ, (6.7.17) /->« если компоненты векторов хм(/), ц(/), flj) составляют линейно-независимую, равномерно неисчезающую систему функций и при огра- ниченных значениях и, й, /, f (назовем это условием А).
560 Глава 6.7. АДАПТИВНЫЕ САУ Рис. 6.7.5. Структурная схема ОНО, в которой коэффициенты корректирующих контуров настраиваются на основе эталонной модели: М - эталонная модель; О - объект, описываемый уравнением (6.7.4) с учетом предположения D(0 “ Е Систему непрерывных функций aj(/), аз(/)> ал(0> заданных при t > Zb, называют линейно независимой, равномерно неисче- зающей, если существует такое Т = const > 0, что для любой линейной комбинации этих функций 0£ (0 = s С, = const, ы Л Ёс? *° /=1 можно указать число р = const > 0 такое, что МФр по крайней мере в одной точке любого отрезка времени [/, t + 7], f £ Iq. 3. В случае выполнения условия А алго- ритмы (6.7.14) обеспечивают близость x(f) и х^(/) при 0, 0, 0, т.е. при пе- ременных параметрах объекта, по крайней мере при малых скоростях их изменения. Рассмотрим несколько подробнее усло- вие А. При его выполнении (Е>у = = £>s = 0) появляется возможность идентифицировать объект, а это в свою очередь позволяет строить более совершенные адаптивные системы.
БЕСПОИСКОВЫЕ АЛГОРИТМЫ АДАПТИВНЫХ САУ 561 Так, зная параметры объекта, можно пе- рестраивать модель, выбирая ее оптимальной для каждого режима работы системы, можно определять предаварийные ситуации в объекте ит.д. Условия А означают, что м(1) и fifi должны быть достаточно богатыми по своему спектральному составу. В ряде работ получены аналогичные ус- ловия, при которых кроме lim x(t) = хм (/) справедливы (6.7.17). Эти условия имеют следующий вид. Для выполнения (6.7.17) необходимо и достаточно, чтобы можно было выбрать числа Tq > О, £0 > 0, > ° такие, что для любых заданных /1 £ 0 и единичного вектора w е Rn+m+h существовал бы момент времени /2 е [/j, /j + Tq ], такой, что /2+б j[xTWnT(t)/Tw] wdi £ е0. (6.7.18) h Если IM IM |z<r)| определены и ограни- чены, то (6.7.18) можно заменить на следую- щее: существуют а и b такие, что для всех значений w е /?Л+Ж+А у |w| = 1 и > *1 ||хт(т)цт(т)/т(т)]^|л £ a(t2 - /0 + b, h (6.7.19) Условия типа А могут быть приведены в следующем виде: для выполнения (6.7.17) дос- таточно, чтобы существовало множество мо- ментов времени //, / = [1, п + т + Л], таких, чтобы матрица x(/i) ... х(/л+л!+л) н('1) ••• ц(^+ж+л) У'(Л) ••• /(Jn+m+h). была неособенной. Аналогичные по структуре алгоритмы адаптации получаются и при применении для их синтеза метода градиента, метода гиперу- стойчивости. В ряде случаев для улучшения процессов адаптации в алгоритмы (6.7.14) добавляют пропорциональные члены, т.е., например, для коэффициентов Дку имеем Дку - 8S\OtXj -и^Дку, (6.7.20) где aei = const >0, aej = const > 0. При этих алгоритмах lim Дку = 0 и контуры самона- стройки теряют "память". Однако алгоритмы (6.7.20) предпочтительнее (6.7.14) в том слу- чае, когда параметры объекта меняются быстро и не стремятся к постоянным значениям. Когда требуется обязательно сохранить "память” контуров адаптации для улучшения процессов адаптации, применяют алгоритмы вида t Дку = Jo/ХуЛ-»2CT/» (6.7.21) 0 где , »2 > °- Практика применения (6.7.21) показыва- ет, что члены ®2СТ/ снижают колебательности процессов по перестраиваемым коэффициен- там. При малых значениях ||м(/)| и в случае, когда fify недоступно измерениям, появляется опасность неограниченного увеличения Д/ty, Дл^ с течением времени. Для "огрубления алгоритмов” можно вводить зоны нечувстви- тельности: ffiCT/Xy 0 ЫСу - при |хм(/)||^8; _ „ (O.7.ZZ) при |хм(0||<8, где 8 = const > 0. При ае —> оо алгоритмы (6.7.14) с учетом ограничений, на Дку, Дп^, Дг^, которые всегда имеют место, превращаются в релейные типа: Дку = Дку sign (о/Ху), Дку = const > 0. (6.7.23) В этом случае возникает скользящий ре- жим движения системы относительно модели, а система становится особым типом из класса систем с переменной структурой. Однако свойства адаптации сохраняются (не срывается скользящий режим) лишь при |дл^| < Дку (аналогично при \du| < Дпи , |с^| < Дг^ ). Выбор больших значений Дку ведет к пони- жению помехоустойчивости системы.
562 Глава 6.7. АДАПТИВНЫЕ САУ Положительным свойством алгоритмов (6.7.23) является их быстродействие, поскольку не требуется времени на перестройку Ькц . В связи с этим предложены комбиниро- ванные алгоритмы t Ьку = ®J Q/Хjdt + Ькц sign (o/Xy). (6.7.24) о Аналогичные по структуре алгоритмы на основе теории Ляпунова получены и для дис- кретных систем. Замкнутая система описывается уравне- нием 4* +1] = (Д) + АЛ + ЬК[к + 1])х[ Л] + +(Д) + Д* + &N[k +1])4 Л], (6.7.25) где к - дискретное время; х е Rn , и е Rm, 4), Bq - постоянные п х п и п х т матрицы; АД ЬВ - неизвестные постоянные матрицы параметрических возмущений, собственные числа 4) лежат внутри единичной окружности комплексной плоскости. В качестве модели выбирается звено ХмИ + 1] = ЛоХмИ] + Ло“1*]- (6.7.26) Тогда алгоритмы, обеспечивающие * lim e[*l = °, 4*1 = *м1*1 - х(Лг] имеют вид: к-ю> AAT[fc + l] = AiT[fc] + М*1Л4*1 - 4)4* - П)4* - И; (6.7.27) &N[k +1] = АДГ[* + Л + +4*^(4*! - 4)4* - И)4* -1]. Здесь Р - симметричная матрица, скаляр а 4*1 =---z— -------, 0 < а < 2; *««/[* -1М*- И Хщах - наибольшее собственное число матрицы В. /1*1 = м*м*11т. Алгоритмы для автоматической или авто- матизированной настройки промышленных регу- ляторов. Перечислим предположения при син- тезе большинства других адаптивных алгорит- мов: максимальный порядок модели объекта считается известным, линейность модели предварительно обоснована; параметры математической модели могут Медленно изменяться, и в большинстве случаев полагаются постоянными, но неизвестными по величине; транспортное (чистое) запаздывание в объекте считается известным и постоянным; для настройки регуляторов используются тестовые (пробные) сигналы, если возмущения в режиме нормальной эксплуатации объекта являются недостаточными для получения со- стоятельных оценок параметров объекта; на этапе настройки допустима процедура верификации математической модели объекта; для управления используется линейный динамический регулятор, аналоговый или цифровой структуры, часть параметров кото- рого являются постоянными, а часть - на- страиваемыми; желаемые динамические характеристики контура регулирования должны учитывать ограничения, определяемые применяемыми приводами, усилителями мощности, датчиками. На основе этих предположений получе- ны алгоритмы автоматической и автоматизи- рованной настройки промышленных регулято- ров [44, 53]. Эти алгоритмы реализуются в виде пакета прикладных программ (ППП) АДАКОМ [45]. Автоматизированная система настройки (АСН) промышленных регуляторов [36] ис- пользует ППП АДАКОМ. Областью применения АСН является ав- томатизация настройки и наладки микропро- цессорных и аналоговых комбинированных регуляторов семейства ПИД-закона, а также модальных регуляторов для непрерывных тех- нологических процессов в энергетике, химии, нефтехимии и нефтепереработке, газовой и атомной промышленности, а также для элек- тромеханических систем в машиностроении (станкостроение, робототехника). АСН может быть реализована в виде встроенных модулей в микропроцессорных регуляторах общепромышленного назначения; автоматизированных рабочих мест настройщи- ка службы КИП и А; подсистем интеллекту- альных регуляторов нового поколения. АСН позволяет: задавать желаемые динамические харак- теристики настроенного регулятора по одному, нескольким критериям, менять их по времен- ной программе или в зависимости от желания оператора; осуществлять централизованный кон- троль за степенью настроенности регулятора; определять, отображать и регистрировать динамические характеристики объектов регу- лирования, исполнительных механизмов и датчиков; генерировать различные тестовые сигналы;
АЛГОРИТМЫ АДАПТИВНЫХ ОПТИМАЛЬНЫХ САУ С ИДЕНТИФИКАЦИЕЙ 563 вычислять значения оптимальных на- строек регуляторов при изменении режима работы или по желанию оператора; автоматически настраивать микропроцес- сорные и аналоговые регуляторы имеющими параметрическое регулирование настроечными параметрами. ППП АДАКОМ состоит: из прохрамм диспетчера, машинной графики, ввода-вывода данных, обеспечения диалога, библиотек про- граммных модулей объектов, регуляторов, генераторов сигналов, эталонных моделей, оценки степени настроенности, верификации математических моделей, экспертной системы, настройки регуляторов и компенсаторов [52]. ППП реализован в нескольких версиях для машин двух типов: мини-ЭВМ и ПЭВМ. В первом случае минимальная конфигурация технических средств включает ЭВМ СМ-4 (СМ-1420) с ОЗУ емкостью 256 Кб, НМД типа ИЗОТ-1370, АЦПУ, видеотерминал типа ВТА-2000. При этом используется операцион- ная система ОСРВ. Во втором случае указан- ная конфигурация включает ПЭВМ IBM PC AT (XT) (EC-1840, 1834), адаптер EGA и принтер типа "Эпсон". При этом используется операционная система MS-DOS. Языки программирования - Фортран-77, Паскаль. Минимальный объем оперативной памяти - 256 Кб. Некоторые данные зарубежных серийных адаптивных регуляторов приведены в табл. 6.7.1 [43]. В них в основном применяют- ся различные версии алгоритмов идентифика- ции объекта. 6.7.3. АЛГОРИТМЫ АДАПТИВНЫХ ОПТИМАЛЬНЫХ САУ С ИДЕНТИФИКАЦИЕЙ Наиболее совершенным (но и наиболее сложным) видом адаптивного управления для объектов с точно известной структурой модели является оптимальное (субоптимальное) управление с одновременной идентификацией обобщенного управляемого объекта в классе нелинейных моделей. Такое управление по- зволяет достичь конечной для каждого этапа цели функционирования системы при мини- мальных в определенном смысле энергетиче- ских, материальных и информационных затра- тах. В некоторых книгах подобные САУ име- нуются универсальными. 6.7.1. Адаптивные регуляторы зарубежных фирм Изготовитель, страна Регулятор Год выпуска Алгоритм основного контура Leeds Northrup, США Elektromax V 1981 ПИД ASEA, Швеция Novatune 1982 Регулятор мини- мальной дисперсии Haneywell, США UOS 500 ПИД Eurotherm, Великобритания 810, 818 1983, 1986 ПИД, двухпозици- онный RAFI/WSE, ФРГ АР720, АР730 1983 Turnbull Control Sys- tem, США 6355 ПИД VDO, США MICON, MDC-60 Foxboro, США EXACT 1984 Gossen, ФРГ DOI, DSY 1985 ПИД, двухпозици- онный Simens, ФРГ Teleperm A-200, -PC 16-11 1986 ПИД ВВС, ФРГ Procontrol 177 HANS, ФРГ PH-ARC16
564 Глава 6.7. АДАПТИВНЫЕ САУ Алгоритмическое обеспечение субопти- мального управления с идентификацией имеет много версий. Рассмотрим версию с непре- рывными координатным оцениванием и иден- тификацией и прогнозирующим управлением [44]. В течение времени идентификации век- тор параметров а обычно считается постоян- ным. При этом непрерывная математическая модель обобщенного стохастического объекта и уравнение наблюдения в общей форме могут быть представлены в виде (6.4.9), (6.4.11): х = f(x,u,t,a) + 5(0, а = 0; (6.7.28) Z = h(x, t, и, а) + ц(0. (6.7.29) Частным и широко распространенным случаем является ММ вида х = /(х, а) + <р(0 + 5(0, а = 0; (6.7.30) Z = А(х,д)+т](0. (6.7.31) Вводя расширенный вектор состояния, вклю- чающий как вектор координат, так и вектор х! параметров xD = , ММ объекта (6.7.30) и уравнение наблюдения (6.7.31) записываем в форме: ip = F(xt) + ф«р + !;р (Г); (6.7.32) z =Л(хр) + л(0, (6.7.33) гае , Г/(х>а)1 Гф» W= n ;ф«р=п ^р(0 = 4(0' о Процесс координатного и параметриче- ского оценивания (идентификации) можно теперь рассматривать как единый процесс оценивания. В соответствии с принципом разделения оптимальная (субоптимальная) САУ состоит из системы оценивания и систе- мы оптимального управления, синтезирован- ной для детерминированных условий при полной непосредственной измеримости всех компонент вектора состояния. Наблюдатели и идентификаторы с моде- лями и адаптивные субонтимальные САУ. В п. 6.2.3 приведены алгоритмы параметриче- ского синтеза, которые могут быть применены для идентификации и оценивания в режиме реального времени в адаптивных САУ. Модуль оценивания и идентификации. Обобщенный объ- ект и условия наблюдения описываются урав- нениями (6.7.30), (6.7.31), где вектор парамет- ров а точно не известен, а статистические характеристики шума 5(0 либо известны, либо также не известны. Настраиваемая модель имеет структуру, подобную (6.7.32), но с дополнительными управлениями и без шума 5р(0 (если его ста- тистические характеристики неизвестны): ip = Л*р) + Ф»р + «м- (6.7.34) При применении в данном модуле квадратич- ного ФОР с главной частью типа (6.4.70) t iT = 0,5 J[z(0) - *(xp(e))]Tp[z(0) - Л(ХР(0))]Л t-T (6.7.35) и частью, отражающей информационные за- траты t 0,5 JJ«J(0)A:-1«M(0) + t-T (6.7.36) алгоритм совместной идентификации и оцени- вания в соответствии с (6.4.68), (6.4.69) и (6.7.34) - (6.7.36) принимает вид ip = f(ip) +Ф«р +**ip(ip)plz - Л(хр )1- (6.7.37) Матрица р при данном подходе должна зада- ваться на основе некоторых дополнительных соображений. Матрица интенсивностей шумов наблю- дения R считается невырожденной и, как пра- вило, диагональной (шумы различных датчи- ков, каналов измерения независимы). Тоща матрицу весовых коэффициентов р естествен- но задавать обратной по отношению к матрице Л р = Тем самым менее точным каналам измерения придается меньший вес. Фильтр (6.7.37) при этом как бы при- ближается к основному модулю обобщенного ФКБ. Он полностью совпадает с этим алго- ритмом, если матрица к выбирается равной оценке ковариационной матрицы, определяе- мой уравнением типа (6.4.91). Целесообраз- ность такого выбора также может быть обос- нована, по крайней мере, при диагональных матрицах Рр, к. Действительно, чем выше дисперсии ошибок оценивания параметров или координат, вызванных случайностью са- мих оцениваемых процессов, тем больше ин- формационные затраты, необходимые для обеспечения работоспособности фильтра.
АЛГОРИТМЫ АДАПТИВНЫХ ОПТИМАЛЬНЫХ САУ С ИДЕНТИФИКАЦИЕЙ 565 Однако в общей постановке задачи адап- тивного управления характеристики шумов, возбуждающих оцениваемый процесс, неиз- вестны и определить матрицу Рр путем реше- ния уравнения (6.4.91) не представляется воз- можным. В ряде случаев может использоваться ме- тод эмпирических средних. Введем обозначение Ахр = хр - х и вы- чтем уравнение (6.7.32) из (6.7.37). Сохраняя члены первого порядка малости относительно Дхр, находим Д*Р = ^(*р)Д*р + *л^(*Р)рк - л(*р)1 - Чр(0- (6.7.38) Моделировать это уравнение можно в следующих случаях: характеристики шума £p(f) известны или сам шум доступен для измерения; влияние шума £p(f) имеет второстепен- ное значение для ошибок оценивания на рас- сматриваемом интервале времени (например, при циклическом оценивании). Имея в виду второй вариант, записываем модуль непрерывного оценивания и иденти- фикации в следующем виде: хр =F(Xp)+q>«p + + AxpAxJ*^(xp).R *к-Л(Хр)]; А*р =/V*P)AiP + + ДХрДх;ЛТр(Хр)2? ’[z-A(Xp)]. (6.7.39) Здесь в качестве матрицы к фигурирует эмпи- рическое среднее по некоторому интервалу времени от произведения АхрДхр (обозначено чертой сверху). Уравнения (6.7.39) должны интегриро- ваться совместно при некоторых начальных условиях и процедуре "запуска", связанной с операцией усреднения ДхрДхр . Вычислительные затра- т ы. Разностная схема, соответствующая (6.7.39), может строиться различными спосо- бами. Поэтому приведем лишь ориентировоч- ные оценки вычислительных затрат. При х е , а е Л’”4’ общий порядок системы уравнений (6.7.39), рассматриваемых как обыкновенные дифференциальные уравнения (операция ДхрДхр как бы игнорируется), составляет 2(л + лд). Если же операция ус- реднения реализуется в независимых линей- ных фильтрах первого порядка, т.е. Т^к + к = Дхр Дх£, (6.7.40) где 7ф - скалярная постоянная, к = ДхрДх£ , то общий порядок системы уравнений (6.7.39), (6.7.40) с учетом симметрии матрицы к соста- вит (л + лд )[2,5 + 0,5 (л + па )].. Однако ряд особенностей структуры этих уравнений благоприятствует снижению необ- ходимого числа элементарных арифметических операций на каждом шаге численного интег- рирования. К ним относят наличие общих членов в правых частях уравнений (6.7.39). Обозначим число арифметических операций, необходимых для однократного вычисления значений векгор-функций F(xp), Ыхр) и матриц Якоби соответственно NF, Nh» ^Fx » • Тоща для однократного вычисления правых частей уравнений (6.7.39), (6.7.40) потребуется приблизительно 3(п + лд )2 + 2(л + na)m+NF + Nh + NFx + (6.7.41) арифметических операций (из которых при- мерно половина - длинные). Здесь предпола- гается, что размерность вектора наблюдения т существенно меньше (л + па) . Другим фактором, сокращающим вычис- лительные затраты, является то, что при пред- ставлении F и h в виде базовых функций и параметров (коэффициентов) значения NF, Nh обычно относительно невелики. Элемен- ты матриц Якоби NFx , при этом также представляют в виде базовых функций с по- стоянными коэффициентами, и для их опре- деления требуется невысокое число арифмети- ческих операций. Общая структура адаптив- ной субопимальной САУ. Со- гласно принципу разделения, принципу ми- нимума ФОР и уравнению (6.7.30) в данном случае прогнозирующей моделью для построе- ния оптимального управления и должна слу- жить ММ:
566 Глава 6.7. АДАПТИВНЫЕ САУ X = /(х,а), а = а (6.7.42) Обозначим общее решение этого уравне- ния в виде х(Г) = X(x(tQ)9a(tQ)9t-tQ). (6.7.43) В качестве минимизируемого функционала задается ФОР с квадратичными затратами на управление (6.1.53): h J = r3[x(z2)]+Je3[x(e),e]dB+ t h +о,5Д«т(е)*Л(е)+“Jn т’Чп (0)рэ- t (6.7.44) Тоща оптимальное (субоптимальное) управле- ние выразится формулой “ = _*“фТ а£) а(/)’ '2 ’ 01+ h +Je3[*(x('),a(O,e-O,o]<« t (6.7.45) fix,а) 0 Алгоритмы (6.7.39), (6.7.40), (6.7.42) - (6.7.44) с учетом соотношений Л*р) = образуют полную систему непрерывных алго- ритмов данной адаптивной субоптимальной САУ. Структура системы показана на рис. 6.7.6. С целью интенсификации координатного и параметрического оценивания в алгоритмиче- ском модуле (6.7.39) могут создаваться допол- нительные искусственные вариации компонент Хр (штриховая стрелка справа). При исполь- зовании метода синхронного дифференциро- вания в модуле формирования оптимального управления (6.7.45) специальные вариации 5х мотуг создаваться на входе и подаваться муль- типликативным способом в этот модуль (на рис. 6.7.6 это не показано). Для грубой оценки необходимого быст- родействия процессора АСАУ данного вида к вычислительным затратам на оценивание и идентификацию следует добавить затраты на формирование собственно оптимального управления. При отсутствии терминального члена в ФОР, скользящем интервале прогнозирования Топ, численном интегрировании методом Эй- лера всех дифференциальных уравнений (6.7.39), (6.7.40), (6.7.42) и синхронном диф- ференцировании в (6.7.45) ориентировочная оценка необходимой вычислительной произ- водительности, оп/с, должна быть представле- на формулой р(л + па)2 + 2(п + па)т + + +^ + Nh+NFx+ ]Д/ш > (6.7.47) где Д/щ - шаг интегрирования. При п + па = 50, т = 6, Np = 100, ЛГЛ+ЛГ/?я+Л\ = 1000, Топ = 10 с, ДАи = 0,05 с необходимая вычислительная производительность составит примерно 7 • 10s арифметических операций в секунду. Системы с калмановской идентификацией и адаптивным прогнозирующим управлением. Оценивание параметров (идентификация) и оценивание вектора состояния х (координатное оценивание) в классе моделей (6.7.36), (6.7.31) или, что то же, (6.7.32), (6.7.33) может проводиться посредством обоб- щенного ФКБ. Если £р(0» л(0 " некоррелированные по отношению друг к другу векторные гаус- совские белые шумы, то алгоритмы обобщен- ного непрерывного ФКБ для модели (6.7.32), (6.7.33) будут иметь стандартный вид (6.4.90), (6.4.91): хр = Р(Хр)+фИр + + Ррй^(хр)Л-1к-Л(хр)]; (6.7.48) Рр=Р^(хр)Рр+РрР?(хр)- -VV*p)*’4(W+fip> (6.7.49) где ер = мр('Чт(оо]=Г° °. р 1 ° J J [° °.
АЛГОРИТМЫ АДАПТИВНЫХ ОПТИМАЛЬНЫХ САУ С ИДЕНТИФИКАЦИЕЙ 567 Рве. 6.7.6. Общая структура адаптявной субоптямальаой прогнозирующей САУ Согласно принципу разделения и принципу минимума ФОР оптимальным (субопти- мальным) управлением в смысле минимума условного математического ожидания функ- ционала (6.7.44) является управление (6.7.45): Ят “ = *“<₽Т efej 'г ’ 01+ h + /езда(О,а(О,е-О,0]Л (6.7.50) где х(П = *(х(ГОМ('о),'-'о) (6.7.51) - общее решение уравнений свободного дви- жения объекта: х = /(х,а), а = а (6.7.52) Алгоритмы (6.7.48 - 6.7.52) совместно с выражениями Ф«р = (ри 0 = 0 ’ (6.7.53) образуют полную систему непрерывных алго- ритмов рассматриваемой адаптивной САУ с калмановской идентификацией и прогнози- рующим управлением. При отсутствии терминального члена в ФОР, скользящем интервале прогнозирования Топ, численном интецжровании методом Эй- лера всех дифференциальных уравнений (6.7.48), (6.7.49), (6.7.52), синхронном диффе- ренцировании в (6.7.50) ориентировочная
568 Глава 6.7. АДАПТИВНЫЕ САУ оценка необходимой вычислительной произ- водительности может быть представлена фор- мулой £(2л + 4т + 3)(л + па)2 + 3(т + 1)(л + па) + + ^г(7опд^ш +1) + ^Л + NFX + • (6.7.54) Здесь обозначения те же, что и в формуле (6.7.47). Так же, как и в случае (6.7.47), при- мерно половина необходимых арифметических операций относится к длинным (умножение), половина - к коротким (сложение). При высоких п для данной АСАУ требуется суще- ственно большая вычислительная производи- тельность процессора, чем для АСАУ с алгоритмами (6.7.39 - 6.7.45). Так, при п + па = 50, п = 20, т = 6, Nf = 100, = 1000, Т’оп = 10 с» Л/ш = 0,05 с (данные идентичны предыдущей АСАУ, но конкретизировано значение л) тре- буемое быстродействие согласно (6.7.54) соста- вит приблизительно 3,8 • 106 оп/с, что более чем в 5 раз превышает оценку для АСАУ с идентификатором, рассмотренным в п. 6.7.3. Кроме того алгоритмы (6.7.39, 6.7.40) могут обеспечивать большую степень адаптивности, так как не требуют знания характеристик шу- мов £(/), воздействующих на управляемый процесс. Еще сравнительно недавно достижения в области теории адаптивных систем казались в некоторой степени соответствующими потреб- ностям. Однако последующий ход научно- технического прогресса показал другое. Дело не только в быстром росте сложно- сти объектов управления, размерности, много- связности, нелинейности моделей. Оказалось, что для многих создаваемых в ускоренном темпе новых объектов и технологических про- цессов даже структура моделей не может быть получена без натурных испытаний, а испыта- ния не могут быть проведены без применения моделей. Проблема еще более усложняется в нештатных и аварийных ситуациях. Как уже отмечалось выше, только недав- но удалось разработать концепцию самоорга- низующегося оптимального регулятора с экст- раполяцией (СОРЭ), структурной и парамет- рической адаптацией. Такие СОРЭ могут реа- лизовываться в виде программ многофункцио- нальных цифровых контроллеров, персональ- ных компьютеров, встроенных цифровых и даже гибридных микросхем. Несколько встро- енных СОРЭ позволяют создать самооргани- зующуюся САУ. Ввиду простоты, низкой стоимости, не- обычной высокой совместимости с уже суще- ствующим оборудованием, аппаратными сред- ствами СОРЭ пригодны не только во вновь создаваемых объектах и технологических про- цессах, но для модернизируемой и восстанав- ливаемой техники. Как отмечалось, СОРЭ, особенно так на- зываемые двухконтурные СОРЭ, уже привлек- ли внимание в различных отраслях и получили первые практические применения [14, 18, 20, 22, 29]. СПИСОК ЛИТЕРАТУРЫ 1. Анализ и оптимальный синтез на ЭВМ систем управления / Под ред. А. А. Воронова и И. А. Орурка. М.: Наука, 1984. 2. Арнольд У. Ф., Лауб А. Дж. Алгорит- мы и программы для решения обобщенной проблемы собственных значений и алгебраиче- ского уравнения Риккати // Автоматизирован- ное проектирование систем управления / Под ред. М. Джалшиди, Ч. Дж. Херчета. М.: Ма- шиностроение, 1989. 3. Атанс М., Фалб П. Оптимальное управление. М.: Машиностроение, 1968. 4. Бабицкий В. И., Ковалев А. С., Шипи- лов А. В. Оптимальное управление приводом цикловой машины // Изв. АН СССР. Техни- ческая кибернетика. 1989. № 6. 5. Беллман Р. Динамическое программи- рование. М.: Изд-во иностр, лит., 1960. 6. Белоглазов И. Н., Казарин С. Н. Со- вместное оптимальное оценивание, идентифи- кация и проверка гипотез в дискретных дина- мических системах // Изв. РАН. Теория и системы управления. 1998. №4. 7. Бронштейн И. Н., Семендяев К. А. Справочник по математике для инженеров и учащихся втузов. 13-е изд., испр. М.: Наука, 1986. 8. Буков В. Н. Адаптивные прогнози- рующие системы управления полетом. М.: Наука, 1987. 9. Васильев Ф. П. Численные методы решения экстремальных задач. М.: Наука, 1988. 10. Воронов А. А. Введение в динамику сложных управляемых систем. М.: Наука, 1985. 11. Головинский А. Н., Наумов А. И. Алгоритмическое решение задач оптимального траекторного управления летательным аппара-
СПИСОК ЛИТЕРАТУРЫ 569 том // Изв. АН СССР. Техническая киберне- тика. 1989. № 6. 12. Григорьев Ф. Н., Кузнецов Н. А., Се- ребровский А. П. Управление наблюдениями в автоматических системах. М.: Наука, 1986. 13. Гурман В. И. Принцип расширения в задачах управления. М.: Наука, 1985. 14. Евстратов И. Ю., Кабанов С. А., Си- ротинкин В. В. Управление многомерным объ- ектом с помощью самоорганизующегося адап- тивного регулятора // Изв. АН. Теория и сис- темы управления. 1997. № 3. 15. Зверев А. И., Карлов В. И., Красиль- щиков М. Н. Определение оптимальной про- граммы измерений с использованием принци- па максимума // Изв. АН СССР. Техническая кибернетика. 1984. № 4. 16. Казаков И. Е., Гладков Д. И. Методы оптимизации стохастических систем. М.: Нау- ка, 1987. 17. Калман Р., Фалб П., Арбиб М. Очер- ки по математической теории систем. М.: Мир, 1971. 18. Кабанов С. А. Управление системами на прогнозирующих моделях. С.-Петербург: Изд. С.-Петербургского университета, 1997. 19. Колосов Г. Е. Синтез оптимальных автоматических систем при случайных возму- щениях. М.: Наука, 1984. 20. Красовский А. А. Адаптивный опти- мальный регулятор с переменным порядком наблюдателя и временем экстраполяции // Автоматика и телемеханика. 1994. № 11. 21. Красовский А. А. Алгоритм оценива- ния с ретроспективной моделью // Доклады АН СССР. 1984. Т. 275. № 3. 22. Красовский А. А. Алгоритмические основы оптимальных адаптивных регуляторов нового класса // Автоматика и телемеханика. 1995. № 9. 23. Красовский А. А. Аппроксимация функций многих аргументов в системах циф- рового моделирования // Изв. АН СССР. Тех- ническая кибернетика. 1983. № 3. 24. Красовский А. А., Ермилов А. С. Бое- вое применение и эффективность пилотажно- навигационных комплексов летательных аппа- ратов. М.: Изд. ВВИА им. Н. Е. Жуковского, 1989. 25. Красовский А. А. Метод быстрого численного интегрирования одного класса динамических систем // Изв. АН СССР. Тех- ническая кибернетика. 1989. № 1. 26. Красовский А. А. Неклассические це- левые функционалы и проблемы теории опти- мального управления (обзор) // Изв. АН СССР. Техническая кибернетика. 1992. № 1. 27. Красовский А. А. Непрерывные алго- ритмы и стохастическая динамика поиска экс- тремума // Автоматика и телемеханика. 1991. № 4. 28. Красовский А. А. Обобщение решения задачи оптимизации управления при неклас- сическом функционале // Доклады АН СССР. Т. 284. 1986. № 4. 29. Красовский А. А. Развитие концеп- ции, аналитическая теория, алгоритмическое обеспечение двухконтурного самоорганизую- щегося регулятора // Автоматика и телемеха- ника. 1999. № 5. 30. Красовский А. А. Развитие принципа минимума обобщенной работы // Автоматика и телемеханика. 1987. № 1. 31. Красовский А. А. Селекгивно- усреднительный метод решения многоэкстре- мальных задач // Автоматика и телемеханика. 1992. № 9. 32. Кротов В. Ф., Букреев В. 3., Гурман В. И. Новые методы вариационного исчисле- ния в динамике палета. М.: Машиностроение, 1969. 33. Крутько П. Д., Максимов А. И., Скворцов Л. М. Алгоритмы и программы про- ектирования автоматических систем. М.: Радио и связь, 1988. 34. Малышев В. В., Кибзун А. И. Анализ и синтез высокоточного управления летатель- ными аппаратами. М.: Машиностроение, 1987. 35. Малышев В. В., Красильщиков М. Н., Карлов В. И. Оптимизация наблюдения и управления летательных аппаратов. М.: Ма- шиностроение, 1989. 36. Математическая энциклопедия / Гл. ред. И. М. Виноградов. М.: Сов. энциклопе- дия, 1982. 37. Поляк Б. Т. Введение в оптимиза- цию. М.: Наука, 1983. 38. Понтрягин Л. С., Болтянский В. Г., Гамкрелидае Р. В., Мищенко Е. Ф. Математи- ческая теория оптимальных процессов. М.: Наука, 1969. 39. Пугачев В. С., Синицин И. Н. Сто- хастические дифференциальные системы. М.: Наука, 1985. 40. Растригин Л. А. Статистические мето- ды поиска. М.: Наука, 1968. 41. Ройтенберг Я. Н. Автоматическое управление. М.: Наука, 1978. 42. Системы: декомпозиция, оптимиза- ция и управление / Сост. М. Синах, А. Тигли, сокр. пер. с англ. А. В. Запорожца. М.: Маши- ностроение, 1986. 43. Соболев О. С. Развитие функций контроля и управления в АСУ непрерывными технологическими процессами // Автоматизи- рованные системы управления. М.: Информ- прибор. Сер. ТС-3. Вып. 2, 1990.
570 СПИСОК ЛИТЕРАТУРЫ 44. Справочки по теории автоматиче- ского управления / Под ред. А. А. Красовско- го. М.: Наука, 1987. 45. Стрейц В. Метод пространства со- стояний в теории дискретных линейных сис- тем управления. М.: Наука, 1985. 46. Сухарев А. Г., Тимохов А. В., Федо- ров В. В. Курс методов оптимизации. М.: Наука, 1986. 47. Топав Ю. И. Атлас для проектиро- вания систем автоматического регулирования. М.: Машиностроение, 1989. 48. Цыпкин Я. 3. Основы информацион- ной теории идентификации. М.: Наука, 1984. 49. Черноусый» Ф. Л. Оценивание фазо- вого состояния динамических систем. М.: Наука, 1988. 50. Шуп Т. Решение инженерных’ задач на ЭВМ. М.: Мир, 1982. 51. Эти Р. Наведение в космосе. М.: Машиностроение, 1966. 52. Ядыкни И. Б. Принципы построения, архитектура и программные средства автомати- зированных систем настройки промышленных регуляторов // Вычислительная техника, сис- темы управления / Под ред. И. В. Пранги- швили. Междунар. центр научной и техниче- ской информации. Москва - София. 1989. 53. Ядыкни И. Б., Шумский В. М., Овсе- ши Ф. А. Адаптивное управление непрерыв- ными технологическими процессами. М.: Энергоатомиздат, 1985. 54. Isermann R. Stand and Entwickung- stendenzen bei adaptiven Regelungen I I Automa- tiserangstechnische Praxis. 1987. No 4. 55. Meditch J. S. Stochastic optimal linear estimation and control. Me. Graw Hill. New York, 1969. 56. Sage A. P. and Mebe J. L. Estimation theory with application to communication and control. N - Y. Me. Graw НШ, 1972.
Раздел 7 УПРАВЛЕНИЕ ПРОЦЕССАМИ В ОРГАНИЗАЦИОННО-ТЕХНИЧЕСКИХ СИСТЕМАХ АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ ИСПОЛЬЗУЕМЫЕ СОКРАЩЕНИЯ: САПР - система автоматизированного проектирования; ОТС - организационно-техническая сис- тема; ТО - технический объект; КСАП - комплекс средств автоматизации проектирования; БД - база данных; БЗ - база знаний; ОПС - обслуживающая подсистема; ППС - проектирующая подсистема; ПМК - программно-методический ком- плекс; ПТК - программно-технический ком- плекс; АБД - автоматизированный банк данных; АБЗ - автоматизированная база знаний; СУБД - система управления базой дан-, ных; ОС - операционная система; ЛПР - лицо принимающее решение; ПР - проектное решение; ХПР - характеристики проектного реше- ния; КПР - конструктивные признаки; КПА - конструктивные параметры; ФПР - функциональные признаки; ФПА - функциональные параметры. Глава 7.1 ОСНОВНЫЕ ПОЛОЖЕНИЯ ОБЩЕЙ ТЕХНОЛОГИИ АВТОМАТИЗАЦИИ ПРОЕКТИРОВАНИЯ Создание ОТС типа САПР связано с ре- шением целого комплекса вопросов и в том числе вопросов управления процессами, про- текающими в этой системе. Они во многом инвариантны по отношению к прикладной ориентации САПР и определяют в совокупно- сти содержание общей технологии автоматиза- ции проектирования (технологии построения САПР). 7.1.1. СТРУКТУРНЫЕ И ФУНКЦИОНАЛЬНЫЕ СОСТАВЛЯЮЩИЕ САПР В зависимости от масштабности автома- тизируемого процесса проектирования разли- чают САПР обычного и более высокого уров- ня комплексности. Если существование САПР обычного уровня определяется возможностью классифицировать эту систему как ОТС, то существование комплексной системы автома- тизированного проектирования определяется наличием нескольких САПР обычного уровня, входящих в эту ОТС в качестве структурных составляющих. В общей технологии автомати- зации проектирования это положение получи- ло название принципа включения [4]. Любая САПР представляет собой взаимо- связанную совокупность комплекса средств автоматизации проектирования (КСАП) и коллектива специалистов проектной организа- ции. В состав КСАП входят методическое, математическое, лингвистическое, программ- ное, информационное, техническое и органи- зационное обеспечения. Допускается объеди- нение лингвистического и математического обеспечений с методическим обеспечением. Методическое обеспечение образуется до- кументами, в которых отражены состав и пра- вила эксплуатации всего комплекса средств автоматизации проектирования. В лингвисти- ческое обеспечение входят языки проектирова- ния, с помощью которых при автоматизиро- ванном проектировании происходит представ- ление и преобразование проектной информа- ции, и используемая терминология. Матема- тическое обеспечение включает в себя методы, математические модели и алгоритмы проекти- рования. В информационное обеспечение входят документы или файлы и блоки данных на магнитных носителях, содержащие сведения, необходимые для выполнения автоматизиро- ванного проектирования (например, описания типовых проектных решений, типовых эле- ментов, комплектующих изделий и др.). Кон- кретными видами этого обеспечения могут быть базы данных (БД) или базы знаний (БЗ). В зависимости от характера информации мож- но различать справочно-нормативные базы данных, базы проектных данных, именуемые также имитационной моделью (или просто
572 Глава 7.1. ОСНОВНЫЕ ПОЛОЖЕНИЯ ТЕХНОЛОГИИ АВТОМАТИЗАЦИИ ПРОЕКТИРОВАНИЯ моделью) объекта проектирования, базы зна- ний об объекте проектирования и базы знаний о процессе проектирования. Организационное обеспечение определяет административно-организационную структуру коллектива специалистов, работающих в рам- ках САПР, и регламентирует функции и сте- пень ответственности и взаимодействия этих специалистов между собой и с комплексом средств автоматизации проектирования. Про- граммное обеспечение включает в себя не только программы, представленные в виде текстов или записей на магнитных носителях, но и программную эксплуатационную документа- цию. Аналогично техническое обеспечение включает в себя не только электронно- вычислительную технику, но и дополнитель- ное оборудование, обеспечивающее работу этой техники. Каждое из обеспечений выполняет опре- деленную функцию реализации автоматизиро- ванного проектирования. Поэтому они рас- сматриваются обычно как функциональные со- ставляющие КСАП. Наряду с этим выделяются структурные составляющие КСАП, которые образуются комплексами компонентов обеспечения, необ- ходимых для автоматизации тех или иных задач общего процесса проектирования. Такая структурная декомпозиция КСАП соответству- ет выделению в рамках каждой САПР отдель- ных подсистем. По своим свойствам и функ-' циям подсистемы САПР являются самостоя- тельными системами. В связи с этим отдель- ные подсистемы или комплексы подсистем могут рассматриваться как структурные состав- ляющие САПР. Различают два вида подсистем САПР: проектирующие подсистемы (ППС) и обслужи- вающие подсистемы (ОПС). К проектирующим относят подсистемы, обеспечивающие выпол- нение основных проектных процедур (или их составляющих - проектных операций), т.е. тех проектных задач, решение которых заканчива- ется получением информации, необходимой и достаточной для рассмотрения и определения дальнейшего направления в реализации про- цесса проектирования. Обслуживающие под- системы предназначены для выполнения про- ектных задач, связанных с документированием проектной информации, поиском, хранением и визуальным анализом, а также с передачей информации из одной подсистемы в другую или из одной САПР в другую подобную сис- тему. В зависимости от отношения к объекту проектирования различают два вида проекти- рующих подсистем: объектно-ориентированные (объектные) и объектно-независимые (инвари- антные). Подсистемы первого вида обеспечи- вают решение проектных задач в процессах проектирования объектов определенного типа. Подсистемы второго вида не имеют подобных ограничений. В число инвариантных подсис- тем попадают, как правило, обслуживающие подсистемы. Помимо структурной декомпози- ции КСАП на комплексы компонентов обес- печений в практике автоматизации проектиро- вания принято также выделять типовые ком- плексы средств двух видов: программно- методические комплекты (ПМК) и программно- технические комплексы (ПТК). Отличием ПМК и ПТК от комплексов компонентов обеспече- ний является то, что они могут соответствовать не одной, а нескольким взаимосвязанным друг с другом подсистемам. Кроме того ПМК и ПТК включают в себя компоненты не всех, а только части обеспечений автоматизирован- ного проектирования. В состав ПМК входят компоненты методического (в том числе мате- матического и лингвистического), программ- ного, а при необходимости информационного обеспечений, необходимые для выполнения какой-либо унифицированной проектной процедуры или получения каких-либо закон- ченных проектных решений по объекту проек- тирования. Под унифицированной проектной процедурой понимается такая проектная задача, алгоритм решения которой не зависит от объ- екта проектирования или стадии проектирова- ния одного и того же объекта. В состав ПТК помимо компонентов указанных обеспечений входят также определенные компоненты тех- нического обеспечения. Примерами ПМК обслуживающих под- систем являются автоматизированный банк данных (АБД), автоматизированная база зна- ний (АБЗ), мониторная система САПР. АБД включает в себя компоненты методического, программного и информационного обеспече- ния. Информационное обеспечение АБД включает в себя базу данных справочно- нормативной или проектной информации. В программном отношении АБД структурно разделяется на схему базы данных (СБД) и систему управления базой данных (СУБД). Включенные в состав КСАП конкретной САПР они обеспечивают организацию хране- ния, ввода-вывода и передачи информации, с которой оперирует эта система. Мониторная система САПР служит для общего управления автоматизированным про- цессом проектирования. В ее состав входят различные информационно-поисковые систе- мы, предназначенные для работы не с проект- ной информацией, а с информацией о самом процессе автоматизированного проектирова- ния. Мониторная система и ей подобные программно-методические комплексы образу- ют операционную систему (ОС) автоматизиро- ванного проектирования. Она включает в себя операционную систему ЭВМ (в случае, если ОС
ВИДЫ ПРОЕКТИРОВАНИЯ И КОМПОНЕНТЫ КСАП 573 Ойеспечениег организационное методическое (О г. ч. лингвистическое, . математическое) программное £ техническое информационное Рис. 7.1.1. Формализованное представление САПР как ОТС ЭВМ обеспечивает выполнение всех требуемых для управления автоматизированным проекти- рованием функций), а также специально раз- работанные компоненты программного обес- печения (в случае, если ОС ЭВМ не обеспечи- вает выполнения всех требуемых фикций). Совокупность таких специально разрабатывае- мых компонентов именуется операционной системой САПР. Рассмотренные выше положения обоб- щены в виде иллюстрации (рис. 7.1.1), где отдельно выделены: организационная система, объединяющая коллектив специалистов, работающих в рамках САПР; программно-технический комплекс САПР; БД и БЗ, используемые в рамках всей системы или отдельных ее подсистем; комплексы компонентов обеспечений, относящиеся к отдельным проектирующим и обслуживающим подсистемам. На рис. 7.1.1 показано также смысловое содержание отдельных обеспечений автомати- зации проектирования. Структура КСАП, показанная на рис. 7.1.1, соответствует наличию в составе САПР собственного АБД, условно обозначен- ного ОПС 1, и подсистемы документирования проектной информации, обозначенной ОПС М. В связи с этим в число специалистов, взаимосвязанных с КСАП помимо специали- стов по проектированию (пользователей САПР), место которых в организационной системе обозначено поз. 3, входят оформители проектной документации и администратор базы данных (соответственно поз. 5 и 4). Кро- ме них в организационную систему входят также руководители проектных разработок, руководитель САПР и специалисты по экс- плуатации КСАП (соответственно поз. 7, 2 и 6). Руководители проектных разработок, кото- рых может быть несколько в рамках одной САПР, и руководитель САПР относятся к категории специалистов, именуемых обычно лицами, принимающими решение (ЛПР). 7.1.2. ВИДЫ ПРОЕКТИРОВАНИЯ И КОМПОНЕНТЫ КСАП В общей технологии построения САПР различают три вида проектирования: неавто- матизированное, автоматизированное и авто- матическое. Конкретный вид определяется тем, в какой степени человек и вычислитель- ная техника привлекаются к реализации ис- пользуемых алгоритмов проектной деятельно- сти. Сказанное относится не только к процес- су проектирования в целом, но и к отдельным его составляющим: частным процессам и зада- чам проектирования. В связи с этим в реаль- ном функционировании САПР имеют место различные комбинации видов проектирова- ния, относящиеся к различным подсистемам САПР. Переход от одного вида проектирова- ния к другому связан с изменением роли раз- личных компонентов КСАП в реализации процессов проектирования. Эго относится, в частности, к методическому, математическому и лингвистическому обеспечениям. Сущест- вующее положение в общей технологии по- строения САПР о допустимом объединении
574 Глава 7.1. ОСНОВНЫЕ ПОЛОЖЕНИЯ ТЕХНОЛОГИИ АВТОМАТИЗАЦИИ ПРОЕКТИРОВАНИЯ Алгоритм проектирования Алгоритм функционирования САПР Рис. 7.1.2. Взаимосвязь методического, математического и лингвистического обеспечений этих обеспечений неслучайно. Их использова- ние в реализации проектирования тесно свя- зано друг с другом и зависит от конкретного вида проектирования. Иллюстрацией этого является рис. 7.1.2, где выделены основные компоненты каждого из этих обеспечений. Как показано на рис. 7.1.2, принято раз- личать формализуемые и неформализуемые алгоритмы проектной деятельности. Формой представления первых из них являются соот- ветствующие компоненты проблемного мате- матического обеспечения (математические методы, модели, структуры данных и т.д.). Неформализуемые алгоритмы предполагают использование в процессе проектирования собственных знаний, производственного опыта и профессиональной интуиции самих специа- листов, осуществляющих проектирование. Однако если не сами алгоритмы, то их струк- туры допускают в данном случае определен- ную формализацию. Видом этой формализа- ции является эвристическое программирова- ние, т.е. разработка системы предписаний, с помощью которых человек, решающий задачу, рациональным путем получает и целесообраз- ным образом перерабатывает необходимую информацию. Представленные своими эври- стическими программами неформализуемые алгоритмы проектной деятельности образуют соответствующие компоненты методического обеспечения. Как показано на рис. 7.1.2, рассмотрен- ные компоненты КСАП образуют единое це- лое, именуемое в общей технологии построе- ния САПР алгоритмом проектирования. Со- вместно с терминологией проектной деятель- ности, являющейся одним из компонентов лингвистического обеспечения, алгоритм про- ектирования составляет методическую основу неавтоматизированного проектирования. Переход к автоматизированному проек- тированию связан с расширением этой мето- дической основы в части каждого из рассмат- риваемых обеспечений. Ведение проектирова- ния при непосредственном взаимодействии человека с ЭВМ обуславливает появление спе- циальных компонентов лингвистического обеспечения. Ими являются языки использо- вания САПР, именуемые также внешними языками САПР. Оперирование с проектной информацией, находящейся в ЭВМ, требует специальных компонентов математического обеспечения, именуемых иногда внутренними языками САПР. При этом качественное изме- нение самого характера проектной деятельно- сти обуславливает появление специальных инструкций по использованию КСАП пользо- вателями САПР. Как показано на рис. 7.1.2, расширение методического и математического обеспечений приводит к новой форме алго- ритмизации проектирования, получившей наименование алгоритма функционирования САПР. Между отдельными компонентами КСАП, представленными на рис. 7.1.2, суще- ствует тесная взаимосвязь. Так, ухудшение по своим лингвистическим свойствам языков использования САПР вызывает необходимость в более детальных инструкциях по использо- ванию КСАП. Необходимость этого возникает также при снижении уровня специального матобеспечения, предназначенного для реали- зации интерактивного решения проектных задач пользователями САПР.
ОПИСАНИЕ СТРУКТУРЫ И СХЕМЫ ФУНКЦИОНИРОВАНИЯ САПР 575 7.1.3. СОДЕРЖАНИЕ ПРОЦЕССА СОЗДАНИЯ САПР Принятая и в отечественной, и в зару- бежной практике общая технология автомати- зации проектирования достаточно полно оп- ределяет содержание процесса создания орга- низационно-технических систем типа САПР [4, 7]. В этом процессе выделяется несколько типовых работ, обязательное выполнение ко- торых в тех или иных комбинациях необходи- мо для осуществления отдельных стадий соз- дания САПР. Укрупненно они выглядят сле- дующим образом: описан ие объекта проектирования и процесса проектирования; разраб отка структуры и схемы функцио- нирования САПР; разраб отка и оценка альтернативных ва- риантов САПР; выбор рационального варианта САПР; разраб отка отдельных обеспечений авто- матизации проектирования в рамках выбран- ного варианта САПР; реализ ация проекта САПР; обеспечение использования и развития САПР. Определяя содержание работ на отдель- ных стадиях создания САПР, общая техноло- гия автоматизации проектирования не дает, однако, конкретной методологии их выполне- ния. Некоторые примеры такой методологии, затрагивающие вопросы управления проект- ными процессами, протекающими в САПР, рассмотрены ниже. Глава 7.2 СПОСОБЫ ОПИСАНИЯ АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ И ПРОЦЕССА ФУНКЦИОНИРОВАНИЯ САПР 7.2.1. ОПИСАНИЕ СТРУКТУРЫ И СХЕМЫ ФУНКЦИОНИРОВАНИЯ САПР Методической основой описания струк- туры и схемы функционирования САПР явля- ется технология структурного программирова- ния. Она позволяет ввести в выполнение дан- ной работы аппарат формализованного описа- ния принимаемых здесь решений, сделать выполнение этой работы управляемой и кон- тролируемой со стороны руководителя разра- ботки САПР. В разработке САПР используются два методических средства структурного програм- мирования, получившие наименование струк- турной диаграммы и диаграммы состояний. Оба они основаны на поэлементном анализе описываемых процессов. Структурная диа- грамма описывает декомпозицию сложных процессов (состояний системы) на более про- стые. Диаграмма состояний описывает взаимо- связь простых процессов в пределах более комплексного процесса, в который они входят. Эта взаимосвязь характеризует последователь- ность простых состояний, которые может принимать выполняемая системой работа. При использовании данных средств при- менительно к описанию структуры и схемы функционирования САПР узлы диаграмм со- ответствуют отдельным процессам, реализуе- мым соответствующими структурными компо- нентами САПР. Поэтому уровни детализации структурной диаграммы рассматриваются как уровни детализации САПР и 1Сак уровни дета- лизации самого процесса автоматизированного проектирования. Далее принимаем, что увели- чение уровня означает переход от общего к более детализированному рассмотрению всего процесса проектирования. Общее пояснение применения методических средств структур- ного программирования для описания струк- туры и схемы функционирования САПР пред- ставлено на рис. 7.2.1. В левой части рис. 7.2.1 показана структурная диаграмма, а в правой - диаграмма состояний. Обозначения структур- ных компонентов САПР соответствуют здесь Обозначениям, принятым на рис. 7.1.1. Компоненты 1-го уровня структурной детализации САПР соответствуют частным задачам проектирования, реализуемым отдель- ными подсистемами САПР. Компоненты 0-го уровня структурной детализации САПР соот- ветствуют достаточно масштабным процессам в рамках общего процесса проектирования ТО, выполнение которых связано с функциониро- ванием самостоятельных организационно- технических систем. При автоматизированном проектировании такие системы рассматрива- ются как САПР проектных работ или САПР минимальной структуры. Компонентом (0-1)-го уровня структурной детализации САПР является комплексная система, которая может быть классифицирована также как САПР проектной организации или САПР максимальной структуры. Структурная диа- грамма* (см. рис. 7.2.1) при желании может быть продолжена в направлении большей де- тализации процесса автоматизированного про- ектирования. Отдельные подсистемы разбива- ются на структурные компоненты, именуемые проектными операциями. Принятый подход к описанию структуры и схемы функционирования САПР позволяет рассматривать САПР как динамическую сис- тему со случайной структурой. В самом деле, применительно к структурной диаграмме (см. рис. 7.2.1) САПР1, САПР2, ..., САПРЬ явля- ются случайными структурами комплексной
576 Глава 7.2 СПОСОБЫ ОПИСАНИЯ АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ Уродень структурной детализации САПР (0-1) CAHPL ППСМ ППС1 ППСл\ 0ПС1 САПР1 САПР! Рис. 7.2.1. Структурная диаграмма и диаграмма состояний как средства описания структуры и схемы функционирования САПР CAPPL САПР1 САПР! 0ПС1\~*\0ПСМ О 1 САПР, реализуемыми в отдельные промежут- ки времени. Аналогично ППС1, ...» ОПСМ являются случайными структурами, которые в отдельные промежутки времени принимает структура САПР2. Особенностью рассмотрения САПР как динамической системы со случайной структу- рой является в данном случае многоуровне-. вость структурной детализации САПР. С этим связана вторая особенность - состояниями процесса автоматизированного проектирова- ния на Z-м уровне структурной детализации САПР являются частные структуры этого про- цесса (Z + 1)-го уровня детализации САПР. Такое положение может иметь место только в процессах, получивших наименование дис- кретной случайной последовательности [3]. Существенная дискретность (как в отно- шении аргумента, так и функции) выделяет процесс проектирования в особый вид случай- ных процессов, а САПР - в особый вид дина- мических систем случайной структуры. Для их исследования мало пригодна существующая теория систем случайной структуры, разрабо- танная в основном для непрерывных процес- сов. В связи с этим исследование функциони- рования САПР основывается на использова- нии более простых методических положений. Приемлемость ряда методических упрощений обоснована в данном случае тем, что в классе систем со случайной структурой САПР отно- сится к подклассу систем с сосредоточенными переходами. Это связано с тем, что в автома- тизированном процессе проектирования сме- ны состояний на каждом уровне детализации этого процесса носят функциональный харак- тер, т.е. происходят при достижении процес- сом некоторой границы. Учитывая целевую направленность функ- ционирования САПР в процессе автоматизи- рованного проектирования, можно считать конечным множеством как состояния различ- ных уровней детализации этого процесса, так и те входные и выходные воздействия, с кото- рыми связаны эти состояния. В этом случае функционирование САПР на всех уровнях ее структурной детализации интерпретируется конечным автоматом (КА) Fg), (7.2.1) где {6} - множество состояний КА; {2} - множество входных воздействий КА; {У} - множество выходных воздействий КА; Fy, Fg- функции, определяющие отображение: ^:{6}х{2}->{6}; (7.2.2) Fy : {6} х {2}->{У}. (7.2.3) Применительно к динамической системе со случайной структурой, какой является САПР, КА представляет собой элемент этой системы. Определенный набор таких элемен- тов, соответствующих отдельным состояниям реализуемого процесса, образуют систему в целом. Функции (7.2.2), (7.2.3) являются форма- лизованным представлением алгоритма функ- ционирования САПР в отдельных состояниях автоматизированного проектирования. Моде- лирование или анализ этого функционирова- ния во времени t описывается при этом зави- симостями Gl + l = F/Zt,Gty, (7.2.4) У, = Fy(Zt, Gj). (7.2.5)
ОПИСАНИЕ ПРОЦЕССА ПРОЕКТИРОВАНИЯ ТО 577 Конкретный вид этих зависимостей оп- ределяется содержанием реализуемого в рам- ках САПР процесса проектирования. 7.2.2. ОПИСАНИЕ ПРОЦЕССА ПРОЕКТИРОВАНИЯ ТО Процесс проектирования любого ТО мо- жет рассматриваться как решение общей зада- чи проектирования, связанной с отысканием дсо = arg max W(x), и(х) / S’/х) £ О, г = 1, ...» т, х е X (7.2.6) или Хо е X, и(х) / W(x) £ 0, 5/х) £ О, r= 1, ...» ш, (7.2.7) где W(x) - глобальный критерий оценки ТО (в частном случае критерий оптимальности ТО); X - множество характеристик проектного ре- шения (ХПР); х - вектор ХПР, соответствую- щий конкретному ПР; п(х) - проектные ха- рактеристики ТО; S/x) - функции проектных ограничений, которым должно соответствовать разрабатываемое ПР; т - число проектных ограничений. В состав ХПР входят: конструктивные признаки (КПР); конструктивные параметры (КПА); функциональные признаки (ФПР); функциональные параметры (ФПА). Задание значений КПР, ФПР и ФПА определяет в совокупности тип ПР, а задание КПА - конкретное ПР в пределах заданного типа ПР. По своему смыслу выражения (7.2.6), (7.2.7) являются математическими формули- ровками задач соответственно оптимального проектирования и проектирования по ограни- чениям. Они применимы к описанию процес- са проектирования любого технического объ- екта (ТО), но не отражают тех особенностей этого процесса, которые имеют место в проек- тировании ТО высокой степени сложности. Каждый из таких ТО представляет собой совокупность большого числа элементов, ко- торые в процессе проектной разработки ТО могут выступать в качестве самостоятельных объектов проектирования. Формализованным представлением сложного ТО является граф, в промежуточных вершинах (узлах) которого находятся элементы к-го уровня детализации ТО. Корневая вершина соответствует ТО в целом, т.е. элементу нулевого уровня детали- зации (к = 0). В промежуточных вершинах (к > 0) находятся сложные, а в висячих вер- шинах (к = п) - простые элементы ТО. Здесь п - предельная степень детализации ТО при проектировании. Проектируемый технический 19 Зак 1023 объект сам может являться элементом более ком- плексного объекта, который будем именовать комплексной технической системой и обозначать как элемент (0 - 1)-го уровня детализации ТО. В авиационной практике, например, где в качестве проектируемых ТО выступают от- дельные летательные аппараты конкретного назначения (транспортного, боевого, инфор- мационного и др.), элементами (0 - 1)-го уровня детализации ТО являются соответст- вующие системы (транспортная, боевая, ин- формационная и др.). Помимо некоторого числа самих летательных аппаратов эта систе- ма включает в себя, как правило, технические объекты и других типов. К ним относятся различные средства наземного обслуживания, наземные или воздушные средства наведения и управления и др. Систематизация процессов проектной разработки элементов ТО в рамках общего процесса проектирования является основой различных описаний проектирования сложных ТО. Большинство из них относится к катего- рии системного макроописания проектирова- ния. Макромодель процесса проектирования ТО представляется здесь как упорядоченная совокупность процессов проектирования от- дельных элементов ТО. Общая структура макро- модели представляет собой граф, который подо- бен конструктивному графу ТО, но содержит в своих узлах не элементы ТО, а процессы их про- ектирования. Эти процессы могут быть детализи- рованы до отдельных частных задач. Описание проектирования в рамках самих частных задач относится уже к описанию проектирования на микроуровне этого процесса. Различается несколько вариантов сис- темного макроописания проектирования. Один из них, получивший в работе [5] наиме- нование "блочно-иерархическая модель проек- тирования", предполагает отсутствие обратных связей между частными процессами проекти- рования элементов различного уровня детали- зации ТО. Это допущение является одним из положений принятого в ряде работ метода декомпозиции общей задачи оптимального проектирования. Дополненное положениями об агрегировании характеристик проектного решения и реализации общей задачи опти- мального проектирования ТО как процесса последовательной оптимизации это допущение приводит к следующей математической фор- мулировке общей задачи оптимального проек- тирования ТО: (/.2.0} “*(х*)/5*(х*)20> г = 1.....тк, хк еХк^Х,
578 Глава 7.2 СПОСОБЫ ОПИСАНИЯ АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ ще т - число ограничений в проектировании элементов к-т уровня детализации ТО; - функция, обратная функции агрегирования ХПР, Xjt - 1 = fk - Хк - множество ХПР всех элементов Л-го уровня детализации ТО; Qk - векторный критерий оптимальности ПР на fc-м уровне детализации ТО; П - мкожеспо векторов, для которых q(x) е H(Q), ще II(Q) - множество оптимальных по Парето векторов q е Q . Индекс к обозначает здесь уровень про- цесса проектирования, соответствующий уров- ню структурной детализации ТО как объекта проектирования (0 £ £ £ л). Выражение типа (7.2.8) получило наименование уравнения внутреннего проектирования [2]. Необходимость учета конкретных осо- бенностей реализации процессов проектирова- ния сложных ТО обусловила появление еще одного описания проектирования - системно- организационного макроописания [1]. Его главным отличием от системного макроописа- ния является учет ряда особенностей органи- зации проектирования ТО, характеризующих реализацию этого процесса на практике. Это относится в первую очередь к итерационное™ проектирования и наличию в процессах про- ектирования сложных ТО нескольких органи- зационных стадий: разработка технического задания (ТЗ), аванпроекгирование (АП), эс- кизное проектирование (ЭП), техническое проектирование (ТП). Как показано на рис. 7.2.2, процесс про- ектирования каждого элемента ТО разбивается на два отдельных этапа. Их содержанием явля- ется: этап 1 - формирование облика элемента ТО; этап 2 - уточненная проверка выполни- мости проектных требований к элементу ТО и формирование исходной информации (ИИ) к элементам более высокого уровня детализации ТО. Этап 2 имеет место только в процессах проектирования сложных элементов ТО (т.е. при к < л) и реализуется одновременно с про- ектированием элементов более высокого уров- ня детализации. Решение частных проектных задач происходит здесь с большей достоверно- стью, чем на этапе 1, что обеспечивается, в частности, использованием текущих результа- тов проектирования элементов более высокого уровня детализации ТО. Поэтому на этапе 2 весьма велика вероятность того, что ПР, сформированные ранее на этапе 1 с учетом требований, вытекающих из задания на разра- ботку ПР, будут оценены здесь как неудовле- творительные. На практике это приводит к появлению проектных итераций поиска новых ПР. Как показано на рис. 7.2.2, каждый ите- рационный цикл поиска новых ПР охватывает этап 2 процесса проектирования элемента 0-го уровня детализации ТО на глубину, соответст- вующую проектированию элементов ТО более У ревень проектирования (вровень структурной оетали-^--------------- зации Гур*-------------1 1 1 1 Комплексная техническая система /этап 2 Стадии проектирования Рас. 7.2.2. Общая структура сястемно-оргашвацяонного макроопясаняя проектярованяя сложных ТО: сплошные стрелки - передача проектных данных; штриховые - указание о пересмотре ИИ или поиске новых ПР
ОПИСАНИЕ ПРОЦЕССА ПРОЕКТИРОВАНИЯ ТО 579 высокой степени детализации. Число итераций pl/o), совершаемых в итерационном цикле проектирования элемента 0-го уровня детали- зации с охватом процессов проектирования элементов /-го уровня детализации ТО, являет- ся одним из количественных показателей про- цесса проектирования. Другим показателем является число итераций т^, совершаемых в циклах обеспечения сходимости процессов проектирования отдельных элементов ТО. Наличие этих циклов обусловлено тем, что в процессе выполнения этапов 2 происходит получение информации, необходимой для формулирования требований к элементам бо- лее высокого уровня детализации ТО. Эта ин- формация уточняется по мере проектирования всей совокупности элементов, что приводит к уточнению также и требований к ним, содер- жащихся в исходных данных. Итерации про- должаются до тех пор, пока различие предва- рительной исходной информации и уточнен- ной не становится меньше некоторой допус- тимой величины. Проектирование характеризуется также числом ПР, прорабатываемых по каждому элементу ТО. Применительно к проектирова- нию элементов £-го уровня детализации ТО число ПР определяется двумя величинами: числом вариантов ПР по элементу (к - 1)-го уровня, принятых для дальнейшей проработки, и числом ПР /£ по элементу кг-то уровня, прорабатываемых применительно к каждому из этих вариантов. Еще одним по- казателем проектирования является число ПР 1g по элементу g-ro уровня детализации, формируемых агрегированием ПР по элемен- там к-ю уровня детализации. Системно-организационное макроописа- ние проектирования устанавливает соответст- вие между уровнями детализации ТО й про- цессе проектирования и организационными стадиями этого процесса. Как показано на рис. 7.2.2, стадия ТЗ охватывает проектные процессы, относящиеся к (0 - 1) и 0-му уровням детализации ТО, стадия аванпроектирования - проектные процессы, относящиеся к (0 - 1), 0 и 1-му уровням детализации ТО. Продолжая рассмотрение этого соответствия (на рис. 7.2.2 оно не показано), можно связать стадию эс- кизного проектирования с процессами про- ектной разработки элементов ТО до 3-го уров- ня детализации ТО, а стадию технического проектирования - с процессами проектной разработки элементов ТО до 4-го уровня дета- лизации ТО. В каждом из этих случаев про- цессы проектной разработки отдельных эле- ментов ТО включают в себя только те этапы, которые охватываются соответствующим ите- рационным циклом поиска новых ПР по эле- менту 0-го уровня детализации ТО. Выполне- ние каждого этапа включает в себя одну или несколько проектных работ, каждая из кото- рых обеспечивается самостоятельной структур- ной единицей в рамках общей организацион- ной системы участников проектирования. Эго относится, в частности, и к автоматизирован- ному процессу проектирования, в котором самостоятельные проектные работы обеспечи- ваются отдельными САПР, обозначенными выше как САПР проектных работ или САПР минимальной структуры. Уровни структурной детализации процес- са проектирования, принятые в системно- организационном макроописании этого про- цесса, и уровни структурной детализации ав- томатизированного процесса проектирования, принятые в описании структуры и схемы функционирования САПР, не являются ана- логией друг другу. Понижение уровня проек- тирования означает переход от одних проект- ных процессов к другим. А понижение уровня автоматизированного проектирования (уровня структурной детализации САПР) означает пе- реход от детального к более общему рассмот- рению процесса проектирования ТО в целом. Системно-организационное макроописа- ние проектирования позволяет дать более раз- вернутую, чем (7.2.6), (7.2.7), и отличную от (7.2.8) математическую формулировку общей задачи проектирования. Наиболее типичными являются два случая такой формулировки. Случай 1. Процесс проектирования носит в целом характер решения задачи оптималь- ного проектирования методом декомпозиции и на каждом уровне проектирования включает в себя определение ПР, оптимальных по кри- териям низших по детализации ТО уровней проектирования. Решение задачи проектиро- вания состоит в данном случае в определении (х)0 = argmax»'0_1(x)> ^ = (*0.*1...*кУ хк eII(Xk,Qk)' uk(*)/S*(x)^-, xi,k - г 0; Рк(Хк), *.;* <=*к, (7.2.9) где г = 1, ...» т (т - число ограничений в про- ектировании элементов к-го уровня детализа- ции ТО); к = 0, ..., п (п - предельный уровень детализации ТО в процессе проектирования); i = 1, ..., / (/ число элементов к-то уровня детализации ТО, выступающих в качестве са- 19’
580 Глава 7.2. СПОСОБЫ ОПИСАНИЯ АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ мостоятельных объектов проектирования); Qi, к (xi, к) - критерий оптимальности в про- цессе проектирования /-го элемента к-го уров- ня детализации ТО; (J4) - предикат ХПР, выражающий ограничения, накладываемые на ПР к-то уровня детализации ТО со стороны ПР (к - 1)-го уровня. Случай 2. Процесс проектирования носит в целом характер проектирования по ограни- чениям и на каждом уровне проектирования включает в себя определение таких ПР, кото- рые удовлетворяют ограничениям более низ- ких по степени детализации ТО уровней про- ектирования. При этом не исключается субоп- тимизация отдельных ПР в рамках частных процессов проектирования. Математическая формулировка общей задачи проектирования может быть представлена в этом случае как определение (х)о еХ, х = (хо,Х1,...,х*)/ЖО-1(х) £0; <«/,*= arg max 9/л(хм), xi,k e%i,k к- (7.2.10). При отсутствии субоптимизации в част- ных процессах проектирования последние выражения в составе математических форму- лировок (7.2.9), (7.2.10) упрощаются и прини- мают вид xi,k G^i,k> ui,k(xi,k)/Sr'k (xi,k) * °, Pk(Xk), Xtkc:Xk. (7.2.11) Рассмотренные случаи математической формулировки общей задачи проектирования ТО в рамках системно-организационного мак- роописания этого процесса являются не взаи- моисключающими, а взаимодополняющими друг друга. В процессах проектирования слож- ных ТО случай 1 наиболее типичен для стадий разработки ТЗ и аванпроекгирования, т.е. при л = 0 и 1, а случай 2 - для стадий эскизного и технического проектирования, т.е. при п = 2 и 3. По своему смыслу выражения (7.2.9), (7.2.10) идентичны выражению (7.2.8), т.е. также относятся к уравнениям внутреннего проектирования. Они также являются фраг- ментом математического описания процесса проектирования ТО, но соответствуют модели- рованию этого процесса не системным, а сис- темно-организационным макроописанием проектирования. 7.2.3. ТИПОВЫЕ ФУНКЦИОНАЛЬНЫЕ СОСТАВЛЯЮЩИЕ В АЛГОРИТМЕ ФУНКЦИОНИРОВАНИЯ САПР Помимо струк1урной декомпозиции процесса проектирования ТО на частные про- цессы, соответствующие разработке отдельных элементов ТО, в проектировании ТО выделя- ются также типовые функциональные состав- ляющие. Они охватывают процессы, относя- щиеся к различным уровням проектирования по структурной детализации ТО, но характери- зующиеся идентичностью их формулировки в рамках алгоритма функционирования САПР. Так, в качестве типовой функциональной составляющей для состояний 0-го уровня структурной детализации САПР выделяется процесс разработки ПР, который имеет место в проектировании элементов и 0-го, и 1-го, и последующих уровней детализации ТО. При рассмотрении 1-го уровня структурной детали- зации САПР процесс разработки ПР распада- ется на ряд типовых составляющих, обеспечи- вающих решение частных проектных задач, а именно задач синтеза ПР, анализа ПР и расче- та параметров. В рассмотренной выше матема- тической формулировке общей задачи проек- тирования этим частным задачам соответству- ют следующие функциональные операторы: синтез ПР - х,.* е Xtk с Хк,Рк(Хк); анализ ПР - ul k(xl k); ик(х); W0_x(x); расчет параметров - xi,k = arg max qt,k(xhk)/sl k(xl k) k 0; xl,k e ^l,kl(xl.k ) °- В зависимости от своего прикладного ха- рактера задача расчета параметров составляет большую или меньшую часть проектных работ соответствующего этапа проектирования. В некоторых случаях расчет параметров может составлять основное содержание процесса раз- работки ПР отдельного этапа проектирования. Наряду с этими функциональными со- ставляющими в процессе проектирования ТО можно выделить и ряд типовых управлений. Их перечень с указанием уровней структурной детализации САПР, к которым они относятся приведен в табл. 7.2.1. Там же указана форма, в которой различные виды управления бывают обычно представлены в алгоритме функциони- рования САПР. Управление разработкой ПР связано с организацией процессов формирования аль- тернативных вариантов ПР и выбора из их числа вариантов ПР, удовлетворяющих опре- деленным условиям и ограничениям. Приме- ром такого выбора является отбор вариантов ПР, оптимальных по Парето, или нахождение
ТИПОВЫЕ ФУНКЦИОНАЛЬНЫЕ СОСТАВЛЯЮЩИЕ 581 7.2.1. Типовые вады управлений реализуемые в САПР Типовые виды управления Уровень структурной детализации САПР Форма представления управлений в алгоритме функционирования САПР Управление проектированием (0-1) Методическое обеспечение Управление разработкой ПР (0-1) Методическое обеспечение 0 Математическое обеспечение Управление поиском решения в расчетных процессах 0 Методическое обеспечение 1 Методическое и математическое обес- печения Управление интерактивным взаимодействием пользовате- ля САПР с ЭВМ 2 Математическое обеспечение одного оптимального варианта на множестве вариантов уже сформированных ранее. В рас- смотренной выше математической формули- ровке общей задачи проектирования этому ваду управления соответствуют функциональ- ные операторы: Wo = argmax^o-iOO. * = x* еЛ(ХъО*)/^*(х)^0; Wo eX, x = (xo,x1,...x*)/JFo_1(x)sO. Рассматриваемый вид управления имеет место в рамках частных процессов, реализуе- мых отдельными САПР проектных работ, или в рамках всего процесса проектирования ТО, реализуемого комплексной САПР. В первом случае управление происходит в одном из состояний автоматизированного проектирова- ния 0-го уровня структурной детализации САПР. Как правило, оно реализуется с помог щью формализованных алгоритмов проектной деятельности, входящих в математическое обеспечение автоматизации проектирования. Во втором случае, соответствующем более масштабным проектным процессам, управле- ние происходит в одном из состояний (0 - 1)-го уровня структурной детализации САПР. Такое состояние обычно соответствует специальной ОТС, ориентированной на управление проект- ными разработками (ОТС УПР). В рамках комплексной САПР эта ОТС может рассмат- риваться как САПР УПР. САПР УПР обеспечивает также управле- ние проектированием. Основным назначением этого вида управления является обеспечение необходимого (или максимального) качества проектирования ТО при минимальных (или допустимых) затратах времени, трудовых и технических ресурсов на его реализацию. Управление проектированием во многом по- добно управлению разработкой ПР и может быть представлено функциональными опера- торами, раскрывающими смысл функций (7.2.2), (7.2.3) в описании данного состояния автоматизированного проектирования. Прин- ципиальным отличием является то, что в слу- чае управления разработкой ПР входными и выходными воздействиями КА являются соот- ветственно задания на проектирование и ре- зультаты разработки ПР, а в случае управления проектированием - данные о текущем состоя- нии процесса проектирования ТО и решения о дальнейшем продолжении этого процесса. Управление поиском решения в расчет- ных процессах является особым видом управ- лений, реализуемых в САПР. В зависимости от масштабности этих процессов следует раз- личать реализацию управлений на 0-м и 1-м уровне структурной детализации САПР. Управление поиском решений в расчетных процессах 1-го уровня структурной детализа- ции САПР имеет место в тех случаях, котда задача расчета параметров локализована рам- ками отдельной подсистемы САПР, т.е. проте- кает в рамках единого программно-методичес- кого комплекса. Для расчетных процессов 0-го уровня структурной детализации САПР реше- ние такой задачи характеризуется использова- нием нескольких подсистем, имеющих раз- дельные ПМК, а порою и раздельные ПТК. Если в первом случае типичной формой пре- доставления управлений в алгоритме функ- ционирования САПР является математическое обеспечение, то во втором - методическое обеспечение автоматизации проектирования.
582 Глава 7.3. УПРАВЛЕНИЕ ПРОЕКТИРОВАНИЕМ В КОМПЛЕКСНОЙ САПР Глава 7.3 УПРАВЛЕНИЕ ПРОЕКТИРОВАНИЕМ В КОМПЛЕКСНОЙ САПР Управление проектированием является одним из видов управления, реализуемых в САПР (см. табл. 7.2.1). В рамках комплексной САПР оно обеспечивается действиями коллек- тива ЛПР, объединяющего в себе руководите- лей проектных разработок (см. рис. 7.1.1), и основывается на использовании этими ЛПР неформализуемых алгоритмов проектной дея- тельности. Объективный характер управляю- щих решений, принимаемых ЛПР, обусловлен тем, что помимо личного опыта и интуиции в принятий этих решений используется также комплекс знаний по организации процесса проектирования в САПР. Создание САПР предполагает разработку и этого комплекса знаний как составной части неформализуемых алгоритмов проектной деятельности, входящих в методическое обеспечение автоматизации проектирования (см. рис. 7.1.2). Примером таких знаний являются мате- риалы, приведенные ниже. Они относятся к автоматизированному проектированию ТО очень высокой степени сложности, а именно летательных аппаратов различного Назначения. 7.3.1. ОСНОВНЫЕ ЗАВИСИМОСТИ ОРГАНИЗАЦИИ ПРОЦЕССА ПРОЕКТИРОВАНИЯ ТО Рассмотренное выше (см. п. 7.2.2) сис- темно-организационное макроописание про- ектирования позволяет получить ряд зависи- мостей, удобных для количественной оценки факторов, характеризующих задачу управления проектированием, как она сформулирована выше. Такими факторами являются качество проектирования и затраты на реализацию этого процесса. Эти зависимости связывают в достаточно простой форме основные характе- ристики й показатели процесса проектирова- ния, предусмотренные системно-организаци- онным макроописанием. Если оперировать осредненными значе- ниями показателей, которые они имеют на всем протяжении процесса проектирования конкретного ТО, то общее число проектных решений по элементу к-то уровня детализации ТО, проработанных на момент, котда само- стоятельными объектами проектирования яв- ляются элементы л-го уровня детализации (где £ £ л), можно выразить зависимостью (7.3.1) а общее время, затрачиваемое на получение этого числа ПР, - зависимостью Аналогично, общее число проектных ре- шений по элементу g-ro уровня детализации ТО, полученных на основе агрегирования про- ектных решений по элементам £-го уровня детализации на момент, когда самостоятельными объектами проектирования становятся элементы л-го уровня детализации (ще g < £ £ л), можно выразить зависимостью (7.3.3) а общее время, затрачиваемое на получение этого числа ПР, - зависимостью (7.3.4) В этих зависимостях наряду с использо- ванными выше приняты следующие обозначе- ния; - интенсивность проектной прора- ботки в процессах проектирования элементов £-го уровня детализации ТО; Ig - интенсив- ность проектной проработки в процессах про- ектирования £-го уровня детализации и агре- гирования получаемых ПР в ПР по элементам g-ro уровня детализации ТО; Ар - статистиче- ский коэффициент, характеризующий интен- сивность выбора решений в операциях, свя- занных с агрегированием ПР. Зависимости (7.3.1) - (7.3.4) получили наименование уравнений организации процес- са проектирования. Комплексный анализ статистических данных по масштабным процессам проектиро- вания позволяет считать, что входящие в (7.3.1) - (7.3.4) показатели зависят определен- ным образом от сложности проектируемого ТО. Некоторые результаты такого анализа представлены в табл. 7.3.1, ще указаны сред-
СОДЕРЖАНИЕ ТРЕБОВАНИЙ К КАЧЕСТВУ ПРОЕКТИРОВАНИЯ 583 7.3.1. Результат! анализа статистических данных* Уровень проектирования, к Lk тк Самолеты специального назначения 0 1 25 - 50 0 - 1 1 5 0 5 - 20 2 1 4 3 0 3 1 3 3 0 Транспортные самолеты 0 1 8 0 - 1 2 3 0 5 - 20 2 2 4 2 1 3 1 3 2 0 ♦ Принятые обозначения см. формулу (7.3.1). ние значения или типичные диапазоны значе- ний отдельных показателей, соответствующие проектированию летательных аппаратов двух типов (транспортным самолетам и самолетам специального назначения) на разных уровнях этого процесса. В качестве таких уровней в системно-организационном макроописании проектирования приняты уровни структурной детализации ТО. Среди основных различий показателей процесса проектирования, соответствующих рассмотренным в табл. 7.3.1 вариантам ТО, следует отметить следующие: 1. Проектирование более сложных по своей структуре ТО, какими являются в дан- ном случае самолеты специального назначе- ния, характеризуется, большей итерационно- сгью, связанной с обеспечением сходимости процесса проектирования. Это выражается в больших величинах тк. 2. Проектирование более сложных ТО характеризуется также более объемными про- ектными исследованиями на верхних уровнях проектирования (к = 0 и 1), что выражается в больших величинах /Ц и //. 3. В проектировании более сложных ТО в большей степени используется метод после- довательной оптимизации, что выражается большими величинами /Ц и наличием самого диапазона этих величин. 4. Отсутствие в проектировании более сложных ТО итераций поиска новых ПР при переходе к достаточно подробной проектной проработке ТО (т.е. Л/q = 0) указывает на то, что основной объем работ, соответствующих начальным уровням проектирования, выпол- .няется здесь на стадии разработки аванпроек- та. 7.3.2. СОДЕРЖАНИЕ ТРЕБОВАНИЙ К КАЧЕСТВУ ПРОЕКТИРОВАНИЯ Являясь достаточно комплексной харак- теристикой, качество проектирования опреде- ляется двумя составляющими - качеством про- ектной информации и качеством результатов проектирования. Последняя из них в значи- тельной степени зависит от управления проек- тированием и оценивается такими общими показателями как завершенность (или опти- мальность) и достоверность результатов про- ектирования. Они могут быть выражены через основные компоненты математической форму- лировки общей задачи оптимального проекти- рования. Как показано на рис. 7.3.1, решение за- дачи, описываемой математическими форму- лировками (7.2.9) и (7.2.10), связано с отыска- нием вектора (х)о, обеспечивающего экстре- мальные или допустимые значения определен- ных функций м/х), ще х = (xq, хк) и j = = (0 - 1), ...» к, к - уровень детализации ТО. Примером компонентов вектора м/х) являют- ся функции S? (х), выступающие в форму- лировках (7.2.9), (7.2.10) как ограничения, относящиеся к проектированию элементов
584 Глава 7.3. УПРАВЛЕНИЕ ПРОЕКТИРОВАНИЕМ В КОМПЛЕКСНОЙ САПР Рис. 7.3.1. Иллюстрация "механизма" качества результатов проектирования: сплошные линии - для мФ(х); штриховые - для и* (х) fc-го уровня детализации ТО. Такой характери- стикой является и глобальный критерий опти- мизации Ир _ i(x), выступающий в качестве целевой функции в математической формули- ровке (7.2.9) и в качестве ограничения в фор- мулировке (7.2.10). Будем рассматривать два вида одних и тех же функций иДх) - методические функции иу(х), представленные соответствующими моделями в алгоритме проектирования, и фак- тические функции ^(х), реально сущест- вующие на практике. В качестве последних могут выступать и методические функции, обладающие очень высокой адекватностью моделирования характеристик объекта проек- тирования. Методические функции, не обла- дающие такой адекватностью, характеризуются некоторой предельной погрешностью ДИу, которая оценивает наибольшую разность меж- ду отдельными составляющими и* (х) и Wj’(x) в области изменения вектора ХПР, представляющей практический интерес. Являясь многоуровневым, развивающим- ся во времени процессом, проектирование сложных ТО начинается с использования от- носительно простых методов проектирования, обладающих малой адекватностью моделиро- вания функций м/х) и заканчивается исполь- зованием методов, обладающих высокой сте- пенью такой адекватности. Использование этих методов при определении вектора ХПР дает истинное значение решения общей задачи оптимального проектирования (x)qct , соот- ветствующее на рис. 7.3.1 точкам Д' и Д'. На начальных стадиях проектирования практически реализуемым решением рассмат- риваемой задачи является вектор (х)”ач. Со- ответствующее точкам А * и А”, это решение, как правило, не совпадает с теоретически дос- тижимым на данных стадиях (точки В' и В"),
УЧЕТ ТРЕБОВАНИЙ К ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ПРОЕКТИРОВАНИЯ 585 т.е. с решением, которое может быть получено при 100 %-ном использовании всех возможно- стей поиска новых ПР. Несовпадение, харак- теризующее завершенность результатов проек- тирования, оценивается величинами отклоне- ний (&с)3 и (8му)3. Само же теоретически дос- тижимое решение не совпадает, как правило, на начальных стадиях проектирования с ис- тинным. Причиной этого является малая адек- ватность моделирования функций W/(x). Такое несовпадение, характеризующее достоверность результатов проектирования, оценивается ве- личинами отклонений (Ъх)о и (Si/До- Их ве- личина определяется на практике относитель- ной предельной погрешностью _ ди/ fsi/Л ДЦ/=—- = тах—-. (7.3.5) J и) I "7) Переход к последующим стадиям проек- тирования сопровождается корректировкой решения задачи в направлении его истинного значения. Это происходит прежде всего вслед- ствие уточнения тех компонентов вектора х, которые не определяются на начальных стади- ях проектирования, а лишь неявно присутст- вуют в решении задачи, полученном с исполь- зованием проектных методов, основанных на осредненных статистических данных и опыте предыдущих разработок аналогичных ТО. Другая причина уточнения решения задачи связана с продолжением поиска новых ПР по ТО в целом, что позволяет приблизить реше- ние задачи к его теоретически достижимому значению. Конечной точкой этого процесса является вектор (x)q°H * Однако это решение не может полностью совпасть с истинным решением задачи, так как при переходе к ста- диям проектирования, использующим более точные проектные методы, поиск новых ПР по ТО в целом постепенно прекращается. Это наглядно иллюстрируется данными о величи- нах Mq , приведенными в табл. 7.3.1. В связи с этим можно говорить о кор- ректируемой и остаточной составляющих в общем отклонении решения рассматриваемой задачи на начальных стадиях проектирования от его истинного значения - (8х)кор, (8#j)KOp, (бх)^, (8Цу)осг* Геометрическая интерпрета- ция этих показателей представлена на рис. 7.3.1. Исходя из математического смысла пока- зателей качества результатов проектирования, основная цель управления проектированием, рассматривается далее как минимизация (или обеспечение допустимой величины) остаточ- ных отклонений в решении общей задачи оп- тимального проектирования: (8х)ост — (5х)з + (5х)/) - (8x)KOpj (8«/)ОСТ (8«;)з + (Suj)D “ (5w;)kop- (7.3.6) Две первые составляющие в этих выра- жениях характеризуют начальные стадии про- ектирования ТО, где поиск новых ПР охваты- вает проектную разработку элементов ТО от 0 до к-го уровня детализации. Последняя со- ставляющая характеризует завершающие ста- дии проектирования, где поиск новых ПР происходит только в рамках частных процес- сов проектирования элементов к-го уровня детализации ТО. Как следует из статистиче- ских данных по величине Mq (см. табл. 7.3.1), принятое здесь понятие начальных и завершающих стадий проектирования связано определенным образом с видом проектируе- мого ТО. Для более сложных ТО начальные стадии проектирования ограничиваются меньшими уровнями проектирования (т.е. меньшими уровнями структурной детализации ТО). В рамках начальных стадий проектиро- вания возможными направлениями обеспече- ния требуемого качества результатов всего процесса проектирования ТО являются: 1) уменьшение отклонений (5х)/>, путем повышения достоверности результатов начальных стадий проектирования; 2) уменьшение отклонений (8х)3, (buj)3 благодаря повышению степени завершенности результатов проектирования, получаемых на начальных стадиях проектирования ТО. Реализация первого направления связана с привлечением методов проектирования, ха- рактеризующихся меньшими предельными погрешностями Дйу. Реализация второго зависит от* эффективности методов поиска решений в процессах разработки ПР по от- дельным элементам ТО, а также от производи- тельности этих методов, т.е. возможности пе- ребора большего числа альтернативных вари- антов ПР в рамках выделенных для этой про- цедуры производственных ресурсов. 7.3.3. УЧЕТ ТРЕБОВАНИЙ К ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ПРОЕКТИРОВАНИЯ Рассматривая вопрос о достоверности ре- зультатов проектирования применительно к отдельной проектной задаче, этапу проектных работ или целой стадии проектирования, ис- пользуемые при их выполнении проектные алгоритмы в общем случае представляют как
586 Глава 7.3. УПРАВЛЕНИЕ ПРОЕКТИРОВАНИЕМ В КОМПЛЕКСНОЙ САПР F: ..., dn, dn + ь dm) -► (rb rp) d (*зад> ^зад> Ин.у.)> r С*6пр> wonp)> (73.7) где F - оператор преобразования вектора ис- ходных данных d в вектор результатов проек- тирования г; Хзад, «зад - ХПР по объекту про- ектирования и характеристики объекта проек- тирования, заданные в составе исходных дан- ных; %опр> иопр - ХПР по объекту проектиро- вания и характеристики объекта проектирова- ния, определяемые в процессе проектирова- ния; Хну., ^н.у. - ХПР по объекту проектиро- вания и характеристики объекта проектирова- ния, неявно учитываемые в алгоритме проек- тирования; п - размерность субвекгора исход- ных данных, представленных в задании на проектирование. Введение субвекгора неявно учитывае- мых исходных данных отражает в данном слу- чае сформулированное выше положение о том, что ХПР по разрабатываемому ТО, отсутст- вующие в рассмотрении на конкретном уровне проектирования, в той или иной степени учи- тываются различными проектными методика- ми, основанными на статистике и предыдущем опыте разработки аналогичных ТО. На основании такого подхода к форма- лизованному представлению алгоритма проек- тирования может быть получена следующая зависимость оценки достоверности результатов проектирования: Н)в = (7.3.8) где - математические ожидания слу- чайных величин dk и Г/; - предельная погрешность задания d^ в исходных данных конкретного проектного процесса; (Д^/)м - методическая предельная погрешность (т.е. максимальное значение относительной ошиб- ки в определении величины Г/), обусловленная неадекватностью представления функций Uj (х) в используемом алгоритме проектиро- вания. Для различных по своей масштабности и содержанию Проектных процессов учет тех или иных факторов, определяющих достоверность подучаемых результатов проектирования, име- ет различное значение. В связи с этим выде- лим два частных случая зависимости (7.3.8): (7.3.8*) (Дг/)в=(Дг/)м- (7.3.8") Зависимость (7.3.8*) соответствует про- ектным процессам, реализующимся с исполь- зованием алгоритма проектирования, в кото- ром методические функции и*£(х) модели- руются достаточно адекватно фактическим функциям Mj’(x). В авиационной практике проектирования к числу таких процессов от- носится, например, задача расчета летно- технических характеристик летательного аппа- рата. Алгоритм решения этой задачи основы- вается на математически строгих уравнениях движения летательного аппарата. И погреш- ность расчета характеристик определяется здесь в основном погрешностями исходных данных. Зависимость (7.3.8”) соответствует про- ектным процессам, в которых собственная достоверность алгоритма проектирования иг- рает решающую роль в определении общей точности проектных результатов по сравнению с достоверностью исходных данных. Собст- венная достоверность алгоритма проектирова- ния является достаточно условной характери- стикой. В зависимости от конкретной поста- новки проектной задачи и особенностей про- ектируемого ТО один и тот же алгоритм про- ектирования проявляет различную достовер- ность результатов проектирования. В связи с этим введем понятие методического совершен- ства алгоритма проектирования - характери- стики, определяющей величину (ДГ/)м и за- висящей только от параметров этого алгорит- ма. В общем случае методическую погреш- ность удобно рассматривать в виде <7-3-9> Р=1 N М где Ф^’ - комплексная функция, описы- вающая свойства алгоритма проектирования М-го уровня методического совершенства при его использовании применительно к N-й по- становке конкретной задачи проектирования;
УЧЕТ ТРЕБОВАНИЙ К ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ПРОЕКТИРОВАНИЯ 587 (Ari)p - функция, учитывающая влияние р-го фактора, связанного с особенностями проек- тируемого ТО, на величину методической по- грешности при решении конкретной проект- ной задачи. Рассматривая данный вопрос примени- тельно к автоматизированному проекгирова- N М нню, функцию Фн ’ можно выразить через показатели, используемые для характеристики программно-методических комплексов САПР. Так, применительно к процессам определения технической концепции ТО, соответствующим в системно-организационном макроописании проектирования 0-му уровню детализации общего процесса проектирования (см. рис. 7.2.2), ще а^, ‘ статистические величины, соответствующие использованию конкретной САПР в конкретном проектном процессе; Nnnn ~ объем в тысячах операторов исполь- зуемого в САПР пакета прикладных программ не считая сервисных и диалоговых программ; Ррм ~ среднее число параметров расчетной модели, используемой в САПР для описания ПР по ТО. Для конкретизации функций (Л^р необ- ходимо рассмотреть конкретные типы ТО. Так, применительно к процессам определения технической концепции самолетов различного назначения такими функциями являются: ще /Ивзл - взлетная масса самолета; - общая масса компонентов, заданная в исход- ных данных на проектирование; - число участков крейсерского полета, отличающихся высотой и скоростью полета самолета; - масса топлива. В состав компонентов, масса которых за- дается в исходных данных и, следовательно, не подлежит расчетному определению в ходе про- ектирования могут входить полезная нагрузка, специальное оборудование и топливо. На рис. 7.3.2 в графической форме пред- ставлены две конкретные зависимости (7.3.9), полученные на основании опытных данных по использованию нескольких САПР в процессах проектирования самолетов различного целе- Рис. 7.3.2. Количественная оценка влияния уровня методического совершенства алгоритма проектирования на методическую погрешность САПР вого назначения. Для исключения влияния особенностей проектируемых ТО на методиче- скую погрешность, имеющую место в проек- тировании, величина этой погрешности пред- ставлена в нормированном виде. Представлен- ные зависимости соответствуют двум частным процессам проектирования, положение кото- рых в общем процессе проектирования ТО показано на рис. 7.2.2. Основное их различие в данном случае состоит в том, что содержани- ем процесса, обозначенного как "ТО / этап Г является определение взлетной массы самолета на основании требований к дальности полета, а содержанием процесса "ТО / этап 2" является определение дальности полета, реализуемой самолетом конкретной взлетной массы. Как следует из рис. 7.3.2, методическая погрешность существенно зависит при прочих равных условиях от особенностей постановки проектной задачи. Существенно большие по- грешности, проявляющиеся при одном и том же уровне методического совершенства алго- ритма проектирования в процессе "ТО / этап Г, обусловлены тем, что определение общей раз- мерности (в том числе взлетной массы) само- лета реализуется как итерационная процедура. Многократное вычисление одних и тех же характеристик с использованием в качестве исходных данных расчетных результатов, по- лученных на предыдущих итерациях, усилива- ет в данном случае влияние собственных по- грешностей используемых расчетных алгорит- мов на общую достоверность результатов про- ектирования. Данные рис. 7.3.2 показывают также ха- рактер влияния уровня методического совер- шенства алгоритма проектирования, исполь- зуемого в САПР, на достоверность результатов проектирования. При низком уровне методи- ческого совершенства алгоритма проектирова- ния повышение этого уровня при прочих рав- ных условиях снижает методические погреш- ности. Эта тенденция существенно замедляется при переходе к использованию алгоритмов с высоким уровнем методического совер- шенства.
588 Глава 7.3. УПРАВЛЕНИЕ ПРОЕКТИРОВАНИЕМ В КОМПЛЕКСНОЙ САПР Необходимо, однако, иметь в виду, что влияние особенностей проектируемого ТО на методическую погрешность является одним из наиболее существенных факторов, проявление которого на рис. 7.3.2 исключено путем нор- мирования (Дг/)м относительно функций (Агдр. Величины [(Л^) 1(^)2], имевшие место в опытных данных (см. рис. 7.3.2) могли раз- личаться друг от друга почти на порядок. Это значит, что при проектировании различных ТО для обеспечения одинаковой методической погрешности в одних и тех же проектных про- цессах требуется использовать алгоритмы раз- личного уровня методического совершенства. В автоматизированном проектировании сложных ТО данное положение находит свое отражение в методической многоуровневости САПР. Так, например, в составе САПР, ори- ентированных на выполнение определенных проектных работ в процессах проектирования самолетов, предусматривается обычно наличие нескольких идентичных по своему назначению проектирующих подсистем, отличающихся уровнем методического совершенства исполь- зуемых в них алгоритмов проектирования. Наиболее часто это имеет место в отношении подсистем расчета весовых характеристик, аэродинамических характеристик и характери- стик силовой установки самолета. Включение в процесс проектирования тех или иных под- систем является в данном случае задачей управления проектированием. В общем случае решение этой задачи связано с рассмотрением не только методиче- ской погрешности, являющейся согласно вы- ражению (7.3.8) лишь частью комплексной оценки достоверности результатов проектиро- вания. На рис. 7.3.3 дана графическая иллюст- рация этого выражения, показывающая влия- ние различных составляющих погрешности Повышение уровня методического совершенства алгоритма проектирования Рис. 7.3.3. Качественная иллюстрация общего изменения достоверности результатов проектирования результатов проектирования на ее общую ве- личину. В тех случаях, когда погрешность ис- ходных данных является доминирующим фак- тором в определении величины > ис~ пользование алгоритмов проектирования с высоким уровнем методического совершенства не может являться эффективным средством обеспечения необходимой достоверности ре- зультатов проектирования. В этих случаях оправданным является применение более про- стых программно-методических средств САПР, использование которых связано с меньшим расходом ресурсов, выделяемых на проектирование. 7.3.4. УЧЕТ ТРЕБОВАНИЙ ЗАВЕРШЕННОСТИ РЕЗУЛЬТАТОВ ПРОЕКТИРОВАНИЯ Постановка рассматриваемого здесь вопроса применительно к макроуровню, а не к отдельным расчетным задачам является причиной использо- вания достаточно интегральных по своему смыслу показателей. Таким показателем является энтро- пия представления об объекте проектирования, связанная с числом ПР, проработанных по ТО и его элементам. Увеличение числа проработанных ПР способствует при прочих равных условиях снижению отклонения (Sx)3 (см. рис. 7.3.1). Число вариантов ПР, прорабатываемых в ходе проектного исследования на определенном уровне проектирования, является характери- стикой начальной неопределенности результа- тов проектирования. Аналогично число ПР, проработанных в ходе проектного исследова- ния и оставленных в качестве альтернативных вариантов в последующих проектных работах, является характеристикой неопределенности результатов проектирования после окончания проектного исследования. Сами величины неопределенностей можно выразить как на- чальную Нп и конечную Нк энтропии пред- ставления об объекте проектирования. Разность этих величин (обозначим ее че- рез АН) определяет снижение энтропии пред- ставления об объекте проектирования, дости- гаемое в конкретном проектном исследовании. Она характеризует завершенность результатов этого исследования вне зависимости от при- кладного содержания проектного процесса, при выполнении которого эти результаты по- лучены. Исходя из общеизвестных формул для выражения энтропии, запишем /=1 ХЧ- (7.3.10) /=1
УЧЕТ ТРЕБОВАНИЙ ЗАВЕРШЕННОСТИ РЕЗУЛЬТАТОВ ПРОЕКТИРОВАНИЯ 589 где (р/)н> (Р/)к - априорная вероятность выбо- ра i-го ПР до начала и после окончания про- ектного исследования (отдельного этапа, ста- дии проектирования или всего процесса про- ектирования); Nw NK - число ПР, планируе- мых для рассмотрения до начала и после окончания проектного исследования. Принимая ряд упрощений и пользуясь некоторыми зависимостями, получаемыми из уравнения организации процесса проектиро- вания (7.3.1), рассматриваемое выражение приводится к виду расчетной формулы. Так, для стадии аванпроектирования снижение энтропии представления о ТО в целом АЯ0 = 0,31g (7.3.10а) Аналогично для проектного исследова- ния, охватывающего стации аванпроектирова- ния и эскизного проектирования, Ьз (7.3.106) Показатель, характеризующий завершен- ность результатов проектирования, проанали-* зирован на рис. 7.3.4. Значения &Hq получены расчетной обработкой статистических данных и соответствуют моменту окончательного вы- бора технической концепции проектируемого ТО (транспортного самолета или самолета специального назначения), т.е. получению окончательного ПР в процессе проектирова- ния 0-го уровня структурности детализации ТО. Значения представлены в зависимо- сти от времени получения окончательных ПР. Представленные данные соответствуют различному уровню автоматизации проектных исследований. Под исходным уровнем автома- тизации здесь понимается традиционная фор- ма использования ЭВМ в вычислительных центрах коллективного пользования при па- кетной обработке информации, под частичной автоматизацией - использование САПР при выполнении только одного из этапов процесса проектирования ТО, под полной автоматиза- цией - использование комплексных САПР, обеспечивающих автоматизацию всех этапов процесса проектирования ТО. Как следует из рис. 7.3.4, проектирова- ние самолетов специального назначения свя- зано с более высокой, чем проектирование транспортных самолетов, завершенностью результатов проектирования в разработке тех- нической концепции ТО. При этом сам про- цесс поиска окончательного ПР на 0-м уровне проектирования ТО связан здесь с большими затратами времени. Для одного и того же типа ТО комплексное использование САПР обеспе- чивает как сокращение сроков проектирова- ния, так и повышение завершенности резуль- татов проектирования. Из приведенных данных вытекают сле- дующие требования к величине AHq, обеспе- чение которых в условиях автоматизирован- ного проектирования должно быть одной из задач управления проектированием рассмот- ренных типов ТО: 0,7 - 0,8 - для проектирования транс- портных самолетов; 0,8 - 0,9 - для проектирования самолетов специального назначения. Как следует из рис. 7.3.4, частичная ав- томатизация проектирования не обеспечивает достижение полного эффекта, который может быть получен от использования САПР в от- ношении сроков выполнения проектных ис- следований. Причиной этого является то, что □,и -самолеты специального назначения] о,е -транспортные самолеты] о,а -полная автоматизация] —исходный уровень] с —частичная автоматизация ЛН0 0,8 0,6 0.Ц 0,2 0 100 200 Т,Н Рис. 7.3.4. Результаты анализа статистических данных по снижению энтропии представлении об объекте проектирования в процессе проектирования
590 Глава 7.3. УПРАВЛЕНИЕ ПРОЕКТИРОВАНИЕМ В КОМПЛЕКСНОЙ САПР на стадиях аванпроекгирования и эскизного проектирования, к реализации которых отно- сятся данные рис. 7.3.4, в разработке проекта ТО принимает участие несколько ОТС. Каж- дая из них обеспечивает выполнение конкрет- ной проектной работы (или отдельного этапа проектирования), включенной в общий итера- ционный процесс проектирования ТО. Повы- шение благодаря использованию САПР произ- водительности только одной ОТС еще не га- рантирует повышения общей производитель- ности всей комплексной системы в целом. В связи с этим в качестве самостоятельной задачи управления проектированием возникает вопрос о согласовании производительности отдельных САПР проектных работ в рамках комплексной САПР. 7.3.5. СОГЛАСОВАНИЕ ПРОИЗВОДИТЕЛЬНОСТИ САПР ПРОЕКТНЫХ РАБОТ В РАМКАХ КОМПЛЕКСНОЙ САПР На рис. 7.3.5 приведены некоторые зави- симости, являющиеся развитием рассмотрен- ных выше уравнений организации процесса проектирования (см. п. 7.3.1) применительно к разработке самолетов различного типа на стации аванпроекгирования. При этом обозна- чено: (^l)i ' интенсивность проектной проработки в процессах проектирования эле- ментов 0-го и 1-го уровней детализации ТО на момент, котда самостоятельными объектами проектирования являются элементы 1-го уров- ня детализации ТО; ~ интенсивность проектной проработки в процессах проектиро- вания элементов 1-го уровня детализации ТО и агрегирования получаемых ПР в ПР по эле- ментам 0-го уровня. Все величины интенсивностей имеют размерность "число ПР / неделя". Для отдельных интенсивностей проекти- рования на рис. 7.3.5 показаны диапазоны их значений, соответствующие тому или иному уровню автоматизации проектирования. Диа- пазоны этих величин выявлены на основании имеющихся статистических данных о предель- ной производительности используемых в практике авиастроения ОТС различного уров- ня автоматизации. Зависимости (см. рис. 7.3.5) показывают наличие определенной взаимосвязи между интенсивностью проработки ПР на 0-м и 1-м уровнях процесса проектирования ТО, которая реализуется через интенсивность передачи проектной информации с одного уровня на другой. Эта взаимосвязь может быть выражена простым соотношением: (z^)i = Xzo)j; <7-311> <7-зл2> где значения коэффициентов А и В зависят от типа проектируемого ТО (А = 33 и В = 0,2 для самолетов специального назначения, А = 8 и В = 0,33 для транспортных самолетов). Рве. 7.3.5. Результаты анализа основных закономерностей орпипвацпп процесса проектирования сложных ТО: 1 - самолеты специального назначения; 2 - транспортные самолеты
ФАКТОРЫ, ОПРЕДЕЛЯЮЩИЕ ХАРАКТЕР РАСЧЕТНЫХ ПРОЦЕССОВ ПРОЕКТИРОВАНИЯ 591 Зависимости (7.3.11), (7.3.12) позволяют рассмотреть вопрос о согласовании произво- дительностей (т.е. реализуемых интенсивно- стях проектной проработки ПР) ОТС, обеспе- чивающих выполнение отдельных этапов про- ектирования. Такими ОТС являются, в частно- сти, и отдельные САПР проектных работ. Как показано на рис. 7.3.5, для реализации на ста- дии аванпроектирования одной и той же ин- тенсивности проектной проработки ПР по ТО в целом (точка А) для различных типов ТО требуются разные уровни автоматизации част- ных процессов проектирования элементов 1-го уровня детализации ТО (точки В и Q. Рассмотренная иллюстрация дает общее представление о вопросах управления проек- тированием, связанных с согласованием про- изводительности отдельных САПР проектных работ в рамках комплексной САПР. Конкрет- ные постановки этих вопросов могут быть на практике более или менее детальными. Одной из них является определение производитель- ности САПР проектных работ в частном про- цессе проектирования, обозначенном выше "ТО / этап Г, с учетом интенсивности проект- ной проработки ПР в других системах, с кото- рыми взаимодействует эта САПР на стадии аванпроектирования ТО. Считая, что инвари- антность рассматриваемой САПР проявляется только в отношении проектирования ТО оп- ределенного типа, запишем ще Адр - число программ проектной разра- ботки ТО, в которых участвует рассматривае- мая САПР; А и В - коэффициенты формул (7.3.11), (7.3.12); к - коэффициент запаса про- изводительности САПР, учитывающий воз- можность совпадения пиковых нагрузок в рамках отдельных проектных программ. Глава 7.4 УПРАВЛЕНИЕ ПОИСКОМ РЕШЕНИЙ В РАСЧЕТНЫХ ПРОЦЕССАХ, РЕАЛИЗУЕМЫХ В САПР Управление поиском решений в расчет- ных процессах является одним из видов управлений, реализуемых в САПР (см. табл. 7.2.1). Конкретное содержание этих управле- ний определяется прежде всего математиче- ской формулировкой тех проектных задач, для решения которых требуется проведение такого поиска. К их числу в общем спектре типовых задач, решаемых при автоматизированном проектировании (см. п. 7.2.3), относятся пре- жде всего задачи расчета параметров. Они соответствуют выполнению проектных процес- сов двух типов: оптимизационному проекти- рованию и проектированию по ограничениям. Математическая формулировка процессов пер- вого типа, присутствует в составе комплексных выражений (7.2.9), (7.2.10). Примером матема- тической формулировки процессов второго типа является выражение (7.2.11). Математические формулировки проект- ных процессов в целом и реализуемых в них задач расчета параметров не являются полной аналогией друг другу. Если в рамках частного процесса проектирования поиск решения свя- зан с рассмотрением вектора всех ХПР, опи- сывающих ПР по ТО в целом или отдельному его элементу, то в рамках задачи расчета пара- метров этот поиск связан с рассмотрением только вектора КПА, описывающих конкрет- ное ПР в пределах заданного типа ПР. В математическом плане замена оптими- зационного проектирования на проектирова- ние по ограничениям означает переход от задачи поиска экстремума к задаче нахожде- ния корней системы нелинейных уравнений. Каждой из них соответствуют свои математи- ческие методы решения, что делает целесооб- разным их раздельное рассмотрение. И если реализации в САПР процессов оптимизацион- ного проектирования в технической литерату- ре уделено уже немало внимания, то реализа- ция расчетных процессов проектирования по ограничениям остается все еще мало освещен- ным вопросом. В то же время именно этот тип процессов является наиболее распространен- ным способом реализации в САПР задач рас- чета параметров. Он имеет место и в некото- рых задачах анализа ПР, выполнение которых связано с использованием итерационных ме- тодов решения систем нелинейных трансцен- дентных уравнений. 7.4.1. ФАКТОРЫ, ОПРЕДЕЛЯЮЩИЕ ХАРАКТЕР РАСЧЕТНЫХ ПРОЦЕССОВ ПРОЕКТИРОВАНИЯ ПО ОГРАНИЧЕНИЯМ Используя условные обозначения, при- нятые при записи выражения (7.2.11), и опус- кая для компактности приводимых далее зави- симостей индексы i и к, введенные ранее для обозначения структурной детализации процес- са проектирования, итерационная процедура рассматриваемых расчетных процессов может быть представлена как х<"+1) = х, +/(*,», 5", 5Г"ДОП), (7.4.1)
592 Глава 7.4. УПРАВЛЕНИЕ ПОИСКОМ РЕШЕНИЙ В РАСЧЕТНЫХ ПРОЦЕССАХ ще х” - значение /-го компонента (/ = 1, ...» g) вектора КПА, существующее на л-й итерации расчетного процесса; S? - существующее на л-й итерации расчетного процесса значение г- й функции проектных ограничений (г = 1, ..., т); $РДОП - существующее на л-й итерации допустимое значение r-й функции проектных ограничений. Совместно с алгоритмом вычисления функций S* операция, описываемая выраже- нием (7.4.1), образует общий алгоритм реше- ния системы т нелинейных уравнений при- менительно к определению g корней этих уравнений. При этом g <. т. Условием прекращения итерационного расчетного процесса является минимизация невязок л;| = с»Л с»Л “ °ГДОП (7.4.2) оЛ ° Г ДОП ще гл- - заданная точность решения для г-го уравнения. Во многих случаях в качестве при реализации итерационных расчетных процес- ' сов может приниматься значение S^n~^ . Существующие алгоритмы проектирова- ния по ограничениям связывают обычно опре- деление значений отдельных КПА с решением конкретных уравнений. С учетом этого выра- жения (7.4.1) и (7.4.2) принимают вид: х<"+1) = х, +/(*". ‘Ч’лоп); (7.4.1') |85(«| = оЛ сЛ ~^/доп сЛ 43/доп (7.4.2-) В случаях, коща g < т и определению значений отдельных КПА может соответство- вать несколько уравнений, в алгоритм вводят- ся дополнительные операции минимаксных или других условий для выбора единственного (л+1) значения х) 7 . Алгоритмы решения рассматриваемых расчетных задач состоят из трансцедентных уравнений. Это обусловлено тем, что даже связанные с определением значений отдель- ных КПА проектные ограничения S* явля- ются функциями не только i-го КПА, но и всей совокупности компонентов общего век- тора КПА х = {Xi, Х2, ...» xg}. Изменение этих компонентов при переходе от одной ите- рации расчетного процесса к другой делает эту функцию зависимой от самого процесса реше- ния расчетной задачи. Это относится и к не- вязкам, определяемым выражением (7.4.2*). Применительно к л-й итерации каждая такая невязка является самостоятельной функцией /-го проектного параметра, соответствующая именно этой итерации: СЛ _ СЛ = (7.4.3) 13 / ДОП Отсутствие (или пренебрежимо малая ве- личина) изменения функции р”(х) при пере- ходе от одной итерации к другой представляет собой частный случай той общей ситуации, которая обычно имеет место на практике. Для этого случая г» Л _ гЛ (7.4.3-) 45/ДОП В практике автоматизированного проек- тирования нашли применение различные формализованные алгоритмы поиска решения рассматриваемой задачи. Наиболее распро- страненными являются: метод простой итерации xj"+= х(" + ; (7.4.4) метод простой итерации с постоянным масштабированием х(л+|) =Х/ +KMxJ‘8Sl‘; (7.4.5) метод простой итерации с переменным масштабированием х("+1) = х? +ф($Г, xfy№, (7.4.6) ще функция Х/Л) ~ играет роль коэффициента масштабирования шага поиска, величина которого зависит от текущих значе- ний параметров, характеризующих решение задачи. Многообразие алгоритмов поиска реше- ния отражает существующую на практике про- блему сходимости решения расчетных задач рассматриваемого типа. Она проявляется как в неустойчивости, так и в слишком большой длительности процесса решения. И то и другое
ФАКТОРЫ, ОПРЕДЕЛЯЮЩИЕ ХАРАКТЕР РАСЧЕТНЫХ ПРОЦЕССОВ 593 затрудняет получение результата с заданной точностью при допустимом расходе вычисли- тельных ресурсов или общего времени реше- ния проектной задачи. Причины, обуславли- вающие проблему сходимости могут быть про- анализированы с помощью введенной выше функции р"(х/). При отсутствии зависимости этой функ- ции от текущих значений всех компонентов вектора КПА, что соответствует частному слу- чаю, описываемому выражением (7.4.3*), ис- пользование поискового алгоритма простой итерации (7.4.4) всетда обеспечивает быстрое решение рассматриваемой задачи. Качествен- ная характеристика этой закономерности по- казана на рис. 7.4.1, а. Процесс поиска реше- ния в данном случае устойчиво приближает значение каждого КПА к той величине, при которой выполняется условие (7.4.2*). Рас. 7.4.1. Качественная иллюстрация возможных вариантов протекания расчетного процесса проектирования по ограничениям: штриховые стрелки - расчет; сплошные - поиск
594 Глава 7.4. УПРАВЛЕНИЕ ПОИСКОМ РЕШЕНИЙ В РАСЧЕТНЫХ ПРОЦЕССАХ Число итераций, необходимых для нахо- ждения решения, определяется в данном слу- чае начальными условиями поиска решения „нам „кон Х1 ~Х1 „кон ’ Х1 где Х/”4 и х*он - начальное и конечное значения i-го КПА, подлежащего определению в процессе решения задачи расчета парамет- ров. При зависимости функции р"(х/) от текущих значений компонентов вектора КПА помимо X/ возможны два варианта проявления свойств этой зависимости в процессе решения задач рассматриваемого типа. Первый вариант имеет место при посто- янстве самого изменения функции от одной итерации к другой (рис. 7.4.1, б). Вто- рой вариант имеет место, коща изменение функции р”(х/) не носит постоянного харак- тера (рис. 7.4.1, в). Как показано на рис. 7.4.1, б, при использовании алгоритма простой итера- ции первый вариант характеризуется замедле- нием процесса решения задачи. Рис. 7.4.1, в объясняет появление неустойчивости в общем процессе решения рассматриваемой задачи.' Как замедление, так и неустойчивость процес- са решения определяются здесь соотношением интенсивностей изменения величины X/ и функции р”(х/) от одной итерации к другой. Общий вид кривых, отражающих на рис. 7.4.1, б и 7.4.1, в поведение функции р”(х/), не учитывает влияние обычных по- грешностей расчета. При анализе вопроса о сходимости процесса решения задач рассмат- риваемого типа такая идеализация является вполне допустимой, если погрешности расчета функций малы по сравнению с заданной точ- ностью поиска решения. В противном случае влияние этих погрешностей не может быть оставлено без внимания. Применительно к графической иллюстрации (см. рис. 7.4.1) эф- фект этого влияния состоит в появлении до- полнительных изменений функции р”(х/) при переходе от одной итерации к другой. Они обусловлены случайным попаданием ка- кого-либо компонента общего вектора х в ту область, где ошибка расчета функции S* становится выше обычной ее величины. Гра- фически расчетный процесс, который имеет место в этом случае, представлен на рис. 7.4.1, г. Погрешность расчета функции SJ не про- сто ухудшает сходимость процесса, а приводит к непредсказуемому изменению КПА вблизи точки решения задачи. 7.4.2. МЕТОД АДАПТАЦИИ ПОИСКОВОГО АЛГОРИТМА В РЕАЛИЗАЦИИ РАСЧЕТНЫХ ПРОЦЕССОВ ПРОЕКТИРОВАНИЯ ПО ОГРАНИЧЕНИЯМ* Проведенный выше анализ позволяет считать, что обеспечение хорошей сходимости расчетных процессов проектирования по огра- ничениям может быть достигнуто лишь на основе учета основных особенностей поведе- ния функции р"(х) в ходе решения задачи. В общем случае поведение этой функции за- висит от постановки задачи и используемого алгоритма проектирования, но не определяет- ся ими однозначно. Процесс решения одной и той же задачи расчета параметров с использо- ванием одних и тех же программно- технических средств САПР может быть весьма различным в зависимости от типа ПР, в пре- делах которого ищется конкретное ПР. На рис. 7.4.2 показано влияние величины коэф- фициента Км, входящего в поисковый алго- ритм (7.4.5), на число итераций л* расчетного процесса, совершаемых на момент достижения решения. Зависимости построены по опытным данным, полученным по результатам исполь- зования двух различных подсистем САПР, обеспечивающих автоматизацию проектирова- ния летательных аппаратов на разных уровнях структурной детализации этого процесса. Для корректности сравнения опытных данных, использованных для построения зависимостей, при их получении была обеспечена идентич- ность значений ДХ/Нач. Для разных случаев проектирования ве- личина Км, рациональная с точки зрения схо- димости процесса решения задачи, различна. Уменьшение по сравнению с рациональ- ным значением приводит к возрастанию л*. Это обусловлено в данном случае замедлением процесса поиска решения, так как сам расчет- ный процесс становится подобным тому, ко- торый представлен на рис. 7.4.1, б. Увеличение Км по сравнению с рациональным значением также приводит к возрастанию л*. Но это яв- ляется уже проявлением неустойчивости про- цесса решения (рис. 7.4.1, в). Различие рациональных значений Км может быть весьма заметным, а несоответствие Км его рациональному значению может суще- ственно затруднить поиск решения. Так при
МЕТОД АДАПТАЦИИ ПОИСКОВОГО АЛГОРИТМА 595 О 0.5 1.0 1.5 2.0 К" Рис. 7.4.2. Примеры количественной оценки оптимальных параметров поисковых алгоритмов: а - решение задачи весового проектирования ЛА; б - решение проектно-конструкторской задачи = 1,0, что является рациональным для проектирования по ограничениям конструк- ции С, процесс проектировочного расчета для конструкции D становится полностью несхо- дящимся, и решение задачи вообще не дости- гается. Анализируя графики (см. рис. 7.4.2) можно также заключить, что в зависимости от характера расчетной процедуры минимальное число итераций, за которое с заданной точно- стью достигается решение задачи, может быть существенно различным. Во всем многообразии расчетных про- цессов, встречающихся на практике, использо- вание поискового алгоритма (7.4.5) не может являться способом обеспечения хорошей схо- димости расчетов. Величина Км принимается здесь до начала решения задачи на основании накопленного опыта. Однако он не всеща учитывает специфику конкретной задачи. Ис- пользование поискового алгоритма с перемен- ным масштабированием, общий вид которого представлен выражением (7.4.6), также не яв- ляется способом решения проблемы. Хотя здесь и проводится настройка поискового ал- горитма в ходе решения, это делается с учетом лишь текущего состояния функции , а не особенностей ее поведения в процессе всего решения. Универсальным в этом отношении явля- ется метод, предусматривающий адаптацию поискового алгоритма с учетом характера рас- четного процесса. Он предполагает поэтапную реализацию процесса решения задачи с вы- полнением на каждом этапе следующих логи- ческих операций: определение особенностей поведения функции рГ(х/) в ходе расчетного процесса и оценка необходимости корректировки поиско- вого алгоритма; проведение корректировки поискового алгоритма с целью улучшения расчетного про- цесса; переход к выполнению очередного этапа решения задачи. При использовании в качестве поиско- вого алгоритма выражения типа (7.4.5) смысл адаптации сводится к подбору в процессе ре- шения расчетной задачи рационального для этой задачи значения Км. Согласно принятому выше (см. п. 7.2.1) описанию процесса функционирования САПР, решение отдельных проектные задач отобра- жается в виде диаграммы состояний второго уровня структурной детализации САПР. Для расчетных задач, к числу которых относят рассматриваемые здесь задачи расчета пара- метров, в качестве таких состояний принято выделять четыре проектные операции следую- щего содержания: 1) ознакомление с условиями задачи (ОУЗ), т.е. усвоение условий задачи и привле- чение необходимой дополнительной инфор- мации, необходимой для организации реше- ния задачи;
596 Глава 7.4. УПРАВЛЕНИЕ ПОИСКОМ РЕШЕНИЙ В РАСЧЕТНЫХ ПРОЦЕССАХ 2) подготовка решения задачи (ПРЗ), т.е. выбор конкретного способа решения задачи из числа возможных, приведение исходной ин- формации в соответствии выбранному способу решения, формирование расчетных моделей и т.д.; 3) получение результатов расчета (ПРР), т.е. преобразование входной информации (исходные данные для ЭВМ) в выходную (результаты расчета) с использованием вы- бранного метода решения; 4) анализ результатов расчета (АРР), т.е. получение выводов и заключений и возобнов- ление, в случае необходимости, поиска других способов решения задачи. Типичный вид диаграммы состояний процесса решения расчетной задачи показан на рис. 7.4.3. Дополнительными обозначения- Г ПРЗ Г ПРР Г АРР т1таттл1г,т Жллжжа ми л*у , лу , л g выделены срормв* лизованные представления алгоритма функ- ционирования САПР вида (7.2.2) и (7.2.3), имеющие отношение к реализации решения задачи методом адаптации поискового алго- ритма. Накопление информации о поведении функции pf(xt) в ходе расчетного процесса входит в состав действий, представленных на ПРР рис. 7.4.3 функцией Fy . Вместе с резуль- татами расчетов эта информация образует множество выходных воздействий КА в со- стоянии ПРР. Она может быть передана в состояние ПРР в качестве множества входных воздействий КА в этом состоянии, если реак- цией КА в состоянии АРР, обозначенной на „АРР рис. 7.4.3 как F& , будет решение о прове- дении адаптации поискового алгоритма и про- должении расчетов. Проведение корректиров- ки поискового алгоритма является реакцией КА в состоянии ПРЗ. Обеспечиваемые при этом новые параметры поискового алгоритма входят в множество выходных воздействий КА в состоянии ПРЗ как результат выполнения функции /’J11’3. Рве. 7.4.3. Диграмма сосгоянай процесса решения расчетной задачи Реализация рассмотренного метода быва- ет различной. Выполнение действий, описы- ваемых функцией F^3, предполагает распо- знавание типа расчетного процесса (из числа тех, которые показаны на рис. 7.4.1) и опреде- ление изменений алгоритма, необходимых для приведения этого процесса к желаемому виду. Для распознавания типа расчетного процесса по внешним его признакам требуется опреде- ленный интеллект. При полностью автомати- ческой реализации процесса поиска решения эта операция выполняется компонентами спе- циального математического обеспечения, по- зволяющими ввести технологию искусствен- ного интеллекта в алгоритм функционирова- нии САПР. Наряду с этим подходом возможен и другой. Он заключается в том, что наиболее простым и естественным для САПР способом выполнения рассматриваемых логических опе- раций является привлечение собственных спо- собностей человека по качественному анализу информации и формулированию логических заключений. Реализация этого подхода осно- вывается на использовании специальных ком- понентов методического обеспечения, которые с учетом существующей терминологии будем именовать эвристическими программами. С помощью эвристической программы, составленной для определенного типа проект- ных задач и входящей в состав методического обеспечения подсистемы САПР, предназна- ченной для решения этих задач, пользователь САПР может определить тип расчетного про- цесса по данным, характеризующим его про- текание. Эта же программа помогает ему сформировать представление о необходимом изменении поискового алгоритма. Эффективность последнего из этих под- ходов зависит от возможности оперативного участия пользователя САПР в расчетном про- цессе решения задачи. При пакетном режиме обработки информации и отсутствии средств машинной графики эта возможность находит- ся на крайне низком уровне. Она в полной мере обеспечивается только при интерактив- ном режиме решения задачи. Визуализация на экране графического дисплея текущих резуль- татов решения задачи существенно расширяет возможности пользователя по управлению процессом решения расчетной задачи и делает рассматриваемый метод поиска решения дос- таточно эффективным. Поэтому при данном подходе к реализации этого метода он рас- сматривается как метод интерактивной адапта- ции поискового алгоритма.
МЕТОД МНОГОШАГОВОЙ РЕАЛИЗАЦИИ РАСЧЕТНЫХ ПРОЦЕССОВ ПРОЕКТИРОВАНИЯ 597 7.4.3. МЕТОД МНОГОШАГОВОЙ РЕАЛИЗАЦИИ РАСЧЕТНЫХ ПРОЦЕССОВ ПРОЕКТИРОВАНИЯ ПО ОГРАНИЧЕНИЯМ Снижение числа итераций, которым ха- рактеризуется расчетный процесс проектиро- вания по ограничениям, имеет свой предел (см. рис. 7.4.2). И даже при рациональных параметрах поискового алгоритма величина п* может быть значительной. В тех случаях, когда выполнение каждой итерации сопряжено с большими затратами вычислительных ресурсов или общего времени проектирования, их сни- жение представляет интерес даже при исполь- зовании алгоритмов поиска решения, обеспе- чивающих незначительную величину п*. Расход ресурсов на одно решение рас- четной задачи рассматриваемого типа записы- вается как Т = t х л*, (7.4.7) где t - расход вычислительных ресурсов или общего времени проектирования на одну ите- рацию; Т - то же самое для расчетного про- цесса в целом. Практика показывает, что величина t связана с такой характеристикой проектного алгоритма, как предельная погрешность Дйу , определяемая выражением (7.3.5). Величина л* в общем случае зависит от требуемой точности и начальных условий решения задачи, ха- рактеризующихся величинами Дх”ач. Раскрывая с учетом этих функций смысл отдельных составляющих выражения (7.4.7), запишем Т = /1(д«7) X л(дх("ач, Sji). (7.4.8) Рассматриваемый далее метод многоша- говой реализации расчетных процессов осно- ван на том, что решение задачи проектирова- ния по ограничениям представляет собой как бы совокупность двух самостоятельных про- цессов. Ими являются: 1) приближение значений варьируемых КПА к тем значениям, которые соответствуют решению задачи; 2) нахождение самого решения задачи. Для второго процесса предельные по- грешности Дйу имеют принципиальное зна- чение, так как непосредственно определяют точность решения задачи в целом. Требования, предъявляемые к точности расчетных алгорит- мов, могут быть здесь очень высокими. Для первого же процесса необходимая точность расчетных алгоритмов определяется лишь обеспечением сходимости процесса решения, и допустимые по этим соображениям погреш- ности Дйу могут быть большими, чем во вто- ром процессе. Это значит, что в первом про- цессе возможно использование проектных алгоритмов, характеризующихся меньшими расходами вычислительных ресурсов или об- щего времени проектирования. Другим факто- ром, на котором основан метод многошаго- вого расчета, является то, что во многих случа- ях начальные значения КПА существенно от- личаются от значений, соответствующих реше- нию проектной задачи, т.е. Дх”84 » 0 . Метод многошагового расчета предусмат- ривает фактическое разделение общего реше- ния задачи на два самостоятельные процесса. Выполнение первого происходит при таких величинах Дйу и при которых обеспечи- вается устойчивое и быстрое приближение х”ач к х*он . Полученные таким образом значения х*он являются приближенным ре- шением задачи и отличаются от точного реше- ния на величину расчетных ошибок, которыми характеризуется первый процесс решения за- дачи. Эти приближенные значения х*°н ис- пользуются в качестве х”ач для проведения второго процесса решения задачи. Он реализу- ется уже при величинах Дйу и соответст- вующих требуемой точности решения задачи в целом. Для первого и второго процессов реше- ния задачи можно записать соответственно: Ti = h х п, = /1(Дйу/) х х/2(дх"ач »0;EjU7); (7.4.9) Тц = tn *пп = Л{^п) х X /^Дх/**4 « 0; еля). (7.4.10) Общий расход вычислительных ресурсов или времени проектирования, приходящийся на решение задачи в целом, зависит в этом случае от конкретного варианта метода мно- гошагового проектирования. Возможны два варианта. Первый вариант метода предполагает раз- биение общего процесса решения задачи на два последовательных шага, представляющих собой соответственно первый и второй про- цессы, рассмотренные выше. Общий расход вычислительных ресурсов или времени проек- тирования (обозначим его через 7”) в этом случае будет
598 Глава 7.4. УПРАВЛЕНИЕ ПОИСКОМ РЕШЕНИЙ В РАСЧЕТНЫХ ПРОЦЕССАХ Т* = tf х Л/ + tjj х Л//. (7.4.11) Положительный эффект использования многошагового расчета реализуется в данном случае следующим образом. На первом шаге расчета происходит приближенное определе- ние значений варьируемых КПА, соответст- • вующих решению задачи. При этом, хотя Л/ и велико, но tf имеет малое значение. На вто- ром шаге происходит точное определение зна- чений КПА, соответствующих решению зада- чи. При этом, хотя tn имеет большую величи- ну, но Пц мало. Второй вариант метода многошагового расчета представляет собой многократное по- вторение двух шагов расчета. Первым шагом является первый вариант процесса решения задачи, рассмотренный выше. Второй шаг аналогичен второму варианту процесса, но состоит из одного цикла без перехода к итера- ционному поиску решения задачи. Если при проведении этого расчета окончательное ре- шение задачи не достигается, происходит по- вторное выполнение первого шага расчета. Но при его выполнении в качестве х”ач исполь- зуются уже значения варьируемых КПА, полу- ченные на втором шаге расчета. После по- вторного выполнения первого шага расчета происходит повторное выполнение второго шага и т.д. Процесс решения задачи прекра- щается как только на втором шаге расчета выполняется условие заданной точности реше- ния. Общий расход вычислительных ресурсов или времени проектирования (обозначим его через Т"} в данном случае будет m T" = ^\tf*ni) + mtn, (7.4.12) где m - число выполнений первого и второго шагов расчета. По сравнению с методом многошагового расчета обычный метод решения задач проек- тирования по ограничениям представляет со- бой одношаговый процесс, проводимый при Дйу и Cj/ = Zstff. Выражение (7.4.8) может быть представлено в связи с этим как т = t х п = /1(дй;л) X х/2(дхГ* » 0; (7.4.8') При использовании метода многошаго- вого расчета точность результатов находится на том же уровне, что и в случае обычного метода решения. Это связано с тем, что завершающий шаг расчета в обоих случаях проводится при одинаковой погрешности вычисления функ- ций Uj. Поэтому эффективность многошаго- вого расчета целиком определяется возможно- стью снижения расхода вычислительных ре- сурсов или общего времени проектирования. Для его количественной оценки введем относительные показатели, которые на осно- вании рассмотренных выше зависимостей и с учетом того, что t/j « /, имеют вид: т'=тг=4т)+^; (7-413) Т" = ^- = tonpfj + (7.4М) 7 \ t J п Отдельные члены этих выражений явля- ются функциями вида 16ля ^jn) 1/J п = <₽з(дх/иач> а величины Л// и /и, судя по имеющимся опытным данным, составляют: Пц = 1 ч- 3 и m = 2 ч- 4. Достаточно наглядная оценка метода многошагового расчета может быть проведена при выполнении следующих условий: 1) если ограничиться рассмотрением дос- таточно типичного случая ад = ад/ и соот- ветственно к = 1; 2) если в качестве показателя, характери- зующего начальные условия решения задачи, рассматривать не величину Дх”ач, а непо- средственно величину л*; 3) если в качестве показателя, характери- зующего возможное снижение точности расче- та функций Ujy рассматривать не величину &Mjf /&йщ , а непосредственно саму величи- ну tj/t. При этом выражения (7.4.13), (7.4.14) становятся аналитическими зависимостями Т' и Т" от показателей, определяющих эффективность метода многошагового расчета. Некоторые данные оценки этой эффек- тивности представлены на рис. 7.4.4. Эффек- тивность рассматриваемого метода реализации
МЕТОД МНОГОШАГОВОЙ РЕАЛИЗАЦИИ РАСЧЕТНЫХ ПРОЦЕССОВ ПРОЕКТИРОВАНИЯ 599 Рис. 7.4.4. Количественная оценка эффективности метода многошагового расчета: а - первого варианта; б - второго варианта расчетных процессов зависит прежде всего от показателя // / t. При втором варианте рас- сматриваемого метода его эффективность про- является при гораздо больших значениях tj / ty чем при первом варианте. Способы реализации рассмотренного ме- тода различны и во многом определяются прикладным характером и масштабностью расчетных процессов. В проектных процессах 0-го уровня структурной детализации САПР метод многошаговой реализации расчетных процессов связан с использованием эвристиче- ских программ. В рамках общей структуры алгоритма функционирования САПР (см. рис. 7.1.2) они образуют самостоятельные компоненты не- формализуемых алгоритмов проектной дея- тельности в составе методического обеспече- ния автоматизации проектирования. Подобный способ реализации рассмот- ренного метода возможен и в проектных про- цессах 1-го уровня структурной детализации САПР. Однако меньшая масштабность реали- зуемых здесь проектных процессов делает воз- можным полную автоматизацию рассматри- ваемого метода. Этой цели служат формализо- ванные алгоритмы проектной деятельности, входящие в состав математического обеспече- ния автоматизации проектирования. Варьирование значений Аму при пере- ходе от одного шага решения расчетной задачи к другому и связанное с этим варьирование расхода вычислительных ресурсов или общего времени проектирования могут достигаться различными способами. Основными из них являются следующие: 1) использование нескольких проектных алгоритмов, различающихся по уровню мето- дического совершенства, достоверности (точ- ности) результатов проектирования и потреб- ности в вычислительных ресурсах или време- ни, необходимого для решения с их помощью конкретных задач; 2) использование одного и того же про- ектного алгоритма при различных вариантах расчетных моделей; 3) использование одного и того же про- ектного алгоритма при различных требованиях к точности выполнения итерационных реше- ний в рамках общего расчетного процесса или различных ограничениях на предельное число итераций в этих решениях. Первый из этих способов наиболее типи- чен для расчетных процессов 0-го уровня структурной детализации САПР. Согласно принятому выше описанию процесса функ- ционирования САПР автоматизированное проектирование отображается в виде диаграм-
600 Глава 7.5. МЕТОДЫ ОЦЕНКИ ОРГАНИЗАЦИОННО-ТЕХНИЧЕСКИХ СИСТЕМ мы состояний 1-го уровня структурной дета- лизации САПР (см. рис. 7.2.1). Такими со- стояниями здесь являются отдельные подсис- темы, соответствующие определенным задачам проектирования. Среди них могут быть под- системы, обеспечивающие решение одних и тех же проектных задач, но с различной степе- нью точности. Многоуровневость математического обес- печения в отношении его методического со- вершенства является характерной особенно- стью САПР, используемых в практике автома- тизированного проектирования сложных объ- ектов авиационной техники. Так в рамках САПР проектных работ, связанных с опреде- лением технической концепции летательного аппарата, может использоваться несколько подсистем расчета аэродинамических характе- ристик, массогабаритных характеристик и ха- рактеристик силовой установки. Их математи- ческое обеспечение основывается на различ- ных алгоритмах проектирования, реализующих получение одних и тех же результатов проек- тирования, но с разной степенью достоверно- сти. Использование той или иной подсистемы определяется функциями входящими в общий алгоритм функционирования САПР. Они устанавливают последовательность ис- пользования различных подсистем САПР как состояний автоматизированного процесса про- ектирования. Два других из упомянутых выше спосо- бов варьирования значений Дйу наиболее типичны для расчетных процессов 1-го уровня структурной детализации САПР, т.е. процес- сов, протекающих в рамках отдельных подсис- тем, обеспечивающих решение задач расчет- ного характера. Применительно к диаграмме состояний, описывающей функционирование САПР в ходе решения таких задач (см. рис. 7.4.3), реализация рассматриваемого ме- тода связана с состоянием ПРЗ. Выходные воздействия КА, характеризующие функцио- нирования САПР в этом состоянии, включают в себя, в частности, результаты выполнения функции 7^ПР3. В число этих результатов входят параметры расчетных моделей, условия точности выполнения отдельных итерацион- ных решений в рамках общего расчетного процесса и ограничения на число итераций при выполнении этих решений. Для варьиро- вания этих факторов при переходе от одного шага расчетного процесса к другому не требу- ется использование каких-то специальных компонентов математического обеспечения. Это может быть реализовано с помощью обычных формализуемых алгоритмов проект- ной деятельности. Глава 7.5 МЕТОДЫ ОЦЕНКИ ОРГАНИЗАЦИОННО- ТЕХНИЧЕСКИХ СИСТЕМ АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ 7.5.1. СИСТЕМА ПОКАЗАТЕЛЕЙ ВЫБОРА РАЦИОНАЛЬНОГО ВАРИАНТА САПР Как самостоятельный вопрос общей тех- нологии автоматизации проектирования кри- териальная оценка САПР связана с проведени- ем выбора рационального варианта САПР из числа альтернативных ее вариантов. Эта работа является одной из составляющих общего про- цесса разработки САПР, что определяет состав показателей оценки САПР. В их число входят показатели, характеризующие не только ис- пользование, но и само создание САПР. Общая система показателей выбора ра- ционального варианта САПР включает в себя: 1) показатели оценки создания САПР: отсутствие риска в создании САПР; приемле- мость процесса создания САПР; 2) показатели оценки использования САПР: технико-экономическое совершенство САПР; совершенство организационного взаи- модействия; совершенство интерактивного взаимодействия; отсутствие риска в эксплуата- ции САПР. Более подробное представление этой структуры включает в себя следующую детали- зацию отдельных показателей. Приемлемость процесса создания САПР: затраты на создание САПР; трудоемкость и продолжительность создания САПР. Отсутствие риска в создании САПР: от- сутствие риска в создании технического и программного обеспечений. Технико-экономическое совершенство САПР: производительность САПР; качество результатов проектирования; качество проект- ной информации; стоимость эксплуатации САПР. Совершенство организационного взаимо- действия: доступность периферийных и цен- тральных ресурсов САПР; организационное удобство работы пользователей САПР; просто- та освоения технологии работ в рамках САПР. Совершенство интерактивного взаимо- действия: реактивность, коммуникативность и функциональность взаимодействия пользова- теля САПР с ЭВМ; эргономическое удобство работы пользователей САПР. Отсутствие риска в эксплуатации САПР: в эксплуатации технического и программного обеспечений.
ПРОЕКТНАЯ ОЦЕНКА ПРОИЗВОДИТЕЛЬНОСТИ САПР 601 Приведенный перечень показателей ох- ватывает все факторы, влияющие на выбор рационального варианта САПР. Каждый из этих факторов имеет свою весомость в общей оценке САПР. Кроме того и степень различия этих факторов в альтернативных вариантах САПР не является одинаковой. В связи с этим для комплексной оценки САПР в практике автоматизации проектирования используются обычно критерии вида N Ко^ВКл), (7.5.1) /=1 1де Kq - комплексный критерий оценки САПР; BKi - весовой коэффициент (обычно от 0 до 1) /-го показателя выбора рациональ- ного варианта САПР; rt - рейтинговая оценка (обычно от 0 до 100 %) /-го показателя выбора рационального варианта САПР. Вопросы критериальной оценки САПР в полном объеме рассмотрены в работе [1]. 7.5.2. ПРОЕКТНАЯ ОЦЕНКА ПРОИЗВОДИТЕЛЬНОСТИ САПР Согласно п. 7.3.5 существует идентич- ность понятий интенсивности проектирования и производительности САПР. Оба эти понятия определяют число ПР, прорабатываемых в единицу времени. Но если интенсивность про- ектирования является характеристикой про- ектного процесса, подлежащего автоматиза- ции, то производительность САПР является характеристикой конкретной системы автома- тизированного проектирования. При проектной оценке рассматриваемого показателя получила распространение оценка не самой производительности САПР, а ее от- носительного роста по сравнению с исходны- ми условиями автоматизации. В качестве таких условий, предшествующих созданию САПР, принимается уровень автоматизации, соответ- ствующий традиционной обработке информа- ции в вычислительных центрах коллективного пользования. Факторами, отличающими САПР от ис- ходного уровня автоматизации, в этом случае являются: информационная интеграция отдельных расчетных задач в единый процесс; эксплуатационное и функциональное удобство работы пользователей САПР со сред- ствами автоматизации проектирования; интерактивность взаимодействия пользо- вателей САПР с ЭВМ. Эти факторы реализуются в САПР соот- ветствующими компонентами методического, программного, математического, лингвистиче- ского, технического, организационного и ин- формационного обеспечений автоматизации проектирования. Статистическая обработка опытных дан- ных, зафиксированных в процессах автомати- зированного проектирования с использовани- ем различных САПР, дает следующую зависи- мость коэффициента роста производительно- сти работ, обеспечиваемого благодаря внедре- нию САПР / А-°>82 F' _ V I ^ПОЛЬЗ I (a лпр-лпр— V*pnp) \lk] ’ к лрмп J ' ' (7.5.2) ще Х'лр - удельный показатель роста произ- водительности; - число пользовате- k лрмп ) лей САПР, приходящееся на одно рабочее место проектировщика в составе технического обеспечения САПР; ЛрПр - коэффициент рас- параллеливания проектных работ по времени их выполнения или используемым трудоресур- сам; 1% - число ПР, прорабатываемых по эле- менту Л-го уровня детализации ТО. Входящие в эту формулу показатели раз- личны по своему смыслу. Так яв- k лрмп ) ляется- параметром самой САПР и характери- зует эту систему вне зависимости от того про- цесса проектирования, в реализации которого она принимает участие. В отличит от этого Лрпр и 1% являются показателями процесса проектирования, а АГпр - показателем как процесса проектирования, так и самой САПР. Вопрос о величине /£ был подробно рассмот- рен выше (см. табл. 7.3.1). Статистические значения остальных показателей, связанных с особенностями автоматизируемого процесса проектирования представлены в табл. 7.5.1. К проектным работам группы А относят процессы с последовательным выполнением всех проектных задач. В практике авиацион- ного проектирования такими работами явля- ются, например: формирование технической концепции летательного аппарата; разработка чертежей общего вида агрегатов конструкции и компоновочных чертежей размещения обору- дования. К работам группы В, характеризующимся распараллеливанием процессов решения от- дельных задач, относят: проектную разработку облика и уточненный анализ летно- технических характеристик летательного аппа- рата; анализ напряженно-деформированного состояния конструкции.
602 Глава 7.5. МЕТОДЫ ОЦЕНКИ ОРГАНИЗАЦИОННО-ТЕХНИЧЕСКИХ СИСТЕМ 7.5.1. Сптепнеские значения показателей Показатели Работы группы А Работы группы В САПР типа I САПР типа II САПР типа I САПР типа II ^пр 3,25 6,25 2,25 4,5 Лпр 1 3 Системами, обозначенными как САПР типа I и II, соответственно являются САПР без интерактивной машинной графики и САПР с интерактивной машинной графикой. Зависимость (7.5.2) позволяет сделать ряд выводов относительно возможного повышения производительности благодаря внедрению САПР. Так, применительно к работам групп А и В в зависимости от величины показателя Шпольэ можно выделить несколько случаев Ч ярмп J в сравнении технико-экономической эффек- тивности альтернативных вариантов САПР. Случай 1: при 1 < Отполы < 7 САПР Ч ярмп J с интерактивной машинной графикой обладает. большим значением /Гпр, чем САПР без инте- рактивной машинной графики. Случай 2: при > 7 САПР с ч ярмп J интерактивной машинной графикой уступает по величине Кпр системам, не имеющим та- кого средства автоматизации проектирования. 7.5.3. ОЦЕНКА КАЧЕСТВЕННОГО ВЛИЯНИЯ САПР НА ХАРАКТЕР ПРОЕКТНОЙ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА Опыт эксплуатации первых САПР пока- зал наличие в автоматизации проектирования определенных проблем социально-психологи- ческого характера. Внедрение САПР ведет к резкому возрастанию интенсификации умст- венного труда проектировщиков и повышению требований к их профессиональной подготов- ке [6]. Для количественной оценки того качест- венного влияния, которое оказывает внедре- ние САПР на характер проектной деятельно- сти человека, в практике автоматизации про- ектирования нашло применение понятие про- дуктивности труда проектировщика. Оно свя- зано с сопоставлением объемов интеллекту- альной и неинтеллектуальной деятельности в работе, выполняемой проектировщиком. Ин- теллектуальную часть составляют различные операции мыслительного характера, связанные с постановкой задачи, оценкой полученных результатов, принятием решений, генерирова- нием идей и др. К неинтеллектуальной части деятельности относятся различные операции, связанные с вычислением, хранением, оформ- лением и передачей информации. При автома- тизации конструкторских задач продуктив- ность характеризуется обычно как отношение объемов инженерного труда к труду чертежни- ка, присутствующих в работе конструктора. Используя существующее понятие про- дуктивности труда, введем в рассмотрение относительный коэффициент продуктивности q, определяющий долю интеллектуального труда в работе проектировщика, в том числе в работе пользователя САПР. Анализ опытных данных по эксплуата- ции существующих САПР позволяет связать этот коэффициент с удельным показателем роста производительности САПР, рассмотрен- ным выше. Выделяемая с учетом различных факторов, характеризующих особенности про- цесса проектирования, организацию этого процесса и организацию труда самого пользо- вателя САПР, величина показателя /Гпр дос- таточно однозначно определяет те условия, в которых реализуется продуктивность работы использователей САПР. На рис. 7.5.1 имеющиеся статистические оценки продуктивности пользователей САПР, выраженные в виде коэффициентов q, по- ставлены в соответствие тем величинам пока- зателя Х'пр, которые приняты для этих САПР на основании данных табл. 7.5.1. Общая тен- денция изменения коэффициента продуктив- ности выражается зависимостью q = 0,25 + 0,083 Гпр. (7.5.3) Достигнутые в существующих САПР ве- личины JTnp, соответствующие автоматизации работ группы А, как она определена примени- тельно к данным табл. 7.5.1, находятся уже достаточно близко к тому пределу, который
СПИСОК ЛИТЕРТУРЫ 603 Рис. 7.5.1. Влвянве ажгоюпазацда проектирована ва нтенсяфакяцпо антеллмпуалыюМ деягельноств пользователей САПР определяется предельным значением q = 1,0. Величина /Гпр = 9 является средним значени- ем этого предела. Ее не следует рассматривать как предел повышения производительности САПР вообще. Очевидно, что величины /Гпр, большие того предела, который определяется условием q= 1,0, должны обеспечиваться в САПР пу- тем расширения и совершенствования компо- нентов специального математического обеспе- чения, относящихся к области искусственного интеллекта. СПИСОК ЛИТЕРАТУРЫ 1. Володин В. В. Автоматизация проекти- рования летательных аппаратов. М.: Машино- строение, 1991. 2. Егер С. М., Лисейцев Н. К., Самойло- вич О. С. Основы автоматизированного проек- тирования самолетов. М.: Машиностроение, 1986. 3. Казаков И. Е., Артемьев В. М. Опти- мизация динамических систем случайной структуры. М.: Наука, 1980. 4. Комплекс общеотраслевых руководя- щих материалов по созданию АСУ и САПР. М.: Статистика, 1980. 5. Норенков И. П. Введение в автомати- зированное проектирование технических уст- ройств и систем. М.: Высшая школа, 1986. 6. Федосов Е. А. Автоматизация проекти- рования сложных технических систем Ц Вест- ник АН СССР, 1986. № 10. 7. Шнейдерман Б. Технология програм- мирования (человеческие факторы в вычисли- тельной технике). М.: Радио и связь, 1984.
Раздел 8 ЧЕЛОВЕКО-МАШИННЫЕ СИСТЕМЫ УПРАВЛЕНИЯ Количество литературы и справочных из- даний по "человеческому фактору" в технике вряд ли существенно уступает объему литера- туры по "чисто машинным" системам управле- ния. Сведенные воедино сведения по "человеко-машинным системам" (ЧМС) соста- вили бы многотомный труд. Поэтому далее приводится лишь систематизированное изло- жение основных понятий и идей в области ЧМС управления с тем, чтобы специалист в области систем управления, не знакомый с эргономикой, получил четкое общее представ- ление о ЧМС управления и мог углубить по- лученные сведения из основных трудов по ЧМС, приведенных в списке литературы. Подробно излагаются лишь вопросы проекти- рования "дискретных" ЧМС управления, наи- более часто требующиеся в работе проекти- ровщика ЧМС, а также важные вопросы про- ектирования ЧМС слежения, недостаточно, по мнению авторов, освещенные в литературе. В технической литературе и документации часто также используется абревиатура СЧМ - систе- мы "человек-машина". Глава 8.1 ОБЩИЕ СВЕДЕНИЯ О ЧМС. РОЛЬ ЧЕЛОВЕКА-ОПЕРАТОРА И ФОРМЫ ОПЕРАТОРСКОЙ ДЕЯТЕЛЬНОСТИ Эффективное применение современной техники зависит от деятельности управляющих ею людей. При работе человека или группы людей с техническими устройствами возникает задача согласования структуры, характеристик и параметров технических устройств с психо- логическими характеристиками человека. Ре- шение этой задачи оказывается возможным только при изучении работы технических уст- ройств и взаимодействующих с ними людей в единой системе с окружающей и взаимодейст- вующей средой. Строго говоря, любая форма взаимодействия человека или труппы людей с машинами представляет собой человеко- машинную или, другими словами, эргатиче- скую систему. Но в научно-технической лите- ратуре, как правило, под человеко-машинной системой понимают систему, состоящую из человека (труппы людей) и машины (техничес- ких устройств), посредством которой человек осуществляет трудовую деятельность [8, 18, 19, 26, 30, 31, 41, 46, 47, 54, 59]. По целевому назначению и по характеру деятельности чело- века выделяют следующие труппы систем "человек-машина": управляющие, в которых основной зада- чей человека (труппы людей) является управ- ление машиной; обслуживающие, в которых задачей чело- века является контроль состояния машинной системы, поиск неисправностей и т.д.; обучающие, служащие для выработки у человека определенных навыков; информационные, обеспечивающие поиск, накопление или получение необходимой для человека информации. В данном разделе рассматриваются управляющие человеко-машинные системы. Поэтому далее слово "управляющие" опускает- ся, а под человеко-машинной системой (ЧМС) будем понимать управляющие ЧМС, или, что то же самое, ЧМС управления. Человек, осуществляющий трудовую дея- тельность, основу которой составляет взаимо- действие с предметом труда, машиной и внешней средой посредством информацион- ной модели и органов управления, называется человеком-оператором (ЧО). Под информационной моделью здесь, как и в ряде работ по инженерной психоло- гии, понимается совокупность приборов и средств отображения информации, с которыми работает человек (группа людей). В некоторых работах по инженерной психологии и эргоно- мике под информационной моделью понима- ется совокупность сведений о состоянии тех- нических средств и окружающей среды, полу- чаемых человеком как от приборов и средств отображения информации, так и непосредст- венно воспринимаемых органами чувств чело- века помимо приборов (неприборная инфор- мация). Примерами неприборной информации могут служить: звук работающего мотора автомашины, характеризующий его исправность и режим работы; визуальная информация о внекабинной обстановке (о состоянии дороги и о поворотах - для шофера, о положении линии горизонта и облачности - для летчика);
ХАРАКТЕРИСТИКИ УСЛОВИЙ ОБИТАНИЯ 605 | неприборная информация Рис. 8.1.1. Типовая структурная схема ЧМС управления механические воздействия (вибрации и перегрузки), характеризующие состояние и маневры транспортного средства. Упорядоченную совокупность действий человека-оператора, направленную на дости- жение поставленной перед ЧМС цели, приня- то называть деятельностью оператора. Человек, работающий в системе управле- ния и рассматриваемый как элемент этой сис- темы, представляет собой сложное "устройст- во*’ с многоканальным приемом, переработкой и выдачей информации. Он воспринимает информацию органами чувств (зрением, слу- хом, тактильными ощущениями), отбирает информацию, необходимую для работы, пере- рабатывает ее в центральной нервной системе в соответствии с имеющимися навыками и знаниями с учетом цели функционирования системы и выдает управляющие команды пу- тем перемещения органов управления и выда- чи разовых команд, в том числе речевых. Далее человек воспринимает реакцию управляющего объекта на команду, вырабаты- вает и выдает новую, т.е. работает как звено в замкнутом контуре управления. Имеют место и воздействия среды на че- ловека, управляемый объект и другие элемен- ты (блоки) машинной части ЧМС, не носящие информационного характера. Их воздействие может быть как полезным, так и вредным. В последнем случае влияние их стремятся свести к минимуму специальными мероприятиями. Типовая структурная схема управляющей ЧМС представлена на рис. 8.1.1. Глава 8.2 ПСИХОФИЗИОЛОГИЧЕСКИЕ ХАРАКТЕРИСТИКИ ЧЕЛОВЕКА-ОПЕРАТОРА 8.2.1. ХАРАКТЕРИСТИКИ УСЛОВИЙ ОБИТАНИЯ Для нормального функционирования в составе системы человек нуждается в опреде- ленных условиях. В первую очередь эти усло- вия характеризуются температурой, влажно- стью, парциальным давлением окружающей
606 Глава 8.2. ПСИХОФИЗИОЛОГИЧЕСКИЕ ХАРАКТЕРИСТИКИ ЧЕЛОВЕКА-ОПЕРАТОРА газовой смеси, освещенностью, механически- ми воздействиями (вибрацией, перегрузками) и др. Для систем различного назначения зна- чения этих параметров регламентируются ве- домственными документами (медико-техни- ческими требованиями, стандартами). Реко- мендации общего характера содержатся в учеб- ной и справочной литературе [3, 6, 12, 57]. В заданных пределах эти параметры под- держиваются так называемыми системами жизнеобеспечения человека-оператора. (Такие системы в книге не рассматриваются, так как выходят за рамки ее тематики). 8.2.2. ХАРАКТЕРИСТИКИ ПРИЕМА, ПЕРЕРАБОТКИ И ВЫДАЧИ ИНФОРМАЦИИ ЧЕЛОВЕКОМ-ОПЕРАТОРОМ Прием информации человеком-операто- ром (ЧО) осуществляется по следующим кана- лам: зрительному (визуальному), акустическо- му (слуховому), тактильному (осязательному), обонятельному, вкусовому. Сигналы, воспринимаемые ЧО, иногда называют афферентными, выдаваемые - эффе- рентными. Пространство информационных прибо- ров, табло и других систем и устройств, пред- ставляющих информацию человеку-оператору, называют информационным полем, оператора. . В современных ЧМС свыше 70 % ин- формации ЧО получает через визуальный ка- нал, называемый иногда также зрительным анализатором. Использование для передачи информации других каналов может быть ис- пользовано для снижения загрузки зритель- ного канала. Основные характеристики зрительного анализатора, обусловливающие работу ЧО в ЧМС: острота зрения; минймальная и макси- мально допустимая яркость сигналов; мини- мально и максимально допустимая освещен- ность информационного поля; оптимальная цветовая гамма; допустимое количество ин- формации, воспринимаемое в единицу време- ни. Формы информации, воспринимаемой акустическим каналом ЧО (иногда называе- мым акустическим анализатором) в ЧМС, довольно разнообразны. Эго и простые звуко- вые сигналы типа "есть-нет" ("звучит-молчит"), и изменение высоты тона, и речевые сообще- ния, порой с весьма сложной семантикой. Для указания направления на объект используется стереофонический эффект. Из вариантов использования тактильного канала лучше других, в достаточном для прак- тического применения объеме, разработан вибротакгильный способ передачи информа- ции. При этом используются вибраторы, за- крепляемые на коже в какой-либо части тела, чаще всего на руках. В простейшем случае появление вибрации сигнализирует, например, об аварийной ситуации. Использование двух вибраторов позволяет судить о знаке сигнала, изменение частоты (обычно от 0 до 10, иногда до 100 Гц) характеризует величину сигнала. Примеры серьезного применения обоня- тельного и вкусового каналов для передачи приборной информации неизвестны. Обоня- тельный канал используется для получения неприборной информации, например, о пожа- ре или об утечке какого-либо газа или жидко- сти. Конкретные значения характеристик анализаторов человека сильно варьируются от одного индивидуума к другому. Так, напри- мер, приводимая обычно в справочниках ост- рота зрения для людей с так называемым 100%-ным зрением (3,5’) довольно часто имеет величину порядка 2’ и даже Г. Для ответствен- ных расчетов используют законы распределе- ния величин. Эти законы обычно задаются квантилями, так как аналитические выражения для их аппроксимации подбираются плохо. В руководствах и справочниках [4, 12, 18, 46, 54, 57, 64 и др.] обычно приводятся "средние” значения характеристик. Данные о законах распределения характеристик по массе операторов обычно представляют собой собст- венность организаций или фирм и тщательно охраняются. На характеристики ЧО влияют и его функциональные состояния, в первую очередь эмоциональные. О выборе значений характеристик при расчете ЧМС см. п. 8.3.4. 8.2.3. ВЛИЯНИЕ ЭМОЦИОНАЛЬНЫХ СОСТОЯНИЙ ЧО НА ХАРАКТЕРИСТИКИ ПРИЕМА, ПЕРЕРАБОТКИ И ВЫДАЧИ ИНФОРМАЦИИ Эмоциональными состояниями называют состояния человека, вызываемые пережива- ниями им своего отношения к внешнему миру и к самому себе. Примером эмоциональных состояний ЧО являются радость, гнев, страх и ДР. Известно много моделей эмоциональных состояний человека. Имеет место определен- ная терминологическая путаница. Например, словом "стресс" различные авторы обозначают. изменение физиологических параметров под воздействием внешних раздражителей; дефицит времени при выполнении рабо- ты; нервно-эмоциональный срыв; эмоциональную напряженность любого уровня, в том числе слабую и умеренную. Далее излагается удобная для практиче- ских целей модель, в основном соответствую-
КЛАССИФИКАЦИЯ ВИДОВ ДЕЯТЕЛЬНОСТИ В "ДИСКРЕТНЫХ" ЧМС 607 щая [18]. Модель не доведена до уровня стро- гой математической записи, а излагается на вербальном уровне, что не лишает ее практи- ческой полезности. Эмоции различают по силе и знаку. По силе эмоции могут принимать множество зна- чений в диапазоне от очень слабых до умерен- ных, сильных и очень сильных. С увеличени- ем до определенного уровня силы эмоций увеличивается вероятность безошибочного выполнения операций и уменьшается время их выполнения. Уменьшается также латентный период реакций. Все это обусловливает повы- шение качества деятельности ЧО. При очень сильных эмоциях наступает нервно-эмоциональный срыв, в результате чего резко ухудшаются все характеристики деятельности. Уровень эмоциональной напря- женности, при котором наступает нервно- эмоциональный срыв, называют уровнем эмо- циональной устойчивости. По знаку эмоции делят на положитель- ные (радость и др.) и отрицательные (страх и др.). Знак эмоций не влияет на характеристи- ки деятельности, но отрицательные эмоции, даже слабые, оказывают вредное влияние на здоровье человека, вызывая так называемые застойные состояния. (Очень сильные поло- жительные эмоции также могут нанести ущерб здоровью. Известны случаи инфаркта миокар- да при получении радостных сообщений). Из изложенного следует важный практи- ческий вывод. Если ЧМС спроектирована по характеристикам ЧО, работающего в спокой- ной обстановке, без эмоциональной напря- женности, то в реальных эксплуатационных условиях она покажет результаты, по крайней мере, не хуже расчетных (если не будет чрез- мерно сильных эмоций ЧО, вызывающих у него нервно-эмоциональный срыв; уровень эмоциональной устойчивости может быть по- вышен специальной психологической подго- товкой ЧО и применением медицинских пре- паратов). 8.2.4. ОБЕСПЕЧЕНИЕ УСЛОВИЙ РАБОТЫ ЧЕЛОВЕКА-ОПЕРАТОРА В ЧМС Человек-оператор, как и устройства, и блоки ЧМС, нуждается в определенных усло- виях для нормального функционирования в составе ЧМС [4, 8, 10, 46, 54, 62, 64]. В допус- тимых пределах эти параметры поддерживают- ся так называемыми системами жизнеобеспе- чения [3]. Глава 8.3 ПРОЕКТИРОВАНИЕ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА (ГРУППЫ ЛЮДЕЙ, ЭКИПАЖА) В "ДИСКРЕТНЫХ" ЧМС УПРАВЛЕНИЯ НА УРОВНЕ СОВОКУПНОСТИ ОПЕРАЦИЙ Изложенные далее сведения по проекти- рованию деятельности на уровне совокупности операций, часто называемой так же "дискрет- ной деятельностью", представляют собой хо- рошо отработанную при проектировании многих ЧМС разновидность способов расчета ЧМС, описанных во многих работах, напри- мер [18, 19, 20, 21, 26, 31, 46]. Несмотря на простоту идей и элементар- ность расчетов излагаемая далее методика по- зволяет ответить на ряд важных вопросов, возникающих при проектировании ЧМС, на- пример: определить необходимое число членов экипажа; убедиться в возможности выполнения членом экипажа заданной работы с заданной вероятностью; определить требования к уровню занято- сти членов экипажа работой в подсистемах ЧМС и т.д. 8.3.1. КЛАССИФИКАЦИЯ ВИДОВ ДЕЯТЕЛЬНОСТИ В "ДИСКРЕТНЫХ" ЧМС Деятельность человека в системе управ- ления может быть представлена как совокуп- ность чередующихся операций и пауз. Среди операций, выполняемых человеком-операто- ром ЧМС можно выделить: операции визуаль- ного .поиска, обнаружения, распознавания сигналов, операции слежения, операции кон- троля, логические операции, операции приня- тия решений, "простые" операции (разовые команды), типа включения и выключения тумблеров, нажатия кнопок, клавиш и т.д. Для исследования каждой из упомянутых операций используется свой специфический математический аппарат, методы математиче- ского или полунатурного моделирования. Для проектирования деятельности на уровне совокуп- ности операций для каждой из операций расчет- ными методами, экспериментально или эксперт- ным путем определяются вероятность ее своевре- менного и безошибочного выполнения и время ее выполнения. Для большинства расчетов доста- точно знания математического ожидания времени выполнения операций. В специальных случаях используют закон распределения времени вы- полнения операций либо его числовые характе- ристики (дисперсию и др.).
608 Глава 8.3. ПРОЕКТИРОВАНИЕ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА В "ДИСКРЕТНЫХ" ЧМС Рис. 8.3.1. Компоненты деятельности человека-оператора Характеристики многих простых опера- ций удобно определят^ по методике, приве- денной в [20]. Разовые команды вводятся включением и выключением тумблеров, нажатием клавиш, кнопок, являющихся конструктивными эле- ментами связи ЧО с машинной частью ЧМС. При большом количестве вводимых разовых команд для снижения числа конструктивных элементов используются многофункциональ- ные пульты, а также речевой ввод команд. При выборе конструктивных элементов связи в процессе проектирования ЧМС целесообраз- но воспользоваться рекомендациями [2, 36]. 8.3.2. АЛГОРИТМИЧЕСКОЕ ОПИСАНИЕ ДЕЯТЕЛЬНОСТИ Для описания деятельности экипажа ис- пользуют алгоритмы функционирования. Из- вестны три формы записи алгоритмов: вер- бальная, схемно-графическая, символьная (в форме Ляпунова-Шестопала), иногда назы- ваемая логической. При проектировании деятельности при- меняют любую из форм, но обычно - вербаль- ную форму в виде таблиц и компактную на- глядную символьную форму записи [26, 31, 41, 54]. В приведенном ниже примере имеют- ся следующие отличия от приведенной в руко- водствах формы символьной записи: аффе- рентные операции обозначены символом "К”; эфферентные операции обозначены символом "В"; в виде подстрочного индекса записано время выполнения операций; надстрочный индекс при символе "К" или "В" несет инфор- мацию о вероятности pi безошибочного вы- полнения f-й операции; вероятность pt опре- деляется по формуле Pi = 1 - п х 10-3, где л - надстрочный индекс; в скобках после символов "К" или "В" записываются поясне- ния. Рассмотрим пример. Пусть необходимо доставить груз на двухместном самолете на дрейфующую полярную станцию в сложных метеорологических условиях (в условиях по- лярной ночи, в тумане при сильном ветре). Визуальное наблюдение станции невозможно. Поиск, обнаружение и распознавание можно выполнить только по радиолокатору. Посадка самолета исключена. Груз можно только сбро- сить. На парашюте спускать груз нельзя - уне- сет ветром. Сброс необходимо осуществить с высокой точностью, чтобы груз попал на льдину, а не в воду. Алгоритм деятельности экипажа в вер- бальной форме, т.е. в виде словесного описа- ния операций, выполняемых экипажем с ука- занием характеристик операций, приведен в табл. 8.3.1.
АЛГОРИТМИЧЕСКОЕ ОПИСАНИЕ ДЕЯТЕЛЬНОСТИ 609 8.3.1. Алгоритм деятельности экипажа в вербальной форме Действия первого летчика П с Pi Действия второго летчика П с Pi Пилотирование самолета Поиск, обнаружение и Периодический контроль распознавание дрейфую- действий второго летчика Периодический контроль дальности до места разгрузки щей станции Принятие доклада второго Доклад первому летчику летчика об обнаружении места разгрузки Начало расчетного режима Пилотирование самолета Ввод в навигационный 2 0,993 Периодический контроль комплекс информации о действий второго летчика режиме полета Периодический контроль Восприятие информации 1,0 0,998 дальности до места разгрузки о нормальной работе ра- диолокатора Контроль наличия на экране радиолокатора отметки расчетного места падения груза 1,0 0,998 Включение фотокон- трольного прибора 1,5 0,998 Совмещение отметки 3 0,999 расчетного места падения груза с заданным местом разгрузки Нажатие кнопки привяз- ки 0,5 0,999 Принятие доклада второго 3 0,999 Доклад первому летчику о 3 0,999 летчика о выполнении при- вязки выполнении привязки Контроль индикатора даль- 2,5 0,995 Установка оптимального 4 0,999 ности до точки разгрузки масштаба на экране ра- диолокатора Контроль отклонения дирек- торного показателя 2,5 0,999 Выполнение наведения по 5 0,993 Уточнение распознавания 3 0,999 курсу места разгрузки Контроль боковой наводки 1 0,999 Корректировка привязки 3 0,999 Контроль текущей дальности D до места разгрузки Если дальность до места раз- грузки D > /^-возврат к вы- полнению операций "Контроль индикатора дальности" и последующих, если D <, Dp - 2 0,998 переход к выполнению сле- дующих операций Включение выключателя "Под- 1,5 0,998 Контроль работы навига- 2 0,998 готовка сброса" ционного комплекса Контроль по дирекгор- ному устройству отработ- 1 0,999 ки первым летчиком за- данного курса Контроль появления ли- нии заданного пути на экране радиолокатора 1 0,999 20 1023
610 Глава 8.3. ПРОЕКТИРОВАНИЕ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА В "ДИСКРЕТНЫХ" ЧМС Продолжение табл. 8.3.1 Действия первого летчика Th с Pi Действия второго летчика Тьс Pi Восприятие сигнала "Разгрузка" 1 0,998 Контроль правильности боковой наводки 1 0,999 Нажатие кнопки "Разгрузка" 0,5 0,999 Контроль совмещения отметки расчетного места падения груза с заданным местом разгрузки 1 0,999 Контроль сигнала "Разгрузка проведена" 1 0,998 Корректировка привязки 3 0,998 Конец расчетного режима Набор высоты и разворот на I I I аэродром Тот же алгоритм, записанный в символьной форме, выглядит следующим образом: I Пл К (II) п К (D) кЦд II) П п К (II) л К (D) 0 В^(Д1) Bj(НК) К] (исправность РЛ) К, (МР) I П л К (II) л К (D) К*(Д II) К52 5(D) К* 5(ДУ) II В| 5(ФКП) Вз(ОРМ-ьМР) Bq j (Привязка) В](Д l) В4 (Масштаб) I Ф1 Пу (Курс) К[(БН) Кз(Р) a(.D Dp) Т1 В|5 (Подготовка сброса) К? (Разгрузка) II К^(МР) В^(ОРМ -♦ МР) К^(НК) К} (Курс) К} (ЛЗП) К} (БН) I BQ S (Разгрузка) К} (Разгрузка проведена) П II К| (ОРМ -+ МР) В J (ОРМ -► МР) Условные обозначения: I - первый летчик; II - второй летчик; П - пилотирование самолета; К - афферентные действия; В - эфферентные действия; а(Л < Dp) - логическая операция с но- мером перехода по стрелке; ОРМ - отметка расчетного места паде- ния груза; МР - место разгрузки; И - индикаторы; БН - боковая наводка; НК - навигационный комплекс; —> - совмещение; D - текущая дальность до места разгрузки; | - одновременность выполнения опера- ций; ЛЗП - линия заданного пути; Dp - заданная дальность до места раз- грузки (Dp = 5 км); Д - доклад; ФКП - фотоконтрольный прибор; О - обнаружение места разгрузки. Тот же алгоритм в виде блок-схемы (в схемно-графической форме) представлен на рис. 8.3.2. Циклограмма представляет собой графи- ческое представление последовательности опе- раций на оси времени. Для большей наглядно- сти вдоль оси времени можно расположить блоки алгоритма. Тот же алгоритм в более привычной для инженеров и программистов схемно-графической форме, т.е. в виде блок- схемы, представлен на рис. 8.3.2.
АЛГОРИТМИЧЕСКОЕ ОПИСАНИЕ ДЕЯТЕЛЬНОСТИ 611 Г~П~1 ф П пК(П) nK(D) О- ..Начало расчетного режима.. ккоп) * B^DI) пК(П) В$(НК) дкаа К|(Исррокостк РЛ) к5(МР) В&ФКП) пК(П) В^(ОРМ->МР) |к{(орм->мрЯ |ВУОРМ->.МР)1 Рас. 8.3.2. Алгоритм деэтелыюста экипажа в схемно-графической форме (блок-схема алгоритма) 20
612 Глава 8.3. ПРОЕКТИРОВАНИЕ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА В "ДИСКРЕТНЫХ" ЧМС 8.3.3. ПОКАЗАТЕЛИ ДЕЯТЕЛЬНОСТИ Для оценки на уровне совокупности опе- раций деятельности человека, работающего с машиной, используют следующие показатели: показатель занятости; вероятность безошибоч- ной работы. Показатель занятости А характеризует резерв свободного времени оператора. Вероят- ность безошибочного выполнения операций характеризует операционную надежность опе- ратора и используется при расчете надежности и эффективности ЧМС. Показатель занятости представляет собой отношение времени // , затрачиваемого на выполнение всех / операций, к располагаемо- му времени Тр: Располагаемое время экипажа определя- ется условиями работы системы. Например, при сбросе груза с самолета в заданную точку располагаемое время экипажа определяется как время от обнаружения заданной точки до подхода самолета к той точке своей траекто- рии, после которой сброс груза в заданную точку невозможен. При работе с А < 1 располагаемое время' расходуется экипажем на выполнение опера- ций и паузы в работе ще tnj - время у-й паузы. Вероятность безошибочной работы опе- ратора для алгоритма, представляющего собой последовательность операций, определяется согласно теореме произведения вероятностей как произведение вероятностей безошибочного выполнения последовательных операций р = Пл- i Как правило, в алгоритме функциониро- вания ЧМС вероятности перехода в каждом из логических условий различаются на порядок и более. В этом случае оценка безошибочной работы, полученная только по последователь- ности наиболее вероятных операций, практи- чески не отличается от результата более слож- ных вычислений, выполненных с учетом всех возможных реализаций алгоритма. Для случая близких значений вероятно- стей переходов в логических условиях алго- ритмов для расчетов целесообразно просчитать цепочки операций для каждого варианта логи- ческого условия, а в случае их большого числа или при необходимости получить осредненные цифры можно воспользоваться методами, из- ложенными, например, в [12, 18, 46, 54]. 8.3.4. ИСХОДНЫЕ ХАРАКТЕРИСТИКИ ЧЕЛОВЕКА-ОПЕРАТОРА ДЛЯ РАСЧЕТА ПОКАЗАТЕЛЕЙ ДЕЯТЕЛЬНОСТИ Распространенное мнение, что ЧМС должна проектироваться на некоторого "среднего" оператора следует считать ошибоч- ным. Рассмотрим простой пример. Пусть не- который параметр X (например, время выпол- нения некоторой операции) подчиняется не- которому симметричному (для простоты рас- суждений) закону распределения. Если система выполнена с расчетом на оператора со средним значением параметра X = А^р, то все операторы со значением пара- метра X > Хср справятся с работой лучше "среднего" оператора, а операторы с X < А^р с работой не справятся. Получается абсурдная ситуация: половина этих ЧМС в эксплуатации не будут удовлетворять предъявляемым требо- ваниям. В реальной жизни столь очевидной нелепости почти не встречается, так как при расчетах берут либо значение параметра близ- ким к A^nin, называя его А^р, либо вместо ма- тематического ожидания берут моду несим- метричного закона распределения, либо, за счет двух-трех средних квадратических откло- нений сближают расчетное значение X с А^щ, резко сокращая тем самым число экземпляров ЧМС, не отвечающих заданным требованиям. Если ЧМС с характеристиками самого слабого оператора (с параметром А^щ) удовле- творяет предъявляемым требованиям, то со всеми остальными операторами она будет ра- ботать, по крайней мере, не хуже. Поэтому при эргономическом проектировании СЧМ необходимо использовать характеристики са- мого "плохого" из заданного контингента опе- раторов, т.е. оператора с наихудшими (из до- пустимого диапазона) характеристиками. 8.3.5. РАЦИОНАЛЬНЫЕ ЗНАЧЕНИЯ ПОКАЗАТЕЛЕЙ ДЕЯТЕЛЬНОСТИ Показатель занятости каждого члена экипажа рекомендуется выбирать в пределах: 0,7 < А < 1 при длительности работы, не превышающей нескольких десятков секунд; 0,2 < А < 0,7 при длительности работы, не превышающей нескольких минут; 0,1 < А < 0,2 при длительности работы порядка десятков минут и более. Значений А < 0,1 следует избегать, так как при столь малой занятости нарушается
ОСНОВНЫЕ ТРЕБОВАНИЯ К ПОКАЗАТЕЛЯМ ДЕЯТЕЛЬНОСТИ В ПОДСИСТЕМАХ ЧМС 613 принцип "активного оператора", в результате чего снижается вероятность безошибочной работы и увеличивается время реакции на маловероятные стимулы (сигналы аварии, от- казов и др.). При расчетах может оказаться, что А > 1. На первый взгляд человек не может справиться с заданной работой в отведенное (располагаемое) время. Однако это не совсем так. Дело в том, что при расчете А использу- ются //, соответствующие отсутствию эмоцио- нальной напряженности, а под влиянием де- фицита времени у человека повышается эмо- циональная напряженность (см. раздел 8.2.3). В состоянии повышенной эмоциональной напряженности, не превышающей уровня нервно-эмоционального срыва, сокращается время выполнения операцией, (что снижает А) и повышается вероятность их безошибочного выполнения. По некоторым данным [21], вре- мя выполнения операций может сокращаться почти в 2 раза, по другим данным - в 1,3 раза. Тем не менее, при проектировочных рас- четах следует избегать значений А 1, по- скольку фактор дефицита времени в условиях реальной работы может сочетаться с другими эмоциогенными факторами (опасностью и т.п.), что может привести к нервно- эмоциональному срыву, при котором проис- ходит значительное увеличение времени вы- полнения операций и даже полный распад деятельности. В результате своевременное вы- полнение нужной последовательности опера- ций оказывается невозможным, и ЧМС не выполняет своей задачи. Другими словами проектирование ЧМС с А £ 1 приводит к снижению ее надежности. Тем не менее, в некоторых исключитель- ных случаях (например, при невозможности технической реализации, обеспечивающей снижение занятости) допустимо использовать значения 1 < А < (1,3 ... 2), но при этом сле- дует помнить, что надежность работы операто- ра может снизиться на непредсказуемую вели- чину. Поэтому при последующей эксперимен- тальной отработке ЧМС на эти режимы следу- ет обратить особое внимание. 8.3.6. СОВМЕЩЕННЫЕ ОПЕРАЦИИ Операторы часто применяют совмещение операций, что сокращает суммарное время выполнения всех операций. Следовательно, проектирование деятельности без учета со- вмещения операций ведется с некоторым "запасом", другими словами, если расчет пока- зывает, что оператор успевает выполнить за- данные операции, то в реальной работе он их выполнит, имея в запасе некоторое свободное время. В том случае, если расчетная занятость оказывается больше нормы, для ее формаль- ного снижения используют совмещение опе- раций. Совмещения операций во времени для каждого отдельного члена экипажа при проек- тировании деятельности следует избегать. При необходимости допускается совмещение во времени не более двух операций двигательной модальности. Принято считать, что время вы- полнения совмещенных операций двигатель- ной модальности представляет собой среднее геометрическое времени выполнения каждой операции Т’совм = 7Г12 +Г2 • Возможности для совмещения операций при проектировании деятельности открывает речевая модальность управления. Существуют операции, которые человек принципиально не может выполнить одновре- менно. Такие операции называют несовмести- мыми или несовместными. 8.3.7. ОСНОВНЫЕ ТРЕБОВАНИЯ К ПОКАЗАТЕЛЯМ ДЕЯТЕЛЬНОСТИ В ПОДСИСТЕМАХ ЧМС При наличии в деятельности каждого члена экипажа только несовмещенных опера- ций показатели занятости, определенные для независимых систем, в каждой из которых оператор выполняет функции некоторого зве- на, являются аддитивными. Например, води- тель некоторого транспортного средства вы- полняет одновременно работу по управлению этим средством, работу в комплексе навигации и контроль работы оборудования. Соответст- венно, показатель занятости А = Ai + Л2 + Аз, тде М = ; Т\ - время, затрачиваемое на Л» управление; Л 2 ^2 ~ время, затрачи- ГР ваемое на работу в комплексе навигации; Т Аз = ——; 7з - время, затрачиваемое на рабо- ту по контролю оборудования; Тр - распола- гаемое время. Показатели Л2 и Л3 обычно легко рассчитать, так как известны характеристики операций, выполняемых водителем в комплек- се навигации и по контролю оборудования. Условие аддитивности позволяет предъявить основное эргономическое требование к систе- ме управления, при выполнении которого возможно ручное управление транспортным средством.
614 Глава 8.4. ПРОЕКТИРОВАНИЕ ЧМС СЛЕЖЕНИЯ AjSl-^A*, где к - порядковый номер показателя занято- сти. В нашем примере к = 2, 3. Другими словами, для того, чтобы води- тель справился с возложенной на него рабо- той, занятость управлением не должна превы- шать величины Aj, что должно быть обеспече- но соответствующей структурой системы управления. 83.8. РАСЧЕТ ЧИСЛА ЧЛЕНОВ ЭКИПАЖА Расчет производится путем алгоритмиче- ского описания функционирования ЧМС в конкретных условиях применения и анализа деятельности экипажа. Анализ представляет собой итерационный процесс, на первом шаге которого исследуется работа экипажа в составе одного человека. Если в результате анализа оказывается, что один человек справляется с работой, то в увеличении числа членов экипа- жа нет необходимости и экипаж ЧМС следует ограничить одним человеком. Если занятость человека превышает допустимые нормы или оказывается, что на человека необходимо воз- ложить выполнение несовместимых операций, то необходимо либо автоматизировать часть операций, либо, если автоматизация невоз- можна (или по каким-либо причинам нецеле- сообразна), увеличить число членов экипажа до двух человек и вновь провести анализ дея- тельности. Численность экипажа можно счи- тать обоснованной, если при минимальном количестве членов экипажа занятость каждого члена экипажа находится в пределах нормы и ни на одного члена экипажа не возлагается выполнение несовместимых операций одно- временно (отсутствует совмещение несовмес- тимых операций). Глава 8.4 ПРОЕКТИРОВАНИЕ ЧМС СЛЕЖЕНИЯ 8.4.1. ЭРРАТИЧЕСКАЯ СЛЕДЯЩАЯ СИСТЕМА. ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ В ряду операций, выполняемых челове- ком-оператором при управлении объектами, одной из наиболее сложных является операция слежения. Значение этой операции настолько велико, что выполняющего ее оператора со- вместно с взаимодействующей структурой машинной части часто выделяют в особый тип ЧМС , называемый системой с непрерывным управлением, эрратической следящей систе- мой, или "ЧМС слежения". Под операцией слежения в общем случае понимается совмещение человеком-оператором в течение заданного времени двух символов: 1) задающего (ЗС), перемещающегося в общем случае независимо от человека-оператора, и 2) отслеживающего (ОС), перемещаемого челове- гом-оператором с помощью некоторого органа управления (ручки, педалей и др.). Орган управления связан с отслеживаю- щим символом через машинную часть челове- ко-машинной системы. Машинная часть мо- жет быть механической, электрической, гид- равлической, аэромеханической и др. Машин- ная часть (часто совместно с элементами сре- ды) с позиции теории систем описывается некоторым алфавитным оператором. Приме- рами эрратических следящих систем являются: управление направлением движения ав- томобиля (задающий символ - мысленная ли- ния на дороге, по которой должен двигаться автомобиль; отслеживающий символ - трасса автомобиля; закон движения задающего сим- вола определяется изгибами дороги и скоро- стью автомобиля; орган управления - руль, машинная часть - рулевой механизм и колеса); наведение оптического устройства, не- подвижно установленного на транспортном средстве, на расположенный или перемещаю- щийся во внешнем пространстве объект (ЗС - объект, ОС - оптическое устройство, закон движения - изменение относительного угло- вого положения транспортного средства и объекта, орган управления - руль, штурвал, педали транспортного средства), машинная часть - механизмы, агрегаты и элементы внешней среды, участвующие в изменении углового положения транспортного средства; наведение на внешний объект оптиче- ского устройства, подвижно установленного на транспортном средстве; совмещение подвижного символа с объ- ектом на телевизионном экране или дисплее. Если задающий и отслеживающий сим- волы перемещаются в поле зрения оператора по одной координате (например, по прямой линии), слежение называют одномерным или однокоординатным. Если ЗС и ОС перемеща- ются по двум координатам, например, в плос- кости экрана или в картинной плоскости, слежение называют двумерным или двухкоор- динатным. Слежение может быть и трехкоор- динатным, например, если помимо положения ЗС на плоскости оператор отслеживает и из- менение его размера. Отслеживание размера ЗС может проводиться, например, обрамлени- ем его кольцевым отслеживающим символом. Если оператор при слежении за ЗС на- блюдает его движение относительно некото- рого фона (рамки ВКУ, естественного фона
МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА-ОПЕРАТОРА 615 местности), т.е. помимо ошибки слежения оператор имеет информацию о законе движе- ния цели, слежение называют преследующим. Иногда преследующее слежение называют сопровождающим. Если оператор не имеет информации о движении ЗС, а располагает лишь информацией об ошибке слежения, сле- жение называют компенсирующим, или ком- пенсаторным. Выделяют также разовое совмещение, непрерывное слежение и прерывистое (пре- рывное) слежение. Под разовым совмещением понимают совмещение ОС с неподвижным ЗС. Если ЧО неотрывно стремится совмещать ОС с плавно изменяющим свое местоположе- ние ЗС, говорят о непрерывном слежении (см. разд. 8.4.2, 8.4.3, 8.4.4, 8.4.5). Если же ЧО сознательно периодически совмещает ОС с медленно меняющим положение ЗС, создавая как бы последовательность разовых совмеще- ний, то говорят о прерывном слежении. При исследовании деятельности ЧО отдельные разовые совмещения рассматриваются как отдельные операции, паузы между которыми могут заполняться другими операциями (см. п. 8.3.1). Детальное исследование прерывного слежения проведено в [4]. Анализ психофизиологических особенно- стей работы ЧО в непрерывных ЧМС слеже- ния дан, например, в [56]. 8.4.2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА-ОПЕРАТОРА В ЧМС СЛЕЖЕНИЯ Задача моделирования сенсомоторной дея- тельности. Деятельность человека-оператора (ЧО) по управлению человеко-машинной сис- темой (ЧМС), рассматриваемую как непре- рывный процесс восприятия и преобразования поступающей информации (входного сигнала или стимула) в управляющие воздействия, изменяющие состояние объекта управления, принято называть сенсомоторной. Различные виды сенсомоторной деятельности ЧО в ЧМС охватывают чрезвычайно широкий диапазон операторских профессий: управление направ- лением движения, поддержание высоты и кур- са летательного аппарата, управление техно- логическим процессом и др. В то же время анализ всего разнообразия видов сенсомотор- ной деятельности показывает, что ее основу составляет операция, имеющая характер от- слеживания задающего сигнала в замкнутом контуре регулирования (рис. 8.4.1). Отличие компенсаторного слежения от преследующего состоит в том, что при пресле- дующем слежении оператору предъявляются как стимул так и выходной сигнал объек- та управления х(/), а при компенсаторном - только ошибка слежения е(1) = q(f) - x(f). Встречаются также различные комбинации преследующего и компенсирующего слежения. Задача моделирования сенсомоторной деятельности заключается в формальном опи- сании характеристик ЧО как звена системы управления динамическим объектом. Трудно- сти решения этой задачи обусловлены тем, что указанные характеристики зависят от чрезвы- чайно большого числа различных факторов. С точки зрения проектировщика конкретной системы управления наиболее существенна их зависимость от характеристик отслеживаемого сигнала q(f) и от динамических свойств объек- та управления. Это является следствием, с одной стороны, ограниченности операторских возможностей человека по восприятию, пере- работке информации и выработке управляю- щих команд, с другой стороны, - уникальных адаптационных возможностей человека, его умения приспосабливаться к особенностям динамики конкретного объекта управления. Математическое моделирование деятель- ности позволяет учитывать индивидуальные особенности ЧО, уровень его профессиональ- ной подготовленности, психологическое со- стояние, степень мотивации и т.д. Однако в практике проектирования ЧМС слежения наи- более распространенным является подход, основанный на использовании математических моделей "среднего оператора", т.е. моделей, отражающих характеристики деятельности оператора средней квалификации, средних профессионально важных психофизиологиче- ских качеств и т.д. Несмотря на серьезные недостатки такого подхода, отмеченные в раз- деле 8.3.4, он может быть полезен при созда- нии моделей, предназначенных для изучения основных закономерностей деятельности ЧО. Рис. 8.4.1. Типичная схема полуаигоматической системы слежения: ОУ - объект управления; ИУ - информационное устройство
616 Глава 8.4. ПРОЕКТИРОВАНИЕ ЧМС СЛЕЖЕНИЯ При расчете конкретных систем необходимо учитывать рекомендации разделов 8.3.4 и 8.4.4. Основой для создания математических моделей сенсомоторной деятельности служат результаты экспериментальных исследований процессов слежения [22, 51, 54, 59, 60], веду- щихся как с позиций теории автоматического управления, так и с позиций инженерной пси- хологии. Модели сенсомоторной деятельности 40 можно разделить на две большие группы: ап- проксимирующие и структурно-функциональ- ные. Аппроксимирующие модели. Для обеспе- чения функциональной адекватности доста- точно, чтобы модели и реальный 40 в одина- ковых условиях обладали в некотором смысле близкими реакциями. Поэтому при моделиро- вании часто применяется подход, в котором используется идея "черного ящика", [35, 63]. Для построения аппроксимирующих мо- делей необходимо располагать информацией о реальных процессах слежения в исследуемой системе. При этом задача моделирования сво- дится к наиболее общей задаче идентифика- ции нелинейного математического оператора, связывающего стимул и реакцию 40. Наибольшее распространение получило использование в качестве аппроксимирующих функционалов рядов Винера и Волътерра [71], а также ортогональные разложения, учиты- вающие статистические характеристики вход- ного сигнала [49]. В качестве примера рассмотрим ряд Волътерра t о t t + JjM,l>Tl>T2)«Ctl)«Ct2)<ftlA2+- + 00 tit п ...Т«)П9(Х1)А/- ООО /=1 Для данной системы существует аналог уравнения Винера-Хопфа для определения ядер ряда ку к}, •••> в зависимости от сово- купности моментов случайных процессов их(/) [7]. Преимущество подхода заключается в том, что наращивая степень функционального полинома (степень аппроксимации), можно повысить адекватность модели. Главный недостаток этого подхода состо- ит в чрезмерной вычислительной сложности получения ядер ряда. В связи с этим более конструктивным является класс моделей, по- строенных на основе набора фильтров с иден- тифицируемыми импульсными функциями (линейные аппроксимирующие модели) [52]. Структурно-функциональные модели. По- строение структурно-функциональных моделей 40 опирается на психофизиологический ана- лиз структуры и особенностей его сенсомотор- ной деятельности. По характеру структуры такие модели можно классифицировать на следующие: ли- нейные - нелинейные; дискретные - непре- рывные; детерминированные - стохастические. Линейные модели. Задача формализации деятельности 40 в рамках теории автоматиче- ского управления при заданной структуре объ- екта управления состоит в отыскании переда- точной функции, которая обеспечивает преоб- разование стимула таким образом, что резуль- тат этого преобразования в некотором смысле близок к реакции реального 40. При этом для различных объектов управления получаются различные передаточные функции 40, что является следствием того, что 40 способен менять свои характеристики в достаточно большом диапазоне. Наибольшее распространение получила модель компенсаторного слежения [53], в ко- торой деятельность тренированного 40 моде- лируется передаточной функцией вида uz /_ч = = *е~Л(71/, + 0 Ч0(Р) е(р) (72/, + 1)(Тз/> + 1)’ (8.4.1) где 7\ - отражает способность 40 к прогнози- рованию и экстраполяции стимула; ?2 - по- стоянная времени, за счет которой происходит адаптация 40 к изменению частотных свойств входного воздействия; Т\ и Т2 - также изме- няются в процессе адаптации человека к ма- шинной части 4МС; Т3 - постоянная времени в широких пределах, отражающая запаздыва- ние нервно-мышечной системы; т - латентное время реакции 40. Как показала практика проектирования, во многих случаях в дополнение к основному линейному преобразованию (8.4.1) целесооб- разно включать в модель аддитивный случай- ный сигнал - остаток (ремнанту) г (0 (рис. 8.4.2). Ремнанта есть та часть управляющих ко- манд 40, которая не может быть получена линейным преобразованием входного сигнала. Как показали исследования по идентификации параметров, для величин т и 7з имеются усто- явшиеся оценки: т = 0,1с ... 0,3с; 7з = 0,15с ... 0,25с, величины к, Ту Т} обладают большой вариантностью в зависимости от различных комбинаций воздействия и передаточной
МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА-ОПЕРАТОРА 617 Рис. 8.4.2. Схема модели слежения с ремнантоМ Рис. 8.4.3. Структурная схема одной из моделей ремнанты функции объекта управления. В этой связи линейные непрерывные модели с остатком обычно именуют квазилинейными. Имеется в виду наличие некоррелированной со входом ремнанты и то, что характеристики линейно- сти в значительной степени зависят от ситуа- ции управления. Многочисленные экспери- менты по определению передаточной функции ^Чо(Р) в задачах слежения позволяют сделать вывод, что для линейных объектов управления невысокого порядка и частотного состава сти- мула до 1 Гц квазилинейная модель может быть подобрана так, чтобы хорошо соответст- вовать экспериментальным данным. При этом оказалось, что около частоты среза сос, т.е. частоты, при которой логарифмическая ам- плитудно-частотная характеристика разомкну- той части системы пересекает 0 децибел, ква- зилинейная модель (8.4.1), объединенная с И*оу(р)> приводится к значительно более про- стой форме "переходной модели" [27]: »*ЧО(Р) (8.4.2) р Для построения переходной модели тре- буется только знание величин сос и тс в зави- симости от FTOy(P) и ширины полосы частот входного сигнала Дсо^. Разработка квазилинейных и переходных моделей привела к необходимости детальнее изучить природу ремнанты. Предпринимались попытки построить такую математическую модель остатка, параметры которой были бы инвариантны по отношению к изменениям в ситуации слежения [68]. На рис. 8.4.3 показана структурная схема характерной части одной из моделей ремнанты. Принимаются следующие предложения: 1) каждая производная входного сигнала (в том числе и нулевая), используемая для регулирования, порождает в управляющем сигнале ЧО независимый белый шум; 2) интенсивность белого шума, соответ- ствующего данной составляющей управления, пропорциональна дисперсии этой составляю- щей; 3) как между шумами модели R& и задающим воздействием ^(/)> так и между самими шумами отсутствует корреляционная связь. Из рис. 8.4.3 следует, что данная модель относится к классу квазилинейных, поэтому все шумы модели могут быть сведены в один "эквивалентный" шум R^. Его спектральная плотность хорошо согласуется с опытными точками при должным образом выбранной величине к^/ке . Квазилинейные, переходные модели сен- сомоторной деятельности вместе с моделями ремнанты обладают свойствами функциональ- ной адекватности и конструктивности, в доста-
618 Глава 8.4. ПРОЕКТИРОВАНИЕ ЧМС СЛЕЖЕНИЯ Г МОДЕЛЬ ЧО "1 Рис. 8.4.4. Дискретная модель сенсомоторной деятельности точной степени отражая ограниченность пси- хофизиологических возможностей ЧО. Однако они не включают в себя закон настройки па- раметров для различных ситуаций слежения, а это является необходимым при решении задач синтеза ЧМС. Чтобы устранить указанный недостаток требуется ввести дополнительное предположение о структуре деятельности ЧО. Таким предположением может служить опти- мальность (в некотором смысле) деятельности ЧО в контуре ручного управления. Дискретные модели. Появление дискрет- ных моделей сенсомоторной деятельности вызвано гипотезой о том, что ЧО осуществляет непрерывное регулирование, базируясь на дискретных выборках из входной информа- ции. Данная гипотеза подтверждается анали- зом экспериментальных данных, оценивающих величину частоты квантования стимула в диа- пазоне 2 ... 3 Гц [1]. Характерная структура дискретной модели представлена на рис. 8.4.4. Важными составными частями этой мо- дели являются импульсный элемент и экстра- полятор ИэКС(р), восстанавливающий сигнал стимула в промежутке между моментами съема информации. Типовая передаточная функция экстраполятора имеет вид И^жсСр) = г-1—р—\ • где Т - шаг дискретизации. Ввиду фазового сдвига, вносимого экстраполятором, в качестве FT40(P) обычно используют передаточную функцию вида (8.4.1) с уменьшенным значе- нием времени запаздывания т. Дискретные модели позволяют естест- венно объяснить присутствие в управляющих командах ЧО спектральных составляющих, выходящих за пределы частотного диапазона входного сигнала. Эти спектральные компо- ненты возникают вследствие работы импульс- ного элемента и играют роль, близкую к рем- нанте квазилинейной модели, хотя и качест- венно отличаются от нее ввиду отсутствия стохастичности. К настоящему времени дис- кретные модели не получили широкого рас- пространения по сравнению с непрерывными квазилинейными моделями или моделями, построенными на принципах оптимальной фильтрации Каймана. Нелинейные модели. Психофизиологиче- ские данные о сенсомоторной деятельности ЧО свидетельствуют о наличии в ней нели- нейных эффектов. К числу таких эффектов можно отнести особенности функционирова- ния рецепторов (сенсорные пороги), ограни- чения диапазона скоростей и сил, развиваемых нервномышечной системой, и др. Проявление нелинейных эффектов при слежении можно успешно моделировать, вводя в известные модели типовые нелинейные звенья: зоны нечувствительности, реле и др. Схема полу- чившей распространение нелинейной модели показана на рис. 8.4.5. Самостоятельный интерес представляют исследования режимов отработки системой слежения больших начальных рассогласований и скачкообразных изменений входного воздей- ствия. Применительно к этому случаю разра- ботан ряд моделей [35, 69], в которых меха- низм действий ЧО аналогичен квазиоптималь- ному по быстродействию регулятору. Одним из перспективных подходов явля- ется моделирование деятельности ЧО посред- ством системы с переменной линейно- нелинейной структурой [50]. Положительное качество нелинейных моделей - возможность увеличения функцио- нальной адекватности моделирования в ситуа- циях со сложными видами динамики объекта управления и входного сигнала. Однако, в настоящее время методы прямого нелинейного описания реакции ЧО разработаны еще недос- таточно. Оптимальные модели. Имеется целый ряд указаний на то, что ЧО некоторым образом оптимально настраивает свои динамические характеристики. Это обстоятельство привело к созданию класса, так называемых, оптималь- ных моделей деятельности, основанных на теории оптимального управления в простран- стве состояний [41, 46]. ЧО воспринимает на информационном устройстве сигнал ИО = Яиу - т) + v(0,
МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА-ОПЕРАТОРА 619 Рис. 8.4.6. Оптимальная модель сенсомоторной деятельности ще Нщ - матрица наблюдений, учитывающая возможности ЧО по оценке вектора состояний *об(0; v(0 - случайная погрешность считыва- ния. Предполагается, что на основании на- блюдения y(i) ЧО вырабатывает оценку векто- ра состояния объекта хоб(/), оптимальную в среднеквадратическом. Эта оценка подчиняет- ся известным уравнениям оптимальной фильтрации по Калману [15]. Далее предпо- лагается, что выработанная ЧО оценка хоб(/) используется для настройки управляющих команд ЧО по критерию минимума функцио- нала 1 = М< /[4^06 + UTLU^t Л (8.4.3) ще Т и L - некоторые матрицы, характери- зующие мотивационные особенности деятель- ности ЧО. Управление {/(/), минимизирующее (8.4.3), может быть найдено строго. Таким образом, типовая оптимальная модель являет- ся последовательным соединением калманов- ского фильтра (или экстраполятора) и опти- мального регулятора. Модель содержит ряд свободных параметров: Т, £, корреляционные матрицы шумов К(1) и И^/). Они могут быть идентифицированы на основе анализа реаль- ного процесса управления. Модели, использующие аппарат калма- новской фильтрации, вместе с усовершенство- ванными квазилинейными моделями чаще других используются в качестве основы фор- мализации сенсомоторной деятельности ЧО в ЧМС.
620 Глава 8.4. ПРОЕКТИРОВАНИЕ ЧМС СЛЕЖЕНИЯ 8.4.3. КРИТЕРИИ ОПТИМИЗАЦИИ ЧМС СЛЕЖЕНИЯ Оптимизация чисто машинных следящих систем проводится по какому-либо точност- ному критерию (минимуму среднего квадрати- ческого ожидания ошибки слежения, мини- мальному времени отработки скачка входного воздействиями, предельной ошибке слежения при заданном входном воздействии и др.). В ЧМС слежения к этому критерию до- бавляются критерии, обусловленные работой в системе человека: критерий минимума време- ни адаптации ЧО к машинной части ЧМС, критерий оптимума психофизиологической напряженности ЧО. Понятие оптимума психофизиологиче- ской напряженности (ПФН) неоднозначно. С одной стороны, оптимум ПФН можно трак- товать как уровень ПФН, обеспечивающий наилучшие значения параметров выполнения операций (время выполнения операций и др., см. п. 8.2.3). Этот уровень ПФН соответствует предельному уровню рабочей эмоциональной напряженности, за которым следует нервно- эмоциональный срыв и распад деятельности. Поскольку уровень эмоциональной устойчиво- сти у всех людей различен, рассчитывать ЧМС на такой уровень недопустимо. Нулевой уровень ПФН соответствует полной расслабленности ЧО. Поэтому за оп- тимальный уровень ПФН принимают мини- мальный уровень ПФН, при котором обеспе- чивается работоспособность ЧО, а критерий оптимума ПФН обычно называют критерием минимума ПФН. 8.4.4. ОПТИМИЗАЦИЯ ЧМС СЛЕЖЕНИЯ ПО КРИТЕРИЮ МИНИМУМА ВРЕМЕНИ АДАПТАЦИИ ЧЕЛОВЕКА-ОПЕРАТОРА И МИНИМУМА ПСИХОФИЗИОЛОГИЧЕСКОЙ НАПРЯЖЕННОСТИ Адаптация ЧО к машинной части ЧМС слежения. Для того, чтобы ЧО нормально ра- ботал в современной ЧМС необходим опреде- ленный инструктаж, пробные попытки работы и более или менее длительные тренировки для выработки устойчивых навыков и доведения их до автоматизма. Процессы, происходящие в центральной нервной системе ЧО при тренировках, по- существу, являются процессами адаптации ЧО к ЧМС. Устройства предъявления информации и управляющие устройства в ЧМС слежения, как правило, очень простые, и адаптации к ним ЧО практически не требуется. Адаптация ЧО в ЧМС слежения по-существу представляет собой его адаптацию к динамической структу- ре ЧМС, т.е. изменения передаточной функ- ции оператора. Возможности этих изменений у подавляющего большинства операторов сво- дятся к изменению коэффициента передачи и постоянных времени форсирующего и инер- ционного звеньев в передаточной функции вида (8.4.1) [32, 37, 38]. В процессе тренировок можно выделить три фазы адаптации операторов. Первая фаза характеризуется недопустимо большими ошибками слежения вплоть до потери систе- мой устойчивости и значительными вегетатив- ными сдвигами ЧО. Во второй фазе ошибки слежения снижаются до допустимого уровня, но вегетативные сдвиги и субъективные ощу- щения сложности работы остаются значитель- ными. В третьей фазе адаптации вегетативные сдвиги и субъективные ощущения сложности существенно снижаются и становятся хорошо коррелированными с трудоемкостью работы Те. Ошибки слежения могут несколько сни- жаться и хорошо коррелированы с Те. Длительность фаз адаптации различна в ЧМС с машинной частью различной динами- ческой структуры. В некоторых системах она исчезающе мала (в пределах 1 с). С машинной частью таких ЧМС все операторы могут рабо- тать практически сразу, без предварительных тренировок [37, 38]. Структура машинной части ЧМС, в ко- торой начинающий человек-оператор нор- мально работал бы сразу, с первой попытки (т.е. ошибка слежения находилась бы в задан- ных пределах и не уменьшалась бы по мере накопления человеком-оператором опыта ра- боты в данной ЧМС) является оптимальной с точки зрения минимума времени адаптации ЧО. В системе такой структуры при обучении операторов не нужно проводить тренировок, достаточно лишь предварительного инструкта- жа; следовательно, резко сокращается время обучения и не требуется относительно дорого- стоящей учебно-тренировочной аппаратуры; не требуется периодических тренировок для поддержания у операторов навыков работы в системе; повышается надежность системы, так как временная потеря в сложных ситуациях хорошо тренированными, опытными операто- рами, навыков в работе для такой системы безразлична (так как нет приобретенных навы- ков работы в системе) [37, 38]. Представляется целесообразным приво- дить любую динамическую структуру любой машинной части (например, путем введения коррекгирущих связей) к подобной оптималь- ной по времени адаптации ЧО структуре, обеспечивающей работу операторов сразу, без предварительных тренировок. Для получения динамической структуры арготической следящей системы с нулевым вре- менем адаптации человека-оператора, с одно- временным выполнением требований по точности
ОПТИМИЗАЦИЯ ЧМС СЛЕЖЕНИЯ ПО КРИТЕРИЮ МИНИМУМА ВРЕМЕНИ АДАПТАЦИИ ЧО 621 следящей системы необходимо при расчетах системы, включая подбор корректирующих свя- зей, по известным методам теории управления (теории следящих систем) применять переда- точную функцию нетренированного человека- оператора [37» 38]. Экспериментально определенная переда- точная функция нетренированного оператора, работающего в спокойной обстановке, т.е. при низком уровне эмоциональной напряженно- сти, имеет вид F- (8.4.4) ще Кн = 2 с-1, т = 0,3 с. При повышении эмоциональной напря- женности оператора, вызываемой стремлением работать точнее и быстрее, Кн увеличивается, в отдельных случаях до 8 с*1. Передаточная функция нетренирован- ного ЧО (8.4.4), естественно, является частным случаем классической передаточной функции ЧО (8.4.1). Отсутствие инерционного звена нервно- мышечного запаздывания в эксперименталь- ной передаточной функции (8.4.4) объясняется тем, что аппроксимация нервно-мышечного запаздывания инерционным звеном в (8.4.1) довольно приближенная и, ввиду малости этого запаздывания, оно при эксперименталь- ном определении функции (8.4.4) оказалось включенным в состав чистого запаздывания т, что на точность расчетов заметного влияния не оказывает. Постоянная времени ?2 в (8.4.1) у не- тренированного ЧО достаточно велика, чтобы можно было пренебречь единицей и считать звено интегрирующим. В этом случае Кк Т2 Постоянная времени Т\ является основ- ным параметром при адаптации ЧО к машин- ной части системы. Ввод в динамическую структуру машинной части эрратической сле- дящей системы форсирующего звена с нужной постоянной времени представляет собой одно из эффективных средств оптимизации ЧМС слежения по времени адаптации ЧО. Структурная схема ЧМС слежения с не- тренированным ЧО, учитывающая также вы- полняемую ЧО функцию выделения ошибки слежения Дф — фэ с - ф0.с представлена на рис. 8.4.7. В теории следящих систем хорошо раз- виты расчетные методы логарифмических час- тотных амплитудно-фазовых характеристик. Поэтому кратко изложим вышеприведенные рекомендации в терминах логарифмических частотных характеристик. Примем во внимание эксперименталь- ный результат, заключающийся в том, что человек-оператор при работе в эротической следящей системе изменяет свою передаточ- ную функцию таким образом, чтобы наклон логарифмической амплитудно-частотной ха- рактеристики (ЛАХ) всей разомкнутой систе- мы, включающей машинную часть и человека- оператора, составлял -20 дБ на декаду в облас- ти частоты среза, расположенной в районе 2 ... 3 с*1. Другого наклона ЛАХ в области частоты среза быть не может, так как согласно теории автоматического регулирования, такой наклон является условием устойчивости замкнутой системы. Для выполнения этого условия при передаточной функции оператора (8.4.4) необ- ходимо, чтобы наклон ЛАХ машинной части контура ручного управления в области частоты среза (оСр был нулевым, что для минимально- фазовых систем эквивалентно требованию равенства нулю фазовой частотной характери- стики машинной части контура ручного управления ф(<о) = 0 при (0,1 ... 0,2) соср < со < (5 ... 10) ®ср. (8.4.5) Такое условие выполняется, например, при машинной части контура ручного управ- ления в виде жесткой связи, т.е. при Рис. 8.4.7. Структурная схема ЧМС
622 Глава 8.4. ПРОЕКТИРОВАНИЕ ЧМС СЛЕЖЕНИЯ ^мч ~ -^мч или при IT-Г Ф + 1) р Оптимальное значение - 1. Однако, учитывая, что человек-оператор адаптируется к изменению коэффициента пе- редачи машинной части за время, много меньшее 1 с, т.е. за пренебрежимо малое по отношению к времени переходного процесса (8.4.6), в случае необходимости можно выби- рать значение отличным от единицы. Важно лишь, чтобы возникающие в процессе регулирования скорости перемещения органа управления и отслеживающего указателя нахо- дились в пределах известных психофизиологи- ческих норм. Комфортная динамическая структура ЧМС слежения. Если на машинную часть ЧМС, отвечающую изложенным выше требованиям, наложить еще и требование минимума психо- физиологической напряженности (что соответ- ствует отличной субъективной оценке системы всеми операторами), то получим ЧМС, опти- мизированную по всем эргономическим пока- зателям и удовлетворяющую точностному кри- терию как дисциплинирующему (при выпол- нении которого ошибка слежения не выходит за заданные пределы). Динамическую структуру машинной час- ти арготической следящей системы, обеспечи- вающую выполнение предъявляемых к системе требований по точности при работе в ней не- тренированных операторов с первой попытки при отличной оценке системы всеми операто- рами, будем называть комфортной [37, 38]. Термин "комфортная** принят по анало- гии с условиями среды обитания, для пребы- вания в которой не требуются специальных тренировок, обеспечивающих оптимальную работоспособность, и оцениваемыми операто- рами как в высшей степени удобные, ком- фортные. Экспериментально установлено, что наи- лучшими, с точки зрения операторов, являют- ся динамические структуры ЧМС, при работе в которых требуемая точность обеспечивается однократным монотонным перемещением ручки управления по закону, близкому к экс- поненциальному Фу = ФуО<1 - 7)> (8.4.6) где Т-0,5 ... 0,55 с. При работе системы в условиях непре- рывно действующих в течение всего времени функционирования внешних возмущений, детерминированных и случайных, такое пере- мещение, характеризующее комфортную ди- намическую структуру, может был» обеспечено только путем включения в динамическую структуру системы Предсказателя детермини- рованной составляющей и Измерителя случай- ной составляющей с автоматической отработ- кой системой их выходных сигналов. ЧМС должна проектироваться таким об- разом, чтобы при непрерывном совмещении органом управления ОС с ЗС автоматически производились бы изменения параметров Предсказателя, повышающие его точность, благодаря чему после ручного совмещения символов в течение 2 - 3-х секунд дальнейшее их совместное движение происходило бы без участия оператора. Для построения Предсказа- теля, в частности, могут быть использованы рекомендации, приведенные в [11, 23]. Структурная схема ЧМС комфортной динамической структуры представлена на рис. 8.4.8. Рас. 8.4.8. Комфортная дянамаческая структура ЧМС
ОПТИМИЗАЦИЯ ЧМС СЛЕЖЕНИЯ ПО КРИТЕРИЮ МИНИМУМА ВРЕМЕНИ АДАПТАЦИИ ЧО 623 Рис. 8.4.9. Пример технической реализации ЧМС Пример расчета возможного варианта реализации ЧМС комфортной динамической структуры. В качестве примера синтеза ЧМС, опти- мальной по критерию минимума времени адаптации ЧО рассмотрим линеаризованную модель реальной промышленной ЧМС, пер- вой, при разработке которой в 1968 году авто- ром [37, 38] был применен предложенный им принцип получения ЧМС слежения с нулевым временем адаптации ЧО и принцип операци- онного комфорта в ЧМС слежения. Пусть ЗС представляет собой объект, движущийся в поле зрения ЧО по линейному закону Фз.с = ф'з.с^ (8.4.7) ще (р'зх принимает любые значения в интер- вале ф'з.с min < ф'з.с < ф'з.с max- (8.4.8) Платформа, на которой расположен ЧО, колеблется случайным образом вместе с ОС, который в результате этого колеблется относи- тельно ЗС. В качестве Измерителя использует- ся гиросистема, измеряющая колебания плат- формы. Измеренные колебания отрабатывают- ся ОС относительно платформы, благодаря чему колебания ОС относительно ЗС прекра- щаются. В качестве Предсказателя при априорных сведениях (8.4.7) и (8.4.8) естественно взять интегратор, интегрирующий по времени неко- торую величину, значение которой подбирает- ся ЧО вручную в процессе ручного слежения за ЗС. Начальные условия интегрирования вводятся первоначальным совмещением ОС и ЗС (реально ЧО ждет, когда ЗС подойдет к ОС и в этот момент включает интегрирова- ние). Априорные сведения (8.4.8) используют- ся для выбора диапазона выходных сигналов ОУ. Структурная схема представлена на рис. 8.4.9. Динамический контур системы с нетре- нированным ЧО на рис. 8.4.9 содержит два последовательно включенных интегрирующих звена и звено чистого запаздывания и, следо- вательно, является неустойчивым. Действи- тельно, при первых попытках работы в этой системе ЧО не в состоянии удержать ОС на ЗС (ОС при попытках ЧО обеспечить его со- вместное движение с ЗС болтается вокруг не- го; ввиду ограниченности поля наблюдения ЗС слежение представляется ЧО вообще невоз- можным). По мере накопления опыта слеже- ние становится все менее колебательным и через некоторое время (для большинства опе- раторов - 20 - 30 попыток слежения) движение ОУ становится близким к экспоненте с посто- янной времени 1 с. После окончания движе- ния ОУ совместное движение ОС и ЗС про- должается с высокой точностью. Естественно предположить, что в процес- се тренировки ЧО изменил постоянную вре- мени форсирующего звена в формуле (8.4.1) с 0 до величины, обеспечивающей устойчивость контура управления. Расчеты показали, что величина этой постоянной времени для полу- чения устойчивости системы должна быть не менее Г с. Для оптимизации ЧМС по времени адаптации ЧО, другими словами для того, чтобы не вынуждать нетренированного ЧО изменять свою передаточную функцию, в со- ответствии с рекомендациями п. 8.4.4 введено последовательно в контур (рис. 8.4.10) форси- рующее звено вида W = Тр + 1. Инерционное звено с малой постоянной времени в технической реализации форси- рующего звена не учитываем, т.к. его влияние на динамику системы практически не заметно.
624 Глава 8.4. ПРОЕКТИРОВАНИЕ ЧМС СЛЕЖЕНИЯ Рис. 8.4.10. Пример технической реализации ЧМС комфортной динамической структуры После ввода в систему форсирующего звена поголовно все операторы нормально работают в системе с первой попытки» причем процессы перемещения ОУ у разных операто- ров мало отличаются и отлично совпадают с расчетными. Осциллограммы процессов слежения приведены на рис. 8.4.11. На осциллограммах приведены обозначения в соответствии с на- званиями параметров реальной системы - про- тотипа рассматриваемой в примере системы. Обозначения осциллограмм А/» /п, /, Ал и А^п соответствуют Аф, фос» Фзс» Фоу + Фоу min и фоу рассматриваемого примера А/ = 1 мм (на осциллограммах ±0,5 мм) - это размеры ОС и ЗС, создающие в рассматриваемой ЧМС нечто вроде зоны нечувствительности. Пренебреже- ние этой зоной при расчете динамики практи- чески не сказывается на результатах, однако, как видно из осциллограмм, влияет на устано- вившуюся ошибку. Различие в наклонах I и /п вызваны раз- личием масштабов записи. На самом деле из записи Аф (т.е. А/) видно, что разница в по- ложении ОС и ЗС мало отличается от величи- ны "зоны нечувствительности". На осцилло1рамме N1 (ЧМС без форси- рующего звена) зафиксирован процесс работы ЧО, уже накопившего небольшой опыт. ЧМС устойчива, но процесс слежения колебатель- ный. ЧМС с Т = 1 с получила отличную оценку всех операторов, с Т = 2,5 с - в сред- нем хорошую, с 7’=0ис Т = 6,25 с - удовле- творительную. Однако в системе с Т = 6,25 с все операторы работали сразу, без тренировок, а в системе с Т = 0 - после 15 - 30 трениро- вочных попыток. Классификация ЧМС слежения по времени адаптации ЧО. Прогноз субъективных оценок операторов при проектировании ЧМС слежения. Разработчик ЧМС как правило стремится к тому, чтобы оценки ЧМС работающими в ней операторами были повыше. Далее приводятся рекомендации, позволяющие на этапе проек- тирования предварительно оценить будущие оценки проектируемой ЧМС операторами. В системе комфортной динамической структуры оценки операторов удовлетвори- тельно прогнозируются следующими эмпири- ческими зависимостями Сх = (5 ... 5,5)Д, 1 для /р 2 2/3; /р/2/3 для (/3 / 2) < /р <;2/э; 0,25. ..0,2 для /р^(/3/2), где Ск - субъективная оценка, индекс "к” оз- начает "комфортная система"; Д - дефицит времени; /р - располагаемое время, т.е. время предъявления оператору задающего символа, в системах с компенсирующим слежением - это в полном смысле время предъявления, в сис- темах с преследованием - время Тгрохождения задающего символа в поле зрения оператора; 1з - время занятости оператора работой в системе (для комфортной системы = 1,5 ... 1,7 с). Инструментальные погрешности измери- теля и предсказателя, возникающие вследствие несовершенства техники, и их методические погрешности, обычно допускаемые преднаме- ренно с целью избежать чрезмерной сложно- сти измерителя и предсказателя, приводят к неполной компенсации внешних возмущений. Как крайний вариант конструктивного реше- ния, измеритель и предсказатель могут просто отсутствовать в схеме.
ОПТИМИЗАЦИЯ ЧМС СЛЕЖЕНИЯ ПО КРИТЕРИЮ МИНИМУМА ВРЕМЕНИ АДАПТАЦИИ ЧО 625 Осциллогрыма№ Осциллограмма N3 Осциллограмма N4 Рис. 8.4.11. Осциллограммы процессов слежения в ЧМС различной динамической структуры
626 Глава 8.4. ПРОЕКТИРОВАНИЕ ЧМС СЛЕЖЕНИЯ При неполной компенсации измерите- лем и предсказателем внешних возмущений или ее отсутствии ЧО все время функциони- рования системы компенсирует их влияние на точность системы, совмещая отслеживающий символ с задающим движениями органа управления. Поскольку динамическая структу- ра контура ручного управления отвечает усло- вию (8.4.6), операторы мотут работать в систе- ме без тренировок, а с течением времени, по мере накопления опыта, качество их работы практически не улучшается. Систему, в которой операторы Moiyr ра- ботать с заданными качеством без тренировок, причем накопление оператором опыта работы не влияет на качество работы системы, и опе- ратор занят работой в системе непрерывно все время ее функционирования, будем называть паракомфортнай. Оценки операторами сложности работы в паракомфортной системе зависят от спек- трального состава внешних возмущений, при- веденных к координате перемещения задаю- щего символа. Если представить внешние воз- мущения в виде рада Фурье, то прогноз оце- нок операторов в случае, если наивысшая час- тота не превышает 1,5 Гц, может быть ориен- тировочно проведен по следующим эмпириче- ским формулам: 0^ = 6-0,5 Те, (8.4.9) где Те - трудоемкость работы оператора: для машинной части (8.4.7) Те =1 + ЛГ1^<о/Л,; (8.4.10) /=1 для машинной части (8.4.8) где со/ и Ai - круговые частоты и амплитуды разложения возмущений в рад Фурье; cojt« 0,25 с'1; соу « 10 с’1. Если при определении Те по формулам (8.4.10) и (8.4.11) Те £ 10, в формулу (8.4.9) подставляется Те = 10. Коэффициенты К\ и Кг являются функ- циями заданной точности слежения. При за- данной среднеквадратической точности слеже- ния ст = 20 коэффициенты К\ = 50, Кг = 4. Из (8.4.10) и (8.4.11) следует, что для возмущений низкой частоты оценки операто- ров более высокие при наличии в структуре машинной Части интегратора. Формулы (8.4.9), (8.4.10) и (8.4.11) явля- ются довольно грубыми и характеризуют ско- рее характер зависимости трудоемкости от спектрального состава входного сигнала. Пред- ставляется целесообразным провести дополни- тельные экспериментальные работы по уточ- нению зависимости трудоемкости от спек- трального состава входного сигнала. В большинстве существующих и вновь создаваемых эргатических следящих систем, при разработке которых не учитываются реко- мендации по синтезу комфортных и параком- фортных систем, операторы осваивают работу после более или менее длительных трениро- вок. После приобретения опыта работы в сис- теме, т. е. после сформирования адекватной передаточной функции, операторы работают без затруднений. Такие системы называют квазикомфортными. В отдельных случаях ква- зикомфортные структуры могут оказаться бо- лее предпочтительными, например, по услови- ям простоты технической реализации. Некото- рые квазикомфортные системы настолько сложны, что не могут быть освоены операто- рами. Поэтому они являются непригодными к эксплуатации. Ниже приведена сводная таблица неко- торых свойств четырех перечисленных града- ций сложности эргатических следящих систем. (8.4.11) Системы Время, с Оценки операторов адаптации, /а занятости, /3 начинающих опытных Комфортные 4< 1 (э = 1,5 ...2,0 (5 ... 5,5)Д (5 ... 5,5)Д Паракомфортные 4<1 Равняется вре- мени функцио- нирования сис- темы 6-0,5Те 6 - 0,5Те Квазикомфортные 4> 1 1 ... 2 3 ... 5 Непригодные к эксплуатации 4->00 Работа невоз- можна 1 ... 2 1 ... 2
ОПТИМИЗАЦИЯ ЧМС ПО КРИТЕРИЯМ МИНИМУМА ОШИБКИ СЛЕЖЕНИЯ 627 При наличии технических возможностей в большинстве случаев машинную часть систе- мы целесообразно проектировать комфортной или паракомфортной. При комфортной струк- туре загрузка оператора при интенсивных внешних воздействиях существенно ниже, чем при паракомфортной, однако паракомфортная структура может оказаться предпочтительнее для реализации "принципа активного операто- ра". Преобразовать квазикомфортную или непригодную к эксплуатации структуру в па- ракомфортную можно введением последова- тельных и параллельных (прямых и обратных) связей, охватывающих всю исходную квази- комфортную структуру или ее часть, в соответ- ствии с хорошо разработанными методами теории автоматического регулирования (с. 621). При этом должна обеспечиваться ус- тойчивость и заданная точность системы с передаточной функцией оператора (8.4.4) при заданных внешних воздействиях. Изложенные рекомендации по построе- нию комфортных систем относятся к одноко- ординатному слежению. При проектировании двух- и трехкоординатных систем целесооб- разно проектировать управление по каждой координате в соответствии с вышеприведен- ными рекомендациями. При одновременном слежении по двум-трем координатам время выполнения операции увеличивается в 1,5 - 2 раза. Поэтому при проектировании челове- ко-машинной системы целесообразно снижать размерность операции слежения. 8.4.5. ОПТИМИЗАЦИЯ ЧМС ПО КРИТЕРИЯМ МИНИМУМА ОШИБКИ СЛЕЖЕНИЯ И ПСИХОФИЗИОЛОГИЧЕСКОЙ НАПРЯЖЕННОСТИ Оптимизация ЧМС по критериям мини- мума ошибки слежения и минимальной пси- хофизиологической напряженности может быть проведена с помощью комбинированной модели сенсомоторной деятельности ЧО. Основанием создания такой модели яви- лись экспериментальные данные о том, что, при слежении за простыми непрерывными сигналами, человек обеспечивает системе в целом инвариантность по отношению к вход- ному воздействию. В соответствии с одним из основных принципов теории инвариантности, сформулированным Б. Н. Петровым, полная инвариантность может быть достигнута лишь в двухканальной системе управления. Комбинированные системы представляют собой двухконтурные системы, содержащие разомкнутую цепь управления по входному воздействию и замкнутую цепь управления по ошибке [50] (рис. 8.4.12). Рис. 8.4.12. Комбинированная модель сенсомоторной деятельности Динамика объекта управления описыва- ется преобразованием LOy. Инвариантность по входному воздействию в комбинированной системе достигается при выполнении условия Л=*-оу> (8.4.12> т.е. преобразование L\ должно быть обратно преобразованию £оу. Неточное выполнение условия инвари- антности (8.4.12) приводит к появлению ошибки е(/). Если она превысит допустимый порог А, то подключается контур управления по ошибке. Таким образом, при изменении режима управления основную роль играет замкнутый контур, а при установившемся сле- жении - контур управления по входному воз- действию. Нарушение условия инвариантности при функционировании разомкнутой цепи объяс- няется тем, что без визуального контроля ре- акции объекта управления на управляющие команды человек постепенно утрачивает меру движения как вследствие сложности самого объекта управления, так и ввиду воздействия на него неконтролируемых оператором внеш- них возмущений. Для коррекции возникающих ошибок, поддержания и уточнения образа совершае- мого движения необходима зрительная обрат- ная связь, которая в комбинированной модели сенсомоторной деятельности формализуется введением замкнутого контура регулирования. При построении комбинированной мо- дели важным является вопрос о выборе струк- туры элементов, входящих в цепи управления по воздействию и по ошибке. В основе выбора структуры цепи управ- ления по воздействию лежит известный факт о том, что хорошо мотивированный ЧО стре- мится осуществлять управление с наименьшей погрешностью, т.е. старается обеспечить сис- теме в целом инвариантность к входному воз- действию. В качестве исходного положения при формировании структуры замкнутого контура
628 Глава 8.4. ПРОЕКТИРОВАНИЕ ЧМС СЛЕЖЕНИЯ принимается, что определяющим в регуляции действий ЧО при устранении значительных рассогласований, является стремление к воз- можно более быстрому их устранению. Это предположение хорошо согласуется с результа- тами экспериментов [49], показывающих, что корректирующие команды оператора имеют прерывистый релейный характер, причем при отработке больших рассогласований опытный оператор способен осуществлять управления, близкие к оптимальным по быстродействию. Из теории оптимальных по быстродейст- вию систем следует, что для сложных управ- ляемых объектов оптимальное управление является релейным с большим числом пере- ключений [53]. Однако на практике редко наблюдается больше двух-трех интервалов максимального управляющего воздействия, а динамические объекты управления, плохо описывающиеся дифференциальными уравне- ниями первого или второго порядков, являют- ся неуправляемыми. Эти факты легко объясняются, если при- нять, что ЧО при управлении действует не в соответствии с точной динамикой объекта управления, а руководствуется упрощенным представлением о ней, т.е. он отождествляет управляемый объект с его концептуальной моделью (динамическим образом), который формируется в его сознании в процессе рабо- ты с данным объектом. Степень близости кон- цептуальной модели и соответствующего ей объекта управления связана со сложностью этого объекта и со способностью оператора оценивать его состояние. Большинство людей способно оценивать лишь первую производную сигнала, характе- ризующего текущее положение объекта управ- ления. Поэтому концептуальной моделью лю- бого объекта управления практически всегда является звено не выше второго порядка. При этом человек настраивает параметры этого звена таким образом, чтобы обеспечить бли- зость его реакции с реакцией объекта управле- ния при одинаковых воздействиях. Задача построения концептуальной мо- дели может быть поставлена, как задача редук- ции многомерной динамической системы. В сознании человека-оператора при управлении складывается целостное представ- ление о свойствах системы в различных режи- мах ее функционирования. Это прежде всего относится к поведению системы в переходном (отработка начальных рассогласований) и в установившемся режимах (слежение за мед- ленно меняющимся сигналом). Поскольку невозможно подобрать объект пониженного порядка, одинаково хорошо аппроксимирующий свойства исходной систе- мы высокого порядка и в переходном и в ус- тановившемся режимах, иногда целесообразно использовать две концептуальные модели: одну для формализации динамического образа в переходном режиме, другую - в установив- шемся. Разработку замкнутой цепи комбиниро- ванной модели следует осуществлять на базе концептуальной модели для переходного ре- жима, а разомкнутую цепь строить на основе концептуальной модели для установившегося режима. При построении комбинированной мо- дели сенсомоторной компоненты деятельности необходимо предусмотреть возможности со- вмещения ее с моделью принятия решений. Таким образом, динамическая система, в ко- торой приходится действовать ЧО, описывает- ся следующей системой в совокупности с ди- намикой нервно-мышечного аппарата опера- тора: Х = AX + BU + W, (8.4.13) где А и В - матрицы коэффициентов; X - «-мерный вектор состояния системы; U - /«-мерный вектор управляющих воздействий; W - «-мерный вектор возмущений, неконтро- лируемых оператором, с матрицей интенсив- ностей FF(/). Введем в рассмотрение две концептуаль- ные модели динамической системы для пере- ходного и установившегося режимов: ф = + В\1Ц (8.4.14) X = A2x + B2U. (8.4.15) Матрицы А\ и А2 вычисляют из условия минимизации различных функционалов. Так, если С - матрица, связывающая вектор выхода динамической системы с ее вектором состоя- ния, то матрица А2 определяется из условий минимизации функционала, характеризующего точность аппроксимации собственных движе- ний системы, Тп /2=у-/Л/[яГ('И(0]л, (8.4.16) п о где Тп - время переходного процесса; E(f) = CX(i) - Л2Х(/). (8.4.17) В то же время матрица А\ определяется из условий минимизации функционала, харак- теризующего точность аппроксимации вынуж- денной составляющей движений системы, Ц = JfrA(OAr(O, (8.4.18) ще
ОПТИМИЗАЦИЯ ЧМС ПО КРИТЕРИЯМ МИНИМУМА ОШИБКИ СЛЕЖЕНИЯ 629 Д(0 = Cx(t) - AiCx(t). (8.4.19) Матрицы Ay By A}, В} имеют блочную структуру, т.е. компоненты этих матриц равны нулю, за исключением компонент, составляю- щих блоки размерностью 2x2, которые рас- положены на диагоналях матриц. С учетом концептуальных моделей (8.4.14), (8.4.15), формализованное описание замкнутой и ра- зомкнутой цепей комбинированной модели выглядит следующим образом. Структура замкнутой ветви комбинированной модели, т.е. преобразование £3, может быть представ- лена в виде квазиоптималъного по быстродей- ствию регулятора с соответствующей функцией переключения <т(е,ё) в фазовой плоскости. Квазиоптимальность связана с наличием чистого запаздывания, а также заменой (8.4.13) на (8.4.14) при определении функции переключения. Методика определения функ- ции переключения основана на "теореме об «-интервалах" [50]. При определении структуры разомкнутой цепи комбинированной модели будем считать, что оператор способен оценивать m компо- нент, которые являются линейной комбинаци- ей величин, характеризующих мгновенное положение управляемой системы, а также их первых производных. Кроме того, ЧО оцени- вает эталонный образ xf вектора состояния в соответствии с выбранным режимом управле- ния. Таким образом, уравнения наблюдения имеют вид: y(f) = Cx(t - г) + n(0; (8.4.20) З'ХО = x(t - г) + n '(0. (8.4.21) гае у - m-мерный вектор (m £ л); у' и xf - ^-мерные векторы (Л < л); С - матрица раз- мерности т х л, у которой только два первых столбца имеют отличные от нуля компоненты. Обобщенное уравнение наблюдения име- ет вид: Г(/) = СН»(/ - т) + п°(0, (8.4.22) Компоненты вектора т|° моделируют шу- мы наблюдения, а также возможные неточно- сти в определении человеком эталонного об- раза. При построении моделей сенсомоторной деятельности в установившемся режиме пред- полагается, что хорошо тренированный и мо- тивированный оператор старается вести себя оптимальным образом, и это удается настоль- ко, насколько позволяют его собственные внутренние охраничения. Введение указанного предположения и обоснование критерия оптимальности позво- ляют однозначно определить структуру и па- раметры таких моделей в зависимости от свойств динамической системы. Оператор в отсутствие зрительной связи стремится так управлять системой, чтобы, с одной стороны, в среднем минимизировать некий квадратичный функционал от ошибки слежения е(/), с другой стороны, не допускать слишком больших энергетических затрат на управление. Математическое выражение для критерия оптимальности имеет вид J -М Т yJ[e2(0 + ~2(0p4> о (8.4.23) где u(t) - управление, генерируемое ЧО; г - весовой коэффициент. Коэффициент г отражает компромисс между требованиями к точности и энергоза- тратам. Варьируя этот коэффициент можно моделировать различную степень мотивации человека. Ввиду того что управление в установив- шемся режиме осуществляется без зрительной обратной связи, в качестве ошибки слежения в данном случае следует понимать разность ме- жду эталонным образом xf и компонентами вектора состояния концептуальной модели (8.4.15), соответствующими выбранному ре- жиму управления. Таким образом, концепту- альная модель объекта управления в устано- вившемся режиме (8.4.15) играет существен- ную роль при построении комбинированной модели сенсомоторной компоненты деятель- ности ЧО методами теории оптимального управления. Введем в рассмотрение обобщенный век- тор состояния системы Z = ||ч'Г, (8.4.24) и формальную операцию объединения матриц где /(^) - единичная матрица. А® В |Л °11 о 4 (8.4.25)
630 Глава 8.4. ПРОЕКТИРОВАНИЕ ЧМС СЛЕЖЕНИЯ Тоща обобщенное уравнение состояния системы имеет вид Z = Д)7 + BqU + V, (8.4.26) ще Ао = Aj Ф А Ф ; BQ = Д Ф ВФ (\к.ку; Н°<»)>,гГ’о(*)Г Критерий оптимальности (8.4.23 ) явля- ется частным случаем более общего критерия 1-М Т yj [zr(t)QZ(t) + о (8.4.27) ще Q, В\ - неотрицательно определенные матрицы. Критерий (8.4.23) представим в виде ще /0 = ^ I = k + Iy, Г т уJ[z(O-£(/)] х (8.4.28) (8.4.29) 1 J[Z(/) Q Z(t) + 0 (8.4.30) Z(t) - оптимальная оценка Z(/). Таким образом, задача оптимизации ра- зомкнутой цепи комбинированной модели распадается на задачу оптимального оценива- ния обобщенного вектора состояния системы и задачу определения оптимального управле- ния. В связи с этим разомкнутая цепь пред- ставляется в виде последовательного соедине- ния элементов, осуществляющих: наблюдение У(/) в соответствии с (8.4.22); оптимальное оценивание и экстраполяцию состояния дина- мической системы; выработку управлений, оптимальных в смысле критерия (8.4.30). Алгоритм оптимального линейного оце- нивания состояния динамической системы задается структурой фильтра Калмана и имеет вид Х(г_т)=(л'-РС0г^1С0)%(0_т) + + PClN-'Y(t), (8.4.31) ще А' = А Ф О(к*к) ’ матРИЦа Р является ре- шением уравнения Р = -А'Р -РА'Т - PCQNCQP + W, Р(Т) = ft (8.4.32) Режим экстраполяции, необходимый для компенсации запаздывания оператора, описы- вается уравнением* Х°(/) = Ф(Г,/ - - г), (8.4.33) ще матрица Ф, является решением уравнения Ф = Л'Ф, Ф(Г,Г) = /. (8.4.34) Оптимальная оценка обобщенного векто- ра состояния системы получается в следующим виде Z(0 = |т(0, Х°(/)|. (8.435) Управление, оптимальное в смысле кри- терия (8.4.23) получается в виде произведения детерминированной матрицы коэффициентов усиления на оптимальную оценку текущего состояния системы U(t) = -LZ(t), (fiA.36) ще матрица L имеет вид L = Sf’fio ^(0. (8.4.37) причем матрица К является решением уравне- ния к = -КА$ - Al к + Ктвов^в1 К-Q, К(Т) = 0. (8.4.38) Таким образом, разомкнутая цепь ком- бинированной модели, моделирует три этапа, из которых Складывается общая структура дея- тельности ЧО в установившемся режиме: этапа восприятия информации, этапа переработки информации и этапа выработки управляющих воздействий. Моделируются также внутренние ограни- чения, свойственные человеку и проявляю- щиеся на каждом из перечисленных этапов. Так, например, на этапе восприятия информа- ции ограничения ЧО моделируются введением чистого запаздывания, ограничением размер- ности вектора наблюдений, а также введением шумов наблюдения. Несмотря на то, что разомкнутая цепь комбинированной модели отражает общую структуру деятельности ЧО в установившемся режиме и ее этапность, формализация самих этапов носит чисто функциональный характер.
ЗАДАЧИ ОЦЕНКИ ЧМС УПРАВЛЕНИЯ 631 Изложенный подход позволяет по задан- ным характеристикам динамической системы определить структуру модели сенсомоторной компоненты деятельности ЧО. При этом ко- эффициенты оптимального фильтра и регуля- тора зависят от параметров критерия опти- мальности и матрицы ковариации шумов на- блюдения АГ(/). В то время как величины, составляющие матрицу АГ(/), зависят от характеристик уст- ройства отображения информации, а также квалификации оператора, и могут быть опре- делены экспериментальным путем, то выбор параметров матрицы В\ представляется более сложным. ЧО в контуре управления действует та- ким образом, чтобы минимизировать напря- женность своей деятельности при сохранении точности управления на должном уровне. Та- ким образом, критериями настройки модели должны быть критерий точности и критерий напряженности. Что касается критерия точно- сти, то его формализация не представляет трудностей и он непосредственно входит в критерий (8.4.27). Напротив, понятие напряженности дея- тельности является крайне трудноформализуе- мым. Преимуществом данной комбинирован- ной модели является то, что лежащий в ее основе принцип двухконтурности позволяет учесть дискретно-непрерывный характер про7 цесса управления и, как следствие этого, опи- сать трудноформализуемое понятие напряжен- ности деятельности. Возможность количественной оцендо напряженности позволяет придать модели адаптивный смысл и, моделировать адаптацию ЧО как последовательность действий по на- стройке своих характеристик с целью умень- шения напряженности. В соответствии с рассматриваемой ком- бинированной моделью сенсомоторной дея- тельности сложное нелинейное управление по замкнутому контуру увеличивает напряжен- ность деятельности. То есть ЧО таким образом подстраивает свои характеристики, чтобы как можно реже подключать замкнутый контур. В связи с этим в качестве формальных крите- риев напряженности выбираются следующие величины: среднее число подключений замк- нутой ветви модели среднее время ее ра- боты Тс и среднее время Те достижения ошибкой критического значения А. Среднее число подключений N& можно вычислить аналитически на основе теории выбросов случайного процесса, однако такой путь предполагает решение уравнений Фокке- ра-Планка-Колмогорова, что в общем случае затруднительно. Поэтому определение N&, как, впрочем, и Тс, и Те, лучше проводить мето- дами математического моделирования. В каче- стве еще одного критерия количественной оценки напряженности можно рекомендовать среднее значение функции когерентности Ysu(®) между стимулом 5(1) и реакцией моде- ли f7(/), взятое на участке частот со = [0; сол], еде ®л - некоторая пороговая частота. Вне этого интервала значения функций спектраль- ных плотностей стимула (вследствие особенно- стей его формирования) и реакции (вследствие фильтрующих свойств ЧО) становятся малыми и рассматривать частоты со > сол не имеет смысла. Если спектральные плотности стимула 5/со) и реакции 5и(со) отличны от нуля и не содержат дельта-функций, то функция коге- рентности стимула 5(/) и реакции U(i) пред- ставляет собой действительную характеристи- ку, определяемую выражением Y”(a,)=(8-4-з9) где 5ш(ю) - совместная спектральная плот- ность 5(/) и U(fy. Среднее значение функции когерентно- сти определяется формулой <в„ G = — f rLrfo>- (8.4.40) ®" о Функция когерентности характеризует линейность связи "вход-выход", т.е. в нашем случае линейность модели деятельности ЧО. Чем ближе к линейному закон, по которому осуществляется отработка входного воздейст- вия, тем ближе к единице. Субъек- тивная оценка условий работы в ЧМС (см. разделы 8.5 и 8.4.4) тем выше, чем проще (ближе к линейному) закон управления. Пере- ходы ко всякого рода нелинейным законам управления приводят к повышению напря- женности, в то время как на точности управ- ления это может не отразиться. Глава 8.5 МЕТОДЫ ОЦЕНКИ ЧМС 8 .5.1. ЗАДАЧИ ОЦЕНКИ ЧМС УПРАВЛЕНИЯ Оценка ЧМС производится с позиций выполнения требований технического задания (ТЗ) к ЧМС в целом, включая ее машинную часть и человека, соответствия условий работы человека-оператора (экипажа) инженерно- психологическим требованиям.
632 Глава 8.5. МЕТОДЫ ОЦЕНКИ ЧМС Оценка ЧМС с позиций удовлетворения требованиям ТЗ на нее регламентируется соот- ветствующими разделами ТЗ и ведомственны- ми документами. Оценка условий работы ЧО включает в себя как оценку условий среды обитания (температура, влажность, освещенность, цвето- вая гамма интерьера и др.), так и оценку усло- вий деятельности человека-оператора, в том числе оценку объема и структуры переработки информации ЧО и его информационного об- мена с машинной частью ЧМС и средой, в которой в свою очередь выделяются оценка информационно-управляющего поля (ПУП) и оценка приема, переработки и выдачи инфор- мации ЧО. В оценках информационно-управляю- щего поля (ИУП) выделяют: антропометрические оценки (досягае- мость органов управления зоны визуального обзора и др.); информационные оценки (упорядочен- ность ИУП, скорость считывания информации и др.). Методы оценки ИУП см. [10, 13, 24]. Для этапа проектирования деятельности оценки приема, переработки и выдачи инфор- мации разработаны с достаточной для практи- ческих целей глубиной для дискретных систем управления деятельности человека-оператора на уровне совокупности операций - см. п. 8.3.2. Оценкам приема, переработки и выдачи информации в ЧМС слежения на этапе проек- тирования деятельностий посвящены материа- лы разделов 8.5.4. и, частично, 8.4.4 и 8.4.5, на этапах экспериментальной отработки и испы- таний - материалы разделов 8.5.2 и 8.5.3. Среди оценок на этапах отработки ЧМС можно выделить: - инструментальные (см. разд. 8.5.2); - экспертные (см. разд. 8.5.3 и 8.5.4). 8 .5.2. НЕКОТОРЫЕ ИНСТРУМЕНТАЛЬНЫЕ ОЦЕНКИ Применение инструментальных оценок основано на свойстве человеческого организма изменять физиологические характеристики в зависимости от напряженности деятельности, хорошо коррелированной со сложностью ра- боты. К инструментальным относят оценки, по- лученные (замеренные или вычисленные на ос- новании измерений) с помощью тех или иных приборов или инструментов: электрокардиограм- мы, электромиограммы, электроэнцефалограммы, пневмограммы и другие, по которым определяют интенсивность, сложность или напряженность деятельности оператора. Для инструментальных оценок обычно используют: кожно-гальваническую реакцию, систолическое и диастолическое давление кро- ви, частоту сердечных сокращений fc, частоту дыхания Уд, объем дыхания в единицу време- ни, дисперсию кардиоинтервалов Дщ. Для повышения информативности инст- рументальных оценок применяют комбинации этих показателей. Приблизительно пропор- ционален субъективному ощущению сложно- сти работы (напряженности деятельности) следующий показатель ПН| = 1 - /дф^сф , /д/с где индекс "ф" означает "фоновые" величины частот fc и /л, т.е. их величины у оператора, находящегося в покое. Дисперсия кардиоинтервалов До, мини- мальна при оптимальном соответствии харак- теристик приема переработки и выдачи ин- формации человеком-оператором характери- стикам ЧМС [55]. Это свойство Д^ особенно удобно при экспериментальной отработке ЧМС слежения, так как в них, как правило, информационно-управляющее поле очень простое (два символа и ручка управления), а основная задача заключается в согласовании динамических свойств ЧМС со способом пе- реработки информации ЧО. Если использовать в качестве показателя напряженности отношение дисперсий ПН2 = Деи Деи min то оптимальное значение этого показателя будет равно 1. Иногда бывает удобно, чтобы оптималь- ная величина показателя напряженности была равна нулю. Тогда используют логарифм от- ношения по минимальному целочисленному основанию ПН3 = log2 ^ки min При отработке ЧМС с разовыми коман- дами удобно использовать кожно- гальваническую реакцию. Объем дыхания и кровяное давление час- то используют при изучении развития утомле- ния ЧО во время его работы в ЧМС. 8 .5.3. ШКАЛЫ ЭКСПЕРТНЫХ ОЦЕНОК Несмотря на развитие и распространение инструментальных оценок напряженности деятельности ЧО, решающими являются субъ- ективные оценки авторитетных операторов- экспертов. Например, при оценке управляемо- сти самолета решающим аргументом является мнение летчика-испытателя.
ЭКСПЕРТНАЯ ОЦЕНКА НАПРЯЖЕННОСТИ СЕНСОМОТОРНОЙ ДЕЯТЕЛЬНОСТИ 633 Для адекватности сравнения оценок раз- личных операторов необходимо привести их к единой системе - единой шкале оценок. Такой широко известной шкалой является 10-балль- ная шкала оценки управляемости самолета - шкала Харпера-Купера [13, 64], в которой единицей оценивается наилучший (по управ- ляемости) самолет, десяткой - самолет, хуже которого невозможно вообразить. Более удобными при экспериментальной отработке ЧМС являются шкалы, построенные на основе принятой в данной стране системе школьных оценок. Такие шкалы операторы осваивают моментально, без каких-либо тре- нировок. Примером такой шкалы, разработан- ной на основе 5-балльной системы школьных оценок, является также предназначенная для оценки управляемости самолета шкала Цува- рева [13]. Эта шкала позволяет проводить оценку управляемости с точностью до десятых долей балла. Однако практически вследствие разброса мнений операторов нецелесообразно пользоваться столь большим числом градаций. Вполне достаточно использовать 5-балльную (точнее, 6-балльную) шкалу оценок: 5 ,5 - лучшую систему невозможно пред- ставить, 5 - отличная система, работается с удо- вольствием, 4 - работать легко, 3 - работать трудно, 2 - задачу выполнить невозможно, 1 - худшую систему трудно вообразить. Такую простую шкалу используют при оценке ЧМС различных типов. Часто бывает достаточно использовать трехбалльную шкалу оценок: хорошая, удобная система, легко рабо- тать; удовлетворительная система, но работать трудно; неудовлетворительная система, работать невозможно. 8.5.4. ЭКСПЕРТНАЯ ОЦЕНКА НАПРЯЖЕННОСТИ СЕНСОМОТОРНОЙ ДЕЯТЕЛЬНОСТИ, ОСНОВАННАЯ НА ПОНЯТИЯХ НЕЧЕТКИХ МНОЖЕСТВ Методы, используемые для получения экспертных оценок, достаточно разнообразны. Целесообразность применения того или иного метода во многом определяется характером анализируемой информации. Если оправданы лишь качественные оценки предпочтительно- сти альтернатив (под альтернативой здесь по- нимается объект экспертизы) либо разбиение их на классы по тем или иным качественным признакам, то можно использовать парные и множественные сравнения, непосредственное ранжирование, классификацию и др. Если характер анализируемой информации таков, что целесообразно получить численные оценки сравнительной предпочтительности альтерна- тив, то используется тот или иной метод чис- ленной оценки, начиная от непосредственных балльных оценок и кончая более тонкими методами Терстоуна и фон Неймана- Моргенштерна [29]. Специфика оценивания напряженности сенсомоторной деятельности ЧО заключается в том, что эксперт (человек-оператор) должен дать оценку сразу после работы с данным объ- ектом управления, пока у него не исчезло субъективное ощущение степени дискомфорта. Ввиду этого методы, основанные на парном или множественном сравнении, не пригодны. Наиболее приемлемым является метод числен- ной оценки в баллах, однако вследствие боль- шой нечеткости понятия напряженности этот метод в некоторых случаях является недоста- точно точным. В рамках излагаемой ниже методики оценки даются в словесной форме, кроме того, учитывается степень уверенности эксперта в своей оценке, что позволяет более адекватно выразить ощущение напряженности. Методика оценивания построена так, что более неудоб- ным для оператора объектам управления дают- ся более низкие оценки. Процедура обработки результатов экс- пертизы предусматривает их усреднение по группе экспертов на основе метода согласова- ния оценок, что позволяет в значительной степени повысить объективность оценки. Для метода согласования оценок характерно зара- нее осознанное и осуществляемое в действи- тельности разделение процесса высказывания суждений и процесса их обработки и анализа. Каждый эксперт дает оценку независимо от других, а затем с помощью какого-либо фор- мального математического приема эти оценки объединяются в одну обобщенную (согласо- ванную). В данном случае таким формальным приемом является вычисление усредненной по группе экспертов оценки с учетом их компе- тентности. Под степенью компетентности по- нимается степень согласованности мнения эксперта с мнением большинства. Предлагаемая методика в значительной степени использует понятия нечеткого множе- ства и лингвистической переменной [9, 16, 27, 40, 58]. В [16] дается определение нечеткого множества. Определение 1. Нечеткое подмножество А универсального множества U характеризуется функцией принадлежности U —> [0, 1], которая ставит в соответствие каждому эле- менту и е U число Цл(м) из отрезка [0, 1], характеризующее степень принадлежности элемента и подмножеству А.
634 Глава 8.5. МЕТОДЫ ОЦЕНКИ ЧМС Понятие нечеткого множества является нетривиальным обобщением понятия множе- ства. Для нечетких множеств определены по- нятия пересечения, произведения, объедине- ния, суммы, отрицания; для них справедливы законы Моргана [27]. Для анализа ситуаций с величинами, оцениваемыми качественным образом, введе- ны понятия нечеткой переменной и лингвис- тической переменной [16]. Определение 2. Нечеткая переменная ха- рактеризуется тройкой [X, U, R (X, ц)], те X - название переменной; U - универсальное множество с базовой переменной ц; R (X, и) - нечеткое подмножество Ц представляющее собой нечеткое ограничение на значение пе- ременной ц, обусловленное X. Определение 3. Лингвистическая перемен- ная характеризуется набором [%, Дх)> ^4 Л/], в котором % ~ название переменной; Дх) - терм-множество переменной х> т.е. множество названий лингвистических значе- ний переменной х> причем каждое из таких значений является нечеткой переменной X со значениями из универсального множества U с базовой переменной и, G - синтаксическое правило (имеющее обычно форму грамматики), порождающее названия X значе- ний переменной х; М - семантическое прави- ло, которое ставит в соответствие каждой не- четкой переменной X ее смысл М(Х), т.е. не- четкое множество М(Х) универсального мно- жества U. Конкретное название X, порожден- ное синтаксическим правилом G, называют термом. Словесные оценки, даваемые экспертом в ходе экспертизы можно рассматривать как термы лингвистической переменной "Оценка" [66], для которой ДОц) + {"неприемлемо", "очень большая напряженность", "большая напряженность", "средняя напряженность", "слабая напряженность", "почти без напряже- ния", "совсем без напряжения (с удовольстви- ем)"] - границы строк-интервалов поля экс- пертных суждений (рис. 8.5.1); U - {0; 1; 2; 3; 4; 5; 6). | 1,0 | 0,8 | 0,6 | 0,5 | 0,4 | 0,2 | 0 | - степени совместимости 0 неприемлемо очещ» большая напряженность 1 1 очень большая напряженность 1 2 большая напряженность 2 2 большая напряженность 2 средняя напряженность 3 3 средняя напряженность 2 3 слабая напряженность 4 4 слабая напряженность 3 почти без напряжения 5 5 почти без напряжения совсем без напряжения 6 шфвания границ значения строк-интервалов базовой ________________переменной | О | ОД | 0,4 | 0,5 | 0,6 | о,ГПУ! левая | центр | правая условные полосы поля экспертных суждений Ряс. 8.5.1. Поле экспертных оценок: (Цифры 1, 2, 3 на поле экспертных оценок иллюстрируют два типа экспертных суждений: метка 1 соответствует первому типу, метки 2 и 3 - второму)
ЭКСПЕРТНАЯ ОЦЕНКА НАПРЯЖЕННОСТИ СЕНСОМОТОРНОЙ ДЕЯТЕЛЬНОСТИ 635 Согласно грамматике G термы лингвис- тической переменной "Оценка" могут иметь два типа представлений: состоять из названий границ одной стро- ки интервала поля экспертных суждений, объ- единенных союзом "или", например, "почти без напряжения или совсем без напряжения"; состоять из модификатора увеличения нечеткости "несколько хуже, чем", предшест- вующего названию правой границы строки- интервала, что соответствует наиболее низкому суждению, союза "или" и модификатора "несколько лучше, чем", предшествующего названию левой границы строки-интервала, что соответствует наиболее высокому сужде- нию о напряженности деятельности, напри- мер, "несколько лучше, чем средняя напря- женность" или "несколько хуже, чем слабая напряженность". Для порождения термов первого типа следует сделать одну метку в строке-интервале, учитывая при этом степень совместимости нечеткого суждения со значениями названий границ этой строки-интервала. Для порождения термов второго типа следует пометить несколько строк-интервалов, соблюдая следующие правила: строки-интервалы с метками, относящи- мися к одной и той же оценке, должны следо- вать одна за другой без пробелов между собой; метки должны располагаться по нисхо- * дящей сверху вниз и справа налево; недопустимо располагать несколько ме- ток друг под другом в одноименных крайних условных полосах поля экспертных суждений и более трех на центральной полосе. Оценки, образованные более чем тремя метками, соответствуют некомпетентному суж- дению эксперта. Смыслом термов лингвистической пере- менной являются нечеткие ограничения на значения базовой переменной. Смысл нечетких оценок в общем виде определяется в обозначениях Заде выражением М(Оц) =1^)/^, (8.5.1) U где j - знак объединения семейства одното- U чечных нечетких множеств; щ - числовое зна- чение базовой переменной; ц(Ц/) - степень совместимости (число из интервала [0, 1]) значений щ с нечеткими ограничениями, обу- словленными названием нечеткой переменной. Семантическое правило Му определяю- щее алгоритм вычисления смысла нечетких оценок, формулируется следующим образом. Значения базовой переменной щ сопос- тавляются с названиями границ строк- интервалов поля экспертных суждений. При этом используются шкалы, устанавливающие соответствие между качественными характери- стиками и их количественными аналогами (баллами). Устанавливается соответствие между парами чисел из интервала [0, 1] (степенями совместимости значений базовой переменной) и фиксированными градациями ("не знаю", "скорее", "достаточно", "в полной мере") поля экспертных суждений. На рис. 8.5.1 последо- вательности этих чисел представляют собой две шкалы - верхнюю и нижнюю. Числа верх- ней шкалы характеризуют степень совмести- мости значений левой шкалы базовой пере- менной с нечеткими оценками, а числа ниж- ней шкалы - степень совместимости значений правой шкалы с нечеткими оценками. Вычисление смысла оценок первого типа производится по формуле Заде (8.5.1). Вычисление смысла оценок второго типа несколько сложнее: А = /мл(“/)/«о и М(Оц) = ДА К) = ]\Л(С/) K(U), и (8.5.2) где F - оператор увеличения нечеткости; А - смысл раскрываемой нечеткой оценки, но без модификаторов увеличения нечеткости; К(Ц) - ядро оператора F; KQJ) - произведение числа ц^((7) и нечеткого мно- жества K(JJ). Результатам проведенной экспертизы и обработки суждений экспертов является мно- жество значений степени совместимости зна- чений базовой переменной щ с нечеткими оценками эксперта. Таким образом, напря- женность деятельности ЧО в каждой конкрет- ной системе управления характеризуется набо- ром из семи чисел (по числу значений базовой переменной) из интервала [0, 1]. Пусть S(m, i, j) - степень совместимости нечеткой оценки т-то эксперта данной на- пряженности деятельности в /-й системе с у-м значением базовой переменной, 5 = S(m9 i, j) - матрица степеней совместимости. Для вычисления коэффициентов компе- тентности проводится усреднение по универ- сальному множеству U(uj — j - 1):
636 Глава 8.5. МЕТОДЫ ОЦЕНКИ ЧМС him, Л = -------——г-------, (8.5.3) ' msafj -1) где В - b(mt i) - матрица усредненных по множеству U оценок. Согласно [29] вектор коэффициентов компетентности экспертов Q = q(m) есть соб- ственный вектор матрицы ВВТУ отвечающий максимальному собственному числу. Далее проводится усреднение значений S(m, i, j) по группе экспертов с учетом значе- ний д(т): = (8.5.4) т ф(/, у) при фиксированном / есть функция принадлежности нечеткого подмножества, порождаемого этой функцией, в универсаль- ном множестве U. Нормализация этого подмножества имеет вид Ф'О.Л = ---/г-» • (8.5.5) тах<р(/,у) Теперь на основе анализа функций. ф 'G, У) ПРИ различных i находится наиболее предпочтительная альтернатива, т.е. система, работа в которой сопряжена с наименьшей напряженностью, и одновременно ранжируют- ся альтернативы по предпочтительности. Для этого согласно [23] строится функция П('1.'2) = = шах пип{ч>'(»1,у1),<р'(/2,;2)цЛ(/1,/2)}, У1 J2 (8.5.6) где (. .4 /1 при У! £у2; ’«('•«Ho /1<Л. т.е. R - отношение строгого предпочтения. Таким образом, в множестве альтернатив I введено нечеткое отношение предпочтения П- Нечеткое подмножество недоминируе- мых альтернатив множества (7, т]) описывается функцией принадлежности Пн я (0 = 1 - nwa[n(<i,<j - n(i, <1)]. (8.5.7) Для исключения возможности попадания во множество (/,т)нд) альтернатив, для ко- торых т)н д’ не отражает фактической степени недоминируемости из-за отсутствия достаточ- ной информации об этой альтернативе, функция т]н д’ корректируется следующим образом: Чн д (0 = minlfi” д (/), тахф'(/,у)|- I Уе/ J (8.5.8) Значения функции чНД’(0 отражают степени предпочтительности альтернатив. Сис- темы управления, в которых достигается ми- нимальная напряженность деятельности опе- ратора, составляют множество 7*= {/: пн д (0 = тахчн д (Л)}- Анализ адекватности комбинированной модели сенсомоторной компоненты деятель- ности ЧО, построенной на основе методов теории оптимального управления, в значи- тельной степени сводится к анализу адекват- ности критериев настройки этой модели. Аде- кватность точностного критерия не вызывает сомнений, полученные значения функции т]НД позволяют провести анализ адекватности эргономических критериев напряженности. Проверку адекватности введенных в п. 8.4.5 критериев настройки комбинирован- ной модели можно осуществить на основе данных математического моделирования (значения ЛГд, Тс и Т^), а также данных полу- натурного моделирования (значения у^ц((а) и экспертные оценки). В качестве объектов управления при про- ведении математического и полунатурного моделирования целесообразно использовать звенья второго порядка, имеющие передаточ- ные функции вида Ьоу(Р> = * 2 ilP + 1------. у Т2/>2+2^7> + 1 представляющие наибольший практический интерес. Анализ нормированных значений ЛГд1, Г-1, Те и пн д- при увеличении £ для различных 7] показывает, что характер изме- нения Tq 1 и Те совпадает с характером из- менения чнд*> т.е. для оценки напряженности
КЛАССИФИКАЦИЯ ВОЗДЕЙСТВИЙ НА ЛЕТЧИКА В ПОЛЕТЕ 637 наиболее приемлемы критерии Тс и Тр. При- менение критерия М ограничено областью параметров, соответствующих субъективно наиболее удобным для оператора объектам управления (£ = 0,7 ... 0,85). Однако ввиду возможности аналитического вычисления Ад с помощью статистической теории выбросов этот критерий, с учетом сказанного выше, также можно рекомендовать для оценивания напряженности сенсомоторной деятельности ЧО. При использовании функций N&, ТСУ Тр и G, в качестве критериев напряженности сенсомоторной деятельности оператора, следу- ет иметь в виду, что эти критерии могут дать ответ лишь на вопрос: "Работа с каким из двух объектов управления сопровождается меньшей напряженностью ?". Ответ же на вопрос: "Во сколько раз ?", является более сложным и тре- бует экспертного оценивания, хотя и в этом случае он в значительной степени зависит от особенностей самой экспертизы. Глава 8.6 ТРЕНАЖЕРЫ И КОМПЛЕКСЫ ПОЛУНАТУРНОГО МОДЕЛИРОВАНИЯ ЧМС. ЭРГОНОМИЧЕСКИЕ АСПЕКТЫ ПРОЕКТИРОВАНИЯ 8.6.1. НАЗНАЧЕНИЕ ТРЕНАЖЕРОВ И КОМПЛЕКСОВ ПОЛУНАТУРНОГО МОДЕЛИРОВАНИЯ ЧМС Подавляющее большинство современных ЧМС требует определенного времени адапта- ции ЧО (экипажа), включая обучение и тре- нировки. Проведение обучения и тренировок непосредственно на машинной части ЧМС - слишком дорогое удовольствие, поскольку этими ЧМС могут был» самолеты, ракетные комплексы, космические аппараты и системы и т.д и т.п. Поэтому для обучения и трениро- вок ЧО создаются специальные тренажеры, воссоздающие существенные черты реальной рабочей обстановки [5, 28, 34]. При этом воз- никает проблема: какие из воздействий на ЧО, имеющих место в реальной обстановке, явля- ются существенными, а какие можно опустить без ущерба для будущих профессиональных навыков ЧО. Комплексы полунатурного моделирова- ния (КПМ) предназначены для отработай и доводки машинной части ЧМС в условиях, максимально приближенных к реальным. Од- ним из таких условий является реальное ин- формационное взаимодействие машинной части ЧМС с ЧО. Поэтому в состав КПМ включаются информационные устройства, пульты и другие органы управления ЧМС. Но для реальных воздействий на машинную часть со стороны ЧО необходимо, чтобы ЧО работал в условиях, максимально приближенных к реальным. Возникает та же проблема, что и при создании тренажера: какие из действую- щих на ЧО в реальной обстановке воздействий нужно воспроизвести, а чем можно пренеб- речь. В качестве примера эти проблемы рас- сматриваются для летного тренажера в разд. 8.6.2 и 8.6.3. В авиационном тренажеростроении по- пыткой избежать недостатков наземной ими- тации и воспроизведения факторов реального полета является так называемый "летающий тренажер" [45]. Идея летающего тренажера состоит в использовании реального самолета, динамические свойства которого можно легко изменять (например, изменениями в системе автоматического управления), превращая его в другой (с точки зрения ощущений летчика при пилотировании) самолет. Летные тренажеры разрабатываются как для пилотов, так и для других членов летных экипажей. Несмотря на высокую стоимость самолето-вылета, возмож- ность относительно быстрого создания такого тренажера на базе серийного самолета, сравни- тельно невысокая стоимость доработок и большая мобильность такого тренажера делают его в ряде практических ситуаций весьма при- влекательным в глазах заказчиков. 8.6.2. КЛАССИФИКАЦИЯ ВОЗДЕЙСТВИЙ НА ЛЕТЧИКА В ПОЛЕТЕ Для определения облика наземного лет- ного тренажера с позиций эргономики (оценки влияния технического облика трена- жера на эффективность обучения) необходимо подробно рассмотреть воздействия, которым летчик подвергается в процессе пилотируемого полета, и оценить, как влияет отображение тех или иных воздействий на качество Подготовки летчика. При разработке тренажера различают воспроизведение воздействий и имитацию воздействий [39]. Под воспроизведением воз- действия понимают его всестороннее полное воссоздание, а под имитацией - воссоздание только одной или нескольких существенных для данной задачи компонент воздействия. Все действующие на летчика воздействия целесообразно разделить на три группы: ин- формационные, физиологические, эмоциоген- ные. Все три группы воздействий взаимозави- симы. Так, например, укачивание неизбежно вызывает изменение характеристик деятельно- сти ЧО и отрицательные эмоции. Получаемая
638 Глава 8.6. ТРЕНАЖЕРЫ И КОМПЛЕКСЫ ПОЛУНАТУРНОГО МОДЕЛИРОВАНИЯ ЧМС летчиком информация может вызывать у него как положительные, так и отрицательные эмо- ции. Однако эта взаимозависимость в опреде- ленных пределах невелика, и для задач трена- жеростроения можно рассматривать все три группы воздействий независимо друг от друга. Информационные воздействия содержат информацию, необходимую для выполнения задачи, поставленной перед человеком, в част- ности информацию, необходимую для управ- ления полетом. Информационные воздействия деляг на приборные и неприборные. К приборным относятся воздействия на летчика, создаваемые специально предназна- ченной для этого аппаратурой (системой ото- бражения информации, сигнальными табло, приборами). По модальности они различаются на зрительные, акустические, тактильные и др. Неприборные информационные воздействия воздействуют на летчика без специально соз- данных для этого приборов. Сюда относят перегрузки, шумы двигателя, визуальную ин- формацию от внекабинного пространства (горизонт, наземные визуальные ориентиры и др.). Физиологические воздействия влияют на состояние организма. Например, колебания с низкой частотой вызывают состояние укачива- ния ("морской" или "воздушной" болезни), вибрации - снижение остроты зрения и т.д. Эмоциогенные воздействия создают ощущение полета, формируют настроение и. тем самым влияют на работоспособность лет- чика и качество его деятельности. Эмоциоген- ные воздействия на тренажере создаются ре- альным интерьером кабины; имитацией вне- кабинного пространства с визуализацией мест- ности; имитацией механических воздействий (перегрузок, вибраций); имитацией акустиче- ских воздействий (звук работающих двигате- лей, предупредительные сигналы и др.). 8.6.3. ВЛИЯНИЕ ТЕХНИЧЕСКОГО ОБЛИКА ТРЕНАЖЕРА НА ПРОФЕССИОНАЛЬНЫЕ НАВЫКИ БУДУЩИХ ЛЕТЧИКОВ В соответствии с приведенной классифи- кацией воздействий рассмотрим сочетания воспроизведения и имитации основных воз- действий (и, соответственно, вариантов техни- ческой комплектации тренажера) и соответст- вующую каждому варианту эффективность обучения. Приведенная классификация воз- действий позволяет рассмотреть варианты комплектации тренажера и соответствующие им возможности по обучению летчика. Воспроизведение приборной информа- ции при обучении пилотированию на трена- жере совершенно обязательно. Для любого варианта комплектации приборная информа- ция реализуется с помощью устанавливаемых в кабине (в имитаторе кабины) штатных при- борной доски и системы отображения инфор- мации со штатными приборами и экранами, нормально функционирующей реальной аппа- ратурой или ее имитаторами. Рассмотрим несколько основных вариан- тов возможной комплектации. 1. Воспроизводится только приборная информация. В этом случае имитируется си- туация, близкая к "слепому" полету (полет по приборам). При этом желательно иметь воз- можность регулировать освещенность в кабине от 10 лк ("ночной полет") до 100 лк ("полет в облаках"). Может проводиться обучение всем заданным в ТЗ режимам полета, кроме движе- ния после касания взлетно-посадочной полосы (ВПП) после посадки и до отрыва от ВПП при взлете. Приобретенные навыки обеспечи- вают полет по приборам на самолете и значи- тельно облегчают дальнейшее обучение управ- лению самолетом с ориентацией по внекабин- ному пространству (по линии горизонта и наземным ориентирам). При этом у обучав- шихся на таком тренажере надолго остается повышенное без необходимости внимание к пилотажным приборам и некоторая скован- ность при выполнении маневров. 2. Воспроизводится вся приборная и часть неприборной информации. При этом возможны следующие варианты: 2.1. Воспроизводится вся приборная ин- формация и линия горизонта. Диапазон отра- ботки заданного положения линии горизонта должен на 10 - 20 % превышать заданный для изучаемого режима пилотирования. Точность индикации линии горизонта должна быть не хуже бу < ±0,5 град, при |у| < |5| град. бу < ±(0,05 * 0,1)у при |5 град. | < М < Мних- Обеспечивается и выработка навыков выполнения разворотов с ориентировкой по линии горизонта и выдерживанием и измене- нием курса по приборам. 2.2. То же, что и в п. 2.1 и визуализация ВПП. Обеспечивается выработка навыков по п. 2.1, а также некоторых навыков взлета и посадки на необорудованный аэродром и по- лета по приборам. 2.3. То же, что и в п. 2.2, и дополни- тельно перегрузки по пу. Те же навыки, что и в п. 2.2, и навык использования неприборной информации по Пу. Известна ценность непри- борной информации по Пу для летчика. Ими- тация Пу создает, к тому же, великолепные эмоциональные воздействия при работе на тренажере 2.4. То же, что и в п. 2.2, но с дополни- тельной индикацией местности. Обеспечивает- ся выработка навыков по п. 2.2 с выдержива- нием и изменением курса по наземным ори-
СПИСОК ЛИТЕРАТУРЫ 639 ентирам. При коллимировании изображения местности возникающие эмоции создают ощущения реального палета. Даже при черно- белом изображении возникает полная иллюзия полета как бы в сумерках. Иллюзия полета настолько реальна, что многие, вспоминая работу на тренажере, рассказывают об испы- танных перегрузках, которых на самом деле не было. 2.5. То же, что и в предыдущих пунктах, но с имитацией в шлемофонах звука работаю- щего двигателя с воспроизведением спектра в диапазоне от 50 Гц до 500 Гц. Целесообразно воспроизводить изменение звука двигателя при нарушении нормальной работы двигателя и при изменениях положения сектора газа. 2.6. То же, что и в предыдущих пунктах, но с имитацией угловой скорости крена путем придания имитатору кабины углового ускоре- ния, заданного наклоном штурвала, с после- дующим плавным, незаметным для обучаю- щегося замедлением вращения имитатора ка- бины и продолжающимся вращением линии горизонта. Так же, как и имитация Лу, имита- ция скорости крена играет в первую очередь эмоциогенную роль, но кроме того формирует у обучающихся дополнительный канал непри- борной информации. Достаточен угол наклона кресла по крену' до 15° с ускорением до 70 град. / с2. 2.7 То же, что и в предыдущих пунктах, но с имитацией толчков и вибраций при дви- жении по ВПП. Для полной имитации требу- ется установка кресла на вибростенд с полосой воспроизводимых частот от 0,25 до 15 Гц, допускающий воспроизведение нескольких частот одновременно. Летчик привыкает чув- ствовать момент отрыва от ВПП при взлете и момент касания ВПП при посадке. Современные методики позволяют про- водить количественную оценку уровня освое- ния обучаемым режимам полета как путем экспертных оценок, так и, в значительной мере, путем инструментальных замеров пока- зателей психологического состояния при вы- полнении осваиваемых режимов полета. Из приведенного перечня ясно, для вы- работки каких навыков предназначены имита- ция или воспроизведение на тренажере тех или иных воздействий. Для подготовки летчи- ков из лиц, не имеющих навыков летной рабо- ты, целесообразно вводить на тренажере все вышеперечисленные воздействия. Для адапта- ции же летчиков-профессионалов к информа- ционно-управляющему полю кабины нового для них самолета перечень воздействий может быть резко сокращен, вплоть до п. 1 (воспро- изведение только приборной информации). Совершенно необходимо, чтобы распо- ложение и загрузка органов управления на тренажере были строго такими же, как и на транспортном средстве (самолете, автомобиле). В противном случае у обучающегося сформи- руются неправильные сенсомоторные реакции, что может привести (особенно в условиях по- вышенной информационной или эмоциональ- ной нагрузки) к неадекватным движениям, а следовательно к аварийной ситуации. СПИСОК ЛИТЕРАТУРЫ 1. Беки Дж. Автоматизация процессов управления Ц Труды II Международного конгресса ИФАК, Т. 5. М.: Наука, 1965. 2. Бакулов А. Ю., Полжов М. В. Резуль- таты экономической экспертизы многофунк- ционального пульта. Материалы международ- ной научно-технической конференции "Авиа- ционная эргономика, тренажеры и подготовка летного состава." Россия. Жуковский. Изд-во ЛИИ им. М. М. Громова, 1995. 3. Богачев И. И., Олизаров В. В. Обеспе- чение условий обитания эргатических систем. М.: Изд-во МАИ, 1988. 4. Богачев G К. Авиационная эргономи- ка. Вероятностные методы. М.: Машинострое- ние, 1978. 5. Бодвер В. А., Закиров Р. А., Смир- нова И. И. Авиационные тренажеры. М.: Ма- шиностроение, 1978. 6. Бокшнцкий Л. В. Основы эргономики и организации труда. М.: Изд-во МЭИ, 1990. 7. Винер Н. Нелинейные задачи в теории случайных процессов. М.: Изд-во иностр, лит., 1961. 8. Войненко В. М., Мунипов В. М. Эрго- номические принципы конструирования. Ки- ев: Техника, 1983. 9. Готлиб А. Е. Метод нечетких оценок в экспертизе. Техническая эстетика. 1982. № 8. 10. Гримах Л. IL, Хачатурьящ Л. С., Хру- нов Е. В. и др. Экспериментальная психофи- зиология в космических исследованиях. М.: Наука, 1976. 11. Гроп Д. Методы идентификации сис- тем. М.: Мир, 1979. 12. Губинский А. И. Надежность и каче- ство функционирования эргатических систем. Л.: Наука, 1982. 13. Доброленский Ю. П., Завалова Н. Д., Пономаренко В. А., Т^ваев В. А. Методы ин- женерно-психологических исследований в авиации. М.: Машиностроение, 1975. 14. Дружинин Г. В. Человек в моделях технологии: Учеб, пособие. М.: Изд-во Моск, ун-та путей сообщения, 1997. 15. Дэвис М. X. А. Линейное оценивание и стохастическое управление. М.: Наука, 1984. 16. Заде Л. А. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976.
640 СПИСОК ЛИТЕРАТУРЫ 17. Зайцев В. С. Системный анализ опе- раторской деятельности. М.: Радио и связь, 1990. 119 с. 18. Зараковский Г. М., Королев Б. П., Медведев В. Н., Шлаен П. Я. Введение в эр- гономику / Под ред. В. П. Зинченко. М.: Сов. радио, 1974. 19. Зараковский Г. М., Павлов В. В. За- кономерности функционирования эрратиче- ских систем. М.: Радио и связь, 1987. 20. Зараковский Г. М., Петров В. П., Кузнецова М. В. Содержание и порядок учета инженерно-психологических факторов // Авиационные цифровые системы контроля и управления. Л.: Машиностроение, 1976. 21. Зигель А, Вольф Дж. Модели группо- вого поведения в системе человек-машина. М.: Мир, 1973. 22. Инженерная психология за рубежом / Под ред. Ю. Б. Гиппенрейтер. М.: Прогресс, 1967. 23. Калман Р., Бьюси Р. Новые результа- ты в линейной фильтрации и теории предска- зания Ц Труды американского общества ин- женеров-механиков. Серия Д. Т. 33, № 1. ИЛ, 1961. 24. Кондратьев С. В., Зайцев К.С. Инже- нерно-психологическая оценка систем "чело- век-машина”. М.: Изд-во МИФИ, 1986. 25. Коспок В. И., Ходаков В. Е. Системы отображения информации и инженерная пси- хология. Киев: Вища школа, 1977. 26. Котак М. А-Курс инженерной пси- хологии. Таллин: Валгус, 1978. 27. Кофман А Введение в теорию нечет- ких множеств. М.: Радио и связь, 1982. 28. Красовский А А Основы теории авиационных тренажеров. М.: Машинострое- ние, 1995. 304 с.: ил. 29. Литаак Б. Г. Экспертная информа- ция: Методы получения и анализа. М.: Радио и связь. 1982. 30. Ломов Б. Ф. Человек и техника: Очерки инженерной психологии. М.: Сов. Радио, 1966. 31. Ломов Б. Ф. Основы инженерной психологии. М., 1986. 32. Мак-Ру ер Д. Т., Грехэм Д. и др. Дис- кретные, самонастраивающиеся и обучающие- ся системы И Труды III Международного KOHipecca ИФАК, Т. 3. М.: АН СССР, 1971. 33. Миркин Б. Г. Проблема группового выбора. М.: Наука, 1974. 34. Москаленко В. Я. и др. Авиационные пилотажные стенды и тренажеры. М.: Изд-во МАИ, 1983. 35. Наслен П., Рауль Ж. С. Автоматиза- ция процессов управления // Труды II Между- народного KOHipecca ИФАК, Т. 2. М.: Наука, 1965. 36. Огинский А А Критерий выбора мо- дальности управления в системе "Человек- машина” Ц Труды ГосНИИГА. Выпуск 229. Проблемы безопасности полетов. Авиационная эргономика и подготовка летного состава. Москва. 1984. 37. Огинский А А Операционный ком- форт в эргатических следящих системах Ц Сб. трудов ГосНИИГА, № 220. 1983. 38. Огинский А А Проектирование ком- фортных структур эргатических следящих сис- тем И Методы учета характеристик деятельно- сти оператора при проектировании систем "человек-машина". М.: Изд-во МАИ, 1983. 39. Огинский А А,. Зубец Ф. А, Байда- ков В. Н., Доценко Н. В. Рациональный объем представления неприборной информации на тренажерах и комплексах полунатурного моде- лирования И Труды Всесоюзной конференции по тренажерам. Пенза. 1982. 40. Орловский С. А Проблемы принятия решений при нечеткой исходной информации. М.: Наука, 1981. 41. Основы инженерной психологии / Под ред. Б. Ф. Ломова, М.: Высшая школа, 1986. 42. Основы экологии и эргономики в авиации. Т. 1. / Под ред. Л. Л. Хундакова и Г. А. Ступакова в 2-х т. М.: Вооружение. По- литика. Конверсия, 1997. 43. Основы эргономики в энергетике: Учебник / Под ред. М. Б. Щепакина и Н. И. Костюкова. М.: Энергоиздат, 1995. 135 с. 44. Пископполь А А, Щедровицкий Л. П. Инженерная психология и эргономика: Справ, обзор. М.: Пуля, 1996. 207 с. 45. Полоз Л. Д., Огинский А А и др. Ле- тающий тренажер для подготовки экипажей боевых самолетов. Материалы международной научно технической конференции "Авиацион- ная эргономика, тренажеры и подготовка лет- ного состава.” Россия. Жуковский: Изд-во ЛИИ им. Громова, 1995. 46. Попович П. Р., Губинский А И., Ко- лесников Г. М. Эргономическое обеспечение деятельности космонавтов. М.: Машинострое- ние, 1985. 47. Психологические проблемы деятель- ности в особых условиях / Под ред. Б. Ф. Ло- мова и Ю. А. Забродина. М.: Наука, 1985. 48. Пупков К. А, Копалин В. И., Ющен- ко А С. Функциональные ряды в теории не- линейных систем. М.: Наука, 1976. 49. Себряков Г. Г. Использование орто- гональных нелинейных функциональных пре- образований в задаче моделирования деятель- ности человека-оператора при слежении // Вопросы кибернетики. Вып. ПО. М:, 1984. 50. Себряков Г. Г., Желтов С. Ю., Коло- бов М. Г. К проблеме формализации поведе-
СПИСОК ЛИТЕРАТУРЫ 641 ния человека-оператора в замкнутом контуре слежения // Вопросы кибернетики. Выл. 91. М.,. 1982. 51. Себряков Г. Г., Силаев Н. Ж., Черны- шев А. П. К вопросу о восприятии сигналов с медленно меняющимися параметрами Ц Во- просы кибернетики. Вып. 9. М., 1982. 52. Системы автоматического управления / Под ред. А. А. Красовского. М.: Наука, 1987. 53. Современная теория систем управле- ния / Под ред. К. Т. Леондеса. М.: Наука, 1970. 54. Справочник по инженерной психо- логии / Под ред. Б. Ф. Ломова. М.: Машино- строение, 1980. 55. Трофимов В. Н., Огинский А А, Александров В. М. Вариативность кардиоин- тервалов как показатель сложности эргатиче- ской следящей системы. Материалы конфе- ренции ГосНИИАС. Ч. 2. 1979. 56. Цибулевский И. Е. Человек как звено следящей системы. М.: Наука, 1981. 57. Чапанис А и др. Справочник по ин- женерной психологии. М.: Мир, 1960. 58. Шапиро Д. И. Принятие решений в системах организационного управления: Ис- пользование расплывчатых категорий. М.: Энергоатомиздат, 1983. 59. Шеридан Т. Б., Феррелл У. Р. Систе- мы "человек-машина” М.: • Машиностроение, 1980. 60. Шибанов Г. П. Количественная оцен- ка деятельности человека в системах "Человек- техника". М.: Машиностроение, 1983. 61. Эрппические системы управления. 1991. Сборник "Кибернетика и вычислитель- ная техника". Вып. 92. Киев. 1991. 62. Эргономические и экологические ос- новы безопасности жизнедеятельности. Меж- вузовский сборник научных трудов. Тверской политехнический институт. Тверь. 1994. 63. Brilliant М. Theary of the analysis of nonlinear Systems. - Technical Report, 345, MIT. 1958. 64. Cooper G. E., Harper R. P. The Use of Pilot Rating in the Ecaluation of Aircraft Handling Qnalities. AGARD R-567. 65. Handbook of Human factors lEd. by G. Salvendy Hew York etal: Wiley. 1987. XXIU, 1874 p. ISBN 0-471-88015-0. 66. Hess R. A Aircraft control-display analysis and design using the optimal control model of the human pilot. - Proc. Int. Conf, on Cybemeticis and Sciety, Boston, 1980, pp. 106 - 120. 67. Kleinman D. L., Baron S., Levison W. H. A Control theoretic approach to manned vehicle systems analysis - IEEE Trans. Atomatic Control, AC-16, 1971, N 6, pp. 824 - 832. 68. Levison W. H., Elidnd J. I. Two- Dimensional Manual Control Systems with Sepa- rated Displays. - IEEE Trans Human Factors in Electronics, HEF-8, 1967, N 3, pp. 202 - 209. 69. Roig R. M. A Comparison Between Human Operator and Optimum Linear Controller RMS - Error Performance - IRE Trans. Human Factors in Electronics, HEF-3, 1962, N I, pp. 18 - 21. 70. Sheridan T. B. Three Models of Preview Control: IEEE Trans. Human Factors in Elec- tronics, HFE-7, 1966, N 2, pp. 91 - 102. 71. Wiener N. Response of a nonlinear de- vice to noise. - Report U-165. Radiation Labora- tory, MIT, 1942. 21 Зак 102 1
Ра з д е л 9 ТЕОРИЯ УПРАВЛЕНИЯ СИСТЕМАМИ С РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ Глава 9.1 ВВЕДЕНИЕ. ЗАДАЧИ УПРАВЛЕНИЯ СРП Системы с распределенными параметра- ми представляют собой обширный и сложный класс систем. Термин "система с распределен- ными параметрами" (СРП) возник при рас- смотрении классических физических процес- сов, протекающих в сплошных средах или полях. Примерами таких процессов служат механические, электрические, тепловые и многие другие процессы, протекающие в фи- зических телах, занимающих области некото- рого многомерного геометрического простран- ства. Величины и параметры, характеризую- щие соответствующие свойства поля или сплошной среды и процессов, в них проте- кающих, могут меняться от точки к точке про- странства. Таким образом, эти величины и параметры оказываются распределенными (плотность механической массы, плотность электрического заряда, теплоемкость, тепло- проводность, температуропроводность и др.). Часто эти параметры входят в уравнения, опи- сывающие процесс, как коэффициенты при соответствующих членах, что дало повод назы- вать эти распределенные параметры просто коэффициентами (множителями): коэффици- ент вязкости, коэффициент теплопроводности и т.д. Под СРП можно понимать чрезвычайно широкий класс систем. Процессы в СПР про- текают во времени и пространстве. С развитием науки, техники и общества понятие и сам термин СРП стал получать бо- лее широкое толкование и распространение. Под этими словами, стали понимать сложные процессы, протекающие не только в "обыч- ном" реальном (скажем, эвклидовом) геомет- рическом пространстве, но и в пространствах гораздо более общей и абстрактной природы и более сложного строения, например, в так называемых многообразиях. В физике зароди- лись такие важные теории, как теория полей, в том числе теория квантовых полей, специ- альная и общая теория относительности, тео- рия гравитационного поля и др. Для описания процессов в СРП служит математическая дисциплина - "Уравнения ма- тематической физики" [1, 2]. В более или ме- нее широком и точном смысле СРП - это системы, которые описываются уравнениями математической физики. В наиболее узком смысле слова под СРП можно понимать системы, движение или со- стояние которых описывается дифференци- альными уравнениями с частными или пол- ными производными с граничными (краевыми) условиями*. Именно, наличие граничных условий делает задачи решения этих уравнений наиболее трудными. В этом также заключено различие понятий и терми- нов: СРП и система (системы) с сосредото- ченными параметрами (ССП). Последние в отличие от СРП, с математической точки зре- ния, можно охарактеризовать как системы, которые описываются конечным числом урав- нений с полными производными (обыкновен- ными дифференциальными уравнениями) и без граничных, а только с начальными усло- виями (задача Коши). В определенном смысле, ССП можно рассматривать как предельный (частный) слу- чай СРП, когда граничные условия вырожда- ются лишь в начальные условия, а соответст- вующие краевые задачи вырождаются в задачу Коши. Это не должно умалять значение этих ССП. Более того, рассмотрение многих СРП нередко исходит и базируется на результатах, полученных для ССП. Начальные условия, строго говоря, также являются граничными (краевыми) условиями. Однако, они связаны с выделенной (особой) числовой переменной, роль которой играет физическое время. Если пользоваться фундаментальными понятиями теории систем "состояние" и "движение [3], СРП можно определить как систему любой природы, состояние и движе- ние которой описывается одной или множест- вом функций нескольких независимых пере- менных. При этом движение можно понимать как последовательность (непрерывную или дискретную) состояний, зависящих от одной независимой переменной, обычно, времени. * Краевыми (или граничными) условия- ми называют условия, накладываемые на па- раметры СРП в точках границы тех областей, на которых рассматривается СРП.
ВВЕДЕНИЕ ЗАДАЧИ УПРАВЛЕНИЯ СРП 643 д дх Существуют системы, состояние которых хотя и описывается функцией одной незави- симой переменной, однако их целесообразно отнести к СРП. Примером может служить установившееся (не меняющееся во времени) распределение температуры Q(x) в одномер- ном (тонком) стержне х е [0, /|. Здесь со- стояние, описываемое функцией Q(x) одной независимой переменной хе [0, /|, удовле- творяет простейшему одномерному уравнению теплопроводности: =0, 0<х</, (9.1.1) с граничными условиями «о) = Оо; 0(1) = 61, (9.1.2) где функция Х(х) описывает распределение параметра этой системы, имеющего в данном примере смысл теплопроводности (коэффи- циента теплопроводности). В уравнения, опи- сывающие СРП, может входить несколько распределенных параметров, задаваемых свои- ми функциями распределения. Приведенный выше пример СРП характеризуется еще и тем упомянутым выше важным признаком, что СРП описывается краевой задачей, задаваемой равенствами (9.1.2) для уравнения с частными производными (9.1.1). Поскольку здесь речь вдет о функции одной независимой перемен- ной, то в (9.1.1) частные производные можно заменить на полные. Но суть от этого не из- менится: данную систему естественно считать СРП вследствие наличия граничных условий (9.1.2). К граничным условиям могут относиться условия, заданные необязательно в виде ко- нечных равенств, выполняемых в конечных точках области определения функций, описы- вающих состояние. Граничные условия могут задаваться и в виде предельных условий на бесконечности и (или) конечных точках облас- ти определения. Важно, чтобы с их помощью состояние СРП определялось однозначно. Граничные условия, как, например, (9.1.2), не обязательно описываются "алгебраическими" выражениями. В них могут входить и "предельные" аналитические величины, такие, как производные (частные или обыкновен- ные), интегралы и др. Данное выше определение СРП, как сис- тем, описываемых уравнениями с частными производными и граничными условиями, мо- жет быть расширено, например, путем вклю- чения в понятие СРП систем, описываемых интегральными или интегро-дифференциаль- ными уравнениями. Многие уравнения с част- ными производными и, в частности, линейные могут быть сведены к эквивалентным инте- гральным уравнениям, хотя не всякое инте- гральное уравнение может был» сведено к эк- вивалентному дифференциальному уравнению. В ряде случаев СРП могут описываться функциями, которые подчиняются еще более сложным, нежели интегральные или диффе- ренциальные, уравнениям, носящим функ- ционально операторный характер и не сводя- щимся к уравнениям в производных и инте- гралах. Математическим аппаратом для изуче- ния подобных систем служит функциональный анализ. Вследствие такого разнообразия и сложности СРП нельзя ожидать разработки самых общих методов и подходов к рассмот- рению СРП. Нередко каждый новый класс СРП требует совершенно новых теоретиче- ских, практических и вычислительных подхо- дов, разработки нового или усовершенствова- ние старого математического аппарата. Многие важные задачи изучения СРП не решены до сих пор. Например, для такого важного класса СРП, как гидродинамические до сих пор не решен окончательно вопрос о существовании решения уравнений Навье-Сгокса. Для СРП могут был» поставлены те же самые задачи управления, что и для ССП, по крайней мере, по названию задач. Однако, чтобы те же самые задачи управления, что и для ССП, точно и корректно поставить для СРП, часто требуется существенно их обоб- щить и переосмыслить. Итак, задачи управления для СРП также весьма разнообразны: построение разомкнутых и замкнутых систем, задачи анализа и синтеза, оптимального управления, управляемости, финитного управления, наблюдаемости, ус- тойчивости, реализуемости, стохастические, детерминированные и игровые, задачи статики и динамики и др. Если, например, взять задачу оптималь- ного управления, разработанную для ССП, то для СРП ее даже невозможно сформулировать в более или менее общем виде. Даже для кон- кретной и не очень сложной классической СРП можно поставить целую серию практиче- ски осмысленных, но существенно разных по своему характеру задач оптимального управле- ния, для которых сейчас не существует общих методов и подходов к решению. Большие трудности возникают при попытке точной формулировки понятия устойчивости СРП. Можно ввести несколько определений устой- чивости для одной и той же СРП, отражаю- щих разнообразие характеров протекающего в ней процесса. Поэтому ниже, когда речь будет идти о точных постановках задач и методах их решения, мы будем рассматривать лишь опре- деленные классы СРП, часто ограничиваясь линейными системами. 21*
644 Глава 9.2. ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП Глава 9.2 ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП И ИХ МАТЕМАТИЧЕСКИЕ ФОРМУЛИРОВКИ Простейшая, но очень характерная и ти- пичная задача управления - управление одно- мерным температурным распределением (полем). Во многих производственных процес- сах большое значение придается экономично- му нагреву металла (быстрому, качественному, с минимальными затратами и потерями). На- пример, работа прокатного стана или анало- гичного оборудования, предназначенного для горячей обработки металла давлением или термообработкой, в значительной степени зависит не от среднемассовой температуры обрабатываемого изделия, а от распределения температуры по сечению изделия или по всему объему нагреваемого тела. Нагрев изделий, как правило, происходит в печах и температура печи является управляющим воздействием. Изменяя подачу топлива в печь или меняя установку ретулятора температуры, можно реализовать те или иные графики нагрева ме- талла. Рассмотрим нагрев бесконечной одно- родной пластины конечной ширины 2S. Пусть распределение температуры по толщине пла- стины х, -S < х < S, и во времени t, 0 < t < Т, описывается функцией Q(x, /)• Это означает, что распределение температуры Q(x, t) задано в области Д которая в данном случае в плос- кости с декартовыми координатами (х, /) представляет собой прямоугольник. Функция Q(x, f) описывает состояние объекта, его из- менение во времени. Внутри отрезка [-5, 5] при t > 0 распре- деление температуры Q(x, f) подчиняется ли- нейному дифференциальному уравнению в частных производных второго порядка, широ- ко известному под названием уравнение теп- лопроводности, или уравнение Фурье: St дх2 ’ (9.2.1) где а - температуропроводность. Для того, чтобы решение этого уравнения было опреде- лено однозначно, необходимо задать гранич- ные, или краевые условия. При этом гранич- ные условия, соответствующие границе t = (например, при 4) = 0), называют начальными. Для уравнения теплопроводности (9.2.1) наиболее общие линейные краевые условия имеют вид: х^(5.0 = «1[«1(о-е(‘5.0]. '>о; (9.2.2) -X^(-S>‘) = a2[»2(t)-Q(-S,t)], t>0, (9.2.3) где X - теплопроводность; оц и а 2 - коэффи- циенты теплообмена между греющей средой (печью) и металлом; «1(0 и «г(0 - температу- ры греющей среды соответственно с одной и другой стороны от пластины. Температуры «1(0 и «2(0 являются функциями времени и находятся в распоряжении оператора печи. Эти функции являются управляющими воз- действиями или управлениями. Физический смысл краевых условий (9.2.1) и (9.2.2) прост: они выражают равенст- во тепловых потоков через поверхности пла- стины при х = S и х = -S изнутри и снаружи поверхностей, т.е. тепловой поток на поверх- ности тела пропорционален разности темпера- тур греющей среды и поверхности тела (закон Ньютона). Начальное условие или начальное рас- пределение в практических условиях бывает известно более или менее точно. Его можно задать равенством С(х, 0) = Qq(x), -S <, х <, S. (9.2.4) В дальнейшем частные производные не- которой функции Q(x, t) по времени мы для краткости иногда будем обозначать точками над функцией. Например, №0=р(Х(0; ^=ё(х,п. er аг2 Если функция Q(x, t) зависит от одной про- странственной переменной х, то производную по этой пространственной переменной будем обозначать штрихами: dt дх1 Если некоторая функция 2(х, у, t) зависит от двух (или более) пространственных перемен-
ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП 645 ных, то производные по этим переменным будем обозначать буквенными индексами: d2Q(x,y,t) дх2 = Gxx(x,y,t); d3Q(x,y,t) dxdydt = Qxy(x,y,t). Тот факт, что проводится сначала дифферен- цирование, а затем подстановка числового значения переменной обозначается так: (S,t) или Q'(S, t). Это выражение озна- чает следующее: И(Л,).№().5Фг11 . дх v ' v ' дх x=S » dQ(S,t) Выражение ——- означает, что сна- чала аргумент х принял значение х = 5, а затем произведено дифференцирование по аргументу t. Уравнения (9.2.1) - (9.2.4) описывают процесс нагрева пластины. Одной из целей нагрева является получение заданного распре- деления температуры тела по его массе. Мате- матически это требование может был» задано в виде уравнения конечного состояния объекта: С(х, 7) = g*(x), -S <, х <, S, (9.2.5) где Т - некоторый момент времени; @(х) - заданное или желаемое распределение темпе- ратуры. Задача получения заданного распределе- ния (9.2.5) при помощи изменения управ- ляющих воздействий (температуры внешней окружающей среды) U\(f) и «2(0» 0 < Z < Т, является характерной задачей в теории управ- ления распределенными системами. Это по существу задача об управляемости данного объекта. Так как часто нагрев тел происходит в специальных технических агрегатах ограни- ченных возможностей, то роль окружающей тело греющей среды играет рабочее простран- ство печи. Каждый конкретный нагреватель- ный агрегат имеет конечный объем рабочего пространства, конечную стойкость жароупор- ной кладки, конечную калорийность химиче- ского и мощность электрического источников энергии. Математически это можно записать в виде задачи с ограничениями типа неравенств, наложенных на управляющие воздействия, т.е. на температуру рабочего пространства печи: At <; «1(0 <. Л2; А3 < «2(0 s Af, (9.2.6) где Л2, A3, Ад - заданные постоянные чис- ла, характеризующие предельно допустимые максимальные и минимальные значения тем- пературы в печи. Таким образом, простейшая задача полу- чения заданного распределения (9.2.5) может осложняться тем, что помимо условия (9.2.5) на величины управляющих воздействий нало- жены ограничения типа (9.2.6). В задачах по- добного рода дополнительные ограничения могут иметь весьма разнообразный характер. Если, например, по каким-либо причинам недопустимы резкие перепады температуры внутри нагреваемого тела, то это ограничение в ряде случаев можно включать в постановку задачи. Таким образом мы получаем задачу с ограничениями на функцию состояния объекта. В частности, градиент температурного поля Q(x, /) внутри тела lgradxe(x, 0l 2 4 (9.2.7) что в одномерном случае соответствует огра- ничению на частную производную по про- странственной переменной -5^х<5, Г>0. дх 3 (9.2.8) Если возникает опасность оплавления поверхности металла, что недопустимо во многих технологических процессах, то необхо- димо учесть это ограничение, записав его в виде соответствующего неравенства: ДО, 0^4», Qt-S't^Ab t£0, (9.2.9) где А$ - предельно допустимая температура поверхности тела, при которой не происходит оплавления металла. Обычно управление процессом нагрева осуществляется путем изменения положения регулирующего органа, например, угла пово- рота регулирующей заслонки трубопровода, по которому идет топливо в печь, или изменени- ем положения реостата, определяющего мощ- ность электрического тока, подаваемого в печь электрического нагрева. Обозначим изменение положения регулирующего органа величиной (сосредоточенной) w = w(t). Положение регулирующего органа также имеет свои допустимые пределы изменения: At£w(f)<As, f2>0. (9.2.10) Каждому положению регулирующего органа ю в установившемся режиме при неиз- менной нагрузке соответствует вполне опреде- ленная температура в печи, например и\ и 1/2*
646 Глава 9.2. ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП Однако температуры i/j и не могут мгно- венно прийти в установившееся состояние, существует некоторый переходный процесс установления температуры в печи. Если это время соизмеримо со временем нагрева, то возникает задача учета динамики изменения управляющих воздействий, в данном случае - температур Щ и и%. Простейший способ учета этой динамики, широко распространенный в теплотехнической теории и практике, состоит в том, что связь между w(l) и Ui(f) или 1^(0 задается соответствующим обыкновенным Дифференциальным уравнением. Хорошее описание этой связи можно задать уравнением первого порядка с запаздыванием (9.2.11) где 0/ - постоянные времени печи; X/ - постоянные коэффициенты; т/ - запаздывания по /-му каналу управления. Более точное опи- сание связи между функциями w(/) и «ХО, / = = 1, 2 может был» получено, если провести полный расчет теплового баланса печи в сис- теме "кладка печи - греющая среда - нагревае- мое тело". Таким образом, по мере необходимости описание объекта управления можно значи- тельно усложнять, добиваясь большей адекват- ности, добавляя ограничения в виде уравнений типа (9.2.11) или ограничения в виде нера- венств, например, типа (9.2.10). Часто услож- нение и обобщение (иногда существенное) может произойти вследствие усложнения ха- рактера рассматриваемого управляемого объек- та. Например, вместо задач с линейным урав- нением (9.2.1) надо рассматривать задачи с нелинейным или неоднородным уравнением с коэффициентами, зависящими от пространст- венных координат или времени, или от со- стояния самого объекта, т.е. от температуры. Тогда уравнение (9.2.1) заменяется более сложным уравнением: t дО a L dol ^^7 = 47 (9.2.12) dt дх дх / где Ь - теплоемкость; р - плотность; X - теп- лопроводность нагреваемого тела; коэффици- енты b, р, X в общем случае могут был» задан- ными функциями х, t и Q, т.е. Ь = b(x, t, О; р = р(х, t, Q); к = Цх, t, Q). (9.2.13) В правой части уравнения (9.2.12) может при- сутствовать членДх, /, Q), который характе- ризует "внутренние" (в пределах -S < х < S) источники или стоки тепла. Эти источники могут был» как управляемыми, так и неуправ- ляемыми. Граничные условия (9.2.2), (9.2.3) могут носить более сложный характер, точнее учиты- вающий природу внешнего теплообмена тела с греющей средой. Например, если во внешнем теплообмене существенную роль играет поми- мо конвективного еще и лучистый теплооб- мен, что в основном имеет место при высоких температурах, то в правые части уравнений (9.2.2), (9.2.3) необходимо добавить новые члены, учитывающие лучистый теплообмен по закону Стефана-Больцмана: \Q'(S, f) = - 0(3, О) + + ₽1{[«10)]4 - 1О(х, 014}; (9.2.14) -XQ’(-S, t) = a2[«2(/) - Q(-S, 1)] + + P2{l«2(0l4 - lQ(x, Ol4}- (9.2.15) Здесь мы сталкиваемся с нелинейной за- дачей. Нелинейность входит в задачу через граничные условия (9.2.14), (9.2.15). Такую задачу можно свести к некоторому нелиней- ному интегральному уравнению. Действительно, пусть для простоты иМ '= и2(/) = и</)- Тогда из условия сим- метрии (при нулевом начальном условии) распределение температуры Q(x, f) можно линейно (с помощью линейного интеграль- ного оператора) выразить через температуру поверхности Q(S, f) с помощью равенства t Q(x,t) = J K(x,t,x)Q(S,x)ck, (9.2.15, a) 0 где K(x, >t, x) - функция влияния или им- пульсная переходная функция системы, если за вход системы принять Q(S, I), а за выход принять Q(x, f). Дифференцируя обе части равенства (9.2.15. а) по х и подставляя в него значение х = S в силу правого условия (9.2.14), полу- чим нелинейное интегральное уравнение отно- сительно величины Q(St t): t xj K'x(S,t,x)Q(S,x)<h = <xj[u(0 - Q(S, fl] + 0 +Pi{[«(0]4-|e[-M4]}>'*a (9.2.15, 6)
ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП 647 Если функция 1/(0 задана, то, решив это ин- тегральное уравнение (9.2.15, б), можно найти Q(S, t), а затем с помощью соотношения (9.2.15, а) простым интегрированием получить распределение температуры. Для рассматриваемой задачи о нагреве металла в производственных условиях кроме того весьма важно получение этого распреде- ления при наименьшем окислении поверхно- сти. Для решения этой задачи кроме уравне- ния теплопроводности надо ввести уравнение, описывающее динамику окалинообразования. Если окалинообразование характеризовать толщиной £ корочки окалины на поверхности тела, то можно установить связь между функ- цией £(/) и температурой поверхности тела, например, при х = S в виде обыкновенного дифференциального уравнения первого поряд- ка: = (9.2.16) Анализ всевозможных законов окисления (9.2.16) позволяет записать уравнение (9.2.16) в более специфичной и более простой форме: (9217) * • (9217) В этом случае уравнение окисления ста- новится уравнением с разделяющимися пере- менными, что позволяет его детально проана- лизировать и найти универсальные законо- мерности нагрева с минимальным окислением. Уравнение (9.2.16) является "ответвлением" (системой с сосредоточенным параметром) в основной структурной схеме объекта управле- ния с распределенными параметрами, характе- ризующимся функцией Q(x, f). Другим примером ответвления является задача цементации с целью повышения сопро- тивления усталости и предела выносливости ряда сталей. Для получения наивысших значе- ний этих показателей технологами предложена функция распределения концентрации углеро- да с*(х) в зависимости от глубины х от по- верхности изделия, 0 £ х £ I. Распределение концентрации углерода описывается функцией с(х, /), которая удовлетворяет уравнению диффузии —=—[дс>е)—, dt дх^^дху где Q = Q(x, /) - распределение температуры; IXе, & ~ коэффициент диффузии углерода, который для конкретной марки стали зависит от концентрации с и температуры Q. D(c, Q) = А + В(с) ехр - м R где Л, Л, R - постоянные, зависящие только от марки стали; В(с) - известная функция от концентрации с. Граничное условие при х = 0 имеет вид где v(/) - углеродный потенциал атмосферы; у - коэффициент массопереноса. Граничное условие при х = I можно принять в виде C(l, t)=co, где ср - константа. Распределение температуры Q(x, f) опи- сывается обычным уравнением теплопровод- ности (9.2.1) с граничными и начальными условиями (9.2.2) - (9.2.4). Задача управления состоит в том, чтобы найти такое изменение углеродного потенциа- ла атмосферы v(/) и температуры атмосферы 1/1(0, и2(0> чтобы к некоторому заданному моменту времени Т истинное распределение углерода с(х, 7) было предельно близко в определенном смысле к заданному с*(х). Еще одним примером ответвления явля- ется задача учета термонапряжений, возни- кающих внутри нагреваемого тела. В этом случае необходимо рассматривать дифферен- циальные уравнения в частных производных (уравнения термоупругости) и, следовательно, кроме распределения температуры возникает проблема анализа распределения термонапря- жений или термоперемещений. На состояние этих полей также могут накладываться ограни- чения для того, чтобы термонапряжения не превысили допустимые пределы и не произо- шел разрыв сплошности тела (трещины). Если обозначить термонапряжение через ст(х, 0, то ограничение можно записать в виде £ ст(х, /) £ Лщ, -S £ х £ S, Г > 0. (9.2.18) В соответствии с принятой теорией прочности в пространственном случае ограни- чивающие условия могут накладываться на некоторую функцию от тензора напряжений Л^Х, У, Z, 1)1 S Лц, (9.2.19) где Лц - некоторая фиксированная константа. Совершенно аналогично рассмотренному выше одномерному случаю можно дать описа-
648 Глава 9.2. ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП ние задачи управляемого нагрева, коща тело имеет конечные размеры во всех трех про- странственных измерениях. Пусть нагреваемое тело занимает некоторую область D трехмер- ного пространства с евклидовыми координа- тами х, у, z, a G - поверхность, ограничиваю- щая згу область D. Пусть функция С(х, у, Z, f) дает распределение температуры в теле D. Если тело однородно, функция Q(x, yf z, О внутри тела D подчиняется уравнению тепло- проводности Q = АС, (х, У, z) е D, t> 0, (9.2.20) с начальным условием Q(x, у, Z, о) = 0Ь(х, у, z). (9.2.21) Здесь А - оператор Лапласа, . д2 д2 д2 & =---z- Ч---z- Ч----z-. дх2 ду2 dz2 Уравнение (9.2.20) нужно дополнить гра- ничным условием. Например, если тело по- мещено в греющую среду, температура кото- рой зависит только от времени /, а теплообмен на поверхности носит конвективный характер, то граничное условие можно записать в виде. (9.2.22) ае| где —— - производная по нормали п к по- дл G верхности (?, взятая в точке, лежащей на по- верхности G. Функцию м(1) температуры окружающей среды можно рассматривать как управляющее воздействие с целью получения заданных рас- пределений 2(х, у, z, 0 внутри тела D. Характерный пример - задача с управ- ляющим Воздействием, распределенным вдоль некоторого многообразия внутри области. Пусть нагрев тела D происходит с помощью тепла, выделяемого электрическим током, проходящим по проволоке, пронизывающей тело D. Как это отразить в уравнениях объекта ? Пусть проволока имеет форму кривой (одномерное многообразие), уравнения кото- рой можно задать параметрически: х =x(Q; у =И£); z=z(5); (9.2.23) где § - параметр; xfo), И5о), z(£o) и xfo), X£i). Zfti) - координаты точек соответственно входа и выхода проволоки из тела D. Нагрев тела электрическим током, проходящим по проволоке, означает наличие внутреннего ис- точника тепла в теле D. Пусть мощность, рас- сеиваемая на единице длины, равна w(l). То- гда в уравнение теплопроводности (9.2.20) нужно добавить еще один член, и оно будет выглядеть следующим образом: с = = ДС + w(t) 8[х - х(§)| 8[у - >(§)] 8[z - Z($)], (9.2.24) где (х, у, z) е D, Ед <. £ <. и 5 есть 5-функ- ция. Если кривая / задана двумя уравнениями (как пересечение двух поверхностей) z=<p(x, у); z=w(x,y), то уравнение (9-2.24) примет вид Q = ДС +h»(Z)8[z -<p(x,y)]8[z - <|/(х,Я). (9.2.25) Если источник тепла мощностью w(l) на единицу площади распределен по некоторой поверхности (двумерное многообразие), урав- нение которой имеет вид Z =Дх, у), (9.2.26) то основное уравнение будет иметь вид e = AC + w(Z)8[z-/(x,y)]. (9.2.27) Большой интерес представляет задача управления индукционным нагревом изделий. Физическая суть индукционного нагрева со- стоит в том, что переменный электрический ток индуцирует переменное магнитное поле, которое, в свою очередь, индуцирует электри- ческий ток в проводящем нагреваемом теле. В термообработке и при нагреве перед механиче- ской обработкой к качеству нагрева предъяв- ляют все более жесткие требования, связанные с распределением теплового поля по сечению изделия с целью получения заданной метал- лографической структуры или механических свойств. В простейшем одномерном случае про- цесс индукционного нагрева может был» опи- сан неоднородным уравнением теплопровод- ности, в котором присутствует член, учиты- вавший наличие источников тепла, индуциро- ванного переменным электромагнитным полем Q = aQ" + /[х, /,«(/)]. (9.2.28) В этом уравнении функция Дх, t, u(0] они- сывает внутренний источник тепла. Так как
ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП 649 обычно индукторы питают переменным элек- трическим током частоты со, то в простейшем случае функция Дх, Г, «(/)] = «(О sincof exp (-sx), (9.2.29) где u(f) - управляющее воздействие, величина которого пропорциональна амплитуде напря- жения (или тока) на индукторе; 5 - показатель затухания, который пропорционален глубине проникновения электромагнитной волны в толщу нагреваемого материала; х - расстояние от поверхности детали до рассматриваемой точки в теле. На величину «(/) могут был» наложены дополнительные ограничения, на- пример, Ai £ «(/) £ А2. (9.2.30) Рассмотрим задачи управления нагревом (и охлаждением) тел с изменяющимся физиче- ским состоянием (задачи учета фазовых пере- ходов). С такого рода процессами часто имеют дело в металлургии в процессах литья и не- прерывной разливки. Например, при разливке стали в мартеновском цехе в изложницы про- исходит постепенное охлаждение слитка. Есте- ственно, что быстрее всего охлаждается по- верхность слитка. Температура поверхности опускается ниже температуры плавления, и слиток покрывается твердой корочкой. При этом внутренность слитка остается жидкой. По мере отвода тепла в окружающую слиток среду толщина затвердевшего слоя увеличивается. Поверхность раздела двух фаз - твердой и жидкой (фронт кристаллизации) - продвигает- ся к середине. Часто слитки, разлитые в мар- теновском цехе, поступают в отделение нагре- вательных колодцев прокатного цеха блюминга или слябинга, когда середина слитка находится еще в жидком состоянии. Такой режим работы имеет то преимущество, что в значительной степени сохраняется теплосодержание слитков и тем самым достигается экономия топлива в нагревательных колодцах. В этом случае сами колодцы служат больше не для нагрева (тепла в слитках почти достаточно, чтобы начать про- катку), а для выравнивания температуры слит- ка по его массе. Таким образом, возникает задача управления внешним теплоотводом от слитка (температурой п(/) нагревательного колодца). Рассмотрим одномерную задачу, когда поверхность раздела жидкой и твердой сред является плоскостью, которая движется параллельно самой себе по закону х = 1(f). Пусть распределение температуры в твердой фазе описывается функцией Q\(x, f), 1(f) < х < 5; распределение температуры в жидкой фазе - функцией &(х, /)> 0 £ х £ 1(f). Эти функции удовлетворяют уравнениям теп- лопроводности: 01 = a10f, /(0 < х < S, t > 0; (9.2.31) 02 = «2О2, 0 < х < /(Г), t > 0, (9.2.32) где ai и 02 ~ коэффициенты температуропро- водности соответственно твердой и жидкой фаз слитка. Краевые условия при х = S обыч- ные и могут иметь вед (9.2.14), (9.2.15). Для полной определенности этой задачи (для единственности ее решения) необходимо запи- сать условия сопряжения функций Qi(x, f) и Q2(x, f) на движущейся границе раздела фаз при х = 1(f). Так как распределение темпера- туры непрерывно, то (?i(/(/), d ~ OAKth d- За промежуток времени (t, t + Al) граница переместится от точки Х{ до точки Х\ + Ах. При этом затвердеет масса рАх, где р - плот- ность металла на единицу длины вдоль оси х. При затвердевании выделяется количество теплоты урАх, где у - скрытая теплота плавле- ния. Для выполнения теплового баланса это количество теплоты должно равняться разно- сти количеств теплоты, прошедшей через гра- ницы х = Xi и х = Xi 4- Ах, т.е. должно вы- полняться равенство [*-2С2(х1’0 - х101(х1 + Дх,?)]д/ = урДх, где Xi и А.2 - коэффициенты теплопроводности соответственно твердой и жидкой фаз. Пере- ходя к пределу при AI -> 0, получит условие на границе раздела фаз x2ej(w,0 - xiQi'(/(o,0 = yp^. (9.2.33) Аналогичное условие можно записать для точ- ки х = -1(f). Физически условие (9.2.33) означает, что скачок потока тепла через фронт кристаллиза- ции равен количеству теплоты, выделившейся от кристаллизации на поверхности раздела фаз в единицу времени. Уравнение (9.2.33) играет основную роль при описании других важных теплотехниче- ских производственных процессов, таких, как непрерывная разливка стали, выращивание монокристаллов из расплавов и др. Далее рассмотрим задачи управления те- пловыми процессами с учетом пространствен- ного движения нагреваемых тел или греющих агентов. Типичным объектом, где происходят также процессы, является проходная нагрева- тельная печь. Существует много разновидно- стей таких печей: методические печи для на- грева слябов перед прокаткой, печи для тер-
650 Глава 9.2 ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП мообработки и нагрева изделий перед механи- ческой обработкой и др. Состояние управляе- мого объекта в простейшем случае, когда пре- небрегают толщиной нагреваемого материала в вертикальном направлении (тонкое тело в теплотехническом смысле, критерий Био Bl = — < 0,25, где а - коэффициент тепло- обмена поверхности металла с внешней сре- дой; S - толщина тела; X - коэффициент теп- лопроводности), можно задать распределением температуры Q(x, f) по длине печи х, 0 £ х £ Z, в каждый момент времени /, t > 0. Пусть ме- талл движется как твердое тело со скоростью V, которая в общем случае может зависеть от времени t, в положительном направлении оси х. Пусть температура греющей среды (или просто температура печи) задается функцией w(x, I), 0 £ х £ Д Г > 0. Эту функцию можно считать управляющим воздействием. Распреде- ление температуры в печи поддерживается на желаемом уровне с помощью соответствующих регуляторов температуры. Если проходная печь, как обычно, разбита на п зон, а в преде- лах каждой А>й зоны температуру можно счи- тать постоянной величиной иМ> не завися- щей от х, которая поддерживается на задан- ном уровне или меняется по определенной программе, то п(х, I) можно записать в виде U(x,/)=U^,Xk^X^Xk+1,XQ-0,X„=L. (9.2.34) В более общем случае, когда, например, имеется взаимное влияние зон друг на друга, вид функции п(х, I) может быть значительно сложнее. Более того, температуры в фор- муле (9.2.34) также могут быть связаны дина- мической зависимостью с расходом топлива в к-й зоне. Но если температура в зоне, под- держиваемая регулятором, устанавливается значительно быстрее, чем температура металла, то динамикой этого процесса пренебрегают и считают управление и(х, t) "безинерционным". Уравнение нагрева металла, т.е. уравне- ние для Q(x, I) имеет вид bQ + bvQ* + Q-u = Q, 0 < х< Lt Г> 0, (9.2.35) . cpS где о =---- - коэффициент, отражающий а теплофизические свойства материала, который может зависеть от х, t и Q, S - толщина тела; с - теплоемкость; р - плотность; а - коэффициент теплообмена. Для однозначности решения уравнения (9.2.35) при заданных функциях ц(х, I), v(l) и d(x, Z, Q) необходимо задать краевое условие при х =» 0: 0(0, 0 = 01W, t * 0, (9.2.36) и начальное условие 0(х, 0) = 0Ь(*)> 0 £ х £ L. (9.2.37) Таким образом, температура элемента металла вдоль оси х зависит от изменения скорости продвижения металла v(l) (темпа) за время пребывания данного элемента в печи. Изменение скорости v(l) является одним из главных возмущающих воздействий. Другим основным возмущающим воздействием явля- ется изменение коэффициента д, так как в печь может быть загружена новая партия ме- талла, имеющая значения теплофизических параметров а, с, р и толщину 5, отличающиеся от значений этих величин b предыдущей пар- тии металла. Возникает задача компенсации внешних возмущающих воздействий путем соответст- вующего изменения управляющих воздейст- вий, т.е. путем изменения распределения тем- пературы в печи п(х, I). На функцию и(х, I) накладываются естественные ограничения типа неравенств Ai £ п(х, 0 £ Л2. (9.2.38) Взаимное влияние зон может выразиться в ограничении на градиент распределения п(х, 0» например: |gradx«(x, Г)| = |«'(*, 0| < Л. (9.2.39) Для печей, нагревающих блумы или сля- бы, основной задачей управления является задача о выдаче металла с заданной температу- рой 0*(/), t £ tQ. Математически это условие записывается в виде равенства 0(4 1) = (ГО), titQ. (9.2.40) Если это равенство невыполнимо, то можно поставить задачу о минимизации укло- нения истинной температуры выходящего из печи металла от заданной ff. За меру такого уклонения можно взять интеграл Т J = J |о(4 0 - у 2 1, (9.2.41) о где Т - заданное время; у - заданное число; - заданная программа для температуры выходящего из печи металла при t £ Iq. Иные требования предъявляют к системе управления в проходных печах, предназначен-
ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП 651 ных для термообработки каждого элемента Дх движущегося металла по определенной темпе- ратурной программе. В этом случае можно определить заданную температуру Qi(x,t) в каждой точке х и в каждый момент времени t Управлящие воздействия должны обеспечивать выполнение равенства 0£x£Z, (9.2.42) или, если это невозможно, обеспечивать ми- нимальное отклонение истинного распределе- ния Q(x, f) от заданного й (х, t) . Задача о нагреве материала в проходной печи может усложняться: тело не является "тонким", т.е. возникает задача нагрева "массивного" в теплотехническом смысле тела по толщине (вдоль вертикальной координаты, например, у). Тоща описание объекта услож- няется - распределение температуры описыва- ется функцией Q(x, у, f), 0 £ х £ L, 0 £ у £ S, tZO. Внутренний теплообмен описывается уравнением Q = aQfy-vQ'x (9.2.43) с граничными условиями при х = S (в случае теплообмена по закону Ньютона) ^Qy (х, S, t) » ф(х, Г) - 2(х, S’, Г)]. (9.2.44) При у ж 0 (в случае тепловой изоляции снизу, в частности, коща металл лежит прямо на подине печи) О;(х,0,/) = 0. (9.2.45) Граничное условие при х = 0 будет иметь вид б(о, у, t) = C?iO, 0- Начальное условие должно быть задано в виде е(х, у, о) = Оо(х, у). Большое распространение в промышлен- ности имеют проточные теплообменные аппа- раты в связи с чем возникла задача управления проточным теплообменом. Теплообмен проис- ходит между двумя движущимися средами со скоростями соответственно Vj и Распреде- ление температур в этих средах будем описы- вать двумя функциями соответственно Qi(x, f) и Ql(x, f). Если направление скоростей Vi и V2 совпадают, теплообменники называют пря- моточными, в противном случае - противо- точными. Процесс теплообмена между этими средами описывается системой двух уравнений (опять же в случае линейного закона теплооб- мена Ньютона): biQi + + ft - & = 0; (9.2.46) + Q2 - ft = 0, (9.2.47) ще bi и ^2 - коэффициенты, характеризующие теплофизические свойства соответственно 1-й и 2-й сред. Для определенности этих уравнений нужно задать начальные условия: С1(х, 0) = С11(х), 0 < х < L; (9.2.48) 01<х, 0) = Q2i(x), 0 < х < L. (9.2.49) Если рассматривать теплообменник про- тивоточного типа и (пусть Vj совпадает по направлению с осью х, v2 направлено в проти- воположную сторону), то граничные условия для С1 должны был» заданы при х = 0: Ci(0, I) = м(1), (9.2.50) а для Сг - ПРИ х = L: Q2(L, f) = f&. (9.2.51) Граничное условие (9.2.50) можно рас- сматривать как управляющее воздействие. Иноща за управлявшее воздействие можно принять и скорость продвижения первой (а, может был», и второй) среды Vp Задача управления таким аппаратом мо- жет состоять в том, чтобы, несмотря на изме- нение входной температуры 2-й среды Д/) или изменение ее скорости v2(l)> найти такое управление и(/)5 при котором температура второй среды на выходе из теплообменника поддерживается на заданном уровне С*(0» т е- необходимо выполнить равенство 6г(0, 0 = С*(0, '^0. (9.2.52) Если равенство (9.2.52) невозможно, то нужно минимизировать в определенном смыс- ле отклонение &(0, О от При решении этой задачи также надо учитывать различного рода дополнительные ограничения, обуслов- ленные физическими или техническими осо- бенностями Каждого конкретного агрегата. Значительный практический интерес представляет задача высокоинтенсивной обра- ботки изделий с помощью подвижных источ- ников воздействия. Примером такого процесса служит нагрев тела управляемым электронным пучком. Управление состоит в том, что меня- ется интенсивность пучка электронов и точка или область его приложения к телу. Нагрев тела осуществляется электронным лучом, про- бегающим вдоль определенной траектории на поверхности тела. В связи с этим возникает проблема управления движением луча [5]. Рассмотрим простейший пример математиче- ской постановки задачи такого рода. Пусть имеется теплотехнически тонкий стержень
652 Глава 9.2. ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП длины /, не изолированный сбоку. Распреде- ление температуры по длине этого стержня будем задавать функцией Q(x, f), 0 х <, I, t £ 0, которая удовлетворяет уравнению теп- лопроводности Q = aQ" + aQ + /(х,/), 0 < х < /, t > О, (9.2.53) гдеДх, I) - количество теплоты, выделившееся от ударов электронов о стержень в момент времени t в точке х. Функция Дх, I) в зависи- мости от остроты (фокусировки) электронного луча может иметь различный вид. Например, при острой фокусировке источник можно считать точечным, и в этом случае функция Дх, /) может быть записана в виде Лх, t) = “1(0 8[х - и2(0]. (9.2.54) Здесь функция U\(t) характеризует интенсив- ность пучка электронов в момент времени f, функция «2(0 дает координату приложения этого источника в момент времени t. Функции «1(0 и ч/2(0 можно считать управляющими воздействиями. Для определенности задачи управления уравнения (9.2.53) и (9.2.54) надо дополнить граничными и начальными условиями: -Х2'(0, 0 = <42с - 2(0, 0], t > 0; (9.2.55) IQV, 0 = <х[& - 0(1, 01, />о; (9.2.56) О(х, 0) = 0о(х), о < X < /, (9.2.57) где Qc - температура окружающей среды. За- дача управления состоит в том, чтобы выбрать такие управляющие воздействия, стесненные отраничениями 4) £ «1(0 £ Ль 0 £ «2(0 А (9.2.58) чтобы за заданное время Т получить желаемое распределение температуры стержня 2*(х), т.е. достичь равенства 2(х, 7) = 0*(х), 0 £ х £ /, (9.2.59) или, если невозможно точное выполнение равенства (9.2.59), минимизировать в опреде- ленном смысле отклонение истинного распре- деления 2(х, 7) от желаемого 2*(х). Равенство (9.2.54) фиксирует один из ви- дов подвижного точечного источника тепла, который соответствует острой фокусировке источника. В случае размытой фокусировки функция Дх, 0 может принять другой вид: f(x,t) = «1(/)-Д=ехр. [х-и2(/)]2 2d (9.2.60) Эта кривая имеет симметричный колоко- лообразный (гауссовский) вид. Значение функции «2(0 дает абсциссу максимума Дх, 0 по х в каждый момент времени t. Числовой параметр d, d > 0, характеризует степень раз- мытости источника тепла. Если d стремится к нулю, источник типа (9.2.60) приближается к точечному источнику типа 8-функции, харак- теризуемому равенством (9.2.54). При увели- чении d источник становится все более размы- тым. Аналогичная задача о нагреве электрон- ным лучом может быть поставлена и в много- мерном случае, например, когда нужно про- греть тонкую (или массивную) двумерную ленту материала. Задача может усложниться тем, что лента нагреваемого материала (напри- мер, при термообработке в вакууме) непре- рывно движется, аналогично тому, как это происходит в проходных печах. Объектом управления с распределенными параметрами, где также имеется движущийся источник тепла, является плазменная горелка, имевшая большое число важных практических применений. Такая горелка представляет со- бой отрезок полого цилиндра (кусок трубы), внутри которого имеется локализованный на внутренней стенке этого цилиндра точечный источник тепла большой интенсивности (низкотемпературная плазма с температурной в несколько тысяч градусов). Для того чтобы этот источник тепла быстро не прожег стенку трубы и тем самым не вывел горелку из строя, им нужно управлять, перемещая этот источник по всей внутренней поверхности цилиндра с таким расчетом, чтобы вся внутренняя поверх- ность полого цилиндра горелки нагревалась как можно более равномерно без наличия местных разрушительных для горелки перегре- вов. Управление плазменным пятном можно осуществлять, например, с помощью магнит- ного поля. Проблема определения оптималь- ного (т.е. наилучшего по равномерности на- грева) управления и создания соответствующей управляющей системы является актуальной научной проблемой. Выше были описаны процессы, в кото- рых управление осуществлялось только одним
ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП 653 видом распределения, например, только теп- ловым полем. Однако на практике очень часто встречаются задачи управления процессами, в которых существенное значение имеет сово- купность взаимодействующих распределений физических величин различной природы. Ти- пичным примером объектов подобного рода являются поля термонапряжений и термопе- ремещений, в которых происходит взаимодей- ствие поля температур с подями термонапря- жений и термоперемещений. Такое взаимо- действие необходимо учитывать при управле- нии работой целого ряда машин, агрегатов и процессов: непрерывная разливка стали, вы- ращивание монокристаллов, разогрев стенок барабанов котлов, управление тепловой про- филировкой валков тонколистовых прокатных станов и др. Рассмотрим подробно последний из указанных здесь процессов. Получение качественного листа на тон- колистовых станах является одной из актуаль- нейших проблем, а главнейшим показателем качества является геометрическая форма про- катанного листа. Лист принимает заданную форму под действием обжимающих его уси- лий, когда его пропускают в зазор между дву- мя рабочими валками клети стана. По мере работы валков его идеальная цилиндрическая поверхность изнашивается и начинает сущест- венно отличаться от цилиндрической поверх- ности. Хотя абсолютное значение этого износа невелико и составляет десятые доли милли- метра, но поскольку эта величина интегриру- ется по длине прокатываемой полосы, она оказывает существенное влияние на ее форму и может привести к браку листа. Одним из эффективных оперативных средств компенса- ции износа валков является воздействие на тепловое состояние валка, что приводит к тер- морасширению валка, которое и компенсирует износ. Таким воздействием на тепловое поле валка может быть подача охлаждающей жидко- сти (воды или специальной эмульсии) вдоль всей образующей цилиндра валка. Реже осу- ществляется подогрев валка с помощью специ- альных также распределенных вдоль образую- щей газовых горелок (или других источников тепла). Здесь имеет место взаимодействие двух полей - температурного поля валка и поля термомеханических перемещений. Темпера- турное поле определяется возмущающими воздействиями от нагретой полосы прокаты- ваемого металла и управляющим воздействием в виде охлаждающей воды, подаваемой на поверхность цилиндра валка. Полученное та- ким образом температурное поле однозначно определяет поле термоперемещений. Будем рассматривать валок как прямой круговой цилиндр конечной длины 1L\ и ра- диуса R. Введем пространственную цилиндри- ческую систему координат (z, г, 6), жестко связанную с валком, и дополним это про- странство осью времени t. Температурное поле Дг, г, 0) валка внутри области £ Z £ L1, 0 £ г £ Я, 0 £ 0 £ 2л, t £ 0] должно удовлетворять уравнению теплопроводности t = а[т& +т„ +±т; , (9.2.61) где а - температуропроводность валка. На границе области D должны выполняться сле- дующие краевые пространственные условия: 1. На торцах - свободный теплообмен с окружающей средой температуры Тс и коэф- фициентом теплообмена а>: KTl\z-b =«1[гс-г(11,г,М]; (9.2.62) (9.2.63) где X - теплопроводность валка; 2. На боковой поверхности - теплообмен с полосой металла шириной 21^, температу- рой Tn(f) и коэффициентом теплообмена а?. И;|м=а2[Т,(0-ТШ/)]; 91(0 1 0 * 02(О, (9.2.64) t где 0jt(O = 0jto ~ J ®(т)А, к = 1,2; со - угло- 0 вая скорость валков; 3. Теплообмен с охлаждающей жидко- стью температуры Т* и коэффициентом теп- лообмена аз: ХГГ'|Г=R = аз[тх - т(г,я,М]; |г| * Ъ 03(О 0 * 04(О, (9.2.65) t где 0jt(O = 0jto “ f к = 3,4;; 2Z3 - 0 длина вдоль валка распределительного устрой- ства охлаждения; 4. На всей остальной боковой поверхно- сти - свободный теплообмен с окружающей средой. Начальные (временные) условия имеют вид
654 Глава 9.2 ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП Дг, г, 0, о) = Tote г, 0). Управление аз = и - коэффициент теп- лообмена между поверхностью валка и охлаж- дающей жидкостью - является функцией рас- хода жидкости q, т.е. и = fijq). Расход q, а следовательно, и управление и являются функциями времени t и координаты Z, |z| Т3. На функцию u(z, 0 накладываются естественные ограничения Лх £ и <. Аъ (9.2.66) ще Л1 и Ai соответственно наибольшее и наи- меньшее значения коэффициента аз = и. В теории упругости, в частности, в тео- рии термоупругости состояние деформируе- мого тела определяется полями перемещений и описывается тремя функциями перемеще- ния: w^z, г, 0) - перемещение по координате Z г, 0) - перемещение по координате г и Wete г> 0) ~ перемещение по координате 0. Эти функции являются координатами вектора перемещений w = и<г, г, 0) = = (w^z, г, е), wXz, г, 0), wt,(z, г, е)]. Поля напряжений описываются шестью функциями напряжений: тремя нормальными напряжениями cr^te г> 0), CT/rte G 0) и create г, 0) и тремя касательными напряжениями <*zrfc г, 0), create г, 0) и cr,ete г, 0)- Эти функции являются компонентами симметри- ческого тензора напряжений a(z, г, 0) = [a^z, г, 0)], = <sjf, i,j = Z, г, 0. Введенные выше функции перемещений и напряжений будем считать независящими непосредственно от времени t (квазистацио- нарный случай). Зависеть же от времени t они будут лишь постольку, поскольку температур- ное поле 7te г, 0, I), вызывающее эти пере- мещения и напряжения, зависит от t. Это до- пущение возможно потому, что скорости из- менения температуры во всех точках валка значительно меньше, чем скорость распро- странения звука в металле валка. Согласно теории термоупругости задача об определении полей перемещений и напря- жений в теле, занимающем область Д под действием поля температур, в частности, рас- сматриваемого валка, сводится к обычной за- даче теории упругости при наличии поля объ- емных сил г, 0) = PgradTte г, 0) и внешнего нормального поверхностного давле- Q Г ния р = —-----Т , где В - коэффициент ли- 1 - 2ц нейного температурного расширения; Е - мо- дуль продольной упругости; ц - коэффициент Пуассона. При этом вектор перемещений w должен удовлетворить в D cnejppmnisiKy век- торному дифференциальному уравнению в частных производных: Aw + * grad div w = PgradT (9.2.67) с граничным условием на поверхности G об- ласти Д ограничивающей валок, сгл| = - 1(7 1 - 2ц где п - внешняя нормаль к поверхности G. В нашем случае краевые условия задают- ся в терминах напряжений, а основное урав- нение (9.2.67) написано для перемещений. Однако тензор напряжений сг связан с векто- ром перемещений w посредством закона Гука (в декартовых прямоугольных координатах) = Е <*и =----- 9 1 +ц * 9 dw, 1 (dwt we кин‘ дексы (/, j} к) = (х, у, z) " циклические. Та- ким образом, получаем довольно сложную задачу управления процессом термоупругости для ограниченного цилиндра. Рассмотрение конкретных постановок за- дач управления для распределенных систем, движение которых носит колебательный ха- рактер, начнем с практически очень важной проблемы гашения пульсаций потоков газа (жидкости, электричества или других физиче- ских субстанций) в длинных трубопроводах. Типичной является проблема гашения пульса- ций давления и расходов в трубопроводах га- зокомпрессорных установок, особенно для поршневых газокомпрессоров. Установка пас- сивных фильтров для демпфирования пульса- ций малоэффективное средство борьбы с ни- ми.
ПРИМЕРЫ СОДЕРЖАТЕЛЬНЫХ ПОСТАНОВОК ЗАДАЧ УПРАВЛЕНИЯ СРП 655 Рассмотрим задачу об активном гашении пульсаций с помощью дополнительного управляемого источника колебаний. Линеари- зованные уравнения пульсаций газа в трубо- проводе можно записать в следующем виде: - р' = MqG; -G' = с0Р, (9.2.68) ще р =р(х, f) - давление; G = (r(x, I) - мас- совый расход; то - акустическая масса; - акустическая емкость. Пусть трубопровод име- ет длину /, 0 х £ I, и пусть на одном из кра- ев его при х = 0 действует некоторый источ- ник периодического возмущения расхода (работа цилиндра компрессора): 6(0, I) =Д|). (9.2.69) Периодически пульсирующий источник массового расхода Д1) в точке х = 0 вызовет нежелательные пульсации во всех точках тру- бопровода х е (0, /). Эти пульсации снижают КПД установки, а вследствие наличия резонансных условий могут привести к разрушению трубопровода. Способ управления пульсациями состоит в следующем. Выберем некоторую точку Хо на трубо- проводе, Q < xq < 19 и подсоединим в этой точке к данному трубопроводу некоторый дополнительный управляемый источник рас- хода с производительностью u(t). Наличие этого дополнительного источника массового расхода можно отразить в математических уравнениях по-разному. Например, достаточно заменить уравнения (9.2.68) на уравнения - р' = «об; - G' = сйр + к(/)8(х - хо) • (9.2.70) Пусть заданы начальные условия и ка- кое-либо граничное условие при х = /. Без ограничения общности можно считать, что среднее значение функции Д|) за основной период равно нулю. Тогда задачу о гашении пульсации можно сформулировать следующим образом: найти такое управляющее воздейст- вие «(/), t £ 0, чтобы при всех t > Tt где Т - какое-то ограниченное небольшое время, пульсации давления и расхода полностью от- сутствовали на участке трубопровода (х<), /), т.е. чтобы р(х, I) = 0, Gix, f) = 0, Xfc < х < I, t> Т Аналогичную задачу можно рассмотреть и для других физических процессов, напри- мер, как задачу передачи энергии по длинным линиям электропередач. Более простой разновидностью рассмот- ренной задачи является задача о гашении на- чальных отклонений в некоторой колебатель- ной среде. Пусть, например, состояние неко- торой системы описывается функцией Q(x, f) 0 х <> I, t £ 0, которая подчиняется обычно- му волновому уравнению Q = 2", о < X < I, t > 0, (9.2.71) Распределение начальных отклонений и скоростей задано: Q(x,o) = О0(х), Q(xfi) = Q\(x), 0 < X < /. (9.2.72) Допустив, что можно выбирать значения функции Q(x, f) при х = 0, т.е. 2(0,/) = «(/), /£0. (9.2.73) Пусть другое граничное условие при х = I имеет вид 2'(4 0 = 0, t 0. Требуется найти управляющее воздейст- вие #(/), 0 t Т, чтобы в моменты времени Т система успокоилась, т.е. Q(x9T) = 2(х,Т) = 0, 0£х£/. Можно потребовать, чтобы успокоение осуще- ствлялось за минимальное время Т. Задача может осложниться наличием дополнительных ограничивающих условий на управляющее воздействие типа Т |»<0| ръл. о Рассмотренные выше постановки задач обобщаются на многомерные случаи. Одним из приложений этой задачи может служить также задача о гашении (или генерировании) волн в экспериментальных бассейнах или электромагнитных колебаний в волноводах и резонаторах. С увеличением скоростей и ростом по- лезных нагрузок подвижных объектов удлиня- ют формы, уменьшают поперечные сечения и толщину обшивок и несущих конструкций, что приводит к большой гибкости и, следова- тельно, меньшей жесткости всей конструкции в целом. Поэтому при больших скоростях и совершении объектом маневров возникают упругие колебания корпусов и деталей, что является причиной крайне нежелательных последствий.
656 Глава 9.3. СТРУКТУРНЫЙ МЕТОД ПРЕДСТАВЛЕНИЯ И ИССЛЕДОВАНИЯ СРП Рассмотрим задачу об управлении упру- гими колебаниями. Рабочим приближением, описывающим изгибные колебания корпусов, подвижных объектов, является приближение ’’балочного'’ типа, т.е. приближенно корпус рассматривается как неоднородная балка. Пусть поперечное отклонение оси балки дли- ны I от положения равновесия задается функ- цией Q(x, I), гае х - координата, рассматри- ваемой точки, a t - время. Тоща функция С(х, I), ° £ х £ £ 0, подчиняется уравне- нию 4-го порядка: [EJQ"\ +[№’]’ + mQ + bQ = f, (9.2.74) где Дх) Дх) - жесткость корпуса; А(х) - продольная сжимающая (растягивающая) сила; /и(х) - плотность массы; д(х) - коэффициент демпфирования; Дх, I) - распределенная на- грузка (силовое воздействие). Функция Дх, I) может описывать как внешнюю возмущающую нагрузку (усилия), так и управляющие силовые воздействия, например, аэродинамического характера. Эта задача в математическом плане в большой степени аналогична рассмотренной выше задаче о гашении пульсаций газа в тру- бопроводах. Для однозначности решения уравнения колебания балки (9.2.74) необходимо задать граничные и начальные условия. Так как это уравнение четвертого порядка по пространст- венной переменной х, то необходимо задать четыре граничных условия по два для каждой стороны при х = 0 и при х = /. Два условия для каждой стороны образуются заданием си- лы и момента, действующих на концах балки. Эти краевые силы и моменты могут служить управляющими воздействиями, приводящими колеблющуюся балку в состояние равновесия относительно недеформированной оси балки. Моменты и силы могут создаваться аэродина- мическими плоскостями для объектов, движу- щихся в атмосфере или реактивными двигате- лями - рулями при движении в безвоздушном пространстве. Глава 9.3 СТРУКТУРНЫЙ МЕТОД ПРЕДСТАВЛЕНИЯ И ИССЛЕДОВАНИЯ СРП 9.3.1. ВВЕДЕНИЕ Данный метод является обобщением структурного метода для систем с сосредото- ченными параметрами (ССП), движение кото- рых описывается обыкновенными дифферен- циальными уравнениями. Особенно широко этот метод применяется при изучении линей- ных систем автоматического регулирования и управления с сосредоточенными и распреде- ленными параметрами [6], хотя он применим и к нелинейным ССП, и к системам с распре- деленными параметрами (СРП). Основные преимущества структурного метода рассмотре- ния сложных СРП: во-первых, метод дает наглядное представление сколь угодно слож- ной взаимосвязанной СРП в виде структурных схем; во-вторых, этот метод позволяет едино- образным способом описывать взаимосвязан- ные распределенные системы с помощью им- пульсных переходных или передаточных функций и правил соединения отдельных бло- ков (эти правила учитывают также особенно- сти взаимодействия отдельных частей системы друг с другом); в-третьих, структурный метод дает возможность на основе знания характери- стик отдельных блоков схемы единообразным способом определять характеристики всей системы в целом и отдельных ее частей, а так- же единообразным способом анализировать и синтезировать сложные взаимосвязанные объ- екты с распределенными и сосредоточенными параметрами*. 9.3.2. РАСПРЕДЕЛЕННЫЕ СИГНАЛЫ Одним из основных понятий структур- ной теории СРП является понятие ’’распределенный сигнал". Распределенным сигналом называют функцию Дх, /), х е D, t g Q, где D - область в r-мерном евклидовом пространстве и Q-областъ числовой оси. Пе- ременную х называют пространственной пере- менной, область D - пространственной обла- стью, а переменную t - временем. Если функ- ция Дх, I) принимает числовые значения, то сигнал называют скалярным распределенным. В зависимости от вида решаемых задач функция f как элемент функционального про- странства, может принадлежать тому или ино- му конкретному функциональному простран- ству Ф: пространству непрерывных функций; интегрируемых с квадратом функций; функ- ций, непрерывных вместе со своими частными производными до определенного порядка, и т.д. Важным прикладным значением обладают обобщенные функции, так как решения мно- гих задач математической физики можно рас- сматривать как обобщенные функции опреде- ленного класса. * В книге [14] в единообразном стан- дартном виде собраны различные характери- стики для 500 блоков, соответствующих раз- личным краевым задачам для уравнений мате- матической физики.
РАСПРЕДЕЛЕННЫЕ БЛОКИ 657 Совокупность из сигналов /^(х*, /*)> х* g Db tl g Q/, / = 1, n можно предста- вить как л-мерный вектор-столбец Если в распределенном сигнале Дх, I), х g D, размерность пространственной области D есть Гу то сигнал называют r-мерным рас- пределенным сигналом, или распределенным сигналом размерности г. Если в качестве функционального про- странства Ф сигналов рассматриваются функ- ции f не зависящие от пространственной пе- ременной Ху э зависящие только от перемен- ной ty то сигналы Д/) этого пространства Ф называют сосредоточенными (сигналами с нуле- вой пространственной размерностью). Если в качестве функционального про- странства Ф сигналов рассматриваются функ- ции f не зависящие от переменной времени /, но зависящие от пространственной перемен- ной Ху то сигналы ДО называют статическими распределенными. Иногда в качестве множества сигналов можно рассматривать множество чисел (констант). Такие сигналы называют парамет- рическими, или параметрами. Не следует смешивать параметрический сигнал, который, по определению множества параметрических сигналов, не зависит от х, /, с конкретным сигналом Дх, /), принадлежа- щим данному функциональному пространству, но тождественно равным определенной кон- станте во всей области его определения D х Q. 9.3.3. РАСПРЕДЕЛЕННЫЕ БЛОКИ Распределенным блоком называют устрой- ство любой природы, в котором выделены вход и выход, причем на вход поступает вход- ной распределенный сигнал, а на выходе од- нозначным образом появляется выходной так- же распределенный сигнал, природа которого отличается от природы входного распределен- ного сигнала. Распределенный блок, для кото- рого выходной сигнал явно (а не при помощи уравнения) выражается через входной сигнал, называют элементарным распределенным блоком. При этом под явным выражением понимается не только некоторая аналитическая формула, но также алгоритм и программа, позволяющая вычислить выход блока по заданному входу. Линейные распределенные блоки будем описывать с помощью линейного интеграль- ного оператора, который каждому входному сигналу w(xj, f)y Xj g 2>i, t £ 4), однозначно ставит в соответствие выходной сигнал О(Х2, I), х2 G Diy 4), по формуле: t О(*2>0 = J J<'(*2,'Лл)»‘'(5,т)<«; А. Го 1>2 (9.3.1) Отсюда следует, что распределенный блок определяется заданием ядра б(х, /, т) данного интегрального оператора. Функция б(х, /, т) является функцией четырех аргумен- тов: двух пространственных х g D% £ g D\ и двух временных t £ 4), т £ 4). В символическом виде правую часть ра- венства (9.3.1) для краткости будем записывать в виде Я(х2, /, Ъ т) О w(xb I), (9.3.2) где символ О означает соответствующую "свертку" двух связанных этим символом функций G и w. Ядро G(xf t, т) называют по-разному: в математике - функцией Грина (отсюда для ее обозначения принята буква б), в теории сплошных сред - функцией точечного источ- ника или функцией влияния, в теории автома- тического управления - импульсной переход- ной функцией. Каждое из этих названий в определенной степени обосновано. Действи- тельно, пусть входной сигнал w(xi, I) описы- вает точечный импульсный источник, напри- мер, тепла. Математически это означает, что 4*1, О = 8(*1 - 5о) 8(/ - то), 5oefil, t0Slb, (9.3.3) где 5(у) означает известную 5-функцию [10]. Подставим (9.3.3) в (9.3.1). Получим 0(*2,') = t = J J G(x2 , t, 5,т) 8(5 - 5о) 8(т - т0) <£, А = А = G(x2,/,5o,to). (9.3.4) Таким образом, если входной сигнал блока имеет вид (9.3.3), то функция СЦхъ t, £о> tq) представляет собой выходной сигнал этого
658 Глава 9.3. СТРУКТУРНЫЙ МЕТОД ПРЕДСТАВЛЕНИЯ И ИССЛЕДОВАНИЯ СРП блока. Функция б(*2» £о, то) показывает реак- цию распределенного блока в точке Х2 е D} в момент t £ 4), если на вход распределенного блока (системы) поступило единичное им- пульсное возмущение, приложенное в про- странственной точке Xi = в момент времени t=4). Важное свойство импульсной переходной функции любой физической системы: G(x, t, т) = 0, х е Да, £ 6 D|, т > t. (9.3.5) Это свойство вытекает из принципа при- чинности физических процессов: система не может реагировать на данное входное воздей- ствие раньше появления этого воздействия. Таким образом, выходной сигнал Ofc, t), Хз е Да» 6 Q, линейного распреде- ленного блока является решением определен- ной задачи для линейных уравнений матема- тической физики. Для линейного распределенного блока связь между входным w(xi, /) и выходным сигналами С(Х2, I) задается уравнением вида 4*2, t, 0(х2, /)] = 0> (9.3.6) где I - некоторый линейный оператор. Здесь входной сигнал w(xi, I) описывает все внеш- ние входные сигналы (параметры), включая начальные и граничные функции. Если зада- ние функции w(xi, I) однозначно определяет решение 0(х2, 0 уравнения (9.3.6), т.е. суще- ствует линейный оператор Л1, обратный опе- ратору /, то С?(*2, 0 = 1~Чхг, t, w(*i, /)] = GOw. (9.3.7) Таким образом, по определению им- пульсная переходная функция G(x2, ty т) удовлетворяет уравнению 4*2, 6(Х2, Г, т)] = 5(Х! - О 5(Г - т), (9.3.8) или 6(Х2, Г, т) = ^"4*2, Г, 5(Х! - О 5(Г - г)]. (9.3.9) 9.3.4. СТАЦИОНАРНЫЕ РАСПРЕДЕЛЕННЫЕ БЛОКИ Если параметры данного физического распределенного объекта не зависят от време- ни, то соответствующий этому объекту распре- деленный блок называют стационарным рас- пределенным. Стационарный распределенный блок характеризуется тем, что его импульсная переходная функция зависит не от четырех, а только от трех независимых переменных (аргументов) и имеет вид 6(х,Ц,т)=б(х,^-т), (9.3.10) т.е. функция G зависит уже не от временных аргументов t и т, а только от их разности t - т. Движение таких систем инвариантно относи- тельно сдвигов по времени. Поэтому за начало отсчета времени без ограничения общности можно принять нулевой момент времени, т.е. считать = 0. Таким образом, интегральный оператор, описывающий стационарный распределенный блок, имеет вид 0г(*2, 0= в(хъ t - т) О w(*b О- (9.3.11) Стационарные распределенные блоки це- лесообразно описывать в терминах преобразо- вания Лапласа сигнала Дх, /) и функции Гри- на G(x, /) по временной переменной t f(x,p) = f e~p'f(x,p)dt; (9.3.12) о JV(x,$,p) = | t~p,G(x,^,p)tit. (9.3.13) 0 Функцию W(x, p) называют переда- точной функцией распределенного блока соот- ветствующей импульсной переходной функции б<х, £, /)• Полагая в (9.3.12) и (9.3.13) р =/», получаем соответствующие преобразования Фурье по времени: 7(х,<в) = 7(х,»; (9.3.14) JP(x,^,(d) = 1К(х,£,/»). (9.3.15) Функцию 1К(х,£,со) называют частот- ной функцией распределенного блока. В терминах преобразования Лапласа по времени данный распределенный блок будет описываться соотношением Q(x2,p)= Г«'(хЛ, А (93.16) х eZ>2> Р еС, где С - комплексная плоскость. В краткой символической форме соотношение (9.3.16) запишем в виде
СУММИРОВАНИЕ РАСПРЕДЕЛЕННЫХ СИГНАЛОВ 659 С(*2>р) = ^x2,l,p)9w(xbp), (9.3.17) где символ ® означает интегрирование двух связываемых этим символом функций по об- ласти, которой принадлежат две (в записи формулы - внутренние) пространственные переменные. В случае однородности процесса по всем или некоторым пространственным перемен- ным распределенный блок целесообразно опи- сывать в терминах двустороннего (для неогра- ниченного изменения переменных) и односто- роннего (для полуограниченного изменения переменных) преобразования Лапласа или Фурье по соответствующим однородным про- странственным переменным. Например, пусть некоторый сигнал Дх, у, I) определен в про- странственной полосе плоскости (х, у): -оо х оо, а <> у <> b при t £ 0. Соответст- вующая функция Грина б(х, у, £, л, /, т) также пусть однородна по переменной х и по /, т.е. G = G(x - у, n, t -т). (9.3.18) Тогда можно применить преобразование Лапласа по t и х: оо оо f(?>y,p) = J f у, t) dx dt; 0 -co (9.3.19) oo oo 0 -CO (9.3.20) Связь между входным и выходным сиг- налами в терминах изображений для этого примера-будет иметь вид _ b Q(s,y,p) = J (9.3.21) Стационарные по времени распределен- ные блоки в терминах преобразования Лапласа по времени описываются уравнениями, ана- логичными уравнениям (9.3.15) - (9.3.18): i[x2,p,Q(x2,p)] = w(xi,p), (9.3.22) где I - некоторый линейный оператор. Решая уравнение (9.3.22) относительно 0(х2,р), получим Q(x2, р) = 7 1{Х2>АИ’(*1,/’)] »IT® W. (9.3.23) Таким образом, по определению имеем l[x2,p,W(x2,l,p)] = 8(Л1 - §), (9.3.24) ^(х2,^р)^Г1[х2,р,6(Х1-^]. (9.3.25) 9.3.5. СУММИРОВАНИЕ РАСПРЕДЕЛЕННЫХ СИГНАЛОВ И ПАРАЛЛЕЛЬНОЕ СОЕДИНЕНИЕ БЛОКОВ Пусть некоторое конечное (или беско- нечное счетное) множество распределенных сигналов JJ(x> О, < = 1, •••> п> определено на одном и том же множестве аргументов. Тогда можно определить понятие суммы этих рас- пределенных сигналов: <93-26) /=1 Если суммируется счетное множество сигналов, то п устремляется к оо. При этом такая сумма должна быть корректно определе- на. В терминах изображений будем иметь Лх>р)=i,A(x>p)- /=1 Если параллельно соединено бесконечное счетное число блоков, то суммирование по i ведется от 1 до оо. Имеем <?/(х,/) = (г/(х,^,Г,т)® w(xbf), i - 1,...,л, хеД Xi е А, * *о- Отсюда $x,t) = £&(*,() = /=1 /=1 О w(x, 0 = G О w, где G = G(x,£,/,t) = £а(х,^,т) /=1 (9.3.27) называют импульсной переходной функцией п параллельно соединенных распределенных
660 Глава 9.3. СТРУКТУРНЫЙ МЕТОД ПРЕДСТАВЛЕНИЯ И ИССЛЕДОВАНИЯ СРП блоков. Все выходные сигналы О, < = 1, ..., п9 определены на одном и том же множе- стве. Таким образом, систему параллельно со- единенных блоков можно заменить одним блоком с импульсной передаточной функцией (9.3.27). Такую операцию замены часто при- меняют для того, чтобы упростить исходную структурную схему или, наоборот, развернуть (разложить) данный блок в ряд параллельно соединенных блоков более простого вида. В терминах передаточных функций для стационарных блоков ^(хЛ,р) = ^ЩхЛ,р). (9.3.28) /=1 9.3.6. ПОСЛЕДОВАТЕЛЬНОЕ СОЕДИНЕНИЕ РАСПРЕДЕЛЕННЫХ БЛОКОВ Пусть задано последовательное соедине- ние п блоков с распределенными параметра- ми, каждый из которых описывается своей импульсной переходной функцией Gfa9 /, т), / = 1, ..., п. На входе этой цепочки после- довательно соединенных блоков действует распределенный сигнал w(x, I), а на выходе получается распределенный сигнал Q(x9 f). Данную цепочку последовательно соеди- ненных п блоков можно заменить одним рас- пределенным блоком с импульсной переход- ной функцией б(х, /, т), вычисляемой по формуле t t = J...J J ... jG„(x,tu,r,Ti)x *o *o Д-i A x <?Я-1(П1,П2Л1,Т2)...С?1(пл-ь5,Тп-1,т) x xAil-Л1Я-1А1(9.3.29) Символически формулу (9.3.29) можно записать следующим образом: б(х, Ъ t9 т) = = Gn(x9 /, т) О ... О ^(х, /, т), (9.3.30) Передаточная функция всей цепочки бу- дет выражаться формулой W(x,t,,p)= f • J W„(x,x\l,p)... A • • • ^1(пя-1 Л, р) <*11 - • • <*1Я-1 • (9.3.31) В символическом виде формулу (9.3.31) можно записать в виде JP(x,li,p) = Wn(x^,p)<3...® Щх^.р) = п = (9.3.32) /=1 Таким образом, импульсная переходная функция G(x9 /, т) [передаточная функция W(x, />)] последовательно соединенных блоков равна композиции импульсных пере- ходных функций (передаточных функций) всех блоков, взятых в обратном порядке по отно- шению к порядку следования блоков в схеме их последовательного соединения. В схеме последовательного соединения любого числа распределенных блоков каждая пара двух соседних блоков должна быть согла- сована в том смысле, что область определения выходного сигнала предыдущего блока должна совпадать с областью определения входного сигнала последующего распределенного блока. В противном случае последовательное соеди- нение не имеет смысла. Поэтому последова- тельное соединение распределенных блоков некоммутативно, ибо поменять местами два блока в общем случае невозможно хотя бы потому, что области определения входного и выходного сигналов могут оказаться различ- ными. Это свойство существенно отличает СРП от ССП. Однако последовательное соединение блоков, как правило, ассоциативно и дистри- бутивно, что следует из возможности переме- ны порядков интегрирования и свойств после- довательного соединения блоков. Передаточная функция последователь- ного соединения бесконечного (счетного) чис- ла распределенных блоков имеет вид 00 W(x,t„p) = JsJ Wt(x,^,p). (9.3.33) Ы Формулы (9.3.30) - (9.3.33) дают воз- можность не только сворачивать цепочки по- следовательно соединенных блоков, но и, на- оборот, разворачивать данный блок в цепочку последовательно соединенных блоков более простого вида. 9.3.7. ЧАСТНЫЕ ВИДЫ РАСПРЕДЕЛЕННЫХ БЛОКОВ 1. Усилительный блок. Этот блок осуще- ствляет операцию умножения входного сигна- ла W(x9 I) на постоянный числовой коэффи- циент к. Q(x9 I) = kw(x9 f). (9.3.34) Соотношение (9.3.34) можно представить в виде
ЧАСТНЫЕ ВИДЫ РАСПРЕДЕЛЕННЫХ БЛОКОВ 661 Q(x, I) = к&(х - О 5(/ - т) О w(x, I), (9.3.35) откуда, по определению, получаем импульс- ную переходную функцию усилительного бло- ка /, т) = к&(х - О 5(/ - т). (9.3.36) В координатной записи имеем в(х9 /, т) = *8(xi - £1)...5(хл - Ы W - т). (9.3.37) Отсюда, в частности, следует, что тождествен- ное (единичное) преобразование распределен- ного сигнала w(x, I) соответствует линейному интегральному оператору с ядром в виде 5-функции: 8(х-^)8(/-г). Усилительный блок, очевидно, является стационарным. Из (9.3.36) находим, что передаточная функция усилительного блока W(x, %, р) = к6(х - %). (9.3.38) 2. Дифференцирующий блок. Пусть вы- ходной сигнал Q(x, /) связан с входным сиг- налом w(x, I) соотношением Q(x, t) =---dm*(x,f)---- (9.3.39) ' ’ дх^...дх^д^< где т = + ... + тп + р Тогда (9.3.39) можно представить в виде следующего линей- ного интегрального оператора: О(х>0 = //б('Я,)(Х1-§1)... ...8Ь)(хя-§я)8Ь+1)(,-г)х (9.3.40) Отсюда импульсная переходная функция диф- ференцирующего блока G(x, t, т) = = 8<””)(х1 - §,) ... 8<“">(хя - §я) 8<«.‘>)(/ - т) (9.3.41) и соответственно W(x,l-,P) = = 8(«О(х1-51) ... 8(<*)(хп - !;„). (9.3.42) 3. Пространственно интегрирующий блок (одномерный случай). Пусть выходной сигнал Q(x, f) связан с входным сигналом w(x, I) соотношением е(х,/)= IwfatjO;, ' ' 3 ' ' (9.3.43) *о Q(x0,f) = 0, х0 ixsi,. Формулу (9.3.43) можно представить в виде 2(х,/) = К*-« 8(/-т)ОмО (9.3.44) Следовательно, б(х,^,/,т) = 1(х-0 5(/ - т); (9.3.45) W(xf^p) = l(x-^). (9.3.46) Если Q(xq, f) = 2о(О, то t *1 2(х, /) = J J 1(х - О 5(/ - т) wft,т)^ А + *0*0 + Jjl8(x-08(/-x)OoW^A- *0*0 (9.3.47) Таким образом, функцию Qq(x) надо рассмат- ривать тоже как входной сигнал. 4. Переходные блоки. Формально пере- ходный блок ничем не отличается от опреде- ленного выше обычного блока, у которого пространственная размерность входного сиг- нала не равна пространственной размерности выходного сигнала. Однако при описании взаимодействия систем различной природы в терминах структурной теории необходимо использовать блоки, описывающие характер этого взаимодействия. Поэтому имеет смысл условно выделить такого рода блоки и назвать их переходными. Остановимся на описании взаимодейст- вия некоторой распределенной системы с со- средоточенной. Такое взаимодействие встреча- ется, например, в случае использования сосре- доточенного регулятора для распределенной системы. Этот регулятор измеряет состояние распределенной системы в одной или не- скольких отдельных точках области определе- ния выходного сигнала и воздействует на рас- пределенный блок также в одной или не- скольких отдельных точках области определе- ния его входного сигнала.
662 Глава 9.3. СТРУКТУРНЫЙ МЕТОД ПРЕДСТАВЛЕНИЯ И ИССЛЕДОВАНИЯ СРП Задан распределенный сигнал (в терми- нах изображений) w(x,p), который поступает на вход некоторого блока, на выходе которого появляется сосредоточенный сигнал (не зави- сящий от пространственных переменных) Q(p) . Связь между этими сигналами описы- вается линейным интегральным оператором вида Ой») = J = D = ^(^./») ® *(х,р). (93.48) Ядро этого оператору. р) является передаточной функцией данного блока. Это ядро не зависит от выходной пространствен- ной переменной х, а зависит лишь от входной пространственной переменной Поэтому этот переходный блок называют ^-блоком. В частности, с помощью ^-блока Р) = “ а) получают значение вход- ного сигнала w(x,p) в некоторой фиксиро- ванной точке х = а. Задан также сосредоточенный сигнал Q(p) , поступающий на вход некоторого бло- ка, на выходе которого появляется распреде- ленный сигнал w(x9p). Связь между этими сигналами описывается линейным алгебраиче- ским соотношением вида Q(x,p) = FKx(x,p)w(p). (9.3.49) Функцию ТЩх, р) яязыввхя х-блоком, так как она не зависит от входной пространст- венной £, а зависит лишь от пространственной переменной х. В частности, с помощью х-блока W&c, р) - 8(Z> - х) получают входной сигнал Q(x,p) для распределенного блока, посту- пающий с выхода сосредоточенного блока: Q(x,p) - 8(/> - x)w(p). (9.3.50) Более общий вид переходных блоков £-типа и х-типа можно представить в виде конечной (или бесконечной) суммы произве- дений функций, каждая из которых зависит лишь от одного аргумента: W&,p) = Z VV в) и1 (Р); (9.3.51) /=1 Vx(x>p) = Vi(p). (9.3.52) /=1 Этот случай важен с практической точки зрения, поскольку с помощью сумм вида (9.3.51) и (9.3.52) можно с любой степенью точности аппроксимировать довольно широ- кий класс передаточных функций переходных блоков. 9.3.8. ЗАМЫКАНИЕ ОБРАТНОЙ СВЯЗЬЮ Пусть сигнал w(x9p) - входной сигнал замкнутой системы, а сигнал Q(x9p) - вы- ходной сигнал замкнутой системы. Блок с передаточной функцией Wi(x, р) находится в канале прямой связи, а блок с передаточной функцией И^(х, р) - в канале обратной связи. Системой с обратной связью описыва- ется большое число систем с распределенными параметрами, которые служат объектом иссле- дования, анализа и синтеза во многих областях науки и техники. Одной из главных задач в исследовании системы с обратной связью является определе- ние ее передаточной функции №(х, ^9.р), которая описывает связь входного сигнала этой системы w(x,p) с выходным сигналом Выведем соотношения, определяющие функцию W(x, t„ р): Q(x,p) = W^x^p) ® f(x,p); (9.3.53) g(x,p) = Witx&p) ® Q(x,p); (9.3.54) 7(x,/>) = w(x,/>)+g(x,/>). (9.3.55) Подставляя g(x,p) из (9.3.54) (9.3.55), а затем подставляя в (9.3.53) полученное вы- ражение для f(x9p), имеем 0(х,р) = = ^1(хЛ,/>)® [^г(хЛ,р)® С(х,р) + + w(x,)»)]. (9.156) Используя дистрибутивность операции 0, из (9.3.56) найдем
ЗАМЫКАНИЕ ВЫРОЖДЕННОЙ ОБРАТНОЙ СВЯЗЬЮ 663 Q(x,p) = _ = ^21(*Л,Р)® + »'1(*,5>/»)® ®w(x,p), (9.357) где ^(х, ъ Р) = *И(х, Ь Р) ® ^2(х, ь Р). (9.3.58) Полагая в (9.3.57) w = б(х - £), по оп- ределению получим, что Q = W(xf р), а также уравнение для определения искомой передаточной функции W(x9 р) замкнутой системы 8 IK + W\ (9.3.59) или в развернутом виде [с учетом (9.3.58)], 8 Wi 8 IK + (9.3.60) При каждом фиксированном £ и р (или х и р) каждое из уравнений (9.3.59), (9.3.60) представляет собой линейное интегральное уравнение Фредгольма второго рода относи- тельно искомой передаточной функции Н^х, р). Ядром этого интегрального урав- нения служит функция »21 = ^1(Х, f,,p) ® Wj(x, §,/>). В развернутом виде уравнения (9.3.59), (9.3.60) выглядят следующим образом: = f 1Г21(х,п,/>)*г(’1,МЛ1 + А +ИДхЛ,р), х £ € А> Р €С, (9.3.61) где D\ - пространственная область определе- ния входного сигнала w(x9p); А - простран- ственная область определения выходного сиг- нала Q(x9p). Ядро W21 в развернутом виде представляется в форме ^21 = J ^(х. W) И'Д’Ъ Р) Л1- (9.3.62) А Теория и методы решения уравнений Фредгольма второго рода наиболее разработа- ны для уравнений с симметрическим ядром, когда И^1(х, р) является симметрической функцией по пространственным аргументам х и§. В частном случае, когда ядро явля- ется вырожденным, решение интегрального уравнения (9.3.59) может быть сведено к ре- шению системы линейных алгебраических уравнений. 9.3.9. ЗАМЫКАНИЕ ВЫРОЖДЕННОЙ ОБРАТНОЙ СВЯЗЬЮ Если в канале обратной связи находится вырожденный распределенный блок, т.е. блок с передаточной функцией вида *г(*&р) • £ V^X’P> /=1 (9.3.63) то обратную связь называют вырожденной. В этом случае уравнения Фредгольма второго рода (9.3.59) - (9.3.61) для определения неиз- вестной передаточной функции И^х, р) замкнутой системы будут уравнениями с вы- рожденным ядром. Решение такого уравнения может быть сведено к решению системы ли- нейных алгебраических уравнений л-го поряд- ка. Действительно, подставим (9.3.63) в (9.3.60). Получим W = w\ ® ® + иъ /=1 (9.3.64) или л w = 5X1 ® к'1к'2 ® w + ^1- /=1 (9.3.65) Умножим обе части уравнения (9.3.64) последовательно на К/2, / = 1, ..., л, н проин- тегрируем полученное уравнение по области изменения аргумента х. Получим V] ® W = = £ F)2 ® Wx ® V?V? ® W + v} ® Wi. /=1 (9.3.66) В полученном уравнении (9.3.66) обозначим: JTy(^) = r;®»K; (9.3.67) А9(р) = V} ® Wi ® К,1; (9.3.68) Mb*) “Г/*®’И- (9.3.69)
664 Глава 9.3. СТРУКТУРНЫЙ МЕТОД ПРЕДСТАВЛЕНИЯ И ИССЛЕДОВАНИЯ СРП Тогда уравнения (9.3.68) примут вид сис- темы п линейных алгебраических уравнений с неизвестными Xj, известной матрицей системы Ау и известным столбцом свободных членов л Xу = * АуХ[ + Ву, у = 1,..., л. /=1 (9.3.70) В матричных обозначениях система (9.3.70) имеет вид ще 8/у - символ Кронекера: 1 при 0 при (9.3.72) 8у = I - единичная матрица. Решение системы (9.3.70) может быть представлено в виде =(9-3-73) ще Д(р) = |8^ - Ау (р)| - определитель мат- рицы - определитель, который получается из Д(р) путем замены у-го столбца этого определителя столбцом из сво- бодных членов Bj(&, р). Для того чтобы определить искомую пе- редаточную функцию замкнутой системы, подставим выражение для Xj из (9.3.73) в уравнение (9.3.64). Получим л Ж = 0 y^Xj + Wi, (9.3.74) ИЛИ Л Sp® и,1] д, FK = —--------------+ W\, (9.3.75) Д ще 1Г10Г/1=|)Г1(х>п,р)К;(л,р)Л1. D (9.3.76) В частности, коща ^2= V1 V2, легко найти ИЛ ® К1^2 ® W\ W = ИЛ + -----=—Ц-. 1-К2®И'1®К1 (9.3.77) Практически важным случаем является обратная связь вида W2 = 8(х - b) 8ft - a) W(p). (9.3.78) В этом случае из (9.3.77) найдем И'(х,?,р) = И'1(хЛ,р) + ^1(х,Д,р))Г1(дЛ,р)Ил(р) l-W\(a,b,p)W(p) (9.3.79) Передаточной функцией вида (9.3.79) описывается, например, система автоматиче- ского регулирования распределенного объекта, который без регулятора имеет передаточную функцию И^(х, р). Регулирование осущест- вляется с помощью "сосредоточенного” регуля- тора с передаточной функцией FK(p), который измеряет регулируемое распределение Q(x,p) в одной точке х = л, а обратное воздействие на объект осуществляет также в одной точке х = b (отличной от точки х — а). Формула (9.3.79) упрощается, коща нужно получить передаточную функцию по каналу от сосредо- точенного воздействия w(d,p), приложенного к точке х = Ьу к распределенному выходу Q(x,p) . В этом случае из (9.3.79) имеем (9.3.80) Аналогично упрощается формула (9.3.79), если нужно получить передаточную функцию по каналу от распределенного воз- действия w(x,p) к сосредоточенному выходу Q(a,p), т.е. к значению выходного распреде- ленного сигнала в данной точке х = а. Здесь из (9.3.79), полагая X = а, получим г(а,и,р)= Q{a,p) w(x,p)‘ (9.3.81) В виде структурной схемы можно пред- ставить и многие другие системы различной физической природы. Если взять, например, плиту и балку подпертые упругой опорой в точке X = а, то
ВЗАИМОСВЯЗАННЫЕ СИСТЕМЫ 665 передаточную функцию таких систем можно найти по формуле (9.3.79), приняв а = Ь, W(p) = (коэффициент жесткости опоры) и обозначив через р) передаточную функцию свободной (без опоры) плиты (или балки) по каналу "внешняя нагрузка f(x,p) - прогиб 2(х,р)”: W(x&p) = Wx(x&p) + , W^a,p)Wx(a^p)k l-kWi(a,a,p) (9.3.82) Тогда передаточная матрица системы бу- дет иметь вид Щх,^,Р) >11(хЛ,р)...ИЪ,(хЛ.^)' 1Ги1(хЛ,р)...1Кпя(хЛ,р). (9.3.85) Связь между входом w и выходом Q теперь может быть компактно записана в мат- ричной форме: Q = W®w. (9.3.86) Переходя в формуле (9.3.82) к пределу при к —> оо, получим передаточную функцию плиты (или балки) на жесткой опоре: И'(хЛ.р) = И,1(хЛ,р)- Wi(x,a,P)Wi(a,^P) Wx(a,a,P) (9W) 9.3.10. ВЗАИМОСВЯЗАННЫЕ СИСТЕМЫ Во многих практических задачах несколько относительно простых распределенных систем взаимодействуют по определенным законам. С такими системами встречаются в самых раз- личных областях науки и техники: теплотехнике, электротехнике, механике, физике и др. Простейшая взаимосвязанная система, состоящая из двух подсистем, каждая из кото- рых в свободном состоянии описывается своей передаточной функцией и Эта систе- ма имеет два входа W\(x,p), W2(x,p) и два выхода Qi(x,p), Q2(x,p). Здесь для упро- щения обозначений пространственная пере- менная при каждом сигнале обозначена одной и той же буквой, в то время как на самом деле пространственная переменная в каждом сигна- ле может быть задана в своей области опреде- ления, независимо от других. Описание взаимосвязанной системы с п входами и п выходами может быть дано в тер- минах передаточной матрицы. Без ограниче- ния общности всегда можно считать, что число входов равно числу выходов. Представим все выходы Qt(x,p) и вхо- ды W/(x,p) системы, i = 1..л, как элемен- ты вектор-столбцов Q(x,p), w(x,p) : В координатной форме имеем _ л Q, =^W99wj, / = (9.3.87) Таким образом, элемент Wy передаточ- ной матрицы (9.3.85) есть передаточная функ- ция от у-го входа Wj к /-му выходу Qt. Аналогично можно рассматривать взаи- мосвязанные системы и в пространственно- временном описании (например, если система нестационарна), вводя векторы входного и выходного сигналов <2М = <21 (х, t) Qn(x,t) w(x,t) = »Mx,0 Wn(x,t\ (9.3.88) и импульсную переходную матрицу <7(хЛ,/,г) = Gnl (х, !j, t, т)... Gm (х, t, т) (9.3.89) Тогда связь между Q и w задается соотноше- нием Q = G О w. (9.3.90) В координатной форме имеем = ХС’« Ои> (9Х91) 7=1 Q(x,P) = w(x,p) = (9.3.84) Таким образом, элемент Gy импульсной переходной матрицы (9.3.89) есть импульсная переходная функция по каналу "вход Wj - вы- ход Qi". Основная задача структурной теории для взаимосвязанных систем - определить переда- M'Hx.p)
666 Глава 9.3. СТРУКТУРНЫЙ МЕТОД ПРЕДСТАВЛЕНИЯ И ИССЛЕДОВАНИЯ СРП точную матрицу W(x, £, р) или импульсную переходную матрицу G(x, £, t, т). Основной способ вычисления элементов передаточной (импульсной переходной) мат- рицы состоит в "разложении" (декомпозиции) исходной структурной . схемы на "элементарные" части и нахождении переда- точных (импульсных переходных) функций этих частей. При этом под "элементарными" частями понимают такие элементы схемы, которые представляют собой параллельное или последовательное соединение блоков, или один контур обратной связи. Заменяя элемен- тарные части схемы одним блоком с найден- ной передаточной (импульсной переходной) функцией, приходим к более простой струк- турной схеме, для которой вновь можно про- вести точно такую же операцию. Конечное число таких операций приводит к желаемому результату - вычислению передаточной матри- цы системы в целом. 9-3.11. СТАНДАРТНАЯ ФОРМА КРАЕВЫХ ЗАДАЧ Пусть для линейного дифференциаль- ного уравнения л-го порядка с неизвестной функцией Q — Q(x) Дх, 0 = W") + № ’ 1) + ... + *л2=/, Хо<х<хь (9.3.92) где известные функции />*= Ь^х) е О* ’ к(хц, Х1), к = 0, 1.л, До(х) # 0, везде на (хо, Х0 и/=Дх) е Р' (Р'- пространство обобщен- ных функций или функционалов, определен- ных на множестве финитных бесконечно диф- ференцируемых функций [7]) поставлена крае- вая задача с неоднородными краевыми усло- виями следующего вида: r/(e) = JattO(*-,)(x0) = g/, 1=1 / = 1,...,г; г < л; Г|«2)-£алс(М(Ж1).<о 1=1 / = г + 1,...,л, (9.3.93) (9.3.94) где хотя бы одно из g/ # 0, • i = 1.л. Естественно предположить, что краевые формы Г}...... Гг линейно независимы, т.е. существует не равный нулю определитель Также предположим, что формы Гг + i, ..., Гл линейно независимы, т.е. существует не равный нулю определитель аг+1,Л •••аг+1,А_г 1 = Обозначим множество (4, ..., /г) через I, а множество (Д, .г) через J. Тоща можно высказать следующее утверждение. Теорема. Существует по крайний мере одна функция такая, что данная краевая задача (9.3.92) - (9.3.94) эквивалентна краевой задаче для уравнения Дх, © = w(x) (9.3.95) с однородными краевыми условиями ГХС) = 0 при / = 1....г, (9.3.96) ГХ0 = 0 при / = г + 1...л. (9.3.97) При этом функция w(x) может был» вычисле- на по формуле *(*) = “ /С*) - Т- Z S (-1)"фЛ«(х1)дJk + 01 JteJ m+l=n*-Jk + Т £ Е(тО"ф*.(хь)Дй, (9198) а Jkelm+l=n-ik где фл.(0 = = Z>,<M)(/)8(x -1) - С^ж'1)(/)8'(х - 0+-.+ + (-1)* С*б/ж-*> (/) 8(t) (х - /)+• • •+ + (-l)M8,(08(M)(x-z) и определители Ад и Д^ получаются из определителей А} и До заменой строк/* и 4 на строки соответственно (gr + i, ..., gj) и (gy •••> &)• Введем ряд терминологических опреде- лений. Определение 1. Краевую задачу (9.3.92) - (9.3.94), где хотя бы одно из чисел gi не равно нулю, и i = 1..л, назовем задачей в нестан- дартной форме.
ДИСПЕРСИОННЫЕ СООТНОШЕНИЯ 667 Определение 2. Краевую задачу (9.3.95) - (9.3.97) с однородными краевыми условиями (все gj = 0, / = 1.л) назовем стандартной формой задачи (9.3.92) - (9.3.94). Определение 3. Функцию w(x) назовем стандартизирующей функцией краевой задачи (9.3.92) - (9.3.94). Приведение краевой задачи в нестан- дартной форме к стандартному виду назовем операцией стандартизирования. Таким образом, операция стандартизирования данной краевой задачи с неоднородными краевыми условиями сводится к отысканию хотя бы одной стандар- тизирующей функции w(x). Такая функция может быть найдена, например, непосредст- венно по формуле (9.3.10). Стандартизирующая функция w(x) зада- чи (9.3.92) - (9.3.94) может быть не единствен- ной. Действительно, у матрицы размера л х г ранга г может существовать С* квадратных подматриц с отличным от нуля определителем порядка г. У матрицы л х (л - г) ранга (л - г) может также существовать С„ квадратных подматриц с отличным от нуля определителем порядка (л-т). Взяв различные пары опреде- лителей порядка г и л - г, по формуле (9.3.98) получим различные стандартизирующие функ- ции. Рассмотрим еще и следующее. Пусть имеется краевая задача для дифференциаль- ного оператора второго порядка Дх,е)=ао(х)2"(х)+*i(x)e'(x)+ + *2<х)2(х) = /(х); (9.3.99) Г/(2) = Л, 1-1,2, йо(х)>0. (9.3.100) Оператор L несамосопряженный. Однако эту краевую задачу можно привести к виду Д(х,0 = 4; В(х) dQ(x) dx + С(х)2(х) = = ц(х)/(х), (9.3101) П(2) = Л, ' = 1,2, (9.3.102) гае Л(х) = ц(х)йо(х), с(х) = ц(х)дг(х); ц(х)/(х) = /1(х) (9.3.103) и оператор Li(x, Q) - самосопряженный. Так как краевая задача решается проще для самосопряженного оператора L\, то имеет смысл сначала решать краевую задачу Ь1(х, 2) =/1(х); (9.3.104) Г/(2) = «/, / = 1,2, (9.3.105) т.е. найти для нее функцию Грина 6?(х, £) и стандартизирующую функцию Wi(x, £). Тоща функция Грина G(xf £) исходной задачи (9.3.99), (9.3.100) определяется формулой ®м=^01(хл), (’х10б) а стандартизирующая функция этой задачи w(x) = wj (х). (9.3.107) 9.3.12. ДИСПЕРСИОННЫЕ СООТНОШЕНИЯ Сущность дисперсионных соотношений рассмотрим на примере одномерного по про- странственной переменной дифференциаль- ного уравнения с частными производными второго порядка с постоянными коэффициен- тами: + 012 “ ^)2" “ № -1>2Q = O, (9.3.108) 2 = Q(x, 0, X € R, t € R. Так как дисперсионные соотношения от- носятся к "собственным" или "внутренним" свойствам данного уравнения или физического процесса, то рассматриваются однородное основное уравнение (9.3.108) и однородные граничные условия. Для получения дисперсионных соотно- шений для данного конкретного уравнения вида (9.3.108) иЩем его решение в виде Q(x, /) = ехр(р/ + яс). (9.3.109) Подстановка этого выражения в (9.3.108) и даст искомое соотношение между комплекс- ной временной частотой р и комплексной пространственной частотой (волновым чис- лом) s. Действительно, подставив (9.3.109) в (9.3.108) и произведя деление обеих частей полученного равенства на ехр(р/ + яс) # 0, получим искомое дисперсионное соотношение oqP2 + atf = bos1 + + 62 = X (9.3.110) или
668 Глава 9.3. СТРУКТУРНЫЙ МЕТОД ПРЕДСТАВЛЕНИЯ И ИССЛЕДОВАНИЯ СРП А(р, 5) ~ а^Р2, + - b\S - Z>2i (9.3.111) Ар(Х, Р) = а^Р2 + flip - X = 0; (9.3.112) А/Х, s) = bos2 + b\s + b2 - X = 0. (9.3.113) При наличии дополнительных условий на решение основного уравнения (9.3.108) в виде соответствующих граничных условий число X не может быть произвольным. Граничные условия выделяют некоторое множество А допустимых значений параметра X, которые называют собственными значения- ми, или собственными числами данной задачи или процесса. Это множество А допустимых значений параметра X, т.е. множество собст- венных значений (чисел), называют спектром данной краевой задачи. Если спектр является дискретным счетным множеством чисел Х^, Хз, ...» то обычно в этом случае его можно упорядочить естественным образом: |х1|2|х2|^...2|х„| <.... В ряде задач множество А допустимых значений параметра X может быть непрерыв- ным или смешанным (часть этого множества непрерывна, а часть - дискретна). Обычно X удовлетворяет уравнению Д(Х) = 0, (9.3.114) которое определяется видом граничных усло- вий, его называют характеристическим урав- нением для собственных чисел краевой задачи. Уравнение (9.3.111) называют дисперси- онным соотношением или дисперсионным уравнением. Оно определяет связь между ком- плексной временной частотой р и комплекс- ной пространственной частотой (волновым числом) s. Эту связь между р и S, задаваемую дисперсионным соотношением (9.3.111), на- зывают дисперсионной функцией. Уравнение (9.3.112) будем называть пер- вым дисперсионным уравнением (соотноше- нием), уравнение (9.3.113) - вторым дисперси- онным уравнением (соотношением). Подставляя в первое дисперсионное уравнение (9.3.112) допустимые (собственные) значения X, получаем допустимые собственные значения временной комплексной частоты р. Для данного конкретного уравнения (9.3.112) это уравнение допускает решение в явном виде. Действительно, пусть X* - некоторое допустимое собственное число. Тоща oqp2 + ajp - Х^ = 0, Х^ € A; (9.3.115) . P\k = т”-1 - ai + Vе? ~ 4e<A*); (9.3.116) P2* = "1 - 7"? -4fl<A*j • (9.3.117) Если основное уравнение (9.3.108) имеет более высокий порядок по временным произ- водным, например, имеет вид dmQ dm-'Q dQ "° +в* ^п-+"+в«-1 -57 = где N - некоторый оператор над Q(x, f), со- держащий лишь операции по пространствен- ным переменным, то первое дисперсионное соотношение дает OOP" + ат - 1Р = ЧЛк е А. В этом случае каждому Х^ соответствует т различных временных комплексных частот Р\к> •••» Ртк- Корни р\ь ..., Ртк первого дисперсион- ного уравнения определяют временной харак- тер процесса: его устойчивость или неустойчи- вость, колебательность или апериодичность. В частности, по виду корней (9.3.116) и (9.3.117) можно иногда сказать, что процесс возможно будет устойчивым, если (необходи- мое условие) R&P\k < 0 и Re/>2jt Для всех X* € А, и неустойчивым, если хотя бы для одного зна- чения X* е А Recife > ° H-7™ R®P2Jt> °- При Reput = Re/>2Jt = 0 процесс будет носить колебательный характер. Таким образом, пусть основное уравне- ние имеет вид M[Q(x, 1)] - N[Q(x, /)] = 0, (9.3.118) где ^О(х,()] = Ло0+...+Ья+1е. Тоща дисперсионное соотношение имеет вид Mt(p) - N\(s) = 0,
ДИСПЕРСИОННЫЕ СООТНОШЕНИЯ 669 где Мх(р) = atf* + а„р, N\(s) = М" + bn +1. Первое дисперсионное соотношение: Мг(р) = X, и второе дисперсионное соотношение: N&) = X. Характеристическое уравнение для собст- венных чисел пространственной краевой зада- чи по-прежнему запишем в виде Д(Х) = 0. Таким образом, все дисперсионные со- отношения для уравнения (9.3.118) с постоян- ными коэффициентами выписываются очень легко. Однако нетривиальной является задача решения характеристического уравнения Д(Х) — 0, т.е. задача определения спектра Л, ибо это уравнение, как правило, является трансцендентным. Для уравнений с постоян- ными коэффициентами в него входят (триго- нометрические или гиперболические) транс- цендентные функции. Для уравнений с пере- менными коэффициентами в характеристиче- ское уравнение входят трансцендентные функ- ции более сложной природы: цилиндрические (бесселевы), сферические и др. Редко эти уравнения решаются в явном виде. Как прави- ло, спектр (корни характеристического урав- нения) определяют численными методами. Дисперсионные уравнения часто исполь- зуют для исследования качественной и количе- ственной характеристик тех или иных сложных процессов. Это объясняется тем, что даже очень общая априорная информация качест- венного характера позволяет установить неко- торые существенные свойства процесса. На- пример, если известно, что спектр Л является множеством действительных чисел, а первое дисперсионное соотношение имеет вид (9.3.115), где Oq, а\ - также действительные числа, то, при а\ < 0 процесс будет неустой- чивым. Аналогичная картина имеет место и для уравнений и процессов большей, чем единица пространственной размерности. Пусть основ- ное уравнение имеет вид (9.3.118) М01 - ДО] =0, (9.3.119) где 4°]=со^+ -+сг^’ х=(*1--М- Если искать решение уравнения (9.3.119) в виде 2(х, I) = ехр(р/ + sx), где s = (<$1, 5Г), то дисперсионное соотно- шение будет выглядеть следующим образом Д(р, s) = Mi(p) - Щх) = 0, гае М(р) = «ор'" + w; = boSi+...+brs?. Первое и второе дисперсионные уравне- ния будут иметь вид соответственно: Др(Х, р) = М\(р) - X = 0; ДА, -У) = Д(*) - X = 0, где X определяется как корень характеристиче- ского уравнения для собственных чисел дан- ной пространственной краевой задачи Д(Х) = 0. Общее решение уравнения (9.3.119) в этом случае может быть представлено как ли- нейная комбинация с бесконечным числом слагаемых функций вида ехр(рЛ/ + Что касается процессов, однородных как во времени, так и в пространстве, то в этом случае функция Грина (г(х, /, т) имеет вид G(x, А?,г)= т.е. фактически является функцией (r(x, I) двух аргументов. Применяя преобразование Лапласа к функции Грина и по времени, и по пространству, получим = J J e~№+a)G(x,f)dxdt. Or" В этом случае связь между входом и вы- ходом распределенного блока описывается простым алгебраическим (а не интегральным) соотношением
670 Глава 9.4. ПРИНЦИП МАКСИМУМА ДЛЯ ОДНОГО КЛАССА ЗАДАЧ Q(s,p) = W(s,p)w(s,p). Полагая в W(s, р) соответственно s =/у, р =усо, получаем пространственно-временную частотную функцию Wr,»- В обычных физически реализуемых сис- темах действительные и мнимые части переда- точной функции W(s, р) распределенной сис- темы не независимы: они связаны между со- бой преобразованием Гильберта (Крамерса). Получающееся при этом уравнение Д(5, р) = 0 является дисперсионным. Таким образом, структурный метод по- зволяет наиболее просто описывать распреде- ленные системы в случае протекающих в них процессов, однородных как в пространстве, так и во времени. Такие системы можно опи- сать чисто алгебраическим путем (без опера- ций интегрирования). Однако однородность, особенно по пространственным переменным, далеко не всегда имеет место. Рассмотрением стационарных (или авто- номных) систем мы ограничились исключи- тельно для простоты изложения. Совершенно аналогично можно рассмотреть нестационар- ные (или неавтономные) системы. Для этого во всех формулах и преобразованиях достаточ- но сделать замену: 1) передаточные функции W(x, р) заменить на импульсные переход- ные функции б(х, /, т); 2) знак 8 компо- зиции по пространству заменить на знак О композиции по пространству и времени и 3) изображения сигналов w(x,p) заменить сигналами w(x, /). Такая замена, которая мо- жет быть выполнена и в обратном направле- нии, при стационарных (или автономных) системах, приводит к соответствующим урав- нениям и формулам для нестационарных (или неавтономных) систем. Глава 9.4 ПРИНЦИП МАКСИМУМА ДЛЯ ОДНОГО КЛАССА ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ СРП Рассмотрим задачу оптимального управ- ления. Пусть Д и Di - две области соответст- венно в г и 5-мерных евклидовых пространст- вах. Состояние системы описывается действи- тельнозначной функцией Q — Q(P), Р е D\. Управление описывается действительнозначной кусочно-непрерывной функцией* и = 27(5), S е е принимающей свое значение из замкну- того множества w. Такое управление называют допустимым. Наконец, состояние системы определяется интегральным соотношением 0(Р) = J. , tf(5)] dS, (9.4.1) А где функция К(Р, 5, и) непрерывна по S € Di и иен равномерно по Р € D\. Задача оптимального управления состоит в том, чтобы найти такое допустимое управле- ние и = 27(5), S е Di и и е w, которое со- гласно равенству (9.4.1) минимизирует сле- дующий функционал: 1 = JlT0[5,O(5)]dS, (9.4.2) А где функция А°(5, Q) непрерывна и имеет непрерывную частную производную по Q. Итак, пусть и = U(S) - оптимальное управление, a Q = Q(P) - соответствующее ему согласно формуле (9.4.1) оптимальное состояние, минимизирующее функционал (9.4.2). Составим функцию п(л,«) = J (9.4.3) Теорема (Принцип максимума). Для того чтобы управление и = 27(5) и соответствующее ему в силу формулы (9.4.1) состояние Q = = 0(Р) реализовывали минимум функционала (9.4.2), необходимо, чтобы при и = 17(5) функция П(Д и), определенная равенством (9.4.3), достигала максимума по аргументу и, меняющемуся на множестве w, почти для всех Refy. Можно доказать справедливость этой теоремы в случае, когда состояние управляе- мой системы есть вектор Q(P) = [247), ...» 2r(70] и управление также есть вектор 27(5)= = [2Л(5), ..., 27"(5)], принимающий свои значения из некоторого замкнутого множества. •Кусочная непрерывность 27(5), 5 е 1)% означает, что область Di может быть "разбита" на конечное число подобластей, внутри кото- рых 27(5) непрерывна.
ПРИНЦИП МАКСИМУМА ДЛЯ ОДНОГО КЛАССА ЗАДАЧ 671 К(Р, S, и) будет л-мерным вектором К(Р, S, и) = [#(/>, 5, //),Х*(Р, S, //)]. Сформулированный принцип максимума позволяет вывести интегральное уравнение, определяющее оптимальное управление. Рассмотрим управляемую систему, со- стояние которой в каждый момент времени t, О Г, описывается функцией распределе- ния Q(x, /)> -S <. х <. S. Под действием управляющего воздействия и = 1/(1), ограни- ченного дополнительными условиями А\ <, и состояние управляемой системы меняет- ся по закону t Q(x, t) = J K(x, t, (9.4.4) 0 где K(x, t, т) - заданная функция, -s £ х <. s, Широкий класс объектов с распределен- ными параметрами может быть описан по- средством соотношения (9.4.4). Функция К(х, I, т) во многих случаях имеет смысл функции влияния, импульсной переходной функции или функции Грина (см. гл. 9.3). Для системы (9.4.4) можно сформулиро- вать следующую задачу оптимального управле- ния. Пусть задана функция С*(х), -s <. х <. s, которая характеризует желаемое или требуемое состояние, а время Т фиксировано. Нужно найти такое допустимое (т.е. Ai £ u(f) <. А^ управление //(/), 0 <. t Т, чтобы в момент времени Т отклонение функции £(х, 7) от функции 0*(х) было наименьшим. За меру такого уклонения примем интеграл j i=/|е*(х)-е(х,т)|гл, yst -J (9.4.5) Предположим, что функция С*(х) и время Т таковы, что ни при каком допусти- мом управлении и = u(f) невозможно выпол- нение равенства Q*(x)=Q(x, Г), -5<х<5, (9.4.6) т.е., точное "попадание" в желаемое распреде- ление невозможно. Это означает, что I # 0 и всегда I > О*. Функция (9.4.3) в этом случае примет следующий вид: s. П(м)= /г|е*(х)-О(х,Т)|у-,х х {sign[C » (х) - 0(х, Т)]} К(х, T,t) udx. (9.4.7) Отсюда следует, что аргумент и входит в определение функции П линейным образом. Предположим, что подынтегральное вы- ражение в равенстве (9.4.7), когда £(х, 7) соответствует оптимальному состоянию, обра- щается в нуль только лишь на множестве меры нуль значений времени t из [0, 7]. Тогда мак- симум функции (9.4.7) при фиксированном /, О t Ту достигается при условии “(О = + а2) + ±(а2- 41) х j xsign. /|е*(х)-о(х,т)Г’1 -J X X sign[O»(x) - е(х, Г)] К(х, Т, t)dx}, (9.4.8) Таким образом, если в уравнение (9.4.8) подставить вместо функции Q(x, /) ее выра- жение через управление //(I) по формуле (9.4.4), то получится интегральное уравнение, которому удовлетворяет оптимальное управле- ние //(!), 0 t < Т9 А\ £ и А^. “(') = у (4 + Л2) + - 4 ) X х sign х Т X sign е*(х) - J К(х, Т, т) и(т) Л х О х ^(XjT,/)^}. (9.4.9) •Допускается, однако, возможность того, что равенство (9.4.6) выполняется лишь для конечного или счетного числа точек интервала - -s <. х <. Sy что не повлияет на содержатель- ность последующих результатов.
672 Глава 9.4. ПРИНЦИП МАКСИМУМА ДЛЯ ОДНОГО КЛАССА ЗАДАЧ Задачу подобного рода можно сформули- ровать, например, для следующего процесса. Пусть функция Q — Q(x, I) описывает распределение температуры в массивном теле в зависимости от пространственной координа- ты х, -s < х <. s9 и времени Д 0 <, t <, Т, а уравнения нагрева для внутреннего теплооб- мена имеют вид Q = aQ", -s £ х £ s, / > О, (9.4.10) а для теплообмена на границе 0 = а[и(1) - 0(-<s» 0], t > 0; (9.4.11) Х2Ч*5, 0 = > о (9.4.12) при нулевом начальном условии 0(х, 0) = 0, -5 < х < х (9.4.13) Здесь а - температуропроводность; X - тепло- проводность; а - коэффициент теплообмена; 2s - толщина массивного тела. Здесь функция u(f) имеет смысл темпе- ратуры среды, которая обогревает тело с двух сторон при условии <, и <, A%. Функцию распределения температуры те- ла Q(x, I) можно выразить через функцию температуры печи u(i) посредством соотноше- ния типа (9.4.4). Если под функцией Q*(x) понимать заданное распределение температуры тела, то задачу наилучшего приближения в смысле минимума функционала (9.4.5) можно поставить, например, для процесса нагрева слитков под прокатку в нагревательных колод- цах. Действительно, решение уравнения (9.4.10) с граничными и начальными условия- ми (9.4.11), (9.4.12), (9.4.13) можно записать в виде: t 2(x,0 = J K(x,t -z)u(z)(h; (9.4.14) о OO *(*>0 = ехр(- |ф)со8ц*х; *=1 (9.4.15) ------Tsinp,------ = ц* +8П1цл cosh* (9.4.16) а числа к = 1, 2, ... являются различными действительными положительными корнями характеристического уравнения — ц = ctgpi, as (9.4.17) причем Hi < Н2 < ••• < Н* < ••• • Рассмотрим задачу о минимизации функционала (9.4.5) при у = 2 (минимизация квадратичного уклонения истинного распреде- ления температур Q(x, 7) от заданного С*(х) в момент времени 7). Для получения уравнения для искомого оптимального управления м(/) подставим ре- шение (9.4.14) в уравнение (9.4.9). Тогда урав- нение (9.4.9) примет вид "(0 = + А2) + |(Л2 - Л1) X signj Q*(x) - j К(х,Т - x)u(x)dr х K(x,T-t)dx], Q^t^T. (9.4.18) Раскрывая скобки под знаком sign в правой части уравнения (9.4.18) и меняя поря- док интегрирования (интегрируя сначала по х, а затем по Z, получим окончательно инте- гральное нелинейное уравнение относительно оптимального управления: “(0 = + А2) + |(л2 - Л1) X т о (9.4.19) где В(Т, о = J Q ♦ (х)К(х, T-f)dx; — S G(T, t, т) = j К(х, Т - t)K(x, T-t)dx. —s Если предположить, что за время Т нельзя получить точное соблюдение условия 0*(Х) = 2(х, 7), т.е. не существует допустимого управления и(1), 0 < t <. Т, с помощью которого можно точно "попасть" в заданное распределение С*(х), то выражение под знаком sign в урав- нении (9.4.19) ни на каком конечном интерва- ле времени /2)» лежащем внутри заданного отрезка времени [0, 71, не обращается в нуль. В этом случае непосредственно из уравнения
ПРИНЦИП МАКСИМУМА ДЛЯ ОДНОГО КЛАССА ЗАДАЧ 673 (9.4.19) следует, что оптимальное управление u(f) на отрезке [0, 7] является кусочно- постоянной функцией времени /, принимаю- щей поочередно свои предельно допустимые значения и Л2. Аналитическое решение интегрального нелинейного уравнения (9.4.19) представляет собой непростую задачу. Однако, это уравне- ние можно решить численно с помощью ЭВМ или параметры приближенного решения u(f) можно находить графически с помощью но- мограмм. Как следует из (9.4.19), если решение u(f) существует, то оно является кусочно по- стоянной функцией, принимающей на интер- вале 0 t £ Т поочередно всего лишь два зна- чения А\ и А). Из опыта расчетов конкретных примеров и физических соображений также ясно, что общее число интервалов постоянства ц(/) должно быть небольшим; практически достаточно взять два или три таких интервала. Для большей общности расчетов представим задачу (9.4.10) - (9.4.13) в безразмерном виде, введя следующие критерии подобия: <р = - критерий Фурье, безразмерное время; , х I = — - безразмерная толщина пласти- • 5 ны, -1 <, I <, 1; as b = — - критерий Био, характеризую- К щий инерционность нагрева; v = —------—L - критерий безразмер- Аг - Л1 ной начальной температуры, где Qq - посто- янное начальное равномерное, a 2* - посто- янное конечное равномерное распределение температуры по толщине пластины; ^+^2-22* % =-------------- - температурный Аг-Ах критерий (безразмерный) несимметрии нагре- ва. Так как по смыслу задачи А\< Q* < Л2, то всегда | х I < 1* Также по смыслу задачи имеем, что v < 0. Новое безразмерное распределение тем- пературы имеет вид 2(/,ф) = AQ-Q*] А2~^ а новое безразмерное управление «(ф) = -4— Задача (9.4.10) - (9.4.13) в новых безраз- мерных величинах будет иметь вид: дО д2О , аТ -1Ш1, О£<р<;<ро=—; оф dll S 8Q а/ /=1 = •₽)]; ае а' /=-1 = - g(-1> '₽)]’ 2(/, о) = -v, v < 0. При этом ограничение на управления примет вид: зв - 1 <. и(ф) £ ав + 1, |ав | < 1 и желаемое конечное распределение темпера- туры будет нулевым: 040 = о. На первом интервале знакопостоянства искомая функция и(ф) должна принять поло- жительное значение и(ф) = ае + 1. Следова- тельно, на втором интервале знакопостоянства и(ф) = ав - 1, и, наконец, на третьем будет снова и((р) = ав + 1. Осталось найти только длины этих интервалов. Обозначим их соот- ветственно Д], Д2, Д3. Это три неотрицатель- ные действительные величины, дающие в сум- ме весь интервал. Таким образом, задача состоит в том, чтобы найти значения интервалов Д/, / = 1, 2, 3, как функций от параметров задачи, кото- рыми в данном случае являются введенные выше безразмерные критерии: фо, b, v, ав. Фактически надо определить две функ- ции: Д1 = МФО» v> «) и Д2 = Д2(ф0, b, v, ав), так как Д3 определяется затем тривиальным образом: Д3 = ФО - Д1 - Д2- Для вычисления искомых величин Д] и Д2 по заданным значениям фо, b, v, ав можно воспользоваться номограммами [7]. 22 Зак 1023
674 СПИСОК ЛИТЕРАТУРЫ СПИСОК ЛИТЕРАТУРЫ 1. Бундовский А. Г. Методы управления распределенными системами. М.: Наука, 1975. 2. Бундовский А. Г. Структурная теория распределенных систем. М.: Наука, 1977. 3. Бундовский А. Г. Теория оптимального управления системами с распределенными параметрами. М.: Наука, 1965. 4. Бундовский А. Г. Характеристики сис- тем с распределенными параметрами. М.: Наука, 1977. 5. Бундовский А. Г., Пустылышков Л. М. Теория подвижного управления системами с распределенными параметрами. М.: Наука, 1980. 6. Бундовский А. Г., Самойленко Ю. И. Управление квантово-механическими процес- сами. М.: Наука, 1984. 7. Владимиров В. С Уравнения матема- тической физики. М.: Наука, 1976. 8. Дирак П. Принципы квантовой меха- ники. М.-Л. ОНТИ, 1937. 9. Колмогоров А. Н., Фомин С В. Введе- ние в функциональный анализ. М.: Наука, 1980. 10. Курант Р., Гильберт Д. Уравнения с частными производными. Т. 1, Т. 2. Гостехиз- дат, 1962. 11. Лионе Ж.-Л. Оптимальное управле- ние системами, описываемыми уравнениями с частными производными. М.: Мир, 1972. 12. Лурье К. А. Оптимальное управление в задачах математической физики. М.: Наука, 1975. 13. Сиразетдинов Т. К. Оптимизация сис- тем с распределенными параметрами. М.: Наука, 1977. 14. Тихонов А. Н., Самарский А. А. Урав- нения математической физики. М.: Гостехиз- дат, 1951.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ А Автоколебания - Достаточное условие отсутствия автоколебаний 265, 267 * Ус- тойчивость 244 - 249 - см. также Метод гармонической линеаризации - в системах высокого порядка 193 - 195 - в системах с трехпозиционным ре- лейным элементом 240 - 244 - несимметричные 181 Автоколебания в системах с двухпозици- онным релейным элементом - Графиче- ский способ определения 238, 239 - Час- тотный метод определения 238 - 240 - несимметричные 234, 237, 238 - симметричные 232 - 236 Алгоритм проектирования 574 - функционирования САПР 574 - Типовые функциональные состав- ляющие 580, 581 - численный решения эквивалентных задач 547 - 549 Алгоритмы адаптивных оптимальных САУ с идентификацией - Наблюдатели и идентификаторы с модулями 564 - 566 - Системы с калмановской иден- тификацией 566 - 568 Алогирнтмы беспоисковые адаптивных САУ - Беспоисковые адаптивные системы (БАС) с информацией о временных характеристиках 557 - 559 - БАС с эталонной моделью 559 - 562 - Настройка промышленных регуля- торов 562, 563 - Синтез основного контура системы 555, 556 - Системы с информацией о частот- ных характеристиках 556, 557 - Структура и классификация систем прямого адаптивного управления 554, 555 Алгоритмы поиска экстремумов функций многих переменных - Классификация 455 - 457 - Локальные алгоритмы в многоэкстремальных задачах 459 - 464 - Программы поиска экстремума 457 - 459 - стабилизации стационарных со- стояний 367 - 372 - Управление по выходной переменной 337 - 340 - Управление по переменным со- стояния 335 - 337 Алгоритмы управления многомерных сле- дящих систем высокой динамической точности 372 - 374 - по ускорению 344 - 350 - следящих систем адаптивные - Ин- формационное обеспечение 361 - 363 - Постановка задачи 351 - Рас- чет параметров 359 - Структура 351 - 359 - следящих систем - Постановка за- дачи 340, 341 - Реализация 342 - 344 - Синтез 341, 342 Анализ систем, представленных в форме функциональных рядов - Анализ устой- чивости 306 - 308 - Вычисление ядер Вольтера для сис- темы с заданной структурной схе- мой 302 - 305 - Частотный анализ нелинейной сис- темы 305, 306 Аналог критерия Михайлова для дис- кретных систем 103 Аттракторы простые 177 - странные 177 22*
676 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Б Баланс энергетический 193 Бифуркации 177 Блоки распределенные 657, 658 - Парал- лельное соединение 659, 660 - Последо- вательное соединение 660 - Частные виды 660 - 662 - стационарные 658, 659 В Вариация игольчатая 475, 476 Вектор состояния системы дискретной 104 - непрерывной 379 - 381 Воздействие ступенчатое единичное 27 - периодическое - Реакция автомати- ческой системы 27 Возмущения 43 Г Гидроусилитель - Схема 18 Гироскоп демпфирующий 68 Годограф функции 26 - частотного оператора 26, 36 д Датчик линейных ускорений 32 Движение квазипериодическое 177 - невозмущенное устойчивое 43 - неустойчивое 43 - установившееся 25, 26 Декомпозиция матриц полярная 60 - сингулярная 60 Дифференциатор нестандартный бинар- ный 283 - 287 - релейный 282, 283 - с "малой" амплитудой разрывов 282 - финитный бинарный 286, 288 Добротность следящей системы 67 3 Задача линейно-квадратичная при клас- сическом функционале 531, 532 - линейно-квадратичная при функ- ционале обобщенной работы 532, 533 - планирования как задача управле- ния уравнением типа Риккати 544, 545 Задачи краевые - Стандартная форма 666, 667 Задачи линейно-квадратичные синтеза оптимальных управлений слежения 483, 484 - с ограниченной наблюдаемостью управляемого объекта 484, 485 - стабилизации 482, 483 - терминального управления 484 Задачи оценивания линейные 499 - Дис- кретный фильтр Калмана-Быоси 502, 507 - Наблюдатели с моделями 500 - 502 - Непрерывный фильтр Калмана- Бьюси 502 - 506 - Фильтр Винера 499, 500 - стохастические оптимизации САУ 528 - Принципы разделения при ус- ловных целевых функционалах 530, 531 - Управления, оптимальные в смысле безусловных и условных це- левых функционалов 528 - 530
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 677 - управления процессом наблюдения 540, 541 - Конкретизация 541, 542 - управления эквивалентные линей- ные 545 - 547 Запас устойчивости 50 Звенья с комплексными коэффициента- ми - Логарифмические характеристики 42 - элементарные - Логарифмические характеристики 40-42 Значения сингулярные 60 и Идентификация нелинейных систем в форме рядов Вольтера - Метод ортого- нальных моментов 293, 294 - Экспери- ментальное определение ряда Вольтера с помощью тестов в форме 5-импульсов 291, 292 - в условиях нормальной работы 294 - 296 Идентифицируемость 82 Изоклина 168 Инвариантность системы по отношению к внешнему воздействию 119 - к возмущающему сигналу 119 Интеграл аналоговой ЭВМ 31 - Дюамеля 33 - свертки - Математическое описание линейной системы 33, 34 К Качество системы - желаемые частотные характеристики 114 - 116 - Связь вида частотной характеристики с показателя- ми качества 113 - 116 - Типовые желае- мые логарифмические характеристики 116 - Требования к качеству переходного процесса 115 - Требования к точности системы 115 - динамической - Вероятностные по- казатели 387 - 389 Колебания вынужденные нелинейной системы - Высшие гармоники 207 - 211 - несимметричные Колебания вынужденные релейных сис- тем 249 - Графический способ определе- ния 250 - 252 - Двухпозиционный ре- лейный элемент 249, 250 - Примеры оп- ределения 252, 253 - Трехпозиционный релейный элемент 250 - Устойчивость 252 - субгармонические - Определение 250 Колебания двухчастотные нелинейные с большой разницей частот 212-214 - двухчастотные нелинейные без ог- раничения близости частот 214 - 216 - одночастотные 204 - 207 Колебательность 75 Координатор следящий - Схема 19 Координаты комплексные 34 - 37 Корень вещественный - Определение 76 Корни комплексные - Определение 76 - 78 Коррекция нелинейных систем - Нели- нейные корректирующие устройства 229 - линейная 227, 228 - псевдолинейная 230 Коэффициент гармонической линеариза- ции дискретный 260, 262, 263 - демпфирования 30 - усиления главный 60 Коэффициенты гармонической линеари- зации 179 - для несимметричных колебаний 188 - 192
678 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ - для симметричных колебаний 182 - 187 Коэффициенты комплексные звеньев 35, 36 * обратных связей в системах со многими входами - Методы вычис- ления 132 - 135 - см. также Методы вычисления коэффициентов обратных связей • усиления матрицы 60 Критерии оптимальности САУ 445 - Вы- бор функционала обобщенной работы 452 - 455 - Критерии качества переходных про- цессов и стационарной точности слежения 446 - 448 - Неклассические целевые функцио- налы 449, 450 - Общие критерии оптимальности 448, 449 - Общие критерии оптимальности в стохастических системах 450, 451 -Однокритериальная и многокрите- риальная оптимизация 451, 452 Критерии оптимизации ЧМС слежения 620 - устойчивости 103 - эффективности систем автоматиче- ского управления 389 Критерий Гурвица 44 - 46, 103 - качества системы 142, 143 - Найквиста 62, 63 - Найквиста для дискретных систем 103, 104 - неустойчивости 63 - оптимальности 543, 544 - Раусса-Шура 103 - робастной устойчивости 325 - устойчивости Михайлова 46 - 48 - устойчивости периодического ре- шения 180 - частотный Найквиста 48-50 Л Лемма ГронулЛа-Беллмана 56 Линеаризация нелинейности вибрацион- ная 226 - нелинейностей при случайном входном сигнале 403, 404 - нелинейных характеристик 23 - характеристик и уравнений 23, 24 Линин переключения 170 м Матрица Жордана 106, 107 - комплексно-сопряженная 59 - Коши 55 - невырожденная 60 - ортогональная 60 - передаточная 37, 38 - передаточная многомерной системы по отношению к ошибке 80, 81 - передаточная синхронной замкну- той дискретной системы 94 - переходная дискретной (стационар- ной) системы 105, 106 - решений фундаментальная 54 - самосопряженная 59 - симметрическая 59 - сопряженная 59 - унитарная 60 - Форбениуса 24 - эрмитовая 59 - эрмитово-сопряженная 59
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 679 Метод адаптации поискового алгоритма в реализации расчетных процессов про* ектирования по ограничениям 594 * 596 - анализа устойчивости частотный * Обобщение на многомерные систе- мы автоматического управления 59-64 - асимптотический 181, 193 - вариации произвольных постоян- ных 55 Метод вероятностных моментов при обычной линеаризации и аддитивном белом шуме 404 - при обычной линеаризации и муль- типликативном белом шуме 404, 405 - при статической линеаризации и аддитивном белом шуме 405 - 407 Метод Винера 296 - 302 Метод гармонической линеаризации - Алгебраический способ определения автоколебаний и их устойчивости 180 - Несимметричные автоколебания 181 - Основы метода 179, 180, 182 - 192 - Час- тотный способ определения автоколеба- ний 180, 181 - - для дискретных систем 260 - 267 - нелинейности 179 Метод дискретных переходных функций состояния 398, 399 - изоклин 168 - интерполяционный 424, 425 - исследования устойчивости частот- ный 199 - 201 - канонических представлений слу- чайных процессов 398 - квазигармонический 193 - коррекции комбинированный 119 - малого параметра 181, 193 - медленно меняющихся коэффици- ентов 181 - многошаговой реализации расчет- ных процессов проектирования по ограничениям 597 - 600 - обратных задач динамики 331, 332 - Схема синтеза управлений 332 - 335 - припасовывания 176 Метод разделения движений 193 - симплекс-поиска 79 - синтеза линейных систем - Синтез закона управления 130 - 132 - Управления по заданным значени- ям матрицы системы для дискрет- ных линейных систем 140 - 142 - Управление при интегральных об- ратных связях 139, 140 - спектральный, основанный на ин- тегральном уравнении Фредгольма 2-го рода 431, 432 - спектральный, основанный на па- раметрических нестационарных спектральных передаточных функ- циях 429 - 431 - статистических испытаний оценки точности автоматических систем 421, 422 - точечного преобразования 173, 174 - фазовой плоскости - Переходные процессы и автоколебания в релей- ных системах 170, 171 - Система с логическим управлением 172 - Сис- тема с переменной структурой 173 - эквивалентных возмущений - Опре- деление математического ожидания и дисперсии 423, 424 - Основы 422, 423 Методы вычисления коэффициентов об- ратных связей - Введение обратных свя- зей по входу, соответствующему одному столбцу матрицы управлений 133
680 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ - Мультипликатное представление матрицы коэффициентов обратных связей 132, 133 -Обеспечение минимальной зависи- мости желаемых значений полюсов системы от возмущений 134, 135 - Обеспечение пропорциональности элементов строк матрицы BL 133 - Приведение матрицы системы к диагональному виду 133, 134 Методы Н*° -теории управления - Нормы сигналов и систем 314, 315 - операционного исчисления 28 - определения закона управления без решения уравнения Риккати 146 Многочлен характеристический 102 Модели математические деятельности человека-оператора в ЧМС слежения - Задача моделирования сенсомоторной деятельности 615, 616 - аппроксимирующие 616 - дискретные 618 - линейные 616 - 618 - нелинейные 618 - оптимальные 618, 619 - структурно-функциональные 616 Модели математические дискретных систем с одним импульсным элементом 84-92 - одномерные стохастических систем 384, 385 - Модель дискретной САУ с интегральным оператором 386 - Модель непрерывной автома- тической системы с интегральным оператором 385 - оптимизируемых процессов и сис- тем 439 - Модели вход-выход 443, 444 - Модели в пространствах со- стояний 439 - 441 -Модели в обобщенных координатах 441 - 443 - Модели ограничений 445 - Области устойчивости и пара- метрическая оптимизация 444, 445 - рекуррентные для вероятностей пе- реходов 383, 384 - рекуррентные для вероятностей со- стояний 384 Моделирование численное 468 Моделирование ЧМС полунатурное - Влияние технического облика тренажера 638, 639 - Воздействия на летчика в по- лете 637, 638 - Назначение тренажеров и комплексов 637 Модель планирования эксперимента в динамических системах (общий случай) 541 - системы стохастическая 377 - стохастическая дискретная систем автоматического управления в про- странстве состояний 382 - 384 - стохастическая непрерывная систе- мы автоматического управления в пространстве состояний 377 - 379 - эволюции характеристик точности эксперимента 542, 543 Модуль оптимального управления с про- гнозированием 540 Модуляции 82, 83 н Наблюдаемость системы 81, 82 Наблюдатель Льюннбергера 150 Нелинейности - Виды 162 - динамические 165, 166 - искусственно вводимые 165 - статические 162 - 164 Нелинейность логического типа 166
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 681 * несимметричная 179 * переменной структуры 166 Неопределенности неструктурированные 324, 325 Неопределенность параметрическая 426 - структурная 426 Неустойчивость системы абсолютная 202 Норма евклидова 21 * спектральная 80 О Область главная 60 * Выделение на плоскости годографов 61 * захватывания 205, 206 * управлений эксплуатационная 22 Области устойчивости в пространстве параметров * Выделение 50 * 53 * Грани* ца устойчивости 51, 52 * Правило обхода областей 51 Объект регулирования 19 •технический - Описание процесса проектирования 577 - 580 - Основ- ные зависимости организации про- цесса проектирования 582, 583 Октава 39 Оператор RIC - Свойства 317, 318 - системы частотный 25 Операторы сжатия и Риккати 316, 317 Оптимизация процессов управления - Математические основы 471 - 481 Оценивание 494 - Классификация задач 495 - Описание условий наблюдения 497 - 499 - Частотное и временное описание оцениваемых процессов 494 - 497 Оценивание, идентификация и проверка гипотез в дискретных динамических сис- темах - Определение апостериорной плотности вероятности 521 - Оптимальный алгоритм совместного оценивания, идентификации и про- верки гипотез по критерию макси- мума апостериорной вероятности 524 - Постановка задачи 521 - Частные случаи 525 - 528 Оценивание оптимальное адаптивное 513 - 515 Оценивание процессов в нелинейных сис- темах - Нелинейные наблюдатели с мо- делями 507, 508 - Непрерывный фильтр Калмана-Бьюси 508 - 511 Фильтр Кал- мана-Бьюси с дискретным временем 512 Оценка качества переходного процесса - Определение вещественного корня 76 - Определение комплексных корней 76 - 78 - устойчивости по функции Ляпунова 390, 391 - Некоторые методы по- строения функций Ляпунова 392 - Устойчивость линейных стохасти- ческих систем 391, 392 - Экспонен- циальная устойчивость 391 Оценки качества интегральные 78 - 80 - квадратичные 79 п Параметризация множества регуляторов в нормализованной проблеме робастной стабилизации 325 - 327 Перемежаемость 178 Плоскость фазовая - Типы особых точек 167 - 170 - многолистная 170 Плотность вероятности перехода 380 Показатели Флоке 176 Полиномы Винера ортогональные 296, 297
682 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Помехоустойчивость вибрационная 223 - 225 Порядок астатизма 66 Преобразование аналого-цифровое 82, 83 -Лапласа дискретное ^-преобразо- вание) 85, 86 - Таблица Z-преобра- зований 87, 88 - Лапласа одностороннее 28 - Фурье дискретное 94 Преобразователь Лапласа 110 Принцип алгебраической дуальности 318 - максимума для одного класса задач оптимального управления СРП 670 - 673 Проблема нормализованная робаст- ной стабилизации 325 - полной информации 318 - Н*-оптимизации 316 - Специаль- ные проблемы 318 - 321 - Стан- дартный объект 315, 316 - Н*-оптимизации общая - Решение 321 - 324 Программа оптимального маневра лета- тельного аппарата - Формирование 549 - 551 Программирование динамическое 477 Проектирование и компоненты комплек- са средств автоматизации проектирова- ния 573, 574 - по ограничениям - Факторы, опре- деляющие характер расчетных про- цессов 591 - 594 Производительность САПР в рамках комплексной САПР 590, 591 Пространство состояния дискретной системы расширенное 108 - фазовое 167 - 170 - Понятие 22 - фазовое систем высокого порядка 176 - 178 Процедура Гловера-Дойла 327, 328 - Бе- зытерационный вариант 328, 329 Процесс Винеровский 378, 379 - дискретный - Полная вероятност- ная характеристика 382, 383 - марковский случайный непрерыв- ный 379 - 381 - непрерывный стохастический Полная вероятностная характери- стика 379 - 382 - переходный 25 - Параметры 20 - переходный по распределению кор- ней характеристического уравне- ния - Оценка качества 75 - 78 - скользящий 172 - Закон движения 172 Процессы переходные - Оценка качества по диаграммам качества затухания нели- нейных колебаний 217 - 221 - Оценка качества по частотному критерию абсо- лютной устойчивости 221 - переходные в линейных автомати- ческих системах - Методы вычис- ления 68 - 75 - Оптимальный пере- ходный процесс 72 - 75 - управления в автоколебательных системах 221 - 223 - управления с вынужденными виб- рациями 221 - 223 Псевдочастота 96 Р Распределение векторного процесса од- номерное 418, 419 Регулятор прямого действия 18 - скорости центробежный 17 - Про- цессы регулирования скорости 17 - Уатта 17, 18
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 683 Решение уравнения асимптотически ус- тойчивое 44 - тривиальное 43, 102 Робастность 59 Ряды Вольтера 291 - Фурье 300, 301 - Фурье-Эрмита 301, 302 с САПР - Виды проектирования 573, 574 -Оценка качественного влияния на характер проектной деятельности человека 602, 603 - Проектная оценка производитель- ности 601, 602 - Процесс создания 575 -Система показателей выбора рацио- нального варианта 600, 601 -Структура и схема функционирова- ния 575 - 577 -Структурные и функциональные со- ставляющие 571 - 573 -Требования к качеству проектиро- вания 583 - 585 - Учет требований завершенности ре- зультатов проектирования 588 - 590 -Учет требований к достоверности результатов проектирования 585 - 588 - Формализованное представление САПР как организационно- технической системы 573 САУ адаптивные - Классификация 551, 552 - Предельные возможности 552 - 554 - с прогнозирующими моделями - Оценки необходимой вычислитель- ной производительности 537 - 540 - Структура 533 - 537 Свертка функций 34 Свойства резонансные частотной харак- теристики 26 Свойство суперпозиции 23 - фильтра 179 Связь обратная - Замыкание 662, 663 - вырожденная - Замыкание 663 - 665 Сглаживание нелинейностей внешними вибрациями 225 - 227 - с помощью автоколебаний 227 Седло-узел 176 Седло-фокус 176 Семиинварианты фазовых координат САУ - Анализ 419 - 421 Сепаратрисы 169 Сигнал апериодический входной 61 - дискретный 82 - периодический входной 61 - управления основной 221 Сигналы распределенные 656, 657 - Суммирование 659, 660 - тестовые 25 Симметрия в системах автоматического управления 331, 332 Синтез параметрический САУ во вре- менной области 468 - 471 - на основе моделей в пространстве состояний 468 - на основе моделей вход-выход 465 - 468 Синтез алгоритмов стабилизации и управления с учетом динамики исполни- тельных элементов 374 - 376 Синтез дискретных автоматических сис- тем с помощью логарифмических частот- ных характеристик - Желаемые частот- ные характеристики 123 - 125 -Построение логарифмических час- тотных характеристик 122, 123
684 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ - Синтез корректирующих устройств 125 - 130 Синтез корректирующих устройств в не- прерывной системе 119, 120 - Определе- ние устойчивости внутреннего контура 120 - 122 - параллельных 120 - последовательных 120 Синтез нелинейных систем 308 - 312 Система автоматическая при случайных воздействиях - Постановка задачи ана- лиза 386 - автоматического регулирования - Понятие 18 - динамическая - Фильтрующие свой- ства 26 Система дискретная замкнутая - Уравне- ние 85 - идентифицируемая 109 - линейная - Управление по квадра- . тичному критерию качества 147 - 149 - многомерная 93 . - обратимая 109 - (полностью) управляемая 109 - разомкнутая 85 - синфазная 92-94 - синхронная 92-94 Система замкнутая - Управление нулями и коэффициентами усиления 135 - 139 - нелинейная 171, 172 - неполностью наблюдаемой 146, 147 - релейная - Уравнение 231 Система следящая астатическая 66 - с гироскопическим исполнитель- ным элементом - Структурная схе- ма 34 - эрратическая - Основные понятия 614, 615 Система с программным управлением - Понятие 18 - управления дискретная 82, 83 - управления многомерная 19 Система управляемая упругая - Исследо- вание динамики 363 - 366 Система уравнений линеаризованная 24 Система устойчивая в целом 44 Системы автоматические - Классифика- ция элементов по функциональному признаку 19, 20 - одномерные 18 Системы автоматического управления - Понятие 18 - Требования к системам 20,21 - в машиностроении - Примеры 17 - 19 - многомерные - Математическое описание 37, 38 - Общие рекомен- дации по проектированию 80, 81 Системы автоматические 291 - астатические 20 - взаимосвязанные 665, 666 - двумерные следящие 18 - Переда- точные функции 34 - 37 Системы дискретные - Переходные про- цессы 91 - Точность - см. Точность дис- кретных систем - в пространстве состояний 108, 109 - с несколькими импульсивными элементами 92-94 Системы дифференцирующие нестандарт- ные 282 - 288 Системы линейные динамические Иденгифируемость 82 - Наблюдаемость 81, 82 - Управляемость 81 - дискретные - Классификация 82 - 84 - импульсные 84
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 685 - непрерывные автоматического уп- равления - Качество воспроизведе- ния при плавных воздействиях 64 - 68 - с постоянной матрицей 44-46 Системы нелинейные - Исследование устойчивости методом Ляпунова 195 - 199 - Описание с помощью рядов Воль- тера 288 - 291 - Определение системы в концепции "вход - выход" 288, 289 - Особенности 159 - 162 - Особые точки и линии 169, 170 -дискретные - Математическое опи- сание 253 - 257 - Определение пе- риодических процессов 257 - 260 - полиномиальные 289 - 291 Системы непрерывно-дискретные - Урав- нения состояния 109 - 112 Системы с распределенными парамет- рами - Задачи управления 642, 643 - Замыкание вырожденной связью 663, 665 - Замыкание обратной связью 662, 663 - Примеры содержательных постано- вок задач управления 644 - 656 Системы с нестационарной неопреде- ленностью 426 - 429 - со стационарной неопределенно- стью 426 - стабилизации - Понятие 18 - стационарные дискретные линей- ные 400 - 403 - стационарные дискретные нели- нейные 416, 417 Системы управления дискретные 83 - нелинейные - Структурный синтез - см. Структурный синтез нелинейных систем управления Системы управления оптимальные про- гнозирующие - Алгоритм с прогнозиро- ванием в задаче^ управления твердым телом 490 - 494 -Алгоритм с прогнозирующей моде- лью 488, 489 -Оценка необходимой вычислитель- ной производительности 489, 490 - Принцип минимума обобщенной работы 486 - 488 - Трудности решения многомерных нелинейных задач оптимизации 485 Системы управления человеко-машин- ные - Общие сведения 604, 605 - Расчет членов экипажа 614 - "дискретные" - Классификация ви- дов деятельности 607, 608 Соотношения дисперсионные 667 - 670 Срыв управления (слежения) в САУ - Основные определения 432, 433 Степень устойчивости 75 Структурный синтез нелинейных систем управления 272, 273 - Координатно- операторная обратная связь 274 - 276 - Координатно-операторное про- странство 273, 274 -Новые типы обратной связи 276 - 278 -Операторная обратная связь 279 - 281 -Операторно-координатная связь 281 -Произвольный линейный конечно- мерный объект 281, 282 -Структурный синтез систем стаби- лизации 278, 279 Структуры дуальные 318 Схемы структурные системы многомер- ной автоматического регулирования 21, 22
686 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ - передачи угла на расстояние 21 - стабилизации скорости 21 т Теорема Виета-Кардано 46 - Калмана 81, 82 - Котельникова 95 - Ляпунова об устойчивости 196, 197 - Ляпунова о неустойчивости 197 - Попова В. М. 199 - 201 Теория выбросов случайных процессов - Применение 436 - 438 Теория корреляционная стохастических линейных систем 392 - 394 Теория марковских процессов и уравне- ние Понтрягина - Применение 435 - и уравнение Фоккера-Планка-Кол- могорова - Применение 433 - 435 Тор инвариантный 177 Точность дискретных систем - Коэффи- циенты ошибок 100, 101 - Точность при гармонических воздействиях 99, 100 - Точность при полиномиальных воздей- ствиях 100, 101 Точность линейных автоматических сис- тем - Астатизм непрерывных стационар- ных систем 395 -Корреляционная матрица выходных переменных системы 396 - Математическое ожидание вектора фазовых координат 394 - Математическое ожидание выход- ной переменной многомерной сис- темы 396 - Математическое ожидание выход- ной переменной одномерной сис- темы 394, 395 - Связь между коэффициентами оши- бок и параметрами системы 395 - Систематическая ошибка 395, 396 - Точность многомерной и одномер- ной следящей систем 397 Точность нелинейных автоматических систем - Дисперсия выходной перемен- ной 408 - Исследование автоколебаний 412, 413 -Корреляционный анализ автоколе- бательной системы 410, 411 - Математическое ожидание выход- ной переменной 408, 409 - Определение вектора математиче- ского ожидания 407, 408 - Систематическая динамическая ошибка 408 - Совместная гармоническая и стати- ческая линеаризация нелинейно- стей 411, 412 - Точность нелинейной следящей системы 409, 410 Траектория фазовая 167 У Управление дистанционное антенной радиолокатора 18 - нулями и коэффициентами усиле- ния в замкнутой системе 135 - 139 - стационарной линейной системой в установившемся режиме 144 - 146 Управляемость системы 81 Уравнение Веллмана 477, 478, 481 - Ляпунова 481 - Пугачева В. С. для характеристиче- ских функций 381 - рекуррентное для вероятностных моментов 399, 400 - Риккати 143, 144
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 687 - состояния дискретных систем 104 - 108 - Фоккера-Планка-Колмогорова 381 - характеристическое 102 Условие достижимости 111 - замыкания системы 20 - (полной) достижимости 108 - управляемости 111 Устойчивость - Метод исследования час- тотный 199 - 201 - Определение 43, 44 - Постановка задачи 43 - Частотные кри- терии 46 - 50 - автоколебаний 244 - 249 - асимптотическая линейной системы с почти постоянной матрицей 58, 59 - дискретных систем в пространстве состояний 112, 113 - линейных дискретных систем - Ус- ловия 101 - 104 - линейной системы с почти посто- янной матрицей 56-58 - линейных систем с почти постоян- ными параметрами 53 - 59 - Норма матрицы 54 - Случай постоянной матрицы 55, 56 - Фундаментальная матрица решений 54, 55 - многомерных систем 62 Устойчивость нелинейных систем - Ис- следование на основе гармонической линеаризации 201 - 204 - Определение абсолютной устойчивости 201, 202 - Расширение области устойчивости 202 - 204 - нелинейных дискретных систем - Критерий Пури-Дрейка 269, 270 - Основные теоремы 267 - 269 - Усло- вие абсолютной устойчивости 270 - 272 - Условие сжатия 269 - по Ляпунову 195, 196 - робастная 63, 64 - системы - Случаи исследования 44 - системы абсолютная 201 - стохастическая 389, 390 - стохастических систем - Вероятно- стные показатели 386, 387 Устройства корректирующие 67 - Поря- док синтеза в непрерывной системе 119 - 122 - см. также Синтез корректирую- щих устройств в непрерывной системе - Синтез 309 - 312 - Типы 117 - 119 Устройства наблюдающие - Понижение порядка 154 - 156 - Понятие 149 - Принципы построения 149 - 151 - Разде- ление задач управления и наблюдения 156, 157 - в стационарных дискретных линей- ных системах 152 - 154 - стационарных непрерывных линей- ных систем 151, 152 Устройство дифференциал ьпое 19 Ф Фильтрация 494 Фильтрация и Проверка гипотез 516 - 521 Фильтры формирующие 378 Фокус устойчивый 168 Формула интерполяционная 424, 425 Формулы принципиально точные 71 - рекуррентные 71 - Одноразовый счет 72 Функционал стабилизирующий 295 Функции передаточные линейных систем 27-29 - случайные 379 - смещенные решетчатые 85 Функция весовая 33 - весовая замкнутой дискретной сис- темы 86 - весовая приведенной непрерывной части 84, 85 - передаточная дискретной системы 86 - переходная 27
688 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ - распределенного блока частотная 659 - характеристическая 381 X Характеристика дискретной системы ам- плитудно-фазовая частотная 94-96 - амплитудно-фазовая частотная по ошибке 95, 96 - амплитудно-частотная 95, 96 - логарифмическая частотная 96 - 99 - фазо-частотная 95, 96 Характеристика линейной динамической системы 26 - преобразования модуляционная 83 Характеристики статические времени бессрывного управления 435, 436 - частотные логарифмические 38-40 ц Цикл предельный 170 - седловой 176 - устойчивый 174 ч Человек-оператор - Адаптация к машин- ной части ЧМС слежения 620 - 622 Человек-оператор в человеко-машинной системе (ЧМС) управления - Алгорит- мическое описание деятельности эки- пажа 608 - 611 - Влияние эмоциональных состояний на характеристики 612 -Исходные характеристики 612 - Обеспечение условий работы 607 - Основные требования к показателям деятельности в подсистемах ЧМС 613, 614 - Показатели деятельности 612 -Прием, переработка и выдача ин- формации 606 - Характеристики условий обитания 605,606 ЧМС слежения - Классификация по времени адаптации человека-оператора 624 - 627 - Комфортная динамическая структура 622 - 624 - Оптимизация по критериям минимума ошибки слежения 627 - 631 ЧМС управления - Задачи оценки 631, 632 - Инструментальные оценки 632 - Шкалы экспертных оценок 632, 633 - Экспертная оценка напряженности сен- сомоторной деятельности 633 - 637 э Эквивалентность проблем робастной ста- билизации и Н*-оптимизации 325 Экспоненциал матрицы 58 Эксураполятор нулевого порядка 90 Элемент импульсный 83 - 85 - преобразовательный 20 Элементы автоматических систем - Классификация по виду передаточных функций 29 - 33 - Математическое опи- сание 22, 23 - исполнительные 20 - корректирующие 20 - передаточной функции 35 - усилительные 20 - чувствительные 19 Я Явление захватывания 204 - 207 Ядра Винера 298 - 300 - Вольтера 302