Текст
                    в.в. солодовников
В.Н. ПЛОТНИ КОВ
А.В. ЯКОВЛЕВ
АВТОМАТИЧЕСКОГО
УПРАВЛЕНИЯ
ТЕХНИЧЕСКИМИ
СИСТЕМАМИ


в. в. солодовников, в. н. плотников, А. В. ЯКОВЛЕВ ТЕОРИЯ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ ТЕХНИЧЕСКИМИ СИСТЕМАМИ Допущено Учебно-методическим объединением вузов по машино- и приборостроительным специальностям в качестве учебного пособия для студентов машино- и приборостроительных вузов Москва Издательство МГТУ им. Н. Э. Баумана 1993
ББК 32965 С60 УДК 681.5@75.8)) Рецензенты: кафедра автоматики Московского энергетического института; докт. техн. наук, проф. В. В. Семенов (кафедра «Дифференциальные уравнения и оптимальное управление» Московского авиационного института) Солодовников В. В., Плотников В. Н., Яковлев А. В. С60 Теория автоматического управления техническими системами: Учеб. пособие.— М.: Изд-во МГТУ, 1993. —492 с, ил. ISBN 5-7038-03Э1-4 Изложены оснозные задачи и методы теории управления техническими системами, вопросы автоматического регулирования. Рассмотрены теория детерминированного оптимального управления, синтез оптимальных систем при случайных воздействиях, методы идентификации, понятие об адаптивных системах управления, а также сведения об иерархических многоуровневых САУ, об автоматизации проектирования технических систем управления. Для студентов приборо- и машиностроительных вузов. Ил. 304. Табл. 12. Библиогр. 20 назв. „ 1402060000—151 С 095B)-93 2~91 ББК 32965 ISBN 5-7038-0331-4 © В. В. Солодовников, В. Н. Плотников, А. В. Яковлев, 1993
СПИСОК АББРЕВИАТУР И БУКВЕННЫХ ОБОЗНАЧЕНИЙ 1. Аббревиатуры АКОР — аналитическое конструирование регуляторов АО — алгоритмическое обеспечение АПР — автоматизация проектирования АРМ — автоматизированное рабочее место АСАУ — адаптивная система автоматического управления АСУ ТП—автоматизированная система управления технологическим процессом АФЧХ — амплитудно-фазовая частотная характеристика АЦП — аналогово-цифровой преобразователь АЧХ — амплитудная частотная характеристика ДПВ — двойной пиковый вольтметр ИПФ — импульсная переходная функция ИУ — исполнительное устройство ИЭ — импульсный элемент КЛ —¦ ключ (импульсный элемент) КУ — корректирующее устройство ЛАЧХ — логарифмическая амплитудная частотная характеристика ЛО — лингвистическое обеспечение ЛФЧХ — логарифмическая фазовая частотная характеристика ЛЧХ — логарифмическая частотная характеристика МП — микропроцессор МПС — микропроцессорная система МПФ — матричная передаточная функция НГПК — низкочастотный генератор периодических колебаний НМБ — накопитель на магнитном барабане НМД — накопитель на магнитном диске НМЛ — накопитель на магнитной ленте НФ — низкочастотный фазометр-частотомер ОМО—¦ общее математическое обеспечение ООС — отрицательная обратная связь ОПО — общее программное обеспечение ОР — объект регулирования ОС — обратная связь ПИ — пропорционально-интегральный регулятор ПКУ — последовательное корректирующее устройство ПО — программное обеспечение ППП — пакет прикладных программ 1* 3
ПЦ — предельный цикл Р — регулятор PC — реверсивный счетчик РСУ — распределенные системы управления РТК — роботизированный технологический комплекс С — синхронизатор САПР — система автоматизированного проектирования САР — система автоматического регулирования САС — система автоматизированного синтеза САУ — система автоматического управления СИАМ — система автоматизированного моделирования СМО — специальное математическое обеспечение СПО— специальное порграммное обеспечение ТАР — теория автоматического регулирования ТАУ — теория автоматического управления ТАУ ТС — теория автоматического управления техническими системами ТЗ — техническое задание ТЭО — технико-экономическое обоснование ТУ ТС — теория управления техническими системами УВК — управляющий вычислительный комплекс УТС — управление в технических системах ФИ — формирователь импульсов ФЧХ — фазовая частотная характеристика ЦАП — цифроаналоговый преобразователь ЦВМ — цифровая вычислительная машина ЦСУ —цифровая СУ ШИМ — широтно-импульсная модуляция Э — экстраполятор ЭАП — электромеханический автопилот ЭВМ — электронная вычислительная машина ЭЦСП — электрический цифровой следящий привод 2. Обозначения k(Z)—матрица коэффициентов П — знак произведения А — матрица Л, — коэффициент ряда Фурье Л (со) —амплитудная частотная характеристика а0 — амплитуда автоколебаний adj — адьюнкта определителя я(ш)—вещественная часть числителя передаточной функции a) В — матрица fc (со)—мнимая часть числителя передаточной функции УЦа) С — матрица выхода с — абсцисса абсолютной сходимости Со, Си...,Сп — коэффициенты ошибок (постоянные интегрирования)
См, rt — коэффициенты алгоритма Рауса с (со) —вещественная часть знаменателя передаточной функции Y (/со) det — детерминант (определитель) diag — диагональная матрица D (/со) — функция комплексного переменного (кривая D-раз- биения пространства параметров) ^р(/со)—полином знаменателя передаточной функции разомкнутой САР D[K\ — области, соответствующие различным значениям корней К D(k) —полином от А D(p) —полином от р D(z) —детерминант матрицы d(co)—мнимая часть знаменателя передаточной функции У(/со) е — основание натуральных логарифмов Е— показатель цели управления еи е2 — напряжения на входе и выходе корректирующего устройства E(z) —Z-преобразование для ошибки e*{t) —дискретный сигнал ошибки Е*(s) —преобразование Лапласа для сигнала e*{t) Ez{s) —преобразование Лапласа для функции e2(t) extr — экстремум функции F— сила F(x, у, г) — функция трех переменных х, у, г F(x)—функция распределения случайной величины F(s) —преобразование Лапласа для функции /(/) ^(г) —Z-преобразование для функции f(k) f(t)—возмущающее воздействие f{k)—последовательность чисел (аргумент k указывает на последовательность чисел) G(s) —преобразование Лапласа для функции g(t) U* (s)—преобразование Лапласа для сигнала g*(t) на выходе импульсного элемента G(г) —Z-преобразование сигнала g*(t) G* (/со) — спектр дискретного сигнала g{k)—дискретный сигнал на входе линейной системы g(t)—управляющее воздействие g*(t) —последовательность импульсов на выходе ключа (сигнал на выходе импульсного элемента) И (со) —амплитудная частотная характеристика Н{х, гр, и)—функция Гамильтона h(t), h(kt) —переходные характеристики h — запас устойчивости по модулю h(t)—переходная функция hx(t) —переходный процесс, соответствующий единичной частотной характеристике
I — единичная матрица j — мнимая единица j=Y—1 ЦА/а)—эквивалентный комплексный коэффициент усиления нелинейного звена ki — коэффициент усиления линейной части К, k — передаточный коэффициент (коэффициент передачи или усиления) ./@ — коэффициент усиления объекта регулирования (крутизна характеристики) К@—матрица коэффициентов k(k) —взвешенная временная последовательность k\t) —импульсная переходная функция ^ид@ — идеальная импульсная переходная функция ks{t)—импульсная переходная функция экстраполятора L(a>) —логарифмическая амплитудная частотная характеристика L,K(o)) — желаемая логарифмическая амплитудная частотная характеристика Lm #(©) — логарифм модуля характеристики Я (со) М— момент силы Мц — движущий момент на валу двигателя Ма — номинальное значение момента Мс— момент сопротивления на валу электродвигателя m — порядок числителя передаточной функции tn{t) —управляющее случайное воздействие п — порядок знаменателя передаточной функции n(t)—возмущающее случайное воздействие (помеха) Р(/)—симметричная матрица Р, (t),.., Рп (/) — множители Лагранжа P(b/z)—условная плотность распределения вероятности Р — число корней характеристического уравнения, лежащих в правой полуплоскости Р(оз)—вещественная частотная характеристика замкнутой САР Q — положительно определенная матрица Q — критерий самонастройки Q(s) — преобразование Лапласа для функции q(t) Q(a>) — мнимая частотная характеристика замкнутой САР q, q{ — гармонические коэффициенты усиления нелинейного звена средний риск —взаимная корреляционная функция на входе и выходе системы R(s) —преобразование Лапласа для функции r(t) i?r(co)—обобщенная вещественная частотная характеристика R(t) — корреляционная функция #0(^1, *a)—центрированная корреляционная функция #х,Лт) —взаимнокорреляционная функция rang — ранг матрицы
R (z) — Z-преобразование сигнала r(t) S — матрица S(a) —функция спектральной плотности Se(co) —спектральная плотность ошибки Sn,m((o); Sm,n(©)—взаимная спектральная функция плотности 5„; S2; Sa; Sb — системы Sr(co)—обобщенная мнимая частотная характеристика spur — след матрицы sup — верхняя граница 7— время переходного процесса (или постоянная времени) Ттт — минимальное время переходного процесса То — постоянная времени объекта регулирования t — время Ua — напряжение потенциометра итг — напряжение тахогенератора Uv—напряжение на выходе генератора LJ—-заданное множество (матрица) Uopt(t)—оптимальное управление U(s) —изображение входного сигнала u(t) u{t)—вектор управления Ve — сигнал ошибки V, v — линейная скорость V(s)—передаточная функция разомкнутой САР по отношению к возмущающему воздействию У((о) —мнимая часть D(/со) ЗД>тах — максимальное значение ускорения регулируемой величины Wn — подпроблемы приемлемых решений W*{j(s\)—передаточная функция (частотная характеристика) разомкнутой дискретной системы W(s) —передаточная функция разомкнутой САР по отношению к управляющему воздействию ()—передаточная функция элемента обратной связи —передаточная функция последовательного корректирующего устройства Wp(s) —передаточная функция регулятора W0(s)—передаточная функция объекта регулирования (неизменяемой части системы) W(f>(s) —передаточная функция фильтра W(z)—Z-передаточная функция дискретной системы Ws(s)—передаточная функция экстраполятора W(x)—плотность распределения вероятностей случайной величины X — заданное множество X(j®) —частотный спектр входного сигнала X(s) —преобразование Лапласа для x(t) x*(t) —дискретный входной сигнал
Xn*(t)—дискретный сигнал на входе экстраполятора (выхода ЭВМ) *@ —регулируемая переменная *вх — входной сигнал Хъых — выходной сигнал *(оо)—установившееся значение регулируемой величины — начальное значение процесса регулирования @ —оптимальный переходный процесс максимальное отклонение регулируемой величины i) —выходной сигнал с ЭВМ X3(t) —выходной сигнал экстраполятора х—вектор состояния Хв* (s)—преобразование Лапласа для величины xB*(t) на входе X0(s)—преобразование Лапласа для величины ха на выходе экстрополятора К(/оз) —частотная характеристика САР Y (s)—передаточная функция замкнутой САР по отношению к возмущающему воздействию Y(z) —Z-преобразованис для у (к) y{k) —дискретный сигнал на выходе системы y(t)—выходная переменная Y — выходной вектор Z(s)—передаточная функция параллельного корректирующего устройства а. — коэффициенты передаточной функции САР у — запас устойчивости САР по фазе А— допустимая ошибка регулируемой величины А* — определитель Гурвица &M(t)—разность отклонений моментов (движущего и сопротивления) At — промежуток времени 60{k) —дельта-последовательность Кронексра б—¦ поправки к асимптотическим ЛАЧХ 6@ —дельта-функция E(s)—преобразование Лапласа для сигнала ошибки е@ 5— коэффициент демпфирования дифференцирующего звена 2-го порядка 0(ю)—логарифмическая фазовая частотная характеристика О — угол тангажа Фи @ —программное значение угла тангажа к — коэффициент наклона вещественной частотной характеристики Xt — корни характеристического уравнения v — порядок астатизма САР ?к — коэффициент демпфирования колебательного звена р(т) —нормированная корреляционная функция ах2 — дисперсия случайного процесса о2 — шум квантования на выходе 8
du2 — шум квантования на входе О — величина перерегулирования, % %—'Постоянная времени дифференцирующего звена 1-го порядка td — постоянная времени дифференцирующего звена 2-го пп- рядка •to — постоянное запаздывание тг; Т; Ткв — такт квантования (дискретизации) Ф(я)—матричная передаточная функция (преобразование Лапласа для матрицы <р@) Ф(г)—Z-передаточная функция системы с обратной связью и ЭВМ в контуре управления Ф(Я) —-расширенная матрица перехода Ф(/'со) —частотная характеристика замкнутой САР Ф(/)—переходная матрица 0(s)—передаточная функция замкнутой САР по отношению к управляющему воздействию (преобразование Лапласа для ф@) Фе(в) —передаточная функция ошибки Ф(в)—матричная передаточная функция (преобразование Лапласа для матрицы ф@) <р@ — переходная, или фундаментальная, матрица Ф.(/'©) —вспомогательная функция ф(со)—фазовая частотная характеристика замкнутой САР ty(s) —преобразование Лапласа для i|)(tf) ш — угловая скорость (угловая частота) шн — номинальная угловая скорость р — частота среза ЛАЧХ — сопрягающая частота ЛАЧХ колебательного звена wcpTffla —частота среза, соответствующая минимальному времени переходного процесса (Оср opt — частота среза, соответствующая оптимальному переходному процессу (оо — частота автоколебаний
ПРЕДИСЛОВИЕ Учебное пособие посвящено теории управления техническими системами — технологическими машинами и процессами, энергетическими установками (включая ядерные реакторы), движущимися объектами различного назначения и др. Теория автоматического управления (ТАУ) техническими системами представляет собой дальнейшее развитие теории автоматического регулирования (ТАР). Предмет ТАР — системы автоматического регулирования (САР) —достаточно полно определен в соответствующей технической и учебной литературе. ТАР изучает системы регулирования, осуществляющие лишь «отработку» входных управляющих воздействий, в предмет ТАР не входят вопросы формирования этих воздействий. Объектом ТАУ являются системы автоматического управления (САУ), функциональное назначение которых заключается: во-первых, в формировании управляющих воздействий на основе соответствующих алгоритмов и исходя из цели управления (например, оптимальных управлений, техническая реализация которых возможна благодаря использованию цифровых вычислительных средств); во-вторых, в «отработке» этих воздействий на требуемом уровне выходной мощности и с необходимой точностью при помощи САР в условиях действия возмущений и помех. В основе теории автоматического управления техническими системами лежат многие понятия, принципы и методы ТАР. Но отличать ТАР от ТАУ необходимо, и вряд ли можно считать оправданным то, что термин ТАР иногда подменяется в научно-технической литературе термином ТАУ. На наш взгляд, оба термина имеют право на самостоятельное существование, так как отражают различную сущность. Материал пособия базируется в значительной мере на книге: Солодовников В. В., Плотников В. Н., Яковлев А. В. «Основы теории и элементы систем автоматического регулирования» (М.: Машиностроение, 1985. 536 с), — переработанной с учетом достижений научно-технического прогресса за последние годы. Показано становление и развитие ТАУ на основе ТАР, теории информации, информатики, кибернетики и вычислительной техники. Изложение основного материала учебного пособия начнается с понятий и определений теории автоматического регулирования, существенных для дальнейшего рассмотрения ТАУ. Далее приведены методы математического описания САР 10
в переменных вход-выход и в переменных состояния; дан анализ устойчивости линейных непрерывных систем; рассмотрен частотный метод анализа качества регулирования и синтеза САР; перечислены элементы анализа нелинейных систем. Кроме того, в пособии даны основы ТАУ: теория детерминированного оптимального управления как одномерных, так и многомерных непрерывных и дискретных систем, основы синтеза оптимальных систем при случайных воздействиях, методы описания дискретных и дискретно-непрерывных систем; методы идентификации, понятие об адаптивных системах управления, основные сведения об иерархических многоуровневых САУ. Изложены вопросы анализа .и синтеза дискретных и цифровых САУ, включая цифровое управление с помощью микроЭВМ., а также методы проектирования и автоматизации проектирования технических систем управления. Среди отечественных изданий, посвященных перечисленным ранее вопросам, нет книг, в которых в сжатой и доступной форме изложена теория автоматического управления техническими системами (ТАУ ТС) на основании принятого здесь подхода. Данное учебное пособие охватывает только собственно теорию управления техническими системами, так как технические средства САР и САУ являются предметом специальной книги. Настоящее издание предназначено для студентов технических вузов, изучающих курс «Управление в технических системах» (УТС) в рамках учебных планов по различным специальностям, кроме специальности «Автоматика и управление в технических системах». Студентам, специализирующимся по системам автоматического и автоматизированного управления, необходим больший объем научно-технической информации, чем в данной книге. Курс «Управление в технических системах» является фундаментальным для целого ряда технических вузов. Для изучения этой дисциплины помимо обычного курса высшей математики необходимо знать элементы высшей алгебры, основы теории матриц и случайных процессов. Изучив курс УТС, студенты будут обладать: знаниями в области принципов построения математических моделей, анализа и синтеза систем (а также подсистем) автоматического управления различных классов при действии возмущений со стороны внешней среды; умением взаимодействовать со специалистами по системам управления в процессе разработки образцов новой техники и новых технологий; сведениями и навыками, необходимыми для формирования обоснованного технического задания на динамическое проектирование системы управления соответствующим технологическим процессом. Книга может быть рекомендована также инженерам, занимающимся проектированием систем управления техническими объектами и технологическими процессами, как содержащая новые подходы в этой области. Доктор техн. наук, проф. В. В. Солодовников 11
ВВЕДЕНИЕ Теория автоматического управления техническими системами (ТАУ ТС) охватывает идеи, принципы и методы информатики, а также основы теории автоматического регулирования и управления в области техники. ТАУ ТС как прикладная научная дисциплина имеет свою историю. XVII—XIX века были начальным периодом в развитии машиностроения и машинных технологий, когда человек управлял энергетическими машинами и ходом технологических процессов на основе своего опыта и интуиции. Этот период можно еще условно назвать и «веком измерений». Он характеризовался тем, что управление машинами и процессами осуществлялось при помощи мускульной силы человека, ориентировавшегося на показания немногочисленных в то время приборов, являвшихся придатками машин. По мере развития технического процесса такой элементарный способ управления оказался неэффективным. Появились первые системы автоматического регулирования, основанные на принципе отрицательной обратной связи. К ним следует отнести такие, например, как системы, регулирующие уровень воды в паровом котле (изобретатель И. И. Ползунов, 1765) и стабилизирующие частоту вращения вала паровой машины при помощи центробежного регулятора (Д. Уатт, 1768). Эти изобретения положили начало «веку автоматики», когда устранялась необходимость применения мускульной силы человека для управления техническими объектами и процессами. Параллельно с техническими средствами автоматики развивалась и наука об автоматике. Истоки формирования теории автоматического регулирования как начальной научной основы управления в технических системах связаны с 30—90-ми годами XIX и. Так, проф. Д. С. Чижов опубликовал курс теории регуляторов (СПб., 1838). Ястржемский Н. Ф. в курсе лекций по теоретической механике изложил основы выбора параметров регуляторов непрямого действия (СПб., 1846). В 1872 г. И. А. Вышнеград- ский сделал сообщение о своей работе по теории регуляторов, которая была опубликована под названием «Об общей теории регуляторов» (Париж, 1876). Первая работа по вопросам нелинейной ТАР —- «О регуляторах непрямого действия» также принадлежит И. А. Вышнеградскому (СПб., 1878). Профессор Московского Высшего императорского учили- 12
ща — Н. Е. Жуковский разработал теорию регулирования хода машин (М., 1909). Несколько раньше вышла в свет работа А. М. Ляпунова «Об устойчивости движения» (Харьков, 1892), которая явилась в то время математическим обоснованием всей теории систем автоматического регулирования (САР). Роль других отечественных ученых в развитии теории автоматического регулирования достаточно известна1. Что касается иностранных ученых, то их работы в этой области довольно полно представлены, например, в одном из справочников2. Теория автоматического управления техническими системами начала развиваться несколько позже3. Научной базой ТАУ являются прежде всего теории автоматического регулирования и информации, а также информатика и техническая кибернетика. Управление в принятом нами смысле отличается от регулирования тем, что его задачей является формирование на основе цели управления и имеющейся информации управляющего сигнала (или уставки), отрабатываемого автоматическими регуляторами (или следящими системами) на требуемом уровне мощности. Другими словами, автоматические регуляторы преобразуют уставки в управляющие воздействия на объект, входящий в систему, так, чтобы этот объект реализовал заданную цель управления. Таким образом, ТАР представляет собой лишь часть или раздел более общей теории управления. В связи с этим более существенным стал вопрос о различии между терминами ТАУ и ТАР, так как во многих научных публикациях дается неточное их определение. Основной задачей ТАР является воспроизведение (обработка) с наименьшей погрешностью некоторого произвольного входного сигнала, причем цель регулирования состоит в сведении к минимуму функционала от ошибки между входным и выходным воздействиями. Главное отличие ТАУ от ТАР состоит в том, что в ТАУ решается задача верхнего уровня, на котором формируется входное для автоматического регулятора управляющее воздействие (сигнал). Эта задача, удовлетворяющая некоторым техническим ограничениям, сводится к нахождению экстремума сложного функционала эффективности, в силу чего решается с помощью мощной вычислительной техники. Если САУ являются верхним уровнем в иерархии управления объектами, то САР играют роль нижнего уровня, на котором выполняется коррекция отклонений траектории движения, 1 Техническая кибернетика: Теория автомат, регулирования: В 3 кн. / Под ред. В. В. Солодовникова. Кн. 1. М.: Машиностроение. 1967. 768 с. (Сер. инженер, монографий). 2 См.: Справочник по теории автоматического управления / Под ред. А. А. Красовского. М.: Наука. 1987. 3 См.: Основы автоматического управления: Автомат, регуляторы и следящие системы / Под ред. В. В. Солодовникова. Т. 3. М.: Машгиз, 1963. 13
соответствующей управляющему сигналу, из-за неопределенности описания объекта регулирования, а также действия случайных возмущений и помех. В общем случае, характеризуя устойчивость САР, говорят, что система является «грубой», если она защищена от таких неопределенностей в объекте, которые наверняка будут иметь место в любой реальной ситуации. В настоящее время в стадии интенсивного развития находятся теория и техника иерархических многоуровневых систем управления технологическими процессами и объектами. Теория такого рода систем является дальнейшим развитием ТАУ. Однако теория и техника систем автоматического регулирования, непосредственно связанные с процессами материального производства, по-прежнему являются базой для построения САУ. Основные понятия, принципы, задачи и методы ТАР и ТАУ сохраняют свою актуальность и получают развитие в современной теории, а также в подходах к проектированию сложных автоматизированных систем. Новым в этих подходах является существенное возрастание роли информации, а также компьютеризации процессов ее обработки, так как любая система управления выполняет поставленную перед ней цель при помощи сбора, передачи, обработки и использования информации на основе принципа обратной связи. 14
I. ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ ТЕОРИИ ИНФОРМАЦИИ, ИНФОРМАТИКИ И КИБЕРНЕТИКИ В этом разделе, кроме указанных в заголовке, даны и основные понятия теории автоматического регулирования и управления. Установлены связи между этими понятиями, являющимися фундаментальными в теории автоматического управ- лени техническими системами. 1.1. Информация — одно из основных понятий кибернетики Общей чертой процессов управления вне зависимости от того, к какой области знаний они относятся (техническая, биологическая, экономическая, социальная и Др.). является их информационный характер. Действительно, любой процесс управления для достижения поставленной цели требует сбора, передачи, переработки и использования информации о его внешних и внутренних условиях для приспособления к этим условиям и эффективного воздействия на них. Получить информацию и действовать в соответствии с ней—существенная функция системы управления от простой до наиболее сложной. Под информацией в широком смысле понимают те сведения об окружающем мире, которые получены в результате взаимодействия с ним, адаптации (приспособления) к нему и изменения его в процессе этой адаптации. Сущность управления на основе информации заключается именно в том, что целенаправленное движение и действие значительных инерционных масс, а также передача и преобразование больших количеств энергии регулируются при помощи незначительных масс и небольших количеств энергии. Отсюда Источник информации Передатчик информации. \ Напал связи. i Источник помех Приемник информации. i Объект регулирования Рис. 1.1. Схема системы передачи информации 15
ясно, что в теории информации энергетическая сущность процессов отступает на второй план по отношению к информационной. Информация передается при помощи сигналов, реализованных в изменениях той или иной физической переменной, характеризующей последовательность некоторых событий. Количество переданной информации и тем более ее эффект не определяются количеством энергии, необходимым для передачи информации. Процесс передачи информации в системах связи происходит следующим образом (рис. 1.1). Источник информации формирует сообщение. Сообщение, содержащее в себе информацию, состоит из символов (букв., цифр, математических знаков и т. д.). Таким образом, сообщение представляет некоторую упорядоченную последовательность символов, каждый из которых выбирается системой из всей имеющейся совокупности. Сообщение поступает на вход чувствительного элемента датчика (или передатчика информации). Датчик, в свою очередь, на основе того или иного кода преобразует данное сообщение в сигнал. Сигнал поступает в канал связи и затем на вход приемника информации, где происходит обратное преобразование сигнала в сообщение, или, как говорят, декодирование сигнала. Сообщение воспринимается получателем (объектом регулирования или управления). Во время передачи по каналу связи на сигнал неизбежно налагаются помехи, которые в большей или меньшей степени искажают сигнал. Процесс формирования сообщения рассматривается как вероятностный, представляющий собой последовательность выборок из некоторой совокупности элементарных символов, причем выбранная совокупность и образует сообщение. Роль вероятности заключается в том, что выбор последующих символов на любой стадии процесса зависит в вероятностном смысле от предыдущих выборов. В свою очередь, каждое в действительности передаваемое сообщение есть результат выбора из всей возможной совокупности сообщений одного из них. Чем выше степень непредсказуемости, чем больше свобода выбора при образовании сообщения, тем большее количество информации оно содержит. Рассмотрим передачу телевизионного изображения какого-либо предмета, когда сообщение характеризуется распределением яркости по строкам изображения. Если имеется лишь две ступени яркости, то количество информации о предмете мало; если же число ступеней яркости велико, то велико и количество получаемой о нем информации. Следовательно, каждый элемент сообщения содержит тем большее количество информации, чем больше общее число элементов, из которых он может быть выбран. При проектировании системы управления инженер для правильного воспроизведения сообщения измеряет содержание информации в нем вероятностью его появления или, если можно так выразиться, его «неожиданностью». Поэтому, если требуется передать «белый шум», т. е. сигнал, изменяющийся абсолютно случайным, непредсказуемым образом, то к системе, передающей информацию, будут предъявляться наиболее жесткие требования. Передача и прием информации возможны лишь при удовлетворении следующих трех условий: сообщения должны представлять собой случайную, непредсказуемую последовательность символов; источник информации должен осуществлять селективные операции над символами, из которых образуются сообщения; символы должны иметь один и тот же смысл, определяемый не только для источника, но и для приемника информации. 16
Перечисленные условия можно пояснить следующим образом. Если на приемном конце заранее известно содержание сообщения, то никакой информации при его приеме не будет получено. Таким образом, в основе понятия информации лежит предположение о невозможности по крайней мере однозначности восприятия сообщений, которые будут приняты в будущем на основании сообщений, принятых в настоящем. Но полное незнание условий также исключает возможность передачи информации, так как. для передатчика и приемника должен существовать общий язык или код. Действительно, если, например, читатель не знает языка, на котором написана книга, то она не может сообщить ему никакой информации, как бы ни было важно и интересно ее содержание. 1.2. Информатика и вычислительная техника В современных условиях необходимость передачи и переработки непрерывно увеличивающихся массивов разнообразной информации вызвала к жизни новую отрасль науки и техники ¦— информатику. Этот термин появился несколько позже, чем «кибернетика», но непосредственно связан с последним. В предмет информатики входят вопросы передачи сообщений или сигналов по линиям связи, обмена и обработки научно- технической информации, организационного управления и планирования; вопросы медицины, образования, лингвистики, искусства, музыки, документалистики, сферы услуг, охраны окружающей среды и т. д. Широта этой научной дисциплины затрудняет однозначное, исчерпывающее определение ее предмета. Наиболее часто информатику определяют как отрасль науки, изучающую структуру и общие свойства научной и другой информации, а также вопросы се сбора, хранения, поиска, обработки, преобразования, распространения и использования в различных сферах человеческой деятельности. Информатика представляет собой новую дисциплину, сформировавшуюся на стыке ряда областей науки и техники (теории информации, кибернетики, вычислительной математики, теории вычислительных систем, бионики и др.). Широкое применение информатика получила в связи с развитием вычислительной техники. Главным элементом, ядром информатики является весь комплекс воздействий вычислительной техники на среду применения. Использование информатики непосредственно зависит от алгоритмических, программных и технических средств. Обычно под информатикой понимают всю технологическую деятельность, связанную с использованием вычислительной техники (математическое и имитационное моделирование, алгоритмизацию и программирование разнообразных процессов, информационное обслуживание и т. д.). Сущность информатики заключается в триединстве математической модели, алгоритма, программы, что позволяет выделить главные проблемы, которые необходимо решить при раз- 2—3591 17
работке новых информационных систем. Это проблемы создания: моделей, позволяющих использовать строгие научные методы преобразования информации; алгоритмов, обеспечивающих применение современных численных методов к решению комплекса информационных задач; программ (для ЭВМ), реализующих новую информационную технологию в той или иной предметной области. Особенно перспективным является проникновение идей информатики в неформализуемые области деятельности человека, т. е. недоступные для точных количественных методов (например, верхние уровни управления многоуровневыми техническими системами, системы искусственного интеллекта). Существенные революционные изменения вносит информатика также в медицину, биологию, лингвистику, прогнозирование событий и т. д. 1.3. Кибернетика и управление Термин «кибернетика» появился раньше термина «информатика». Общим как для кибернетики, так и для информатики является то, что в них рассматриваются информационные процессы, которые используются в кибернетике для целей управления, а в информатике — для более широкого круга процессов и явлений. Так что в современном понимании информатика является более общей отраслью знаний, чем кибернетика [4]. Кибернетика, так же как теория информации и информатика, существенным образом связана с понятиями вероятности и случайных процессов. Воздействия, приложенные к системам управления как полезные, так и вредные (помехи), в общем случае являются не детерминированными, а случайными функциями времени, которые невозможно заранее предугадать. Поэтому кибернетика (как и теория информации) является теорией систем, находящихся под влиянием случайных управляющих и возмущающих воздействий. Под управляющим воздействием здесь понимается сигнал, который необходимо передать от источника информации к объекту, а под возмущающим — различные типы возмущений и помех, влияющих на точность этой передачи. Необходимость введения статистических методов в информатику и кибернетику следует из того, что информационные системы, а также системы управления должны удовлетворять предъявляемым к ним требованиям не только для одного определенного или детерминированного сигнала, но и для совокупности сигналов, которая может быть охарактеризована лишь при помощи методов математической статистики. Кроме того, часто возникает необходимость учитывать случайные изменения параметров системы. Непредсказуемость реализаций управляющих и возмущаю-
щих воздействий, т. е. их информационная сущность, привела к необходимости введения в системы управления отрицательной обратной связи, являющейся непременным атрибутом структуры систем автоматического управления, позволяющим уменьшить влияние возмущений и помех на точность воспроизведения управляющего сигнала. Таким образом, кардинальным в процессах управления является принцип отрицательной обратной связи (ООС). Сущность его заключается в том, что для достижения цели управления, поставленной перед процессом, объектом или системой, необходимо не только формирование управляющих воздействий, но и получение достоверной информации о протекании процесса на выходе САУ. Техническая реализация принципа ООС сводится к разработке каналов прямой и обратной связи между управляющей системой и объектом, что существенно повышает эффективность управления при наличии возмущающих воздействий и помех (рис. 1.2). Канал примой связи Помехи, Цель управления Управляющее i воздействие Система об- 'afiorntru и. передачи информации Возмущаю щее воздействие пдъемт Вы хо в сие/пемт Ошибка 1Шум измерений Источник или датчик информации. Нйнал обратной с8/>зи Рис. 1.2. Обобщенная схема САУ Процессы управления — это динамические процессы, протекающие в системах, в которых потоки информации, а также решения и действия для достижения цели управления структурно реализуются в виде замкнутых контуров, т. е. систем с обратной связью. В настоящее время понятие обратной связи стало универсальным, характеризующим все природные и технические процессы, связанные в том числе и с деятельностью человека. Так, например, экология является проявлением принципа обратной связи между человеком и природой. До недавнего времени человек использовал природные ресурсы, не заботясь об обратной реакции, т. е. осуществлял воздействие на природу по разомкнутому циклу. Сейчас он вынужден учитывать эту реакцию и в управлении ею осуществлять принцип обратной связи (рис. 1.3). 2*
Принцип обратной связи проявляется и во взаимодействии человека с им же создаваемой техникой: последняя приобретает возможность влияния на человека. Так, в начале технической революции ремесленный труд в значите 1ыюй мерс был вытеснен машинами и их системами (например, конвейерами). В дальнейшем в связи со стремительным развитием вычислительной техники возможность такого обратного воздействия на человека в области его умственной деятельности существенно возросла. Влияние современной техники на социальные, трудовые, психологические и физиологические условия деятельности человечества должно быть управляемым (рис. 1.4). Человек Природа Канал информационной обратной связи Рис. 1.3. Обратная связь в системе человек — природя Человек Техника Канал информационной обратной связи. Рис. 1.4. Обратная связь в системе человек — техника Насколько важно уметь управлять научно-техническим прогрессом, особенно наглядно показывает пример с развитием ядерной энергетики. Ведь, казалось бы, АЭС—величайшее достижение науки. Однако в случае аварии на ней (например, из-за ненадежности технических средств или нарушения условий эксплуатации) может последовать гибель людей и даже угроза для самой жизни на нашей планете. Поэтому система человек—машина или проблема человек—техника приобретают в настоящее время глобальное значение. Наиболее возможны два пути развития техники: 1) разделение труда между человеком и машиной осуществляется «оптимальным» способом в соответствии с их специфическими особенностями и возможностями; 2) по мере прогресса в областях формализации и алгоритмизации все процессы управления передаются машине. Первый путь является более эффективным, дешеиым, устанавливающим гармонию между человеком и машиной. Второй путь с течением времени можег сделаться опасным, так как он может привести к такому положению вещей когда творческие способности человека начнут ослабевать и уже окажется невозможным вернуться на первый путь. Поэтому глубокое понимание и знание принципов и идей теории управления имеют особо важное значение. 20
1.4. Цель управления в технических системах Основной принцип управления в кибернетике — принцип ООС — универсален, но специфика его применения существенно зависит от управляемого процесса, изучение которого является предметом соответствующих наук, ставящих цели управления (например, технических, экономических, биологических, общественных и т. д.). Необходимо подчеркнуть важность и определяющую роль четкой формулировки цели управления. Нет цели — нет управления! Например, в зависимости от того, какой у предприятия план — по валу или по номенклатуре изделий, будут получены совершенно разные конечные результаты. Цель управления процессом или объектом — конечный технический или экономический результат, который может быть достигнут системой управления на определенном временном интервале ее нормального функционирования1. Цель управления формулируют не специалисты по кибернетике, а, например, технологи, инженеры-аэродинамики, экономисты, биологи, т. е. специалисты в той области техники, в которой необходимо применить управление. Основная задача специалистов по управлению состоит в том, чтобы создать систему для сбора информации, необходимой для осуществления цели управления, передачи, представления или преобразования ее в удобную форму, переработки и, наконец, принятия решения о том, как использовать эту информацию, чтобы обеспечить выполнение цели объектом управления. Техническое решение этой задачи связано с применением различных аппаратных и программных средств. Для того чтобы уяснить отличие информационных систем от систем управления, необходимо подчеркнуть, что в первом случае качественное воспроизведение информационных сигналов и подавление помех являются основной целью, тогда как во втором — промежуточной, т. е. для принятия или выработки решений, связанных с управлением объектом, имеющим самые различные свойства и цели управления. Кроме того, к определении термина «информатика» не отражена концепция обратной связи, которая требует для своей технической реализации детального изучения того объекта, на вход которого передается информация. Таким образом, при переходе к понятию управления определение информатики необходимо несколько детализировать. В определении информатики в явной форме не отражено следующее: цель обработки информации, состоящая в принятии и выработке решений для управления объектом на основе принципа обратной связи; анализ качества достижения цели и др. Управление — это единство цели, модели объекта, алгоритма, программы и анализа результатов достижения цели. 1 Математическая формулировка цели управления будет дана далее. 21
Основным методом исследования и анализа информационных процессов управления п кибернетике является метод их алгоритмизации. Он заключается и том, что любой информационный процесс управления рассматривается в виде некоторой последовательности связанных друг с другом и причинно обусловленных математических и логических операций, представляющих собой алгоритм процесса. Решая задачу изучения общих принципов и законов эффективного управления объектами различной природы, кибернетика стремится установить алгоритмический изоморфизм, т. е. структурное, логическое и количественное сходство между процессами управления, протекающими в различных системах управления. С этой точки зрения предмет кибернетики заключается в анализе, синтезе и реализации алгоритмов управления, как уже имеющихся в природе и технике, так и необходимых для приспособления к ней и эффективного воздействия на нее при достижении определенных целей. Алгоритмический подход позволяет кибернетике на основе точного количественного определения понятия информации применять для исследования информационных процессов управления методы точных наук и современный математический аппарат вне зависимости от того, к какой категории явлений они относятся. Итак, учитывая все сказанное, можно дать следующее общее определение. Кибернетика — это наука об общих принципах и законах управления процессами и объектами различной физической природы. Основным объектом исследования являются системы с обратной связью, цель управления которыми достигается на основе получения, передачи, переработки и использования информации. Техническая кибернетика является составной частью, ветвью общей кибернетики. Предметная область технической кибернетики — управление разнообразными технологическими процессами и техническими объектами. Контрольные вопросы 1. Что такое информация? В чем состоит информационная сущность процесса управления? 2. Определите вероятностный аспект понятия информации. 3. При выполнении каких условий возможны передача и прием информации? 4. Что такое информатика и информационная система? Что такое общая и техническая кибернетика? 5. Какая связь между кибернетикой и теорией управления? 6. В чем заключается принцип обратной связи? Что такое управление по разомкнутому и замкнутому циклам? 7. Дайте определение цели управления в технических системах. 2. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИЙ АВТОМАТИЧЕСКОГО РЕГУЛИРОВАНИЯ И АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Теория автоматического регулирования появилась и достигла довольно высокого уровня гораздо раньше, чем теория автоматического управления. Становление и развитие ТАУ потре- 22
бовало использования современных достижений теории информации, информатики, вычислительной техники, кратко изложенных в разд. 1. Однако основные понятия, принципы и методы ТАУ сформировались в ТАР. Поэтому здесь сначала даются терминология, классификация САР, потом формулируется проблема регулирования, а затем более сложная проблема — управления [19]. 2.1. Принципы и основы построения систем автоматического регулирования Рассмотрим ряд технологических процессов, которые характеризуются тем, что в течение продолжительного времени необходимо поддерживать постоянными или изменять по определенному закону некоторые физические величины на выходе соответствующего управляемого объекта (машины, установки, агрегата и т. д.). Эти величины называют регулируемыми переменными (например, частоту вращения вала турбины, температуру и давление на выходе технологической установки, напряжение на клеммах генератора, координаты движущегося объекта и т. д.). Для технической реализации таких процессов используют специальные устройства, называемые автоматическими регуляторами, которые на основании измерения регулируемых переменных должны оказывать соответствующие управляющие воздействия на объект регулирования. Целенаправленное изменение поведения объекта во времени может осуществляться по принципу разомкнутого или замкнутого циклов. Рассмотрим два варианта системы автоматического регулирования частоты вращения вала нагруженного электродвигателя (см. рис. 2.1). Рис. 2.1. Схемы САР: а — система без обратной связи (разомкчутый цикл): б —с обратной связью (замкнутый цикл)
Система разомкнутого цикла. В системах как разомкнутого (рис. 2.1, а), так и замкнутого цикла (рис. 2.1,6) входным управляющим воздействием является перемещение токосъемно- го элемента (движка 2) потенциометра /. Последний преобразует это перемещение в напряжение на входе усилителя 3, что приводит к изменению тока в обмотке якоря электродвигателя 4 — исполнительного элемента системы. Это в свою очередь вызовет соответствующее изменение угловой скорости вала электродвигателя (Эдв). При идеальных условиях частота вращения вала в установившемся режиме будет однозначно соответствовать заданной уставке — положению движка потенциометра. Частоту вращения вала можно контролировать при помощи тахогенератора 5 и вольтметра 6, но результаты этого контроля не используют в процессе регулирования. Рассмотренная схема не имеет замкнутого пути обхода, т. е. является разомкнутой. Для установления соответствия между входом (положением движка 2) и выходом (частотой вращения) система должна быть тщательно отградуирована. Конкретная градуировочная кривая справедлива только при постоянном значении механической нагрузки на валу электродвигателя. При изменении этой нагрузки градуировка нарушается. Кроме того, при износе и старении элементов системы, при колебаниях температуры и т. д. эта градуировка также нарушается. Поэтому системы, работающие по принципу разомкнутого цикла, не могут обеспечить высокую точность регулирования. В них не измеряется результат, вызываемый управляющим воздействием, т. е. перемещением движка, и не осуществляются действия, влияющие на этот результат, с тем чтобы он соответствовал требуемому. Система замкнутого цикла, принцип обратной связи. Эта система (см. рис. 2.1,6) отличается от системы разомкнутого цикла тем, что выходное напряжение тахогенератора 5 сравнивается с уставкой на входе, т. е. с напряжением 0п, которое снимается с потенциометра 1. Если угловая скорость электродвигателя отличается от заданной, то возникает сигнал ошибки Д?/=[/„—Un. Усиление сигнала AU но мощности до уровня, необходимого для нормальной работы Эдв, осуществляет усилитель 3. Электродвигатель с встроенным на его валу тахо- генератором отрабатывает сигнал ошибки до определенного значения, которое в установившемся режиме и задает частоту вращения вала нагрузки при определенном значении Un. Значение сигнала ошибки тем меньше, чем больше коэффициент усиления усилителя по напряжению. Отметим, что модуль и знак сигнала ошибки определяют соответственно угловую скорость и направление вращения вала Эдв, т. е. вала механической нагрузки. Принцип управления, основанный на использовании ООС, характеризуется тем, что не требует градуировки и сохра- 24
пяст высокую точность и в тех случаях, когда нагрузка и параметры элементов системы со временем изменяют свои значения. В этом заключается основное достоинство систем с обратной связью. Б некоторых случаях оба принципа управления (по разомкнутому и замкнутому циклам) используют в сочетании друг с другом. В системах с замкнутым циклом или обратной связью точность регулирования, т. е. точность поддержания требуемой функциональной связи (в частности, пропорциональной) между входом и выходом, в основном зависит от точности, с которой проводят измерение и сравнение требуемого и действительного значений регулируемой переменной. Системой автоматического регулирования называется активная1 динамическая система, стремящаяся сохранять в допустимых пределах отклонение между требуемым и действительным изменениями регулируемой переменной при помощи их сравнения на основе принципа обратной связи (замкнутого цикла) и использования получающегося при этом сигнала для управления источником энергии. САР называются системы с обратной связью (ОС). Это объясняется тем, что в них имеется не только прямая связь между входом (входным управляющим воздействием, или управлением) и выходом (регулируемой переменной), но и обратная между выходом и входом, служащая для сравнения этих величин. Изменения регулируемых величин вызывают не только управляющие, но и возмущающие воздействия, приложенные в соответствующих точках системы автоматического регулирования. Управление осуществляет целенаправленное изменение регулируемых переменных. Возмущение стремится нарушить требуемую функциональную связь между управляющим воздействием и регулируемой переменной. Например, на рис. 2.1,6 возмущающими воздействиями могут быть момент нагрузки Мп, приложенный к валу электродвигателя, или изменение напряжения UB в обмотке возбуждения последнего. САР должна вести себя по отношению к управляющему и возмущающему воздействиям различным образом. Необходимо, чтобы система осуществляла управление с наименьшими погрешностями, компенсируя действие возмущений на регулируемые переменные. f(t) Цепь обратной связи Рис. 2.2. Схема САР с одной регулируемой переменной 1 Активной является САР, содержащая источник (источники) энергии. 25
САР с одной регулируемой величиной показана на рис. 2.2. Цифрой / обозначено устройство для сравнения управляющего воздействия с регулируемой переменной; цифрой 2 — объект и регулятор. Отметим, что если управляющее воздействие g{t) может быть приложено только к сравнивающему устройству системы, то возмущающее воздействие /(/) может быть приложено к любой точке САР. Внешние воздействия на систему приводят к тому, что требуемые и действительные значения регулируемой величины отличаются друг от друга. Разность между необходимым и действительным значением регулируемой величины является ошибкой системы автоматического регулирования. Отклонением регулируемой величины называют разность между значением регулируемой величины в данный момент времени и некоторым фиксированным ее значением, принятым за номинальное или за начало отсчета (рис. 2.3, а). Рис. 2.3. Основные переменные (воздействия и сигналы) в САР: g(O и fit)—управляющее и возмущающее воздействия; г (<) — рассогласование или сигнал ошибки; x.(t) — регулируемая переменная В то время как отклонение x(t) регулируемой величины при неограниченно возрастающих управляющих воздействиях является также -неограниченно возрастающей функцией времени, ошибка е(^) остается ограниченной (рис. 2.3, б). Воздействие, приложенное к сравнивающему элементу системы регулирования, называют входным сигналом, или сигналом на входе системы автоматического регулирования. При введении отрицательной обратной связи система слабо реагирует на возмущающие воздействия и подчиняется главным образом управляющему воздействию, т. е. замкнутая система регулирования по существу представляет собой фильтр, который достаточно точно воспроизводит управляющее воздействие и подавляет возмущающее. Сигнал, который поступает с выхода системы на ее вход, называют сигналом главной обратной связи, а разность между 26
входным сигналом и сигналом главной обратной связи — сигналом ошибки. САР являются системами направленного действия. Это означает, что выходной сигнал последующего элемента может оказать влияние на формирование ошибки на выходе элемента сравнения только через обратную связь. Итак, САР — это замкнутая активная динамическая система направленного действия, преобразующая уставку на ее входе в регулирующее воздействие, непосредственно прикладываемое к объекту управления. 2.2. Классификация САР. Основные функциональные устройства САР В зависимости от характера изменения входного (задающего) управляющего воздействия g(t) CAP могут быть подразделены на три основных типа: 1) системы автоматической стабилизации (или собственно системы автоматического регулирования). В них управляющие воздействия представляют собой заданные постоянные величины ( уставки); 2) системы программного регулирования. В них управляющие воздействия являются известными функциями времени (изменяются по программе); 3) следящие системы. В них задающие воздействия представляют собой заранее неизвестные функции времени. Если в САР, показанной на рис. 2.1,6, входной сигнал сохраняет постоянное значение (движок потенциометра неподвижен), то она представляет систему автоматической стабилизации угловой скорости электродвигателя. Постоянное значение, которое имеет входной сигнал, называется настройкой (уставкой) автоматического регулятора. Уставке соответствует требуемое значение регулируемой величины объекта. Если движок потенциометра перемещается по заранее рассчитанной программе, например с помощью кулачкового механизма, и снимаемое с него напряжение является заданной функцией времени, то такая САР представляет систему программного регулирования. Если движок потенциометра перемещается по заранее неизвестному закону, например в соответствии с показаниями какого-либо измерительного прибора, и угловая скорость электродвигателя должна находиться в определенной функциональной зависимости от положения движка, то САР является следящей системой. На рис. 2.4 приведена типовая функциональная схема СЛР с регулируемой переменноей x(t). Система состоит из объекта регулирования и автоматического регулятора. Объект регулирования — основной элемент системы регулирования, т. е. машина или установка, заданный режим работы которой должен поддерживаться регулятором при помощи регулирующих органов. 27
Рассмотрим устройства и элементы, входящие в регулятор, по нх функциональному признаку, т. с. по назначению (см. рис. 2.4): I JoirvuK Рис. 2.4. Функциональная схема типовой САР и основные ее устройства задающее устройство 7—преобразует входное управляющее воздействие g(t) в управляющий сигнал, пропорциональный заданному значению регулируемой переменной x(t) и удобный для сравнения с ней. Задающими устройствами могут быть пружины, калиброванные сопротивления, уровни и т. и. В сложных системах программного управления выработка заданной функции осуществляется счетно-решающими или вычислительными подсистемами, которые называют программными устройствами; сравнивающее устройство 2 — на основании сравнения управляющего сигнала и сигнала главной обратной связи вырабатывает сигнал ошибки e(t). Устройства сравнения, предназначенные для измерения отклонений регулируемых неличин от заданных значений, могут представлять собой арифметическое устройство, осуществляющее вычитание из измеренного чувствительным элементом значения регулируемой величины другой величины, принятой в регуляторе за опорную функцию (траекторию); преобразующие устройства 3 — преобразуют одну физическую величину ' в другую, более удобную для использования в процессе регулирования, не выполняя при этом функций измерения, усиления или коррекции; корректирующие устройства 4 (последовательное) и 8 (встречно-параллельное) — повышают устойчивость и улучшают динамические слойства системы регулирования. Вообще, в зависимости от способов включения корректирующие устройства (КУ) и регуляторы подразделяют на: а) последовательные, б) параллельные, в) встречно-параллельные. С помощью последовательных КУ сигнал ошибки преобразуется так, что в закон регулирования вводятся воздействия но производным и интегралам регулируемых неличин по времени. Параллельное КУ представляет собой элемент системы, включенный, как правило, параллельно усилителю, так, что на выходе осуществляется суммирование сигналов усилителя и корректирующего устройства. Встречно-параллельное КУ применяют в качестве местной корректирующей обратной связи. При встречно-параллельном соединении сигнал с выхода элемента передается на вход одного из предыдущих; вспомогательное сравнивающее устройство, 5—сопоставляет сигнал в промежуточной точке прямой цепи с сигналом местной обратной связи 8; усилительное устройство 6 — предназначено для усиления мощности сигналов в регуляторах. Оно управляет энергией, поступающей от внешнего источника энергии. Применяют электронные и электромагнитные усилители, гидравлические золотники, пневматические усилители и т. д.; исполнительное устройство 7 — вырабатывает регулирующее воздействие r(t), непосредственно прикладываемое к регулирующему органу или к объекту управления. Исполнительные устройства, осуществляющие механическое перемещение регулирующего органа, называют исполнительными двигателями, или сервомоторами; чувствительные, или измерительные, элементы 9 — предназначены для 28
преобразования регулируемых величин или возмущающих воздействий в сигналы управления, удобные для дальнейшего использования в процессе регулирования. Чаше всего значения регулируемых величин преобразуются в пропорциональные электрические сигналы или механические перемещения; элемент главной отрицательной обратной связи 10—вырабатывает си1-нал, находящийся в определенной функциональной зависимости от регулируемой переменной. Часть регулятора, которая преобразует сигнал ошибки e(t), называют датчиком регулятора. Он состоит из задающего, измерительного и сравнивающего устройств. Часть регулятора, которая преобразует сигнал ошибки в регулирующее воздействие r(t), обычно называют сервомеханизмом. Таким образом, САР состоит из следующих четырех частей: объект регулирования 3, датчик /, сервомеханизм 2, элемент ООС 4 (рис. 2.5). e.(t) г 4 r(t) 3 jrff) Рис. 2.5. Функциональные элементы САР Конкретные схемы систем регулирования могут отличаться от типовой схемы (см. рис. 2.4). Часть устройств может отсутствовать или может быть конструктивно объединена в одном устройстве. В системы регулирования могут входить и другие элементы, не показанные на рис. 2.4. Что касается функций корректирующих устройств, то их могут выполнять также цифровые и аналоговые вычислительные машины. 2.3. Прямое и непрямое регулирование, одноконтурные и многоконтурные, несвязанные и связанные САР Прямое и непрямое регулирование. Как уже отмечалось, САР состоит из объекта регулирования и регулятора. Регулятор имеет чувствительный элемент, который измеряет отклонение регулируемой величины. Чувствительный элемент воздействует на регулирующий орган, изменяющий параметр таким образом, чтобы значение регулируемой величины стало равно заданному. В простейших регуляторах чувствительный элемент непосредственно осуществляет перемещение регулирующего органа. САР, в которых чувствительный элемент воздействует непосредственно на изменение положения регулирующего органа, называют системами прямого регулирования, а регуляторы этих САР — регуляторами прямого действия (см., например, рис. 2.8, а). В этих регуляторах энергия, необходимая для изменения положения регулирующего органа, поступает непосредственно от чувствительного элемента. Следует отметить, что реакция регулирующего органа на чувствительный элемент снижает чувствительность этого элемента, в результате чего ухудшается качество регулирования. В системах непрямого регулирования для перемещения регулирующего органа используются вспомогательные устройст- 29
ва, которые работают от дополнительного источника энергии. При этом чувствительный элемент воздействует на управляющий орган вспомогательного устройства, а вспомогательное устройство осуществляет перемещение регулирующего органа (см. рис. 2.9,6). Системы непрямого регулирования необходимо применять в тех случаях, когда мощность чувствительного элемента недостаточна для перемещения регулирующего органа и необходимо иметь высокую чувствительность измерительного элемента. Одноконтурные и многоконтурные САР. Современные САР помимо главных обратных связей часто имеют местные ОС, а также параллельные корректирующие устройства (см. рис. 2.4). САР с одной регулируехмой величиной, имеющие только одну главную обратную связь и не имеющие местных обратных связей (системы с одним контуром регулирования), называют одноконтурными. В этих системах воздействие, приложенное к какой-либо точке системы, может обойти систему и вернуться в первоначальную точку, следуя только по одному пути обхода (см. рис. 2.2). САР, которые помимо одного контура главной обратной связи имеют и местные обратные связи, называют многоконтурными. В них воздействие, приложенное к какой-либо точке, может обойти систему и вернуться в эту точку, следуя по нескольким различным путям обхода (см. также рис. 2.4). Системы несвязанного и связанного автоматического регулирования. Системы с несколькими регулируемыми величинами (многомерные САР, рис. 2.6) можно подразделить на два вида. САР с несколькими регулируемыми Величинами LUC/ПСМЫ несвязанного регулирования Системы связанного регулирования Г"  ^3 ^; C3 Рис. 2.6. Классификация многомерных САР 1. Системы несвязанного регулирования — такие, в которых регуляторы, предназначенные для регулирования различных физических величин, не связаны друг с другом и могут взаимодействовать через общий объект регулирования. Системы не- 30
связанного регулирования можно подразделить на зависимые и независимые. В зависимых системах несвязанного регулирования на изменение одной из регулируемых величин влияют изменения остальных. Поэтому в таких системах процессы регулирования различных регулируемых параметров нельзя рассматривать изолированно друг от друга. Примером зависимой системы несвязанного регулирования является самолет с автопилотом, который имеет самостоятельные каналы управления рулями. Предположим, что самолет отклонился от заданного курса. При атом автопилот вызовет отклонение руля попорота. При нозвращении к заданному курсу угловые скорости обеих несущих поверхностей самолета, а следовательно, и действующие на них подъемные силы будут неодинаковыми. Это вызовет крен самолета. Автопилот отклонит элероны. В результате отклонения руля поворота и элеронов лобовое сопротивление самолета возрастает. Самолет начинает терять высоту и его продольная ось отклонится от горизонтали. При этом амтонилот отклонит руль высоты. Таким образом, процессы регулирования трех регулируемых величин — курса, бокового крена и тангажа нельзя считать независимыми друг от друга, несмотря на наличие самостоятельных каналов управления. В независимых системах несвязанного регулирования изменение каждой из регулируемых величин не зависит от изменения остальных. Поэтому процессы регулирования различных величин можно рассматривать независимо друг от друга. Примером независимых систем несвязанного регулирования является САР угловой скорости гидротурбины и САР напряжения генератора, который врашает эта турбина. Процессы регулирования в этих системах независимы. Процесс регулирования напряжения протекает во много раз быстрее, чем процесс регулирования угловой скорости гидротурбины. 2. Системы связанного регулирования — такие, в которых регуляторы различных физических величин связаны друг с другом и могут взаимодействовать вне объекта регулирования. Примером системы связанного автоматического регулирования может служить электромеханический автопилот (ЭАП) (рис. 2.7). Он предназначен для поддержания заданных курса, крена и тангажа самолета. Кроме того, ЭАП позволяет стабилизировать положение самолета в горизонтальном полете, производить подъем, спуск, планирование, плоские и координированные развороты при различных режимах полета и т. д. Далее будут рассмотрены лишь функции ЭАП, связанные с поддержанием курса, крена и тангажа. Чувствительным элементом, воспринимающим отклонение самолета от заданного курса, является гирополукомпас 12 (см. рис. 2.7). Его основной частью является азимуталыю-свободный гироскоп, ось которого направлена вдоль заданного курса. При отклонении самолета от курса ось гироскопа и связанные с ней при помощи рычага 11 щетки реостатных датчиков курса 7 и поворота 10 сохраняют свое положение в пространстве, а корпус самолета вместе с датчиками 7 и 10 смещается. Причем смешение щеток относительно средних точек сопротивлений пропорционально отклонению самолета от заданного курса. Чувствительным элементом, который воспринимает отклонения самолета от заданного в пространстве направления (например, от вертикали или от горизонтальной плоскости), служит гировертикаль 14. Основная ее часть — свободный гироскоп, ось которого перпендикулярна горизонтальной плоскости. Гировертикаль связана с щетками реостатных датчиков по двум осям. При отклонении оси самолета от горизонта в продольной оси происходит относительное смещение щетки датчика тангажа 13; при отклонении самолета в горизонтальной плоскости возникают относительные смещения щеток датчиков крена 15—17. Регулирующими органами самолета являются рули поворота /, высоты 18 и элероны 19, а исполнительными элементами, которые управляют положениями рулей, — рулевые машины каналов курса, тангажа и крена. Прин- 31
Рис. 2.7. Упрощенная схема электромеханическою автопилота
цин действия всех трех каналов управления автопилота одинакоь. Рулевая машина каждого из каналов связана с потенциометрическим датчиком ОС. Основной потеициометрический датчик 13 соединен с соответствующим датчиком ОС но мостовой схеме. Диагональ моста подключена к усилителю 6. Когда самолет отклоняется от заданного направления полета, тетка основного датчика смещается. В диагонали моста появляется сигнал. В результате срабатывает соответствующее электромагнитное реле на выходе усилителя, которое замыкает цепь электромагнитной муфты 4. Барабан 3 соответствующей рулевой машины сцепляется с валом непрерывно вращающегося электродвигателя постоянного тока 5. Наматывающиеся на барабан (или сматывающиеся с него) тросы начинают поворачивать соответствующий руль самолета и перемещать при этом щетку потенциометра ОС 2. Когда значение смешения тетки потенциометра обратной связи будет равно значению смешения шетки потенциометрического датчика, сигнал в диагонали моста станет равным пулю и движение данного руля прекратится. При этом руль повернется на угол, необходимый для изменения курса самолета под действием аэродинамического момента до заданного направления. Щетка основного датчика, по мере устранения рассогласования, возвратится к среднему положению, что приведет к действию рулевой машины в обратном направлении и к повороту руля в исходное начальное положение. Выходные каскады автопилота (от усилителей 6 и до рулевых машин) идентичны, а входные — несколько отличаются друг от друга. Щетка датчика курса связана с гирополукомпасом не жестко, а с помощью пружины 8 и демпфера 9. Поэтому кроме смещения, пропорционального отклонению от курса, щетка получает дополнительное смещение, пропорциональное первой производной отклонения по времени. Во всех каналах предусмотрены и дополнительные датчики, осуществляющие связанное регулирование по различным осям, т. е. необходимую координацию действий всех трех рулей. Это обеспечивает алгебраическое сложение сигналов основного и дополнительного датчиков на входе усилителя 6. В канале управления курсом дополнительно установлены датчики крена и разворота, а в канале управления креном — датчики поворота и разворота. Следует отметить, что датчик поворота отличается от датчика курса тем, что его отклонение пропорционально только отклонению от курса и не зависит от первой производной. В канале управления тангажом установлен дополнительный датчик крена. Влияние каналов управления друг на друга приводит к тому, что при движении самолета его крен, например, вызывает изменение тангажа и наоборот. Систему связанного регулирования называют автономной, если связи между входящими в се состав регуляторами таковы, что изменение одной из переменных в процессе регулирования не вызывает изменения остальных. 2.4. Статическое и астатическое регулирование 1. САР подразделяются на статические и астатические в зависимости от того, имеют или не имеют они ошибку в установившемся состоянии при определенных воздействиях. На рис. 2.8, а приведена схема статической САР уровня воды в резервуаре с помощью поплавкового регулятора. Такая система является системой прямого регулирования: поплавок в ней жестко связан с регулирующим элементом органом — задвижкой, которая изменяет количество воды, поступающей в единицу времени по питающей трубе в резервуар. Данная система — пример статического регулирования, при котором регулируемая величина при разных, но постоянных внешних воздействиях на объект по окончании переходного процесса принимает различные значения, зависящие от значения внешнего воздействия (нагрузки). Чем больше расход жидкости Q(t) в системе, чем больше открыта задвижка и, следовательно, тем ниже в состоянии равновесия будет находиться поплавок. 3—3591 33
Характерные особенности статической системы регулирования следующие: равновесие системы имеет место при различных значениях регулируемой величины; каждому значению регулируемой величины соответствует единственное определенное положение регулирующего элемента; контур регулирования системы должен состоять из статических звеньев, осуществляющих зависимость xEblx=f(xBX). i и. - a S Рис. 2.8. Статическая САР уровня (а) и астатическая (б) В схему САР уровня жидкости (рис. 2.8,6) включен электродвигатель постоянного тока. При увеличении (уменьшении) расхода жидкости поплавок (чувствительный элемент) опускается (поднимается) и замыкает верхний (нижний) контакт. При этом электродвигатель начинает вращаться в таком направлении, чтобы поднять (опустить) задвижку—регулирующий элемент — и увеличить (уменьшить) приток жидкости. Данная схема — пример астатического регулирования, когда при различных постоянных значениях внешнего воздействия на объект отклонение регулируемой величины от требуемого значения по окончании переходного процесса становится равным нулю. Степень открытия заслонки зависит от расхода жидкости, а поплавок при заданном значении уровня занимает одно определенное положение, соответствующее заданному. Связать поплавок и заслонку следует таким образом, чтобы одному положению поплавка могло соответствовать любое положение заслонки. Характерные особенности астатической системы регулирования следующие: равновесие системы имеет место при единственном значении регулируемой величины, ранном заданному; регулирующий элемент должен иметь возможность занимать различные положения при одном и том же значении регулируемой величины. В астатических системах первая особенность реализуется с некоторой погрешностью, так как чувствительный элемент обладает разрешающей способностью (нечувствительностью). Для осуществления указанной связи между чувствительным и регулирующим элементами в контур регулирования должно быть введено астатическое звено —в данном случае электродвигатель. При отсутствии напряжения вал электродвигателя неподвижен в любом положении, при наличии напряжения он непрерывно вращается. Астатическое звено находится в состоя- 34
нии так называемого безразличного равновесия при отсутствии внешнего воздействия и выходит из равновесия при наличии этого воздействия. 2. Следует также различать системы статические и астатические по отношению к возмущающему и управляющему воздействиям. В системах, статических по отношению к возмущающим воздействиям, не одинаковым по постоянной величине, этим воздействиям соответствуют различные значения регулируемой величины. В астатических системах значение регулируемой величины остается постоянным, равным заданному, и не зависит от значения возмущающего воздействия. В системах, статических по отношению к управляющим воздействиям, постоянным значениям этого воздействия соответствует постоянная ошибка, значение которой зависит от значения управляющего сигнала. В астатических системах после окончания переходного процесса ошибка равна нулю. На рис. 2.9 и 2.10 приведены кривые переходных процессов в статической и астатической системах по отношению к возмущающему f(t) и управляющему g(t) воздействиям соответственно. ш. Рис. 2.9. Переходные процессы в статической (кривая /) и астатической (кривая 2) системах по отношению к возмущающему воздействию Рис. 2.10. Переходные процессы в статической (кривая 1) и астатической (кривая 2) системах по отношению к управляющему воздействию 3* 35
2.5. Классификация САР в зависимости от идеализации, принятой при их математическом описании При анализе и расчете САР возникает необходимость выбора адекватной математической модели, которая соответствовала бы с заданной степенью приближения изменению переменных состояния системы в реальном времени. Следует отметить, что почти все САР представляют собой нелинейные системы, содержащие как переменные, так и распределенные параметры, в которых значение переменных в данный момент может зависеть не только от текущих, но и от прошлых значений этих переменных. Точное математическое описание САР представляет собой большие трудности и не всегда связано с практической необходимостью. Методы теории автоматического регулирования разработаны применительно к различным типовым математическим моделям реальных систем автоматического регулирования. Классификация линейных и нелинейных математических моделей САР представлена на рис. 2.11. Стационарные Нестационарные I Стационарны! I I Нестационарные Парам/три ipu системы I Рис. 2.11. Классификация математических моделей САР в зависимости от идеализации в их описании: / — сосредоточенные параметры; 2—распределенные параметры Следует отметить, что системы (или их математические модели) каждого из классов и подклассов могут быть детерминированными или статистическими. Математическую модель называют детерминированной, если приложенные к системе воздействия и ее параметры являются постоянными или детерминированными функциями переменных состояния и времени, н, наоборот, статистической, если приложенные к системе воздействия и се параметры являются случайными функциями или случайными величинами. 36
2.6. Системы непрерывного и дискретного действия САР в зависимости от характера сигналов подразделяют на непрерывные и дискретные (прерывистые). Если в процессе регулирования структура всех связей в системе остается неизменной, то это — система непрерывного регулирования. Сигналы на выходе элементов такой системы являются непрерывными функциями воздействий и времени. Между элементами на входе и выходе системы существует непрерывная функциональная связь. Примером системы непрерывного действия может служить схема на рис. 2.1,6, в которой ток в цепи якоря является непрерывной функцией напряжений на входе усилителей. Системы прерывистого регулирования отличаются тем, что в них через дискретные промежутки времени происходит размыкание или замыкание цепи воздействий. Принципиальным достоинством дискретных СЛР являются: высокая точность, помехозащищенность, многоканальность, а также гибкость при настройке на заданные технологические режимы. Системы прерывистого действия подразделяют на импульсные или релейные. В импульсных системах размыкание цепи воздействий происходит принудительно-периодически под действием специального прерывающего устройства. В течение передачи импульсов процессы в этих системах протекают так же, как и в непрерывных САР. Импульсные системы содержат импульсные элементы и осуществляют квантование сигнала по времени. В системах релейного действия размыкание или замыкание цепи осуществляются с помощью реле или элемента, имеющего релейную характеристику. Реле срабатывает при определенном значении непрерывно изменяющегося воздействия на его входе. Релейные системы квантуют сигнал по уровню (см. рис. 2.8, б). Существуют и релейно-импульсные, или кодово- импульсные, системы, в которых квантование сигнала происходит как по времени, так и по уровню. К кодово-импульсным относят системы, содержащие в контуре управления цифровые вычислительные машины (ЦВМ) или их элементы. Такие системы называют цифровыми. САР в зависимости от их конструктивного выполнения подразделяют на электронные, электрические, электромеханические, пневматические, электрогидравлические и гидравлические. 2.7. Основные технические требования, предъявляемые к САР Применение САР в каждом конкретном случае зависит от того, насколько система удовлетворяет предъявляемым к ней техническим требованиям. Основное требование — сохранение 37
заданной функциональной зависимости между управляющими и регулируемыми переменными на входе и выходе системы. Идеальных систем, которые выполняют это требование абсолютно точно, не существует. Поэтому речь может идти только о степени приближения системы к идеальной. Чем больше эта степень, тем сложнее система. При проектировании САР необходимо стремиться к разумному компромиссу между высоким качеством ее работы и простотой технических средств для достижения этого качества. Требования, предъявляемые к поведению системы в динамике, зависят от ее назначения, характера и конкретных условий работы и т. д. Различают следующие категории технических требований: устойчивость системы (запасы устойчивости системы); значение ошибки в установившемся состоянии (статическая точность); поведение системы в переходном процессе (условия качества); динамическая точность системы (значение ошибки при непрерывно изменяющихся воздействиях). Проектируя САР, следует учитывать и такие показатели, как расход энергии на управление, экономическая эффективность системы регулирования, стоимость и окупаемость оборудования, надежность и др. Наиболее существенным из перечисленных требований является устойчивость системы. САР из-за наличия обратных связей склонны к колебаниям. В устойчиво работающей системе колебания с течением времени затухают, и система приходит в согласованное состояние. Устойчивость системы не должна нарушаться при изменении в определенных пределах внешних и внутренних условий (например, окружающей температуры, напряжения питающей сети и т. д.). Запасы устойчивости должны быть такими, чтобы обеспечивалась возможность изменения параметров системы во время ее работы. Следует отметить, что принцип обратной связи САР, применяемый для подавления колебаний и уменьшения ошибки, при определенных условиях может привести не только к генерации колебаний и увеличению ошибки, но и к аварийным режимам. В качестве примера рассмотрим автомат курса, реагирующий на отклонение самолета от требуемого направления. Пусть в начальный момент времени под действием возмущающих сил продольная ось самолета не совпадает с требуемым направлением движения. В результате чувствительный элемент автомата курса вырабатывает сигнал, который заставляет отклониться рули направления. При этом возникает вращающий момент, возвращающий самолет на заданный курс. Однако в момент, когда продольная ось самолета совпадает с требуемым направлением движения, это возвращение не прекратится, во-первых, потому, что самолет имеет значительный момент инерции и при подходе к заданному курсу будет обладать определенным запасом кинетической энергии; во-вторых, потому что автомат курса, обладающий некоторым запаздыванием, возвратит руль в нейтральное положение лишь через некоторый промежуток времени после того, как продольная ось самолета совпадет с заданным курсом. Поэтому самолет будет отклоняться от заданного курса в направлении, противоположном первоначальному, до тех пор, пока автомат курса не произведет перекладку руля и пока не возникнет вра- шающий момент, достаточный для возвращения самолета к заданному курсу. 38
Если при этом демпфирование самолета невелико, а инерция и запаздывание автомата курса значительны, то амплитуда колебаний самолета относительно заданного курса возрастет и сохранение заданного курса станет невозможным. Таким образом, устойчивость является необходимой, но недостаточной характеристикой динамических свойств САР в реальных условиях работы при наличии различных воздействий. Виды типовых воздействий. Поведение САР существенно зависит от величины и характера воздействий на систему. При рассмотрении конкретных условий работы системы оказывается возможным выбрать такой вид воздействий, который для данной системы был бы наиболее типичным или наиболее неблагоприятным. Изучив переходный процесс, вызванный этим видом воздействий, можно судить о динамических свойствах системы. Так, при анализе динамики САР в качестве типового (тестового) часто выбирают ступенчатое воздействие, или единичный скачок (рис. 2.12, а). Примерами такого вида воздействий являются уменьшение (сброс) или увеличение нагрузки в системах регулирования угловой скорости электродвигателя, отказ двигателя в системе двухмоторный самолет —автомат курса, внезапное изменение положения задающей оси в следящих системах и т. д. g<t> gtt) t о t t ад в г Рис. 2.12. Виды типовых воздействий Типовое воздействие может быть в виде б-функции (рис. 2.12, б), т. с. иметь форму импульса весьма малой продолжительности но сравнению с ожидаемым временем переходного процесса. В реальных условиях такой вид воздействия имеет место, например, в случае внезапного вхождения самолета в струю воздуха, движущегося перпендикулярно траектории движения самолета. При этом б-функцию можно рассматривать как производную от единичной ступенчатой функции. При исследовании следящих систем типовым управляющим воздействием является, например, g(t)=g*+git+g2t2+ ... +grt', t>Q. B.1)" Частными случаями такого вида воздействий являются: g(t)=O, 39
g(t) = O t<0.\ {2-3) Выражения B.2) соответствуют изменению управляющего сигнала с постоянной скоростью (кривая 1, рис. 2.12,s), а выражение B.3) — изменению управляющего сигнала с постоянным ускорением (кривая 2, рис. 2.12, в). Однако при исследовании следящих систем управления антенной радиолокационной станции используют функцию g(t)=arctg$t, которая отражает собой закон изменения азимутального угла между направлением на цель и некоторым фиксированным направлением в случае прямолинейного и равномерного движения сопровождаемого объекта (рис. 2.12, г). В отдельных случаях типовое воздействие может быть сложной формы, которая определяется экспериментальным путем. Переходные процессы удовлетворяют так называемым первичным показателям качества, когда при единичном ступенчатом воздействии время переходного процесса Тп.„^.Ттах, перерегулирование (ЛГтах—Х0)/Хо- 100%, СТЭТИЧеСКОе ОТКЛОНеНИе Д^Дтах, число колебаний К^Ктак за время Ттах. Здесь Ттах, Хты, Ктах, Атах — заданные величины, а Хо — установившееся значение регулируемой величины x(t). Переходные процессы. Любое воздействие вызывает в системе процесс, по окончании которого система переходит в новое установившееся состояние. При статическом отклонении, не равном нулю, можно выделить следующие типы переходных процессов (рис. 2.13): Рис. 2.13. Основные типы переходных процессов в САР колебательные (кривая /), характеризующиеся наличием двух или большего числа перерегулирований; малоколебательные (кривая 2), характеризующиеся наличием только одного перерегулирования; без перерегулирования (кривая 3), характеризующиеся тем, что значение отклонения регулируемой величины остается в переходном процессе меньше установившегося значения, т. е. выполняется условие x{t)^.x{oo) при всех t (с точностью до А); монотонные (кривая 4), характеризующиеся тем, что скорость изменения регулируемой величины не меняет знака в те- 40
чение всего переходного процесса, т. е. выполняются условия dx/dt>0 при 0==^<Т и \x(t)—x(oo) |<Д при t>Tn.n, где Гп.п — время переходного процесса. В случае воздействий, интенсивность которых неограниченно возрастает с течением времени, отклонение значения регулируемой переменной также неограниченно возрастает. Поэтому будем рассматривать не установившиеся и максимальные значения отклонения, а установившиеся и максимальные ошибки регулируемой переменной от установившегося ее значения. Иногда реальные условия работы системы могут быть такими, что само понятие «переходный процесс» теряет смысл. Это относится к случаю (рис. 2.14), когда управляющее и возмущающее воздействия представляют собой непрерывно и быстро изменяющиеся случайные функции времени (например, шумы или помехи). Рис. 2.14. Воздействие, являющееся случайной функцией времени В качестве примера рассмотрим следящую систему для управления угло- яым положением антенны радиолокационной станции. На входной сигнал системы, воспроизводящей движение цели, накладываются помехи, или флуктуации, представляющие собой быстро изменяющиеся случайные функции времени. Флуктуации входного сигнала создаются непрерывным изменением коэффициента отражения самолета вследствие рыскания и качки последнего, а также вследствие неоднородности его отражающей поверхности и других причин. Такого рода воздействия при анализе систем не могут быть заменены типовыми воздействиями в виде заданных функций времени, но этими случайными факторами нельзя пренебречь, так как от них зависит общее значение ошибки системы. Такие показатели качества, как время переходного процесса, статическое отклонение регулируемой величины, число колебаний, перерегулирование, при этом теряют смысл. Сохраняет значение или максимальное отклонение хтах регулируемой величины, которое характеризует динамическую точность системы в неустановившемся состоянии, или среднее ее значение х за достаточно большой промежуток времени. 2.8. Системы автоматического управления Начиная с середины 60-х годов термин ТАР исчез из названий отечественных монографий и учебников, так как был почти везде заменен термином «теория автоматического управления» (ТАУ). Это представляется нам 41
неоправданным, ибо в термин ТАУ было вложено другое содержание, чем в термин ТАР (например, в работах [2, 9, 12] излагается обычная проблематика ТАР и пренебрегается ранее установившейся терминологией в классических трудах отечественных ученых). Поэтому необходимо пояснить различие между ТАР и ТАУ, состоящее в том, что ТАУ является дальнейшим принципиальным, существенным этапом развития ТАР. Основная проблема ТАР (см. подразд. 2.1) в векторной форме ставится так: заданы воздействия на входе системы, т. е. уставки, или управляющие воздействия g(t)==gB^.(t), зависящие от технологии процесса. Необходимо их наиболее качественное воспроизведение, т. е. сведение к минимуму функционала от ошибки Q(Ay) между векторами входа и выхода САР: emIn = minQ[gBx@-y@]. B-4) Система автоматического управления (САУ) представляет собой совокупность объекта управления и управляющей подсистемы (системы), подчиненных общей цели управления. Однако САУ могут состоять из нескольких объектов, объединенных единством цели управления (рис. 2.15). В качестве таковых можно рассматривать, например, участок производства, цех завода или даже сам завод. Цель управления —Г .JE I Объект iyrv^\ Объект Управляемая система. САУ I \уМ x(t) Упра бляющая система. I ! i Рис. 2.15. Общая функциональная схема САУ Поведение САУ в процессе нормальной эксплуатации определяется целью управления, внешней средой или внешними условиями, а также внутренними свойствами управляемой и управляющей подсистем. Система управления называется автоматизированной, если основные функции, необходимые в процессе ее работы для до- 42
стижения цели управления, осуществляются в ней с участием человека-оператора. Настоящая книга посвящена в основном теории автоматического управления, т. е. теории управления техническими объектами без непосредственного участия человека. Для того чтобы перейти к рассмотрению проблемы ТАУ и ее отличия от проблемы ТАР, дадим математическое описание САУ [4, 17]. САУ характеризуется следующими основными переменными, которые являются функциями времени: неременные состояния2 xx{t) , x2{t), ..., xn(t), представляющие собой обобщенные координаты; управляющие переменные u\{t), u2(t), ..., um{t), формируемые управляющей системой и представляющие собой воздействия на управляемый объект; внешние переменные или возмущающие воздействия fi{t), /2@. ¦••. fh(t), создаваемые внешней средой и являющиеся, вообще говоря, случайными переменными; наблюдаемые переменные у\ (t), y-z{t), ..., yi{t), представляющие собой те из обобщенных координат xq(t), q=\, 2, ..., n управляемой системы, информация об изменении которых поступает на управляющую систему. Переменные yq(t), q=\, 2, ..., / считают выходными переменными системы управления. Будем рассматривать эти переменные как компоненты многомерных векторных функций (см. рис. 2.16): \(t) 1-й» lxn (t) J Aw -У lit и называть векторы х(^), u(t), f(/), y(/) векторами состояния, управления, возмущения, наблюдения (выхода) соответственно. В любой момент времени t состояние управляемой системы является функцией начального состояния х(/0) и векторов u(tQ), f(M, т. с. x(O=X{x(fo);u(f, /0); f(/, /о)}- B.5) Векторное уравнение B.5) эквивалентно системе из п скалярных уравнений x,(t)=Xt{x(t0); u(t, to); f(t, to)}, B.6) где i=l, 2,...,«. Уравнения B.5) и B.6) можно рассматривать как математическую модель управляемой системы в общем случае. Для 2 Строгое определение вектора состояния дано в разд. 4. 43
САУ, описываемых дифференциальными уравнениями, уравнения B.5) и B.6) можно привести к следующему виду: g-X{x(/); u@; f(t)l B.7) Уравнение B.7) — стохастическое векторное уравнение системы, где f(/) —вектор возмущений и помех, имеющий случайный характер. Часто на изменение вектора состояния х(^) (или его производных) и вектора управления u(t) накладываются ограничения вида B.8) которые означают, что изменения векторов х(^) и и(/) должны быть ограничены замкнутыми областями A(t) и В@ векторных пространств состояний и управлений соответственно. Пусть цель управления как конечный результат функционирования САУ определяется экстремумом некоторого функционала Е, называемого показателем цели управления: Е=Е{х(/), u@, f@> B.9) Решение задачи управления состоит в том, чтобы найти вектор управления u(t), обеспечивающий экстремум функционала B.9) Е0==Е {х@; u(/); f(/)}=extr B.10) и и одновременно удовлетворяющий ограничениям и связям, налагаемым внутренними (собственными) свойствами системы и внешними возмущениями и помехами. Так как в правую часть уравнения B.7) системы (объекта) входят случайные переменные f (t), то и процесс изменения вектора состояния х(/) или вектора выхода у(*) оказывается случайным. Таким образом, общей задачей теории управления является управление случайным (стохастическим) процессом. Эта задача в общей постановке представляет собой математически почти непреодолимые трудности. Поэтому решение оптимальной задачи управления B.10) обычно основывают на методе последовательных приближений, причем первую и вторую итерации определяют поэтапно: 1) этап первичной оптимизации — состоит в нахождении оптимального вектора управления uopt@ без учета влияния возмущающих воздействий и помех, характеризуемых вектором i(t). Экстремальная задача решается в упрощенной детерминированной постановке, учитывающей лишь основные свойства системы, т. е. без учета влияния случайных переменных или помех f(t); 2) этап вторичной оптимизации, или оптимизации качества 44
управления, — состоит в определении минимума функционала (называемого показателем качества САУ) Qo=min{Eo—Едейст}, B 11) где Ео — экстремум показателя цели управления, вычисленный согласно этапу первичной оптимизации; Едейст — действительный показатель цели управления, учитывающий влияние внешних возмущений и помех. Из сравнения следует, что функционал B.4) является частным случаем общего функционала B.11). Поясним, почему проблема ТАУ более общая и сложная, чем проблема ТАР. Во-первых, необходимо сформировать управляющее воздействие или вектор и(^) на основании цели управления Е объектом, представляющей собой, в достаточно общем случае, конечный технический или экономический результат, который может быть достигнут САУ на определенном временном интервале ее функционирования. Функционал Е(-), характеризующий цель управления, может представлять собой сложную функцию, которую трудно формализовать (представить в аналитической форме), так как этот функционал зависит, например, от эффективности, производительности, прибыли, стоимости, вероятности выполнения некоторого события и т. д. Кроме того, решение задачи затруднено ввиду значительной неопределенности при описании модели объекта, требуемых ограничений, случайного характера приложенных к нему возмущений и помех и т. д. Очевидно, что цель управления гораздо сложнее, чем цель регулирования, которая состоит лишь в нахождении минимума функционала от ошибки между входом и выходом согласно B.4). Во-вторых, сложность проблемы управления состоит в аналитическом решении задачи определения оптимального значения uopt(/). придающего экстремум функционалу цели управления Ео. Кроме того, необходимо усилить управляющий сигнал до уровня, достаточного для воздействия на объект управления, т. е. решить собственно задачу регулирования, так как технически управляющий сигнал обычно формируется при помощи ЭВМ на низком уровне мощности. Таким образом, необходимо сформировать показатель качества управления в виде функционала B.11) QO==CXlrQ[Eo(O— Едейст@1 B-12) и и решить эту задачу уже в стохастической постановке. Один из вариантов решения проблемы управления приведен на рис. 2.16, где f}(t) и f2(t) —случайные воздействия. Итак, поставлена проблема, которая сводится к решению задачи двух зависимых друг от друга функционалов B.11) и B.12), между тем как в математике не существует регулярных средств для решения задач такого рода. 45
\fi(tl Цель управления extrE + Рис. 2.16. Вариант построения САУ 2.9. Проблема управления Стремление обеспечить минимум функционала ошибки Qo, характеризующей качество управления, обычно вступает в противоречие с условиями технической реализуемости, зависящей от сложности системы, ее стоимости, надежности и т. д. Действительно, чем выше качество управления, т. е. чем выше точность аппроксимации оптимального алгоритма управления, тем сложнее, дороже и ненадежнее управляющая система. Проблема управления является даже не двух-, а многокритериальной задачей, что обеспечивает наивыгоднейшие условия компромисса между противоречивыми условиями качества и реализуемости управления. Вопросы проектирования САУ здесь не рассматриваются3. Проблема управления может быть пояснена схемой, показанной на рис. 2.17. Цель управления задается функционалом Ео (блок /); в блоке 2, представляющем собой ЭВМ, определяется экстремум функционала E0=extrE(u); B.13) U в блоке 3 осуществляется сравнение оптимального значения Ео с его действительным значением Едейств при использовании функционалов B.12) и B.13) и вычислении на ЭВМ: Qo= extr [Eo (t) -Едейст (*)] = extr ДЕ. U U Функционал Qo определяет качество управления при наличии случайных возмущающих воздействий. Реализация управления по этому принципу представляет собой большие технические трудности. Одна из наиболее существенных— необходимость формирования ошибки АЕ по показателю цели управления Ео. * См.: Солодовников В. В., Бирюков В. Ф., Тумаркин В. И. Принцип сложности в теории управления. М.: Наука, 1977. 46
блок 7 блок 2 ЭВМ блО/C, I f(t) Цела управления- функционал '4x,u,f.t} extr E Х,и Рис. 2.17. Схема проблемы управления Действительно, определение АЕ требует измерения всех переменных величин, от которых зависит результат и которые входят в выражение для цели управления Е(/). Большинство из них не может быть оперативно определено в ходе процесса управления (либо из-за недостатка измерительных устройств, либо из-за того, что вычисление этих переменных может быть выполнено лишь за большой промежуток времени). Поэтому задача управления в изложенной ранее постановке заменяется более простой задачей, когда показатель качества управления Q=Q[E0-EpeaJJbH]=Q[AE] не зависит явно от ошибки в показателе цели управления Q(AE). В этом случае необходимость формирования сигнала об ошибке АЕ отпадает и задача значительно упрощается. Таким показателем может служить точность управления, определяемая следующим образом. Рассмотрим вектор ошибки ex(t)—x0(t) x(t) B.14) или в,(О=Уо(О-у(О. где х0@, Уо(О—оптимальные векторы состояния и выходной переменной соответственно (получены на основании первичной оптимизации функционала Е, определяющего цель управления). Вектор состояния х(^) можно найти по результатам наблюдения или по данным измерения вектора наблюдения (см. рис. 2.16). Тогда этап вторичной оптимизации (собственно задача регулирования) не требует вычисления показателя цели управления E(t) и сводится к определению оптимального управляющего воздействия u@=kx@, где х(/)—оценка вектора состояния; к — некоторый переменный коэффициент. Другими словами, необходимо получить корректирующее воздействие v@=uOpt@+Au@, 47
которое компенсирует все случайные возмущения, вызывающие отклонения от оптимального режима xopt@ или от траектории объекта, вычисленной согласно первичной оптимизации, пренебрегающей этим возмущением. На рис. 2.18 показана возможная схема адаптивной (приспосабливающейся) системы управления, в которой экстремум цели управления Е(/) модифицируется под влиянием наблюдения действительных управляющих воздействий и(/) и вектора состояния x(t). Эта схема представляет собой двух- контурную систему управления. Рис. 2.18. Адаптивная (приспосабливающаяся) САУ Конечно, этот косвенный метод решения проблемы управления в принципе менее совершенен, чем метод непосредственного измерения разности между оптимальным показателем цели управления Ео и его реальным показателем Едейств согласно алгоритму B.1). Но этот алгоритм, как отмечалось ранее, не реализуем в техническом отношении. Поясним этапы первичной и вторичной оптимизации на примере системы управления самолетом. Этап первичной оптимизации связан с необходимостью получения максимальной точности вывода самолета на оптимальную траекторию при условии минимальной затраты топлива. Этап вторичной оптимизации, согласно выражению вектора ошибки B.14), необходим для достижения заданного конечного состояния в определенный момент (согласно оптимальной траектории, вычисленной на первом этапе оптимизации). Но это — траектория, вдоль которой полет самолета не осуществим из-за различных возмущений, действующих на самолет в.полете. Эти возмущения, отклоняющие самолет от оптимальной траектории, необходимо компенсировать. Отметим, что если бы величину одного из функционалов, например показателя цели управления Е можно было ограничить затратами на энергетику, расходуемыми рулями управления самолетом, то зависимости второго этапа оптимизации от первого не существовало бы и отпала бы проблема одновременной оптимизации двух взаимозависимых функционалов. Но на самом деле функционал Е, а также функционал Qx, зависящий от отработки САУ оптимальной траектории и тоже требующий затрат на энергетику, т. е. формирования корректирующего воздействия v(/), взаимосвязаны. 2.10. Примеры САР и САУ В различных отраслях промышленности и народного хозяйства широкое применение нашли два класса автоматических систем: циклические, или разомкнутые, действующие по 48
жесткой программе (например, разнообразные автоматы, роботы, станки-автоматы, входящие в состав поточных линий, и др.); ациклические, или замкнутые, функционирующие на основе принципа обратной связи. Приведем примеры ациклических систем4. В качестве систем регулирования рассмотрены САР нагревательной печи и система стабилизации угла тангажа самолета; в качестве систем управления — ряд САУ объектами металлообрабатывающего производства. САР температуры печи (рис. 2.19). Рассмотрим процесс стабилизации или автоматического регулирования температуры, заключающийся в том, что в условиях неопределенности начальных условий и возмущений необходимо поддерживать температуру 8 в электропечи постоянной (или изменять ее в соответствии с некоторым законом), которая задается напряжением и0 на входе системы. Температуру в в печи измеряют термопарой, которая дает напряжение ыт, пропорциональное температуре 0. Сравнение этого напряжения с напряжением на входе системы осуществляется за счет цепи обратной связи. Разность напряжений Аи = ио—их называют рассогласованием, или отклонением (ошибкой системы регулирования). Оно пропорционально отклонению температуры от требуемого значения «0. Разность напряжений Аи усиливается электронным, магнитным или каким-либо другим усилителем. Напряжение с его выхода иу подается на привод, который осуществляет перемещение s движка потенциометра и изменяет сопротивление г в электрической цепи нагрева печи. При увеличении сопротивления г ток в цепи нагрева уменьшается, а температура в печи снижается, и наоборот. Характерная особенность САР заключается в том, что сама разность между требуемым и действительным значениями регулируемой величины является причиной устранения этого рассогласования при помощи обратной связи. Рис. 2.19. САР температуры в нагревательной печи: / — усилители (суммирующий и мощности); 2 — электрический привод; 3 — реостат; 4 — электропечь; 5 — высокотемпературный нагревательный элемент; 6 — термопара В рассматриваемом примере обратную связь осуществляет измерительное устройство — термопара. Она является чувствительным элементом, реагирующим на действительное значение регулируемой величины (температуры 6) и формирующим сигнал ошибки Да. Автоматическое управление летательным аппаратом (рис. 2.20). Отклонение действительного угла тангажа ft от требуемого определяется с помощью свободного гироскопа, снабженного потенциометром. Нулевое положение по- 4 Циклические (цикловые) системы регулирования подробно рассмотрены (см., например Коровин Б. Г., Прокофьев Г. И., Рассудов Л. Н. Системы программного управления промышленными установками и робототехническими комплексами. Л.: Энергоатомиздат, 1990. 352 с). 4—3591 49
тенциометра соответствует требуемому углу тангажа гзп и задается программным механизмом 1. Напряжение ut на выходе потенциометра 2 пропорционально ошибке е=#п—О. Устройство 3 преобразует сигнал ошибки иг в управляющий сигнал и,. Для придания САУ требуемых динамических свойств к сигналу ошибки с помощью корректирующего устройства (электрической RC-цепи) добавляются сигналы, пропорциональные его производным и интегралам. ш оос Рис. 2.20. Система автоматической стабилизации тангажа самолета Электрический сигнал затем усиливается электронным или магнитным усилителем 4. Выходной ток t'y управляет рулевой машиной 5 летательного аппарата 6. Рулевая машина поворачивает на угол б рули, которые создают момент, вращающий летательный аппарат вокруг центра масс и изменяющий при этом угол тангажа ¦&. Этот угол 0" сравнивается с требуемым углом Фп и, таким образом, система замыкается обратной связью. Управляющим воздействием в системе яиляется программное значение входной величины 0Л(О- Возмущающее воздействие — силы и моменты {FB и Мъ), приложенные к летательному аппарату и вызываемые атмосферными факторами, а также производственными погрешностями. Металлообрабатывающие станки с числовым программным управлением (ЧПУ). В современном производстве широко используют станки с ЧПУ [11, 19]. Применяемые в машиностроении сложные поверхности и кривые либо описывают известными уравнениями, либо могут быть аппроксимированы по участкам плоскостями и прямыми линиями, а также поверхностями и кривыми второго порядка. Это дает возможность сравнительно просто программировать процесс определения координат точек кривой и поверхности на ЭВМ (этап первичной оптимизации системы). Поскольку число точек, которыми должно задаваться положение рабочего инструмента при достаточно высокой точности обработки детали, получается значительным, то на центральной ЭВМ вычисляют лишь сравнительно небольшое число опорных точек, которые обычно являются точками сопряжения кривых, описываемых различными уравнениями. Эти данные выдаются в виде первичной программы для последующей обработки на микроЭВМ, осуществляющей интерполяцию между опорными точками и выполняющей некоторые другие операции: управление скоростью перемещения инструмента, учет его износа и т. д. (этап вторичной оптимизации). Функциональная схема импульсной системы управления фрезерным станком (системы с ЧПУ) показана на рис. 2.21. С выхода центральной управ- лящей ЭВМ сигналы поступают в формирователь импульсов (ФИ), который преобразует эти сигналы в прямоугольные импульсы uu*. Синхронизаторы (С) разделяют во времени сигналы и,.* прямой цепи от импульсов обратной связи иос*. Сигналы обратной связи, пропорциональные истинному перемещению стола фрезерного станка, в виде импульсов снимаются с преобразователя угол — код (УК). Эти сигналы также проходят через блок ФИ. При наличии рассогласования п числе задающих импульсов и импульсов обратной связи иОс* на выходе реверсивного счетчика (PC) образуется сигнал разности Аи* = ии*—«ос*, который поступает в преобразователь ЦАП, где импульсный сигнал преобразуется в непрерывный Аи. Знак непрерывного напряжения Ли совпадает со знаком рассогласования Аи*. Напряжение Аи, усиленное электронным (ЭУ) и электромашинным (ЭМУ) усилителями, поступает на вход эелктродвнгателя (Эдв), который 50
I Ввод задании <струмент 9ва6атыВаен1ая деталь Рис. 2.21. Функциональная схема импульсной системы управления фрезерным станком (по координате х перемещения стола станка) приводит во вращение через редуктор ходовой винт подачи стола. Электродвигатель будет вращать ходовой винт до тех пор, пока в результате поворота преобразователя УК число отработанных импульсов не станет равным числу заданных импульсов, т. е. Ли*=О. Для обеспечения устойчивости цифровой следящей системы станка применена гибкая отрицательная обратная связь. В нее входят тахогенератор (ТГ), вал которого связан с валом Эдв, и корректирующее устройство (КУ). .МикроЭВМ осуществляет экстраполяцию сигналов, интерполяцию уравнений обрабатываемого контура и адаптацию системы. Промышленные роботы. Промышленный робот является автоматической машиной, представляющей собой элемент технологического оборудования, объединенный с другим оборудованием в некоторый роботизированный технологический комплекс (РТК). В состав РТК входят станки, прессы или другие технологические агрегаты с числовым программным управлением (ЧПУ), обслуживаемые промышленными роботами, и общая система управления [11]. Основа робота —многостепенная механическая подсистема подвижности (манипулятор) и микропроцессорные системы автоматического регулирования. РТК является системой автоматического управления с общей целью управления — максимизировать производительность труда при заданных ограничениях. Благодаря многозвенной кинематике манипулятора и системе управления, включающей микроЭВМ с соответствующим программным обеспечением, промышленный робот может легко переналаживаться на выполнение разнообразных производственных операций. Переналадка осуществляется изменением только программы действий, т. е. только цифровым перепрограммированием. Это свойство робота принципиально отличает его от традиционной производственной оснастки и других «жестких» технологических приспособлений, которые необходимо заменять на новые при другом типе изделия. Таким образом применение роботов существенно экономит подготовительное время и средства при смене продукции. Промышленный робот — это принципиально новый элемент оборудования, автоматизирующий различные операции и позволяющий осуществлять гибкую и оперативную перенастройку. Применение роботов в определенной степени завершает комплексную автоматизацию производственных процессов в масштабе линии, участка, цеха с приданием им гибких свойств. Роботы позволяют исключить участие человека как в основных, так и во вспомогательных операциях. Робот выдерживает жару, холод, вакуум, радиацию, 4* 51
может реагировать на ультразвук, иметь удлиняющие (телескопические) суставы своих звеньев и развивать большие усилия. Но ему, конечно, недоступны в полной мере интеллектуальные возможности человека. При роботизации производства для достижения цели управления необходимо пересмотреть организацию технологического процесса, а в некоторых случаях и переоснастить производственный участок на базе технологического оборудования с ЧПУ, чтобы не объединять новую технику с устаревшей и малопроизводительной. Робот важен не сам по себе, а в комплексе с основными технологическими машинами. Именно в таком сочетании робот дает преимущества перед традиционным составом оборудования. Эти преимущества оправдают затраты на роботизацию производства, если правильно организовать РТК как хорошо продуманную комплексную систему. Современные и перспективные промышленные роботы подразделяют на три класса (или три поколения): программные, адаптивные и интеллектчые (с элементами искусственного интеллекта). Все они обладают перепрограм- мируемостью, т. е. свойством оперативной замены программы в соответствии с целью управления. В промышленных роботах первого поколения (программных) перепрограммирование осуществляется человеком-оператором, после чего робот действует, циклически повторяя жестко заданную программу. Программа действий роботоп второго поколения (адаптивных) закладывается человеком, но робот обладает свойством в определенных пределах автоматически перепрограммироваться, т. е. адаптироваться (см. разд. 12) в ходе технологического процесса в зависимости от условий и обстановки, которые были неточно определены при его проектировании (рис. 2.22). Ввод задания, цель управления ч Адаптация р Ч 1! Управление движением -| ЯВтоматичес- ние приводы САР Датчики, очувствления Обьен/пы и среда действия Датчики информации Рис. 2.22. Функциональная схема САУ адаптивного робота 52
It Ввод задания, цель управления ЭВМ испустдениого urtme/i/ie/rma. Система восприятия обстановки. Вввд информации I I ЭВМ оптимизациай и пдамироваш действий Система наведения Л -Л-К *—1/ Выдача информация ввод информация. ЭВМ распределениях сигналов \u(t)-s//t). '«• -о л flffmoMamuve: A_ ние приводы Механизмы робота Выдача информации LMZJL I Система очувствления Объенты и среда действия Ин форма - ционная система Рис. 2.23. Функциональная схема САУ интеллектного робота Для роботов третьего поколения (интеллсктны.ч) задание в общей форме вводит человек-оператор, а робот может планировать свои действия в неопределенной или меняющейся обстановке (рис. 2.23). Интеллектные роботы отличаются значительными логическими и вычислительными возможностями. Гибкие производственные системы (ГПС). Гибкостью производства называется его способность оперативно и без существенных затрат труда и средств переналаживаться на изготовление новой или модернизированной продукции, на новые технологические процессы [11]. При этом существенное значение имеют организация всех производственных процессов, синхронизация работы его звеньев и обеспечение оптимального взаимодействия всех технологических линий и таких частей производственных подразделений, как склады, транспорт, контроль, проектирование, испытание, снабжение и т. д., подчиненных единой цели управления. ГПС в целом представляет собой многоуровневую иерархическую систему управления. Нижний ее уровень составляют локальные системы программного управления объектами — станком, прессом, роботом, вспомогательным механизмом. Эти объекты технологического оборудования снабжены микропроцессорными средствами обработки информации и управления 53
верхнего уровня, а также информационными устройствами с измерителями параметров состояния объекта и хода технологической операции в каждом из них. Информация поступает на их собственную микропроцессорную часть для обработки и использования в локальной системе регулирования. Кроме того, эта информация (или часть ее) передается на следующий уровень ГПС. Каждый отдельный объект имеет свою внутреннюю иерархическую систему переработки информации, управления и регулирования (например, промышленный робот, обрабатывающий центр с ЧПУ и т. д.) Следующим, средним уровнем в иерархии ГПС является гибкий производственный модуль (рис. 2.24). В состав модуля входят один—три станка, Информация от устройств диагностики оборудования ЭВМ Верхнего уровня Информация от средств контроля деталей ЭВМ модуля ГПС Пульт управления модулем ГПС МПУУ подачи инструмента мпс. о мпсп I МНР, МПР„ Автоматические привады Рис. 2.24. Функциональная схема САУ гибкого производственного модуля: МПС — микропроцессоры управления станками; МПР — микропроцессоры управления роботами; МПУУ — микропрцессорное управчяющее устройство роботы, вспомогательные механизмы или комплексы другого технологического оборудования. МикроЭВМ производственного модуля получает информационные сигналы от каждого отдельного объекта, входящего в состав этого модуля. МикроЭВМ формирует команды управления на каждый из объектов своего модуля, согласовывая их совместную деятельность в соответствии с общей целью управления и критерием оптимальности. МикроЭВМ передает также необходимую информацию о состоянии и ходе технологического процесса на следующий уровень САУ. Функциональная схема всей системы управления ГПС цеха, включая верхний уровень, показана на рис. 2.25. В единую ГПС включают не только участки и линии, но также автоматизированные склады заготовок, деталей, инструмента и выходной продукции цеха, внутрицеховой автоматический транспорт, цеховые АСУ, технологические службы, подразделения технологического контроля продукции цеха. Гибкая переналадка ГПС реализуется с использованием сети ЭВМ с соответствующим программным обеспечением, допускающим расширение и развитие системы в целом. 54
тс цеха Основное оборудование Промышленные роботы Двтомати- эированные силаВы I \ ^*>§ дета узло i изде \ ч) s п Инструмент и оснастна Йвтомаггизи- раванная транспортная система Система/ управления Нонтрольно- измерительные ус/пройства Технологическая служба Диспетчерская слунгоа. СП Рис. 2.25. Схема ГПС цеха
Контрольные вопросы 1. Что такое САР и САУ? Какими основными свойствами обладают САР и САУ, функционирующие по замкнутому циклу? 2. В чем заключается сущность прямого и непрямого автоматического регулирования? 3. Дайте определение и охарактеризуйте особенности следующих типов САР: систем автоматической стабилизации, систем программного регулирования, автоматических следящих систем. 4. Определите принципы и особенности статического и астатического регулирования (по отношению к управляющему и возмущающему воздействиям). 5. Перечислите и охарактеризуйте основные виды воздействий на САР. 6. Каковы основные технические требования, предъявляемые к САР? На какие технические характеристики САР и как влияют требования к энергетике системы (мощность, КПД и т. д.). 7. Что такое математическая модель САР? Какие существуют основные формы представления математической модели динамической системы? 8. Объектом регулирования является металлорежущий станок. Какие основные возмущения действуют на систему управления станком? 3. Дифференциальные уравнения и частотные характеристики систем автоматического регулирования Основная форма математического описания объектов и систем — дифференциальные уравнения. В частности, динамические свойства линейных непрерывных систем описывают линейные дифференциальные уравнения, которым адекватно соответствуют передаточные функции и амплитудно-фазовые частотные характеристики (АФЧХ). Последние в теории автоматического регулирования имеют особое значение, так как являются основой частотного метода анализа и синтеза САР [19]. Частотная характеристика объекта (системы) может быть получена либо из соответствующей передаточной функции заменой s на /ю, либо экспериментальным путем. Формализм типовых линейных динамических звеньев и их передаточных функций позволяет, с одной стороны, осуществить декомпозицию математических моделей сложных систем, а с другой — использовать их в качестве элементарных структур для представления объектов и систем при автоматизации моделирования их динамики на ЭВМ. 56
3.1. Уравнения CAP Для проектирования и анализа системы автоматического регулирования необходимо располагать ее математическим описанием — дифференциальными или интегродиференциаль- ными уравнениями. Системы с сосредоточенными параметрами описывают обыкновенными уравнениями в функции непрерывного времени /, а системы с распределенными параметрами — уравнениями в частных производных. Дифференциальные уравнения определяют поведение САР в переходном процессе при действии возмущающих сил или после прекращения их действия. Дифференциальные уравнения называются уравнениями динамики, если они описывают изменение входящих в них переменных во времени. Из уравнений динамики обычно можно получить уравнения статики, если принять все входящие в них производные и воздействия равными нулю или некоторым постоянным величинам. Уравнения статики описывают состояние системы в установившемся режиме. При составлении дифференциальных уравнений динамики системы автоматического регулирования ее математическую модель обычно разбивают на отдельные независимые элементы, или звенья, и записывают уравнение каждого отдельного звена. Уравнения всех звеньев образуют единую систему, которую можно преобразовать к одному уравнению путем исключения промежуточных переменных. Уравнение звена должно быть составлено так, чтобы оно выражало зависимость между величинами (переменными), являющимися входом и выходом данного звена, т. е. между теми величинами, которые представляют собой воздействия данного звена на последующее и предыдущего на данное. Звено может иметь не одну входную величину, а несколько (например, при наличии дополнительных обратных связей). Кроме входных и выходной величин звено имеет вход (точку), к которому приложено возмущение. Дифференциальные уравнения составляют на основе тех физических законов, которые определяют протекание процесса в соответствующем элементе. Чаще всего исходным является закон сохранения вещества и энергии, записанный применительно к рассматриваемому процессу [18]. При составлении дифференциального уравнения выявляют все факторы, от которых, зависит исследуемый процесс, или переменные, входящие в это уравнение. При большом диапазоне изменений регулируемой величины уравнение статики нелинейно. Приведем примеры. Для электрического генератора с независимым возбуждением при малых изменениях тока возбуждения можно написать линейное уравнение вида где Uг — напряжение на выходе генератора, UB—напряжение возбуждения генератора. 57
При значительном токе возбуждения необходимо учитывать насыщение магнитной цепи электрической машины, т. е. перейти к нелинейному уравнению Vr=f(UB). Для малых отклонений регулируемой величины можно пользоваться линеаризованными уравнениями, а для больших — нелинейными вида где х, у, z — абсолютные значения регулируемой величины, регулирующего и возмущающего воздействий соответственно. Геометрическое изображение уравнений статики системы — это статические характеристики, т. е. кривые, построенные в координатах х, у или х, z. Примером таких характеристик является статическая характеристика электронного усилителя ) (рис. 3.1) или электродвигателя постоянного тока si Uy Рис. 3.1. Статическая характеристика электронного усилителя постоянного тока Рис. 3.2. Характеристика холостого хода электродвигателя постоянного тока Q=/(?/y) (рис. 3.2). Здесь ?/Вых — напряжение на выходе усилителя; /Увх — напряжение на его входе; Q — скорость вала электродвигателя, рад/с; Uy — управляющее напряжение на якоре. Статические характеристики (см. рис. 3.1 и 3.2) являются нелинейными. Когда это возможно, для упрощения расчетов их следует линеаризовать, например методом усреднения или методом касательной при небольшом диапазоне изменения входной и выходной величин (рис. 3.3). Точка С (см. рис. 3.3) характе- ристики Q=/(?/y) с координатами рц &» и Uyo соответствует номинально- нейной статической характери- му режиму работы электродвига- теля. Если учесть малость отклонений AQ и AUy (угловой скорости якоря и управляющего соответственно), то можно прилежащий к точке С криволиней- Рис. з.З. Линеаризация нели йй ической стики 58
ный участок статической характеристики Q f(Uy) заменить прямой (касательной или секущей). Рассматриваемый рабочий участок можно изобразить отдельно в новых осях координат (AQ, Л?/у), обозначающих отклонение величин Q и Uy от их номинального режима. Такую замену реальной нелинейной характеристики линейной называют линеаризацией. Рабочий участок описывается формулой AQ=k0AUy, где ^0==tga — крутизна характеристики. Следует отметить, что имеются так называемые существенно нелинейные характеристики. Среди них можно выделить типичные для САР, которые могут быть представлены математически или получены экспериментально. При анализе систем, элементы которых содержат такие характеристики, применяют методы теории нелинейных систем автоматического регулирования (см. разд. 8). 3.2. Методика составления дифференциальных уравнений САР. Линеаризация уравнений Первый шаг при составлении уравнений динамики элемента САР — установление физических законов его поведения. Как уже отмечалось, ими являются основные законы физики. Математическое выражение закона, определяющего процесс в данном элементе системы, является исходным дифференциальным уравнением этого элемента. Второй шаг — выявление и анализ факторов для определения зависимостей переменных, входящих в исходное уравнение, и нахождение выражений, характеризующих эти зависимости. Последние могут быть или выражены аналитическими функциями, или заданы графически. В большинстве случаев они являются нелинейными зависимостями. Подстановка найденных выражений в исходное уравнение дает нелинейное уравнение элемента (в частности, объекта регулирования). Если для полученного уравнения линеаризация допустима, исследование процесса (например, регулирования) может быть упрощено. Достаточными признаками для проведения линеаризации обычно являются отсутствие разрывных, неоднозначных или резко изменяющихся характеристик, а также правомерность уравнения для всего интервала времени регулирования. Дифференциальные уравнения линеаризуют при помощи формулы Тейлора. Используя ее, можно разложить нелинейную функцию нескольких переменных по степеням их малых приращений (в окрестностях значений, соответствующих установившемуся режиму). Формула Тейлора содержит остаточный член, исследование которого позволяет оценить величину ошибки, получающейся в том случае, когда ограничиваются лишь первыми членами разложения. Формула Тейлора, например для функции трех переменных х, у и z имеет вид: 59
F(x, у, z) = F (х„ dF dF dF = F(x0, y0, z*)+-^- Ax+-^j-Ay + -rjj-/\z+...=F(x0, y0, z0) + 1 / dF dF dF \@ где x=xa-\-Ax\ y=yo+<Ay; z=zo+Az; *0=const; f/o=const; z0 = const; Rn+i—остаточный член. Если в выражении под знаком суммы показатель степени i=2, то dF dF dF V &F ^F d"F d'F 2 Частные производные здесь вычисляются в точке с координатами *0, Уа, Zq и поэтому являются постоянными. При линеаризации нелинейных уравнений обычно ограничиваются лишь членами первого порядка малости, пренебрегая остаточным членом R2. Поэтому можно записать dF dF dF F(x, у, z)xF (*„, y0, z0) + -fa- Ax + -^- Ay + -jf Az. Для исследования устойчивости процесса регулирования такого приближения, как правило, бывает достаточно. Однако иногда линеаризованные уравнения используют для исследования качества процесса регулирования. В этом случае приращения переменных могут быть не всегда малыми. Тогда для строгой оценки допускаемой погрешности проводят анализ остаточного члена $2. Выражение приращения AF(x, у, г) функции F(x, у, г) определяется как разность между текущим значением этой функции и ее значением F в некоторой фиксированной точке, заданной координатами Хо, уа и z0, т. е. AF(x, у, z)=F(x, у, z)—F(x0, Уо, z0). Подставив в это выражение значение F(x, у, г), определяемое по формуле Тейлора, получают приближенное, с точностью до R2 соотношение dF dF dF A A ^-Az. C.1) Им следует пользоваться при линеаризации нелинейных дифференциальных уравнений. После линеаризации получают уравнение в отклонениях (или в приращениях), выраженное в абсолютных единицах. Каждый член уравнения C.1) имеет определенную размерность. Однако при исследовании САР удобнее иметь уравнения, выраженные в относительных единицах с коэффициентами: безразмерными или имеющими размерность времени и степень, соответствующую порядку производной, к которой относится данный коэффициент. При приведении дифференциального уравнения в отклонениях, выраженного в абсолютных единицах, к уравнению в от* носительных единицах с безразмерными коэффициентами необходимо провести следующие операции. 60
1. Все члены уравнения делят на некоторое постоянное значение переменной, имеющей размерность членов этого уравнения (таким постоянным может быть, например, номинальное, максимальное или некоторое начальное значение переменной). В результате каждый член уравнения станет безразмерным. 2. Переходят к относительным единицам. Выбирают постоянное значение для каждой координаты любого из приращений, входящих в полученное уравнение. Затем определяют соотношения приращений и выбранных постоянных значений. 3. Вводят обозначения относительных единиц и коэффициентов уравнения. В качестве примера рассмотрим методику составления уравнений системы регулирования угловой скорости вала электродвигателя. Для объекта регулирования исходным является уравнение баланса моментов: 1=Л'1д"~Л1с1 C-2) где / — момент инерции движущихся частей, приведенный к валу электродвигателя; со — угловая скорость вращения вала; Мя—движущий (вращающий) момент на валу электродвигателя; Мс — момент сопротивления на валу; t — время. Прежде всего выясним, от каких величин зависит и какими величинами определяются движущий момент Мп, момент сопротивления Ме и является ли постоянной величиной приведенный момент инерции /. Отметим, что исходное уравнение C.2) справедливо для любого двигателя, однако вид зависимостей соответствует конкретному типу двигателя. В случае регулирования числа оборотов, например, авиационного двигателя при помощи винта с изменяющимся шагом движущий момент зависит от угловой скорости двигателя, а также от наддува, которое задается датчиком и не может быть заранее определено, так как является неизвестной функцией времени. Поэтому Л4д=Л?д(й>, t). Момент сопротивления зависит от угловой скорости вала двигателя и», угла установки лопасти винта фл и ряда других факторов (плотности воздуха, скорости полета и др.), изменение которых учесть трудно. Выражение Для момента сопротивления имеет вид Мс—М<:{а>, фл, t). Основываясь на теории двигателей, можно записать аналитические зависимости полученных функций или представить их в виде графиков (и т. д. Далее, если приведенный к валу электродвигателя момент инерции вращающихся частей является постоянным, то, как следует из C.2), уравнение установившегося режима, или уравнение статики при &)=const имеет вид Мдо=.Мс<,. C.3) Малые отклонения моментов (приращения) от установившихся значений обозначим через ДМД и ДМС. Тогда Мя=МА0+ЫЛп; Мс=Мео+АМе. Теперь, подставив в исходное уравнение C.2) выражение установившегося Режима C.3), получим day J-7f = AMJl-AMc. C.4) Для линеаризации выражения C.4) следует воспользоваться формулой Тейлора C.1). Приращения ЛМЯ и АМС определим из выражений: 61
^ дМс дМс -^ Д« +-^7 АФ + Д^ @. где AMa(t) и ДМс@—составляющие приращений Мя и Мс, изменяющиеся во времени по неизвестному или заданному закону. Угол установки лопастей винта срл изменяют с помощью исполнительного механизма регулятора (серводвигателя), координату перемещения которого обозначают через т: Функция фл=/(т) задается обычно графически, и частную производную (дц>п)/дт) определяют как тангенс угла наклона касательной к кривой <рл=Дт) в точке, соответствующей установившемуся режиму. Тогда дМс дМ^ д(рл Полученные выражения подставляют в уравнение C.4): _ d(o дМ-, После переноса в левую часть уравнения C.5) членов, содержащих Aw, получим для рассматриваемого двигателя линеаризованное уравнение в приращениях, выраженное в абсолютных единицах. Для приведения дифференциального уравнения в отклонениях, выраженного в абсолютных единицах, к уравнению в относительных единицах и с безразмерными коэффициентами выбирают номинальное значение момента Мп и на него делят каждый член уравнения C.5): J dw 1 / дМс сШд \ AM (t) J дМс дц>л Мн dt + Мн [да> ~ 0а> /А<0= Ма ~ Мя д<рл ~дт Ат> где AM{t)=AMa(t)—AMc(t). В результате все члены уравнения стали безразмерными. Для координат каждого приращения, входящего в полученное уравнение, выбирают соответственно некоторые постоянные значения. Так, для угловой скорости — номинальное значение шн, для координаты серводвигателя — максимальное значение тт. Каждый член уравения, в который входит та или иная переменная, делят (умножают) на соответствующее ей выбранное постоянное значение. После этого ураинение C.5) будет иметь вид Уа>„ da 09ц /дМс дМя \ Дш AM (t) mm дМсд<ря Am Мн(йн dt ~*~ Мн \ дш дю J а>н = Ма Мн д<рл дт тт ' Учитывая, что tfu) rf(A<o) дМ дАМ dt ~ dt ¦ ды = д (Дш) и т- д- последнее уравнение переписывают в виде 62
J@H C ми AM M i Дш > dt @ ( н \ ( ' A \ AM, * MH AMC J MH Д© Йфл , Д/и о ,ДЛ4Д - д мя Д<о Am тт \ Дш 1 «н C.6) Вводят обозначения: Дш Д/и ДЛ4С Уравнение C.6) двигателя как объекта регулирования цринимает вид или окончательно ^/ +*сФ=/л(О-*м1». C-7) Все величины, входящие в уравнение C.7), за исключением / и постоянной Tq, приведены к безразмерному виду. Полученное уравнение справедливо и для других двигателей, так как их динамика во многом аналогична. Часто используют другую форму этого уравнения (для инерционного объекта регулирования) : где Аг2=(р; Xi—}i; Т—постоянная времени объекта регулирования (Г= = ТЧ/Кс)\ f(t) = (l/kc)fit(t))', k— передаточный коэффициент объекта. Приведем для различных обектов регулирования несколько типовых линеаризованных уравнений, записанных в операторной форме: (Tp+l)x2=f(t)-kXl; Tpx2=f(t)-xl; где р — символ дифференцирования (p^d/(dt)). 63
Методика составления уравнений элементов автоматического регулятора аналогична рассмотренной ранее методике со- ального закона изменения величк- ставления уравнений объектов. Во всех уравнениях Т представляет собой постоянную времени регулятора. В случае экспоненциального (инерционного) процесса постоянная времени Т может быть определена известным способом, показанным на рис. 3.4. С точки зрения физики процесса постоянная времени экспоненци- Рис. 3.4. Определение постоянной времени инерционного процесса ны х представляет собой то время, через которое эта величина достигла бы своего конечного значения (являющегося ее пределом в бесконечности) в случае, если бы она изменялась с постоянной скоростью, равной скорости ее изменения в начальный момент, т. е. если бы крив-ая изменения х, начиная с этого момента, совпадала с касательной (к экспоненте), проведенной в ее начальной точке. 3.3. Свободные и вынужденные колебания САР. Частотные характеристики Система линеаризованных дифференциальных уравнений, описывающих физические процессы элементов САР, может быть сведена к одному дифференциальному уравнению путем исключения промежуточных координат, кроме одной: dnx ~h dmf л-h dm~ dx dt dtm-i C.8) Здесь f(t)—входное воздействие; x(t)—изменение выходной величины; щ, bt — постоянные величины, которые определяются физическими (техническими) свойствами системы. Уравнение C.8) описывает физические процессы, т. е. изменение переменных х и /, в замкнутой системе регулирования. Его решение может быть: 1) общим, когда правая часть уравнения C.8) равна нулю, т. е. d"x dn-1x , dx -j-fl, 1F = aox= C.9) 2) частным, когда это уравнение представляет собой выражение, которое, будучи подставлено в его левую часть, дает правую, т. е. обращает уравнение в тождество. 64
Общее решение уравнения C.9) для случая ап—ап-\=... . . . =а2=0 находим в виде x{t)=e-*. (зло) Решение такого вида уравнения C.9) позволяет определять свободное движение системы, т. е. колебания, которые совершает система, выведенная из состояния равновесия некоторым воздействием после того, как это воздействие стало равным нулю. Подставляя выражение C.10) в C.9), получим (Д"+Я' + ++)' 0 +) Выражение C.10) является решением уравнения C.9) при условии, что % — корень характеристического уравнения: Д1 Так как последнее уравнение имеет п различных корней (Хи Яг,..., Кп), то общее решение уравнения C.9) может быть представлено в виде х (t) = С,е;-' + С2е*-' + • • • + С„е*»', где Си С2,..., Сп — постоянные, зависящие от начальных условий. Решение уравнения C.9) удовлетворяет условию \\mx(t)=0, f-«-co т. е. свободные колебания системы с течением времени затухают только в том случае, если все корни %t характеристического уравнения имеют отрицательные вещественные части. Вычисление вынужденных колебаний. Пусть воздействие f(t) представляет собой гармоническую функцию времени, т. е. линейную комбинацию sin at и cos at: /@=foCOs(coH-(p), где со — угловая частота воздействия; /0 — амплитуда; ф — фаза. Если начальная фаза фо=О, то f(i)=focos(ot. Гармоническую функцию можно рассматривать и как сумму двух экспонент: / @ = /0 cos wt == ? е>»' 4-4s e~Jat, J = У~-^¦ Последнее удобно с математической точки зрения, так как производная и интеграл — тоже экспоненциальные функции. Считая данную систему линейной, применяют к ней принцип суперпозиции и определяют реакцию, создаваемую каждой из экспоненциальных функций в отдельности. При f{t) = ^eJ(at частное решение уравнения C.8) имеет вид 5—3591 65
Подставляя выражения f(t) и X\a(t) в уравнение C.8), получим и, следовательно, 1 т... J- й, (/со) I- ь0 «и-, (/ш)"-1 -- ¦ • • -:- ал (./со) 4- в. " ^ И' Последнее выражение может быть представлено через амплитудную Л (со) и фазовую <р(со) частотные характеристики системы: (/)() Подставляя выражение У (/со) в формулу для *iB@ запишем @4()jr'+«>] Если в уравнении C.8) f (t) = ^ е~*®', то вынужденные колебания или Когда /(/)—гармоническое воздействие, т. е. /(/)=/0cosco/, то *в @ = JCib (/) +^2в @ = -' Л (со) [е'-'е«->+ C.12) +e-J"f e-J«e)]=»M (to) cos (©f+ф (и»)). Выражение C.12) показывает, что вынужденные колебания, вызываемые в линейной динамической системе гармоническим воздействием, представляют собой также гармоническую функцию времени, имеющую ту же круговую частоту со, что и воздействие, но отличающуюся по амплитуде и по фазе. При этом относительная амплитуда и фаза вынужденных колебаний определяются амплитудной Л (со) и фазовой <р(со) частотными характеристиками. Если в выражении для функции У (/со) C.11) в числителе и знаменателе отделить вещественную часть от мнимой, то оно может быть записано где а (со) =6о—Ь b(co)=bito—6 с (со) =а0— d(a) = aid)—азсо3+а5со5 —... . 66
Выражение C.13) может быть представлено в виде у / ¦ ч _ . а (со) с (ад)- Ь (а>) d (со) . Ь (со) с (си) — a(a>)d (со) ^ '"" c2(co) + tf2(co) "г-7 с2 (со) |- d2 (со) ПЛИ Y(/co)=P(co)+/Q(co), где Р(со), Q(co)—вещественная и мнимая частотные характеристики системы соответственно: _ P(a) = (ac+bd)/(c2+d2); Q(co) = (bc-ad)/(c2+d2). Амплитудная и фазовая частотные характеристики САР определяются выражениями: А (со) = V (a2+b2)I{c2+d2), Ф (to) =arctg [{be—ad)/{ac+bd)]. Частотные характеристики Л (со) и ср(со) связаны с характеристиками Р(со) и Q(co) следующими соотношениями: Р(а)=А((о) ¦ cosф(со); Q(и)=Л(co)•sinф(ffl); На основе выражения C.12) можно экспериментально определить амплитудную и фазовую частотные характеристики линейной системы. Для зто- io к системе прикладывается гармоническое воздействие xBn(t) =cosa>f, М = 1), имеющее угловую частоту со. В результате в системе возникают переходный процесс и вынужденные колебания с частотой со. Через некоторое время произойдет затухание переходного процесса, если система Динамическая система или звено Рис. 3.5. Экспериментальное определение частотных характеристик динамической системы (динамического звена): а — система или звено; б — процессы на входе и выходе 5* 67
устойчива, и останутся лишь вынужденные колебания. Они будут иметь час- TOiv 1.1. ранную частоте воздействия, но отличаться от входного воздействии" по амплитуде и фазе (рис. 3.5). Амплитуда выходного сигнала и угол сдвига фазы исходного сигнала хиЫх = Л(о))-cos[@^-f(p(<o)l по отношению к входному з;:н.1сят от угловой частоты м. На рис. 3.0 приведена схема включения контрольно-измерительной аппаратуры для определения частотных характеристик, которая позволяет генерировать синусоидальные входные колебания различной частоты, измерять амплитуду колебании на входе и выходе системы, а также сдвиг фазы между этими колебаниями. Для экспериментального определения частотных характеристик используют специальную низкочастотную аппаратуру, так как САР — обычно низкочастотные системы. В состав аппаратуры входят, например, следующие нрпборы (см. рис. 3.6): Рис. 3.6. Схема включения измерительной аппаратуры для определения частотных характеристик низкочастотный генератор периодических колебаний (НГТЩ для генерирования как входных колебаний синусоидальной, прямоугольной, треугольной трапецещальных форм, так и одиночных импульсов тех же форм; 'низкочастотный фазометр-частотомер (НФ) для определения частоты и фазы колебаний, которые измеряются с помощью счета импульсов стандартной частоты A00 кГц) за время одного периода при измерении частоты и за время между двумя смежными прохождениями через нуль кривых входного и выходного напряжений при измерении фазы; двойной пиковый вольтметр (ДПВ) для измерения амплитуды на входе и выходе системы; П1 и П2— преобразователи сигнала. Приборы рассчитаны на напряжения ±100 В и диапазон частот от 0,001 до 100 Гц. Кривые отношения амплитуды выходной переменной Хпых к амплитуде воздействия АТв* и сдвига фазы между ними в зависимости от частоты представляют собой амплитудную и фазовую частотные характеристики САН соответственно. В зависимости от условий эксплуатации системы иногда удобно подавать на ее вход колебания прямоугольной формы (включение— выключение) и треугольной (равномерное открытие и закрытие регулирующего устройства) и т. п. 3.4. Передаточная функция непрерывной линейной стационарной системы и ее свойства В теории автоматического регулирования широкое применение получил способ математического описания, основанный на понятии передаточной функции. Как уже отмечалось, физические процессы в системе (или элементе системы) автоматического регулирования в общем случае описывают линейным уравнением C.8). 68
Пусть воздействие f{i) удовлетворяет условиям: =0; t<0; где с—абсцисса абсолютной сходимости. Тогда преобразование Лапласа для функции f(t) ¦ос Пели все члены уравнения C.8) при нулевых начальных условиях умножить на e"st и проинтегрировать в пределах от 0 до оо, то получим C.14) = (b^-hb^s"-^ ... +bis+bo)f(s), где ) о Следовательно, X(s) = Y{s)F{s), где оператор ^>" F(s) является передаточной функцией динамической системы. Согласно выражению C.15), передаточной функцией непрерывной линейной стационарной динамической системы называют отношение преобразования Лапласа X(s) переменной x(t) на выходе системы к преобразованию Лапласа F (s) воздействия f(t) на ее входе при нулевых начальных условиях. Передаточная функция полностью характеризует динамические, а также статические свойства системы. Зная передаточную функцию системы и вид воздействия, можно определить переходный процесс на выходе системы. Передаточные функции устойчивых динамических систем обладают следующими основными свойствами: 1) передаточная функция Y(s) представляет собой дробно- рациональную функцию вида C.15), причем в реальной системе порядок т числителя не превышает порядок п знаменателя; 2) все коэффициенты bo, b\,... ,bm~i, bm, по, ai,...,an-u an передаточной функции вещественны. Это следует из того, что они представляют собой функции параметров системы, т. е. могут быть только вещественными; 3) невещественные нули и полюсы передаточной функции могут быть лишь комплексно-сопряженными; 69
4) все полюсы передаточной функции Y(s) расположены в левой полуплоскости комплексной плоскости, что является условием устойчивости системы; 5) при s=j(n передаточная функция C.15) преобразуется в амплитудно-фазовую частотную характеристику системы, а при s=0 — в передаточный коэффициент (для позиционных звеньев). \/(t) g(t) r*?W *1M r(t) W.(s) x(t) Рис. 3.7. Схема CAP: W i, (s) — передаточная функция объекта регулирования; W (s) — передаточная функция регулятора Передаточные функции САР. Общие дифференциальные уравнения рассматриваемой линейной САР, приведенной на рис. 3.7, можно записать в виде: D(p)x(t)=M(p)f(t)+C(p)r(t) —для объекта регулирования, C.16) # (р) r(t)=N (р) е @ — для регулятора, C.17) e(t)=g(t)—x(t)—уравнение ошибки. C.18) Применяя к уравнениям C.16) — C.18) преобразование Лапласа, обозначим X (s) =\x(t) e-stdt; E (s) ==^e (t) e~stdt; о о G (s) =- \ g (t) e-«dt; R (s) = jj г (t) e~°<dt; о о Учитывая начальные условия Мв1 и МК2, уравнения C.16) — C.18) можно представить в виде ?> (s X (s) = M(s)F E) + С (s) R (s) + Мл (s); C.19) Если из уравнений C.19) исключить функции R(s) и E(s) и выразить эти уравнения относительно X(s), то 70
N (s) С (s) G (s) -!¦ В (s) M (s) /•- (s) -+- Mn (s) Нсли из уравнений C.19) исключить функции R(s) и ii выразить эти уравнения относительно E(s), то Fl4\ D (s) B (s) G<s)~B(s) M (s) F (s)—Mn (s) K) I) (s) В (s) - С is) N (s) • Разделии нес члены уразнений C.20) и C.21) на D (s) В (s) получим W{s) G is) - V (s) F Is) ' Vn{s) U(S> ¦ 1 --W(s) r{-S)~- 1 t-W(s) ' O(s) V{s) Fi-:) Vh(s) ?() O(s) Fi:) где W(c). - C(s)N(s) . „ . _M(s). у {)_ MH(s) W W-~ D(s)B(s) ' V(S'~D(s)' v»ys>— D(s)B(s) ¦ Первое слагаемое в правой части выражений C.22) и C.23) характеризует собой эффект управляющего воздействия g(t); второе — эффект возмущающего воздействия /@; третье слагаемое— эффект начальных условий. В случае нулевых начальных условий формулы C.22) и C.23) могут быть переписаны в следующем виде: X(s)=<l>(s)G(s) + Y(s)F(s); E(s)=d>.{s)G(s)-Y{s)F(s), Д^% ^%; C-24) т. C.25) Если возмущающее воздействие f(t)=O, то X(s)=O{s)G(s) X (s) и (D(s)=:j— , т. е. функция G>(s), определяемая выражением C.24), является передаточной функцией замкнутой САР по отношению к управляющему воздействию g(t). Если управляющее воздействие g(/)=0, то X(s) = Y(s)F(s) и Y(s)=X(s)/ /F(s), т. е. функция Y(s) представляет собой передаточную функцию замкнутой САР по отношению к возмущающему воздействию f{t). Функция Фе (s) = G {) ' , определяемая C.2?>), называется передаточной функцией ошибки, или рассогласования. Если САР (см. рис. 3.7) разомкнуть в точке А (чувствительный элемент, измеряющий разность между входом и выхо- 71
дом, будет отключен от регулируемой переменной), то уравнение ошибки C.18) перестанет существовать, а уравнение регулятора будет иметь вид B(p)r(t)=N(p)g(t) или В (s)R (s)=N (s) G(s). C.26) Если уравнение C.26) разрешить относительно R(s) и результат подставить в уравнение для объекта C.16), то для разомкнутой системы X 1*\~ M{s) Fl-Л ¦ ^E)C(S) т* лр^>" о (s) h W ~- в (s) D (s) U (-s>- Если возмущающее воздействие f(t) = 0, то Хр (s) N (s) С (s) G(s) B(s)D(s) -=W{s), C.27) т. е. функция W{s) представляет собой передаточную функцию разомкнутой САР по отношению к управляющему воздействию g(t). Когда управляющее воздействие g(/)=0, Х„ (s) M (s) vw C28> т. е. функция C.28) представляет собой передаточную функцию разомкнутой САР по отношению к возмущающему воздействию fit)- 3.5. Типовые звенья САР При анализе различных свойств САР вводят в рассмотрение понятие типовых линейных звеньев как некоторых составных частей динамических элементов системы. Разнообразные элементы систем регулирования можно описывать одинаковыми дифференциальными уравнениями и, следовательно, иметь одинаковые передаточные функции. Коэффициенты, входящие в выражения для передаточных функций, непосредственно связаны с конструктивными параметрами этих элементов. Типовые звенья с различными передаточными функциями характеризуются определенным процессом, возникающим при изменении входного сигнала (воздействия). Для сравнения временных характеристик этих звеньев принято рассматривать переходный процесс при скачкообразном изменении входного сигнала на одну единицу (при нулевых начальных условиях), т. е. при единичном ступенчатом воздействии. Функцию, определяющую изменение переменной на выходе звена при этих условиях, называют переходной функцией звена. Она может быть получена экспериментально, путем регистрации изменения выходной величины при скачкообразном изменении входной. Эту функцию иногда называют кривой разгона. 72
X7i Xi(t) Рис. 3.8. Временные характеристики усилительного звена: а - нхо,чпос ступенчатое воздействие; о — переходная функция Частотные характеристики типовых звеньев могут быть определены из соответствующих дифференциальных уравнений (передаточных функций), а также экспериментально. Можно указать семь видов типовых звеньев: усилительные (безынерционные), апериодические (инерционные), колебательные, интегрирующие, дифференцирующие 1-го порядка, дифференцирующие 2-го порядка, запаздывающие. Усилительное звено. Воспроизводит входной сигнал без искажения и запаздывания, но с изменением масштаба (увеличивая его или уменьшая). Передаточная функция усилительного звена W(s) =k. Зависимость между выходной и входной величинами: xz==kx\. При подаче на вход усилительного звена единичного ступенчатого воздействия X\{t) = \[t] сигнал *г@ на его выходе изменяется мгновенно (рис. 3.8). АФХ определяется выражением W(j(a)=k и изображается точкой на действительной оси комплексной плоскости. Апериодическое (инерционное) звено описывается дифференциальным уравнением 1-го порядка: 7 -dT + Xi = kxu C.29) где Х\ — величина на входе звена; х2 — на выходе. Уравнению C.29) соответствует передаточная функция W{-S^T7TT' C.30) где k — передаточный коэффициент (для нормированной передаточной функции k=\); T — постоянная времени. На рис. 3.9,а входной величиной является напряжение Ux на входе RC-фильтра, выходной —напряжение U2 на его выходе. На рис. 3.9,6 входной величиной является давление газа в магистрали Рь выходной —- давление ! аза в резервуаре Р2. На рис. 3.9, в входной величиной является температура жидкости Ti, выходной —температура т2 тела, опущенного в жидкость. Переходная функция h(t) устойчивого апериодического звена для случая, когда хх в C.30) представляет собой единичное ступенчатое воздействие дс, (/) = !(*), определяется выражением 73
Xi'P,(t) *"D0 - Вентиле XfP2\t. a 5 8 Рис. 3.9. Примеры апериодических звеньев: а — электрический НС-фильтр; б— резервуар с сжатым газом; в — ироцесс закалки детали в жидкости Эта функция изображена на рис. 3.10 в виде кривой /. Неустойчивое апериодическое звено имеет передаточную функцию которой соответствует переходная функция показанная на рис. 3.10 в виде кривой 2. x(t) Рис. 3.10. Временные характеристики апериодического звена: а — иходное ступенчатое воздействие; б — переходные функции устойчивого звена A) и неустойчивого B) Частотные характеристики апериодического звена могут быть получены из выражения для передаточной функции C.30) путем формальной замены s аргументом /со: У +1 . g—j arctg 7"co C.31) Модуль этой функции представляет собой амплитудную частотную характеристику (АЧХ) апериодического звена 74
Аргумент функции C.31) является фазовой частотной характеристикой (ФЧХ) апериодического звена, т. е. О (со) =—arctgrco. Кривую (рис. 3.11), описываемую концом вектора Щ/со) на комплексной плоскости, или годограф вектора W(j<x>), при из- JV(W)\ Ш*2 Рис. 3.11. АФХ апериодического звена менении частоты от —с» до -f-oo называют амплитудно-фазовой частотной характеристикой (АФХ) звена. АФХ апериодического звена при положительных значениях частоты (со>0) представляет собой полуокружность, диаметр которой равен передаточному коэффициенту k. При частоте ю, стремящейся к бесконечности, выходной сигнал отстает от входного на 90°. Колебательное звено. Динамические свойства устойчивого колебательного звена описывают дифференциальным уравнением 2-го порядка: „ 2 1 к dXz df" C.32) Дифференциальные уравнения неустойчивых колебательных звеньев имеют вид j, 2 d*X2 1 к ~4tr i y "ТЛ2 C.33 к dt2 к dt где хи х2 — величины на входе и выходе соответственно; ТК — постоянная времени; |к — коэффициент относительного демпфирования @<|к<1); k — передаточный коэффициент. Согласно уравнению C.32) колебательное звено имеет передаточную функцию W(s)— C.34) I о
Передаточные функции неустойчивых колебательных звеньев из уравнений C.33): ^(«)==-гтл=о^ггт, C.35) = TKV»,-2*^-1 • C-36) Примеры колебательных звеньев приведены на рис. 3.12,а и б. ГГЦ ~A Рис. 3.12. Примеры колебательных звеньев: а — М-С-колебательный контур; б—механическая система (т —масса, h y — коэффициент упругости пружины; с—коэффициент демпфирования) Переходную функцию устойчивого колебательного звена определяют в соответствии с уравнением C.32): ^3Z)] C.37, Переходная функция неустойчивого колебательного звена, например C.36), h{t) = ¦+arctg- C.38) Ступенчатое воздействие на входах и соответствующие переходные функции C.37) и C.38) устойчивого и неустойчивого колебательных звеньев изображены на рис. 3.13. Следует отмстить, что колебания возникают лишь Рис. 13. Временные характеристики колебательного звена: а — входное ступенчатое воздействие; б — переходные функции устойчивого звена (/) и неустойчивого B) 76
у том случае, если корни характеристического уравнения являются комплексными величинами, т. е. когда 5к2—КО. Для устойчивого колебательного звена 0<г„<1. При ск>1 колебательное звено может быть представлено в виде двух апериодических звеньев с постоянными времени 71, и Г2; если |к —1, то апериодические звенья имеют одинаковую постоянную времени, т. е. 7"i = r2. Если коэффициент демпфирования |к = 0, то передаточная функция звена имеет вид W(s)= C.39) Система, имеющая передаточную функцию вида C.39), называется консервативной; такая система не рассеивает энергию и в ней протекают незату- лаюшие колебания. Когда коэффициент |к<0, то выходные колебания с течением времени возрастают. Такое звено является неустойчивым колебательным звеном. Частотные характеристики устойчивого колебательного звена имеют вид —j arctg I -Г C.40) Модуль функции C.40) является АЧХ колебательного звена- Я (со)-- к V{\— 7УшгJ + 4?к!!7уш! Аргумент функции C.40) представляет собой ФЧХ: jv(uj) АФХ звена (рис. 3.14) начинается на действительной оси в точке k ьри ш = 0. При частоте со->-оо кри- г.ая подходит к началу координат, касаясь действительной оси. Выходной гармонический сигнал при частоте, стремящейся к бесконечности, отстает от входного на 180°. Интегрирующее звено. Дифференциальное уравнение этого звена имеет вид ЧГ = Ь*. C.41) Интегрирующему звену соответствует передаточная функция W(s) = -y, C.42) где k — передаточный коэффициент (отношение скорости изменения выходной величины к входной величине). Рис. 3.14. АФХ колебательного звена 77
Из уравнения C.41) следует, что значение скорости выходной переменной интегрирующего звена пропорционально значению входной величины. На рис. 3.15, а изображена схема электродвигателя постоянного тока, у которого входным сигналом является управляющее напряжение X\ = UV, a выходным — угол поворота якоря х2=8. При этом не учитываются электри- Рис. 3.15. Примеры интегрирующих звеньев: а — электродвигатель постоянного тока; б — резервуар с входным трубопроводом ческая и механическая инерционности электродвигателя. На рис. 3.15,6 показан резервуар, в который поступает поток жидкости Xr—Q; выходной величиной является высота уровня x2=h. Переходную функцию интегрирующего звена, согласно уравнению C.41), определяют с помощью выражения h(t)=kt. График этой функции приведен на рис. 3.16,6. x,lt) W(M Ш-" U (U) Рис. 3. 16. Временные характеристики интегри- Рис. 3.17. АФХ интегрирующего звена: рующего звена а — входное ступенчатое воздействие; б — переходные функции: / — при fti = I, 2 —при Й2= 10 Частотные характеристики интегрирующего звена C.42) при / "~е~32. C.43) При изменении частоты а от 0 до оо (рис. 3.17) конец вектора №(/со), согласно C.43), движется по отрицательной части мни- 78
мой оси от —оо до 0. Интегрирующее звено создает отставание выходного гармонического сигнала от входного на 90° при всех частотах. Амплитуда выходного сигнала уменьшается с возрастанием частоты. В САР интегрирующее звено выполняет роль астатического элемента. Порядок астатизма системы зависит от числа интегрирующих звеньев в прямой цепи контура регулирования. Дифференцирующее (форсирующее) звено 1-го порядка описывается уравнением C.44) а именно выходная переменная Xi определяется не только текущим значением, но и скоростью изменения входной переменной, г. е. ее производной. Уравнению C.44) дифференцирующего звена соответствует передаточная функция W(s)=k(js+\). C.45) Здесь, в выражениях C.44) и C.45), k — передаточный коэффициент звена; т — постоянная времени. Переходную функцию дифференцирующего звена 1-го порядка определяют с помощью выражения где 6@ —дельта-функция. График переходной функции C.46) показан на рис. 3.18,а. При скачкообразном изменении входного воздействия на выходе hit) h(t) U(ui) Рис. 3.18. Динамические характеристики дифференцирующего звена 1-го порядка: а —переходная функция; б — АФХ дифференцирующего звена получается импульс бесконечно большой амплитуды, соответствующий бесконечно большой скорости изменения входного воздействия в момент скачка. После этого выходная величина принимает постоянное установившееся значение. 79
Частотные характеристики дифференцирующего звена 1-го порядка имеют следующий вид: W (ум) - к |" rV+Te/arcf*T'°. C.47) Модуль этой функции является амплитудно-частотной характеристикой И (и):- k V т2ы- + 1. C.48) а се аргумент представляет собой фазовую частотную характеристику звена O(w)=arctgxco. C.49) АФЧХ дифференцирующего звена 1-го порядка (рис. 3.18,6)—прямая, параллельная мнимой оси и начинающаяся на действительной оси в точке К при частоте со = 0. Идеальному дифференцирующему звену соответствует передаточная функция W(s)=ks, которая может быть получена из уравнения C.44), если в его правой части принять л;1 = 0. Пример такого звена — тахогенератор постоянного тока (рис. 3.19, а), если рассматривать установившийся режим Рис. 3.19. Примеры дифференцирующих звеньев 1-го порядка его работы. Входной величиной хх является угол поворота 0 вала якоря тахогенератора, а выходной х2 — напряжение Utt- Это напряжение пропорционально угловой скорости Q = dO/dt якоря тахогенератора. Поэтому, согласно уравнению Urr=k^dQjdt, передаточная функция тахогенератора Свойством дифференцирования входного сигнала обладает электрический RC-фильтр (рис. 3.19,6), имеющий передаточную функцию Г E)= к (s) Ts ¦As) Ts числитель которой характеризует дифференцирование входного напряжения, а знаменатель — электрическую инерционность фильтра. Как следует из формулы C.47), дифференцирующее звено создает опережение выходной величины по фазе. При частоте ы^оо сдвиг по фазе приближается к 90°. Наличие дифференцирующего звена 1-го порядка в основном контуре системы регулирования означает введение производной в закон регулирования и применяется для улучшения динамических свойств системы. 80
Следует обратить внимание, что выражения C.48) и C.49), определяющие ЛАЧХ и ЛФЧХ дифференцирующего звена C.45), являются обратными по отношению к соответствующим характеристикам апериодического звена C.30). Дифференцирующее звено 2-го порядка. Дифференциальное уравнение такого звена имеет вид -аГ + Xi)- C.50) =- k Здесь выходная величина определяется не только входной переменной, но также первой и второй производными от нее. Звено характеризуется тремя параметрами — передаточным коэффициентом k, постоянной времени rd и параметром %d. Уравнению C.50) соответствует передаточная функция W(s)=ft(t;s2+2Us+l)- C.51) Предполагается, что выражение C.51) нельзя разложить на простые множители, т. е. представить в виде двух выражений первой степени. Передаточная функция C.51) является обратной по отношению к передаточной функции C.34) колебательного звена. Переходную функцию дифференцирующего звена 2-го порядка определяют с помощью выражения h(t) = k {т/ (t) C.52) График переходной функции C.52) изображен на рис. 3.20,а. f>'t)k | It Ш) 1 \ а«о) Рис. 3.20. Динамические характеристики дифференцирующего звена 2-го порядка: а — переходная функция; б — АФХ Если входное воздействие изменяется скачкообразно, то на выходе получаются импульсы бесконечно большой амплитуды, соответствующие бесконечно большой скорости изменения входного воздействия и его производной в момент скачка. Затем выходная величина принимает постоянное значение. Частотные характеристики идеального дифференцирующего звена 2-го порядка описывают формулой 6—3591 81
/arctg C.53) Модуль функции C.53) является амплитудно-частотной характеристикой Я (со) = k /A-t/co2J + ( а ее аргумент представляет собой фазовую частотную характеристику АФХ дифференцирующего звена 2-го порядка представляет собой параболу, которая начинается из точки К (рис. 3.20,6). Дифференцирующее звено 2-го порядка при частотах, стремящихся к бесконечности, вносит опережение по фазе, стремящееся к 180°. Это звено необходимо для введения первой и второй производных в закон регулирования для улучшения динамических свойств системы. Запаздывающее звено. Описывают уравнением X2(t)=X1(t—То). C.54) которое показывает, что входной сигнал воспроизводится на выходе запаздывающего звена без искажений, но с запаздыванием то (рис. 3.21,а).  */ хМ)jh.it) U(uj) Рис. 3.21. Динамические характеристики запаздывающего звена: а — входной сигнал x,(.t) и реакция звена x2(t); б — АФХ Уравнению C.54) могут соответствовать: трансцендентная передаточная функция C.55) частотная характеристика 82
W (j a) ="*-* C.56) где то — постоянное запаздывание. Амплитудно-частотная характеристика запаздывающего звена #((о) = 1, фазово-частотная характеристика 0(ю)=—тою. Согласно формулам C.55) или C.56), АФЧХ представляет собой окружность единичного радиуса с центром в начале координат (рис. 3.21,6). При увеличении частоты вектор W(ja>) вра- шается по часовой стрелке. На рис. 3.22, о изображена схема системы регулирования концентрации смеси компонент Л и В. Датчик (Д) измеряет состав смеси и через время io = ljV в зависимости от состава смеси регулирующее устройство (Р) воз- Рис. 3.22. Примеры САР с запаздывающим звеном действует на заслонку, открывая или закрывая ее. (Здесь / — расстояние измерительного элемента Д от заслонки; V — скорость движения жидкости). На рис. 3.22, б изображена схема САР толщины проката. Регулирующее воздействие поступает на валки через время xo=llV (где I — расстояние Д от валков, V — скорость проката). Большинство звеньев САР обладает направленным (детектирующим) действием. В общем случае выражение для передаточной функции последовательно соединенных звеньев имеет следующий вид: П i=\ а 1I1 1=1 ¦ e-T»5, C.57) где П — знак произведения. Выражение C.57) состоит из произведения передаточных функций типовых звеньев, рассмотренных ранее. 3.6. Логарифмические частотные характеристики Исследование САР значительно упрощается, если пользоваться не обычными, амплитудно-фазовыми частотными характеристиками, а логарифмическими. 5* 83
Амплитудно-фазовые частотные характеристики системы C.57) определяются с помощью выражения: )=tf((o)eW, C.58) где Н(со)—амплитудная частотная характеристика; 0 (со) — фазовая. Прологарифмировав выражение C.58), получают In Г(/со)=1пЯ(ш)+/6((в). Кривые, соответствующие функциям In Я (со), 0 (со) и построенные в логарифмическом масштабе частот In со, называют натуральными логарифмическими (амплитудной и фазовой) частотными характеристиками (ЛЧХ). На практике обычно пользуются ЛЧХ, основанными на десятичных логарифмах. Рассмотрим ЛЧХ системы, описываемой выражением C.27). Логарифмической амплитудной частотной характеристикой (ЛАЧХ) разомкнутой системы №(/со) называют кривую, соответствующую двадцати десятичным логарифмам модуля передаточной функции, построенную в логарифмическом масштабе частот. ЛАЧХ обозначают через Lm(co) или L| W(/co) |: Lm (со) =201gl W(/©) I = L| W(/со) I. C.59) Логарифмической фазовой частотной характеристикой (ЛФЧХ) разомкнутой системы W(ja) называют фазовую частотную характеристику 6(со), построенную в логарифмическом масштабе частот. Логарифм модуля передаточной функции системы W(jq) отсчитывают в децибелах1. Двукратному изменению частоты соответствует октава, а десятикратному — декада. Число октав в интервале частот (юг ¦ • ¦ coi) определяют соотношением lg(<B2/fl>i)/lg2«3,32a>2/<»i, число декад в том же интервале частот составляет Ig(co2/©i). Рассмотрим логарифмические частотные характеристики типовых звеньев САР. Усилительное звено. Так как передаточная функция усилительного звена W(s) =k, то ЛАЧХ и ЛФЧХ этого звена не зависят от частоты и их определяют по формулам Lm(co) =201g&= const и 0(to)=0 во всем частотном диапазоне. Апериодическое звено. Частотную характеристику апериодического (инерционного) звена определяют по формуле 1 Децибел, заимствован из теории связи, где он является единицей измерения усиления или затухания. Если усиление или затухание определяется числом к, то это соответствует 201gfe децибелам. В теории связи децибел является безразмерной величиной. В теории автоматического регулирования децибел выражает 20 десятичных логарифмов отношения амплитуды выходной величины к амплитуде воздействия на его входе. Эти величины могут иметь разные размерности. 84
Логарифмические амплитудную и фазовую частотные характеристики апериодического звена при k=\ определяют в соответствии с выражениями C.59) и C.60) по следующим соотношениям: Lm(<o)=201gVr2GL-l; C.61) 9(со)=— arctgToi. C.62) Если в выражении C.61) для Lm(a)) пренебречь величиной Г2и2 по сравнению с единицей в частотном диапазоне, в котором Та>^. 1, и пренебречь единицей по сравнению с Т2®2 при Тш^\, то Lm (со) =—20 щУтга>2+ 1 «0, Lm (а) га — 20 lg Та. 7"со>1;| C.63) Lm(co)s=—20 lg "j/^2 =—3 дБ, Та>=1.1 Соотношения C.63) показывают, что ЛАЧХ апериодического звена Lm(co) приближенно может быть представлена двумя прямолинейными отрезками (асимптотами ЛАЧХ): Lm(co)ssO, со<1/Г; Lm(ci))=—201g7\o, coSsl/Г, которые сопрягаются друг с другом при частоте &>а = 1/7\ Эта частота называется сопрягающей. Максимальная ошибка, которая допускается при такой аппроксимации, имеет место при сопрягающей частоте и составляет —3 дБ, т. е. Lm(co)=— 20 lg 1/П+1_._; Наклон, который имеет асимптота при частотах (о>о). по отношению к оси частот, определяют следующим образом: При G)j>COa Lm((o()=— 201g7"W(, при @ = 2@, LmB(ai)=—20]g2T<o(. Следовательно, Lm Ba t) —Lm (и,)= —201g 2^—6. При двухкратном изменении частоты характеристика затухания апериодического звена Lm(co) уменьшилась на 6 дБ, или асимптота имеет наклон, равный —6 дБ на октаву. Если изменить частоту сз* на декаду, т. е. ш=10@;, то LmA0(o,)=-201gl0r(o,-, LmA0coi)— Lm(@i) =—20. На рис. 3.23 приведены ЛАЧХ и ЛФЧХ апериодического звена, вычисленные по точной (сплошная линия) и приближенной (штриховая линия) формулам. Вне интервала, равного двум октавам вправо и влево от сопрягающей частоты, обе характеристики (точная и приближенная) не отличаются друг от друга. Значения ошибки б для различных отношений ш/оза, которые получаются при замене точной ЛАЧХ двумя сопрягающими асимптотами, следующие: (о/<Оа... 0,10 0,25 0,40 0,5 1,00 2,0 2,50 4,00 10,0 б, дБ...0,04 0,32 0,65 1,0 3,01 1,0 0,65 0,32 0,04 85
-10 -20 -30 -50 0,1 ш/ша- f,0 10 ЮОв(ш)° 0,01 в(ш) L(w) ¦20 -40 -60 ¦80 -90 Рис. 3.23. Логарифмические характеристики апериодического звена: L(to)—ЛАЧХ; fi(co)—ЛФЧХ ш/ша а -1 -г -3 —* s > / / f > = = ¦¦ 0,1 0,1 0,5 2,0 1,0 жТаи> 5,0 10 шТ Рис. 3.24. Кривые зависимости поправки б апериодического звена от отношения <о/<ва На рис. 3.24 показана кривая зависимости поправки б от отношения ш/соа, ЛФЧХ апериодического звена определяют по формуле C.62), т. е. 9(со)=—arctg(co/«a). C.64) В логарифмическом масштабе частот эта характеристика является кососим- метричной относительно сопрягающей частоты wa, при которой она имеет ординату —45° (см. рис. 3.23). Для построения ЛФЧХ можно пользоваться тригонометрическими таблицами. Так, например, при со/соа<0,5 фазовая характеристика C.64N(со)з=<в/соа: при ш/ша>2 0(<в)« — (л/2—ш/соа). Эти формулы получают разложением в ряд arctg ш/ша при отбрасывании членов выше 1-го порядка малости. Неустойчивое апериодическое звено. Частотные характеристики неустойчивого апериодического звена при ?=1 могут быть описаны выражением Сравнив это и выражение C.60), видим, что логарифмические амплитудные характеристики устойчивого и неустойчивого апериодических звеньев совпадают, а фазовые отличаются друг от друга. ЛФЧХ устойчивого апериодического звена при малых значениях ш асимптотически стремится к нулю, а при <в-»-оо к (—я/2). ЛФЧХ неустойчивого звена при малых значениях со асимптотически стремится к (—л), а при со—>-<» к (—я/2). Эти характеристики строят по тем же правилам, что и характеристики устойчивого апериодического звена. 86
Устойчивое колебательное звено. Логарифмические амплитудная и фазовая частотные характеристики устойчивого колебательного звена определяют с помощью выражений: C.65) Lm (со) = -20 lg 7Yto2J + BgK7»2; C.66) Семейство кривых Lm(a>) и 0(ш) для различных значений ?к коэффициента демпфирования Тк=const показано на рис. 3.25 и 3.26. Значения ЛФЧХ колебательного звена при |к=0,5 даны в табл. 3.1. Кривые Lm(co) в зависимости от значения gK могут иметь существенный пик при Гксо=1. Поэтому представить Lm(co) в виде сопрягающих прямолинейных отрезков в окрест- дб 10 -ю -20 -30 ¦ ¦ _. 1 ¦ S т — — 1—- 1 —• 1 ^Зсст^^.^ 0, SO щ к. \ ч 4 \ 0,1 0,2 0,3 0,4- 0,5 0,1 0,1 1,0 Z 3 * 5 6 В Рис. 3.25. ЛАЧХ колебательного звена при различных нзачениях |к щ из в* as 0,6 as w г з * 5 б Рис. 3.26. ЛФЧХ колебательного звена при различных |к шТ 87
Таблица 3.1 ЛФЧХ колебательного звена @ 0,01 0,04 0,06 ом 0,10 0,20 0,30 0,40 ф,° —0,6 —2,3 —3,4 —4,6 —5,8 —11,8 —18,3 —25,4 ю . »к 0,5 0,6 0,7 0,8 0,9 1,0 1,1 ф.° —33,7 —4 i, 1 —53,9 —65,8 -78,1 —90,0 —100,8 @ юк 1,25 1,50 2,00 3,00 4,00 5,00 6,00 ф.° —114,2 —129,8 —146,3 —159,4 —165,1 —168,2 -170,3 @ 7,0 8,0 9,0 10,0 20,0 30,0 50,0 100,0 ф,° —171,7 -172,8 —173,6 —174,2 -177,1 -178,1 —178,8 -179,4 ностях точки Тка>=1 не всегда возможно. Однако при значениях со<1/Гк и <й^>1/7"к ЛАЧХ C.65) может быть приближенно заменена прямыми линиями, т. е. Lm(co)«0, Lm(co)«— 20lg (Гк(оJ, со>1/Гк. ЛАЧХ колебательного звена при малых значениях со асимптотически стремится к оси частот (т. е. к прямой, имеющей нулевой наклон), а при больших — к прямой, имеющей наклон —12 дБ на октаву или —40 дБ на декаду. Для облегчения построения логарифмических частотных характеристик колебательных звеньев в таком интервале частот, в котором они не могут быть заменены прямолинейными асимптотами, пользуются кривыми поправок (рис. 3.27) или табл. 3.2. t.db 16 11 в 0 -ь -8 я 9 П т п А 1 * If А t 3> К I Ъс—~ ± * 1 -Ч ¦; ч > Ж пя 0,10 \-0,20 \-0,25 ¦0,30 -от ¦0,50 -0,60 2 i ' = 4- с > 1 W/ Рис. 3.27. Кривые поправок б для асимптотических частотных характеристик колебательного звена
Таблица 3.2 Поправки 6 к асимптотическим логарифмическим амплитудным характеристикам колебательного звена Ьк 0,05 0,10 0,15 0,20 0,25 0,30 0,40 0,50 0,60 0,80 1,00 Поправки в, дБ при частоте и, с 0,1 0,087 0,086 0,083 0,080 0,076 0,071 0,059 0,044 0,024 -0,025 - 0,086 0,2 0,353 0,348 0,338 0,325 0,312 0,292 0,240 0,170 0,092 -0,103 —0,340 0,3 0,814 0,802 0,781 0,744 0,708 0,658 0,533 0,371 0,190 • 0,245 —0,748 0,4 1,505 1,480 1,430 1,360 1,274 1,179 0,927 0,627 0,292 —0,474 —1,29 0,5 2,480 2,425 2,330 2,201 2,040 1,857 1,414 0,902 0,354 —0,800 —1,938 0,6 3,838 3,728 3,546 3,305 3,016 2,687 1,940 1,137 0,326 — 1,240 —2,670 0,8 8,665 8,094 7,280 6,345 5,380 4,439 2,680 1,137 —0,217 —2,474 —4,296 1,0 20,000 13,980 10,460 7,960 6,020 4,439 1,940 0,00 —0,217 —4,080 —6,020
Правила вычисления и построоения ЛАЧХ колебательного звена: 1) на оси частот отмечают точку, соответствующую сопрягающей частоте <йк=1/Тк, и из нее проводят две асимптоты: с наклоном 0 дБ/дек влево и —40 дБ/дек вправо. В результате получают первое приближение для логарифмической амплитудной характеристики в виде прямолинейных асимптот, которые сопрягаются в точке ык=1/Тк; 2) для уточнения ЛАЧХ используют или кривую поправок, которой соответствует значение параметра |к, наименее отличающееся от рассматриваемого, или табл. 3.2. Поправки откладывают с соответствующим знаком от сопрягающих асимптот. Для вычисления значений ЛФЧХ в соответствии с выражением C.66) можно использовать тригонометрические таблицы и следующие приближенные формулы: arctg ДКукКг^2§кГко). Гк«Х0.4; Ошибка при вычислении фазы по этим формулам при любом значении <о не превышает 2°. Неустойчивое колебательное звено. В случае неустойчивого колебательного звена, имеющего передаточную функцию вида C.36), выражения для ЛАЧХ и ЛФЧХ соответственно при й=1 имеют вид Lm (©)= — 20 lg УA + 7УсогJ + B?к7>J; C.67) C.68) Кривые отклонений точных ЛАЧХ от асимптотических, определяемых формулой C.67), даны на рис. 3.28; семейство ЛФЧХ, определяемых формулой C.68), показано на рис. 3.29. Для неустойчивого колебательного звена, имеющего передаточную функцию вида C.35), ЛАХ и ЛФЧХ соответственно при k=l имеют вид: Lm (со) = —20 lg /(I — 7Yco2j2 + BgK7Vo)J. C.69) C.70) Сравнивая формулы C.69) и C.70) с формулами C.65) и C.66), отметим, что амплитудные характеристики Lm(co) рассматриваемых неустойчивого и устойчивого колебательных звеньев одинаковы, а фазовые характеристики отличаются лишь знаком. Таким образом, при построении ЛАЧХ C.69) можно пользоваться рис. 3.30, а при построении ЛФЧХ C.70)—рис. 3.31, зеркально отобразив последние относительно оси о>. Интегрирующее звено. ЛАЧХ и ЛФЧХ интегрирующего звена при k=l, в соответствии с выражением C.43), определяют по формулам: Lm(co)=— 201gco; C.71) 90 в(ш)=—5_ = const. C.72)
Lmfel 06 -1 -г -j -¦ -s -в -7 -S -s 0,4- Of- 0,8- %„~ 1,0- ш —i \ 1 V \ r,o Тш Рис. 3.28. Кривые отклонений точных ЛАЧХ от асимптотических неустойчивого колебательного звена Ни)," -150 -ISO ш Z* =1.0 ш 0,8 Ofi , ¦— 0,4 0,2 — -—* L, !¦ — = <?/ в/ /0,0 7 Рис. 3.29. Семейство ЛФЧХ неустойчивого колебательного звена Характеристики C.71) и C.72) приведены на рис. 3.30. Сдвиг фазы, создаваемый интегрирующим звеном, не зависит от частоты и равен (—л/2). Дифференцирующее звено 1-го порядка. ЛАЧХ и ЛФЧХ дифференцирующего звена 1-го порядка имеют вид Lm(cu)=201gVT2(D2+l; 8((o) =arctgTco. Если выражения C.73) и C.74) сравнить ниями C.61) и C.62) для апериодического чаются друг от друга лишь знаком. C.73) C.74) с соответствующими выражезвена, то при х = Т они отли91
Цш),дВ Рис. 3.30. ЛАЧХ L(«) и ЛФЧХ 6 (со) интегрирующего звена Следовательно, кривые ЛАЧХ и ЛФЧХ дифференцирующего звена являются зеркальным отображением кривых тех же характеристик апериодического звена относительно оси частот (см. рис. 3.31). 60 60 40 го 40 30 го ю J Lm (co) = 20 lg V(l- not at 1,0 ю юош Рис. 3.31. ЛАЧХ L(co) и ЛФЧХ 6(<о) дифференцирующего звена 1-го порядка Дифференцирующее звено 2-го порядка. ЛАЧХ и ЛФЧХ дифференцирующего звена 2-го порядка при k=\ определяют с помощью формул C.75) C.76) Если сравнить формулы C.75) и C.76) с соответствующими формулами C.65) и C.66) для устойчивого колебательного звена, то при Xd=TK и ?<г=|к они отличаются друг от друга лишь знаком. Поэтому кривые Ьт(ш) и 6(и>) для дифференцирующего звена 2-го порядка могут быть получены как зеркальное отображение относительно оси частот соответствующих кривых колебательного звена (см. рис. 3.25 и 3.26). Поэтому во втором случае при пользовании табл. 3.2 следует изменить знак поправок. Запаздывающее звено. Логарифмические частотные характеристики запаздывающего звена определяют с помощью выражений Lm(w)=0; 0((О)=— ТоШ. 92
в1ш)' Рис. 3.32. ЛФЧХ запаздывающего звена ЛАЧХ запаздывающего звена совпадает с осью частот, а ЛФЧХ показана на рис. 3.32. При определении логарифмических частотных характеристик типовых звеньев САР предполагалось, что k=l. Если передаточный коэффициент звена кф\, то, например, для апериодического звена ) и L(o)=201g?—201g Таким образом, полученную ранее ЛАЧХ для k—\ следует переместить параллельно самой себе на величину 20lgft вверх или вниз в зависимости от значения k: если k>\, то вверх (так как 201g&>0); если k<l, то вниз (так как 201g&<0). Рассмотренные логарифмические частотные характеристики типовых звеньев используют в ряде систем автоматизированного моделирования при расчете САР и САУ, реализованных в виде пакетов прикладных программ для персональных и уни- S,dS 8(w),° 0,01 -45 90 си/и/а Рис. 3. 33. Шаблоны для построения ЛФЧХ апериодического звена 93
версальных ЭВМ. Такими пакетами являются, например, СС, СИАМ, ФАЗЕР и др. [21]. При выполнении расчетов САР с использованием графоаналитических и графических методов, основанных на логарифмических частотных характеристиках, применяют специальные шаблоны. На рис. 3.33 показаны, например, шаблоны для построения ЛФЧХ и поправки для апериодического звена. Аналогичные шаблоны могут быть получены и для ЛЧХ других динамических звеньев. 3.7. Приближенный способ вычисления и построения логарифмических частотных характеристик одноконтурных систем Общее выражение для передаточной функции разомкнутой одноконтурной системы можно представить аналогично выражению C.57): У. Ц Т) ТС ki П ins +1) П [ту* + 2ZdiTdls +1) ^(S) = -i=LJ=l L±=! , C.77) где П — знак произведения; v — число интегрирующих звеньев в прямой цепи системы. Если обозначить Lm((o)=201g| W(j<u) |, то выражение C.77) можно записать в виде Lm V(l - p vLmco — iTKi^ ¦ C-78) Выражение C.78) показывает, что ЛАЧХ одноконтурной системы может быть получена в результате суммирования ординат ЛАЧХ типовых звеньев, входящих в ее состав. Правила построения ЛАЧХ одноконтурной системы: 1) определяют сопрягающие частоты coi = 1/ti; со2=1/т2; ••¦ ... и т. д. и отмечают их вдоль оси частот lg ©; 94
2) проводят низкочастотную асимптоту ЛАЧХ Lm(co), которая представляет собой при co<©i прямую с наклоном, —20v дБ/дек, где v — порядок астатизма системы, или число интегрирующих звеньев. Эта прямая или ее продолжение при частоте ш = 1 должны иметь ординату 201g& (где k= П kt — передаточный коэффи- циент разомкнутой системы из выражения C.77)); 3) после каждой из сопрягающих частот со( наклон асимптотической частотной характеристики Lm(co) изменяется по сравнению с тем наклоном, который эта характеристика имела до рассматриваемой сопрягающей частоты cot, в зависимости от того, какому звену принадлежит сопрягающая частота. Наклон изменяется на: —20 дБ/дск, если сопрягающая частота принадлежит апериодическому звену; —40 дБ/дек в случае колебательного звена; +20 дБ/дек в случае дифференцирующего звена 1-го порядка; +40 дБ/дек в случае дифференцирующего звена 2-го порядка; 4) уточняют вид 1лп(со) при помощи кривых или таблиц поправок. Следует отметить, что высокочастотная асимптота ЛАЧХ, т. е. часть ЛАЧХ при частотах, больших наивысшей сопрягающей частоты, должна иметь наклон —20 (п—т) в децибелах на декаду (где п — порядок знаменателя; т — порядок числителя передаточной функции C.77) разомкнутой системы). Выражение для ЛФЧХ соответствующей передаточной функции C.77) разомкнутой системы имеет вид 2^ ЛФЧХ одноконтурной системы, так же как и ЛАЧХ, может быть определена в результате сложения ординат фазовых характеристик типовых звеньев, входящих в ее состав. Для приближенного построения фазовых характеристик звеньев удобно пользоваться номограммами и приближенными формулами. Чтобы построить графики ЛАЧХ и ЛФЧХ при помощи ЭВМ, по оси абсцисс откладывают логарифм частоты со в линейном масштабе, в результате чего в отношении lg а градуировка шкалы вдоль этой оси оказывается равномерной. Разметку оси абсцисс обычно выполняют не по значениям lg со, а по соответствующим им значениям самой частоты ю, поэтому градуировку шкалы в отношении ш получают неравномерной. При построении графиков ЛАЧХ C.78) по оси ординат откладывают в ли- 95
нейном масштабе увеличенные в 20 раз значения логарифма модуля в децибелах, а при построении ЛФЧХ C.79) — значения фазового угла в градусах. ЛАФХ строят либо на полулогарифмической, либо (чаще) на миллиметровой бумаге. На последней удобно принять следующие масштабы-, по оси абсцисс 1 дек— 50 мм; по оси ординат: 1 дБ — 2 мм, 1 град— 1 мм. Пересчет линейного масштаба оси абсцисс в логарифмический выполняют с помощью табл. 3.3. (При построении логарифми- Таблица 3.3 Пересчет линейного масштаба оси абсцисс в логарифмический ш, с-1 1,0 1,1 1,2 1,3 1,4 1,5 d, мм 0,00 2,06 3,95 5,70 7,30 8,80 СО, С 1,6 1,7 1,8 1,9 2,0 2,1 d, ММ 10,20 11,51 12,75 14,40 15,05 16,20 СО, С 2,25 2,50 2,75 3,00 3,50 4,00 d, мм 17,60 20,00 21,80 23,80 27,20 30,00 СО, С 4,50 5,00 5,50 6,00 6,50 7,00 d, мм 32,60 35,00 37,00 39,00 40,50 42,20 со, с 7,50 8,00 8,50 9,00 9,50 10,00 d, мм 43,70 45,00 46,40 47,70 48,80 50,00 Обозначения: со — значение частот по оси абсцисс; d — расстояние по оси абсцисс, соответствующее данной частоте. ческих частотных характеристик при принятых масштабах удобно пользоваться шаблонами [18, 20].) Для перевода натуральных чисел в децибелы и наоборот пользуются номограммой (рис. 3.34). Вычислим и построим логарифмические частотные характеристики одноконтурной системы (рис. 3.35). Пусть необходимо построить логарифмические частотные характеристики одноконтурной САР, имеющей передаточную функцию типа C.77): w (S) — s A0s + IJ @,2s + 1),@.045+ 1)* Построение выполняют на миллиметровой бумаге, которую подготавливают соответствующим образом. Определяют сопрягающие частоты, обратные по значению постоянным времени системы, с~ь. <й1= 1/10=0,1; со2=1/3=0,33; @3=1/0.2 = 5; 0L=1/0,04=25. Сопрягающие частоты отмечают на оси частот. После этого строят низкочастотную асимптоту ЛАЧХ, которая имеет наклон —20 дБ/дек, так как система является астатической 1-го порядка (число интегрирующих звеньев v=l). Эта прямая должна быть проведена так, чтобы ее продолжение при частоте со=1 имело ординату 20 lg ft = = 26 дБ. Далее, ввиду того что частота «i принадлежит двум апериодическим звеньям, наклон асимптотической ЛАЧХ изменяют на —40 дБ/дек. В интервале (Oi ... а>2 асимптотическая ЛАЧХ имеет наклон —60 дБ/дек. При частоте со = а>2 начинает влиять эффект двух дифференцирующих звеньев с одинаковыми постоянными времени. Поэтому наклон асимптотической ЛАЧХ 96
;-?' I ISf и* If W tf fff f" w m <*? w «/ iwl w lit II /W 131 г» .-7.Г 13,1 13T w 130 129 m 127 tu 125 m 123 122 121 121 111 Hi r.v ns as Hi tf* w tw 109 m 107 m №5 m 103 tu tot tot too n 91 97 91 95 94 »,' 11 11 Я1 14 и 17 It IS li и и ft to \ 71 71 77 75 75 74 W 71 71 70 ft и 17 It SS ft SI 12 II IS Г so SI SI 57 SS ff Л ,TT ft 51 @ 49 it *7 if *S it 43 t2 it ill 39 31 37 31 35 34 i»J 3? 31 30 79 7» ?7 7S 75 2t 23 77 71 20 It Я 17 IS 15 H 13 1? 11 10 s 1 7 S S 4 3 f t 0 \ \ \ \ / /¦ / / IS 0Л \ O.ZS 0,3 Ц. • / / \ \ у / к о, 4i*SC ~2_ \ A/ k \ \ Si sst 0,7 / 0,9 f / / n ft 17 и 15 13 1t 1t 1A t 7 ( 1 4 3 I и 39 3d 37 31 35 34 T,f 3? 31 1) ft 27 ?e 75 7t 73 77 ft 20 U 5) 5$ S7 Я SS и cr it 51 Я! 41 *F 41 if a и 43 i? 4! iO It n 7» 77 Л 75 74 11 ff S7 (( ti и 63 a fi to ж 99 90 97 St «f 4 11 if 11 m tt 17 V »f и из иг ft so -Ю 1.0 1.5 3 IS 4 Рис. 3.34. Номограмма для перевода натуральных чисел в децибелы и наоборот изменяют на +40 дБ/дек и в интервале со2—со3 этот наклон делают равным —20 дБ/дек. При частотах, больших <о3, вследствие влияния апериодического звена с постоянной времени 7"i = 0,2 с наклон становится —40 дБ/дек, а для ш>ш4 асимптотическая ЛЛЧХ будет иметь наклон —60 дБ/дек. Па рис. 3.35 приведены также кривые поправок для соответствующих типовых звеньев. Их суммирование с асимптотической характеристикой дает точную ЛАЧХ разомкнутой системы. Там же приведены построенные по шаблонам тазовые характеристики типовых звеньев, входящих в систему е(а))„, e(w)d, 8(ш)«, е(<в),4> е(ш)я. ЛФЧХ всей системы получают путем суммирования ЛФЧХ типовых звеньев этой системы. Следует отметить, что здесь высокочастотная асимптота ЛАЧХ имеет наклон, дБ/дек: —20(п—т) =—20E—2)=—60, где т — порядок числителя; п — порядок знаменателя передаточной функции разомкнутой системы. ЛФЧХ при частоте, стремящейся к бесконечности: — -g- (я — /и) = —¦g- E—2) = — -j я. ЛАЧХ разомкнутой САР может быть разбита на следующие три характерных участка (рис. 3.36). 1. Область низких частот. Этот участок находится в области частот, меньших первой сопрягающей частоты. Вид ЛАЧХ здесь определяет порядок астатизма и статическую точность системы. Для статических систем ЛАЧХ представляет горизонтальную прямую, отстоящую от оси частот на 201g k, для 7—3591 97
Кривые поправок -w . -60- Рис. 3.35. Пример построения ЛАЧХ и ЛФЧХ одноконтурной системы регулирования частот Рис. 3.36. Области низких, средних и высоких частот логарифмической амплитудной характеристики САР астатических систем 1-го порядка характеристика имеет наклон —20 дБ/дек. При частоте ю=1 эта прямая или ее продолжение, согласно выражению C.77), должна иметь ордина- 98
ту 2Q\gk. Если система имеет астатизм v-порядка, то наклон- прямой должен быть —20 v дБ/дек. 2. Область средних частот. Вид ЛАЧХ в этой области определяет в основном запас устойчивости и качество САР. В этом интервале находится частота среза системы сосР, характеризующая время переходного процесса при достаточных запасах устойчивости. Область средних частот заканчивается частотой (Ов. 3. Область высоких частот (©в...°°). Этот участок может быть назван интервалом малых параметров. Он содержит сопрягающие частоты, пренебрежение которыми не оказывает существенного влияния на вид логарифмической характеристики в интервале средних частот, т. е. на динамику системы. 3.8. Преобразование структурных схем САР Правила преобразования структурных схем облегчают определение передаточных функций сложных САР и дают возможность привести многоконтурную систему к эквивалентной одноконтурной. Пример 1. Пусть система состоит из двух последовательно включенных элементов с передаточными функциями Wi(s) и U72(s) (рис. 3.37). Первый иа Вых Рис. 3.37. Пример эквивалентного преобразования структурной схемы САР этих элементов охвачен рядом параллельных обратных связей с передаточными функциями Zi(s), Zg(s),..., Zn{s). Так как передаточная функция нескольких параллельно соединенных элементов может быть представлена как сумма передаточных функций этих элементов, то схема на рис. 3.37, а может быть преобразована в схему на рис. 3.37, б, где Z(s)=Zl(s)+Zt(s)+... +Zn(s). Но передаточная функция элемента Wt(s), охваченного обратной связью Z(s), имеет вид Wt(s) или W" <s>= 7! (S) E) [Z, (s) + ... + Zn E)]# 7* 99
Таким образом, двухконтурная система заменяется одноконтурной, которая состоит из последовательного соединения элементов Wn(s) и W3(s) (рис. 3.37, в). Передаточная функция системы с разомкнутой обратной связью имеет вид: Пример 2. Схема многоконтурной (четырехконтурной) САР показана на рис. 3.38,а. Передаточная функция Wu(s) элемента Wt{s), охваченного отрицательной обратной связью Z4(s) Wt(s) При этом четырехконтурная система может быть сведена к трехконтурной системе (рис. 3.38, б). В* But Рис. 3.38. Пример преобразования четырехконтурной САР Далее последовательно соединенные структурные элементы с передаточными функциями Ws(s) и W44(s), охваченные обратной связью Z3(s), могут быть заменены эквивалентным структурным элементом с передаточной функцией В этом случае трехконтурную схему можно свести к двухконтурной схеме (рис. 3.38, в), которая в свою очередь может быть приведена к одноконтурной схеме (рис. 3.38,г). Для схемы, показанной на рис. 3.38, г, передаточная функция Wt (s) W* (s) Wt (s) - 1 + Z4 (s) W4 (s) -f- Z3 (s) W (s) Wt (s) + Zs (s) W2 (s) W, (s) WA (s) • Передаточная функция всей системы с разомкнутой главной обратной связью имеет вид (s) W1 js) Ws (s) Wt (s) W< (s) - 1 + Z4 (s)W4(s) + Z3 (s) W3 (s) Wi (s) + Z2 (.9) «72 (s) Передаточная функция система в замкнутом состоянии 100 (s) W< (s)
фE)= W(s) (s) Ws (s) W3 (s) IF4 (s) ~ 1 -;- Z4 (s) IF4 (s) + Z3 (s) W3 (s) W4 (s) + Z2 (s) IF2 (s) W3 (s) VP4 (s) -f ' - Zj (s) W, (s) IFj, (s) Г3 (s) W4 (s) Пример 3. Для упрощения структурную схему САР (рис. 3.39, а) преобразуют к виду, показанному на рис. 3.39,6, исходя из того, что сигнал g(t) Рис. 3.39. Пример преобразования структурной схемы САР с двумя це- I пями ООС на входе элемента Ws(s), прежде чем поступить на выход системы и в цепь обратной связи Zx(s), должен пройти через элемент W3{s). Передаточная функция части системы, которая отмечена на рис. 3.39,6 штриховыми линиями, Схема на рис. 3.39, б может быть преобразована к схеме на рис. 3.39, 8, передаточная функция которой в замкнутом состоянии имеет вид Wx (s) W» (s) W, (s) р W^ Wl(s)W,(s)W,(s) - 1 -г Z, (s) W., (s) Wz (s) + Z2 (s) W, (s) Щ (sy Пример 4. Рассмотрим преобразование структурной схемы сложной САР (самолет с аитопилотом) с несколькими регулируемыми величинами (рис. 3.40). Система включает в себя самолет (объект регулирования) и 2 3 Рис. 3.40. Размещение и соединение агрегатов автопилота самолета: / — канал курса; 2 — руль курса; 3 — руль высоты; 4 — капал крена; 5 —элероны; 6— гировертикаль; 7 — курсовой гироскоп; 8 — канал тингажа 101
автопилот, состоящий из трех регуляторов, которые координирование управляют самолетом по трем каналам (тангажа, курса и крена) с помощью рулей высоты и курса, а также с помощью элеронов. Для упрощения можно предположить, что боковые и продольные движения самолета независимы друг от друга. При этом ограничимся рассмотрением курсовой и поперечной стабилизации самолета с автопилотом. Чувствительным элементом курсовой стабилизации служит свободный гироскоп с горизонтальной осью свободного вращения. При помощи чувствительного элемента, специального демпфирующего устройства и потенциометра и автопилоте вырабатывается напряжение, пропорциональное углу отклонения самолета от заданного курса и его угловой скорости относительно вертикальной оси. Это напряжение подается на вход электронного усилителя, который воздействует на серводвигатель (рулевую машину), управляющий движением руля курса. Серводвигатель имеет электрическую обратную связь. На вход усилителя канала руля поворота подается напряжение, пропорциональное не только углу рысканья, но и углу бокового крена самолета. Это напряжение поступает от потенциометра, которым снабжен другой чувствительный элемент автопилота — гироскоп продольно- поперечной стабилизации, представляющий собой свободный гироскоп с вертикальной осью вращения. На вход электронного усилителя канала элеронов полается сумма напряжений, одно из которых пропорционально углу боковою крена, а другое — углу отклонения самолета от заданного курса. Этот усилитель воздействует на серводвигатель, управляющий поворотом vieponoB. Серводвигатель канала элеронов также имеет электрическую обратную связь. Г.слк не рассматривать системы продольной стабилизации и внутренних обратных связей п автопилоте, то систему самолет—автопилот можно представить состоящей из четырех замкнутых контуров: 1) самолет—гироскоп курсовой стабилизации — усилитель и серводвигатель курсового канала — руль направления — самолет); 2) самолет — гироскоп продольно-поперечной стабилизации —усилитель и серводвигатель канала элеронов — элероны — самолет; 3) самолет—гироскоп курсовой стабилизации — усилитель и серводвигатель канала элеронов—элероны — самолет; 4) самолет—гироскоп про- долыю-поперечпой стабилизации — усилитель и серводвигатель канала направления -руль направления — самолет. Структурная схема системы самолета с автопилотом показана на рис. 3.41,0. где через We(t) и Q>g(t) обозначены требуемые законы изменения курсового угла бокового крена, а через Чг@ и Ф(/) их действительные значения: Через Wi(s) и Wi{s) (на рис. 3.41 везде Wt, W2 и т. д.) обозначены передаточные функции каналов руля направления и элеронов автопилота соответственно, а через W3(s) и W4(s), W5(s) и We(s) —передаточные функции самолета, характеризующие эффекты отклонений элеронов и руля (на углы бокового крена), а также рысканья соответственно. На рис. 3.41,6 приведена преобразованная схема, на которой самолет представлен в виде четырех параллельно соединенных элементов с передаточными функциями Wi(s) ... №e(s). Так как сигнал от каждого из элементов сравнения по двум параллельным цепям проходит через каналы Wi(s) и W2(s) то для определения передаточной функции, характеризующей изменение курсового угла W(t) в зависимости от сигнала ошибки ev(t) схему на рис. 3.41, б можно представить в виде двух схем на рис. 3.41, в, г. Схема (см. рис. 3.41, в) характеризует влияние сигнала ошибки e^(t) на курсовой угол ?@ через канал руля W^s), а схема (см. рис. 3.41,г)—влияние сигнала ошибки e-v(t) на 4х (t) через канал элеронов W2(s). Для выявления параллельных путей прохождения сигнала на (см. рис. 3.41,6, г) изменение угла бокового крена полагается равным нулю, т. е. Фв=0, а передаточная функция элемента сравнения для угла бокового крена заменяется —1. Это возможно на основании того, что если в уравнении 102
Рис. 3.41. Преобразование структурной схемы самолет-—автопилот то Схемы на рис. 3.41, в, г, могут быть сведены к виду, изображенному на рис. 3.41,C, е. Схема на рис. 3.41, в преобразуется к виду, изображенному на рис. 3.41,E, так как сигнал ошибки вф (t) после прохождения через структурный элемент W\ (s) разветвляется на две параллельные ветви. Схема на рис. 3.41, г приводится к схеме на рис. 3.41, е. Передаточные функции для каждой из этих систем можно записать следующим образом: для схемы на рис. 3.41, д: ^k W (S) W(S) + W (S) W (S) W {S) Для схемн! на рис. 3.41, е: Искомая передаточная функция системл с разомкнутым каналом курса Wx is) W2 (s) Wt (s) Wb (s) (д) W, E) W3 (s) W6 (s) I + WAs) WAs) l-rW1(s)WAs) Аналогично можно определить передаточные функции других каналов управления. 103
3.9. Номограмма для замыкания системы Как будет показано далее, для анализа качества САР необходимо решить следующую задачу: известны логарифмические амплитудная и фазовая частотные характеристики Я (со) и G(co) разомкнутой системы W(s); необходимо найти логарифмические амплитудную и фазовую частотные характеристики А(а>) и ф(со) замкнутой системы где Н — значение ЛАЧХ, дБ; Ан.ч — значение амплитудной характеристики замкнутой системы, абс. ед. Придавая А в формуле C.80) некоторые постоянные значения в абсолютных единицах, а в формуле C.81) —в градусах, и изменяя 0 от 0 до ±360°, можно получить для каждого 8 соответствующие значения L(co) в децибелах. При построении номограмм замыкания по оси ординат откладывают значения Я(со) в децибелах, а по оси абсцисс — фазы 0 (со) в градусах (рис. 3.42). На плоскости (с координатами ЬтЯ(со) и 0(со)) строят кривые, соответствующие геометрическим местам точек, имеющих постоянные значения А и ф. Значения А и ф, для которых построены кривые, составляющие номограмму, отмечены соответствующими цифрами (индексами). Следует отметить, что при больших по абсолютному значению отрицательных Я, уравнение C.81) сводится к виду sin@—(р)^0, или О^ф, т. с. линии равных значений ф примерно совпадают с вертикалями (т. е. значения фазы 8 равны индексу ф). Номограммой пользуются следующим образом. В координатах логарифм модуля — фаза, в которых построена номограмма, строят кривую L@), представляющую зависимость L(u>) = = Lm| W(j(o) | от 0 (со) = arg{W(j®)} для системы. При этом угловую частоту со рассматривают как параметр и значения о> отмечают вдоль L(Q). Если кривая L(8) пересекает одну из кривых номограммы, имеющую индекс ЛГ1 = ЬтЛ1 при значении со = сйЬ то ЛАЧХ замкнутой системы LmA имеет значение ЛГЬ Если при co = coi кривая L@) пересекает одну из кривых номограммы, имеющую индекс фь то при а» = ш1 ЛФЧХ ф(со) имеет значение <pi. 104
-360 -зго Фаза в (и) -zuo° юо" пос ее" т° о° -e,s @,94$ -130 -140" -wo -во" -го" о~ га" so wo wr ws -160° -120" -80° -40'" " IsB" " 80" " 120° ' 160° Избыток фазы Рис. 3.42. Номограмма для определения ЛАЧХ и ЛФЧХ САР с обратной- связью (замкнутой системы) по ЛАЧХ и ЛФЧХ разомкнутой системы 105
X(t) Z(s) X(tJ Рис. 3.43. Схема САР: а — с единичной ООС; б — с неединичной ООС Номограммы применимы для САР, имеющих единичную обратную связь (рис. 3.43, а), передаточная функция которой Если САР имеет неединичную обратную связь (рис. 3.43,6), то передаточная функция системы в замкнутом состоянии имеет вид {> l+Z(s)W(s)' Для того чтобы применить номограмму для получения логарифмических частотных характеристик замкнутой системы, передаточную функцию этой системы представляют следующим образом: ф,„ч _J_ Г W(s)Z(s) у ' Z(s) [ l-rW(s)Z(s Выражение в квадратных скобках дает возможность воспользоваться номограммой и найти логарифмические характеристики, соответствующие этому выражению. Из полученных характеристик следует вычесть характеристики, соответствующие передаточной функции Z(s). В результате получают искомые логарифмические частотные характеристики замкнутой системы с неединичной обратной связью. Контрольные вопросы 1. В чем состоит задача линеаризации уравнения САР? Какова математическая основа линеаризации? 2. Какова методика экспериментального определения частотных характеристик динамической системы? 3. Охарактеризуйте особенности свободных и вынужденных колебаний САР. 4. Что такое передаточная функция линейной САР? Какими передаточными функциями может быть описана САР? 5. Сравните между собой основные временные и частотные свойства типовых динамических звеньев. 106
6. Почему в определении передаточной функции динамической системы начальное состояние (условия) является нулевым? 7. В чем состоят преимущества ЛЧХ в сравнении с амплитудно-фазовыми характеристиками (АФХ)? 8. Каковы правила вычисления и построения ЛЧХ системы автоматического регулирования? 9. На какие технические свойства САР оказывают влияние низко-, средне- и высокочастотные области ЛЧХ? 10. Заданы ЛЧХ разомкнутого контура САР. Как определить ЛЧХ системы, замкнутой цепью отрицательной обратной связи? 11. Сформулировать основные правила преобразования структурных схем САР. 4. МЕТОД ПЕРЕМЕННЫХ СОСТОЯНИЯ В САР Метод переменных состояния1 в теории управления основан на понятии состояния динамической системы (объекта или САР в целом). Если систему описывают некоторой совокупностью физических переменных xt(t), x2(t), ..., xn(t), характеризующих поведение этой системы в будущем, и если известны ее состояние в данный момент и приложенные к ней воздействия, то статические и динамические свойства объекта или САР в данном случае можно описать системой дифференциальных уравнений в нормальной форме Коши. Матричная передаточная функция системы, а также свойства наблюдаемости и управляемости позволяют глубже понять динамику и особенности технических систем [18, 20]. 4.1. Переменные состояния и уравнения состояния динамической системы Рассмотрим многомерную систему (рис. 4.1), описываемую переменными состояния xx(t), x2(t), ..., xn(t), позволяющими у, ш Рис. 4.1. Система с двумя входами и выходами, описываемая переменными состояния 1 Строгое определение метода переменных состояния (или пространства состояний) дано, например, в книге: Ту Ю. Современная теория управления / Пер. с англ. Я. Н. Гибадулина; Под ред. В. В. Солодовникова, М.: Машиностроение, 1971, с. 80—90. 107
по их начальным значениям Xi(t0), x2(t0),... ...,xn{tu) в момент t0 и заданным воздействиям Ut(t) и u2(t) при /^/„ определить будущие значения переменных состояния, а также выходных переменных yl(t) и г/2@- Поясним понятие переменных состояния на простом примере механической системы, состоящей из груза массой т, подвешенного на пружине с коэффициентом упругости k и двигающегося в цилиндре с коэффициентом трения / (рис. 4.2.). Дифференциальное уравнение этой системы можно представить в виде d2y dy уш Рис. 4.2. Механи- ^ качестве пере.чонных состояния «ведем ческая система, по- х у\ — у и\ ясняющая понятие переменных со- ... dy (t) dxt стояния х?\ )~ dt ~ dt ' Подставляя выражения D.2) в уравнение D.1), получим dx2 Учитывая нмраженин D.2), можн> написать: D.1) D.2) dt It 2_ т т m D.3) Система уравнений 1-го порядка D.3) и является уравнениями в переменных состояния для рассматриваемого линейного объекта. В общем случае нелинейной системы уравнения, выраженные в переменных состояния, имеют вид Xi (t) =fi[xu x2 хп; «,, и2, ..., ит; t]; 4 x2, ..., хп; ии и2, ..., ит; f\; D.4) xn(t) =fn[x\, x2, ..., хп; ии и2 ит; t]. Если предположить, что в уравнениях D.4) функций fu f2, ... ..., fn линейны относительно переменных хх, х2, ..., хп, ии «2, • • •, «т и не зависят от времени /, то их можно привести к виду ... -\-Ьыит; .. ¦ -\-Ь2тит; D.5) xn=anlx1-\-an2x2+ ... 108
В матричной форме уравнения D.5) принимают вид X 1 Хп Х- + = а„ а, 2 .. а п Й21 #22 • • • #2п _#/!! #п2 • • • #лп _ bn ... ЬХт Ьпх ... Ь2т b > щ и2 Xi х2 _хп_ D.6) Матрицу-столбец, содержащую все переменные состояния в правой части уравнения D.6), называют вектором состояния и обозначают через х, т. е. Если вектор входных сигналов обозначить через и, то данная линейная система в компактной векторно-матричной форме может быть описана при помощи уравнения х=Ах+Ви, D.7) где А — квадратная [п, п]-матрица ~ап ... а1п п /у _ и,п\ . . . и,пп В —прямоугольная [п, »г]-матрица 'Ьп ... Ьш т> __ >п\ х„ Для полного описания системы к уравнениям состояния D.5) или D.6) необходимо добавить уравнения, устанавливающие связь между переменными состояния *i, X2, ..., хп и выходными переменными уи у2, ..., г/Р. которая обычно выражается в виде системы линейных алгебраических уравнений: D.8) У\=~- у2 =¦- С^Ху -г С22Х2 + • • • + С2пХп\ Ур~: ср\х\ "Г cpiX2 -j- . • • -j- СрпХп или в векторно-матричной форме У=Сх. 109
При этом матрица-столбец У\ У= называется выходным вектором, а матрица С(р, п) —матрицей выхода: С\\ ... С\п С ... с рп Уравнениям D.7) и D.8) может соответствовать структурная схема (рис. 4.3), где векторные связи показаны стрелками. Рис. 4.3, Структурная схема многомерной САР с обратной связью А Векторное дифференциальное уравнение D.7) можно решить методом, который применяют для решения уравнения 1-го порядка. Рассмотрим уравнение 1-го порядка: х=ах+Ьи, D,9) где х и и — скалярные функции времени; а и b — постоянные величины. Преобразовав уравнение D.9) по Лапласу, получим: sX{s)—x{O)=aX(s)+bU(s), откуда X(s)=-^-+j^U(s). D.10) Решение уравнения D.9) можно найти, взяв обратное преобразование Лапласа L~'[X(s)]: ) dx. D.11) Решение векторного уравнения D.7) определим аналогичным образом, а именно sX(s)— x@)=AX(s)+BU(s)s D.12) или X(s) =[sI~Ar1x@)+IsI-A]-'BU?5), D.13} НО
где I — единичная (n, n) матрица: "I 0 ... О" О" -.1 ... О 1 = О 0 ... 1 Аналогично получим следующее решение неоднородного век- торно-матричного уравнения D.7): t x@ = eA'x@)+ J еА<'-т>Ви(т) dx, D.14) а где матричная функция еА' может быть представлена в виде ряда, т. е. сходящегося при всех конечных значениях t. Общим решением однородного уравнения D.7) при и (/) = = 0, описывающем свободное колебание системы, является Хс.в(/)=еА'х@). D.15) Функцию, определяющую свободные колебания линейной системы с точностью до постоянной >/й (*) ••• Фяя (*) . называют переходной, или фундаментальной, матрицей. В развернутой форме уравнение D.15) имеет вид "*1 @) "¦*! (О (')••• Vnn(t)Mxn@)j откуда Xi(t)=q>n) =Xa(t)+xi2{t)+...+xin{t) (t=l, п). D.17) Очевидно, что выражение D.17) описывает изменение i-й составляющей вектора состояния Xi(t), вызываемое начальными условиями лг((О), а каждый из членов правой части выражения представляет собой изменение i-й составляющей вектора состояния Xi(t), вызываемое /-м начальным условием. Следовательно, каждый из элементов (fa(t) переходной матрицы q>(t) можно рассматривать как реакцию i-й перемен- Ш
ной состояния при х,@) = 1 (^) и при нулевых начальных значениях всех остальных переменных состояния. Выражение D.14) с учетом матрицы D.16) можно представить также в виде суммы общего и частного решения: x(t)=xCD(t)+xBbin(t)=<p(t)x(O) + + !<p(t—т)Ви(т)</т, D.18) где хвын@—реакция системы на вектор управления и(т); t h(t) = J({)(t—%)Ъйх—¦ матрица управляемого перехода, т. е. о при учете решения D.14) (f(t—т)=еА('-т>. Составляющая xBbia(t) является частным решением дифференциального векторно-матричного уравнения D.7). Методы вычисления переходной матрицы. Вычисление переходной матрицы (p(t) линейной системы в случае, когда матрицы А и В не зависят от времени, можно выполнить одним из следующих трех методов. 1-й — метод разложения в ряд. Переходную матрицу можно представить в виде бесконечного ряда Ограничившись конечным числом членов ряда и произведя их суммирование, найдем приближенное выражение для q>(t). 2-й — метод, основанный на определении собственных зна-i чений матрицы. Применяя к уравнению D.16) преобразование Лапласа, получим ф* (s) =L{<f (t) }=L{eA'} = [sI—A]-1, где O*(s)—изображение переходной матрицы (см. D.22)) и, следовательно, А]-1}. D.19) Определение (p(t) сводится к вычислению собственных значений матрицы А. Пример. Пусть необходимо вычислить переходную матрицу системы, уравнения которой имеют вид *2=—Ьх\—ах2. В таком случае 112
результате обращения зг.ш м.чг./щд получим Пусть матрица А имеет действительные и различные собственные значения а 1 _, _ _ . а , /•, = -.—4f —У а2— где «2 > 4ft. Тогд.'! переходная mi пища систем >г X Ме-мп_е-мо 3-й — метод, основанный на теореме Сильнестра. Предположим, что имеется некоторая функция /(А) от матрицы А, ко- го-рую можно представить в виде степенного ряда: оо /(А) =- = 2 с*А*, /,¦=-1 г.1,е А — квадратная матрица размерностью (п, п) с п — различными собственными значениями >.,-. Тогда, согласно теореме Сильвестра, где А—\] В частном случае, когда имеем п Пример. Предположим, что уравнения линейной системы имеют вид 3 этом случае Г1-л -3 L 1 -1- или Я2+2=0, так что корни перехода 8—3591 ~2 ; Я2=— У У . Имеем матрицу
причем Согласно К Таким с = (cos + У2 =?]• ). Ту» А+/У2 У2У2 )бразом, А + /У2" уг<I+( 1 2 , F( 0 А-УУП /2У2 [А—У УГ1] е-'^5"' f2~t) A = cos VTt j 1 + 3 ~ ... l/"o~ oin l/*9~^ У2 4.2. Матричная передаточная функция Применяя прямое преобразование Лапласа к уравнениям D.7) и D.8), выраженным в переменных состояния, получим sX (s)_=AX (s) +x @) + BU (s) ;J D20) I E) — IjA (S) , J откуда, исключая X(s) и полагая х@)=0, найдем Y(s)=C(sI—A)-'BU(s). D.21) Матрицу -А)-'В, D.22) устанавливающую связь между векторами выхода Y(s) и входа U(s), называют матричной передаточной функцией (МПФ) многомерной системы. Если система имеет только один вход u(t) и только один выход y(t), то матрицы В и С в уравнениях D.20) превращаются в скаляры, которые обозначим через Ъ и с соответственно. 2 Ту Ю. Современная теория управления. С. 64—65. 114
Поэтому для одномерной системы *& = ЪЩ = сE1-А)-*Ь. D.23> Из формул D.21), D.22) видно, что для определения передаточной функции системы по уравнениям D.7), D.8) состояния требуется обращение матрицы (si—А). В случае высокой размерности матрицы А это может представить определенные трудности. Один из способов решения задачи основан на так называемом алгоритме Леверье. Пусть где R(s) =s Тогда a,- и Rt можно вычислить по следующим формулам: A! = A->an_,= — spurA,-vR, = A2==AR1->an_2= — у spur A2-*-R2 = А2 + а„_21; (h = — ^ц spur Ал_, -у Rn_t = Art_, +^1; Таким образом, Пример. Рассмотрим линейную динамическую систему, описываемую векторным уравнением: Г 0-1 ОН Г4 2-1 Имеем [О —1 01 Г1 0 0] —1 —2 —2 +2 0 10; 1 о oj LooiJ [2 —1 01 Г 1 О 2П -1 0 -2 ; A2 = AR,= -2 10; a1=*-l; I 0 2j L 2 —1 Oj [1 0 0] Г О О 21 Г2 0 01 О 1 0 = —2 0 0 ; A, = ARS= 0 2 0 ; 0 0 lj L 2-1 -IJ Lo 0 2J 8* 115
- 9 2; R., = A3 (-(—2I = 0. Следовательно, 1 ил» 8 9 —1 —3 —7 — 6 14 2 Получим АШФ система — Cos--г 80s-г 70 Зо( —0,93s2 + 1,14s + 1) -25=—i—2 0,5s" \-s-~0,5s—l ¦ Решение обратной задачи — определение уравнений состояния по заданной передаточной функции, в особенности для многомерных систем, связано с более существенными трудностями 4.3. Управляемость и наблюдаемость Предыдущий этап развития теории автоматического регули рования, до широкого использования в ней понятия переменных состояния, был связан с описанием САР при помощи переменных вход — выход. Этот способ описания удобен для решения задач прикладной математики и автоматики. Однако развитии метода переменных состояния показало, что метод вход — выход имеет и существенные недостатки. Они связаны в основном с понятиями управляемости и наблюдаемости, которые не учитывались в рамках данного метода. При получении передаточной матрицы сложной многомерной системы по передаточным матрицам или передаточным функциям ее подсистем или элементов возможно сокращение полюсов или нулей, оказывающих существенное влияние на динамику системы. Пренебрежение этим фактором при расчете систем управления, как показывает опыт, может привести к ошибочным результатам. Состоянием системы х(/) можно управлять, изменяя вектор входа u(t), а наблюдать состояние системы можно, измеряя вектор выхода у (О- В связи с этим возникает два вопроса, имеющих кардинальное значение для теории автоматического управления. 1. Можно ли, выбрав соответствующим образом входы и @и перевести объект управления из некоторого произвольного со* стояния х(/0) в Другое произвольное состояние x(/i)? 116
2. Можно ли, наблюдая вектор выхода у(/) в течение достаточно долгого промежутка времени, определить начальное состояние объекта х(/0)? Ответ на первый вопрос связан с понятием управляемости, а ответ на второй вопрос — с понятием наблюдаемости. Определение понятий управляемости и наблюдаемости. Понятие управляемости связано с возможностью приведения системы в заданное состояние с помощью входных или управляющих воздействий. Понятие наблюдаемости — с возможностью определения переменных состояния по результатам измерения пыходных переменных. Б качестве примера, поясняющего эти понятия, рассмотрим линейный объект, описываемый уравнениями состояния (рис. 4.4): Х\~Х\\ Как это видно из рис. 4.4, переменная х\, которой соответствует полюс \=\, не соединена со входом, и поэтому вход и не может влиять на ее изменение по времени. Такую переменную состояния называют неуправляемой. Переменная Хг (полюс ^— — — 1) не соединена с выходом, и поэтому невозможно определить переменную х%. Такую переменную состояния называют ненаблюдаемой. 5"/ s+Z S+3 Рис. 4.4. Структурная схема САР с одним неуправляемым (Х=1) и одним ненаблюдаемым (Л=—1) полюсами 117
Управляемость. Более общее определение управляемости заключается в следующем. Состояние [х0, to] называют управляв» мым, если можно найти момент времени t\ (ti>tQ) и вход u(t)r переводящий систему за интервал времени (t0, ti) из состояния \хо, to] в состояние [0, t{\. Если любое состояние х^Х является /i>/o, любых заданных состояний х0 и Xi существует управле- мым в момент времени to- Можно дать и такое определение. Систему называют полностью управляемой, если для любых моментов времени ^о и ti, tt>t, любых заданных состояний х0 и xt существует управление u(/), (tn<.t<.t\.), переводящее начальное состояние х0 в конечное Хь Судить о том, является ли система управляемой по виду ее уравнений состояния, в общем случае (за исключением одномерной системы) очень трудно. Однако если уравнения системы х=Ах — Ви; у- Сх приведены к канонической форме х— Ах-МЗи; у=Сх; D.24) D.25) где А — диагональная матрица, то судить об управляемости системы можно, исходя из следующего. Запишем уравнения D.25) в развернутой форме: i-i D.26) Эти уравнения показывают, что управляющие воздействия и< не будут оказывать какого-либо влияния на переменную xjt если ^ = О» т. е. если все элементы /-и строки матрицы В равны нулю. Следовательно, все те канонические переменные состояния х, которые соответствуют нулевым строкам матрицы В, являются неуправляемыми. Это означает, что изменение этих перемен- 118
ных происходит независимо от управляющих воздействий «4 и целиком определяется начальными условиями, а также внешними возмущениями. Таким образом, система D.24) является управляемой, если матрица В не содержит строк, все элементы которых равны нулю. Условия управляемости для системы, описываемой уравнениями D.24), не требующими их приведения к канонической форме D.25), определяются следующей теоремой (или критерием), полученной Р. Калманом: необходимое и достаточное условие для управляемости системы D.24) заключается в том, чтобы матрица Q=[B, AB, A2B, .... А-1 В] D.27) имела ранг п. Часто матрица D.27) имеет ранг п для некоторого v<n, т. е. rangQv=rang[B, AB, ..., Av-1B]=n. D.28) Наименьшее значение v, при котором имеет место равенство D.28), называют показателем управляемости. Из критерия управляемости D.27) видно, что управляемость определяется свойствами матриц А и В. При этом он остается справедливым и для дискретной системы, если ее уравнения представить в виде л-k+l — AXft-f- HU/i. Наблюдаемость. Как было доказано в рассмотренном ранее примере, переменная х2 является ненаблюдаемой, так как она не соединена с выходом. Но для управления необходимо располагать сведениями о всех текущих значениях вектора состояния. Поэтому возникает вопрос: при каких условиях, наблюдая векторы выхода и входа, можно найти переменные состояния? Систему D.24) называют наблюдаемой, если по данным измерения или наблюдения векторов у (t) и и(^) на конечном интервале времени to^t^ti можно однозначно определить начальное состояние x(to). Систему D.24) называют полностью наблюдаемой, если все ее состояния наблюдаемы в любые моменты времени. Предполагая, что уравнения системы приведены к нормальной форме, рассмотрим уравнение связи между вектором выхода у и вектором состояния х: у=Сх, D-29) где С Г" С С" И W2 • • • "-" 1/ • • • *¦" 1 п С = С 22 п1 • • • ^ ni • • • *" пп _ 119
Уравнение D.29) в развернутой форме имеет вид п iJi @ ~= 2 с'*** Оr cnxi -Г----Т CijXj -;-... -j- cinx,,; Ур @ - : р Из этих уравнений следует, что переменная *3- может быть определена по переменным уи у2, ..., уг, если коэффициенты c,-j для (/=], 2, ..., р) не все равны нулю. Другими словами, х, является наблюдаемой переменной, если элементы /-го столбца матрицы С не все равны нулю, или линейная стационарная система является наблюдаемой, если матрица выхода С не содержит столбцов, элементы которых равны нулю. Условия наблюдаемости в общем случае, когда уравнения D.20) не приведены к канонической форме, определяются следующей теоремой: необходимые и достаточные условия для полной наблюдаемости состоят в том, чтобы матрица R = [CT, ATCT, (АТJСТ, ..., (АЧ'-'С1] D.30) имела ранг п. Из выражения D.30) видно, что наблюдаемость определяется свойствами матриц А и С. Так же как и в случае критерия управляемости, если матрица R имеет ранг п для некоторого ц<п, т. е. rangR,=rang[CT, АТСТ, .. ., (Ат)"-1Ст]=п, то наименьшее ц, при котором имеет место равенство D.30), называют показателем наблюдаемости. Дуальность критериев управляемости и наблюдаемости. Очевидная аналогия между критериями управляемости и наблюдаемости позволяет сделать вывод об их дуальности. Назовем два объекта S и S* дуальными, если они описываются соответственно уравнениями i-A^z-rCii;} D32) w=Brz. j Из уравнений D.27) и C.30) — D.32) видно, что если S управляема в fa то S* наблюдаема в t0 и наоборот. Таким образом, наблюдаемость одной из систем можно проверить анализом управляемости дуальной ей системы. 120
Декомпозиция системы. Как было показано ранее, любая система, описываемая уравнениями состояния D.24), может быть представлена в виде структурной схемы (см. рис. 4.3). Рассмотрим схему системы, которая может быть декомпозирована на две подсистемы — управляемую / и неуправляемую 2 (рис. 4.5). Верхняя часть этой схемы соответствует неуправляе- Рис. 4.5. Декомпозиция САР: / — управляемая подсистема; 2— неуправляемая мой подсистеме, так как вектор входа и не может влиять на происходящие в ней процессы. Уравнения состояния этой системы можно представить в виде 0 A У=1 22 в, и; D.33) Точно так же декомпозируем систему на две подсистемы — наблюдаемую / и ненаблюдаемую 2; нижняя часть схемы (рис. 4.6) соответствует ненаблюдаемой подсистеме, так как ее вектор состояния никак не связан с выходом у. Рис. 4.6. Структурная схема САР: / — наблюдаемая подсистема; 2 — ненаблюдаемая 121
Уравнения состояния этой подсистемы имеют вид А„ О ]ГХЛ ГВ, В общем случае многомерная система может быть декомпозирована на четыре подсистемы (рис. 4.7): управляемую и ненаблюдаемую 5Ь управляемую и наблюдаемую 5г, неуправляемую и ненаблюдаемую S3, неуправляемую и наблюдаемую S*. Наличие связей между подсистемами определяется из следующих соображений: если Si — ненаблюдаема, то она не может воздействовать на S2 и S4, которые наблюдаемы; если S3—• неуправляема и ненаблюдаема, то на нее не могут воздействовать подсистемы 5i и 5г, которые управляемы, и т. д. Уравнения состояния системы (см. рис. 4.7) в общем случав в, Bi > S/ Ait 1 1 «F» Сг Рис. 4.7. Структурная схема САР, декомпозированной на четыре подсистемы можно записать в виде ?» Y . ГА„ 0 0 0 A12 A22 0 0 А,з 0 A33 0 Al4 A24 A34 A B2 0 0 D.34) у = [0 С2 0 С4][ха х4 хс 122
Для того, чтобы система была наблюдаемой она должна состоять только из подсистемы S2- и управляемой, 4.4. Значение понятий управляемости и наблюдаемости в ТАР Возможно существование двух особых значений, или мод (одной неуправляемой при s* = l и другой — ненаблюдаемой при s*=—1). Для этой простой одномерной системы неуправляемость и ненаблюдаемость легко обнаружить непосредственно по ее уравнениям или рис. 4.3. Рассмотрим теперь пример, когда систему описывают передаточной функцией. Эта система (рис. 4.8) состоит из двух последовательно соединен- 5-/ (s+1)(S+2) V s+f Рис. 4.8. Представление структурной схемы рис. 4.4 в виде двух последовательно соединенных подсистем ных подсистем с передаточными функциями s+l (s)= Передаточная функция системы или (если провести сокращения) W() II Однако такое сокращение полюса и нуля при s=s*=±l возможно лишь теоретически, так как не учитывает образование диполя системы (рис. 4.9). Если этот диполь расположен в левой полуплоскости вблизи точки —а, то Jurro/гь X- а Рис. 4.9. Нули и полюса системы в левой и правой комплексных полуплоскостях 123
ему в переходном процессе будет соответствовать член вида re ar, где г — вычет, связанный с полюсом. Последний очень мал, так как вблизи полюса расположен нуль. В большинстве случаев этим членом можно пренебречь. Если диполь расположен и правой полуплоскости, то он даст неустойчивый член геа1, каким бы малым г не был. Заметим (см. рис. 4.8), что если по стрелке (от входа к выходу) сначала расположен нуль, а затем полюс, как, например, при s* = l, то имеет место неуправляемость; если по стрелке сначала расположен полюс, а затем нуль, как, например, при s* =—i, то имеет место ненаблюдаемое™. В случае многомерных систем с многими выходами и входами, когда сокращение может происходить в результате свойств определителей, обнаружение неуправляемости и нснаблюдаемости гораздо сложнее. Однако во всех случаях это происходит из-за тех или иных сокращений в подсистемах. Следует подчеркнуть различие между неуправляемыми (или ненаблюдаемыми) полюсами (или нулями) в зависимости от того, расположены они в левой или в iipaeofl полуплоскости. Предположим, что в системе имеется наблюдаемый, но неуправляемый неустойчивый полюс. Так как он наблюдаем, то выход неустойчив. Он не может быть не замечен, но его неуправляемость исключает возможность управления системой. В этом случае выходом из положения может быть изменение не закона регулирования, а структуры системы. Допустим теперь, что система имеет управляемый, но ненаблюдаемый не- устойчниый полюс. Так как упомянутый полюс не связан с выходом системы, то этот выход будет наблюдаться как устойчивый. Но тем не менее внутренняя неустойчивость системы может привести: к аварии, когда неустойчивая переменная достигнет определенной амплитуды; к появлению эффекта насыщения из-за выхода системы из линейной зоны. у г- L S 1 s in Рис. 4.10. Структурная схема CAP: Si — неуправляемая подсистема; S2-- управвляемая Ранее было показано, что входное воздействие не влияет на неуправляемую часть системы. Покажем, что введение обратной связи тоже не позволяет устранить этот недостаток. Рассмотрим САР с обратной связью (рис. 4.10), состоящую из управляемой Si и неуправляемой S2 подсистем. Уравнения системы в разомкнутом состоянии: y=C,xi+C2x2. Учитывая, что e = g—у, уравнения системы в замкнутом состоянии имеют вид 124
В,С, K2 —B,C y-[C, C2)[x, x2]T. При этом се характеристическое уравнение имеет вид del [si—Ai + BiC] dct {si—A2J =0. Корни этого уравнения описывают динамику управляемой части замкнутой системы (первый сомножитель) и неуправляемой части разомкнутой системы (второй сомножитель). Таким образом, введение обратной связи не повлияло на динамику неуправляемой части. К аналогичному вьшоду можно прийти и относительно ненаблюдаемой части. 4.5. Управляемость и наблюдаемость соединений подсистем Линейную систему можно представить как упорядоченную совокупность подсистем. Поэтому очень важно уметь определять свойства системы по свойствам ее подсистем. Исследуем условия управляемости и наблюдаемости при параллельном и последовательном соединении двух подсистем, а также при соединении подсистем с обратной связью. Рассмотрим подсистемы Sn и Sh, имеющие размерность па и nh и собственные значения %ia, • ¦ •. ^паа и Х^,.. . , %пь ь соответственно. Параллельное соединение подсистем. Предположим, что подсистемы Sa и Sf, соединены параллельно и образуют систему S (рис. 4.11, а). Тогда не- Рис. 4.11. Соединения подсистем Sa и Sy. а — параллельное, & — последовательное обходимые и достаточные условия для управляемости (наблюдаемости) системы S состоят в том, чтобы обе подсистемы были управляемы (наблюдаемы). Последовательное соединение подсистем. Для того чтобы система S, являющаяся последовательным соединением подсистем Sa и S& (рис. 4.11,6), была управляемой (наблюдаемой), необходимо, но недостаточно, чтоб:-! обе подсистемы Sa и S* были управляемы (наблюдаемы). Если Sa и S6 управляемы (наблюдаемы), то все неуправляемые (ненаблюдаемые) моды S возникают в Sb (в Sa). Пусть S неуправляема и ненаблюдаема несмотря на то, что Sa и Si, управляемы и наблюдаемы. 125
Пусть Xia==— JCib = —2*1 +«16—«2b; Тогда уравнения системы S имеют вид: из которых видно, что система S неуправляема и ненаблюдаема. Соединение подсистем с обратной связью. Структурная схема многомерной САР показана на рис. 4.12. Обозначим последовательное соединение под- Уа'У Ув Рис. 4.12. Система с обратной связью систем 5а и Sb через Sc, a последовательное соединение S& и Sa через So и предположим, что (I-f-DaDj,) — несингулярна (невьгрождена). Поэтому для того чтобы система S была управляемой (наблюдаемой), необходимо и достаточно, чтобы система SC(SO) была управляемой (наблюдаемой). То есть необходимое, но не достаточное условие для управляемости (наблюдаемости) S состоит в управляемости (наблюдаемости) как Sa, так и S&. Причем неуправляемые (ненаблюдаемые) моды S являются неуправляемыми (ненаблюдаемыми) модами Sc(So) и возникают в S&. Во всех трех рассмотренных случаях п=па-\-пь, Покажем практическое значение понятий управляемости и наблюдаемости. Так, например, при имитационном моделировании проектировщики, полагаясь на устойчивость каждой из подсистем и, в то же время, наблюдая неудовлетворительное поведение всей системы в целом, иногда делают вывод, что это объясняется явлением насыщения в интеграторах, и стремятся его устранить, заново масштабируя переменные. Это, естественно, не помогает, и возникает ложный вывод, что неправильно функционируют сами интеграторы. Но их замена опять не приводит к положительному результату. Избежать лишних затрат времени поможет только предварительный анализ свойств подсистем, входящих в состав САР, 126
Ввод системы управления в эксплуатацию, когда расчеты дают хорошие результаты, но не учтена ее неуправляемость (ненаблюдаемость), может привести в действительности к неполадкам. 4.6. Задача минимальной реализации Найдем матричную передаточную функцию, соответствующую уравнениям D.7), D.8), выраженным в переменных состояния. Применяя преобразование Лапласа в предположении нулевых начальных условий, получим МПФ А)-'В. D.35) Учитывая теперь структуру матриц А, В и С, найдем 4>(s) = [0C2 О С4]Х X = C2(sI — АаГ'Вг, D.36) у=[0 С2 0 С4][х, х2 х3Х4]т. Таким образом, <D(s) совпадает с МПФ, описываемой урав- (sI-An)- 0 0 0 X (si—Аз,1 0 0 X "' X (si-A 0 ззГ1 X X X (si — A^t) в, в2 0 0 нениями х2 = А22Х2 -Ь В2и; у=С2х2. D.37) Следовательно, матричная передаточная функция представляет собой только управляемую и наблюдаемую части системы и не содержит информации о неуправляемой и ненаблюдаемой частях. Это указывает на то, что переход от заданной МПФ <D(s) к эквивалентной форме описания в переменных состояния должен быть корректным. Прежде всего необходимо найти тройку матриц (А, В, С), причем так, чтобы Однако этому уравнению удовлетворяет бесконечное число таких троек и не все из них являются решением системы. Размерность вектора состояния не определяется уравнением D.35), так как ему можно поставить в соответствие любое число лишних переменных состояния, не изменяя вида <I>(s), лишь бы они описывали неуправляемые и ненаблюдаемые моды. Следовательно, для получения описания системы в переменных состояния, т. е. для получения МПФ Ф(«), необходимо, чтобы, во-первых, тройка матриц (А, В, С) удовлетворяла уравнению D.35), а во-вторых, система должна быть управляемой 127
и наблюдаемой, т. е. чтобы матрица С имела минимальную размерность (задача минимальной реализации). Выполнение пер- вого условия несложно, а второго — связано с определенными трудностями. Контрольные вопросы 1. Что такое переменные состояния динамической системы? 2. Какова физическая (математическая) сущность понятия состояния системы? 3. Что такое переходная матрица САР? Каков физический смысл элементов матрицы перехода? 4. Какие существуют способы вычисления элементов матрицы перехода САР? Как из матричной передаточной функции системы получить передаточную функцию САР с одним входом и одним выходом? 5. Что такое наблюдаемость и управляемость? 5. АНАЛИЗ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО РЕГУЛИРОВАНИЯ Одной из основных задач ТАР является исследование дина-, мических процессов, протекающих в системах регулирования и, управления. САР всегда подвергается действию внешних воз? мущающих сил, которые могут вывести ее из состояния равновесия. Если система устойчива, то она противостоит внешним возмущениям: будучи выведенной из состояния равновесия,: снова возвращается к нему. С технической точки зрения требование к устойчивости си-; стемы является более жестким, чем при математической поста?) новке задачи. Техническое задание (ТЗ) на устойчивость систе-1 мы предусматривает не только саму устойчивость, но и временной интервал, в течение которого система должна восстановить состояние равновесия после приложения возмущающей силы. В данном разделе рассмотрены основные критерии и мето,- ды исследования устойчивости линейных непрерывных динамических систем. 5.1. Понятия и определение устойчивости по Ляпунову Устойчивость САР — одно из основных условий ее работоспособности и включает требование затухания переходных процессов. Система с расходящимся процессом на выходе будет неработоспособной. Рассмотрим определение устойчивости, которое было дано А. М. Ляпуновым. САР соответствует система дифференциальных уравнений, которая может быть приведена к виду [19] 128
~ГГ -уь(У\' %. •-.. Уп)\ (А — 1, 2 л), E.1) где tjk — обобщенные координаты системы, т. е. переменные, описывающие ее состояние; Yk — известные функции, определенные в некоторой фиксированной области G пространства переменных уи у2, . . ., уп. Пусть величины г/10, t/20, • • • у Уп обозначают начальные значения переменных уи у2,..., уп. Каждой системе начальных значений ую, У20, ¦ ¦ ¦, Упо соответствует решение Ук=Ук(У\а, г/го,..., Ум, t); (k=l, 2,..., п) E.2) уравнения E.1). Установившиеся процессы описывают следующими тривиальными решениями уравнения E.1): г/1 = г/1*. У2=г/2*, ¦.., Уп=Уп*, E.3) которые представляют собой корни уравнения Yh(yt, у2, . . ., уп); (^=1, 2,..., п). Они входят в семейство решений E.2) и зависят от начальных значений yko=yk*. Обычно рассматривают случаи, когда имеется одно решение E.3), соответствующее вполне определенному установившемуся процессу в системе регулирования. Введем отклонение координат Хк от установившихся значений: хк=Ук—ук*. E.4) Подставляя отклонения E.4) в уравнение E.1), получим систему уравнений: ^*— Xk (xu х2, ..., хп); k=-=\,2 n, E.5) где Xk(xu x2,...,xn) = Yh(x1+y1*; ...; xh+yn*). Уравнения E.5) называют уравнениями возмущенного движения. Формула E.4) определяет преобразование переноса начала координат в точку у*, вследствие чего решению E.3) соответствует хх*=0;...; хп*=0. E.6) По терминологии Ляпунова, уравнения E.6) называют уравнениями невозмущенного движения динамической системы. При t—t0 переменные Xk принимают свои начальные значения, которые называют возмущениями. Каждой заданной системе таких возмущений отвечает однозначное и непрерывное решение Хк==Хк{хЮг ¦"¦20, •¦•> Хп0, О уравнений E.5). Это решение называют возмущенным движением системы. 9—3591 129
Исследования Ляпунова по устойчивости движения позволяют судить об основных свойствах возмущенного движения, не прибегая к интегрированию уравнений E.5), и рационально рассчитывать регулятор САР. Если окажется, что при определенной настройке регулятора решение E.6) будет устойчивым, то система регулирования сама, без постороннего вмешательства, изберет режим невозмущенного движения. Если же решение E.6) будет неустойчивым, то такого установившегося режима получить нельзя. При сколь угодно малых возмущениях Xko система будет от него удаляться. В большинстве задач теории автоматического регулирования функции Xk(X[, х2,..., Хп) допускают разложение в степенные ряды, сходящиеся в некоторой Я-окрестности начала координат E.6): '<Н, если #>0 достаточно мала. В этих случаях уравнениям E.5) можно придать вид ~=-- акххх + ... + a,ksxn -\-Fk (хг ,x2 хп); (? = 1,2 п), E.7) где uks (k, s=l, 2,..., п) — постоянные линейные части разложения, а функции Fk не содержат членов ниже 2-го порядка малости. На практике судят об устойчивости решения E.6), рассматривая вместо уравнения E.7) лишь уравнения 1-го приближения ~j-=а^хх + ак2х2 -г ... + aknxn\ (k = 1, 2, ..., п). E.8) Так как справедливость замены уравнений E.7) уравнениями E.8) заранее не очевидна, необходимо исследовать уравнения E.7), при которых устойчивость (неустойчивость) решения E.6) вытекает из рассмотрения уравнений 1-го приближения E.8). Ляпунов все случаи исследования уравнений E.8) разделил на некритические и критические. К первым относят случаи, в которых вопрос об устойчивости (неустойчивости) невозмущешюго движения однозначно решают на основании исследования уравнений 1-го приближения E.8). Чтобы обнаружить эти случаи, следует составить характеристическое уравнение системы 22 —Я ... а2п ^ _Я „1 ап1 • • • О-пп — '"_ 130
п исследовать его корни Xk {k=\, 2,..., п). Ляпунов доказал две теоремы, которые позволяют исследовать все некритические случаи. Теорема 1. Если вещественные части всех корней Xk характеристического уравнения E.9) 1-го приближения отрицательны, то невозмущенное движение асимптотически устойчиво независимо от членов разложения выше 1-го порядка малости. Теорема 2. Если среди корней кк характеристического уравнения E.9) 1-го приближения найдется по меньшей мере один с положительной вещественной частью, то невозмущенное движение неустойчиво независимо от членов разложения выше 1-го порядка малости. Критические случаи имеют место, когда среди всех корней уравнения E.9) имеются некоторые корни, вещественная часть которых равна нулю, а остальные корни имеют отрицательную вещественную часть. В критических случаях вопрос об устойчивости невозмущенного движения E.6) не может быть разрешен на основании исследования уравнений 1-го приближения: устойчивость (неустойчивость) невозмущенного движения определяется видом нелинейных функций Fk. Поэтому в критических случаях требуется рассматривать уравнения E.7) в исходном виде. Характеристическое уравнение, соответствующее системе уравнений E.8), имеет вид anXn+an-iln-1+ ... +fl1X+ao-=0. E.10) Пусть для определенности все корни уравнения E.10) различны, тогда его решение записывают в виде где Я.ь ta,..., К — корни характеристического уравнения; Аи А-2, ¦ ¦ ¦, Ап — постоянные интегрирования, зависящие от начальных условий. Пусть Kk — вещественный корень. Если Я*>0, то член A^k* с течением времени непрерывно возрастает и стремится к бесконечности. В этом случае х также стремится к бесконечно-. сти и система неустойчива. Если Kk<0, то член Л»ел*' с течением времени стремится к нулю, т. е. затухает. Пусть один из корней Кг — комплексный, тогда всегда существует сопряженный с ним %г: В этом случае &* = Areai sin Если а>0, то имеют место колебания с частотой р и нарастающей амплитудой, т. е. движение неустойчиво. При сс = О получим незатухающие колебания — система находится на границе устойчивости. Если а<0, то амплитуда колебаний с тече- 9* 131
нием времени уменьшается и колебания затухают. Отсюда можно сделать следующие выводы: если все вещественные части корней характеристического уравнения отрицательны, то динамическая система устойчива (рис. 5.1): Плосхость s х —х- вещественном ось Рис. 5.1. Расположение корней характеристического уравнения устойчивой САР на комплексной плоскости если хотя бы один из корней имеет положительную вещественную часть, то система неустойчива. Если в каких-либо корнях характеристического уравнения вещественная часть равна нулю, а у остальных — отрицательная, то об устойчивости невозмущенного движения по первому приближению ничего сказать нельзя и требуется специальное исследование полного уравнения. Наконец, если среди корней характеристического уравнения имеется один или несколько нулевых корней, а вещественные части остальных корней отрицательны, то говорят, что система нейтрально устойчива. Этот случай называют критическим, к для определения устойчивости системы необходимо специальное исследование нелинейных членов разложения. 5.2. Критерии устойчивости линеаризованных САР Вычисление корней характеристического уравнения не представляет труда для уравнений 1-й и 2-й степеней. Что касается общих выражений для корней уравнений 3-й и 4-й степеней, то они громоздки и практически мало удобны. Следует отметить отсутствие общих выражений для корней в уравнениях более высоких степеней. Поэтому важное значение приобретают правила, которые позволяют определить устойчивость системы, минуя вычисления корней. Эти правила называют критериями устойчивости. Они позволяют в ряде случаев не только установить, устойчива система или нет, но и выяснить влияние тех 132
или иных параметров, а также влияние структурных изменений на устойчивость системы. Существуют различные формы критериев устойчивости. Однако математически эти формы эквивалентны, так как определяют условия, при которых корни характеристического уравнения находятся в левой части комплексной плоскости. Критерии устойчивости классифицируют на алгебраические i: частотные. Критерии, которые позволяют определить, устойчива ли система, с помощью только алгебраических процедур пал коэффициентами характеристического уравнения, называют алгебраическими. К ним относят критерии устойчивости: Рауса, Гурвица, Шур-Кона и др. [2, 19, 20]. Алгебраические критерии для систем, описываемых уравнениями выше 4-й стелен]?, дают возможность определить лишь устойчивость системы при заданных численных значениях коэффициентов уравнения. Но затруднительно с их помощью ответить на вопрос: как изменить параметры системы, чтобы сделать се устойчивой? Частотный критерий устойчивости, впервые сформулированный Найквистом, был применен для исследования устойчивости СЛР А. В. Михайловым в 1936 г. Кроме того, последний сформулировал другой частотный критерий, получивший название критерия устойчивости Михайлова. Достоинством частотных критериев является их наглядность, а также возможность использовать частотные характеристики, полученные экспериментально, когда не известны дифференциальные уравнения системы или ее элементов. Крптерш! устойчивости Михайлова целесообразно применять тогда, когда размыкание системы не приводит к заметному упрощению задачи. Об устойчивости замкнутой системы судят по частотной характеристике разомкнутой, и в этом случае применяют критерий устойчивости Найквиста—Михайлова. Кроме того, частотные критерии устойчивости дают представление и о качестве процесса регулирования. 5.3. Алгебраические критерии устойчивости Критерий устойчивости Рауса. Этот критерий формулируют следующим образом: если система автоматического регулиро- нания описьтается линеаризованным характеристическим уравнением вида E.10), то для того, чтобы система была устойчива (т. е. псе корни уравнения имели отрицательные вещественные части), необходимо и достаточно, чтобы все элементы столбца 1 табл. 5.1 для данного уравнения были одного знака. Если ал>0, то все элементы столбца 1 табл. 5.1 должны быть положительны. Таблицу (алгоритм) Рауса (см. табл. 5.1) составляют следующим образом: в строку 1 вписывают коэффициенты уравнения E.10) с индексами (а„, а„-2, а„-4, •••); в строку 2 — коэффициенты уравнения с индексами (ап-и а„-3) ап~ъ, . . ¦); в строку 133
Таблица 5.f Значение г — Г л SSC ——— 18 18 С14 Номер строки 1 2 3 4 5 i + 3 Ci3 = a СИ= с Алгоритм 1 ап Оп-1 п-2-г„а„_3 = Сгз—''г^ I,i+3 = ск- с = Payca Столбец 2 в»_, = а„-4—Гопп-5 3 а„_5 Сзз = а„_6-г0а„_7 С35 ::== ^43—^2^44 •• «3 — коэффициенты схг, с2Ъ, которые подлежат определению. В последующие строки вписывают коэффициенты сы \k — номер столбца; i — номер строки, в которой стоит коэффициент). Каждый из коэффициентов с^, с2з, . .., сы равен определителю; первый столбец определителя составлен из двух элементов, записанных в следующем за искомым коэффициентом столбце таблицы на двух расположенных выше строках. Первый элемент второго столбца определителя образован из частного от деления двух элементов, расположенных в столбце 1 табл. 5.1 на двух вышележащих строках. Второй элемент второго столбца определителя равен единице. Так, 'i-2 'п. 1 an а„-., Ck~\,i-l где Значения г вписывают в боковик табл. 5.1, озаглавленный «Значение г». На них умножают соответствующие коэффициенты. Из критерия Рауса следуют выводы: 1) все коэффициенты характеристического уравнения устойчивой системы должны быть одного знака. Обращение в нуль 134
одного из коэффициентов а; (за исключением коэффициента старшего члена) свидетельствует о неустойчивости системы или о том, что она находится на границе устойчивости. Если коэффициенты характеристического уравнения положительны, то все вещественные корни, если они существуют, отрицательны (так называемые «левые» корни). Комплексные корни могут быть и «правыми»; 2) число отрицательных коэффициентов сц столбца 1 табл. 5.1 равно числу корней с положительной вещественной частью; 3) обращение в нуль аа приводит к появлению нулевого корня. Обращение в нуль последних v коэффициентов ао=О; а: = = 0,... ау_! = 0 приводит к появлению нулевых корней. При этом обращаются в нуль последние коэффициенты си табл. 5.1 {С\, n—Ci, п-1= • • ¦ "ci, n-v+i=0); 4) обращение какого-либо промежуточного коэффициента в нуль свидетельствует о появлении пары чисто мнимых корней. Критерий устойчивости Гурвица. Этот критерий легко получить из критерия устойчивости Рауса. Для данной цели выразим коэффициенты с-л в виде определителей: /r-i а„ пп-1 вл-i an-i "А,1 «Л-В л-, «л О Л-5 йл_4 Йл_з ап-г «л-! пп-i ап пп-i ап-г E.11) А» дТ' а в общем случае где Дд.(& = 1,2, ...) —определители Гурвица, получаемые с помощью следующей записи: а„_11 а„ ап-з ап-2 0>п-Ь Яп-А ап-7 Яп-в 0 «л-З «л-7 0 «я «л-2 «л-4 «л-6 0 0 ап-л ап-г ап-ъ О о E.12) т. е. соответствующим отчеркиванием строк и столбцов. Все коэффициенты с отрицательными индексами заменяют нулями. Определитель составляют по следующему правилу. По диагонали вписывают коэффициенты характеристического уравнения, 135
начиная с ап-л. Строки определителя, начиная с диагонали, заполняют коэффициентами: вправо — по убывающим индексам, а влево — по возрастающим. Согласно критерию Рауса, необходимым, и достаточным условием устойчивости являются соотношения Сп=а„>0; с]2=ал-1>0; с,3>0;... ; си п+1>0. Этим неравенствам, как следует из E.12), эквивалентны неравенства вида а„>0; Д,>0; А2>0; ..... Дя>0. Таким образом, критерий Гурвица формулируют следующим образом: для того чтобы система была устойчива, необходимо и достаточно, чтобы выполнялось неравенство an>0, a определители Гурвица Л], Дг,.. ., Ля были положительны. Для характеристических уравнении высоких степеней порядок определителей возрастает, и практическое вычисление их обычным путем становится громоздким. Необходимые, но недостаточные условия устойчивости за- ключаю.ся в том, что в случае уравнения м-го порядка все коэффициенты а.п, а„-и . . . , ап должны быть положительны и ни один из них не должен равняться нулю. Рассмотрим характеристические уравнения и условия устойчивости для динамических систем, порядок которых не превышает пяти: 1) а1Я+ао = О. Условия устойчивости: aG>0, Qi>0: 2) a^J-a,/.-|-ао — О. Условия устойчивости: ао>О. а.>0. аг>0; 3) а3Р-\-а2^+а,Х-\-аг1=0, Условия устойчивости: an>0, a,>0, а2>0. a3>0, А2=-а,а2—а0а3>0; 4) а,?.4+а3^3+ +Qi>-+Oo=0. Условия устойчивости: ао>О, ai>0, a2>0, as>0, 0 А.2=-а2а3—а^Х), A3 = ata2a3—а^ал—а0а32>0; 5) а5Я6+а4>.4+аз^3+а2^2 +о0=0. Условия устойчивости: ао>О, ai>0, a2>0, Яз>0, а4>0, а5>0, = а,й4 —a.-as>0, д,--= я4 п* а0 О аА я2 аъ а, а, О О в4 «г а0 а„гя52 — а,га42>0. Для п = 2 условием устойчивости является лишь положительность коэффициентов характеристического уравнения. Для я = 3, п = 4, п = Ъ положительность коэффициентов характеристического уравнения недостаточна. Кроме того, коэффициенты должны удовлетворять дополнительным неравенствам. 136
5.4. Частотные критерии устойчивости. Критерий устойчивости Михайлова. Амплитудно-фазовый критерий устойчивости Частотные критерии в большинстве случаев используют в качестве графоаналитических критериев — они отличаются наглядностью при выполнении инженерных расчетов. В основе частотных методов лежит принцип аргумента — следствие из теоремы теории функций комплексного переменного, а именно теоремы Коши, относительно числа нулей и полюсов функции, аналитической н заданной области. Принцип аргумента. Рассмотрим алгебраическое уравнение п-н степени с действительными коэффициентами: D{k) =аД"+ап_,Г-!+ . . . +а^+ао=О. Если через к\, Х2, ¦ ¦ ¦, к„ обозначить корни этого уравнения, то многочлен D(k) можно представить в виде произведения простых сомножителей: D{X)=an{k—Аг)(А—Я2) . . . (Л—л„). На комплексной плоскости каждому корню соответствует вполне определенная точка (рис. 5.2, а). Геометрически каждый корень Х{ изображается в виде вектора, проведенного из начала координат к точке кг (рис. 5.2,6). Длина этого вектора J 1 Цепстбительная ось Рис. 5.2. Корни характеристического уравнения системы: а — расположение корнеП; б— модуль и фаза иектора Я,; равна модулю комплексного числа, т. е. \Xt\, а угол, образованный вектором с положительным направлением действительной оси, — аргументу или фазе комплексного числа Л<, т. е. 'dvgki. Векторы (к—Xt), входящие множителями в D(X), проведены из точек Хг к точке к. Каждый из этих векторов является разностью двух векторов, соответствующих к и h (рис. 5.3). Если принять А=/со в D(k), то D(/co)=an(/co—A.i) (/со—Ы • • ¦ (/со—Я„). где со — круговая частота (см. раздел 3.3.). 137
Рис. 5.З. Элементарный вектор (X—%{) Рис. 5.4. Элементарные векторы (/со—Я(), 1=1, 2,..., п Концы элементарных векторов будут находиться на мнимой оси в точке X=ja> (рис. 5.4). Модуль этого вектора равен произведению модулей элементарных векторов и ап: \D(j(?>) | =ал|/©—Ai| I/a—Яг! • ¦ ¦ |/ю—^J- а аргумент или фаза его равна сумме аргументов элементарных векторов: argD(/co)=arg(/o)—h Направление вращения вектора против часовой стрелки принимают за положительное. Тогда при изменении со от —со до -f-°° каждый элементарный вектор (/со—X,) повернется на ( ) X р р угол +л, если его начало (корень находится в левой части комплексной плоскости, и на угол —л, если его начало (корень Кк) находится в правой части комплексной плоскости (рис. 5.5). Если уравнение D(X)—0 имеет т корней в правой части плоскости К и, следовательно, п—т корней — в левой части комплексной плоскости, то при возрастании <о от —оо до +°° изменение аргумента вектора D(/co), или угол поворота .5. Изменение аргу- D(/o)) (равный сумме изменений ар- сша векторов (ко—%Л и ' ч J^ /«-Л») при возрастании г>ментов элементарных векторов), бу- частоты © от —оо до +оо дет Рис. 5 мента A arg E.13) Отсюда следует, что разность (п—т) корней уравнения D(X)~ = 0, находящихся в левой части плоскости, и т корней, рас- 138
положенных в правой части плоскости, умноженная на л, отражает собой изменение аргумента D(/co) при возрастании со от —оо до -j-°°' Это утверждение в теории автоматического регулирования называют принципом аргумента. Критерий устойчивости Михайлова. Этот критерий основан на принципе аргумента E.13) и является геометрической интерпретацией соотношения A arg D{ju) = (n — т);л — тл=^(п — 2 т) л, < где т — число корней в правой части комплексной плоскости; (п—т)—число корней в левой части комплексной плоскости. Пусть характеристическое уравнение системы с обратной связью (замкнутой САР) имеет вид D(X) =anX"+an-i^''~1+ • • • +u]h+ao=O. Если все корни этого уравнения находятся в левой части комплексной плоскости X (система устойчива), а в правой части плоскости корней нет, то т = 0 и изменение аргумента A arg D {j а>) = пк. — зо<ю<оо Отсюда следует вывод: САР является устойчивой, если при возрастании со от —оо до +°° изменение аргумента вектора О (/со) будет равно пп, где п — степень характеристического уравнения ?)(А,)=0. При изменении частоты со от —оо до +оо вектор ?>(/со) на комплексной плоскости опишет своим концом кривую, которая называется характеристической кривой, или годографом вектора D(JG>) . Уравнение характеристической кривой определяют подстановкой Л=усо в многочлен D(k) и последующим разделением действительной и мнимой частей: Z}(/<fl)=aB(/co)n+an_i(/co)n~1+ ... +a1(/co)+a0; Z)(/co)=«(co)+/y(co), где и (со) —a,Q—а2<й2+а4°L—¦ • ¦ •. г1 (со) =«!<¦)—a3co3+auco5— . .. Действительная часть «(со) является четной функцией, а мнимая часть и (со) —нечетной функцией частоты со, т. е. и(—to) = = ы(со), у (—со) =-и (со). Поэтому для отрицательных значений со ?>(—/со) =ы(со)— jv (со). Отсюда следует, что характеристическая кривая симметрична относительно действительной оси для +го и —со. При построении характеристической кривой можно ограничиться лишь 139
положительными значениями w от 0 до со. При этом угол поворота вектора D(/a»), т. е. изменение аргумента D(/co), уменьшается вдвое и критерий устойчивости формулируется следующим образом. САР будет устойчивой, если при возрастании частоты <о от О до +со вектор ?>(/со) повернется на угол «я/2 (где п — степень уравнения D(A)=0). Это означает, что вектор характеристической кривой (при изменении частоты от 0 до +оо) начиная с положительной действительной оси) последовательно «обходит» п квадрантов в положительном направлении, т. е. против часовой стрелки. На рис. 5.6 приведены характеристики, соответствующие устойчивой системе. При п— 1 изменение аргумента равно л/2, при п=2 изменение аргумента равно я и характеристическая кривая проходит через два квадранта, и т. д. JV(UJ) 'и(ш) Рис. 5.6. Характеристические кривые Рис. 5.7. Годограф не- (годографы) для устойчивых систем устойчивой системы На рис. 5.7 приведена характеристическая кривая для п— = 4, которая соответствует неустойчивой системе. Система будет находиться на границе устойчивости, если ее характеристическая кривая при некотором значении пересекает начало координат, обходя при этом (п—1) квадрантов. Частота со является одновременно корнем уравнений «(со)=0 и и(со)=О. В ряде случаев может быть использован критерий устойчивости, называемый критерием перемежаемости корней (рис. 5.8 и 5.9). Действительно, характеристическая кривая при изменении со от 0 до оо будет обходить в положительном направлении п квадрантов и система устойчива, если «@)>0, у@)=0 и уравнения «(со)=0 и и(со)=0 имеют все действительные и перемежающиеся корни, т. е. если между каждыми двумя соседними корнями а(со)=0 лежит корень уравнения ы(со)=0 или между двумя соседними корнями и(со) находится корень уравнения и(со)=0. 140
Для устойчивости системы корни должны перемежаться и быть вещественными, а сумма корней должна быть равна порядку уравнения п. На рис. 5.8 при п=4 изображены характеристические кривые, соответствующие устойчивой системе, а на рис. 5.9 — неустойчивой системе. и(ш) Рис. 5.8. Вещественная и мнимая части кривой ?>(/@) устойчивой САР (п=4) Рис. 5.9. Вещественная и мнимая части кривой D(ja) неустойчивой САР (п=4) Амплитудно-фазовый критерий устойчивости (частотный критерий устойчивости Найквиста—Михайлова). Этот критерий, основанный на рассмотрении частотных характеристик разомкнутых САР, был впервые доказан Найквистом применительно к ламповым усилителям с обратной связью и введен Михайловым в теорию автоматического регулирования. Данный критерий, как и критерий Михайлова, вытекает из принципа аргумента. Для вывода амплитудно-фазового критерия устойчивости рассмотрим вспомогательную функцию ф(/ф), которая связана с частотной характеристикой разомкнутой системы W(ja>) соотношением Частотная характеристика разомкнутой системы №(/со) может быть выражена через полиномы числителя Mp(ja) и знаменателя Dp (/со) разомкнутой системы: Тогда РЦа>) Знаменатель функции ф(/со) представляет собой характеристическую кривую разомкнутой системы, а числитель — характеристическую кривую замкнутой системы. Предполагается, что разомкнутая система устойчива. Устойчивость разомкнутой системы можно установить без каких-либо вычислений непосредственно по структурной схеме системы. Например, 141
разомкнутая система, состоящая из устойчивых звеньев и не содержащая обратных связей, заведомо устойчива. Если разомкнутая система устойчива, то изменение аргумента при возрастании частоты <о от 0 до + оо будет О<со< оо, где п — степень характеристического уравнения разомкнутой системы ?>Р(Л)=О (она совпадает со степенью характеристического уравнения замкнутой системы, так как в реальных системах степень числителя передаточной функции не может превосходить степени знаменателя). Изменение аргумента ?(/со) при возрастании © от 0 до +оо в общем случае: A arg Dp (у со) = я4г, 0<0)< оо, где п — число корней характеристического уравнения D{%) = = 0, лежащих в правой части комплексной плоскости. Изменение аргумента функции D при возрастании со от 0 до + оо равно разности изменений аргумента D(joi) и Z)p(/co), т. е. Д arg ф(Усо) = Л arg ?>(усо)~Д arg Dp(;'co)= 0<@<оо О«В<з° 0<Ш<оо = (n — 2m) -y - n -J- = — ma. Система будет устойчивой, если т=0, т. е. если Aargcp(/oo)=O. Вектор ф(/со) опишет угол, равный нулю, лишь з том случае, когда его годограф не охватывает начало координат (рис. 5.10); точка А отстоит от начала координат на единицу. От этой кривой можно перейти к амплитудно-фазовой характеристике (АФХ), построенной по выражению №(/со) на плоскости U(со)jV(со), если сместить эту кривую на единицу влево. В плоскости W(ja) начало вектора ср(/со) находится в точке (—1; / 0), а конец вектора при изменении со скользит по АФХ. Изменение аргумента cp(jco) равно нулю, если точка (—1; / 0) будет находиться вне АФХ (рис. 5.10, б). 142
Рис. 5.10. Соотношения между годографами: а — годограф вектора <l>(j(v); б — соответствующий сну годограф нектора W(/u>) Амплитудно-фазовый критерий устойчивости формулируют следующим образом: САР будет устойчивой, если АФХ U7(/ со) не охватывает точки с координатами (—1; / 0). При рассмотрении многоконтурных систем, имеющих местные обратные связи, а также систем, содержащих неустойчи- зые звенья, разомкнутая система может оказаться неустойчивой. Для такой разомкнутой системы возможность экспериментального определения АФХ исключается, однако эта характеристика может быть построена по уравнениям системы и по ней можно судить об устойчивости системы. В этом случае изменение аргумента Z)p(/co) при возрастании а» от 0 до + °о: где р — число корней характеристического уравнения разомкнутой системы, лежащих в правой части комплексной плоскости. Если замкнутая система устойчива (р=0), то на основании принципа аргумента Д arg D (/&>)= я-f-, — Д arg . 0«0<оо следовательно, Д ащ ф(/со) = Д arg i 0<со<оо 0<ы<оо — П—2—(л —2о)-^- = /?л=-|-2я. САР будет устойчивой, если АФХ охватывает точку (—1, / 0) з положительном направлении р/2 раз. При р=Ь получится прежний результат. На практике удобнее пользоваться следующей формулировкой критерия устойчивости, исключающей необходимость непосредственного подсчета изменения аргумента: изменение аргумента ф(/и) при возрастании ш от 0 до +с° будет равно нулю, если число переходов АФХ W(ja) через отрезок действительной оси (—оэ... _1) из верхней полуплоскости в нижнюю и из нижней в верхнюю одинаково. Это изменение аргу- 143
мента будет равно ±ря, если разность между ними равна ±р/2. Переход W(ja) (с возрастанием со) из верхней полуплоскости в нижнюю считается положительным, а из нижней и верхнюю — отрицательным. В окончательном виде амплитудно-фазовый критерий устойчивости можно сформулировать следующим образом: САР будет устойчивой, если разность между положительными и отрицательными переходами АФХ отрезка действительной оси (—оо...—1) равна р/2, где р — число корней характеристического уравнения разомкнутой системы с положительной вещественной частью. Следует отметить, что если №(/со) при со = 0 начинается на отрезке действительной оси (—оо ...—]); то считается, что №(/о>) при а>=^0 совершает половину перехода. В частном случае, когда р = 0 (что соответствует устойчивой или нейтрально-устойчивой разомкнутой системе), система будет устойчивой, если разность между положительными и отрицательными равна нулю. Пример. На рис. 5.11 изображена ЛФХ разомкнутой САР. В точках ее перехода через участок действительной оси (—оо...—1) ставят стрелки в сторону возрастания со и определяют разность между числом стрелок, на- jvfw) Рис. 5.11. Интерпретация амплитудно-фазового критерия устойчивости на комплексной плоскости U(<d), правленных вверх и вниз. Для АФХ на рис. 5.11 разность между положительными и отрицательными переходами равна единице B—1 = 1). Если разомкнутая система неустойчива и р = 2, то замкнутая система будет устойчивой. Таким образом, критерий устойчивости Найквиста—Михайлова позволяет по годографу АФХ разомкнутой системы судить об устойчивости САР с обратной связью (замкнутой системы). Критерий может быть использован и в тех случаях, когда дифференциальные уравнения системы (или отдельных ее звеньев) не известны, но расчетчик располагает соответствующими экспериментальными частотными характеристика- 144
ми. Кроме того, критерий дает возможность исследовать устойчивость системы не только с сосредоточенными, но и с распределенными параметрами, а также позволяет связать исследование устойчивости с последующим анализом качества. 5.5. Анализ устойчивости одноконтурных систем автоматического регулирования по их частотным характеристикам АФЧХ САР в зависимости от пересечения с вещественной осью относительно критической точки с координатами (—1; /0) можно подразделить на два типа: 1-й, когда все точки пересечения АФЧХ с вещественной осью расположены справа от критической точки (кривая 1, рис. 5.12); 2-й, когда все точки пересечения АФЧХ с вещественной осью расположены к;:к сле- 1>а, так и справа от критмчесхо.': го',ки (кривая 2, рис. 5.12). В системах 1-го типа увеличение передаточного коэффициента К выше его критического значения приводит к нарушению устойчивости, а уменьшение ни- 0 Шш) W(jw) Рис. 5.12. Амплитудно-фазовые характеристики 1-го и 2-го типа же критического—к стабилизации системы. Следует отметить, что критическим называют то значение передаточного коэффициента К, при котором АФЧХ проходит через критическую точку (—1; /0), т. е. система находится на границе устойчивости. В системах 2-го типа при увеличении К выше его критического значения система может превратиться из неустойчивой в устойчивую, а при уменьшении —из устойчивой в неустойчивую. На основании амплитудно-фазовых критериев устойчивости могут быть сформулированы требования, которым должны удовлетворять логарифмические частотные характеристики разомкнутой системы для того, чтобы она была устойчива в замкнутом состоянии. Если система имеет АФЧХ 1-го типа, то она устойчива в случае, когда всем точкам АФЧХ, начиная с со = 0, вплоть до точки пересечения с окружностью единичного радиуса, соответствуют значения фазы 0, большие, чем (—п). Точке пересечения АФЧХ с окружностью единичного радиуса соответствует точка пересечения ЛАЧХ L(co) с осью частот (так как lg 1 = 0). Поэтому для того, чтобы система, устойчивая в разомкнутом состоянии и имеющая АФЧХ 1-го типа, была устойчива и в замкнутом состоянии, необходимо и достаточно, чтобы при всех 10—3591 145
частотах, при которых ЛАЧХ положительная, т. е. L I значения фазы 8(и) не превышали (—л). На рис. 5.13,а приведены характеристики устойчивой и неустойчивой систем соответственно. Если система, устойчивая в разомкнутом состоянии, имеет АФЧХ 2-го типа, то для того, чтобы она была устойчива в замкнутом состоянии, необходимо и достаточно, чтобы разность между числом положительных (сверху вниз) и отрицательных иш) , 0 в (D -^-^ , а < ч Рис. 5.13. Логарифмические частотные характеристики САР: а — устойчивой; б — неустойчивой (снизу вверх) переходов АФЧХ отрезка действительной оси (—о° ... —1) была равна нулю. Но в точках пересечения АФЧХ отрезка (—»...—1) ЛАЧХ L(a) положительна, а фазовая характеристика 9(ю) пересекает прямую (—л) снизу вверх (положительный переход) или сверху вниз (отрицательный переход). Поэтому для того, чтобы система, устойчивая в разомкнутом состоянии, была устойчива в замкнутом состоянии, необходимо и достаточно иметь разность между числом положительных и отрицательных переходов фазовой характеристики О (о) и прямой (—л), равную нулю при тех значениях и, для которых ЛАЧХ L (со) положительна. Если ЛЧХ разомкнутой системы имеют вид, изображенный на рис. 5.14, а (разомкнутая система устойчива или нейтрально устойчива, т. е. имеет полюс в начале координат), то замкнутая система будет также устойчива. Если САР в разомкнутом состоянии неустойчива и характеристическое уравнение имеет р корней в правой полуплоскости, то для устойчивости системы в замкнутом состоянии необходимо и достаточно, чтобы разность между числом положительных и отрицательных переходов АФЧХ на отрезке (—оо .. .—1) составляла р/2. Поэтому для устойчивости замкнутой системы, характеристическое уравнение которой в разомкнутом состоянии имеет р корней в правой полуплоскости, необходимо и достаточно, чтобы число положительных переходов между фазовой характеристикой 0(а>) и прямой (—л) превышало на р/2 146
число отрицательных переходов при положительных значениях ЛАЧХ. На рис. 5.14,6 приведены ЛАЧХ, соответствующие системе неустойчивой в разомкнутом состоянии, если р=2. Если характеристическое уравнение этой системы имеет два корня с по- С(ш) Рис. 5.14. ЛЧХ разомкнутых систем, устойчивых в замкнутом состоянии: а ~ число корней в правой полуплоскости Р~0; б — число корней и правой полуплоскости Р=2 ложительной действительной частью (р=2), то такая система будет устойчивой в замкнутом состоянии, так как разность между числом положительных и отрицательных переходов равна единице. Для анализа устойчивости по логарифмическим частотным характеристикам следует: определить и построить ЛАЧХ и ЛФЧХ системы; найти интервал частот, в котором ЛАЧХ положительна |Х(ю)>0]; подсчитать число пересечений в этом интервале частот ЛФЧХ 8(ю) с прямой (—л) снизу вверх (+) и сверху вниз (—). Если разность между числом точек пересечения, отмеченных знаком «+», и числом точек пересечения, отмеченных знаком «—», равна значению р/2, то система устойчива; если какому-либо другому значению, то система неустойчива. В случае астатических систем при подсчете числа точек пересечения необходимо учитывать точку пересечения (или касания) амплитудно-фазовой характеристикой отрезка (—°° ... • ..—1), получающуюся при бесконечно малых значениях ©. 5.6. Запасы устойчивости систем по модулю и фазе Устойчивость замкнутой САР зависит от расположения го- Дографа W(/<o) разомкнутой системы относительно критической точки с координатами (—1; / 0). Чем ближе он к критической точке, тем ближе замкнутая система к границе устойчивости. ю* 147
ulw) Для устойчивых систем удаление годографа W(jg>) от критической точки (—1; / 0) характеризуется запасом устойчиво-' сти по модулю и фазе (рис. 5.15). Минимальный отрезок действительной оси h, характеризующий расстояние между критической и ближайшей точкой пересечения годографа W(/(o) с действительной осью, называют запасом устойчивости по модулю. Минимальный угол у. образуемый радиусом, проходящим через точку пересечения годографа W(/a>) с окружностью Рис. 5.15. Запасы устойчивости единичного радиуса (с центром в САР по модулю и фазе начале координат) и отрицательной частью действительной оси, называют запасом устойчивости по фазе. Система обладает требуемым запасом устойчивости, если она, удовлетворяя условию устойчивости, имеет значения модуля характеристического лектора W(j(o), отличающиеся от единицы не менее чем на заданное значение h (запас устойчивости по модулю), и угол поворота или фазу, отличающуюся от ( —л) не менее чем на заданное значение у. Амплитудно- фазовые характеристики систем, обладающие запасами устойчивости по углу или по фазе (рис. 5.16), не должны входить в область I—I, II—II комплексной плоскости. В случае применения для анализа устойчивости логарифмических частотных характеристик (рис. 5.17) запасу устойчиво¦f Рис. 5.16. Зона устойчивости СЛР на Рис. 5.17. Определение запасе»» комплексной плоскости устойчивости САР по ЛЧХ сти системы по модулю соответствует отрезок 1=20 lg h при том значении частоты, при котором фазовая характеристика G((o)=—я. Относительно ЛЧХ можно говорить и о запасах устойчивости по модулю (/i и /г), соответствующих частотам Щ и (о2- Запасу устойчивости системы по фазе f соответствует значение угла, превышающее значение фазовой характеристика над линией —л при частоте среза соср (см. рис. 5.17). 148
5.7. Определение областей устойчивости Критерии устойчивости позволяют выяснить, устойчива ли САР, если все ее параметры (постоянные времени, коэффициенты усиления и др.) заданы. Часто на практике задают все параметры системы (кроме одного или двух, которые могут изменяться в некоторых пределах) и определяют, при каких их значениях система будет устойчивой [2]. Для решения этой задачи необходимо многократно повторять построение годографа Михайлова или АФХ либо, если пользоваться критерием устойчивости Гурвица, проводить анализ сложных и громоздких выражений. Области устойчивости и плоскости двух действительных параметров системы были впервые введены И. А. Вышнеградским. Пусть в характеристическом уравнении ДлХл-га„-,л(я~1>+ ... + а1к + ао—.О E.14) псе коэффициенты, кроме двух (например, а0 и ап), определены. При неко- vopi.rx фиксированных значениях ао и а„ урапненис E.14) имеет гга комплексной плоскости К корней, лежащих слепа, и п—К корней, лежащих справа от мнимой оси. Изменение в определенных пределах значении коэффициентов ао и ип не вызывает изменения числа корней, расположенных сле- iin и справа от мнимой оси в плоскости корней. Поэтому на плоскости ао ¦: а... можно выделить такую область, каждая точка которой определяет ;ногочлен (п.14), также имеющий К корней, лежащих слева, и п—К корней, лежащих справа от мнимой оси. Эту область обозначим через D(K)- Число К может иметь любое целое значение, и в плоскости ао, а„ можно указать области D(K), соответствующие разным значениям К. Например, если характеристическое уравнение имеет третью степень (п = 3), то *:огут быть указаны области D[% D[\\, D[2] и D[3]. Область ?>[3] будет областью устойчивости в пространстве коэффициентов. Если не существует иодасти йЩ, то это значит, что при любых значениях неопределенных ко- ¦: !фициентов (а» и ап) и при заданных значениях остальных коэффициентов уравнение не может иметь трех корней с отрицательной действительной частью слева от мнимой оси, т. е. система не может быть устойчивой. При трех неопределенных коэффициентах, например при ао. а, и а„, следует рассматривать трехмерное пространство с осями координат ао, ai ii an. При большем числе коэффициентов приходится рассматривать много- vepHoc пространство коэффициентов и область D[K] выделяется гиперповерхностью. Такое разбиение пространства коэффициентов называют D-раз- биением. Пусть К корней полинома лежат слева от мнимой оси. Если плавно изменять значения коэффициентов о,-, то корни могут перейти в правую полуплоскость. Этот переход может осуществляться либо через мнимую ось, либо через бесконечность при значении параметров, обращающих в нуль коэффициент о0. Переход в пространстве D-разбиения соответствует в плоскости корней переходу корней через мнимую ось. Отсюда следует метол определения границы D-разбиния, которую определяют заменой в исследуемом полиноме Я на /ш и могут построить изменением значения м от —оо до +°о, т. е. граница О-разбиения есть отражение мнимой оси плоскости корней на пространство коэффициентов характеристического уравнения. Аналогичным образом можно построить D-разбпение пространства любых параметров, от которых зависят коэффициенты характеристического уравнения (например, постоянных времени и коэффициентов усиления системы). 149
Построение области устойчивости в плоскости одного комплексного параметра. В том случае когда необходимо исследовать влияние на устойчивость только одного параметра (при заданных значениях других парамет. ров), удобно ввести вместо неизвестного параметра комплексную величину, вешестпеннан часть которой равна этому параметру. Для определения влияния, например параметра к, характеристическое уравнение выражают относительно этого параметра А, т. е. приводят к виду QO.)+kR(X)=0, откуда Предполагается, что Для построения области устойчивости принимают Х = /ш и разделяют вещественную и мнимую части: Задавая различные значения частоты со (от —оо до +оо), строят в плоскости U. V (плоскости k) границу .D-разбиения. При движении по мнимой оси от о> = — оо до щ=+оо на комплексной плоскости область корней с отрицательными вещественными частями остается слева. При этом отмечают направление движения от —оо до +оо и заштриховывают левую часть кривой по отношению к этому движению. В той части плоскости, в сторону которой направлены штрихи, находится отображение левой полуплоскости корней. Поэтому областью устойчивости может быть только эта часть ило-:.ч.с" :¦. Так как область устойчивости ищется в плоскости только одного параметра, то этой области может и не быть; поэтому необходимо проверит,, условие остойчивости с помошью какого-либо критерия. После нахождения области \r:'i;ii4iiBOCTn рассматривают лишь действительные значения k. Пример. Пу.:ть дано характеристическое уравнение системы которое выразим относительно параметра k: Вместо ). подставим )ш, т. е. %—ju>. Тогда где L' = oJ, V=(u3—со. В плоскости U и V (рис. 5.18) строим область D-разбиения. При частоте 10 = 0, U—Q и У=0; при <в=1, U=\ и 7=0, при ю-»-оо, ?/->-оо и 1/->°°. Кривую границы области следует заштриховать слева при движении от <о = = —оо к Ш=+оо. Областью, соответствующей полиномам, имеющим наибольшее число горней слева от мнимой оси, будет область, заштрихованная на рис. 5.18. Проверим, является ли она областью устойчивости. Для этого выберем, например, граничную точку /е=0, когда уравнение сводится к виду /.(>.ЧЬ+1)=0. Его корни 1 ^3~ /¦1 — 0, '"з.з"" 2 ~ 2 ' т. е. один корень нулевой, а два лежат слева от мнимой оси. Внутри области число корней, расположенных слева от мнимой оси, должно быть 150
Рис. 5.18. Выделение областей устойчивости, D[l], D[2], ?>[3] — области, соответствующие различным значениям корней на один больше, так как при этом происходит движение в сторону штриховки. Следовательно, этой области соответствуют полиномы, у которых все три корня лежат слева от мнимой" оси. Здесь существенны только действительные значения k, принадлежащие области устойчивости. Они определяются отрезком оси U, лежащим внутри области D[3]. Условию устойчивости рассматриваемой системы отвечают значения 061 Контрольные вопросы 1. Дайте строгое определение устойчивости динамической системы (САР) по Ляпунову. Что такое критерий устойчивости? 2. В чем достоинства и недостатки алгебраических и частотных критериев устойчивости САР? 3. В чем состоит смысл принципа аргумента? 4. Сформулируйте и проиллюстрируйте на примерах частотные критерии Михайлова и Найквиста, используя АФХ. 5. Сформулируйте и проиллюстрируйте частотный критерий устойчивости Найквиста с использованием ЛЧХ. 6. Что такое запасы устойчивости по модулю и фазе? Что они характеризуют? 7. Что такое полоса пропускания системы? 8. Как построить области устойчивости САР в плоскости одного параметра? Что дает проектировщику САР выделение областей устойчивости? 6. АНАЛИЗ КАЧЕСТВА ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО РЕГУЛИРОВАНИЯ Задача анализа качества процесса регулирования заключается в нахождении ряда показателей, характеризующих переходную функцию системы и называемых первичными показателями качества. Их удобно использовать при составлении технического задания на проектируемую САР. В данном разделе рассмотрены методы определения показателей качества регулирования. Основное внимание уделено 151
частотному метолу анализа, который базируется на связи вещественной частотной характеристики САР, вычисленной при разомкнутой цепи обратной связи, с переходной функцией системы. Это позволяет использовать логарифмические характеристики разомкнутой САР, необходимые для анализа как устойчивости по амплитудно-фазовому критерию, так и качества регулирования. Для оценки точности САР в установившемся режиме при действии детерминированных сигналов и возмущений используют метод коэффициентов ошибок. 6.1. Методы анализа качества САР Качество САР или качество регулирования являются обобщенными показателями системы, характеризующими: во-первых, переходный процесс; во-вторых, статическую точность системы при некоторых типовых воздействиях; в-третьих, точность при медленно изменяющихся сигналах [19, 12]. Для оценки качества детерминированных САР выбирают типовые (тестовые) воздействия, являющиеся наиболее неблагоприятными или характерными для данной САР (например, ступенчатые функции: единичные; дельта-функции; воздействия, соответствующие движению с постоянными скоростью и ускорением, а также гармонические воздействия и др.). Для оценки стохастических САР применяют вероятностные методы, определяя динамическую точность САР по значению среднеквадратической ошибки или среднеквадратического отклонения регулируемой переменной. Вопросы анализа и синтеза САР, функционирующих при случайных управляющих и возмущающих воздействиях, будут рассмотрены далее. Качество регулирования при детерминированных воздействиях можно оценивать: непосредственно, т. с. по экспериментальным или расчетным кривым переходного процесса в САР; косвенно, т. е. по каким-либо динамическим характеристикам или параметрам системы. Оценки, полученные непосредственно по кривой переходного процесса САР, называют прямыми (первичными) показателями качества, а оценки, определяемые другими способами — косвенными показателями. Вычисление переходных процессов с математической точки зрения сводится к отысканию общего решения неоднородного дифференциального уравнения, описывающего физические процессы в САР при заданных начальных условиях и воздействиях, а также к анализу влияния изменения параметров системы на вид этого решения. Следует отметить, что аналитическое решение уравнений требует вычислений корней характеристического уравнения и определения произвольных постоянных, связь которых с конструктивными параметрами системы для уравнений выше 3-го порядка установить трудно. Поэтому применяют приближенные методы определения переходных процессов, не тре- 152
бующих, так же как и при анализе устойчивости, непосредственного решения дифференциальных уравнений. При анализе качества САР необходимо установить, находится ли переходный процесс внутри области допустимых по техническому заданию значений или выходит из нее. Основные методы определения переходных процессов и анализа качества линейных САР: 1) частотный; 2) корневого годографа (распределения и траектории нулей и полюсов передаточной функции системы); 3) логарифмического корневого годографа; 4) интегральных оценок. Рассмотрим их. 1. Частотный метод. Основан на рассмотрении преобразования Лапласа X(s) для регулируемой величины при чисто мнимых значениях аргумента s = j<o, а также на связи, существующей между частотными характеристиками замкнутой (разомкнутой) системы и переходным процессом. Одно из основных различий между прямым методом анализа переходных процессов, основанным на преобразовании Лапласа, и частотным заключается в том, что первый является аналитическим и связан с вычислением корней характеристического уравнения системы, а второй (как и частотный метод анализа устойчивости) — графоаналитическим, не требующим вычисления корней. При использовании частотного метода анализа переходных процессов исходными данными могут быть частотные характеристики, которые определяют из эксперимента, без использования дифференциальных уравнений всей системы в целом или отдельных ее элементов. Этот метод позволяет: а) проводить полный анализ динамики, а также решать многие вопросы синтеза корректирующих устройств или регулятора САР; б) учитывать особенность САР, заключающуюся в том, что анализ систем в разомкнутом состоянии обычно проще, чем в замкнутом; в) осуществлять анализ устойчивости, качества, а также переходных процессов и систем любого порядка (как одно-, так и многоконтурных, содержащих не только сосредоточенные, но и распределенные параметры); г) решать вопросы анализа и синтеза систем при непрерывно изменяющихся воздействиях. 2. Метод корневого годографа. Основан на связи между расположением нулей и полюсов передаточной функции системы в замкнутом и разомкнутом состоянии и на изучении их перемещения на плоскости s при изменении параметров системы. Если в процессе проектирования САР были получены характеристики переходного процесса, не соответствующие предъявляемым техническим требованиям, то изменением положения кор- ней характеристического уравнения можно изменить показатели качества. Метод корневого годографа позволяет проанализировать, как меняются корни уравнения при изменении от —°° до +°° линейно-входящего параметра системы, и показывает, как нужно изменить эти корни для получения требуемых характеристик. 15а
3. Метод логарифмического корневого годографа. Основан на анализе свойств замкнутой системы по логарифмическим комплексным частотным характеристикам разомкнутой системы, т. с. характеристикам, построенным для комплексных значений аргумента s = o+/co в выражении для передаточной функции W(s). 4. Метод интегральных оценок. Использует определенные интегралы по времени от функции регулируемой величины или ошибки. При этом для косвенных интегральных оценок обычно не требуется знания корней характеристического уравнения. Он может быть отнесен к аналитическим методам, хотя во многих случаях требует значительных числовых расчетов. Этот метод эффективен при использовании электронных вычислительных машин. Из перечисленных методов только частотный позволяет проводить оценку прямых (первичных) показателей качества (время переходного процесса, значение перерегулирования, числи перерегулирований). Остальные методы дают лишь косвенные оценки качества (например, степень устойчивости, показатель колебательности и т. п.). 6.2. Частотный метод определения переходных функций линейных непрерывных САР Первичные показатели качества. Поведение системы в переходном процессе, вызванном типовым воздействием, стремящимся с течением времени к постоянному установившемуся значению, можно охарактеризовать при помощи некоторых параметров, называемых первичными показателями качества САР. В частности, при ступенчатом воздействии и нулевых начальных условиях переходный режим системы характеризуется следующими показателями качества (рис. 6.1): x(t) Рис. 6.1. Определение показателей качества САР а) установившимся значением хуст:=л:(оо) (т. е. статическим отклонением регулируемой переменной x(t), которое определяет статическую ошибку (точность) системы ?уст — -^вт" 'Л-уст, б) временем регулирования Тр (т. е. временем переходного процесса 7ц.и), которое характеризует быстродействие системы. 154
Время Тр определим как наименьшее значение интервала времени tp—/0. отсчитываемого от начала приложения воздействия /о до момента tp, после которого \x(t)— ЛГу где А — заданная малая постоянная величина (значение А обычно назначают равным 0,05 хуст); в) положительным перерегулированием хта% (т. е. максимальным динамическим отклонением) регулируемой величины: времени 1 I о, { sssss. 77777 t г) числом колебаний N величины x(t) в течение переходного процесса, т. е. в интервале tP—to- Три показателя: дгуст, Тр, а (или N) — определяют качество переходных процессов минимально-фазовых систем, т. е. систем с минимально-фазовыми или «левыми» передаточными нулями и полюсами. Показатели качества выбирают в зависимости от технических требований, предъявляемых к системе. Система обладает необходимым качеством, если она удовлетворяет заданным условиям качества, а переходный про- x(i) цесс не выходит из области допустимых значений (на рис. 6.2 граница области допустимых значений обозначена штриховкой). Графоаналитический метод определения переходного процесса, рассмотренный далее, может быть реализован на ЭВМ с подсистемой визуализации или с использованием обычных графических средств. В первом случае данный метод является основой для математического и программного обеспечения ЭВМ. Связь между частотными характеристиками замкнутой системы и переходным процессом. Связь между частотным и временным пространствами имеет в теории автоматического регулирования фундаментальное значение, так как на этой основе возможно решение различных задач анализа и синтеза систем. Математической основой для частотного метода определения и анализа переходных процессов является преобразование Фурье. Оно позволяет получить на основании дифференциальных уравнений с учетом начальных условий и приложенных к системе воздействий (или с использованием экспериментальных данных) некоторые функции, называемые обобщенными частотными характеристиками САР. Можно показать, что изменение обобщенной координаты или регулируемой переменной x(t) для широкого класса воз- 155 О Рис. 6.2. Область допустимых значений переходной функции
действий g(t) как при ненулевых, так и при нулевых начальных условиях определяют выражениями [19J: со х (t) -.= хп (t) ¦¦:—[ Rr (<д>) cos tatd® ; F.1) x (t) =-¦ xn @ —|- \ Sr И sin cot rfco, F.2) 0 где jcb(/) — нерегулярная часть функции x(t), которая при /-»¦» является расходящейся, или периодической, функцией, либо постоянной величиной; Rr(co) и 5г(ш) —обобщенная вещественная и мнимая частотные характеристики процесса, получающиеся,, если преобразование Лапласа для функции X, (s) при s=;'(i> представить в виде Xr (/to) =/?Р (со) +/SP (<в). Здесь Xr(s) —регулярная часть функции X(s), т. е. когда все полюсы се расположены в левой полуплоскости и \imxr(t)=0. Формулы F.1) и F.2) можно переписать в виде ¦X) Ax(t)=x(t)—xn{t)— -[RT{(u)cost(i>d(a; F.3> Ах(t) =x{t) —xn@ = — .B jjsr(со)smtad®. F.4) о Левые части уравнений F.3) и F.4) представляют собой отклонения регулируемой переменной от нерегулярной составляющей x,,(t) переходного процесса. В случае, если функция X(s) не содержит особенностей во всей правой полуплоскости и на мнимой оси, ] im sX (s) = 1 i m x (t) .-•.- 0 s-*o t -,a и ф}-нкция x(i) имеет только регулярную часть. Поэтому выражения F.3) и F.4) сводят к виду 9 i' х (t) — — \ Яг (w) cos ttodib, (G.5> , t>0. F.6> 9 — или Если RrM совпадает с вещественной частью Я(ш) выражения X(/w), а 5г(ш) —с мнимой частью S(cu), to обобщенные частотные характеристики определяют следующими выражениями: Я(со)=Р(ш)Рв(ш)— Q(co)Qb(cu)+Ph((o); S(u.) = P(co)QB(co)+Q(to)PB(w)+QH(W), где Р(ш) и Q(<b) —вещественная и мнимая частотные характеристики системы соответственно; Рв(ш) и Qu(co)—вещественная и мнимая частотные характеристики воздействия; Рц((о) и Qb(co)—вещественная и мнима» частотные характеристики начальных условий. 156
В случае, если функция X(s) имеет простой полюс в начале координат, а все остальные полюсы расположены в левой s-полуплоскости, а также в случае, когда такой полюс отсутствует, формулы F.5) и F.6) имеют вид со ¦ sin taclai, F.7) или 2 x(t)=R @) -!¦¦ — S(co) cos tada), t>0, F.8) где R @) — значение R (со) при со = 0. При единичном ступенчатом воздействии g(t) = l(t) и нулевых начальных условиях функциями R(u>) и S(co), входящими в формулы F.7) и F.8), являются собственные вещественная Р(а>) и мнимая <?(со) частотные характеристик» замкнутой системы. Типовые вещественная Р (со) и мнимая Q(co) частотные характеристики САР с единичной обратной связью показаны на Qfwh Рис. 6.3. Типовые вещественная (а) и мнимая (б) частотные характеристики САР с единичной обратной связью рис. 6.3. Функция x(t) в выражениях F.7) и F.8) представляет собой переходную функцию h(t) системы. Поэтому формулы F.7) и F.8) примут вид hit) --=- -sin t(od<o. F.9) I 1 U (СО) К (t) = Р @) -г — \ ^ cos ta>d(o. F.10) Таким образом, первым шагом при вычислении переходного процесса но формулам F.7) и F.8) является определение частотных характеристик Р(со) или Q(co) системы. Определение вещественной и мнимой частотных характеристик замкнутой системы по ЛЧХ разомкнутой системы. Взаимную связь между АФЧХ замкнутой и разомкнутой САР определяют выражением F.11) Как было показано ранее, АФЧХ разомкнутой системы 1 может быть представлена соответствующими амплитудной //(со) и фазовой 0(со) частотными характеристиками следующим образом: 157
IP (/ю) =//(©) е'"<->. F.12) Подставляя выражение F.12) в F.11), получим И () cos ° ^ + ]Н (w> sin 9 (со) ///(со) sine (со) +()() г /() () Отделяя в правой части выражения F.13) вещественную часть Я (to) от мнимой Q (со), найдем _ Я2(Сй)+Я(ш)СОз0((й) . ,fi ч дч ) + 9# (Ш) cos 0 (со) г 1' *¦ ' Я (со) sin 0 (со) (cu) cos G (со) + Г Геометрическое место точек Р (G>) = const=JDc согласно F.14) определяют уравнением Яг (со) + Я (со) cos 6 (со) р Н2 (со) + 2Я (со) cos 0 (ш) + 1 с> ИЛИ Я(со)со50(со)A-2Рс)=Я:г(со)(Ро— 1 )+/>.. F.16) Точно так же геометрическое место точек в соответствии с выражением F.15) Q(o))=const=Qc, определяют уравнением Я (со) sin 0 (со) „ Я2 (со) + 2Я (со) cos 0 (со) + 1 — "с> ИЛИ Я (со) sine (со)— гС^ЯС©) cose (со) = QC+Qc#2 (со). F.17) Номограммы можно построить: в соответствии с выражением F.16)—для определения вещественной частотной характеристики замкнутой системы [18, 20]; в соответствии с выражением F.17)—для мнимой. Эти номограммы строят в координатах фаза — амплитуда, т. е. в следующих единицах отсчета: град _ по оси абсцисс, дБ — по оси ординат. Параметры Р и Q номограмм — безразмерные. На номограммы наносят точки, соответствующие значениям амплитудной характеристики Z-(ffl) разомкнутой системы (в дБ) и фазовой характеристики 6 (со) (в град) для выбранной частоты со,-, и определяют вещественную Р(а) и мнимую Q(eo) частотные характеристики, соответствующие частоте со,-. Определение вещественной Р(со) и мнимой Q(co) частотных характеристик замкнутой системы по логарифмическим амплитудной Л (со) и фазовой ф(со) частотным характеристикам замкнутой системы. При вычислении переходных процессов в САР в случае, когда возмущающее воздействие может быть приложено в любой точке системы, а также для системы с неединичнои обратной связью, вещественную и мнимую частотные характеристики Р(а>) и Q(co) следует определять по частотным характеристикам замкнутой системы: 158
P(©)=i4(<B)cosq>(©); F.18) Q(oi)=4(a>)sin<p(ffl). F.19) Чтобы облегчить процесс построения функций Р(ю) и Q(co) по ЛЧХ ЬА(а) и ф(со), применяют специальные номограммы. Для нахождения вещественной частотной характеристики Р(о>) пользуются номограммой, вычисленной по формуле F.18), при определении мнимой частотной характеристики Q(<o) — номограммой, вычисленной по формуле F.19). Эти номограммы построены в координатах фаза — амплитуда замкнутой системы у и LA соответственно. Параметры Р и Q номограмм — безразмерные. Имея зависимость LA(a>) от ф(со), построенную на кальке в масштабе номограммы, и наложив ее на номограмму, можно найти вещественную и мнимую частотные характеристики замкнутой системы. Пересечение кривой LA (со) =/[ф(со)] с кривой номограммы Рс или Qc при заданной частоте сй = а>г означает, что при « = = а,- вещественная частотная характеристика Р(со) имеет значение Pit а мнимая — значение Q,. Положительным фазовым углам соответствуют положительные значения Q(co), а отрицательным — отрицательные. 6.3. Определение переходных процессов методом трапецеидальных частотных характеристик Формулы F.9) и F.10) применимы для вычисления переходных процессов (при нулевых начальных условиях), стремящихся при достаточно больших значениях времени t к постоянному значению, которое в частном случае может быть нулем. Рассмотрим задачу вычисления переходной функции (переходной характеристики) САР, т. е. задачу нахождения переходного процесса как реакции системы на единичное ступенчатое воздействие. Первый шаг при вычислении переходной характеристики по формуле F.9) или F.10) заключается в нахождении вещественной Р(ю) или мнимой Q(u>) характеристики системы. Различные варианты задания и способы определения функций Р{а>) и Q(©) были рассмотрены ранее. Следующим шагом является вычисление интеграла в выражениях F.9) и F.10). Для приближенного нахождения переходной характеристики САР применяют графоаналитический метод, заключающийся в аппроксимации функций Р(а>) или Q(©), заданных в виде графиков, трапецеидальными частотными характеристиками. Метод может быть реализован либо на ЭВМ с графическим дисплеем в диалоговом режиме, либо с использованием обычных графических средств. 159
Типовая трапецеидальная частотная вещественная характеристика. Эта характеристика (рис. 6.4) определяется следующими параметрами: высотой г0; интервалом равномерного пропускания частот cod; интервалом пропускания частот ш„. Отноше- Рис. 6.4. Типовая траиецеи- рис. 6.5. Аппроксимация дальная частотная характери- вещественной частотной стика характеристики САР трапецеидальными частотными характеристиками ние ш<;/(йп = х характеризует наклон боковой стороны типовой трапецеидальной частотной характеристики. Если го= 1, со„=1, то трапецеидальную частотную характеристику называют единичной. Коэффициент наклона этой характеристики может быть любым (от 0 до 1). Единичной вещественной частотной характеристике соответствует переходная функция h*(t). Вычисленные значения h в функции времени t для различных х приведены в таблице /гх-функций [см.: 2, 10, 19]. Зная коэффициент наклона х, по этой таблице можно определить hx и /та6л. Для перехода от ^-функции процесса (на выходе САР), соответствующего единичной частотной характеристике, к заданной следует значение функции hx(t) умножить на г0, а значение аргумента ?Табл, найденное по таблице, разделить на о)„. Так, например, если го = э, (od=15, ю„=20, то х = а><г/а>п = = 0,75; по таблице /г^-функций для х —0,75 находим значения *тайл. hy.(t) и составляем табл. 6Л. Таблица 6.1 Пример определения /яем(:тв. и h(t) 'табл 0,0 1,0 2,0 0,0000 0,5344 0,9383 ( 'табл 'деПстн'" w 0,00 0,05 0,10 0,000 2,672 4,691 Далее определяем действ и h (t) Аппроксимация вещественной частотной характеристики трапецеидальными характеристиками. Кривая Р{а) может быть представлена в виде совокупности из некоторого числа траие- 160
цеидальных частотных характеристик (рис. 6.5). Заменим кривую Р(а>) мало отличающейся от нее ломаной Р(е>), состоящей из сопрягающихся друг с другом прямолинейных отрезков, и проведем через каждую из точек сопряжения прямую линию, параллельную оси частот © (штриховые линии). В результате кривая Р{а>) может быть заменена определенным числом типовых трапецеидальных частотных характеристик г((ю): Этой сумме соответствует переходная функция h(t) системы, являющаяся линейной комбинацией функций ht{t), т. е. F.20) 1=1 Так, например, вещественная частотная характеристика Р(а>) (см. рис. 6.5) может быть аппроксимирована отрезками и заменена суммой трех типовых трапеций (рис. 6.6): трапеция \-ONDF; трапеция W — OKGH; трапеция Ш — ОАВС. Вычисление переходной функции. После того как вещественная частотная характеристика разбита на трапеции, определя- Рис. 6.6 Трапецеидальные частотные характеристики, полученные при аппроксимации кривой Р(со) Рис. 6.7. Составляющие Xrt(t) и переходная функция x(t) CAP • ют переходные функции xrt(t), соответствующие каждой трапеции, сведя /табл к /действ для каждой функции xt(t) при 1=1, 2, 3. При этом пользуемся таблицами /гх-функции, как это было изложено ранее. Затем, выполнив алгебраическое суммирование ординат кривых, соответствующих переходным функциям xt(t) (рис. 6.7), получим переходную функцию h(t) CAP. В качестве примера рассмотрим определение переходной функции САР, имеющей в разомкнутом состоянии передаточную функцию вида: 300@,65+1) ; B2s + 1) @,06s + 1) @,01s + 1) @,002s ¦ 11—3591 1)' 161
Рис. 6.8. Логарифмические частотные характеристики системы W() Трчнцм 1 i В В imttmmiu тратиий rt -ЦП 1.31 -Ы7 -0,1 *л IS 10 г п. г so и н V «¦ US Я ы,Цс о» * Рис. 6.9. Определение переходной функции САР: а — вещественная частотная характеристика системы; б — аппроксимация кривой Р(в> ) системы W(s) трапецеидальный» характеристиками 162
Логарифмическая амплитудная и фазовая хаарктеристики, построенные по этому уравнению, приведены на рис. 6.8. Пользуясь номограммой, определим вещественную частотную характеристику />(<*>) (рис. 6.9, а, непрерывная кривая). Аппроксимируем кривую Р(ш) прямолинейными отрезками. При этом разбиваем частотную характеристику на трапеции I—IV. Находим параметры каждой трапецеидальной характеристики (см. табл. на рис. 6.9,6). Определим по таблице /г„-функций переходные функции, соответствующие каждой из трапеций (табл. 6.2; рис. 6.10). Суммируя ординаты этих переходных характеристик (в функции /действ), находим, согласно выражению F.20), искомую переходную функцию h(t) CAP. Таблица 6.2 Значения составляющих кривой переходного процесса 'табл 'действ— -*Т1«>„ 'табл 'действ о 1 2 3 4 5 6 8 10 12 15 20 25 0 1 2 3 4 5 6 8 10 12 15 20 25 I трапеция (и=0,2) 0,000 0,371 0,682 0,895 1,008 1,042 1,037 1,020 1,030 1,024 1,006 0,995 0,995 0,0 0,5 1.0 1,5 2,0 2,5 3,0 4,0 5,0 6,0 7,5 10,0 12,1 0,000 —0,052 —0,095 —0,125 —0,142 —0,146 —0,145 —0,143 —0,144 —0,143 —0,141 —0,139 —0,139 II трапеция (х=0,4) 0,000 0,432 0,785 1,013 1,110 1,112 1,068 0,998 0,994 0,988 0,991 1,004 0,999 0,000 0,089 0,178 0,268 0,355 0,446 0,536 0,714 0,893 1,072 1,34 1,786 2,235 0,000 0,625 1,188 1,532 1,676 1,688 1,612 1,506 1,500 1,492 1,494 1,518 1,508 2 3 4 5 6 8 10 12 15 20 25 0 1 2 3 4 5 6 8 10 12 15 20 25 III трапеция (х=0,5) 0,000 0,461 0,831 1,061 1,141 1,117 1,051 0,966 0,982 0,997 1,005 0,995 1,000 0,000 0,033 0,067 0,1 0,133 0,167 0,2 0,267 0,33 0,4 0,5 0,67 0,833 0,000 -0,124 —0,224 —0,286 —0,308 —0,301 —0,284 —0,261 —0,265 —0,269 —0,271 —0,268- —0,27 IV трапеция (и=0,5) 0,000 0,461 0,831 1,061 1,141 1,117 1,051 0,966 0,982 0,997 1,005 0,995 1,000 0,000 0,016 0,033 0,05 0,066 0,083 0,1 0,133 0,167 0,2 0,25 0,333 0,416 0,000 —0,046 —0,083 —0,106 —0,114 —0,112 —0,105 —0,097 —0,098 —0,1 —0,100 -0,099 —0,100 И* 163
*(t) 1,6 ',* 1,1 1,0 US 0,6 0,1 0,2 0 г г г 1 L F— -* ——< <«^ ** ¦ МНИ \- x(t) 7. 4* т~т -я* Рис. 6.10. Составляющие Xt(t)—xt(t) переходной функции и функция x(t) системы W(s) %А. Вычисление переходного процесса в САР при помощи ЭВМ Современные средства вычислительной техники позволяют определять переходные процессы САР в автоматическом режиме, т. е. без непосредственного участия проектировщика. Рассмотрим два способа такого вычисления. 1-й способ. Заключается в применении численного интегрирования дифференциальных уравнений, соответствующих замкнутой системе, и состоит в выполнении таких последовательных операций (рис. 6.11,а): 1) ввод передаточного коэффициента системы, постоянных времени и коэффициентов демпфирования, соответствующих передаточной функции W(s) разомкнутой системы; представление W(s) в виде отношения двух полиномов: M i где т и п — степени полиномов числителя и знаменателя разомкнутой системы соответственно (т<п); 2) вычисление передаточной функции замкнутой системы (при единичной ООС): W (s) M (s) M (а) 1 + W (s) - jV (s) 164
Ввод передаточной функции разомкнутой системы Wfs) Вычисление передаточной функции замкнутой системы ?{s) ввод передаточной функции разомкнутой системы W(s) Вычисление передаточной функции замкнутой системы Переход к уравнением в переменных состояния Х~Ах+ви Интегрирование системы при х(о)-0, u~l(t) Вычисление переходного процесса т+1 -Г bLxL(t) Вычисление Вещественной частит ной характеристики Р(си) вычисление интеграла ¦sLnco Jdw J(T)-f о Вычисление точек переходного процесса •- XT) л Рис. 6.1 J. Блок-схемы программы вычисления переходных провесов: и —с использованием численного интегрирования уравнения системы в пространстве состоя* ния; б — с использованием вещественной частотной характеристики Р( ш ) где ai; i=m + I, n-j 3) переход к уравнениям в пространстве состояний вида где А= аП+1 0 0 0 1 0 0 аг 0 I 0 0 0 1 - о 0 • 1 F.21) 155
4) численное интегрирование системы уравнений F.21) при нулевых начальных условиях и u(/) = I(/); 5) вычисление переходного процесса по формуле от+1 где bj — коэффициенты, определяемые из уравнения F.21). Отметим, что если известно выражение для передаточной функции замкнутой системы ®(s), то переходный процесс может быть вычислен разложением этой передаточной функции на элементарные слагаемые с последующим суммированием функций, являющихся оригиналами от составляющих 0(s). Однако такой подход требует вычисления корней знаменателя <I>(s), что при высоком порядке системы может привести к существенным погрешностям. 2-й способ. В качестве исходной информации используют значения вещественной частотной характеристики Р(ш). В этом случае можно предложить несколько алгоритмов определения переходных процессов. Первый алгоритм (рис. 6.11,6) базируется на методе трапецеидальных частотных характеристик и на его разновидностях. Проектировщик проводит аппроксимацию Р(а>) трапециями, задавая в качестве исходной информации для ЭВМ значения со,-, при которых изменяется наклон аппроксимирующей ломаной линии и соответствующие ординаты Р,-. Все остальные, т. е. наиболее трудоемкие, операции выполняют на ЭВМ в соответствии с методом трапецеидальных характеристик. Программа использует таблицы /^-функций, постоянно хранящиеся в памяти. Такой подход позволяет создать быстродействующие программы для вычисления и построения переходных процессов, однако требует большого объема памяти ЭВМ. Точность начисления зависит от точности аппроксимации и шага таблиц, что тоже связано с объемом памяти ЭВМ. Второй алгоритм состоит в непосредственном вычислении выражения 2 Г' /> =— \— (со) для данных значений /. В этом случае удобно использовать метод Филона для интегрирования так называемых осциллирующих функций, т. е. функций вида /(«о) sin at. Исходную информацию берут из таблицы значений pi = P((oj) [20], соответствующих дискретным значениям частоты со,, i= =-1,п. Для построения одной точки переходного процесса kh = h(ih); k=\~m, где m — требуемое число точек, выполняют следующие операции: 1) определяют значения функции 2) вычисляют интеграл У /, 0 -!_ [ f ((ft k — J k ^^ J J \ш' Юг где у,= !?!_ (в1_в1); 3) определяют значения переходного процесса 166
Второй алгоритм менее быстродействующий по сравнению с первым, однако для него необходим существенно меньший объем памяти ЭВМ. Кроме того, он не требует участия проектировщика в построении переходных процессов, позволяя сосредоточить больше внимания на менее формализованных этапах расчета САР. На рис. 6.12 в качестве примера приведены переходные процессы рас- h 1.Z ив ол 0 Рис 0.2 ОЛ 0.6 0.6 . 6. 12. Переходный следящей системе 1.0 t.c процесс в смотренной ранее САР, рассчитанные на ЭВМ с использованием численного интегрирования и определения интегралов методом Филона. 6.5. Вычисление переходной функции в САР с неединичной обратной связью Упрощенная структурная схема САР угловой скорости турбины приведена на рис. 6.13,а. Рассмотрим определение пе- э—i - Wg(S) - Us) ¦ w^> x(t) «a 'II Wa(s) - 1 Wf(s) Рис. 6.13. Структурные схемы CAP угловой скорости вала турбины: а — упрощенная схема; б — преобразованная схема с единичной обратной связью реходного процесса в системе по возмущающему воздействию, которое непосредственно приложено к турбине. В цепи обратной связи находится регулятор. Передаточная функция объекта 167
(в данном случае можно считать, что эта функция по отношению к управляющему и возмущающему действиям одинакова). Передаточные функции сервомотора Wz(s)=2/s, изодрома Z(s)=sf(s-\-l), центробежного маятника fed=0,09 (маятник считается безынерционным). Передаточную функцию регулятора легко получить аналитически: t (s) 0,06 (s+1) \ (s) Z (s)~s @,33s+1) ¦ Последовательность определения переходного процесса такая: 1) представление структурной схемы системы (рис. 6.13,6); 2) построение логарифмических амплитудных и фазовых характеристик, соответствующих передаточным функциям Wa(s) и Wp(s) (на рис. 6.14 везде Wa и WP); 20 -20 -SO -80 —180 Рис. 6.14. ЛЧХ подсистемы 3) использование номограммы для замыкания системы с целью нахождения логарифмических частотных характеристик, соответствующих передаточной функции (см. рис. 6.14): WQ (а) УГр (а) Ф() l+WQ(s)Wp(s) 168
4) вычитание из полученных ЛЧХ характеристик регулятора Wp(s) для получения ЛЧХ замкнутой системы, соответствующих передаточной функции системы по отношению к возмущающему действию (рис. 6.15): l+WQ(s)Wp(s); 5) использование номограммы для определения вещественной частотиой характеристики с целью нахождения P(w) (рис. 6.16) по логарифмическим характеристикам замкнутой системы (см. рис. 6.15); 6) разбиение вещественной частотной характеристики Р(ш) на три трапеции (см. таблицу на рис. 6.16) с целью определения переходной функции системы (рис. 6.17) методом трапецеидальных частотных характеристик. Цш), в(ш), 65 40 100 Рнс. 6.15, ЛЧХ САР угловой скорости вала турбины Р(ш) 0Л 0,6 Трапеция I П Ш Параметры трапеции Г -ш 0,78 0,1 Щ 0 0,7 2J со„ 0,6 ZS В л 0 № 0,36 7,5 ш, '/с Рис. 6.16. Вещественная частотная характеристика CAP 169
Рис. 6.17. Переходный процесс x(t) в САР 6.6. Частотный метод анализа качества регулирования Данный метод, так же как и частотный метод определения переходных процессов (функций), основан на использовании интеграла и преобразования Фурье, приводящих в случае произвольных типовых воздействий и ненулевых начальных условий к понятию обобщенных частотных характеристик. Частотный метод анализа качества регулирования позволяет по свойствам приведенной обобщенной частотной характеристики R(a>), не вычисляя интеграла sin о судить о том, удовлетворяет ли функция x(t) условиям качества регулирования или нет. Как было показано ранее, в случае единичного ступенчатого воздействия и нулевых начальных условий выражение для переходного процесса (переходной функции) принимает вид 00 w ч sin/ю . Эту формулу особенно широко используют на практике. Оказывается, что по свойствам вещественной частотной характеристики Р(а) системы автоматического регулирования можно судить о качестве регулирования без вычислений интеграла и переходной функции. Рассмотрим некоторые из этих свойств. 1. Достаточно близким переходным процессам соответствуют близкие частотные характеристики. 2. При анализе САР нет необходимости исследовать ее во всем интервале частот от 0 до -f-oo. Достаточно ограничиться областью существенных частот (или полосой пропускания). Начиная с частоты ш„, имеет место соотношение 170
Р@) <0,1 ...0,2, поэтому при оценке качества регулирования вид Р{а>) при @>(о„ можно не принимать во внимание. 3. Установившееся значение %Ст переходной функции x(t) равно начальной ординате Р@) функции Р{а). 4. Если 'Pi(w) и ^(ш) отличаются только масштабом по оси частот, т. е. Р1(ю) во всех точках идет более полого, чем Рг(а>), то переходная характеристика x^t), соответствующая Pi (со), затухает быстрее x2(t), соответствующей Рг (со), во столько раз, во сколько масштаб Р4 (ю) по оси частот больше масштаба Р2(ы) (рис. 6.18). Или чем шире диапазон частот вещественной частотной характеристики Р((а), тем быстрее завершается переходный процесс x(t) (рис. 6.18, а и б). x(t) Рг(ш) Р,(шГ X,(t) Рис. 6.18. Вещественные частотные характеристики и соответствующие им переходные процессы: о — характеристики Pi( ) и Р2( и); б — переходные процессы *i(i) и хгA) Р(ш)>0 Р(ш) Рис. 6.19. Положительная не- возрастающая вещественная частотная характеристика Рис. 6.20. Вещественные частотные характеристики САР, находящиеся на границе устойчивости 5. Время переходного процесса будет меньше, чем положе вещественная частотная характеристика. 6. Если характеристика Р(ю) положительна и представляет собой невозрастающую функцию частоты Р()^0 при всех © (рис. 6.19), то перерегулирование не 18%. превышает 171
7. Если вещественная частотная характеристика Р(а>) в точке @=00! имеет разрыв непрерывности, т. е. Pi (w) = oo, то это означает, что система находится на границе апериодической неустойчивости и в ней происходят незатухающие гармонические колебания с частотой о>! (рис. ^_ 6.20). Наличие острых экстрему- """** мов в частотной характеристике п во. о Р^Ы) свидетельствует о наличии Рис. 6.21. Вещественная частотная v ' * характеристика, которой соответ- медленно затухающих колеба- ствует монотонный переходный ний. Качество процесса повыша- процесс ется с уменьшением крутизны частотной характеристики при отсутствии острых экстремумов. 8. Если производная dP/dat — отрицательная неубывающая непрерывная функция от со (рис. 6.21), то процесс монотонен* а время регулирования где (о„ — частота, определяющая интервал, на котором вещественная частотная характеристика положительна. 9. Если вещественная частотная характеристика положительна на интервале [0, шя], то время регулирования Гр больше, чем л/а„, т. е. Гр>я/й)„ 6.7. Определение значения передаточного коэффициента (или добротности) астатической системы по ЛАЧХ i Передаточная функция САР в разомкнутом состоянии, обладающая астатизмом v-ro порядка по отношению к управляющему воздействию, может быть представлена в виде Следовательно, выражение для ЛАЧХ имеет вид Lm(co) =Lm k—v Lm co+Lm[Fo(/o))]. При значениях со, меньших значения первой сопрягающей частоты co, = l/7t, можно приближенно написать Lm(<a)«Lmk—vLmw, 0<<o<cu,. (б.22> Прямую, описываемую уравнением F.22), называют низкочастотной асимптотой ЛАЧХ. По ней достаточно просто определить передаточный коэффициент k или добротность САР при любом порядке астатизма (первый способ). 172
Действительно, при со=1 выражение F.22) сводится к виду LmH.[(ffl) |w=1 = Lmfe, из чего следует, что значение передаточного коэффициента к системы, выраженое в децибелах, определяется ординатой низкочастотной асимптоты LmH4(co) при значениях уголовой частоты со, равной единице (рис. 6.22). L\W(j,u!)\ I частот средних частот1 Высоких частот Рис. 6.22. Определение передаточного коэффициента астатической САР по ее ЛАЧХ В статических системах выражение для низкочастотной асимптоты принимает вид пз чего следует, что продолжать низкочастотную асимптоту до значения со= 1 излишне, так как эта асимптота представляет прямую, параллельную оси частот, и значение k в децибелах равно расстоянию этой прямой от оси частот со. Второй способ определения k заключается в следующем. Продолжим низкочастотную асимптоту LmH.4(cu) до пересечения с осью частот (см. рис. 6.22). В точке пересечения ш=©ь Следовательно, согласно выражению F.22), Lm k=v Lm co,;. или т- е. значение k равно значению угловой частоты и>к в точке Пересечения низкочастотной асимптоты с осью частот в степе- ци у, равной порядку астатизма системы. 173
6.8. Коэффициенты ошибок системы Определение точности САР в установившемся режиме работы, а также при медленно изменяющихся воздействиях является составной частью общей задачи анализа качества САР. Исследование точности САР при медленно изменяющихся воздействиях можно проводить при помощи коэффициентов ошибок. Связь между функцией x{t) на выходе и управляющим воздействием g(t) на входе САР может быть представлена в виде интеграла свертки dx, F.23) где k(t)—импульсная переходная функция САР, представляющая собой реакцию системы на б-функцию. Коэффициенты ошибок в ряде случаев позволяют избежать необходимости вычисления интеграла F.23). Если ввести в рассмотрение ошибку то *{t) = g(t)-[g(t-i)k(T)dx. F.24) s Предположим, что воздействие g'(t) является функцией, имеющей г первых производных на временном интервале 0^ <*<Г. Тогда функцию git—т) в подынтегральном выражении F.23) можно разложить в ряд по производным от воздействия g(t): F.25) Подставляя выражение F.25) в уравнение F.24), получим новый ряд где остаточный член ^^ 1, 0<т<7\ В выражение F.26) коэффициенты ряда Со, Си С2,...,СГ,< а также Kt равны соответственно: 174
C0=l-$ k(x)dr, о г С\ = \ т? (т) с?т; F.27) о г Выражение F.26) представляет собой разложение ошибки е (^) САР в ряд по производным от управляющего воздействия g(t). В случае медленно изменяющихся воздействий, когда в выражении F.26) можно ограничиться небольшим числом членов, оно оказывается удобным для вычисления е (/), так как при этом не требуется знания корней характеристического уравнения. Каждый из членов ряда F.26) можно интерпретировать как i-ю составляющую ошибки е(/) САР. Каждая из составляющих является реакцией системы на соответствующую производную от воздействия g(t). Коэффициент пропорциональности между этой составлящей, обусловливаемой i-и производной от g(t), деленной на t-факториал, называют коэффициентом ошибки САР. Если функция g{t) имеет г первых производных на интервале О^/^оо и Г=оо, то формулы F.27) принимают вид F.28) Kr = (- l)r+1 \ *rgr (t-Ат) k (t) dx. о В этом случае ошибку е (t) можно записать в виде е(*) = ес(О + е*(О. 175
где Г Си i=0, 1, 2, ...,г—i-й коэффициент ошибки; ес@! и eB(f)— составляющие ошибки, определяемые коэффициентами F.28) и характеризующие точность САР при медленно изменяющихся g(t), имеющих г производных. Коэффициенты Ct могут быть вычислены и по заданной передаточной функции ошибки <Ds(s) или <D(s) системы: со оо Ф8 (s) - 1 - Ф (s) = 1 - jj k (т) е-"Л = ^ke (x) e-^rft. F.29) о о Разложим выражение для передаточной функции F.29) в ряд Маклорена при малых s: ФЕ (s) =Ko+KiS+K2s2+ ... Преобразование Лапласа E{s) для ошибки e(t) на выходе можно представить в следующем виде: = Mo + ^s + K>s2 + ...) G (s)]^0. F.30) Применяя к выражению F.30) обратное преобразование Лапласа, получим B{t)=Kog(t)+Klg(t)+K2g{t)+... F.31) Сравнивая выражение F.31) с F.26), имеем С0=К0; C,=/Ci; C2=2! К2; ...; Ст=г\ Кг F.32) Таким образом, вычисление коэффициентов С< сводится к разложению в ряд Маклорена передаточной функции ошибки Фс{б) при S-+-0. Формулы для определения коэффициентов Kt в соответствии с F.32) имеют вид 42^ F.33) 176
формула F.33) позволяет найти каждый последующий коэффициент С, по известным предыдущим: Со, Сь С2,..., C<_i. Передаточную функцию ошибки <D,.(s) через передаточную функцию разомкнутой системы определяют выражением <6-34> где M(s) — числитель передаточной функции разомкнутой системы; D(s) — знаменатель. Коэффициенты ошибки С,- можно определить, согласно выражению F.33), простым делением D(s) на D(s)-\-M(s) и сравнением членов с одинаковыми степенями s получающегося таким образом ряда с его коэффициентами. Этот ряд, сходящийся при малых значениях s, находят в результате разложения (De(s-) передаточной функции ошибки F.34) по степеням s. Коэффициенты ошибки могут быть выражены через коэффициенты передаточной функции разомкнутой системы. В табл. 6.3 приведено несколько первых коэффициентов ошибок для статических и астатических систем 1-го и 2-го порядка, вычисленных для случая W (*) = -?¦ sv A +a1s + a,2s2 - ... +ansn)' Важным свойством астатических CAP является то, что для системы с порядком аетатизма, равным v, первые v коэффициентов ошибки Со, С\, ..., Cv-i равны нулю. Следовательно, соответствующие ошибки в установившемся режиме работы системы отсутствуют. Контрольные вопросы 1. Сформулируйте содержание задачи анализа САР. Охарактеризуйте основные методы анализа САР. 2. Что такое качество системы автоматического регулирования? Каковы основные первичные показатели качества? 3. В чем состоит связь между частотными характеристиками САР и переходным процессом? 4. Как определить вещественную (мнимую) частотную характеристику САР по ЛЧХ разомкнутой системы? 5. Какова последовательность действий при определении переходной функции САР методом трапецеидальных частотных характеристик? 6. Докажите, что значение Р@) астатической системы равно единице. 7. Что такое добротность САР? Какими способами и как можно определить добротность системы? 8. Каков физический смысл коэффициентов ошибок? 9. Установите закономерность изменения коэффициентов Со, Си С2, С3 по табл. 6.3. 12—3 591 177
Коэффициенты ошибок Таблица 6.3 Система Статическая Астатическая 1-го порядка Астатическая 2-го порядка Коэффициенты Со с, Сз Со с, с, Со с, С, С, Фочмулы 1/A+Х) (о, —Р,)Х A-ХJ 2(а2 — р2)Х j гаДрг-аОХ A+КJр1(Р1-а!)Х^K 6XA!-W 1К(Х-0(аЯ«г,р"г) A+ХK "' 0 1/Х X X2 н ^——+—!—^—'— 0 0 2/Х 6 (а,—Pi) X 7. СИНТЕЗ КОРРЕКТИРУЮЩИХ УСТРОЙСТВ ЛИНЕЙНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО РЕГУЛИРОВАНИЯ Задача синтеза в процессе проектирования САР заключается в выборе ее структурной схемы, параметров и характеристик элементов, способа технической реализации системы, при которых требуемые в соответствии с ТЗ статические, динамические, энергетические и эксплуатационные характеристики обеспечиваются при применении возможно более простых и 178
надежных аппаратных средств. В некоторых случаях синтез сводится к нахождению корректирующего устройства, включение которого в систему обеспечивает качество регулирования в соответствии с ТЗ. Рассмотрим частотный метод синтеза корректирующих устройств (регуляторов), базирующийся на концепции желаемой логарифмической характеристики разомкнутой системы [19. 20]. 7.1. Постановка задачи синтеза При постановке и решении задачи синтеза САР необходимо учитывать следующие особенности. 1. СЛР содержит объект регулирования и элементы с трудно изменяемыми параметрами и характеристиками. Эту часть .¦нстемы назовем неизменяемой. В САР могут входить также элементы с легко изменяемыми параметрами и характеристиками. Такие элементы называют корректирующими устройствами. При решении задачи синтеза линейной САР необходимо учитывать статические и динамические характеристики объекта и той части системы, которая не подлежт изменению, но существенно влияет на свойства САР в целом. 2. Следует стремиться к реализации оптимальных динамических характеристик. При этом задают верхний предел отдельных показателей качества в области допустимых значений, но не определяют однозначно вид переходного процесса. 3. Одни и те же технические требования к системе можно реализовать при помощи различных корректирующих устройств. Последние выбирают такими, чтобы они были технически наиболее просто осуществимы. 4. Во многих случаях нельзя получить точных результатов расчетным путем, так как современные САР характеризуются не только постоянными, но и переменными, а иногда и распределенными параметрами. Теоретический анализ и расчет лишь облегчают выбор рациональной схемы, а также ориентировочных значений параметров корректирующих устройств, входящих в состав системы. Значение этих параметров уточняют в результате последующей регулировки и настройки САР в реальных условиях ее эксплуатации. 5. Большую роль отводят вычислительной технике, приме» нение которой сокращает сроки разработки и проектирования новых систем. Синтез линейной САР состоит из следующих этапов: а) анализ свойств объекта регулирования и определение его статических и динамических характеристик; б) обоснование и формулировка критерия оптимизации, условий качества регулирования и других требований; в) выбор структурной схемы и технических средств для ее реализации; 12* 179
г) собственно синтез оптимальных динамических характеристик; д) аппроксимация оптимального режима, т. е. выбор динамических характеристик, обеспечивающих качество регулирования, простоту технической реализации и надежность САР; с) определение динамических характеристик корректирующих устройств, обеспечивающих желаемые динамические свойства системы в целом; ж) выбор схемы и способа технической реализации значений параметров корректирующих устройств; з) анализ полученной схемы САР с целью проверки расчетным или экспериментальным путем соответствия этой схемы предъявляемым требованиям качества. Для пояснения оптимальных, или предельных по быстродействию динамических характеристик рассмотрим переходный процесс в гипотетической системе управления инерционным механическим объектом без обратной связи (рис. 7.1), описываемой трансцендентной передаточной функцией X (s) Go (s) 'm!n 7rU-2e о -т„ G.1) Два интегрирующих звена представляют собой математическую модель инерционного объекта регулирования. Система изменяет уровень регулирования переменной x(t) по оптимальному (по быстродействию) закону при ступенчатом изменении входной величины go(t) и ограниченном значении ускорения w(t) регулируемой переменной (в структурной схеме это ограничение должно быть представлено нелинейной статической характеристикой типа насыщения). Рассматриваемая система состоит из двух частей — формирующего звена 1 и инерционного объекта 2 (см. рис. 7.1). На Г" 1 1 1 9аЩ 1 1 1 1 г- U- 1 ~2е г -TminS -зг1 1 1 , 1 г 1 | 1 1 J 1 S 'а) o(t) 2 i 1 s I i 1 * | 1  1 ! Рис. 7.1. Структурная схема (без обратной связи) системы управления инерционным механическим объектом 180
выходе трех параллельно соединенных звеньев при ступенчатом воздействии go(t) формируется прямоугольная знакопеременная функция w(t), имеющая в системе управления инерционным объектом в соответствии со вторым законом Ньютона размерность ускорения. Первый интеграл от w(t) при нулевых начальных условиях представляет собой треугольную функцию :'(/)—закон изменения скорости движения инерционного' объекта; второй интеграл от w(l) является искомой реакцией л(/) оптимальной по быстродействию системы Wopi(s). Процесс xil) —оптимальный в смысле монотонности и минимума значения времени переходного процесса Тпп = Ттш при указанных ограничениях на значение ускорения w(t). Структурная схема оптимального управления инерционным объектом с обратными связями (положительной и отрицательной) показана на рис. 7.2. Обозначим передаточную функцию Г Формирующий фильтр 1 *(t) Рис. 7.2. Структурная схема (с обратными связями) системы управления инерционным объектом чтой системы через „OOpt(s). Учитывая выражение G.1), трудно показать, что неСистема <J>opt(s) с главной ООС является оптимальной по быстродействию, имеющей в своем составе формирователь оптимального управления w(t). Входным сигналом системы является ступенчатое воздействие go(t). 181
Kit) 0<t<Tmla/2; Рис. 7.3. Оптимальный переходный процесс: а — оптимальная функция перемещения х{1); б — ускорение w(i) В период разгона 0<.t<.Tmin/2 (рис. 7.3), когда ускорение w=dix/dt'2 объекта сохраняет максимально возможное значение шшах, переходный процесс по перемещению определяют выражениями } G.2) jc(<)=-- 0; *<0. Переходный процесс для всех значений x'(t), включая период тор- можения Tmin/2<t<Tmin, может быть составлен из следующих трех парабол {рис, 7,4): 1 — определяется выражением G.2) для всех 2>0; 2 — сдвинута по оси t вправо на Tmin/2 и имеет постоянную по значению вторую производ- ную —2wmnt, 3 — сдвинута вправо на Tmin и имеет по модулю значе- ние второй производной, т. е. wnillx. Выражение для оптимального переходного процесса можно предРис. 7.4. Представление кривой оптимального переходного про- uc.va тремя параболами ставить в виде mln \2 1 /- ' mln G.3) где 1 (t), \\t ~-\ и 1 (t — Tmin) — единичные ступенчатые функции с соответствующими сдвигами, предел функции liin A- -opt @ =- л:ор1 (оо) = — wmaxT2mlB. Правую часть этого выражения при заданных условиях обозначим через ?о= T^m^Tinm^'- const. 182
Выражение go@~const характеризует ступенчатое управляющее воздействие, которое нужно приложить к астатической системе G.1) с оптимальными характеристиками, для того чтобы чолучить переходный процесс вида G.3). Время Гтт, необходимое для перевода системы из одного состояния в другое, является суммой, состоящей из равных интервалов Tm;J2 разгона и торможения. Действительно, на интервале разгона 0</],a3r<7'iTiin/2 ускорение инерционной нагрузка имеет постоянное максимальное положительное значение fc'max. Переходные процессы по скорости v и координате х (Лределяют выражениями: т /¦> W = ) На интервале, торможения rmin/2 <^торм <Гт,п имеем соответственно: dt = Гга!п rmin/ - Время оптимального переходного процесса 7min при заданном максимальном ускорении wmax зависит от значения приложенного ступенчатого воздействия, и его определяют соотношением wmtI. G.4) Минимальное время Jmin переходного процесса, соответствующего оптимальной системе G.1), имеющей оптимальные частотные характеристики, зависит от значения управляющего ступенчатого воздействия go(t), или начального рассогласования— см. формулу G.4). Поэтому оптимальную частоту среза системы нужно определять для ступенчатого управляющего воздействия, равного не единице, а значению, выбираемому на основании рассмотрения конкретных условий работы системы. Таким значением, например, может служить наибольшее значение начального рассогласования, при котором еще возможно линейное рассмотрение системы. Необходимость введения в системы автоматического регулирования корректирующих устройств можно пояснить, рассмотрев их влияние на изменение частотных характеристик системы. 183
Пусть САР имеет АФХ 1Г(/ш), изображенную на рис. 7.5, а (кривая 1). Система, имеющая такую .характеристику, будет неустойчивой. Для ее стабилизации можно уменьшить передаточный коэффициент к (кривая 2). Как правило, коэффициент к уменьшать нельзя (от значения к зависит статическая точность системы). В этом случае необходимо скорректировать форму АФХ на средних частотах (u>i ... Юг) так, как это показано на рис. 7.5, о Рис. 7.5. Коррекция ЛФЧХ САР (кривая 3). Система станет устойчивой, и обеспечит заданную точность регулирования. Это может быть реализовано при помощи корректирующего устройства. АФХ, показанная на рис. 7.5, б (кривая /) должна соответствовать устойчивой системе. Однако система не имеет достаточного запаса устойчивости и кривая пересекает окружности вещественной круговой диаграммы с большими значениями индексов /¦>,-. Это означает, что переходный процесс в такой системе будет колебательным. Уменьшение передаточного коэффициента к не может существенно уменьшить склонность системы к колебаниям. Но если при помощи корректирующего устройства скорректировать форму АФХ так, как это показано на рис. 7.5, б (кривая 2), т. е. создавая положительный сдвиг фазы в интервале частот wi ... и2, то можно обеспечить достаточный запас устойчивости и качественные показатели системы. Пусть САР имеет АФХ 1-го рода (кривая /, оис. 7,5, в). Требуется, чтобы система не имела установившейся ошибки при подаче на ее вход воздействия в виде постоянной скорости. Для этого необходимо, чтобы АФХ разомкнутой системы при частотах, стремящихся к нулю, проходила вдоль отрицательного направления не мнимой, а вещественной оси (кривая 2), что достигается введением в систему дополнительного интегрирующего звена. Получим систему с астатизмом 2-го порядка, которая не обладает требуемой устойчивостью. Поэтому необходимо скорректировать АФХ системы так, как показано на рис. 7,5, в (кривая 3). В автоматике применяют следующие способы коррекции динамических характеристик САР: 1) последовательную коррекцию (корректирующее устройство включают последовательно с усилительно-преобразующим устройством и объектом регулирования); 2) параллельную коррекцию (корректирующее устройство включают параллельно усилительно-преобразующему устройству) ; 3) корректирующую обратную связь (корректирующее устройство включают встречно-параллельно, охватывая усилительно-преобразующее устройство системы в качестве элемента местной обратной связи); 4) комбинированную коррекцию. 184
Предположим, что структурная схема САР задана и приведена к виду, показанному на рис. 7.6. Система состоит из: объекта или неизменяемой части, включающей последовательно Wd(s) WmCs) l(s) —I W,(S) x(t) Рис. 7.6. Структурная схема CAP с последовательным корректирующим устройством и корректирующей обратной связью соединенные элементы с передаточными функциями W0{s) и Wm(s); последовательного корректирующего устройства (ПКУ) с передаточной функцией Wd(s); корректирующей обратной связи (КОС) с передаточной функцией Z(s), охватывающей звено Wm(s). Передаточная функция САР, разомкнутой в месте измерения ошибки, имеет вид Wm{s) Wc{s). G.5) ау">1 rWm(s)Z(s) Передаточные функции Wm(s) и WQ(s) заданы в виде аналитических выражений или соответствующих им частотных характеристик. Задача заключается в определении таких передаточных функций Wd(s) и Z(s) последовательного корректирующего устройства и корректирующей обратной связи, чтобы система G.5) обладала необходимыми показателями качества. Этими показателями могут быть: 1) статическая точность системы при типовых входных воздействиях (определяется порядком астатизма), а также коэффициенты ошибок С\ и С2; 2) время Тп.п переходного процесса, вызванного единичным ступенчатым управляющим воздействием; 3) значение (в процентах) перерегулирования о, вызванного ступенчатым управляющим воздействием; 4) максимальное ускорение &>тах, с которым должна изменяться регулируемая величина; 5) запас устойчивости системы по фазе у. При синтезе системы не обязательно задают все показатели одновременно: можно учитывать лишь некоторые из них. Преимуществом ПКУ является то, что они могут быть реализованы в виде простых пассивных или активных RC-фалъ- тров на серийных или заказных микросхемах. Перечислим недостатки ПКУ: 1) эффективность их действия существенно снижается вследствие непостоянства параметров и характеристик основных элементов системы (при применении ПКУ к характеристи- 185
кам остальных элементов системы следует предъявлять повышенные требования); 2) дифференцирующие #С-фильтры чувствительны к помехам и шумам. Теперь перечислим преимущества КОС: 1) КОС уменьшают зависимость динамических свойств САР при изменении параметров и характеристик элементов, входящих в се состав; 2) питание КОС обычно не вызывает затруднений, так как они включаются на выходе системы, где развивается значительная мощность; 3) системы с КОС менее подвержены влиянию помех, чем системы с ПКУ. так как элементы системы, включенные перед их входом, играют роль фильтров нижних частот. Недостатки КОС заключаются в следующем: 1) высокая стоимость и громоздкость составляющих элементов (тахогенераторы, дифференцирующие трансформаторы и др.); 2) необходимость применения больших по значению коэффициентов усиления. 7.2. Желаемая логарифмическая амплитудная частотная характеристика САР Частотный метод САР с последовательным корректирующим устройством связан с понятием желаемой ЛАЧХ разомкнутой системы. От этой характеристики зависит качество переходного процесса в пределах заданной области допустимых значений первичных показателей Т^г—Ти.а и а. Использование данного метода ограничено классом линейных САР и инерцион-i ным механическим объектом, уравнение которого подчиняется' второму закону Ньютона. Применение метода связано со следующими особенностями синтеза САР. Техническая реализация оптимальных частотных характеристик САР, отвечающих требованию получения Тт1„ в соответствии с выражением G.4), сопряжена со значительными трудностями. Такая реализация часто и не является необходимой, так как в ряде случаев, по ТЗ на систему, допускаются монотонные переходные процессы, а время регулирования больше Тт\п. Множество переходных процессов, соответствующих (по ТЗ) области допустимых значений Грег и о, будем называть квазиоптимальными. Вводимая в рассмотрение желаемая ЛАЧХ Lm(cu) разомкнутой системы удовлетворяет требованиям получения квазиоптимального переходного процесса, а также условиям, подлежащим учету при решении задачи синтеза. При синтезе системы с ПКУ удобными аналитическими (графическими) зависимостями являются соотношения между максимальными значениями Ртах вещественных частотных характеристик, с одной стороны, и соответствующими им значениями 186
оремени переходного процесса Трег тах = Ттзх и перерегулирования Op max = amax— С ДРУГОЙ [18, 19]. Для решения задачи синтеза САР по критерию обеспечения квазиоптимального переходного процесса вычисляют функции на множестве следующих значений параметров аппроксимированной трапецеидальной характеристики системы: Эти параметры определяют в соответствии с рис. 7.7. Рис. 7.7. Типовая аппроксимированная вещественная характеристика Ртип(<в) системы УсреДНеННЫе ГрафИКИ фуНКЦИЙ Tmax = fl(flniax) И m =/2(Ptnax) приведены на рис. 7.8, а, б. Эти функции не зависят от порядка характеристического уравнения системы, а приве- ¦ 40 W max РИС. 7.8. КрИВЫе заНИСИМОСТеЙ бгаах = /(Ятах) И Гтах — /'(Ртах): а - для -х<0,«; ?.>0,5; у 0,1; б — для z<0.8; 0,1<Л<0,п; ха<0,4 денные области значений х, у.а и % при решении задач синтеза встречаются наиболее часто. Если вещественная частотная характеристика Р(ы) замкнутой системы близка по форме к трапецеидальной (см. рис. 7.7), то время переходного процесса оценивают неравенством 187
ТЗ на проектируемую САР при данной постановке задачи синтеза включает следующие данные: степень астатизма и добротность; допустимое значение времени регулирования Трет так', допустимое значение (в процентах) перерегулирования Отах', максимальное ускорение регулируемой величины при заданном начальном рассогласовании. Выбор желаемой ЛАЧХ осуществляют по правилам связи между ЛЧХ разомкнутой системы и вещественной частотной характеристикой САР замкнутой системы — см. формулы F.11), F.13) и др. Порядок определения желаемой ЛАХ может быть, в частности, следующим. 1. Исходя из требуемых по ТЗ степени астатизма v и добротности k~W (s)\s=o системы, согласно выражению G.5), определяют (строят) ЛАЧХ объекта или неизменяемой части САР с учетом заданных v и k. To есть формирование желаемой ЛАЧХ начинают с низкочастотной асимптоты (объекта или неизменяемой части системы). Желаемая ЛАЧХ при частотах, меньших первой сопрягающей частоты, имеет наклон —20v (в децибелах на декаду), а при частоте со, равной 1 рад/с, имеет ординату 20 lg k (в децибелах). 2. По заданному в ТЗ значению оъах, по графику функции Omax==f2(f>max) (см. рис. 7.8, а), а также по указанным в под- рисуночной подписи значениям -х, ха и К определяют соответствующее значение Ртах вещественной характеристики замкнутой системы. Значение \Рт\и\ находят по приближенной формуле Mminl*" шах 1. ''•'/ 3. Частоту среза соср желаемой ЛАЧХ синтезируемой системы, реализующей квазиоптимальные переходные процессы, выбирают из соотношения где (йсР(г ) — частота среза, соответствующая заданному (допустимому) по ТЗ времени регулирования; cacpopt — частота среза оптимальной, в смысле выражения G.4), САР: (i)cp opt^^// min. Здесь 7min=2 ]/ go/^max — время оптимального переходного процесса. Частоту среза Юср(гшах) находят по кривой rmax=fi(Pmax) при значении Ртах, определенном в п. 2 (см. также рис. 7.8). Если заданное значение 7\пах таково, что ыср opt<Tft>cP(rmax) , то частоту среза САР следует выбирать не превышающей значения Иср opt. 4. Через точку соср на графике формируемой желаемой ЛАЧХ (см. п. 1) проводят прямую с наклоном —20 дБ/дек, которая является среднечастотной асимптотой желаемой ЛАЧХ синтезируемой САР. Наклон этой части ЛАЧХ выбирают равным 188
—20 дБ/дек потому, что такой наклон имеет ЛАЧХ оптимальной системы (качество переходного процесса в САР в основном определяется среднечастотной частью ЛЧХ разомкнутой системы, см. подразд. 6.6). 5. По номограмме (рис. 7.9) находят наименьшее допустимое значение запаса устойчивости системы (избытка фазы ус -3Z0 -280 -240 -/20-180-160 -120 -ВО -40 Lm.d6 /* -Г00 е,' -joo -гео -220 -/во -по Рис. 7.9. Номограмма для определения Р(<о) замкнутой системы по ЛЧХ разомкнутой системы при й)=юсР), обеспечиваемое на интервале частот, на котором желаемая ЛАЧХ удовлетворяет неравенству /.m>Z.,i;(<o)>—LM, L:A=Lm. G.8) Значения 2LM и 2^с характеризуют собой стороны прямоугольника, которым приближенно можно заменить область на номограмме рис. 7.9, ограничиваемую кривыми с индексами ^тахИ Pmin (CM. П. 2). 6. Сопрягают низко- и средпечастотную асимптоты ЛАЧХ таким образом, чтобы в том интервале частот, в котором справедливо неравенство избыток фазы был не меньше y<=- Проверку выполнения этого условия осуществляют при помощи приближенной формулы G.9) 189
где со; — сопрягающие частоты, меньшие того значения ю, при котором определяют значение фазы б; U и 12 — число сопрягающих частот, при которых наклон увеличивается или уменьшается на 20 дБ/дек. В формуле G.8) частоты сопряжения, превышающие частоту среза, не принимают во внимание, так как обычно среднечастотная асимптота желаемой ЛАЧХ занимает значительный интервал частот (порядка декады и более). Проверку можно также проводить путем построения фазовой характеристики, например при помеши шаблонов. Среднечастотную асимптоту желаемой ЛАЧХ сопрягают с высокочастотной частью логарифмической амплитудной характеристики (областью малых параметров) так, чтобы в том интервале частот, в котором справедливо неравенство избыток фазы ч был не менее ^с. Проверку выполнения этого условия выполняют по приближенной формуле т т=Я-|-вН-г1—5-^ср-2 -^-. G.Ю) где qcp — наклон среднечастотной асимптоты ЛАЧХ (при наклоне, равном —20 дБ/дек, q=l); ;n — число сопрягающих частот Юср, уДОВЛеТВОрЯЮЩИХ УСЛОВИЮ Иг>Шср. 7. Строят высокочастотную асимптоту желаемой ЛАЧХ так, чтобы она мало отличалась от высокочастотной асимптоты неизменяемой части системы. На устойчивость и качество систем мы этот участок ЛАЧХ влияет незначительно. На этом процедура формирования желаемой ЛАЧХ синтезируемой САР завершается. Если среднечастотная асимптота сопрягается с низкочастотной асимптотой, а также с высокочастотной частью желаемой ЛАЧХ, следует обращать внимание на то, чтобы желаемая ЛАЧХ имела наклон, возможно менее отличающийся от наклона ЛАЧХ неизменяемой части системы на каждом из участков сопрягающих частот. Это необходимо для того, чтобы получить более простую передаточную функцию корректирующего устройства, имеющую числитель и знаменатель возможно более низкого порядка. 7.3. Синтез последовательных корректирующих устройств Предположим, что структурная схема САР имеет вид, показанный на рис. 7.10. Необходимо определить тип последовательного корректирующего устройства и его параметры. Пере- 190
даточная функция разомкнутой синтезируемой САР (см. под- разд. 7.2). W(s) = Wd(s)W0(s). G.11) Предположим, что обе передаточные функции, входящие в правую часть выражения G.11), являются минимально-фазовыми: Lm[W\=LmHd+LmH0; 9(со)-ВДо^-ИМсо). Эти уравнения показывают, что логарифмические амплитудная /-(со) и фазовая 0(со) всей системы соответственно равны сумме логарифмических амплитудных Lm Hd, Lm Яо и фазовых Od(co), О.(со) характеристик последовательного корректирующего устройства и объекта (неизменяемой пли заданной части системы). Ж" Лс.„ т W,(s) Рис. 7.10. Структурная схема САР с последовательным корректирующим устройством Порядок операций для определения передаточной функции основан на формулах G.6) — G.10) и состоит в следующем: а) строят ЛАЧХ L0(to)=Lmff0 той части системы, схема и параметры которой являются заданными; б) определяют желаемую ЛАЧХ Z^(co)=Lm #ж; в) требуемую ЛАЧХ ?<*ж(с») последовательного корректирующего устройства находят вычитанием из желаемой ЛАЧХ ?.ж(со) характеристики неизменяемой части системы L0(co): г) аппроксимируя ЛАЧХ LdjK(©)=Lm#diK дробно-рациональной функцией или полиномом, с требуемой степенью точности находят желаемую характеристику последовательного корректирующего устройства синтезируемой САР; д) выбирают схему корректирующего устройства. В общем случае осуществляют синтез пассивного электрического i^C-кон- тура методами, принятыми в теории электрических цепей (корректирующий ./?С-контур можно выбирать, например, в соответствии с полученной формой ЛАЧХ, приведенных в табл. 7.1); 191
Пассивные корректирующие ЯС-фильтры Таблица 7.1 п/п Электрическая схема и асимптотическая ЛАЧХ Передаточная функция R1 ; "T *i Lm \ ° i -20 , ib e.i i H i\ Jt 1 ||| 1 Jr., г з \ IT 1 i T" 9 о 2 03^ ! III! -JJiili ^jl'll %t 0,2 03 \ \ I j IT II 7 ? г < \\ ч 7 -IS 'J«sfe fflll >• ?„=0; ?^==1; Tl = ¦1 + 192
Продолжение табл. 7.1 г* Электрическая схема и асимптотическая ЛАЧХ Передаточная функция R2 & 6 -iff i*lll!i /.1 ; ^"t^kutff f? -го сг TJ Шр 13—3591 ш- rkr.k+i ?„ = 0; ?^ = II 1 Illli 1 У*|| fej. ! "^ IIH I j zzi /\ j С i J /2 ^^ ' \ 2 1 Ifljj «vf?nr Inii ti-l 1 ? 1 D I П *-* I 193
Окончание табл. 7,1 п/п Электрическая схема и асимптотическая ЛАЧХ Передаточная функция о О -10 ш г II i 1 141|^- 1 1 11 Я2 7Г ЯГ№ 12 а сг 1т, 'б I, о; 1,1 viiww J<fY*5~i VJ Will iti I \ZOiBlici -2tlBIM\ ?. = 1; ?M=1; X !+?= +^ T2\l ' i=°iw! T2 = В = Г, 7V1 + Примечание. Значения ?0 и L«. даны в абс. ед. 194
е) проверяют выполнение заданных требований качества при выбранной ЛАЧХ корректирующего устройства. 7.4. Синтез корректирующих обратных связей и параллельных корректирующих устройств Для коррекции динамических свойств САР, наряду с ПКУ, применяют корректирующие обратные связи, что позволяет уменьшить влияние нестабильности и x(tj нелинейности характеристик отдельна ' г~*" ных элементов на динамические свой- ства системы в целом. Рассмотрим, некоторые свойства систем с корректирующими обратными связями, которые могут быть положены в основу Рис. 7.11. Элемент САР, ох- синтеза САР с КОС. ваченный корректирующей Передаточная функция элемента обратной связью САР (например, усилителя) с КОС (рис. 7.11) имеет вид W(s)= 1+w2(S)Z(s) • GЛЗ) Допустим, что передаточная функция Wm(s) задана. Необходимо определить передаточную функцию Z(s) КОС в классе минимально-фазовых систем. Для того чтобы введение корректирующей обратной связи не понижало порядок астатизма системы, необходимо, чтобы порядок нуля передаточной функции Z(s) при s = 0 был не ниже порядка полюса передаточной функции Wm(s) неизменяемой части при s = 0. В интервале частот, в котором или |2(/(о)Гт(/(о)|»1, G.14) ЛАЧХ, соответствующая передаточной функции G.13), удовлетворяет следующему приближенному равенству1: Lm[lF]«—Lm[Z]. G.15) Из формулы G.14) видно, что в интервале частот, для которого справедливо условие G.14) ЛАЧХ системы, состоящей из последовательных звеньев, охватываемых КОС, приближенно равна ЛАЧХ элемента КОС с обратным знаком. Если ЛАЧХ Lm[Wm(j(a)] отличается от характеристики — Lm[Z(/o))] в некотором интервале частот (©ь ©2) не более чем на +AL, то это значит, что в данном интервале частот должно удовлетворяться неравенство 1 Здесь и далее для упрощения записи в передаточных функциях W(s)y Zs и других оператор s=/<o опускается. 13* 195
m\Z\ <¦ \Wm\ -tZWn [Z\ ' где или m ¦<¦ 1+ZU7,, < Выражение <D2m=ZWm/(l+Z№m) имеет такую же структуру, как и соотношение <& — W/(l + W), представляющее зависимость между передаточными функциями системы в замкнутом и разомкнутом состояниях. Отсюда следует, что для удовлетворения приближенного равенства G.15) в некотором интервале частот (соь со2) с требуемой степенью точности ±ДЬ необходимо и достаточно, чтобы в этом интервале вектор 'Z(ja) Wm(ja)) не попадал внутрь окружностей амплитуды круговой диаграммы с индексами т и \/т. При рассмотрении способа синтеза КОС в постановке задачи и по ТЗ подразд. 7.2 предполагают, что последовательное корректирующее устройство в составе САР (рис. 7.12) отсутст- Zls) x(t) Рис. 7. 12. Структурная схема САР с корректирующей обратной связью вует. Тогда процедура определения передаточной функции КОС может быть следующей: а) строят ЛАЧХ Lm[Wm] неизменяемой части системы; б) исходя из заданных требований к качеству САР строят желаемую ЛАЧХ Lm[WV] всей системы; в) определяют интервал частот (шь М2)> в котором для характеристики Lm[Z] имело бы место приближенное равенство Lm[Z]=- Lm[W»]; г) строят характеристику Lm[Z]; д) выбирают значение Ка так, чтобы удовлетворить неравенство G.11) в интервале частот (©ь ы2); е) проверяют, является ли выбранное значение Ка совместимым с требованием устойчивости контура, охваченного элементом КОС, при соблюдении заданного запаса устойчивости. Для этого строят фазовую характеристику, соответствующую выбранной ЛАЧХ Lm[Zrd]; 196
ж) по выбранной передаточной функции Z синтезируют корректирующую обратную связь, при этом руководствуются теми же соображениями, что и при синтезе последовательного корректирующего устройства; з) выбирают Kd так, чтобы оно имело требуемое значение; и) уточняют вид ЛЧХ, соответствующих передаточной функции Wm/(l-\-ZWm). Для этого суммируют ординаты этих характеристик, соответствующих функциям Wx и 1/A+Z№m); к) проводят проверку удовлетворения заданных условий качества. Примером технической реализации задачи синтеза КОС является схема коррекции с тахометрической обратной связью. Последнюю обычно применяют в позиционных следящих системах для демпфирования колебаний. Рис. 7.13. Корректирующая обратная ¦ связь на основе тахогенератора На рис. 7.13, а показана КОС, состоящая из тахогенератора ТГ, механически связанного с валом исполнительного электродвигателя и пассивного однозвенного /?С-контура (RC- фильтра). Передаточная функция этого устройства Вместо однозвенного может быть применен двухзвенный RC- контур (рис. 7.13,6). Тогда передаточная функция корректирующего устройства (КУ) имеет вид 7 (ч\ На рис. 7.14 приведена схема КУ с мостовой тахометрической обратной связью. Если мост сбалансирован, то напряжение на выходе пропорционально угловой скорости вращения электродвигателя; если мост не сбалансирован, то напряжение на выходе пропорционально угловой скорости и ускорению. Рассмотрим также в общем виде (на примере изодрома, рис. 7.15) параллельные корректирующие устройства Wnap(s). Изо- 197
Рис. 7.14. Корректирующее устройство в виде мостовой тахометрической обратной связи: ЭУ — электронный усилитель; ЭМУ — электромашинный усилитель; Эдв — электродвигатель постоянного тока Рис. 7.15. Изодромное корректирующее устройство дромное КУ представляет собой параллельное соединение двух звеньев — интегратора и усилителя, на входы которых поступает сигнал uBX(t). Сигнал на выходе изодромного КУ а передаточная функция изодр ' Ts + l G.16) Как видно из выражения G.16), изодромное КУ обладает свойствами интегратора и форсирующего звена в интервале частот, примыкающих к о = 1/7". Техническая реализация изо- дрома может быть выполнена на аналоговых микросхемах. Параллельные КУ широко применяют для повышения устойчивости различных промышленных САР. 198
7.5. Синтез САР с последовательным корректирующим устройством и корректирующей обратной связью Если САР содержит как последовательное КУ, так и КОС (общий случай структурной схемы САР см. на рис. 7.6), и если система имеет передаточную функцию G.5), то ее ЛАХ представим в виде [J^] G.17) Первый шаг процедуры синтеза, состоящий в выборе на основании заданных по ТЗ условий качества и характеристик объекта желаемой ЛАЧХ, остается тем же, что и ранее. Дальнейший ход решения задачи может, например, заключаться в следующем. Принимают тогда вместо выражения G.17) можно написать G.18) Выражение G.18) имеет такой же вид, как и формула G.12) для Lm[W] при синтезе последовательных корректирующих устройств. Поэтому выбор передаточной функции Wd, может быть выполнен способом, которым осуществляют синтез ПКУ. После определения Lm[№V] и выбора Lmf^] на основании имеющихся в распоряжении четырехполюсников находят ЛАЧХ путем вычитания из Lm[№d'] соответствующих характеристик. ЛАЧХ может быть записана в виде По ЛАЧХ G.19) и соответствующей ей фазовой характеристике (используя номограмму для замыкания системы) обратным преобразованием определяют ЛЧХ, соответствующие передаточной функции (ZWm)~l. Последние дают возможность найти характеристики передаточной функции ZWm, представляющие собой зеркальное отображение характеристик (ZW)-1. Путем вычитания одной из найденных характеристик ЛАЧХ Lm[Wm] определяют искомую логарифмическую характеристику Lm[Z]. После этого выбирают схему КУ и осуществляют проверку заданных требований при полученных корректирующих устройствах. Задача синтеза упрощается, если во всем существенном интервале частот удовлетворяется неравенство |ZUPm|;>l. При этом ЛАЧХ Lm|Wy| сводится к виду Lm [Wd]« Lm [Wd\ -Lm [Z] G.20) 199
и способ синтеза не отличается от способа синтеза ПК.У. После определения характеристики Lm[WV] выбирают последовательное корректирующее устройство Wd и по формуле G.20) определяют амплитудную характеристику Lm[Z] элемента корректирующей обратной связи. Пример (построение желаемой ЛАХ). Передаточная функция неизменяемой части позиционной САР с механическим инерционным объектом имеет вид ГE)= a @,012s-I) @,05s+1) • G-21) Необходимо обеспечить следующее: 1) нулевую установившуюся ошибку на класс ступенчатых входных воздействий (т. е. система должна иметь астатизм 1-го порядка, а передаточный коэффициент k должен составлять 200 1/с); 2) перерегулирование атах в системе не должно превышать 30%; 3) время переходного процесса ГЛ1а1 не должно превышать 0,3 с; 4) максимальное ускорение регулируемой величины должно составлять 300 рад/с2 при начальном рассогласовании go=A6, равном 0,1 рад. Оценочное значение Грсг можно найти по формуле G.6). Для построения графика желаемой ЛАЧХ системы регулирования сначала по передаточной функции G.21) строят низкочастотную ЛАЧХ при й=200 1/с и v=l (рис. 7.16). Низкочастотная асимптота при ш —1 имеет Ш), вы,' 200 Рис. 7.16. Пример нахождения желаемой ЛАЧХ и синтез последовательного корректирующего устройства
ординату 20!g?, т. с. 46 лБ. Затем выбирают частоту среза желаемой ЛАЧХ о)ср. По заданному процентному значению атах и по графику 0тах = =fi{Pma) находят Ртах, равное 1,25 отн. ед., а по графику Ттах = /ЛРтах) определяют 7"тах=3>75л/шСр = 0,3 с, откуда (шср)г =39,21/с; max (®cp)opi = Таким образом, частота среза желаемой ЛАЧХ должна находиться в диапазоне 39^ыСр^55. Частоту среза желаемой ЛАЧХ выбирают равной 40 1/с. После этого проводят среднечастотную асимптоту желаемой ЛАЧХ с наклоном —20 дБ/дек. Затем определяют |Pmm|=Pmax—1=0,25. На номограмме линий равных значений Р(ш) (см. рис. 7.9) кривые с индексам* 1,25 и —0,25, т. е. Ртах=1,25 и Pmin = —0,25, вписывают в прямоугольник, стороны которого 2Lm и 2ус. В результате по номограмме определяют значения: Lm« + 15 дБ, Y=43°. Далее сопрягают низко- и среднечастотную асимптоты желаемой ЛАЧХ отрезком прямой, имеющим наклон —40 дБ/дек. Используя формулу G.9), находим наибольшее значение сопрягающей частоты и>2, при которой еще "\>=^7с- Среднечастотную асимптоту сопрягают с высокочастотной частью ЛАЧХ Lm[Wo]. На устойчивость системы и на ее качество высокочастотная асимптота влияет незначительно, поэтому для упрощения корректирующего устройства сопряжение осуществляют отрезком прямой с наклоном —40 дБ/ /дек, а в дальнейшем желаемая ЛАЧХ совпадает с Lm[W0J. Проверку наличия избытка фазы \с проводят с помощью формулы G.10). Построенная желаемая ЛАХ может быть уточнена с использованием но- ыограмм, приведенных далее. Пример (синтез последовательного корректирующего устройства). Пусть неизменяемая часть САР имеет передаточную функцию G.21) и построена желаемая ЛАЧХ, удовлетворяющая требуемым показателям качества (см. рис. 7.16). Из желаемой характеристики Lm[WH<] CAP вычитают характеристику LmfW'o] и находят желаемую ЛАЧХ последовательного корректирующего контура (см. рис. 7.16). По этой ЛАЧХ определяют передаточную функцию ПКУ в виде 1 Электрическая схема пассивного корректирующего контура, соответствующая данной передаточной функции, показана на рис. 7.17. С1, -CZ3- Rl i сг Рис. 7.17. Электрический пассивный корректирующий контур 201
7.6. Номограммы для определения запаса устойчивости, показателей качества и коэффициентов ошибок САР по ЛА ЛАЧХ Lm[fl7] систем часто можно представить состоящими из следующих основных отрезков (рис. 7.18): CD (средне- частотная асимптота) с наклоном —20 дБ/дек, пересекающий -Wffff/ie/r Рис. 7.18. Типовые ЛАЧХ САР ось частот в точке, соответствующей частоте среза wcp; AB (низкочастотная асимптота) с наклоном —20 v в децибелах на декаду (где v — порядок астатизма); ВС с наклоном —40.., ... —60 дБ/дек (соединяет низкочастотную асимптоту с отрезком прямой, пересекающим ось частот); DE (при высоких частотах). Высокочастотная часть ЛАЧХ мало влияет на качество системы и в первом приближении может не приниматься во внимание. Поэтому ЛАЧХ можно подразделить на ряд основных типов и для каждого из них составить номограммы, позволяющие связать основные параметры ЛАЧХ с показателями качества САР. Номограммы составлены для минимально-фазовых систем и представляют интерес не только для анализа, но и для синтеза корректирующих устройств САР. Далее рассмотрены лишь типовые ЛАЧХ минимально-фазовых астатических систем 1-го порядка. При этом можно Ш- делить четыре основных типа ЛАЧХ. Они имеют низко- и сред- нечастотные асимптоты с одним и тем же наклоном (—20 дБ/ /дек) и отличаются друг от друга наклоном в интервале частот (©1 ... ©г) (отрезок ВС на рис. 7.18) и в интервале частот (юз.-.о°) (отрезок DE). Передаточные функции и наклоны асимптотических ЛАЧХ в указанных интервалах частот приведены в табл. 7.2. Каждая из типовых ЛАЧХ (см. табл. 7.2) полностью определяется четырьмя параметрами: передаточным коэффициентом, или добротностью, k и сопрягающими частотами а>\ — \1Ти 202
Таблица 7.2 Передаточные функции W(s) для типовых ЛАЧХ Тип ЛАЧХ I II III IV Передаточная функция .(r'+mVi+i) s(Tts+\J(T3s + lJ Наклоны, дБ/дек в интервалах 0...Ш, |со,... о). —20 20 20 —20 40 —60 40 —60 20 20 20 —20 40 —40 60 -60 оJ=1/Г2, <вз=1/Гз. Однако удобнее пользоваться совокупностью следующих четырех параметров: ординатой ЛАЧХ L\ при ю = = coi; частотой среза юСр и относительными сопрягающими частотами ом/юср и / Каждому типу передаточной функции соответствует своя номограмма, позволяющая определять показатели качества, запас устойчивости и точность системы непосредственно по виду типовых ЛАЧХ, заданных параметрами Л / / р; i/P; 3/р Для астатических САР 1-го порядка эти номограммы приведены, например, в работе [19]; для статических и астатических САР 1-го и 2-го порядка имеются специальные альбомы [20]. Аналогичные номограммы могут быть построены и для других типов ЛАЧХ. Кривые номограммы представляют собой зависимости динамических показателей: а; Грег; (Оср/10; (OcpCi; <вСр2С2 и у от относительной сопрягающей частоты <Bi/(oCp при различных фиксированных значениях L\\ Шз/шср (где а — перерегулирование, %; Грег — время переходного процесса; у— запас устойчивости по фазе; Ci и Сг — коэффициенты ошибки, которые определяют точность системы при медленно изменяющихся управляющих воздействиях). Номограммы построены для значений L\, равных 80; 70; 60; 50; 40; 30; 20 дБ, и значений Шз/Мср, равных 1; 2; 4; 8. Способ применения номограмм для определения перечисленных динамических показателей, соответствующих какой-либо конкретной ЛАЧХ, относящейся к одному из четырех типов (см. табл. 7.2), заключается в следующем: 1) определяют тип рассматриваемой ЛАЧХ и выбирают соответствующую номограмму; 2) находят параметры ЛАЧХ Li\ coi/шср; шз/шер; Шор и при помощи кривых, приведенных в номограмме, определяют динамические показатели. Пример. Допустим, что имеется ЛАЧХ II типа (рис. 7.19) с параметрами ?-==60; Wi/(Ocp = 0,04; co3/cocp = 2; v=l. Сначала выбирают номограмму для v=l с отметками L=60 и а>зЛоСр = = 2. На оси абсцисс (coi/(oCp) отмечают точку 0,04, и из нее проводят перпендикуляр до пересечения с кривыми номограммы. В результате получают искомые динамические показатели: 0=45%; 7"рй)ср/10=0,75; <BcpCi=0,025; »ср2С2=2,2; y=58°. Если значения параметров ЛАЧХ отличаются от имеющихся в номограмме, то динамические показатели могут быть определены по кривым номограммы при помощи интерполяции. 203
Lib 4 0,05 0,0U 0,05 0.06 cj,lwa Рис. 7.19. Определение динамических показателей системы по номограмме: а — ЛАХ II типа; б -лист ш>м>грачм (кривые: 1 --пригар',; 2— при о) ,аС2; 3 -« при а; 1 — при Ги ./10; 5 — при у) Следует отметить, что номограммы часто можно применять не только в случае передаточных функций (см. табл. 7.2), имеющих кратные полюса и нули, но и в случае передаточных функций, не имеющих кратных полюсов и нулей. Однако необходимо, чтобы порядок числителя и порядок знаменателя рассматриваемой и соответствующей типовой передаточной функции были одинаковы. Так, например: номограммой, построенной для ЛАЧХ II типа, можно пользоваться в случае систем с передаточными функциями вида ft(T,s-l)(T4s-1) sGVH)GV.l)GV+l): G-22> вида номограммой III типа -- в случае систем с передаточными функциями G.23> номограммой IV типа — в случае систем с передаточными функциями вида .„,, *(T,S+1)(T4S+I) )G-5s+l)(r,s+I)- G.24> Праьило переходов от передаточных функций G.22) — G.24) к передаточным функциям табл. 7.2 состоит в том, что две соседние постоянные времени Ti и Tifi заменяют двумя одинаковыми постоянными времени, определяемыми по формуле Ошибка в ЛАЧХ, которая получается при замене двух соседних неодинаковых постоянных времени (Ti и Ti+i) одной постоянной 7~м+ь при l/Ti+i<4/Ti не превышает 2 дБ. 204
Номограммой можно также пользоваться а тех случаях, когда вместо двух апериодических звеньев с одинаковыми постоянными времени имеется одно колебательное звено. Ошибка при этом будэт уменьшаться с убыванием коэффициента затухания |„ колебательного звена. Контрольные вопросы 1. Сформулируйте задачу синтеза корректирующего устройства САР. Что представляет собой квазиоптимальная переходная функция системы? 2. Дайте определение желаемой ЛАЧХ. (Почему при этом можно не учитывать соответствующую ЛФЧХ?) 3. Какова связь между частотной характеристикой разомкнутой системы и вещественной частотной характеристикой замкнутой САР? 4. Какова последовательность процедур при синтезе последовательного корректирующего устройства? Корректирующей местной обратной связи? 5. Сформулируйте особенности синтеза комбинированного корректирующего устройства (последовательного КУ и КОС). 6. Какие используют аппаратные средства для технической реализации КУ в САР? 7. Какова структура номограммы для определения запасов, устойчивости, показателей качества и коэффициентов ошибок САР? 8. ЭЛЕМЕНТЫ ТЕОРИИ НЕЛИНЕЙНЫХ СИСТЕМ АВТОМАТИЧЕСКОГО РЕГУЛИРОВАНИЯ Существенным отличием нелинейных систем от линейных с точки зрения передачи и преобразования сигнала управления является зависимость «мгновенного» передаточного коэффициента безынерционного нелинейного элемента, входящего в состав нелинейной САР, от значения входного сигнала. Эта особенность не допускает применения рассмотренных ранее методов расчета линейных САР к нелинейным системам. В последних возможно также возникновение специфического автоколебательного режима работы. В данном разделе рассматриваются специальные методы анализа нелинейных систем, а также методы определения параметров автоколебаний [10, 20]. 8.1. Нелинейные системы. Типовые нелинейные характеристики САР, содержащие звенья, динамику которых определяют нелинейными дифференциальными уравнениями, относят к не- ''пиейным системам, включающим элементы с типовыми 205
нелинейными характеристиками, описываемыми зависимостью Хвых==1 (Хвх) г где хВх —¦ входной сигнал; лгВых — выходной. Статические характеристики типовых нелинейностей приведены на рис 8.1. Могут быть и различные сочетания этих харак- XBux хвх "вш *дш, *бых XQux *бх JB* хвых *Вх т Рис. 8.1. Статические характеристики типовых не-? линейностей САР: а — релейная двухпозиционная (однозначная); б— релейная трехпозиционная (однозначная); в — релейная с гис „„ терезисом; г — линейная с насыщением; д — релейнаК *DX двухпозиционная (неоднозначная или петлевая); е — характеристика типа «люфт»; ж — характеристика типа «идеальный диод» (детектор); э — характеристика тип* «модуль»; и — линейная характеристика с зоной нечув- " ствительности теристик. К нелинейным САР относят также и релейные системы, содержащие элементы с релейными характеристиками. Моменты времени, при которых происходят размыкание и замыка-; ние системы, заранее не известны. Они зависят от внутренних свойств системы. Физические процессы в САР описывают дифференциальными уравнениями с переменными коэффициентами, но эти коэффициенты — функции регулируемой величины, а не времени /. Нелинейные САР обычно представляют в виде структурной схемы (рис. 8.2), для получения которой выполняют следующие операции: \ Линейная часть системы У > i X Нелинейная часть системы 1 Рис. 8.2. Структурная схема нелинейной САР 206
составляют дифференциальные уравнения для всех звеньев систем автоматического регулирования; проводят линеаризацию тех звеньев, где это допустимо (в результате звенья будут разделены на линейные и нелинейные); линейные звенья объединяют в один блок (линейная часть); анализируют систему одним из методов нелинейной теории автоматического регулирования. Для анализа нелинейных систем автоматического регулирования в основном применяют методы: фазовых траекторий; при- пасовывания; гармонической линеаризации; фазовой границы устойчивости и др. 8.2. Метод фазовых траекторий Фазовая плоскость — это плоскость, на которой по двум координатам х и у откладывают какие-либо две переменные, характеризующие динамику САР, например отклонение регулируемой величины х и скорость: х=у= (dx)f(dt). При изображении процесса на фазовой плоскости уравнение 2-го порядка удобно свести к системе двух уравнений 1-го порядка: где fi и /г — в общем случае нелинейные функции координат. Чтобы изобразить процесс на фазовой плоскости, исключают время, для чего второе уравнение этой системы делят на первое: dy fi (at, у) dx "ft (x, у) ¦ В результате получают нелинейное дифференциальное уравнение, для которого общих методов точного решения не существует. В каждой задаче приходится изыскивать частный метод: Решением уравнения будет некоторая функция y=F(x), графическое изображение которой на фазовой плоскости называют фазовой траекторией (или фазовым портретом системы регулирования). Изображение процесса на фазовой плоскости обеспечивает Достаточную наглядность. Однако рассмотрение ограничено только такими системами, динамика линейной части которых Может быть описана уравнением 2-го порядка. В тех случаях, Когда уравнение системы имеет более высокий порядок, применяют многолистные фазовые плоскости. Изображение на фазовой плоскости основных процессов регулирования. Рассмотрим фазовые портреты некоторых временных процессов. 207
Риг.. 8.3. Периодически* незатухающие колебания в САР: а — цре.ченная функция * = /(/); б — фазовый портрет системы 1. Периодические незатухающие колебания (с постоянными амплитудой и частотой) (рис. 8.3). На фазовой плоскости их изображают в виде некоторой замкнутой кривой или замкнутой фазовой траектории. Каждому периоду колебаний системы соответствует прохождение изображающей точкой М всей кривой А, В, С, D, Е фазовой траектории. Если колебания синусоидальные, то фазовая траектория имеет вид эллипса (см. рис. 8.3) и ее описывают уравнениями x(t)=- a sin o)t; y(t)=~'-jf= — я» cos at, где (а=2п/Т — круговая частота (здесь Т — период колебаний); а и аол — полуоси эллипса по осям х и у соответственно. Если колебания не синусоидальные, то замкнутый контур траектории отличается от эллипса. 2. Затухающий колебательный процесс (рис. 8.4). Его изображают на фазовой плоскости в виде спиралевидной сходящейся фазовой траектории. Когда наступит та же фаза колеба- Рис. 8.4. Затухающий колебательный процесс: а — функция *=/(/); б — фазовый портрет системы 208
ний, что и в начальный момент времени, точка М окажется на расстоянии, меньшем, чем хяач. 3. Расходящийся колебательный процесс (рис. 8.5). Его Рис. 8.5. Расходящийся колебательный процесс: а — функция x=i(t)\ 6 — фазовый портрет системы изображают на фазовой плоскости в виде спиралевидной расходящейся траектории. 4. Затухающие апериодические процессы (рис. 8.6). Имеют на фазовой плоскости траектории, сходящиеся в начале коор- Рис. 8.6. Затухающие апериодические процессы: а — графики. A—6) функций xj=f(t); /=1, 2,..., 6; б —фазовые портреты (/'—5') систем описываемых функциями Xi=f(t) динат: А — начальные значения функций Xj=f(t), j=\, 2,... 6; Ви В5 — максимальные и ВзЯ4 — минимальные значения функций, имеющих экстремумы; С3 и Се — нулевые значения знакопеременных функций; В\ , В6' и Вз', BS — отображения максимумов и минимумов на фазовой плоскости; С3' и Се' — отображения нулевых значений. 5. Расходящиеся апериодические процессы имеют на фазовой плоскости фазовые траектории, изображенные на рис. 8.7. Правило построения фазовых траекторий. Фазовые траектории строят по заданным уравнениям динамики САР. В верхней 14—3591 209
tit) t Рис. 8.7. Расходящиеся апериодические процессы: а — графики A—4) функции x(t); б — фазовые портреты Ц'—4') половине фазовой плоскости (где у>Щ изображающая точка всегда движется слева направо, в сторону увеличения х; в нижней половине фазовой плоскости (где t/<0)—справа налево. Это правило используют для расстановки стрелок вдоль фазовой траектории. На оси х, которая разделяет верхнюю и нижнюю половины фазовой плоскости, у=0, dx/di=0 (т. е. скорость изменения координаты х равна нулю); фазовая траектория пересекает ось х под прямым углом. По полученным фазовым траекториям можно судить о динамических свойствах САР. При анализе фазовых траекторий выделяются особые точки. В этих точках не существует определенного направления касательной к фазовой траектории, т. е. имеет место неопределенность вида dy. dx' 0_ О' В особых точках фазовые траектории не пересекаются друг с другом, а сходятся к этим точкам или выходят из них. Особые точки являются точками равновесия системы. Для нелинейных САР могут быть выделены, например, случаи, когда: 1) система имеет элемент с зоной нечувствительности и насыщением. Статическая характеристика такого элемента изображена на рис. 8.1,6. Установившемуся состоянию равновесия на фазовой плоскости соответствует целая область возможных состояний равновесия (рис. 8.8). Особая точка превращается в особый отрезок прямой АВ. Его длина зависит от размера зоны нечувствительности и от насыщения; 2) поведение системы характеризуется расходящимися процессами, по до определенных пределов. Система неустойчива в «малом», амплитуда расходящихся колебаний ограничена. 210
Рис. 8.8. Фазовый портрет (диаграмма) системы с зоной нечувствительности и насыщением Щ Рис. 8.9. Фазовый портрет системы, имеющей устойчивый предельный цикл В начале координат на фазовой плоскости находится неустойчивый фокус. Фазовый портрет (диаграмма) системы показана на рис. 8.9. Спирали фазовых траекторий расходятся из фокуса и приближаются асимптотически к замкнутому контуру (замкнутой траектории), который имеет конечные размеры. Все изображающие точки, которые начинают свое движение вне этого контура, тоже приближаются асимптотически к этому контуру. Контур называют устойчивым предельным циклом (ПЦ). Он представляет собой замкнутую изолированную траекторию. Если изображающая точка под влиянием внешнего воздействия сойдет на другую траекторию, то она обязательно будет двигаться по внутренней или внешней спирали, т. е. будет «наматываться» на контур ПЦ и приближаться к нему асимптотически. Устойчивый ПЦ свидетельствует о наличии области устойчивых колебаний в САР, которые называют автоколебаниями; 3) в системе происходит затухающий процесс до тех пор, пока начальные отклонения не выйдут за пределы некоторой области. Система устойчива в «малом», но не устойчива в 14* 211
«большом». Здесь также имеется изолированная замкнутая траектория — неустойчивый предельный цикл (НПЦ), рис. 8.10. Если изображающая точка находится внутри НПЦ, то она движется к устойчивому фокусу—началу координат; если вне НПЦ, то она удаляется по спирали в бесконечность. Изображающая точка не может двигаться по неустойчивому циклу; 4) в системе имеется несколько предельных циклов. На рис. 8.11 показана фазовая диаграмма, когда имеются два •—г Рис. 8.10. Фазовый портрет си- Рис. 8.11. Фазовый портрет системы, стемы, имеющей неустойчивый имеющей два предельных цикла предельный цикл предельных цикла: внутренний неустойчивый — ПЩ (с него «сматываются» фазовые траектории); внешний устойчивый—• ПЦг (на него «наматываются» фазовые траектории). Возможен также полуустойчивый предельный цикл, когда соседние фазовые траектории «навертываются» на предельный цикл с одной стороны и «свертываются» — с другой. Пример (Построение фазовой траектории в системе, имеющей характеристику типа статического трения, см. рис. 8.1, б). Фазовую траекторию можно получить, используя уравнение Т*!ПГ + Х=±11' где A — постоянная, характеризующая силу трения и не зависящая от времени. Операторная форма этого уравнения Общее решение находят как сумму общего и частного решений однородного уравнения. Общее решение имеет вид х=±и+А cosat, х= —Лео sin со?, где со = 2л/Г — круговая частота; А — амплитуда, определяемая начальными условиями. Уравнение фазовой траектории о>А 1 описывается эллипсом с центром в точке (±-ц; 0). Знак перед ц определяют из условия, что сила статического грения всегда направлена против ско- 212
Рис. 8.12. Построение фазовой траектории системы с релейной трехпози- ционной характеристикой рости движения. Движение по фазовой траектории начинается из точки I (рис. 8.12), имеющей координаты х=х0, у = 0. От точки I до точки II фазовая траектория представляет собой эллипс с центром в точке О\ (OOi = p.). Уравнение эллипса находят после определения значения А\ по начальным условиям: при ^=0, х=х0, у=0. Уравнение эллипса для участка I—II (см. рис. 8.12): Координаты точки II: х=—л:о+2ц; у=0. При изменении направления движения за точкой II знак силы трения меняется на противоположный. Уравнение фазовой траектории на участке II—III (см. рис. 8.12): </ = 1. Это — уравнение эллипса с центром в точке из начальных условий точки II: х= —хо+2ц; у=0. Значение Лг определяют из уравнения г. Для определения Л2 исходят Уравнение эллипса на участке II—III (см. рис. 8.12): + \х у Г у V о—3\i) +[ш(л:„— 3|X)J -1* Координаты точки III: х=х0—4ц; у=0. Построение фазовых траекторий продолжают до тех пор, пока изображающая точка не попадет в зону нечувствительности О2О\ (точка IV), после чего движение прекращается. 8.3. Автоколебания в нелинейных САР В нелинейных САР при малых начальных отклонениях может быть расходящийся колебательный процесс (кривая 1, рис. 8.13), а при больших отклонениях — затухающий колеба- 213
тельный процесс (кривая 2). На фазовой плоскости эти процессы разграничивает устойчивый предельный цикл (УПЦ), он соответствует периодическому колебательному процессу (кри- Рис. 8.13. Виды колебательных процессов в нелинейной САР вая 3) с постоянной амплитудой а0 и постоянной частотой (ао=Т/2л. К кривой УПЦ асимптотически приближаются фазовые траектории изнутри и снаружи. Период колебаний Т из картины фазовых траекторий неясен. Равновесное состояние системы неустойчиво. Но процесс расходится до определенной амплитуды а0. Практически колебательный процесс будет устойчивым, так как при одних начальных значениях он расходится, а при других — затухает. Относительно равновесного состояния эта САР неустойчива, но она обладает устойчивыми периодическими колебаниями с определенной амплитудой а0. Такая система пригодна для регулирования, если амплитуда колебаний а0 невелика и частота их не опасна (т. е. наложение этих колебаний на регулируемую переменную допустимо по техническим требованиям, предъявляемым к данной системе). В этом случае САР можно считать практически устойчивой. Если амплитуда устойчивых периодических колебаний так велика, что систему нельзя использовать для регулирования,то такую САР считают практически неустойчивой. Следует отметить, что эти колебания являются собственными (так как возмущающее воздействие f(t)—O), свободными и имеют вполне определенные амплитуду и частоту, которые зависят не от начальных условий процесса, а от параметров самой системы, т. е. объекта и регулятора. Эти устойчивые собственные свободные периодические колебания САР возникают и при каком-то определенном сочетании параметров системы, и при некотором множестве их сочетаний (подобно области устойчивости равновесного состояния в линейной САР). Такие устойчивые собственные свободные колебания с параметрами а0, ©0 называют автоколебаниями. Они могут возникнуть только в нелинейных системах. Если в реальных САР наблюдаются ав- 214
токолебания, то это свидетельствует о наличии нелинейности в этих системах. К автоколебательным системам можно отнести не только САР, но и электронный генератор, электромагнитный прерыватель, часы, духовой инструмент, поршневой двигатель (паровой или двигатель внутреннего сгорания), а также шимми (колебания управляемых колес автомобиля), флаттер (вибрация крыла или хвостового оперения самолета). Автоколебательный характер имеют и процессы в живых организмах (дыхание и работа сердца). Автоколебательной называют систему, способную создавать незатухающие колебания. Такая система характеризуется наличием: источника энергии; клапана (вентиля), который регулирует поступление энергии в колебательную систему; обратной связи (с колебательной системы — на клапан). 8.4. Примеры нелинейных САР релейного типа Для того чтобы представить работу нелинейной САР, рассмотрим несколько типов систем автоматической стабилизации температуры (рис. 8.14, 8.15). Пусть необходимо поддерживать постоянную температуру в объекта 2, охлаждаемого воздухом (см. рис. 8.14). Регулирующим элементом являются f(t) Рис. 8.14. Линейная САР регулирования температуры непрерывного действия шторки 1, угловое положение которых ф определяет интенсивность поступления охлаждающего воздуха. Измерительное устройство регулятора состоит из термометра сопротивления 3, включенного в качестве одного из плеч моста 4, и устройства 5, измеряющего ток в диагонали моста. Мост 4 настраивается так, чтобы при заданной температуре, которую надо поддерживать неизменной, ток в диагонали моста отсутствовал. Чувствительный эелемент регулятора C—5) пере- 215
мешает токосъемный элемент потенциометра 6 пропорционально отклонению' температуры 0. Потенциометр управляет работой электродвигателя Эдв с помощью усилителя 7. Электродвигатель черед редуктор 8 изменяет положение шторок А Недостаток системы заключается в том, что токосъемный элемент измерительного устройства 5 имеет значительное механическое сопротивление в виде трения об обмотку потенциометра. Это снижает чувствительность измерителя и всего регулятора к малым отклонениям регулируемой величины 9. Для устранения этого недостатка при управлении работой привода шторок вместо измерителя 5 и потенциометра 6 может быть применен переключающий релейный элемент — поляризованное реле 5', 6' (рис. 8.15). (Названия позиций 1—4 и 7—8 на рис. 8.14 и 8.15 — одинаковые.) Рис. 8.15. Релейная система регулирования температуры Средний контакт поляризованного реле в зависимости от знака тока в диагонали моста 4, т. е. в зависимости от знака отклонения регулируемой величины 9, замыкается с правым или левым контактом. Ток якоря включается в одном или в другом направлениях. Электродвигатель Эдв через редуктор 8 открывает или закрывает шторки /, увеличивая или уменьшая охлаждающий воздушный поток. Уравнение объекта регулирования может быть записано в виде где То — постоянная времени объекта; В — отклонение температуры; k0 — передаточный коэффициент объекта регулирования, определяющий эффективность воздействия регулирующего элемента на объект; <р — угол поворота шторок; f(t)—возмущающее воздействие на объект (изменение температуры из-за любых других причин, кроме поворота шторок). Параметры объекта То и k0 можно определять экспериментально. Измерительное устройство (термометр сопротивления 3 и мост 4) характеризуется тем, что ток / в диагонали моста или в управляющей обмотке реле пропорционален б, т. е. I=k\Q. Из сети в переключаемую цепь поляризованного реле (цепь контактов) подается постоянное напряжение (U—с), питающее электродвигатель. Оно изменяется соответственно изменению тока / в диагонали моста. Зависимость выходного напряжения реле U от тока / называют статической характеристикой реле. 216
-b Ь,Ь, и. Ч 1 1 0 ч g -b ¦/ v и. 0 г Li 6 7 Рис. 8.16. Характеристики электромагнитных реле: 6i=/i и Ь2 = /2 — токи отпускания и срабатывания реле соответственно Нейтральному положению среднего контакта реле соответствует значение ?/=0 при малых значениях тока — 6</<Ь (рис. 8.16,а). Интервал — b^I^b, где U=0, называют зоной нечувствительности реле. При токе 1=Ь реле срабатывает, включая напряжение t/=c. При обратном отрицательном направлении тока / реле срабатывает при /= —Ъ. При этом электродвигатель изменит направление вращения. Если ток срабатывания реле не совпаадет с током отпускания, т. е. коэффициент возврата реле квф1, то статическая характеристика реле имеет вид петли гистерезиса (рис. 8.16,6). Зона нечувствительности реле (рис. 8.16, а и б) появляется тогда, когда средний контакт имеет нейтральное положение. Если этого нет, то якорь реле будет перескакивать из одного среднего положения в другое (см. рис. 8.16,а). В этом случае статическая характеристика является идеальной — без зоны нечувствительности и без петли гистерезиса. В реальных условиях эта характеристика при отсутствии зоны нечувствительности имеет петлю гистерезиса (рис. 8.16, г). Статическую характеристику реле описывают уравнением U=F(I), где F.(I) — нелинейная функция (графически задается одной из форм, приведенных на рис. 8.16). Характеристика реле существенно нелинейна: ее нельзя линеаризовать. Уравнение для электродвигателя с редуктором и со шторками, учитывая электромеханическую постоянную времени Гь можно записать в следующем пиде: где ф — угол поворота шторок; k2 — коэффициент Эдв. Таким образом, осуществлено замыкание системы и ее можно представить в виде схемы, изображенной на рис. 8.17. 9 РЭ 1 fit) ОР п и в' р 1 43 Рис. 8.17. Функциональная схема нелинейной САР температуры: ОР — объект регулирования; РЭ — регулирующий элемент: Я — привод; ЧЭ — чувствительный элемент; Р — реле (переключающее) 217
Релейный регулятор называют: трехпозиционным при таких релейных характеристиках, как на рис. 8.16, а и б; двух- позиционным (или регулятором по принципу «да—нет») при таких релейных характеристиках, как на рис. 8.16, виг. Если характеристика реле идеальная (см. рис. 8.16, в) и при этом не принимать во внимание постоянных времени регулятора, то закон регулирования в релейной системе без нейтрального положения (двухпозиционной системы) определяется характеристикой, показанной на рис. 8.18, а, т. е. dt 49 at 9' в' Рис. 8.18. Законы регулирования в системе: а — реле без нейтрального положения; 6 — реле с нейтральным положением тт = ^2^> при 0>О; jf=— k2c 9<0. Для трехпозиционной системы в нейтральном положении (рис. 8.18,6) закон регулирования следующий: g = 0. 9 = 0; Работа реле во времени показана на рис. 8.19. Если реле a. i Рис. 8.19. Временная диаграмма работы электромагнитного реле 218
ймеет такую характеристику, как на рис. 8.16, а, то изменение напряжения U, которое подается на электродвигатель, будет происходить так, как на рис. 8.19,6. Переключения реле происходят при определенных значениях входного тока (I=b и Составление расчетной схемы нелинейной САР сводится к следующим трем этапам. 1. Выделяют нелинейное звено (реле), а все остальные звенья системы, включая и объект регулирования, объединяют в линейную часть (рис. 8.20). лч и нэ Рис. 8.20. Расчетная функциональная схема нелинейной САР: ЛЧ — линейная часть системы,- НЭ — нелинейный элемент 2. Представляют уравнение нелинейного звена в виде нелинейной функции U—F(I), которая соответствует одной из характеристик на рис. 8.16. 3. Получают уравнение динамики линейной части, подставляя значение 0, выраженное через /, в уравнение объекта (8.1): Г dI i A- 1 г, ,, —"— 1 *" Из этого выражения путем преобразований получают уравнение динамики линейной части системы в виде ~.?1л.а\ (8.2) где k.i — коэффициент усиления линейной части регулятора Следует отметить, что к релейным системам регулирования и управления относят не только САР, содержащие реле, но и системы, в составе которых есть звенья со статическими характеристиками релейного типа (т. е. когда выходная величина звена меняется скачкообразно при непрерывном изменении входной величины). Ранее рассматривалась система, в которой релейное управление осуществляется приводом регулирующего элемента. Однако часто встречаются нелинейные САР, в которых сам регулирующий элемент работает в релейном режиме. Типичным 219
0(t) Рис. 8.21. Принципиальная схема САР напряжения генератора постоянного тока примером двухпозиционного регулирования с релейным режимом работы регулирующего элемента является вибрационное регулирование напряжения генератора постоянного тока. Принципиальная схема такого генератора показана на рис. 8.21. Объектом регулирования здесь является генератор Г, а регулируемой переменной — напряжение V. Уравнение чувствительного элемента (электромагнита ЭМ) с учетом постоянной времени (индуктивности) можно записать следующим образом: Изменение тока Д/ создает изменение тягового усилия электромагнита ЗМ. При уменьшении этой силы пружина замыкает переключающие контакты К и выключает добавочное сопротивление /?д в цепи возбуждения ОВ генератора. Уравнение регулирующего элемента в этом случае имеет вид релейной характеристики Ar=F(A/), показанной на рис. 8.22. С учетом этих Л1 Рис. 8.22. Статическая характеристика релейного регулирующего элемента уравнений запишем дифференциальное уравнение генератора Рассмотренная система отличается простотой устройства, надежностью и большим ресурсом работы. 8.5. Метод припасовывания Одним из методов определения процесса регулирования в нелинейных САР является метод припасовывания. Рассмотрим его на примере нелинейной системы автоматической стабилизации температуры. При этом предполагается, что реле имеет такую характеристику, как на рис. 8.16, а. 220
Пусть известны начальные условия процесса,, которые характеризуют положение начальной точки искомой кривой l(t). Если \1\<Ь, то ?/=0. Уравнение (8.2) решают при этом условии до тех пор, пока не выполнится ус.юние / = 6. Когда />6, уравнение (8.2) решают при U=c и т. д. Если пренебречь малым значением произведения Т0Т\ и принять возмущение воздействия f = 0, то метод припасовывания состоит в последовательном решении следующих уравнений: d2l dl d'l dl d*I dl (Го + 7\)аР+л^ d4 dl G" + 7\) 6 и т. д. Таким образом, процесс регулирования в релейной системе может быть вычислен в результате решения различных линейных уравнений по участкам, границы между которыми определяются такими значениями тока реле, при которых / = Ь и /= —Ъ. При этом в качестве начальных условий для уравнения каждого участка берут значения переменных, полученные в конце предыдущего участка. Такой метод определения процесса регулирования получил название метода припасовывания. Картина фазовых траекторий для релейной системы может быть нанесена на фазовую плоскость. Здесь метод припасовывания рассмотрен на примере САР, содержащей электромагнитное реле для управления работой привода регулирующего элемента. Следует отметить, что для улучшения процесса регулирования в релейных системах применяют те же меры и технические средства, что и в непрерывных линейных системах. К этим средствам относятся устройства: а) последовательные корректирующие (введение производных и интегралов в закон регулирования); б) параллельные и встречно-параллельные корректирующие (введение параллельных цепей, а также жестких и гибких обратных связей); в) корректирующие по возмущению (комбинация принципа регулирования по отклонению с принципом регулирования по возмущающему воздействию). Кроме перечисленных корректирующих средств для изменения качественных показателей работы релейных САР существенное значение имеет изменение параметров релейных элементов (например, ширины зоны нечувствительности, ширины петли гистерезиса и др.). 8.6. Применение метода гармонической линеаризации для анализа устойчивости нелинейных САР Амплитуда а0 и частота соо, а также сам факт возникновения автоколебаний зависят от параметров САР. Для определения этих зависимостей следует использовать дифференциальные Уравнения системы 3-го и более высокого порядка (но иногда и 2-го порядка). Решение уравнений возможно методом припасовывания, однако получить зависимости а0 и соо от параметров систем выше 2-го порядка сложно. Поэтому применяют приближенный метод — гармонической линеаризации, который для практических целей обладает достаточной точностью и дает не- посредственные выражения требуемых зависимостей амплитуды и частоты автоколебаний от параметров системы. Его использу- 221
ют для общего анализа свойств системы регулирования, а также при выборе структуры системы и параметров во время проектирования и регулировки системы. Сущность метода гармонической линеаризации заключается в отыскании периодического решения на входе нелинейного элемента, разложении сигнала на его выходе в ряд Фурье и замене выходного сигнала его первой гармоникой. Такая замена справедлива, если САР является фильтром низких частот, эффективно подавляющим колебания высших гармоник. Основа метода — предположение о том, что автоколебания приближенно можно искать в синусоидальной форме x=asina>t. Метод гармонической линеаризации рассмотрим на примере нелинейной САР температуры (рис. 8,23,а,б). Входная величина rj_w -WJ p П \=^ PO 8 (p i OP Рис. 8.23. Нелинейная система автоматического регулирования температуры: а — функциональная схема; б — статическая характеристика реле (см. рис. 8.1, а) реле здесь обозначена через х, выходная — через у (в системе регулирования температурой они были обозначены через I я U соответственно). Характеристика реле у(х) идеальная (см. рис. 8.23,6). Если входной сигнал реле изменяется по синусоиде, то изменение выходного выражается прямоугольной зависимостью уA) (см. рис. 8.23,с). Сигнал y(t) на выходе нелинейного элемента с нечетной статической характеристикой может быть представлен в виде У У, 1 Частота Зш б МЛЛЛЛ/VW t Частота 5ш Рис. 8.24. Представление прямоугольной функции y(t) в виде суммы ряда не четных гармоник 222
суммы ряда синусоид (рис. 8.24, а—г) или нечетных гармонических составляющих (гармоник) в функции t: 1-я гармоника г/i == где Л]=4с/п; 3-я гармоника y3=Assm3(iit, где Л3=4с/3я; 5-я гармоника i/5=^5sin5to^ где Лб=4с/5я и т. д. Здесь ю = 2л;/Г — частота колебаний. Если увеличить число гармоник, то сумма синусоид ряда будет стремиться к прямоугольной зависимости. Данное представление произвольной периодической кривой в виде суммы гармонических составляющих называют разложением в ряд Фурье, а все гармоники, кроме 1-й, — высшими гармониками разложения. Сигнал x(t) на входе реле будет близок к синусоиде, если колебания с частотой ю A-я гармоника у\) с выхода реле будут хорошо воспроизводиться всеми звеньями системы — приводом, регулирующим элементом, объектом, чувствительным элементом (см. рис. 8.23). Одновременно с этим необходимо, чтобы все колебания с высшими частотами (высшие гармоники yz, у-0, ..., • • •, уг) плохо передавались через те же звенья системы, т. е. чтобы амплитуды высших гармоник при этом гасились. Это, как правило, соблюдается в реальных САР, так как их элементы являются фильтрами нижних частот. Прямоугольный сигнал y(t) в результате прохождения через все звенья системы превращается в синусоиду x(t) и, пройдя через реле x(t), преобразуется снова к прямоугольному виду и т. д. Следовательно, можно искать автоколебания для переменной x(t) в синусоидальной форме. Начальный этап приближенного определения автоколебаний з релейных системах заключается в гармонической линеаризации релейной (нелинейной) характеристики. Гармоническая линеаризация базируется на том предположении, что в разложении сигнала прямоугольной формы на выходе реле все высшие 1'ярмоники в последующих звеньях системы гасятся и во внимание не принимаются. Учитывается только 1-я гармоника. Релейную характеристику в общем случае обозначают как нелинейную функцию y=F(x). При x=asinat 1-ю гармонику ух Для однозначных (непстлевых) релейных характеристик определяют формулой 223
где А\ — коэффициент ряда Фурье: Al = —\F (a sin со*) sin о Для однозначных петлевых релейных характеристик 1-ю гармонику определяют формулой г/i =Aisinwt-\-BiCosat, причем 2г. Д = — \ F {a sin co^) sin atdat; о Bi ¦¦= — { F {a sin сог?) cos Следует отметить, что в расчетных формулах для метода гармонической линеаризации интегралы отсутствуют. Так как dx , acocos cor, то , х , 1 dx = —; cos cor = — —. a aa> dt Для однозначных релейных характеристик 1-ю гармонику определяют по формуле а для петлевых релейных характеристик использукт гкраже ние У1~~ а гаы df Зависимость у,=:{А[а)х можно пояснить следующим образом. Задана, например, однозначная релейная характеристика Obef (рис. 8.25). При этом если входной сигнал х изменяется по закону х= = asinw/, то 1-я гармоника выходного сигнала yi=A\sma)t будет такой, как если бы вместо релейной характеристики Obef была линейная Od с крутизной (т. е. с тангенсом угла наклона), равной AJa. 224
Следовательно, при определе- У нии 1-й гармоники ух периодических колебаний на выходе релей- \ ного звена с однозначной характеристикой при синусоидаль- О ном входном сигнале релейный i^ элемент можно заменить линей- S\ ным звеном уг y=qx, (8.3) имеющим коэффициент усиления Рис 8-25. гармоническая ливеари- q = A\/a, (8.4) зация релейной характеристики зависящий от амплитуды входного сигнала. В случае петлевой характеристики в том же режиме колебаний релейный элемент заменяют линейным звеном с введением производной с коэффициентами усиления Для петлевых характеристик гистерезисного типа значение <?i всегда получается отрицательным, т. е. производную в уравнение (8.5) вводят с отрицательным коэффициентом. Эта производная дает запаздывание в работе звена. Первый член уравнения (8.5) играет точно такую же роль, что и в уравнении (8.3), т. е. является идеальным линейным звеном с коэффициентом усиления q; второй член означает, что при рассмотрении 1-й гармоники на выходе звена запаздывание реле, выраженное нелинейно гистерезисной петлей, можно заменить линейным запаздыванием в виде производной от входного сигнала с отрицательным коэффициентом (q\ <0). Таким образом, ограничиваясь рассмотрением 1-й гармоники на выходе релейного звена при синусоидальном входном сигнале, нелинейное уравнение релейного звена заменяют линейным вида (8.3) или (8.5). Такую линеаризацию называют гармонической линеаризацией нелинейных характеристик потому, что она связана с разложением нелинейных колебаний на гармонические составляющие. Величины q и q{ называют гармоническими коэффициентами усиления нелинейного звена, или коэффициентами гармонической линеаризации. При обычной линеаризации нелинейную характеристику заменяют прямой линией с определенной крутизной k, которая не зависит от входной и выходной переменных х и у релейного элемента. Принципиальное отличие гармонической линеаризации состоит в следующем: а) при ней нелинейную характеристику заменяют прямой линией, крутизна которой q зависит от амплитуды входного сигнала; б) она позволяет вместо нели- 15-3591 225
нейного звена получить линейное, коэффициент усиления которого q зависит от амплитуды а входного сигнала; в) она дает возможность определять свойства нелинейных САР методами линейной теории автоматического регулирования. Гармонические коэффициенты усиления q вычисляют по формулам (8.4) и (8.6): для идеальной релейной характеристики па для характеристики с зоной нечувствительности для двухпозиционной релейной характеристики гистерезиса с петлей _4с_ -i/ й* для трехпозиционной характеристики с гистерезисной петлей и т. д, (см. например [20]). Графическая зависимость коэффициентов гармонической линеаризации от входной величины а для трех типов релейных характеристик показана на рис. 8.26. Ч irk "Я Рис. 8.26. Зависимость коэффициентов гармонической линеаризации от амплитуды колебаний на входе реле 226
Гармонический коэффициент усиления q уменьшается с увеличением амплитуды а, начиная со значения a=byr2, так как величина на выходе реле остается неизменной (у=с) при увеличении входного сигнала (х>Ь). Коэффициент q\, характеризующий запаздывание вследствие наличия гистерезисной петли, также уменьшается по модулю с увеличением амплитуды. Коэффициенты q и q\ для всех типов релейных элементов при больших амплитудах сближаются друг с другом, так как с увеличением амплитуды влияние зоны нечувствительности и гистерезисной петли на работу реле становится менее заметной. 8.7. Определение амплитуды аа, частоты а>0 и устойчивости автоколебаний Метод гармонической линеаризации позволяет решить две задачи: 1) выявить автоколебания в нелинейной САР; 2) найти параметры автоколебаний (амплитуды а0 и частоты соо). Рассмотрим их. 1-я задача. Для се решения используют различные критерии. Наиболее простым япляется следующий. Если автоколебания устойчивы и определяются амплитудой «о и частотой соо, то случайное увеличение амплитуды на Д<7 должно вызвать постепенное уменьшение амплитуды колебаний до совпадения ее с установившимся значением а0, т. е. исследуемый процесс является сходящимся. При случайном уменьшении амплитуды процесс будет расходиться и стремиться к аа. При неустойчивых автоколебаниях процесс протекает в обратном направлении. При увеличении амплитуды на Да амплитуда колебаний продолжает увеличиваться, а при уменьшении — уменьшаться. Согласно критерию устойчивости Гурвица, если характеристическое уравнение имеет все корни, расположенные в левой полуплоскости, кроме пары мнимых сопряженных корней на мнимой оси, то все определители Гурвица положительны, кроме предпоследнего Дп-1 = 0 и последнего Дп=алДп-1. Общими условиями устойчивости колебаний в системе являются: 1) при значениях а0 и (Оо, отвечающих устойчивым автоколебаниям, предпоследний определитель Гурвица Дп-1 (а0, шо)=О; 2) все определители Гурвица для характеристического уравнения замкнутой нелинейной системы после гармонической линеаризации при увеличении амплитуды а0, на Да остаются положительными; 3) все определители Гурвица для того же характеристического уравне- лч нз Рис. 8.27. Структурная схема нелинейной САР: ЛЧ — линейная часть; НЭ — нелинейный элемент ния при уменьшении амплитуды во на Да остаются положительными, кроме Дп-1 и Дп, которые становятся отрицательными. Последний критерий должен соблюдаться при малых отклонениях от значений частоты автоколебаний шо на ±Дсо. 15* 227
На рис. 8.27 показана структурная схема нелинейной САР. Для линейной ее части можно записать где W(/co) —АФХ линейной части системы. Для нелинейного элемента — )*,; xs=xlt где l(Aja)—эквивалентный комплексный коэффициент усиления, который показывает, во сколько раз 1-я гармоника на выходе нелинейного элемента больше амплитуды А синусоидального входного сигнала; 1о{А/а) — нормированный комплексный коэффициент усиления. Уравнение свободных колебаний: Приравнивая к нулю отдельно действительную и мнимую части комплексной переменной, получим два уравнения с двумя неизвестнами: частотой со и амплитудой (А/а) колебаний. Если в результате решения этих уравнений <в будут иметь действительные значения, то колебания в системе возможны. Решение может быть получено графически, для чего уравнение переписывают в виде 1 /о Годограф — NW(j<$) при изменении частоты со от —ею до -f-oo представляет собой АФЧХ линейного элемента разомкнутой системы, увеличенную в N раз; годограф Zu(Ala) при изменения амплитуды от 0 до оо — амплитудную характеристику нелинейного элемента системы (рис. 8.28). Пересечение АФЧХ и амплитудной характеристики нелинейного элемента определяет частоту и амплитуду возможных автоколебаний. JI/ Z,(A/a) Рис. 8.28. Варианты взаимного расположения на комплексной плоскости АФЧХ линейной части системы и обратной эквивалентной характеристики нелинейного элемента 228
Если характеристики не пересекаются (рис. 8.28, а), то нет действительных значений частоты шив системе не могут существовать автоколебания с конечной амплитудой. Если характеристики касаются друг друга (рис. 8,28, в), то система находится на границе устойчивости. Изменением параметров нелинейного звена можно устранить касание характеристик, т. е. подавить автоколебания в САР. Частота автоколебаний определяется по АФЧХ W(j®), а амплитуда — по обратной АФЧХ нелинейного элемента. Если характеристики пересекаются в двух точках (рис. 8.28,6), то осуществляется проверка устойчивости автоколебаний (рис. 8.29). Точка N с частотой @; соответствует неустойчивым колебаниям, а точка М с частотой <о2 — устойчивым. Если рассмотреть установившиеся колебания в точке N и увеличить их по амплитуде на 6(А/а), т. е. колебания возрастут и будут иметь амплитуду {А/а)!+б(Л/а), то, согласно амплитудно- фазовому критерию устойчивости, система оказывается неустойчивой. Точка Ni будут возрастать. При уменьшении амплитуды на б (А/а) система оказывается устойчивой. Точка Wj не охватывается АФЧХ, и колебания буДут затухать. Если в такой системе начальные колебания были меньше, чем (А/а) и то автоколебания не возникнут. Если рассмотреть точку М, соответствующую частоте Шг, то при увеличении амплитуды колебаний на б (А/а) система становится устойчивой. Точка М{ не охватывается АФЧХ, и колебания уменьшаются. При уменьшении амплитуды на б (А/а) система становится неустойчивой. Точка М2 охватывается АФЧХ, и колебания возрастают. Система переходит в режим, соответствующий точке М. Итак, если точка амплитудной характеристики, соответствующая увеличенной амплитуде (Л/а)+о" (Л/а), не охватывается АФЧХ, то рассматриваемые колебания устойчивы; в лротипном случае — неустойчивы. 2-я задача. Пусть САР описана нелинейным уравнением D(p)x+M(p)F(x, рх)==0, которое с допустимой погрешностью может быть заменено линейным уравнением Рис. 8.29. Определение периодических решений в нелинейной САР охватывается АФЧХ, и колебания Коэффициенты усиления q и Ц\ вблизи искомого периодического решения изменяются незначительно и без скачков. Характеристическое уравнение системы после гармонической линеаризации будет =0. (8.7) Подставляя в уравнение (8.7) значения р=/со, получим Коэффициенты q и Qi являются функцией амплитуды а и частоты ш. После разделения вещественной и мнимой частей имеем х(а; a; ш)=0. 229
Совместное решение уравнений х(а, ю) и у(а, ш) позволяет определить амплитуду а и частоту а»о автоколебаний, которые по физическому смыслу должны быть положителньыми и вещественными. Отрицателньые и комплексные решения свидетельствуют об отсутствии автоколебаний. 8.8. Анализ устойчивости и расчет параметров автоколебаний. Метод фазовой границы устойчивости Анализ устойчивости нелинейной САР выполняют после приведения ее структурной схемы к одноконтурной, содержащей нелинейное звено с эквивалентным комплексным коэффициентом усиления WH(an; а>), п=1, 2, 3 ... и линейную часть с АФЧХ W.(/со) = Wx (/©) W2(/со) ... Wk(/а). При наличии в системе автоколебаний необходимо найти их частоту и амплитуду. Выбор метода исследования зависит от особенности системы и целей анализа. Рассмотрим метод определения частоты и амплитуды автоколебаний, основанный на понятии фазовой границы устойчивости [3, 10]. Предположим, что разомкнутый контур системы устойчив. Тогда, в соответствии с критерием Найквиста, САР будет находиться на границе устойчивости, если WAi®)W»{an, со) = —1. (8.8) В системе могут иметь место колебания, которые в случае их устойчивости будут автоколебаниями. Из выражения (8.8) следует, что -w^h«j' (8>9) т. е. если эти частотные характеристики пересекаются, то в точке их пересечения по Wj,(/co) можно определить частоту too, а по —\/Ws(an; со) амплитуду а0 колебаний, возникающих в исследуемой системе. Устойчивость колебаний приближенно проверяют исследованием поведения нелинейной САР при малых изменениях амплитуды а^. Если при положительном приращении амплитуды (-f-Дао) колебания затухают, а при отрицательном (—Дао) расходятся, то колебания, определяемые точкой пересечения рассмотренных характеристик, будут устойчивы, т. е. имеют место автоколебания. Однако колебания в замкнутой системе расходятся, когда АФЧХ устойчивого или нейтрального-устойчивого разомкнутого контура системы охватывает на комплексной плоскости точку ¦—1; 0/. Если эта точка не охватывается АФЧХ разомкнутого контура системы, то колебания затухают. Математически условия нарастания и затухания колебаний выражают заменой равенства (8.9) неравенствами. Колебания с амплитудой аа и частотой Ша будут автоколебаниями тогда, когда АФЧХ линейной части №л(/«) системы не охватывает точку характеристики —\/W«(un, со), полученную увеличением значения аг на +Даа, а также тогда, когда охватывает точку этой характеристики, полученную уменьшением значения аа на —Даа. Точки, соответствующие значениям аа1=аа+Даа и аа2=аа—Даа, показаны на рис. 8.30. Из приведенного правила следует, что в системе не возникают колебания, если характеристика нелинейного звена —l/WH(an; <в) будет расположена вне АФЧХ линейной части №л(/о>). Если характеристика — l/WH(an; и) размещена внутри области, охваченной АФЧХ №л(/<в), то колебания будут расходящимися, т. е. нелинейная САР неустойчива в том смысле, в каком неустойчива линейная система. В этом отношении условия устойчивости гармонически линеаризованной системы можно считать даль- 230
Рис. 8.30. Определение устойчивости предельного цикла нейшим развитием амплитудно-фазового частотного критерия устойчивости линейных систем. Вместо точки —1; 0/, которую не должна охватывать АФЧХ разомкнутого контура системы, если замкнутая линейная система устойчива, для гармонически линеаризованной системы служит характери- с™к? —1/^н(ап(о), которая не должна охватываться АФЧХ линейной части №л(/оо), чтобы колебания в замкнутой системе затухали. Для анализа устойчивости нелинейных САР могут быть применены ЛАЧХ и ЛФЧХ. В этом случае, согласно соотношению (8.9), должны быть использованы два одновременно действующих условия: 1 20 ]g[Wa (/«)] = 20 lg H (an\ ш) (8.10) WH (а„; ft Соотношения (8.10) означают, что гармонически линеаризованная система находится на границе устойчивости, если при частоте ш = ша пересекаются ЛАЧХ а также пересекаются ЛФЧХ arg Wa(}a>) и arg[—l/WH(anto)] ¦ Для определения устойчивости автоколебаний, а также параметров а» и Ыа удобно использовать фазовую границу устойчивости (ФГУ). Эту границу строят следующим образом. На ЛАЧХ линейной части 201g| №л(;'ш) | системы накладывают логарифмические амплитудные характеристики 201g|—l/WH(an; со)|, полученные для нелинейного звена на некотором множестве значений амплитуды ап при п=1, 2, 3... Затем на ЛФЧХ линейной части q^ = arg W,i[j(o) наносят вычисленные при тех же значениях ап для нелинейного звена ЛФЧХ cpH = arg[— \/W«(an; to)]. Точки пересечения характеристик 201g|flP*(/w)| и 201g|-—1/WH (fln", ш) | по вертикали сносят на соответствующие по значениям ап характеристики <pH(w). Кривая, проведенная через эти точки пересечения, будет фазовой границей устойчивости. Построение ФГУ показано на рис. 8.31. В точках пересечения ФГУ с ЛФЧХ линейной части гармонически линеаризированная система находится на границе устойчивости. Частоту сь возникающих в такой системе колебаний определяют непосредственно по абсциссам этих точек, а амплитуду а„ — интерполяцией значений ап, указанных на характеристиках 20\g\—\/WH(an; ш)|. На рис. 8.32, например, значения а, определяют интерполяцией а3 и а4. Амплитуда аа может быть представлена и в относительных значениях а. 231
Lm,d6 Рис. 8.31. Построение фазовой границы устойчивости 20 10 1 2 3 * S 6 7 8910 СО Рис. 8.32 Интерполяция значений ап Для выполнения рассмотренного ранее условия существования устойчивых автоколебаний при пересечении характеристики 20lg| Ц7л(/ш) | с характеристикой 20Ig| l/WH(an; ш)|, взятой при аа+Аа3< фазовая характеристика линейной части должна быть выше ФГУ, а в точке пересечения, полученной при аа = —Лаа — ниже ФГУ, поэтому предельный цикл при частоте оь' неустойчив, а при частоте <оа — устойчив. 232
Для звеньев с типовыми нелинейными характеристиками эквивалентный •омллексный коэффициент усиления является функцией только амплитуды а„, и его определяют по соотношениям (8.10). При этом 1 ~Wa (an) 1 20 lg —i 7н (а„) = 20 lg Y\q (an)]2 + [qi («л)Ь (8-11) 1 — 180°. (8.12) Соотношения (8.11) и (8.12) показывают, что в случае типовых нелинейных характеристик для определения ФГУ на ЛАЧХ и ЛФЧХ линейной части системы достаточно нанести семейство горизонтальных прямых, параметром которых будет амплитуда ап. При однозначных нелинейных характеристиках ФГУ представляет собой отрезок прямой, лежащей на линии значений фаз, равных —я. Пример. Рассмотрим систему с нелинейной характеристикой типа насыщения (рис. 8.33). Приведенные коэффициенты гармонической линеаризации [10, 20]: о(а)=\. а<\; Г1е ^"-относительная амплитуда на входе нелинейного эЛемен1/ (^Z6.; ^величина линейного участка статической__характеристи™. Зависимость LmH от 7 [\<7<Щ, т. е. Lm.(o) =-201g9(a)=-2,2+101g a также приве- ясна на рис. 8.33. 20 16 п 8 0 У 2. / у / / / / 3 4 5 61 i III / 6 / / 97 1 0 ft Рис. 8.33. Зависимость LmH от а для статической характеристики насыщения 233
Lm,d6 Рис. 8.34. Определение влияния характеристики насыщения на устойчивость и автоколебания На рис. 8.34 показана процедура расчета нелинейных САР для трех типов Wn(ju>), когда линейная часть САР устойчива, неустойчива и условно- устойчива. Очевидно, что ФГУ совпадает с отрезком_линии ф=—я, ограниченным справа частотой среза <оСр. При увеличении а амплитудные характеристики нелинейной части перемещаются вверх, значит ФГУ необходимо заштриховать снерху [20J. Если САР без учета насыщения устойчива (ЛЧХ линейной части обозначены на рис. 8.34 как Lnbi и q)j,i), то нелинейная характеристика типа насыщения не может ухудшить степень устойчивости системы, так как фл[ не пересекает ФГУ. Если линейная часть САР неустойчива (характеристики Ътл2 и фл2), то характеристика фл2 пересекает ФГУ, переходя из заштрихованной области в нсзаштрихованную. В системе возникнут автоколебания с частотой «м соответствующей точке пересечения фЛ2 линейной части с ФГУ. Относительная амплитуда автоколебаний at= 14,5. Наконец, если линейная часть САР условно-устойчива (характеристики Ьгплз и флз), то при наличии элемента с насыщением в_САР возникнут автоколебания па частоте о>зо с очень большой амплитудой аг=40 (см. рис. 8.34). Точка пересечения ЛФЧХ с ФГУ при частоте соа3 соответствует неустойчивому предельному циклу — автоколебаний с такими параметрами в САР не существует. Контрольные вопросы 1. Дайте определение нелинейной САР. Охарактеризуйте основные методы анализа нелинейных САР. 2. В чем заключается сущность метода фазовых траекторий? 234
3. Постройте фазовую траекторию системы, содержащей одно из звеньев (их характеристики показаны на рис. 8.1) и инерционное звено. 4. Что такое устойчивый (неустойчивый) предельный цикл системы? 5. Какой режим называется автоколебательным? Какими параметрами характеризуются автоколебания? 6. В чем заключается сущность анализа нелинейных САР методом гармонической линеаризации? 7. Как определить в нелинейной системе, имеющей устойчивый предельный цикл, частоту и амплитуду автоколебаний? 8. В чем заключается сущность анализа нелинейной САР методом фазовой границы устойчивости? 9. ОСНОВЫ ТЕОРИИ ДЕТЕРМИНИРОВАННОГО ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Невозобновляемые ресурсы Земли (уголь, нефть, вода, лес и т. д.) вследствие развития техники начинают убывать. В современных теории и технике автоматического управления придают большое значение проблеме оптимального управления, решение которой указывает пути экономии этих ресурсов. К числу оптимизационных задач можно отнести минимизацию массы горючего для полета самолета или ракеты. Отношение затрат топлива, необходимого для доставки полезного груза, к массе этого груза обычно весьма велико. Поэтому определение траектории, обеспечивающей достижение заданной области пространства (т. е. цели управления) с минимальными затратами, яв- „чяется чрезвычайно актуальной проблемой теории и техники управления. Так, например, при проектировании системы управления химического или атомного реактора стремятся решить оптимизационную задачу, состоящую в получении максимальной производительности реактора. Для расчета эффективности любой системы управления существует множество решений, и проблема управления заключается в том, чтобы выбрать «наилучшую» совокупность этих решений. Однако предварительно необходимо: а) определить цель управления, выраженную целевой функцией (или критерием оптимизации), позволяющей найти количественный эффект любого решения; б) выбрать модель для анализа и определения эффективности принятого решения; в) изучить все состояния среды функционирования объекта, влияющие на прошлое, настоящее и будущее процесса управления. При решении задач оптимального управления используют идеи вариационного исчисления, принцип максимума, а также динамическое и математическое программирование. 235
9.1. Постановка задачи оптимального управления Задачу оптимального управления в общем случае можно сформулировать следующим образом (рис. 9.1). ¦~| Система услобий Уравнения 9i/Hff/YaveeKou ci/ше/гы 1 1 1 1 \u* rV i i i Eltr I x,u I Рис. 9.1. Схема задачи оптимального управления Даны: 1) цель управления, математически представленная в виде некоторого функционала или критерия управления; 2) уравнения системы (обычно в виде уравнений состояния); 3) система граничных условий в начальный и конечный моменты времени; 4) система ограничений, которым должны удовлетворять переменные состояния и управления. Требуется найти вектор управления, при котором критерий цели управления имеет экстремум (т. е. минимум или максимум). Математическая формулировка задачи оптимального управления состоит В следующем. Предположим, что управляемый динамический объект описывают системой дифференциальных уравнений: х=/(х, и, /); х(/„)=х° (9.1) на интервале времени (^о, ^к)*. При этом векторы состояния х и управления и могут изменяться лишь в некоторой допустимой области, т. е. (9.2) где X, U — заданные множества. * В выражении (9.1) и далее функции вида f(x, u, /) в общем случае являются векторными. 236
Необходимо найти такой вектор оптимального управления и*, чтобы он обеспечивал экстремум некоторого функционала (целевой функции или критерия управления): / = jj F [х (t), u (t), t] dt +FK [x (tK)], (9.3) to т. е. переводил систему из начального х(?0)=х0 в новое состояние, расположенное внутри области FK\ (xK) |^0, и удовлетворял ограничениям на векторы состояния х(/) и управления и(/), которые могут быть представлены в виде выражений (9.2) или системы неравенств: G,(x, u)>0; G2(x, u)=0. (9.4) Следует подчеркнуть, что оптимальное управление в ряде случаев может и не существовать и что обычно трудно утверждать заранее, существует ли оптимальное решение для данной конкретной задачи. Поэтому часто проще решить задачу, если это вообще возможно, и тем самым установить, что оп- шмалыюе управление существует. Кроме того, решение задачи нахождения оптимального управления, за исключением ограниченного числа случаев, может быть неоднозначным. Найдем необходимые условия для решения задачи оптимального управления. Эти условия дают локальный оптимум. Но если найдены все эти оптимумы, то оптимальное управление, соответствующее глобальному оптимуму, можно найти, выбрав среди локальных оптимумов такое управление, для которого функционал (9.3) имеет, например, наименьшее минимальное значение. Таким образом, в точке глобального оптимума управление и* минимизирует функционал /: t. 7 [x, u, t] dt + FK [x (tK), tK] (9.5) при всех uGU, для которых 9.2. Вариационное исчисление и современные задачи теории автоматического управления Оптимизация САУ возможна при определении главной цели в виде минимизируемого функционала1 или целевой функции (критерия оптимизации). ' Если каждой функции х(?), принадлежащей некоторому множеству Функций х, (х(/)СХ). отвечает некоторое число /(х(/)), то говорят, что на множестве X задан функционал. 237
Для каждого режима технологического процесса или этапа движения подвижного объекта обычно можно указать главную цель управления. Помимо этого, процессы управления должны удовлетворять ряду условий. Так, например, самолет или космический аппарат необходимо вывести в заданную точку пространства, в заданное время, с заданной точностью, израсходовав при этом минимальное количество топлива. Одна из особенностей проектирования оптимальных САУ состоит в том, что систему в ряде случаев нельзя охарактеризовать одним критерием. Поэтому процесс проектирования часто представляет собой упорядоченную последовательность оптимизационных задач и сводится к нахождению оптимального детерминированного управления. Рассмотрим задачу расчета оптимальной траектории или оптимальной программы при помощи классического вариационного исчисления. Эта задача формулируется следующим образом. Даны: 1) цель управления, представленная в виде некоторого функционала или критерия цели управления; 2) уравнения системы; 3) граничные условия в начальный и конечный моменты времени. Требуется найти вектор управления, при котором критерий цели управления имеет экстремум (т. е. минимум или максимум). Пусть управляемый объект, согласно системе (9.1), описывают на временном интервале (tu t2) векторным дифференциальным уравнением х=/(х, u, t), где x<fR"; u6Rm; (9.6) х — вектор состояния (выходные переменные, xfR"); u — вектор управления (переменные управления, ueRm); t — независимая переменная (реальное время функционирования системы). Вариационное исчисление не учитывает ограничений, кроме условий (9.6), которым должны удовлетворять переменные состояния и управления. Будем считать, что область допустимых управлений и есть множество всех ограниченных непрерывных функций u(t) из (tuh). Введем скалярный критерий качества I = \ /0 (х, u, t) dt + ф [х (t2), t2]. (9.7) Первое слагаемое в выражении (9.7), характеризующее качество управления на всем интервале (tu t2), называется интегральной составляющей. Второе слагаемое характеризует точность в конечный (терминальный) момент времени t2. Функция fo(x, u, /), ф[х(^2), Ы являются действительными и называются подынтегральной и терминальной частями функционала /. 238
Задача оптимального управления — отыскание такого детерминированного управления u(t), чтобы функционал / достигал, например, минимального значения. Конкретизация выражений f(x, u, t), fo(x, u, t) и cp[x(rf2) t2], входящих в (9.6) и (9.7), порождает различные типы задач синтеза управления. Функционал вида (9.7) можно назвать классическим, так как он используется в классических задачах вариационного исчисления, а именно: 1) в задаче Лагранжа — подынтегральная и терминальная части выражения (9.7): /о(х, и, *)*0; Ф[х(*2), /2]=0; (9.8) 2) в задаче Майера: /о(х, и, 0=0; <р[х(*2), /2]#0; (9.9) 3) в задаче Больца: fo(x, u, 0*0;<p[x(*2),/2]?=0. (9.10) Кроме перечисленных особый интерес представляет и задача на максимальное быстродействие технической системы. Задача Лагранжа. Рассмотрим сначала интегральный функционал вида I=[fo(x,u,t)dt, (9.11) t\ который является частным случаем критерия (9.7) при выполнении условий (9.8). Задача управления по минимуму критерия (9.7) связана с оптимизацией САУ по отношению к некоторому интегралу типа (9.11). В очень многих процессах управления, встречающихся на практике, отклонения выходной переменной от некоторого требуемого значения являются нежелательными. В одних случаях вычисляют среднее значение этого отклонения или интеграл (9.11), представляющий собой, например, прибыль; в других случаях эффект усредняют таким образом, чтобы получить представление об ухудшении качества продукции (убыток). Иными словами, особый интерес представляет среднее отклонение в течение определенного интервала времени, поэтому задача системы управления состоит в том, чтобы обеспечить минимум интеграла этого изменения в течение заданного интервала времени. Задачу о минимуме функционала (9.11) традиционно называют задачей Лагранжа. Задача Майера. В этом случае, согласно условиям (9.9), минимизируемым является функционал, определяемый только терминальной частью (9.7), т. е. /=ф[х(/2), t2]=min. 239
Например, для системы управления ЛА, описываемой уравнением х=/0(х, u, t), можно поставить следующую задачу — задачу Майера: определить управление u(t), ti^t^t2 так, чтобы за заданное время полета достичь максимальной дальности при условии, что в конечный момент /2 ЛА совершит посадку, т. е. x(t2)—0. Задачу Майера можно интерпретировать как задачу управления по минимуму времени переходного процесса, или как задачу перевода объекта (процесса) из заданного начального состояния хA в желаемое конечное х,2 за минимальное время, что обеспечивается вектором допустимого управления и(/). Проектирование систем управления конечным состоянием основано на том положении, что если даны начальные условия для системы, описываемой дифференциальными уравнениями, то при отсутствии возмущений можно предсказать ее поведение в будущем. Желаемое конечное состояние достигается непрерывным управлением и прогнозом конечных условий. Таким образом, желаемые конечные значения выходных переменных в системе приводят к требуемым значениям, если даже имеются возмущения. Принцип, управления конечным состоянием применяют при проектировании, например, систем посадки самолетов, управляемых ракет и т. д. В системе посадки самолета прогнозируют и доводят до желаемых значений скорость снижения и высоту в определенный момент времени, соответствующий моменту посадки. Задачу управления конечным состоянием можно сформулировать как задачу определения такого вектора допустимого управления и, при котором за данный интервал времени Т система переходит из начального (хь ^) в такое состояние, при котором одна (или некоторая совокупность) переменная состояний принимает возможно большее или возможно меньшее значения, а остальные переменные состояния имеют фиксированные значения в физических допустимых пределах. Иначе говоря, систему управления конечным состоянием проектируют таким образом, чтобы она имела желаемую реакцию только в один-единственный момент времени, а в остальные моменты ее реакция может быть произвольной в физически допустимых пределах. Задача Больца. Сводится к задаче минимизации критерия вида (9.7) при условиях (9.10). Можно показать, что задача Больца приводится к задаче Майера [6]. Задача на максимальное быстродействие. Данную вариационную задачу не относят к числу классических. Термином «вариационные» объединяют такие задачи, в которых минимизируемым функционалом является время, т. е. (9.12) при /0(х, и, /) = 1, ф[х(*2), ^]=0. Предположим, что концы фазовой траектории управляемого объекта фиксированы. Тогда задачу на быстродействие формулируют следующим образом: определить управление u(t), которое переводит объект из состояния Xi в состояние хг за минимальное время. 240
9.3. Типовая вариационная задача оптимального управления Приведем для примера одну из типовых задач оптимального управления, решаемую с использованием принципа вариационного исчисления, — задачу со свободным правым концом и заданным временем переходного процесса. Пусть заданы объект управления x(t)=f(x, и, t), начальные условия x(^i), время окончания переходного процесса t% и функционал качества в форме (9.3), т. е. t. /=-jJ/0(x, u, t)dt + <f\x(t2),t2\. <i Образуют вспомогательный критерий качества / прибавлением к (9.7) системы дифференциальных уравнений (9.6) с некоторыми множителями, совокупность которых представляют вектором Я(/)=[М0 .. -K(t)]T: (9.13) где Т — знак транспонирования; h(t)—множители Лагранжа (причем Ktity^O для всех f=l; n и являются дифференцируемыми по t). Введем скалярную функцию Я(х, и, к, t), называемую функцией Гамильтона, или гамильтонианом: Н(х, и, X, /)=/0(х, u, t)+V(t)f(x, u, *), (9.14) где функции /0(х, u, t) и f(x, u, t) —функции, определяемые из выражений (9.7) и (9.6) соответственно. Интегрируя по частям второе слагаемое в правой части критерия (9.13) и учитывая (9.14), получим 7=Ф [х (ta), t2] + J [Я (х, u, X, t) - Xr (t) x (t)] dt = = Ф [x (t2), t2] + { [H (x, u, X, t) + XT (t) x (t)] dt - Пусть u(t)—вектор оптимального управления, который обеспечивает минимум функционала / ,(или /), а х(^)—оптимальное решение, т. е. реакция системы х(?)=/(х, u, t) на воздействие оптимального управления и(*)._ Рассмотрим вариацию б/ функционала /, соответствующую вариациям векторов n(t) и x(t), имея в виду, что вариации б(^) 16—3591 241
не должны менять закрепленной начальной точки x(?i) т. е. 6х(/,)=0; Jx-x(/2) J (9.15) Вариации бх и би в выражении (9.15) представляют собой отклонение вектора состояния х от опорного, а вектора управления и от программного соответственно; частные производные определяются векторами: Г дН ~1 г дН ~1 дх ду дН{.) дх дН дН .дит _ где п—размерность вектора х (порядок уравнения объекта); т — размерность вектора и. Найдем необходимые условия экстремума функционала (9.15), т. е. 61=0, при произвольных стремящихся к нулю вариаций 6и(?) и бх(/) относительно оптимального вектора управления и соответствующей ему траектории. Для того чтобы исключить влияние вариаций 6х(?), вызываемых отклонением по управлению би(/) на вариации вспомогательного критерия б/, выберем множитель %{t) таким образом, чтобы коэффициенты при бх(/) и бх(^2) в уравнении (9.15) обратились в нуль. Необходимые условия экстремума будут выполнены, если i=\, ..., п; (9.16) (9-17) - = 0; ?=1 щ. Так как уравнение объекта х=/(х, u, t), то и вариация б/=0, т. е. будет выполнено необходимое условие экстремума требуемого функционала Р. Таким образом, для нахождения оптимального управления необходимо решение системы, состоящей из уравнений (9.6), (9.16) и (9.17), т. е. 2 Приведенные выкладки не обладают необходимой математической строгостью, чтобы рассматривать их как доказательство необходимых условий решения вариационной задачи. 242
= 0 (9.18) ди при граничных условиях v z/ OX t = 12 Из гамильтониана (9.14) следует, что частная производная dH/dk,=ft{\u и, 0, а функции Xi(t) при i==l, .. ., п традиционно обозначают через i|5;@- Поэтому систему из 2п уравнений (9.18) обычно записывают в следующем виде: Для того чтобы критерий / достигал локального минимума, недостаточно выполнения третьего условия системы (9.19); необходимо также, чтобы вторая производная функционала / при решениях системы (9.19) была неотрицательна для всех значений 6и(/), т. е. Таким образом, решение задачи оптимального управления сводится к решению нелинейной системы уравнений 2 п-го порядка (9.19), причем для вектора состояний х(/) заданы условия в начале интервала {t\, /2), т. е. в точке to, а для сопряженного вектора ${t) заданы условия на конце интервала (*о, t&), г. е. в точке ty. Такого рода задачи называют двухточечными краевыми. Сложность решения вариационной задачи в форме системы (9.19) заключается именно в том, что граничные условия для векторов х(^) и ty(t) заданы на различных концах. Поэтому такие задачи решают при помощи численных методов. В случае линейной задачи с квадратичным критерием, рассмотренным в подразделе 9.5, эти трудности в значительной мере снимаются. Задача сводится к решению уравнения Рикка- ти (9.32) по заданным условиям на конце интервала t=tk и получению оптимального закона регулирования (9.36), справедливого для любых начальных условий. Для решения нелинейных двухточечных краевых задач обычно применяют ту или иную итеративную процедуру, основанную на выборе некоторого более или менее произвольного решения, которое должно удовлетворять сле- 16* 243
дующим условиям: уравнениям состояния; сопряженным уравнениям; ограничениям как на управление, так и на состояние; граничным условиям. Это исходное решение, обычно не удовлетворяющее перечисленным условиям, затем используют для улучшения результатов, т. е. для получения следующего решения, более близкого удовлетворению необходимых условий оптимальности, и т. д. (т. е. до тех пор, пока не будет получено решение, удовлетворяющее им с требуемой степенью точности). 9.4. Приведение задачи оптимального управления к уравнению Гамильтона—Якоби Предположим, что функции F и Fk, входящие в функционал (9.3) или (9.5), являются гладкими, т. е. непрерывными и дифференцируемыми функциями. Пусть I*[x(t), t]= min f[x(t), up), t]. (9.20) В уравнении (9.20) левая часть не содержит и(/). Действительно, если оптимальное управление найдено с учетом ограничений (9.4), то минимум функционала (9.3), т. е. I*[x(t), t], уже от него не зависит. Имеем О 'к  F(x,u,x)dT-+\ F (х, и, x)dx+FK[x(tK), tK]\, /; J или, учитывая формулу (9.20), I*[x(t), t]=min \(f(x, u, x)dx+I*[x{t,), tx]\. (9.21) Пусть tl = t-}-At, тогда, разлагая правую часть (9.21) вряд Тейлора, получим I*[x(t),t] = min откуда при Д?->0, найдем [^]T } (9-22) Обозначим через и* управление, минимизирующее правую часть (9.22), тогда ~=--F\x, и*. *]+[*?-]*/<х. и. t). (9.23) Граничное условие для уравнения (9.3) имеет зид /*[хD),/к]=^[х(^)]. Уравнение (9.23) называется уравнением Гамильтона—Якоби. 2«
9.5. Квадратичный критерий качества. Линейный объект Рассмотрим теперь задачу оптимального управления для частного случая линейного объекта и квадратичного критерия, которую часто называют задачей аналитического конструирования оптимальных регуляторов (АКОР). Пусть уравнения объекта имеют вид (рис. 9.2): Aft) —+Q^—*. f Рис. 9.2. Структурная схема оптимальной системы, реализующей квадратичный критерий (f), x(fo)=xo, (9.24) где x(t)—л-мерный вектор состояния; и(^)—m-мерный вектор управления; А(/)—непрерывная матрица [пХп]; B{t)—непрерывная матрица [пХт]. Критерий качества регулирования 1(<k)Fbx(*k), (9.25) где Q(t) — симметричная, неотрицательно определенная весовая матрица [nXn]; R(t)—симметричная положительно определенная3 матрица [тХт]; F& — неотрицательно определенная матрица [пХп]7. Требуется: найти вектор управления и, при котором функцио» нал (9.25) имеет минимум; определить значение /*=min/. U Смысл этого квадратичного функционала следующим образом: выражение л. xTQxdt его можно пояснить является мерой нормы ||х|| вектора x(t), т. е. мерой колебательности в процессе регулирования; выражение 3 Квадратичную матрицу М называют положительно (неотрицательно) определенной, если скалярная величина uTMu положительна (неотрицательна) для всех значений вектора и, отличающихся от нуля. 245
является мерой количества энергии, используемой для управления; выражение xkTFkxk характеризует норму НхкЦ вектора х(/), т. е. отклонение от установившегося значения на конце интервала регулирования. В некоторых задачах нужно стремиться к тому, чтобы все эти три значения были возможно меньшими. Поэтому задача оптимального регулирования состоит в минимизации функционала (9.25). Предположим, что, в соответствии с критерием (9.25), являющимся квадратичной формой, выражение для /*[х(^), t] также можно представить в виде квадратичной формы /*[х@, /]=хт@Р@х@, (9-26) где Р@ —симметричная матрица. Сравнивая уравнение (9.25) с (9.3) и уравнение (9.1) с (9.24)t легко видеть, что в рассматриваемом случае Г(х, и, /)=uTRu+xTQx; (9.27) f(x, u, f)=A@x+B@u. (9.28) Согласно выражению (9.26), (9.29) dI*/dt=xrPx, (9.30) Подставляя выражения (9.27) — (9.30) в уравнение (9.22), получим xTPx=min[uTRu+xTQx+2TPAx+2xTPBuJ. (9.31) то Последнее выражение можно преобразовать в виду xTPx=-min[(u+R~I3TPx)TR(u U (Q-PBR-'BT Если матрица R является положительно определенной, то выражение (9.31) имеет минимум при т. е. когда выражения в первых двух скобках в формуле (9.31) обращаются в нуль. Но тогда хтрх=—xT(Q—PBR-»BTP+PA+ATP)x. Полученное уравнение справедливо для всех х(/), поэтому —Р(О = РА+АТР—PBR-'BTP+Q. (9.32) Уравнение (9.32) является матричным нелинейным дифференциальным уравнением Риккати. Граничные условия можно опре- 246
делить из следующих соображений. Согласно выражению (9.25), полагая в нем ^о=^к, получим I*[x(tk), h]=x*(t)Fkx(tk), откуда, учитывая формулу (9.26), найдем следовательно, исли Fk = 0, то Согласно (9.26), оптимальное значение /* критерия (9.25) l*[x(t0), t]=x7(to)P(to)x(to). (9.33) Выражения (9.32) и (9.33) остаются справедливыми для любого начального значения t, т. е. u*@=-R-'@BT@P@x@ (9.34) /*[х@, /о]=хт(ОР(Ох(О- (9.35) Формулы (9.34) и (9.35) представляют собой решение поставленной задачи оптимизации. Равенство (9.34) можно переписать в следующем виде: u*@ = K@x@, (9.36) где Анализ выражения (9.36) позволяет сделать следующие выводы: 1) закон регулирования (9.36) приводит к структурной схеме с ОС, так как вектор управления непосредственно зависит от вектора состояния х(/); 2) закон регулирования (9.36) является «кинематическим», а не «динамическим», так как в нем не содержатся производные или интегралы от х; 3) закон регулирования (9.36) даже в случае объекта и критерия с постоянными параметрами содержит матрицу K(t), зависящую от времени. Следовательно, замкнутая система регулирования является системой с переменными параметрами; 4) основные трудности задачи оптимизации — необходимость решения матричного уравнения Риккати и выбор весовых матриц Q и R; 5) решение характеризует свободные колебания системы. Заметим, что решение задачи оптимизации ранее было получено в предположении, что внешние задающие (или управляющие) воздействия отсутствуют. Рассмотрим задачу оптимального регулирования для случая, когда интервал оптимизации T=tk—to бесконечен. Эта задача имеет решение только в том случае, если система полностью управляема: 247
u*(/)=-R-»@BT@P@x(O. где P(t)—так называемое установившееся решение уравнения Риккати (9.33) при граничном условии Р(^ Т) Пример. Поясним приведенные результаты на следующей задаче. Даны линейный объект 2-го порядка „ d%y л. dy j_ (Q-*7\ а2 ~77г +ei TJ + аау=и, (9.37) и критерий оптимизации вида Т где г — коэффициент. Найти вектор оптимального управления u*Opt(/). Введем переменные состояния Х\ = yt X2=== Х\ = у. Уравнение (9.37) перепишем в виде (9.38) Из выражений (9.28) и (9.38) следует, что А = Матричное уравнение Риккати (9.32) принимает вид Г °а 1л B_rjl I — — I I — I «1 + iJ" 0-g VPli Pl2~\ LPl2 Pit] ИЛИ Pu Pu —r- P\iPvi. Pl2jP82 P22 (9.39) Сравнивая левую и правую части равенства (9.39), получи 2 P 248
Оптимальное управление будет описываться, согласно формула (9.34) выражением (O=-r-' i о -J [рн рк\ [ .] = -—,-_ j, •Vt На рис. 9.3 приведены кривые, полученные в результате решения уравнений на ЭВМ при а0—щ—«2=1; г=1. При этом видно, что по мере увеличения I функции рц. Pi2. P22 стремятся к установившимся постоянным зна- Рис. 9.3. Кривые p(t) чениям и для достаточно больших t дифференциальные уравнения для Р\г, Ргг сводятся к алгебраическим уравнениям: 0-2Л1-2 ?,„_. Р22 Но полученные уравнения нелинейны, и непосредственное решение их затруднительно. Поэтому их решение удобнее находить, наблюдая дифференциальные уравнения для переменных рп, pi2, p22 на математической модели, а также наблюдая, к каким установившимся значениям они стремятся при достаточно больших значениях времени t. Для рассматриваемого случая р„(оо)=0,91; р12(оо)=0,41; р22(°°) =0,35. Найдем условия, при которых матрица К коэффициентов усиления в законе регулирования (9.36) не зависела от времени. Для этого необходимо, чтобы решение Р уравнения (9.32) удовлетворяло условию Р = 0 и чтобы все матрицы в правой части уравнения Риккати (9.32) не зависели от времени. 249
В этом случае установившееся решение Р является решением нелинейного алгебраического уравнения РА+АТР—PBR-'BTP+Q=0. Таким образом, матрица К не зависит от времени только в том случае, если оптимизацию проводят на бесконечном интервале, объект регулирования стационарен и весовые матрицы R и Q, входящие в критерий (9.25), не зависят от времени. Для этих условий можно сформулировать критерий устойчивости замкнутой оптимальной системы регулирования. Уравнения для такой системы легко получить подстановкой закона (9.34) в уравнение (9.24): х=(А—BR-'BTP)x, и критерий устойчивости заключается в следующем. Замкнутая система регулирования асимптотически устойчива, если пара [A, D] полностью наблюдаема, где D — любая матрица, удовлетворяющая условию DDT = Q, а квадратичная форма хтРх является функцией Ляпунова. 9.6. Оптимальные ПИ-регуляторы В подразделе 9.2 был дан метод расчета линейных оптимальных регуляторов с обратной связью по вектору состояния. Такие регуляторы позволяют свести к нулю с течением времени влияние на выход объекта ненулевых начальных условий или кратковременных импульсных воздействий. Однако в случае постоянных или медленно изменяющихся входных воздействий такие регуляторы не могут обеспечить равенство нулю отклонений регулируемых величин от заданных значений. Для того чтобы они удовлетворяли такому требованию, закон регулирования должен содержать не одну, а две составляющие, одна из которых зависит от вектора состояния, а другая — от интеграла вектора состояния. Такие регуляторы называют пропорционально-интегральными, или ПИ-регуляторами. Рассмотрим следующую задачу. Предположим, что задан линейный динамический объект с постоянными параметрами, описываемый уравнениями х = Ах+Ви, х(/0)=х°. (9.40) причем критерий качества регулирования имеет вид / [х (t0), u, g = J (uTRu -f uTSu + xTQx) dt, (9.41) и где S — положительно определенная; R и Q — неотрицательно определенные симметричные матрицы. Предположим, что начальное значение управления и(^0) = =и° задано. Необходимо найти управление и*, минимизирующее этот критерий. Введем новые переменные 250
z === v=u и новые матрицы д ГА В1 «ГО] R_s о =-[Q °1 Б новых переменных уравнение (9.40) и критерий (9.41) соответственно примут вид z=A,z±B,v, z(*0)=z°; (9.42) 't. (9.43) На рис. 9.4 показана система, описываемая уравнениями (9.42). Применим в этой системе теорию оптимального регули- | I Ряс. 9.4. Структурная схема ПИ-регулятора рования, предварительно проверив условия управляемости и наблюдаемости. В результате получим схему регулирования (рис. 9.5). Эта схема с безынерционным регулятором может LLP ±г Рис. 9.Б. Преобразованная схема ПИ-регулятора ОР — объект регулирования; БР — блок регуляторов 251
OP S *; Рис. 9.6. Схема системы, состоящей из объекта регулирования и линейного динамического регулятора быть преобразована в схему, показанную на рис. 9.6, состоящую из первоначального объекта регулирования ОР, описываемого уравнением (9.40), и линейно динамического регулятора Р. Далее будет показано, что эту схему можно также преобразовать к виду, показанному на рис. 9.7, где регулятор осуществляет обратную связь по вектору состояния и интегралу от вектора состояния (регулятор типа ПИ). То, что эти регуляторы являются искомыми оптимальными, будет ясно из дальнейшего изложения. Г" 1 1 ! У 1 РО ' Г " if 3 < 1 1 I 1  I 1 1 Рис. 9.7. САР с оптимальным ПИ-регулятором 252
Итак, найдем минимум функционала (9.43) при условии (9.42). Предварительно заметим, что для существования закона регулирования и конечности функционала (9.43), а также для асимптотической устойчивости замкнутой системы необходимо принять два дополнительных допущения: пара [А,, В,] полностью управляема; пара {.А1; Dj] полностью наблюдаема для любой DJ, удовлетворяющей условию D1D1T=Q1. При выполнении этих допущений можно использовать результаты, полученные ранее, согласно которым оптимальный закон регулирования имеет вид v*=—Rr' Здесь P = llmP (t, T) = \imP (t, T). Причем Р есть решение уравнения Риккати: _Р=РА,+А,ТЕ- PB^r'B^P+Q, Р(Г, Г)=0. Первое предположение обеспечивает существование Р, а второе определяет асимптотическую устойчивость замкнутой системы z=(A1-B1R-1B1TP)z. Можно показать, что оба предположения эквивалентны допущениям, которые ранее делались для уравнений (9.40), (9.42), и что оптимальные значения показателей качества регулирования, согласно уравнениям (9.41) и (9.43), одинаковы. Перейдем теперь к интерпретации результатов минимизации расширенной системы, для того чтобы получить решение задачи минимизации для первоначальной системы. Как это было замечено ранее, оптимальное управление и* для модифицированной проблемы регулирования удовлетворяет равенству ii=v при u*(to)=^u(to). Минимальное значение /* одинаково для обеих задач: Оптимальное управление и* и минимальное значение /* можно выразить через параметры модифицированной задачи следующим образом. Пусть .РЯ P22J Оптимальное регулирование 253
u=v*. u*(/0)=u° определяют выражением *-™—стаж- = -S-'P21x-S-ip22u*, т. е. оптимальное регулирование и* имеет вид ii* = KiTx+K2Tu* и u*(/0)=u°. (9.44) Здесь KT=_S-'P22. Минимальное значение показателя качества /: / [х (g, u <д. д=/* [z (g, *c]=zT (gPz(g= =- ит (д р22и (д. Необходимо заметить, что при и(^0)=0 /*=хт(^о)Рпх(М. Матрицы Ри, P2i, Р22, входящие в оптимальный закон регулирования и в минимальное значение /, можно найти как пределы Ри, Р21 и Р22 при t-уоо, причем -P11 = PliA+ATP11-P21TS-'P21-fQ; PflG-)=0; -?,^-1?,,; Р21(Г)=0; T-P22S-'P22+R; Р(Г)=0. Итак, получено решение задачи оптимального регулирования при наличии производной и от регулирующего воздействия и. Полученным результатам можно придать несколько другую форму, свидетельствующую о том, что регулятор действительно являтся ПИ-регулято- ром. Согласно уравнению (9.40), u = B-I(x—Ax) = (BTB)-1BT(x—Ах). Полагая, что ВТВ положительно определена, уравнение (9.44) перепишем в следующем виде: u* = K3Ti+K4Tx; u*.(*0)=u°. (9.45) Здесь Кзт = К2т(ВтВ)-1Вт; К4Т=К,Т-К3ТА. Интегрируя уравнение (9.45), получим t u*(t =Kj\(t -bjK4Tx(t dx + u(t0) — Kfx(to). (9.46) U 254
Из уравнения (9.46) видно, что оптимальное регулирование реализовано в ниде ПИ-рсгулятора. Таким образом, схема оптимального регулятора имеет вид, показанный на рис. 9.7 или рис. 9.8. Рассматривая расширенную систему (9.42) как первоначальную и применяя ту же процедуру, можно получить решение задачи оптимального регулирования при наличии вторых производных от управления и. 9.7. Понятие о принципе максимума Принцип максимума может рассматриваться как обобщение классического вариационного исчисления на случай, когда управляющие воздействия u(Z) принадлежат к замкнутому множеству, т. е. их значения ограничены определенными пределами, что всегда имеет место на практике. Принцип максимума дает изящный способ решения задачи детерминированного оптимального управления. Он позволяет только в общем случае найти необходимые условия оптимума, а в отдельных случаях — необходимые и достаточные условия, как например в задачах с квадратичным критерием и линейными уравнениями объекта. Однако использование этого принципа, так же как и вариационных методов, затруднено решением двухточечных краевых задач. Кроме того, он не позволяет определить оптимальное управление как функцию и(х) переменных состояния и поэтому остается открытым вопрос о реализации системы управления как замкнутой системы с обратной связью. Принцип максимума Понтрягина. Ранее была рассмотрена задача Лагранжа и сформулировано необходимое условие оптимальности. Оно состоит в том, что оптимальное управление должно быть стационарной точкой функции Гамильтона (9.14), т. е. удовлетворять векторному уравнению д" 0. аи Основное предположение, сделанное при решении задачи Лагранжа, состояло в том, что управление может принадлежать всему пространству U, т. е. на управление не налагалось никаких ограничений. В практических задачах, однако, необходимые условия, определенные ранее, естественно, не пригодны. Согласно теореме Понтрягина, получившей название «принцип максимума», оптимальное управление должно обеспечивать функции Гамильтона максимальное значение. Введем понятие допустимого управления. Вектор управления будет допустимым, если каждая его компонента Ui(t), 1=1,2,... ,т является ограниченной кусочно-непрерывной функцией, такой, что u(t)GU для всех t, tt^t^t2. Начальный момент времени ti предполагают фиксированным, а конечный tz может быть как фиксированным, так и нефиксированным. 1'55
Чтобы проиллюстрировать понятие допустимого управления, рассмотрим систему с двумя управляющими входами Ui(t) и ib@, на которые наложено ограничение где Мй — некоторая положительная константа. Множество U, т. е. ии и2 щ, состоит из внутренней части и границы круга радиусом Мо (рис. 9.8). В данном случае управляющий вектор на плоскости и,, «2 может иметь любое направление, но его значение ограничено Mq. Таким образом, управление и(^) как функцию времени t будем искать в классе кусочно-непрерывных функций. Единственное затруднение, которое возникает по сравнению. с задачей Лагранжа, заключается в появлении нового условия допустимости управлений. В связи с этим допустимые вариации управления должны удовлетво- рять уравнению Рис. 9.8. Область допустимого управления u=u+6u uGU (9.47) т. е. вариации управления не могут быть произвольными, они должны удовлетворять заданным ограничениям. Если х, и реализуют минимум /(х,и), то необходимо, чтобы вариации (9.15) функционала (9.7) были неотрицательны б/(х, и, бх, би)>0 для любых допустимых вариаций бх, би. Постановка задачи. Сформулируем задачу оптимального управления в виде, удобном для последующего изложения принципа максимума и его приложений, а также уточним ряд понятий и определений. Пусть состояние управляемой системы характеризуется «-мерным вектором состояния х(^). Целенаправленное воздействие на процесс можно осуществлять с помощью т-мерного вектора управления и(/). На векторы управления и состояния могут накладываться ограничения: u(/)€U,x(/)eX, где U и X — области допустимых управлений и состояний соответственно. Будем считать допустимыми управляющими воздействиями кусочно-непрерывные функции на отрезке управления \tu t2] с точками разрыва первого рода. Между u(t) и x(t) существует 256
зависимость, записываемая в виде системы дифференциальны* уравнений ?? = А(х,и), /=1,2 п, (9.48) где Xi — i-я координата (переменная) вектора состояния. Заданы граничные условия: начальное состояние управляемой системы x(?0)=x° и конечное состояние x{tn)=xK в m-мсрном фазовом пространстве. Момент времени t2 полагаем не зафиксированным, а характеризующим только момент перехода в конечное состояние х". Цель управления описывают функционалом (9.7) при равенстве нулю терминальной части, т. е. '? I = [fc(x,u,t)dt. (9.49) /, Теперь постановку задачи оптимального управления можно сформулировать следующим образом. В n-мерном фазовом пространстве XGR" даны две точки х, и х2. Среди всех допустимых управлений, для которых фазовая траектория, исходя в момент t0 из точки х,, приходит в точку х2 в U, найти такое управление, при котором функционал 1 типа уравнения (9.49) принимает наименьшее возможное значение (о минимуме функционала речь идет только для определенности). Такое управление называют оптимальным, а соответствующую ему фазовую траекторию — тоже оптимальной. Постановку задачи можно видоизменить, введя в рассмотрение еще одну координату вектора состояния, характеризующую текущее значение функционала: ^0{x,n,t)dt (9.50) Дифференцируя уравнение (9.50), получаем уравнение относительно новой координаты вектора состояния §° = Л(х. о) (9-51) с граничными условиями xo(ti)=O, xo(t2)=I. (9.52) Теперь речь будет идти о (гс+1) -мерном фазовом пространстве (для пространства состояния сохраним обозначение XeR"+1). Приведем новую постановку задачи, эквивалентную предыдущей 16]. В (п+1)-мерном пространстве X заданы: точка с координатами @, х,) и прямая Я, проходящая параллельно оси х0 через точку с координатами @, х2). Среди всех допустимых управлений, для которых соответствующая фазовая траек- 17-3591 257
тория, исходящая в момент времени из точки @, Xi), пересечет прямую П, найти управление и(/), обеспечивающее наименьшее возможное значение координаты пересечения прямой Я вдоль оси х„. Постановка задачи геометрически интерпретирована для случая рис. 9.9. (О,*') Рис. 9.9. Постановка задачи оптимального управления Основная теорема—-принцип максимума. Кроме основной системы уравнений (9.48) и (9.51) с граничными условиями (9.52) = 0, 1,2, ...,я, (9.53) введем в рассмотрение дополнительную систему дифференциальных уравнений относительно вспомогательной вектор- функции <$г: «¦ (9.54) Целесообразно записать уравнения (9.53), (9.54) в более удобной форме. Для этого введем функцию Гамильтона в следующем виде: (X, ф, U) (9.55) Системы уравнений (9.53) и (9.54) теперь можно объединить записью в форме так называемой системы Гамильтона (канонических уравнений Гамильтона): dxi дН dtyi дН ; г\ л п „ /q са\ 258
где i^T — элемент функции ^т=(ф0, tyi, ..., г|)„)т размерности п+1; Т — знак транспонирования в уравнении (9.55). Из системы канонических уравнений (9.56) следует, что функция Гамильтона есть непрерывная функция 2(п-\-\)-\-т переменных х0, хи ..., хп; -ф0, у>„..., tyn; щ,..., ит. При фиксированных х и ij) функция Гамильтона Н есть функция только управления и и времени /. Система Гамильтона (9.56) обладает интерсным свойством: частная производная от функции Н по переменной г|5< равна скорости изменения переменной х{, а частная производная от функции Н по переменной Хг— скорости изменения переменной Tjjj. Обозначим через М(х,-ф) максимальное значение (точную верхнюю грань) функции Гамильтона Н: М(х, H>)=suptf(x, ^ и). (9.57) Формулировка основной теоремы. Пусть вектор u(t) на отрезке (t0, ti) —допустимое управление, удовлетворяющее условию задачи. Тогда для оптимальности управления и(/) необходимо, чтобы существовала ненулевая вектор-функция tp(O> такая, что: 1) для всех t на отрезке (tu t2) функция Гамильтона как функция u, u6U достигала максимума, определяемого выражением (9.57): (9-58) 2) в конечный момент времени t=tz выполнялись соотношения M[x(t2), y(t2)]=0. (9.59) Ввиду важности п. 1 теорема названа принципом максимума. Подчеркнем, что этот принцип в общем случае дает необходимые условия для определения оптимального управления "(О- Таким образом, имеет 2(n+l)+m соотношений (9.53), (9.54) и (9.58) (т соотношений дает п. 1 принципа максимума) между 2{п-{-\)+т координатами векторов x(f), $(t) и u(f). Так как т соотношений — недифференциальные, то решение систем (9.53), (9.54) и (9.58) зависит от 2(п+1) неизвестных параметров; кроме того, t%>tx (или U—U=T) является параметром. Один из параметров несущественен, так как ip(f) определяется с точностью до общего множителя в силу однородности Я относительно if. Итак, для нахождения 2(п.-И) параметров имеем 2(п+1) граничных условий на функцию х(^) и уравнение (9.59). Применение принципа максимума для синтеза системы, оптимальной по быстродействию. Линейное оптимальное быстродействие. Важным для технических приложений является класс 17* 259
задач на оптимальное быстродействие: требуется найти управление и@, переводящее точку в фазовом пространстве из состояния k в момент ti в состояние k' за минимальное время. Поэтому функционал (9.7) в данном случае I=^dt = t2~tv /0[x,u] = l. Функция Гамильтона принимает вид Я (х, <М) = 2 где Я, (х, 4», и) = 2 /у (х. и) ф/, ^ — неположительная постоянная, полученная на основании п. 2 принципа максимума. Значение -ф0 влияет не на и(^), а только на значение максимума. В случае принципа максимума при нахождении оптимального быстродействия имеем функции #,(х, ¦$, и) и М(х, \|з)и)=тахЯ1(х, if, и); поэтому равенства (9.58) и (9.59) основной теоремы представим соответственно в виде: Сформулируем задачу на линейное оптимальное быстродействие. Применим принцип максимума для нахождения оптимального быстродействия САР, которую описывают системой линейных дифференциальных уравнений с постоянными коэффициентами: 2 / 2 ЬФ1 (* = 1.2.....«)• С9-60 /-1 7=1 Полагаем, что управляющие воздействия подчинены ограничениям вида |Uj@I<Mj. M;>0, /=1, 2, ... т. (9.61) Требуется минимизировать время перехода системы (9.60) из состояния х° в х1, т. е. Составим функцию Гамильтона п п т я, (х, ф, и)=2 /**'=2*« 2 260
Изменим порядок суммирования во второй группе слагаемых в (9.62): «/ 2 ъьц- (9.63) ] / На основании принципа максимума вектор-функцию и(^) следует искать, исходя из максимума Я(х, if (и)) относительно и@, для всех t из (f0, /i) при учете ограничения (9.61). Нетрудно видеть (рис. 9.10), что значение, принимаемое щЦ) в Рис. 9.10. Формирование оптимального управления л каждый момент /, определяется знаком БЬ^гр((^) в гамильто- ниане (9.63), т. е. изменение Uj(t) происходит по закону п и, (t) = Mj sgn 2 bub (*) = Mj sgn Cj (t), (9.64) 1 У = 1,2 ,n, где Cj — оптимальная функция переключения, Mj=const. Таким образом, 1-е свойство управления в задачах на линейное оптимальное быстродействие следующее: управляющие воздействия Uj(t), /=1, 2, ..., п представляют собой кусочно-постоянные функции, которые принимают либо максимально, либо минимально допустимые для них значения. Иначе: оптимальное управление принимает значения на вершинах многомерного параллелепипеда U (9.61). Изменим порядок суммирования в первой группе слагаемых функции Гамильтона (9.62): 2 261
Уравнения гамильтоновой системы (9.55) относительно вспомогательной функции i|;(f) будут иметь вид ' = 1.2 п. (9.65) Эта система уравнений является однородной; следовательно, общее решение можно записать в виде п *' @ = 2 АЧ^ Для всех i = 1. 2 п, (9.66) где к, — совокупность корней характеристического уравнения или собственные значения матрицы А. Полагаем, что Х}, /=1, 2, ..., п являются простыми вещественными корнями. Тогда каждая из функций ^i(t) как сумма монотонных функций не более (п—1) раз пересекает ось t. п Так как функция Cj(t)= 2 Ьц$(Ц) является суммой п монотонных функций, то можно сформулировать 2-е свойство оптимального управления и(/). В случае задачи на линейное оптимальное быстродействие систем п-го порядка, корни (9.66) характеристического уравнения которых вещественны, управляющие воздействия имеют не более п промежутков знакопостоянства или не более (п—1) переключений. Пример. Пусть управляемая система представляет собой двойное интегрирующее звено, т. е. а ограничение на управляющее воздействие имеет вид |«@|=?Jl. Требуется найти управление и (г), переводящее фазовую точку из х° в начало координат фазового пространства за минимальное время. 1. Введем фазовые координаты Хх — Х, Х2= ^j , тогда в нормальной форме корни уравнения системы типа (9.53) запишем в виде dxx dXj ~dT = Xs> 1Г = и- 2. В соответствии с (9.55) выражение для функции Гамильтона Н(х, г|), u) =i Система уравнений Гамильтона (9.56) относительно вспомогательной вектор-функции (9.66) имеет вид Отсюда 262
i = —Ci = const, %=Cit+C2. 3. На основании свойств управления, согласно закону (9.64), Число переключений управления u(t)—не более одного. Уравнения семейства фазовых траекторий при «@ = 1, -*22/2=Xi+Ci и при u(t)=—1, х22/2 = +d показаны на рис. 9.11а и рис. 9.116 соответственно. Под действи- х -х а б Рис. 9.11. Фазовые траектории см управления «=±1 фазовая точка может попасть в начало координат только по выделенной траектории; для того чтобы фазовая точка попала в начало координат не более чем за одно переключение, движение должно быть организовано, как показано на рис. 9.12. Систему, реализующую подобное оптимальное по быстродействию движение, можно реализовать в соответствии с рис. 9.13. Рис. 9.12. Фазовые траектории и оптимальный процесс 263
а 1 8г S х-х, Рис. 9.13. Схема системы оптимального управления при и=М sgn -фг Задача оптимального управления линейным процессом. Рассмотрим простой линейный процесс, характеризуемый уравнением (9.60): где а и 7 — положительные постоянные. Начальное состояние процесса x(to)=x°, а управляющее й ||^М О воздействие ограничено: @ ( . Определим управляющее возр действие «@. которое обеспечивает минимум показателя качества (9.7), т. е. Положим, что Х\=х, и пусть новой координатой будет t, Тогда дифференциальные уравнения системы (9.60) примут вид Задача сводится теперь к определению управляющего воздействия u(t), минимизирующего критерий /. Функция Гамильтона (9.14) для этой системы имеет вид (9.62) Для применения принципа максимума необходимо найти максимум функции Гамильтона по отношению к и. Очевидно, что функция Гамильтона имеет максимум, если знак управляющего воздействия и, согласно (9.64), совпадает со знаком ifi, a его значение равно максимально допустимому значению М, т. е. где 264
sgn ф, = О, ^=0; — 1. %<0. Канонические уравнения Гамильтона (9.56) имеют вид: дН X дН Ь й 2 яр2=0. Начальные условия для х: xl(t0)=x°=x10, x2(t0)=0. Граничные условия для if: *i(*i)=0, ф2(Л)=— Ьг=—1, Так как то Подставляя условия (9.65) максимума функции Гамильтона в канонические уравнения (9.56), получим Известные из условия задачи граничные условия для этих двух дифференциальных уравнений имеют вид: Это и есть задача с граничными значениями в двух точках, так как граничные условия заданы для обоих концов траектории. Теперь приведенные ранее два дифференциальных уравнения необходимо решить относительно х\ и ^ при этих двух граничных условиях. Процедура решения заключается в выборе наугад значения y\>i(to)=p и в нахождении значений Х\ и i|;i, при которых удовлетворяется другое граничное условие i'i(^i)=0. После того как определено yp\(to), находят управляющее воздействие «=Afsgni|;i, которое переключается согласно знаку функции i|?i@- Следовательно, tyi(t)—требуемая функция переключения. Стратегия оптимального управления и= =Msgn^n может быть легко реализована (рис. 9.14). Иногда легче определить ifi (/) при помощи аналоговой моделирующей установки. Из рис. 9.15 следует, что управляющее воздействие образуется посредством подачи переменной состояния в схему, отмеченную пунктирной линией и известную под названием сопряженной системы. Последнее понятие будет рассмотрено в дальнейших разделах. Оптимальное управляющее 265
Р'-А'р р п eft) х= Ax+J7m xft) Рис. 9.14. Структурная схема оптимальной САР Г \9я_ х„ L I Рис. 9.15. Схема оптимальной САР с сопряженной системой A) воздействие является нелинейной функцией переменной состояния. Следует отметить, что закон управления не может быть выражен аналитически как функция переменной состояния. Такую схему оптимального управления иногда называют релейным вариантом оптимального управления. Задача оптимального управления конечным состоянием. При отсутствии ограничений на вектор управления в задаче Майера классического вариационного исчисления определяют значение функции от координат состояния в конечный момент t=t\, т. е. /=<р[х(/,)]. Пусть управляемую систему описывают системой дифференциальных уравнений n-го порядка /=1,2, ..., т (9.67) ;=¦* с граничными условиями x(io)=x°; x(^)=xI- Эти уравнения линейны относительно /гс-мерного вектора управления и(/). На управляющие воздействия накладываются ограничения вида M<Mj; (Ms>0), /=1, 2, ..., т. (9.68) Требуется определить вектор управления, минимизирующий функционал 1. Введем новую координату 266
Дополнительное дифференциальное уравнение относительно Xo{t) запишем в виде п dxe _ у dip dXj at *d dxt dt с граничными условиями *о(/о)=ф[хо], xo{t)—I. 2. Функция Гамильтона (9.14) для системы (9.67) 1=0 ' Выполняем ряд несложных преобразований функции Я(х, if, u): 2 При выполнении преобразований, в силу ^ = 0, tyo{ti)~ — 1, полагаем ^0(t)= — 1. 3. На основании принципа максимума при введенных ограничениях оптимальное управление конечным состоянием для данной системы определяют выражением и, /=1,2 т. (9.69) Таким образом, управление Uj(t) является кусочно-постоянной функцией. Оптимальная функция переключения может быть вычислена после решения гамильтоновой системы уравнений при заданных граничных условиях. Задача управления на минимум расхода энергии. Это — задача оптимального управления, имеющая большое практическое значение. Расход энергии, затраченной на управление, пропорционален интегралу по времени от квадрата управляющего воздействия. Если расход энергии по всем входам брать с одинаковыми весовыми коэффициентами, то функционал (9.7) можно записать в виде 267
о где 1/2 — коэффициент, введенный для удобства последующих выкладок. Система, описываемая дифференциальными уравнениями п-то порядка: п m bnttj. i=~n. (9.70) Рассмотрим два случая определения оптимального управления по расходу энергии на управление: 1-й, когда на вектор управления не накладывается ограничений; 2-й, когда управляющие воздействия подчиняются ограничениям вида Введем новую координату Соответствующее этой координате дифференциальноs ние т при граничных условиях Яо(Аэ)=О, xo(ti)==I. Функция Гамильтона для этой системы имеет вид (9.70) т л п п т Н(х, ^, u) = rJ;0^-2"/ + 2^2a'/xrb2^2 ЬЧи1- Меняем порядок суммирования в последней группе слагаемых и полагаем, как и прежде, что ^0= — 1. п п т п т г=1 j=\ ; 1-й случай. На вектор и(/) не накладывается ограничений. Максимум функции Гамильтона (9.71) относительно и может быть найден на основании необходимого условия экстремума функции из классического анализа: дН (х, ф, и) ди Дифференцируем по щ: Ci(t)-u,(t)=O, /=1, п, где 268