/
Автор: Гальперин М.В.
Теги: физика автоматика системы управления учебное пособие теория автоматического управления
ISBN: 5-8199-0020-0
Год: 2004
Похожие
Текст
681.5 Г17
М. В. Гальперин
/I
автоматическое управление
офессиональное разование
М. В. Гальперин
АВТОМАТИЧЕСКОЕ УПРАВЛЕНИЕ
Допущено Министерством образования Российской Федерации в качестве учебника дм студентов образовательных учреждений среднего профессионального образования, обучающихся по группам специальностей 2100 Автоматизация и управление, 2200 Информатика и вычислительная техника
Москва ФОРУМ - ИНФРА-М 2004
УДК 6&,6У
УДК 53(075.32)
ББК 22.3я723
Г15
Рецензенты:
директор Московского государственного техникума технологии, экономики и права им. Л. Б. Красина, кандидат
физико-математических наук В. В. Соколов', зам. директора по учебной работе Т. Н. Грибань (Московский радиотехнический колледж академика А. А. Расплетина);
преподаватель, председатель ПЦК Л. Г. Мельник (Московский радиотехнический колледж академика А. А. Расплетина)
Гальперин М. В.
Г15 Автоматическое управление: Учебник. — М.: ФОРУМ: ИНФРА-М, 2004. — 224 с.: ил. — (Серия «Профессиональное образование»).
ISBN 5-8199-0020-0 (ФОРУМ)
ISBN 5-16-000543-9 (ИНФРА-М)
В учебнике приведены базовые сведения о системах автоматического управления, их назначении, структурах, классификации и функциональных модулях. В качестве основного математического аппарата в необходимом объёме рассмотрено преобразование Лапласа и его применения к анализу и синтезу систем регулирования. Рассматриваются передаточные функции, статические и динамические свойства и критерии устойчивости линейных систем, критерии качества процессов регулирования, характеристики типовых звеньев и объектов управления, законы регулирования и методы синтеза регуляторов, дискретные, нелинейные и самонастраивающиеся системы, устройства программного управления. Описаны алгоритмы управления и возможности ЭВМ и микро-ЭВМ в системах управления, приведены сведения о программном обеспечении.
Для работы с учебником достаточно знания математики и физики в объёме средней школы. Учебник рассчитан на студентов среднетехнических учебных заведений, специализирующихся по автоматике и автоматизации производственных процессов. Он может служить полезным пособием для студентов высших и средних учебных заведений, изучающих эти
дисциплины, а также электронику, измерительную и вычислительную технику, и для инженерно-технических работников, проектирующих и об-
"л;"п1Г1 iiiiuiiini гпгтгг'ц прпмып|приной автоматики.
ISBN 5-81'
ISBN 5-16
академик С.Бе.-1сембаев.
УДК 53(075.32) ББК 22.3я723
© М. В. Гальперин, 2004 © ИД «ФОРУМ», 2004
Предисловие
Термин «автоматическое управление» означает процесс управления техническим объектом без вмешательства человека. При этом объект управления должен быть способен воспринимать управляющие воздействия — сигналы, содержащие информацию о том, что должно с ним произойти. В большинстве случаев эти сигналы генерируются специальным управляющим устройством на основе информации о текущем состоянии объекта и его окружения. Таким образом, предметом автоматического управления, как раздела технической кибернетики, являются информационные связи и потоки в системе, образуемой объектом управления и управляющим им устройством, безотносительно к их физической природе и конкретному техническому исполнению. ~
Основной вопрос, на который должна отвечать система автоматического управления, — «что должен сделать этот объект?». Ответ на него неизбежно зависит от ответа на вопрос «что этот Объект может делать?». Способы получения ответов на эти вопросы, называемые алгоритмами управления объектами и их идентификации, и составляют суть автоматического управления.
В соответствии со сказанным и задумана данная книга, представляющая собой простейший вводный курс, рассчитанный, прежде всего, на учащихся среднетехнических учебных заведений.
Для общего ознакомления с предметом достаточно первой главы и разделов 3.4, 4.2—4.4 и 5.2 из других глав. Более подробное изучение принципов автоматического регулирования требует знакомства с преобразованием Лапласа, свойствами 5-функции Дирака и единичной функции Хевисайда, а также с методами исследования устойчивости, которым в основном и посвящены главы вторая и третья. В главе четвёртой рассмотрены нелинейные, экстремальные и самонастраивающиеся системы управления. Начальные сведения по идентификации объектов управления приводятся в разделе 5.1. В приложения вынесены исторический обзор, таблицы преобразования Лапласа и z-преобразования. Список литературы включает в себя ряд современных изданий и учебников, а также ставшие классическими монографии и учебные курсы, наиболее полно отражающие рассмотренные вопросы и полезные для их углублённого изу-
4 Предисловие
чения. Ссылки, на них в тексте помещены в квадратных скобках той лько в тех случаях, когда учащимся рекомендуется обратиться к данному источнику.
Для работы с книгой достаточно знания математики и физики в объёме средней школы. Учебник может служить полезным пособием для студентов высших учебных заведений, изучающих электронику, автоматику и автоматизацию производственных процессов, а также для инженерно-технических работников, проектирующих и обслуживающих системы промышленной автоматики.
Чтобы облегчить пользование книгой, ниже приведен пе)речень основных аббревиатур и обозначений.
Автор искренне благодарен научному редактору книги Э. Д. Тузову за ценные и глубокие замечания.
г М. Гальперин
Аббревиатуры и основные обозначения
АФХ — амплитудно-фазовая характеристика;
АЧХ — амплитудно-частотная характеристика;
И^С — информационно-измерительная система;
ИИЭ — идеальный импульсный элемент;
ИЭ т- импульсный элемент;
ЛАЧХ — логарифмическая амплитудно-частотная характеристика;
САР — система автоматического регулирования;
САУ — система автоматического управления;
ФЗ — фиксирующее звено;
ФЧХ — фазо-частотная характеристика.
Обозначение дифференцирования по времени: в случаях, когда дифференцирование по времени не вызывает сомнений, используются сокращённые обозначения х’, х", х*"0 — первая, Вторая ...,
/и-ная производные от х по времени;
а0, at, а2, ..., а„, bOi Ьи Ь2, Ьт — постоянные коэффициенты в линейном дифференциальном уравнении;
f f(f) — произвольная функция;
F(p) — изображение функции f(f) по Лапласу; вообще функции — оригиналы обозначаются малыми, а соответствующие им изображения т- теми же большими буквами;
— мнимая часть комплексной функции в квадратных скобках;
j = (-1)1/2 — мнимая единица;
А(г) — реакция блока (звена, системы) на воздействие единичной функции — переходная функция;
6 Аббревиатуры и основные обозначения
Н(р) — изображение функции А(0 па Лапласу;
к(<в) — модуль АФХ (АЧХ) блока (звена, системы);
к(<о)[дБ] = 20 1g к(р>) — АЧХ блока (звена, системы), выраженная в децибеллах (ЛАЧХ);
К .**- независимый от частоты коэффициент передачи, петлевое усиление;
Kb n — соответственно коэффициенты передачи прямой цепи и цепи обратной связи;
— коэффициент усиления регулятора (или его пропорциональной части);
Kq — коэффициент передачи звена или блока;
£(...) — преобразование по Лапласу функции в квадратных скобках;
p-r+jtd — независимая комплексная переменная, г —действительная, <о — мнимая часть;
... J — действительная часть комплексной функции в квадратных скобках;
t — время;
Т ~~ постоянная времени, период дискретизации в дискретных системах;
Та — постоянная времени дифференцирования;
Ги— постоянная времени интегрирования;
u(t) — единичная ступенчатая функция Хевисайда;
U(p) = \/р — изображение единичной ступенчатой функции Хевисайда;
и>(/) — реакция блока (звена, системы) на воздействие 5-функции — импульсная переходная функция; ,
И^р) — передаточная функция блока (звена, системы); — изображение импульсной переходной функции;
х(/), У^У ~ фазовые координаты, сигналы;
Аббревиатуры и основные обозначения 7
х(оо), у(°°) — установившиеся значения фазовых координат, сигналов;
x*(f) — дискретизированная, фазовая координата, сигнал;
X*(z) — z-изображение дискретизированной фазовой координаты, сигнала; < ,
/[...] — z-преобразование функции в квадратных скобках;
U — коэффициент передачи цепи обратной связи;
5(0 — 8-функция Дирака;
1; ’
^лнт. — интегральная нелинейность статической характеристики;
5дифф — дифференциальная Нелинейность статической характеристики;
а(0 — ошибка системы регулирования;
Е(р) — изображение ошибки;
$ — отношение колебательности;
% — декремент затухания;
о — действительная часть корня характеристического уравнения;
ст* — дисперсия случайной величины х;
1°мии1 ~~ степень устойчивости;
р — коэффициент корреляции;
Р — ковариация случайных величин;
т — время, запаздыйание или опережение по времени;
<р — угол фазового сдвига;
[ф] —• запас устойчивости по фазе;
ф(ш), ф(<в) — фазочастотная характеристика ФЧХ;
<о —круговая частота;
П — круговая частота, мнимая часть корня характеристического уравнения.
Глава 1 НАЗНАЧЕНИЕ, СТРУКТУРЫ И ОСНОВНЫЕ ФУНКЦИОНАЛЬНЫЕ БЛОКИ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ (САУ)
1.1. Назначение, классификация и структуры САУ
Любая целенаправленная деятельность или процесс нуждаются в управлении. Если управление осуществляется техническими средствами без участия человека (или другого живого организма), — это автоматическое управление.
Системы автоматического управления (САУ) предназначены для управления техническими процессами без непосредственного вмешательства или участия человека.
В составе САУ различают собственно объект управления и управляющие устройства. Очень часто это деление отчасти или полностью условно и основано на удобстве анализа системы, а не на физическом разделении объекта и устройства управления. Объект и управляющее устройство связаны через исполнительные механизмы, по которым на объект передаются управляющие воздействия, и измерительную аппаратуру, от которой управляющие устройства получают сигналы о состоянии объекта. Технически в САУ входят также аппаратура и линии связи между перечисленными частями САУ, и их возможным влиянием на сигналы в системе нельзя пренебрегать. При построении и анализе САУ принимаются во внимание именно информационные потоки и связи, а также те преобразования (и искажения) сигналов, которые происходят в объекте, управляющем устройстве и связной аппаратуре. Совокупность правил и процедур, по которым управляющее устройство обрабатывает информацию для выработки управляющих воздействий, называется алгоритмом функционирования САУ.
С точки зрения направленности информационных потоков возможны два основных принципа построения САУ: с разомкнутой и с замкнутой цепью воздействий.
В САУ с разомкнутой цепью воздействий (сокращенно — «разомкнутые САУ», рис. 1.1, а) поток информации направлен только от управляющего устройства к объекту управления, то есть вырабатыва
Назначение, классификация и структуры САУ 9
емые в системе управляющие воздействия не зависят от состояния объекта. Типичные примеры такого управления — многие копировальные станки, стиральные машины, установки для нарезки и сверления печатных плат в электронике, трикотажные и прядильное машины — автоматы, САУ выведением баллистических ракет на околоземные орбиты, наконец, многие станки с программным управлением. Помимо разомкнутых САУ в промышленности широко распространены разомкнутые системы автоматического контроля или информационно-измерительные системы (ИИС) (рис. 1.1, б). Эти системы не управляют объектами, но часто выполняют функции автоматической маркировки, сортировки или отбраковки изделий.
В САУ с замкнутой цепью воздействий («замкнутые САУ», рис. 1.1, в) имеются сигналы обратной связи, поступающие от объ-- екта управления в управляющее устройство. Сигналы обратной связи обрабатываются управляющим устройством по определённым алгоритмам в соответствии с текущими и прогнозируемыми изменениями состояния объекта управления. В результате на выходе управляющего устройства формируются управляющие воздействия на объект. В системе управления образуется замкнутая петля обратной связи.
Сигналы, передаваемые между блоками и звеньями САУ, часто называют фазовыми координатами или просто координатами САУ. Математический смысл этого термина разъясняется в четвёртой главе, а пока будем им пользоваться для удобства.
Рис. 1.1. Структуры систем автоматики: а — разомкнутая система программного управления; б — разомкнутая информационная система; в — замкнутая система (с обратной связью); г — разомкнутая система с управлением по возмущению; д — комбинированная (смешанная) система с управлением по возмущению и обратной связью
10
Глава 1. Назначение, структуры и основные блоки САУ
Важнейшим преимуществом САУ с обратной связью является их способность компенсировать всевозможные возмущения и помехи, неизбежно возникающие в процессе работы любого объекта управления. В простейшем случае задача замкнутой САУ состоит в поддержании некоторой координаты в заданных пределах. В этом случае текущее значение стабилизируемой координаты (выхода объекта) сравнивается с требуемым значением, называемым уставкой. Управляющее устройство воздействует на объект таким образом, чтобы разность выхода и уставки была минимальна (желательно нулевой). Такие системы называют системами автоматического регулирования (САР) или просто автоматическими регуляторами. Пример такой системы — обычный домашний холодильник. Здесь термореле срабатывает, когда температура в холодильной камере становится выше допустимой, и включает двигатель компрессора, который действует до тех пор, пока термореле не «обнаружит», что температура снизилась достаточно, и не отключит питание двигателя. Если уставка не является постоянной, а изменяется по заданному закону с тем, чтобы и выход системы изменялся по этому закону, то такая САР называется следящей системой.
Разомкнутые САУ и ИИС можно рассматривать как частные случаи наиболее общего типа замкнутой САУ, в которой одна из связей оборвана. К разомкнутым САУ относятся и системы с управлением по возмущению (рис. 1.1, г), иногда называемые системами компенсационного типа. В них управляющее воздействие вырабатывается как функция действующего на систему возмущения.
Предположим, что требуется поддерживать выходную координату системы на постоянном уровне и известно, какой именно фактор и каким образом воздействует на выход системы. Тогда можно, измеряя возмущения этого фактора, задавать управляющее воздействие так, чтобы компенсировать эти возмущения. Рассмотрим простой пример. Производится автоматическая электросварка металлических листов, равномерно подаваемых в сварочный аппарат. Чтобы сварной шов был прочным, скорость подачи сварочного электрода и температура сварки должны находиться в определённых пределах. Однако толщина свариваемых листов может меняться, а потому должны меняться и скорость подачи электрода, и сила тока в сварочном аппарате. В этом случае вполне целесообразный вариант управления состоит в том, чтобы измерять заранее толщину листов и, в зависимости от неё, менять скорость подачи электрода и сварочный ток. Другая возможность состоит в изменении скорости подачи листов в зависимости от их толщины. В обоих случаях обрат
Назначение, классификация и структуры САУ 11
ная связь в системе отсутствует, а управление вырабатывается как функция возмущения.
Важное преимущество систем с управлением по возмущению состоит в том, что компенсация возмущения возникает одновременно с самим возмущением. Более того, управляющее устройство может при необходимости заранее «принять меры», чтобы возмущение не повлияло нежелательным образом на объект управления или технологический процесс. Такое управление с прогнозом во многих случаях просто необходимо. Капитан корабля выбирает курс и скорость в зависимости от того, что находится впереди, а не тогда, когда столкновение с рифами становится неизбежным. В этом смысле управление с обратной связью существенно проигрывает управлению по возмущению, так как в системе с обратной связью информация в управляющее устройство поступает «по факту», то есть когда корабль уже садится на рифы. Главный недостаток систем управления по возмущению состоит в отсутствии у них универсальности. У них нет проблемы устойчивости, но остро стоит проблема точности. Необходимо заранее знать все возможные возмущающие факторы и иметь точные способы их компенсации, что, как правило, невозможно или слишком сложно. Поэтому очень часто прибегают к комбинированному управлению, включающему в себя управление по возмущению вместе с управлением с обратной связью (рис. 1.1, д).
В тех случаях, когда управление процессом осуществляется с помощью специальных устройств, но При участии человека (оператора), говорят об автоматизированных системах управления. Обычно в состав автоматизированных систем входят САУ более низкого уровня, управляющие отдельными агрегатами сложной технологической цепи или установки.
Например, в состав системы управления крупной энергетической установкой может входить множество автоматических регуляторов, поддерживающих, скажем, давление и температуру водяного пара на заданных уровнях, и целый ряд автоматических устройств, осуществляющих защиту агрегатов от перегрузок или предназначенных для управления процессами выведения этих агрегатов на рабочий режим и их останова. В состав такой системы обычно входят и устройства, осуществляющие оптимизацию режима работы (экстремальные регуляторы), например, минимизирующие расход топлива. Однако основные параметры процесса задаёт с пульта оператор, наблюдающий за работой установки в целом. В состав такой современной системы обычно входят и компьютеры, которые могут как непосредственно управлять параметрами процесса, так и работать в
12 Глава 1. Назначение, структуры и основные блоки САУ
режиме советчика, вырабатывая рекомендации для оператора, но оставляя за ним окончательное решение.
Все эти системы автоматики, как правило, связаны между собой, образуя множество контуров управления. В частности, устройства, ответственные за оптимизацию, задают уровни, на которых САР должны стабилизировать параметры процессов. В процессе работы объекта уставки могут также изменяться в соответствии с заданной программой или по воле оператора.
Таким образом, системы управления могут иметь сложную иерархическую структуру и включать в себя множество подсистем, каждая из которых является локальной САУ. При этом обычно система в целом оказывается автоматизированной — на верхнем уровне находится человекгоператор, в то время как отдельные подсистемы выполняют свои функции полностью автоматически (рис. 1.2).
Физическая реализация САУ зависит от множества факторов, таких, например, как стоимость, надёжность или ограничения по габаритам или весу. В частности, управляющая часть САР или экстремальных регуляторов может быть частично или полностью реализована в виде компьютерных -программ, установленных на том же компьютере, что вырабатывает рекомендации оператору и выполняет ещё ряд дополнительных функций.
Объект управления и управляющее устройство далеко не всегда располагаются в непосредственной близости друг к другу. Когда расстояние , между ними становится, столь велико, что требуется применение специальных средств связи для передачи управляющих воздействий и информации о состоянии объекта, то такие САУ называют системами телемеханики и телеуправления.
Рис. 1.2. Структура автоматизированной системы управления
Информация и сигналы
13
1.2. Информация и сигналы
Независимо от технической реализации САУ — это системы, в которых циркулируют информационные потоки. Эффективность управления зависит от того, каким именно преобразованиям и искажениям подвергается информация и её физические носители — сигналы.
Постараемся разобраться в том, что такое количество информации, в виде каких сигналов она может быть представлена И что такое информационная Производительность аппаратуры И её быстродействие.
Определение количества информации было Первоначальнд предложено Р. Хартли и X. Найквистом в 1928 г. именно в связи с необходимостью формального сравнения пропускной способности (то есть производительности) телеграфных каналов связи.
X. Найквист исходил из того, что каждое сообщение можно представить как цепочку сигналов типа «да» и «нет». Это формирование цепочки символов «да» и «нет» может происходить, например, по такому же закону, как в игре в «Известных людей». В этой игре один из участников — отгадывающий — имеет право задать не более некоторого числа вопросов, на которые можно отвечать только «да» и «нет». По этим ответам надо определить загаданного отвечающим человека. Обозначим ответ «да» как логическую единицу, а «нет» как нуль И представим себе, например, что отвечающий загадал Наполеона Бонапарта. Тогда цепочка Вопросов и ответов может иметь следующий вид:
Вопрос Ответ Код
1. Жив? Нет 0
2. Мужчина? Да 1
3. Родился после 1600 г.? Да 1
4. Родился до 1900 г.? Да 1
5. Европеец? Да 1
6. Уроженец Западной Европы? Да 1
7. Начал свою деятельность после 1800 г.? Нет 0
8. Начал свою деятельность после 1700 г.? Да 1
9. Связана ли его деятельность с искусством? Нет 0
10. Он участвовал в военно-политических событиях? Да 1
11. Участвовал ли он в событиях Французской революции? Да 1
12. Обладал ли он единоличной государственной властью? Да 1
13. Наполеон Бонапарт? Да 1
Условившись о порядке расположения вопросов и отбросив последний из них, данные Наполеона можно представить в виде набора нулей и единиц: 0111110101111. Такой набор есть не что иное,
14 Глава 1. Назначение, структуры и основные блоки САУ
как число, только в двоичной системе счисления, где Цифрами в разрядах служат только нули и единицы. Этот набор можно назвать «словом» и считать, что оно обозначает как раз Наполеона Бонапарта. Разряд двоичного сдова, принимающий значения 0 или 1, есть единица количества информации, называемая бит (от английского binary digit — двоичный знак).
Нетрудно заметить, что практически любое понятие можно представить в виде набора таких двоичных символов — нулей и единиц. Действительно, каждой букве алфавита можно сопоставить тоже набор-нулей и единиц и такими же наборами обозначить паузы между словами и знаки препинания. Тогда и любой текст можно изобразить в виде двоичного кода достаточной-длины. Заметим теперь, что чем больше, ответов типа «да» и «нет» получено нами, тем больше у нас информации и тем точнее сообщение, оказавшееся в нашем распоряжении. Следовательно, число мест в слове, на которых могут стоять нули и г единицы, или, иначе говоря, число бит — разрядов в коде (числе), может служить мерой количества информации.
К тому же выводу можно прийти с несколько иных и более формальных позиций. Предположим, что нам заранее известно, сколько альтернативных, взаимно исключающих друг друга вариантов сообщения может быть получено. Это число в точности равно тому максимальному числу в двоичном коде, которое выражается передаваемым словом заданной длины. Для того, чтобы представить себе, чтотакое число в двоичном коде, обратимся к простому примеру. Рассмотрим число 9037. Запись «9037» есть запись в десятичном коде и, в сущности, означает следующее;
9037 = 9 х 10J +0 х 102 + 3 х 10’+ 7 х 10°,
где 103 есть 1000, 102= 100, 10’= 10 и 1Q°= 1.
В двоичном коде можно пользоваться только степенями двойки и соответственно символами 0 и 1. Теперь запишем
' 903710= 1 х 2° + 0 х 212 + 0 х 2”+ 0 х 2,0+ 1 х2’+1х2* + + 0х27+1х26 + 0х25 + 0х24+1х25+1х22 +
+ 0 х 2‘ + 1 х 2° = 100011010011012,
где индексы 10 и 2 означают соответственно написание одного и того же числа в двоичном и десятичном кодах. Отсюда видно, что число 9037, четырехзначное или четырехразрядное в десятичном коде, можно представить в виде четырнадцатиразрядного двоичного слова или числа. Иначе говоря, его можно определить с помощью 14 ответов типа «да нет». Сколько же всего сообщений (слов, чисел) можно передать с помощью 14 двоичных разрядов?
Информация и сигналы
15
Ясно, что это число равно максимальному двоичному числу, которое можно записать с помощью 14 двоичных знаков плюс единица, которую надо добавить в силу того, что 14 нулей — тоже сообщение. Итого можно передать 213 + 212 + 2“ + ... + 2° + 1 = 214 = = 16384|0= 1000000000000002 сообщений.
Следовательно, характеристикой числа сообщений, которое может быть передано с помощью двоичного слова, является число двоичных разрядов в слове. Но это число в точности равно логарифму от числа возможных сообщений по основанию 2. Понятно, что это число характеризует вероятность получить одно данное сообщение из всех возможных сообщений при условии их равновероятности. Таким образом, количество информации, содержащееся в двоичном слове, есть
Н = log2JV,
где N — число двоичных разрядов.
По аналогии с термодинамикой эту меру вероятности получения одного из возможных сообщений назвали энтропией1, так как в термодинамике энтропия есть логарифм вероятности нахождения системы в данном состоянии.
Есть еще ряд глубоких аналогий между информационными понятиями и термодинамикой. Например, при всякой обработке информации, когда проделываются определенные операции над числами и сообщениями, могут выявляться скрытые в имевшихся данных сведения, но нельзя получить новых сведений. Напротив, обработка информации связана с ошибками — малыми, допустимыми, и грубыми, безнадежно искажающими результаты округлениями и тому подобным, — каждый раз часть исходной информации теряется из конечного результата. Это очень похоже на закон, именуемый вторым началом термодинамики, гласящий, что во всякой тепловой машине часть энергии теряется впустую.
Итак, введено понятие количества информации. Теперь нетрудно, имея его, ввести и величину информационной производительности источника сигналов (в том числе и устройств передачи и обработки данных).
Достаточно взять количество разрядов в словах, появляющихся на выходе источника в единицу времени. Один двоичный сигнал, могущий принимать значения нуля или единицы, называют «бит».
1 Приведенное определение относится только к случаю равновероятности всех сообщений. Если сообщения не равновероятны, то это надо учесть. См. по этому поводу, например, учебник Е. С. Вентнель {7].
16
Глава 1. Назначение, структуры и основные блоки САУ
Следовательно, информационная производительность источника будет выражаться в битах в секунду. Информационная производительность связана с понятием быстродействия, хотя последнее значительно менее точно определено и употребляется для обозначения весьма разнородных величин. В частности, под быстродействием обычно понимают количество обрабатываемых или «производимых» слов в секунду, не упоминая при этом о числе разрядов в этих словах, то есть о количестве информации в каждом из них.
Двоичная, десятичная или любая другая система представления данных есть скорее изобретение человеческого разума, чем свойственная природе манера передавать сообщения. Наоборот, большинство природных величин, с которыми приходится иметь дело всем, кроме физиков-ядерщиков, меняется плавно. Эта плавность обычно нарушается только на молекулярном и атомном уровнях. В макрокосме господствует непрерывное изменение.
Именно поэтому почти все датчики, то есть элементы, ставящие в соответствие измеряемому параметру некоторую величину, которая поддается дальнейшей обработке для ввода в вычислительную машину или прибор, имеют непрерывный выходной сигнал. Обычно таким сигналом является электрическая величина. А вот здесь наблюдается поразительное разнообразие. Информация от датчиков может быть заключена и в величине напряжения, и в силе постоянного или переменного электрического тока, в частоте электрических импульсов или в их длительности по времени, в изменяющемся под действием измеряемого параметра сопротивлении или емкости электрического конденсатора и т. д.
Посмотрим подробнее на некоторые из этих сигналов. Что такое электрическое напряжение или сила тока и что их величина может меняться аналогично некоторому другому физическому параметру, более или менее понятно.
Рассмотрим представление данных в виде частоты. Пусть, например, имеется натянутая струна, имеющая некоторую собственную частоту колебаний, которую в случае музыкального инструмента называют тоном, на который она настроена. Известно, что настройку музыкальных инструментов производят, изменяя силу натяжения струн. Таким образом, натянутая струна частотой своих колебаний указывает на силу натяжения. Этот принцип и используют во многих типах датчиков механических усилий. Подводя к струне энергию, чтобы возбудить в ней незатухающие колебания на ее собственной частоте, измеряют эту частоту. Измерение можно производить, придав материалу струны магнитные свойства и наблюдая за электрическим током в проводнике, возбуждаемым по индукции
Информация и сигналы
17
ее магнитным полем. Сила этого тока будет изменяться с той же частотой, с которой колеблется струна.
Итак, усилие натяжения, характеризующее состояние механической системы, оказывается представленным в виде частоты электрического тока. Или, иначе, частота электрических колебаний аналогична усилию. При этом, однако, если температура струны окажется непостоянной, то будет меняться сила ее натяжения за счет теплового сжатия-расширения материала струны. У этого последнего явления есть две стороны: во-первых, оно служит источником температурной погрешности струнного датчика усилий, так как не всегда есть возможность стабилизировать температуру материала струны, а во-вторых, его можно использовать для измерения температуры.
Ниже вопрос о точности и однозначности показаний датчиков еще будет обсуждаться, а здесь для нас важно установить, что частота электрических колебаний может быть мерой некоторой другой физической величины, например, температуры.
Как же в свете данного выше определения количества информации и информационной производительности оценить работу струнного датчика? Возможен простой и ясный способ такой оценки. Предположим, что минимально различимое отклонение частоты на выходе датчика, достоверно свидетельствующее об изменении температуры, есть 1 Гц (герц), а полный диапазон изменения его выходного сигнала равен 1000 Гц (1 кГц). Тогда можно считать, что количество информации, получаемое в результате измерения, определяется отношением всего диапазона выхода к минимально различимому сигналу, то есть величиной
log2( 1000/1) = log.2210 = 10.
Таким образом, количество информации о температуре, даваемое рассматриваемым датчиком, есть примерно 10 бит, или 10 двоичных разрядов. Это. число характеризует не просто чувствительность измерения 0,001, или 0,1 % в десятичной системе, но и требования к узлам и вычислительным устройствам, обрабатывающим полученные данные. Ясно, например, что бессмысленно пытаться обрабатывать данные, поступающие от этого датчика с помощью устройства, которое оперирует с более, чем одиннадцатью двоичны-
ми разрядами.
Вместе с тем тепловое равновесие которой измеряется, и струной датчика струна должна успеть нагреться. Этот п ции датчика и может занимать от тысяч ков секунд. Понятно, что до окончаний
между лредбй. jewnepaiypa' устанавдиюйй&яадьу -юцеЙГ j? Ме&пйДОк-
jTonanptMXwebi&wmtffleH- !
И1ТЛ n VA U Л r»L I
18
Глава 1. Назначение, структуры и основные блоки САУ
но считывать показания датчика. Следовательно, быстродействие канала измерений тоже явно ограничивается свойствами датчика, то есть количеством слов в секунду по 10 бит каждое, которые могут нести новую информацию об измеряемой температуре.
Так мы подошли к фундаментальной теореме, полученной в 20-х годах XX в. независимо В. А. Котельниковым в СССР и К. Шенноном в США, часто называемой теоремой отсчетов.
Один из результатов этой теоремы в том и состоит, что для того чтобы ничего не потерять из информации, создаваемой источником данных, достаточно считывать эти данные с периодом считывания, не большим, чем время установления сигнала датчика^ В то же время повышение частоты считывания, то есть уменьшение периода, не может дать никакой новой информации об измеряемом параметре. Конечно, если нет посторонних помех.
Таким образом, в ндше распоряжение попал электрический сигнал, непрерывно меняющийся аналогично измеряемому параметру. Сигналы, в которых носителем информации является значение физической величины, называются аналоговыми, а оперирующие с такими сигналами устройства — аналоговыми устройствами. Часто это понятие относят только к сигналам электрического напряжения или тока, по форме соответствующим форме изменения некоторого параметра. Типичный пример аналогового сигнала — сигнал электрического тока, возбуждающий звуковые колебания в динамике радиоприёмника. К сожалению, часто бывает, что, хотя датчики и дают электрические сигналы, однако не совсем те, с которыми удобно обращаться при вычислениях или с другими целями.
Действительно, вычислительные машины — компьютеры оперируют с двоичными числами, аналоговые устройства, специализированные на обработке информации — с сигналами напряжения и тока высоких уровней порядка единиц, а то и десятков вольт, исполнительные механизмы, с помощью которых эти устройства могут воздействовать на технологический процесс, — с еще более мощными сигналами. Да и не только по мощности, но и по виду сигнал, например, частоты, идущий от струнного датчика, плохо поддается вычислительной обработке.
Поэтому прежде, чем приступить к операциям над сигналом — к извлечению из него необходимой для управления информации, — его нужно передать (иногда и на значительное расстояние) и привести в удобный для вычислений и обработки вид. Все эти операции связаны с большими или меньшими искажениями и наложением на сигнал помех, как проникающих извне, так и возникающих в самой аппаратуре САУ за счёт внутренних шумов. Дополнительные потери
Функциональные блоки и звенья САУ
19
информации возникают при выработке управляющих воздействий и их передаче на объект управления. Наконец, реакцию самого объекта управления на управляющие воздействия можно рассматривать как результат переработки объектом информации, содержащейся в сигналах управления.
Отсюда следует, что техническая структура САУ должна строиться с учётом характерных свойств всех отдельных элементов, составляющих систему.
1.3. Функциональные блоки и звенья САУ
1.3.1. Характеристики блоков САУ. Разбиение САУ на звенья
САУ состоят из отдельных блоков (узлов и устройств), каждый из которых, включая и объект управления, получает на входе информацию, преобразует её (не всегда полностью желательным образом) и передаёт со своего выхода на вход следующего блока. Помимо передачи сигналов блоки системы могут оказывать друг на друга и энергетическое воздействие.
В общем виде блок САУ можно рассматривать как «чёрный ящик», физическое устройство которого не играет роли, а с точки зрения системы в целом важно только соотношение между его входным х и выходным у сигналами в момент времени t (рис. 1.3):
y(t)~f[x(t),dx/dt, ...], (1.1)
где y(f) может зависеть от текущего значения x(t), от скорости изменения x(f), то есть dxjdt, от значений х на предшествующих интервалах времени и от многих других, часто «посторонних» параметров. Чтобы понять, каким образом данный блок будет реагировать на разнообразные сигналы, его представляют в виде последовательного или параллельного (что реже) соединения нескольких элементарных звеньев, каждое из которых преобразует информацию по достаточно простому, поддающемуся анализу, закону. Понятно, что иногда блок может быть представлен только одним звеном.
Таким образом, система в целом рассматривается не как совокупность физических блоков (объектов и устройств), а как совокупность взаимодействующих звеньев, определенным образом перерабатывающих информацию.
Справедливость подобного под- Рис. 1.3. Представление блока хода видна, например, и ИЗ следую- САУ в виде «чёрного ящика»
Ело*' «•Ирный тцик»
20 Глава 1. Назначение, структуры и основные блоки САУ
щих соображений. Представим себе, что некий технический агрегат ’ эффективно управлялся с помощью ряда специализированных электромеханических устройств. В какой-то момент функции всех этих > устройств передаются компьютерным программам. В этом случае> достаточно, чтобы эти программы с необходимой точностью воспроизводили функции заменяемых устройств. При этом информационная структура САУ в целом не меняется, и набор звеньев, об- \ рабатываюших информацию, остаётся прежним. <
Разбиение структуры системы на звенья делается так, что все звенья являются направленными или, как иногда говорят, детектиру- юшими2. Это означает, что последующее, ведомое звено не должно непосредственно влиять на информацию на выходе предыдущего, ведущего. Иначе говоря, звено должно влиять только на свой выход, но не на вход. В исправно работающей аппаратуре, оперирующей с кодами, это правило выполняется автоматически.
Однако в системе управления каждое последующее аналоговое устройство в какой-то мере является нагрузкой для предыдущего, Так как при передаче аналогового сигнала неизбежна затрата энергии. Поэтому при разбиении На направленные звенья реальная физическая и информационная структуры системы могут совладать не полностью, то есть некоторые звенья могут включать в себя отдельные элементы разных устройств.
Рассмотрим, например, последовательное соединение двух Устройств, из которых первое, ведущее, управляет вторым, ведомым, и управляющим сигналом является напряжение электрического тока (рис. 1.4). Случай — весьма обычный на практике.
Ведущим устройством является усилитель мощности с выходным сопротивлением Дйх, а ведомым, скажем, нагревательный элемент или электродвигатель, на обмотку возбуждения которого подаётся напряжение. Понятно, что электрическое сопротивление нагрузки Лн, неиз
Рис. 1.4. Пример последовательного соединения устройств и выделения направленных звеньев — блоков
2 Термин «детектирующее звено» нельзя считать совсем удачным. Во-первых, английское «detection» означает «обнаружение», и, таким образом, не подходит сюда по смыслу. Во-вторых, под детектором в радиотехнике и телемеханике понимают устройство для выделения информативной части из сигнала (что подходит по смыслу), а следовательно, термин «детектирующее звено* может просто сбивать с толку. ; ,
Функциональные блоки и звенья САУ 21
бежно влияет на выходной сигнал усилителя. Чтобы получить возможность рассматривать нагрузку как направленное звено, её входное сопротивле!ire включается в единое звено с усилителем, а для ведомого звена принимается, что его входное сопротивление Авх бесконечно велико.
Для каждого звена суШествует определённый диапазон входного сигнала, в пределах которого оно способно функционировать. Это есть рабочий диапазон звена.
Характеристики звеньев могут быть чрезвычайно разнообразными. Прежде всего, звено может быть устойчивым и неустойчивым. Строгое определение этих понятий будет рассмотрено ниже, а здесь поясним их иа простом примере. Каждый знает, что обычный двухколёсный велосйпёд при малейшем отклонении от равновесия пада* ет — типичное неустойчивое звено, равновесное состояние которого можеТ поддерживаться только благодаря управлению седока, .Детский трёхколёсный велосипед — устойчивое звено, так как для сохранения его равновесия внешнее управление не требуется. Степень его отклонения от равновесия примерно пропорциональна возмущениям, вносимым седоком и дорогой, И при малых отклонениях от равновесия он самостоятельно возвращается в устойчивое состояние. Неустойчивое звено после малого отклонения от исходного состояния отклоняется от него всё дальше, даже если внешних причин для такого движения уже нет. Соответственно устойчивое звено ведёт себя Противоположным образом.
В большинстве случаев приходится иметь дело с устойчивыми статическими Звеньями, Основное свойство таких звеньев состоит в том, что по прошествий некоторого Интервала времени после установления входного сигнала на постоянном уровне выходной сигнал звена также становится постоянным. Типичные временные характеристики статических звеньев показаны на рис. 1.5.
Для устойчивых статических звеньев при входном сигнале, Показанном на рис. 1.5, а, Можно записать, учитывая обозначения (1.1):
у(х) - limy(r) = lim f\x(t),dx/dt,...] = Дх(®)]. . /~>оо /—>х
Здесь и ниже для упрощения письма статическую характеристику будем писать в виде Дх), не оговаривая, что значения у и х берутся при t ->оо. Отношение
К" [Х(оо)) в Доо)/Х(оо) (1.2)
называется коэффициентом передачи или преобразования звена (или цепочки звеньев). Это отношение может быть безразмерным, если размерности х и у совпадают, но может и иметь размерность.
22 Глава 1. Назначение, структуры и основные блоки САУ
Рис. 1.5. Типичные временные характеристики устойчивых статических звеньев: а — входной сигнал в виде ступеньки, б, в и г — отклики звеньев на ступенчатый
сигнал
Величины х и у могут быть как электрическими (разность потенциалов, ток, сопротивление, ёмкость, взаимная индуктивность), так и не электрическими (температура, давление, расход жидкости или газа, положение в пространстве, скорость, ускорение, световой поток и т. д.).
Коэффициент передачи всегда в той или иной степени зависит от величины входного сигнала. В некоторых случаях эта зависимость пренебрежимо мала и такие звенья называются линейными3 статическими звеньями. Нелинейность статического звена можёт носить весьма разнообразный характер (рис. 1.6) и её можно оценить по отличию характеристики звена у(х) от линейной.
В тех случаях, когда желательно иметь.линейную характерйбти-ку звена, требуется количественная оценка погрешности нелинёй-
3 Условие независимости К от х — необходимое, но не достаточное условие линейности. Полностью условия линейности звена рассмотрены ниже. На практике, однако, нелинейные звенья с постоянным А"почти не встречаются.
Функциональные блоки и звенья САУ
23
ности. Относительная интегральная погрешность от нелинейности, часто называемая просто интегральной нелинейностью есть
(рис. 1.7, а):
Хюке '^макс
Зиит. = /(Их) - Kox]dx / jKoxdx, (1.3)
Jf г
лмик лмин
где
^4) ж (Умакс Умин) / Самаке *^мии) = Л_у/ДХ.
Здесь х^, умакс и хмин, Хмии — соответственно максимальные и минимальные значения х и у, а Ах и Ау — рабочие диапазоны этих величин. Часто 5ИНТ выражается в процентах.
Рис. 1.6. Примеры распространённых нелинейных статических характеристик звеньев: а — ограничение, б — зона нечувствительности (порог срабатывания), в — релейная характеристика, г — релейная характеристика с гистерезисом
Рис. 1.7. Интегральная (в) и дифференциальная (б) нелинейности статической характеристики. Они рассчитываются по Отличию реальной характеристики от её линейного приближения
24
Глава 1. Назначение, структуры и основные блоки САУ
Однако во многих случаях 8ИНТ не является в полной мере исчерпывающей характеристикой линейности звена. На рис. 1.7, б показан как раз.такой случай — здесь интегральная нелинейность рав-на нуЯю,ь’-нс?Х'явно зависит от х. Поэтому наряду с интегральной нелинейностью рассматривается относительная дифференциальная нелинейность характеристики 8дифф. Она может быть оценена по максимальному модулю отклонения характеристики от прямой пропорциональной зависимости:
$дифф. = [max | у(х) - К$х |] / Ду. (1.4)
Если функция у(х) известна, то при анализе системы её заменяют линейным приближением, показанным на рис. 1.7. Такая замена есть линеаризация модели звена, и она, разумеется, не ведёт к исчезновению нелинейности, а только упрощает расчёты. Во многих случаях в систему удаётся ввести устройства или программы, корректирующие нелинейность. Эта процедура также называется линеаризацией, и она действительно «исправляет» нелинейность. Звенья, для которых любой тип линеаризации возможен, называют линеаризуемыми. Однако например, при наличии зоны нечувствительности или порога срабатывания (рис. 1.6, б) линеаризация оказывается невозможной. В пределах зоны нечувствительности информация о состоянии входа звена просто отсутствует на его выходе — нечего корректировать.
Помимо зоны нечувствительности другими источниками неустранимой погрешности являются шум и дрейф характеристики звена у(х) (рис. 1.8). Шум и временной случайный дрейф характери-
Рис. 1.8. Типичная картина дрейфа и шума на выходе блока САУ (а). Шум «размывает» статическую характеристику блока в виде некоторой полосы неопределённости (б и в). Ширина этой полосы зависит от удвоенной амплитуды шума. Дрейф нуля ведёт к смешению статической характеристики параллельно самой себе (б), а дрейф коэффициента передачи — к изменению её наклона (в)
Функциональные блоки и звенья САУ 25
стики в принципе имеют одну и ту же природу. Различие между ними состоит в том, что шум представляет собой быстрые хаотические колебания у при постоянном х. Период этих колебаний меньше, чем время установления выходного сигнала на уровне у(оо) на рис. 1.5. Дрейф характеристики у(х) возникает не только за счёт её медленных случайных, ненаправленных изменений, но может носить направленный характер, когда он возникает за счёт старения аппаратуры или под действием внешних факторов, например, температуры.
Наряду со статическими звеньями широко распространены устойчивые астатические звенья, в частности, интегрирующие. Характеристика линейного интегрирующего звена имеет вид
ХП = /[х(г)-х0]л!х/Ти, (1.5)
о
где Ти называется постоянной времени интегрирования. При некотором начальном уровне входного сигнала х^ (обычно Xq = 0) выход интегрирующего звена постоянен, но при отклонении входа от нуля, этот уровень равномерно растёт или снижается. Классическим примером интегрирующего звена является бак с водой, снабженный наливным и выпускным клапанами. Расходы воды через эти клапаны есть входные воздействия, а количество воды в баке — это интеграл по времени от разности этих воздействий.
За исключением простейших регуляторов в состав САУ помимо самого объекта и управляющего устройства (и/или компьютера с соответствующим программным обеспечением) входят датчики, нормирующие преобразователи и исполнительные устройства и механизмы, представляющие собой самостоятельные Звенья системы; Все части САУ кроме объекта управления обычно включайте сёбй только устойчивые звенья с монотонными характеристиками.'
1.3.2. Технические средства САУ
Никакая, даже самая совершенная вычислительная машина с самыми богатыми логическими и вычислительными возможностями не сможет управлять технологическим процессом, если не будет получать достаточно полные и точные данные о параметрах этого процесса. Грубо говоря, машина есть мозг, который может исправно управлять телом, только получая сигналы от глаз, ушей, рецепторов положения в пространстве и степени напряженности различных
26
Глава 1. Назначение, структуры н основные блоки САУ
мышц, температуры кожи, огромного числа нервных волокон различного назначения, рассеянных по всему телу.
Датчиками или чувствительными элементами называют элементы, преобразующие некоторый контролируемый и/или регулируемый параметр в величину, пригодную для восприятия или дальнейшей Информационной обработки. В большинстве случаев датчики преобразуют неэлекгрические параметры в разность потенциалов или электрический ток, которые в идеале должны быть прямо пропорциональны измеряемому параметру.
Например, термопара или термометр сопротивления, включённый в измерительный мост, служат для преобразования температуры в электрическую разность потенциалов. Соответственно размерность передаточного коэффициента К у этих датчиков есть [В/грац]. При этом термопара есть генераторный датчик, — ей не требуется внешний источник питания, тогда как в термометре сопротивления, — параметрическом датчике, — температура сначала преобразуется в сопротивление датчика, а его выходное напряжение возникает за счет внешнего источника тока.
У каждого датчика есть рабочий диапазон измеряемого параметра, в пределах которого результаты измерения пригодны для дальнейшего использования.
Как правило, электрический выходной сигнал датчика напряжения или тока является нестандартным, к нему добавляются шумы и помехи от внешних источников, и не соблюдается строгая пропорциональность Между входом и выходом датчика — его передаточный коэффициент меняется внутри рабочего диапазона. Поэтому для дальнейшего использования сигнала требуется его нормализация.
Нормализация сигналов датчиков осуществляется с помощью нормирующих электронных усилителей, с выходов которых сигналы подаются либо на специализированные аналоговые управляющие устройства, либо на аналого-цифровые преобразователи (АЦП) для ввода в управляющие компьютеры или микропроцессорные устройства. Задача АЦП — перевести аналоговый сигнал датчика (сигнал аналоговый, потому что он аналогичен измеряемому параметру) в цифровую форму, обычно — в двоичный код. Нормализация сигнала может быть совмещена с его линеаризацией. В этом случае нормирующий усилитель должен иметь характеристику у(х), обратную характеристике датчика, возможно умноженной на постоянный коэффициент. Другая, лучшая возможность заключается в программной линеаризации в микропроцессорном устройстве или управляющем компьютере. В последнем случае в памяти компьютера записывается зависимость значения измеряемой величины от показаний датчика.
Задачи я методы управления 27
В простых системах в качестве управляющего устройства может использоваться аналоговый решающий блок, преобразующий сигнал в соответствии с принятым алгоритмом управления САУ. Обычно в виде аналоговых блоков реализуются регуляторы и управляющие устройства следящих систем. В случае более сложных алгоритмов управления применяются цифровые микропроцессорные комплекты, иа основе которых строятся специализированные устройства с небольшим числом функций. Их применение особенно целесообразно, если управление формируется с использованием логических операций типа условного перехода «если ..., то ...», логического сложения «если ... или ... , то» и логического умножения «если ... и ... , то».
- - В тех случаях, когда для формирования сигналов управления требуется Много логических операций и/илй нестайдартных операций с двоичными кодами, чрезвычайно эффективны ПЛИС — программируемые логические интегральные схемы.
При использовании более сложных алгоритмов управления на крупных объектах используются микро- и мини-ЭВМ в промышленном исполнении. Наконец, для управления цехом или производством в целом может потребоваться ЭВМ типа рабочей станции.
Выходные управляющие сигналы компьютера могут передаваться в виде двоичных кодов, задаваемых на микропроцессорные устрЬйства или на исполнительные механизмы объекта. В последнем случае они сначала подаются на ЦАП (цифро-аналоговые преобразователи), а с выходов последних — на усилители мощности, способные привести в действие исполнительные механизмы. Усилители мощности обычно необходимы и на выходах аналоговых управляющих устройств.
1.4. Задачи и методы управления
Всякое управление имеет цель. И всякое управление направлено на объект управления.
Цель управления может быть только одна. Нельзя купить одновременно наилучший и самый дешевый костюм. Можно искать либо наилучший костюм за данную цену, либо самый дешевый костюм определенного качества. В задачах такого рода Следует тщательно различать цель — например, купить самый лучший костюм —-и ограничения — в данном случае заплатить за костюм сумму, не превосходящую заданную.
28 Главе 1. Назначение, структуры и основные блоки САУ
Этот простой пример ближе по своему характеру к экономическим задачам, чем к задачам управления технологическими объектами, однако, он. ясно показывает проблему выбора единственного критерия или цели управления и определения совокупности ограничений. . , .
Выбор и формулировка критерия, а также выявление ограничений требуют создания моделиобъекта.
Понятно, что любое явление или объект материального мира не могут быть абсолютно точно, адекватно и полно описаны никаким способом. Идеальной моделью объекта является только сам моделируемый объект.
Однако к счастью, в большинстве случаев можно обойтись достаточно грубыми приближениями.
Модель объекта — это не всегда математическое описание его свойств, хотя в большинстве случаев математическая модель оказывается основой при построении системы управления.
, Среди объектов управления, прежде всего, можно выделить два основных класса: Объекты стационарные или непрерывного действия и объекты нестационарные периодического или даже разового действия.
К первому классу относятся многочисленные агрегаты, производящие энергию и большинство видов используемых человеком материале». Это электростанции всех типов, тепловые станции и котельные, большинство агрегатов и установок химической и нефтехимической Промышленности, в металлургии — доменные печи И прокатные станы, обогатительные фабрики в горной промышленности, сборочные конвейеры и поточные линии в машиностроении и электронной промышленности, бытовые приборы холодильники, кондиционеры и так далее. Их отличительная особенность с Точки зрения управления — это желательность или даже необходимость поддержания стабильного, неизменного режима работы несмотря на возможные помехи и возмущения — изменения нагрузки, качества сырья и другие факторы, способные на него повлиять.
Второй класс объектов — это объекты, цель управления которы-1 ми может быть достигнута только в результате изменения -их состояния и/иди положения относительно окружающей их среды. Понятно, что такое изменение может происходить за некий ограниченный интервал времени. Сюда относятся циклические производственные процессы, например, выплавки металлов, транспортные средства, космические аппараты. Многие объекты. непрерывного действия становятся временно нестационарными в переходных режимах, при пуске или останове и именно в этих режимах особенно нуждаются в
Задачи я методы управления 29
автоматическом управлении. Достаточно вспомнить атомные или химические реакторы. Вместе с тем, «внутри» задач управления нестационарными объектами могут возникать задачи стабилизации части параметров объекта управления.
Таким образом, цели управления этими двумя классами объектов в известном смысле противоположны —• в первом случае стабилизация, неизменность состояния объекта, во втором, — наоборот, поиск управляющих воздействий, изменяющих состояние объекта в соответствии с целью управления. В большинстве случаев Объекты обоих классов нуждаются не просто в управлении, а в управлении оптимальном или близком к оптимальному, то есть наилучшем с точки зрения некоторого заданного критерий. Например, при выведении йа орбиту спутника Земли можно стремиться сделать это за минимальное время (задача об оптимальном быстродействии), а можно — с минимальными затратами топлива. Скорее всего, решение задачи в соответствии ₽ первым критерием потребует затрат топлива, много больших минимально необходимых, а второй критерий приведёт к решению, далёкому от оптимального быстродействия,
1.4.1. Управление стационарными объектами. у
Стабилизация и оптимизация
Типичным стационарным объектом управления, является обычный водогрейный котельный агрегат. На его сравнительно простом примере можно видеть основные задачи управления непрерывными агрегатами и возможные подходы к их решению.
Исправная работа объекта означает должное качество продукции. Характеристикой качества продукции в данном случае является температура воды на выходе, которую обозначим 0. Она должна поддерживаться на определённом уровне. Обозначим эту требуемую температуру 0О- На температуру воды на выходе влияют, прежде всего, температура поступающей холодной воды, расход воды, расход топлива, расход воздуха и его. температура и всевозможные менее существенные факторы. Кроме этих, относительно быстро меняющихся факторов, исходные свойства установки будут медленно меняться в процессе эксплуатации, например, в трубах неизбежно осаждение солей, что будет менять их теплопроводность. !
Расход воды — это нагрузка на объект управления, расход топлива — это управляющее воздействие. Температура воды — регулируемый параметр.
30 Глава 1. Назначение, структуры и основные блоки САУ
Предположим, что устройство для измерения температуры горячей воды имеется. Тогда, сравнивая температуру воды 0 с заданным её значением 0О, можно сформировать сигнал управления подачей топлива и регулировать её в зависимости от разности 0 - 0О так, чтобы по возможности сводить эту разность к нулю. Получается система с обратной связью, схема которой показана на рис. 1.9. Сразу отметим, что практически наверняка уставку температуры 0в придётся сделать перестраиваемой, хотя бы вручную, так как в зависимости от наружной температуры и других факторов может потребоваться вода с различной температурой.
Однако даже эта простая на вид задача имеет свои «подводные камни». Если подачу топлива менять слишком быстро и резко, то вместо регулирования температуры получится её раскачка вокруг значения 0О, так как температура воды не может меняться мгновенно с изменением подачи топлива. Если же изменять Подачу топлива слишком медленно, то не удастся отследить за изменениями температуры воды. В обоих случаях система регулирования окажется неработоспособной: в первом случае неустойчивой, йо втором — неэффективной. .
Значит требуется некое компромиссное решение. Эти вопросы построения устойчивых и эффективных систем регулирования будут подробно рассмотрены в главе третьей, а сейчас предположим, что задача регулирования температуры успешно решена. Однако ниоткуда не следует, что она решена наилучшим образом. Желательно ведь не просто поддерживать нужную температуру воды на выходе, но и делать это с наименьшими затратами.
Рассмотрим в связи с Этим такую дополнительную (по отношению к стабилизации температуры воды) задачу: Требуется обеспечить минимальный расход топлива водогрейным котлом независимо от условий окружающей среды и нагрузки, то есть количества отбираемой горячей воды и ее температуры, а также ofr других возмущений. Понятно, что этот минимальный расход топлива будет разным в разных условиях, но он должен быть минимальным в каждой ситуации.
Рис. 1.9. Система регулирования температуры воды на выходе водяного котла
Задачи и методы управления
31
Первый же вопрос, который здесь возникает, каковы основные факторы, определяющие расход топлива при заданной нагрузке на котел? Ясно, что такими факторами являются: качество подаваемого топлива, количество подаваемого воздуха, температура поступающей воды и воздуха, самого топлива и, наконец, требуемые температура и расход нагретой воды. Представим себе, что тщательное исследование объекта показало, что можно считать существенными только перечисленные факторы, к тому же отбросив как более или менее постоянную величину, слабо влияющую на процесс, температуру подаваемого топлива.
Рассуждая чисто качественно, можно сказать, что, в конце концов, такие параметры, как теплотворная способность топлива, тем-_ пература поступающей воды и воздуха, от нас не зависят, и поэтому их можно рассматривать только как величины, создающие возмущения в процессе горения, когда они отклоняются от установившихся значений.
Температура и расход нагретой воды должны поддерживаться с заданной точностью в определенных пределах, это и есть наложенные на процесс ограничения. Расход задаётся как нагрузка, а поддержание температуры в заданных пределах обеспечивает регулятор температуры.
Остается одна переменная, существенно влияющая на расход топлива и практически ничем не лимитированная, — расход воздуха.
Эта переменная целиком в нашем распоряжении, и ее можно использовать в качестве управления в данной задаче.
Продолжая качественные рассуждения, нетрудно понять, что если количество подаваемого воздуха будет избыточно по отношению к тому, что требуется для сжигания топлива, то расход топлива увеличится. Действительно, избыточный воздух будет уносить тепло вместе с уходящими из топки газами. В свою очередь, нехватка воздуха приведет к неполному сгоранию топлива и, более того, к его прямому уносу в несгоревшем виде из зоны горения. Следовательно, если обозначить на графике количество воздуха, точно соответствующее количеству топлива, точкой А, то зависимость расхода топлива от расхода воздуха при прочих постоянных параметрах будет выглядеть примерно так, как это показано на рис. 1.10.
Понятно, что рост необходимой температуры горячей воды или ее потребления, а также снижение температуры поступающих воды и воздуха будут сдвигать эту кривую в Сторону больших расходов топлива и воздуха, и точка А будет дрейфовать из положения А\ вместе со всей кривой (точки А2 и Л3).
32
Глава 1. Назначение, структуры и основные блоки САУ
Рис. 1.10. Зависимость расхода топлива от расхода воздуха в водогрейном котлоагрегате и её возможный дрейф во времени
Рассматривая кривые на рис. 1.10, можно перейти от пожелания о минимальных затратах топлива к количественной формулировке целй управления — требуется удерживать объект, независимо от режима, на линии образуемой точками А, — линии минимальных расходов топлива.
Однако при этом регулятор температуры должен удерживать её на заданном уровне, и именно он, при меняющихся исходной температуре и количестве нагреваемой воды, есть то управляющее устройство, которое изменяет потребление топлива.
Так как параметры управляемого процесса медленно меняются во времени, то скорость слежения за минимумом можно сделать достаточно большой по сравнению со скоростью дрейфа (изменения) характеристик на рис. 1.10.
Однако эту задачу проще сформулировать, чем практически решить. Ведь если качественно вид характеристик известен и не меняется, то количественно он может меняться достаточно быстро. И вместо того, чтобы греть с помощью котла воду, можно оказаться перед необходимостью снимать кривые расходов топлива. А тогда и сам котел и, тем более, управление им потеряют всякий смысл. Поэтому здесь нельзя заранее предсказать ситуацию, а требуется найти способ «следить» за точкой А.
Конечно, возможно простое и грубое решение этой задачи: раз навсегда установить соответствия между режимами и расходами воздуха и, составив такие таблицы, действовать, руководствуясь ими. Часто так и поступают, когда иной способ по каким-либо причинам невозможен или действия по таблицам оказываются до
। Задачи и методы управления 33
статочно эффективными. Фактически — это схема разомкнутого управления.
Как правило, однако, гораздо эффективнее иное решение — организация автоматического поиска точки А — минимума кривых на рис. 1.10. Здесь возможен целый ряд вариантов, выбор которых зависит от степени нашей информированности о процессе горения.
Если имеется достаточно точный датчик расхода топлива, то наиболее идеологически простая возможность заключается, в прямом поиске минимума характеристик на рис. 1.10, причем этот поиск должен происходить быстрее, чем дрейф точки А. Процедуры поиска могут быть различны. Одна из возможностей заключается в том, чтобы сделать пробный шаг с целью определения того, увеличится или уменьшится расход топлива.
Предположим, что этот шаг сделан из точки 1 в точку 2 (рис. 1.11). Тогда обнаружится, что расход топлива немного увеличился. Следовательно, направление движения должно быть изменено на противоположное.
Однако неизвестно, до каких пор надо двигаться в обратную сторону. Это движение приходится совершать, постоянно замеряя, увеличивается или уменьшается расход топлива. Заметим, что результаты этих замеров неизбежно отстают от темпа движения. Это отставание носит принципиальный характер: даже если датчик расхода топлива и само управляющее устройство имеют практически бесконечное быстродействие, все равно реакция объекта вместе с системой стабилизации температуры не мгновенца, а потому невозможно установить без запаздывания факт попадания в точку минимума. На самом деле начавшееся возрастание расхода топлива при движении из точки 2 влево (рис. 1.11) будет обнаружено в некото-
Рис. 1.11. Процедура поиска минимума расхода топлива в котлоагрегате
2 - 8764 Гальперин
34
Глава 1. Назначение, структуры и основные блоки САУ
рой точке 3. В этой точке движение будет реверсировано, но по той же причине, что и ранее, скорее всего процесс проскочит точку А и попадет в точку 4, оттуда в точку 5, далее в точку бит. д., пока движение практически не закончится в зоне точки А, ограниченной точностью приборов. Понятно, что такой процесс с сильными колебаниями весьма нежелателен. Более того, хотя сам темп движения из точки 2 в точку 3 и далее может быть высок, число колебаний может оказаться чрезмерно большим и фактическое время поиска точки А сильно затянутым. Наконец, очень большие скорости движения могут вообще привести к незатухающим колебаниям или даже к возрастанию их амплитуды. Это уж совсем недопустимо, так как прямо ведет к аварии.
Альтернативный вариант заключается в снижении темпа движения до такого уровня, чтобы практически иметь возможность сразу Или почти сразу остановиться, когда расход топлива снова начнет возрастать. Иными словами, двигаться столь медленно, чтобы объект успевал за темпом движения. Хорошо, если при этом темп дрейфа самой точки минимума А окажется настолько мал, что ее можно будет догнать. А если нет?
Задача оказывается весьма трудно разрешимой, если и разрешимой в принципе. В этих случаях прибегают к достаточно изощренным методам поиска минимума, тщательно разработанным в огромном числе работ во всем мире. Некоторые из них будут рассмотрены в главе четвёртой. На практике, однако, получается так, что почти для каждого нового объекта приходится, хотя и в частностях, разрабатывать свой подход, несмотря на общность основных идей. Это связано с природой вещей — нет одинаковых объектов, но есть общее у всего материального мира.
Скажем все же несколько слов об усовершенствованных способах решения нашей задачи в случае возникновения упомянутых трудностей. Один из них, достаточно общеупотребительный, состоит в изменении скорости движения к минимуму в зависимости от ситуации.
Другой возможный выход из положения в данной задаче и многих аналогичных задачах состоит в следующем. Если соотношения быстродействий не позволяют отыскать минимум прямым путем, измеряя минимизируемую величину —• расход топлива, то надо попытаться отыскать косвенные признаки достижения этого минимума.
Это, конечно, не всегда удается, однако, в важном частном случае управления горением в топках есть возможность косвенного определения оптимального режима. Она основана на том, пока не
Задачи и методы управления 35
имеющем общепринятого объяснения, факте, что при оптимальном режиме горения пульсации пламени становятся максимальными. Всем, кто пользуется газовыми плитами с открытыми конфорками, этот факт должен быть известен: когда подача воздуха отрегулирована правильно, то есть пламя не отрывается от горелки и, вместе с тем, у него нет красноватых кончиков, свидетельствующих о неполном сгорании, оно начинает явно и иногда достаточно сильно пульсировать. Весьма существенно, что эти пульсации достаточно быстры, так что темп определения их амплитуды может быть гораздо выше темпа дрейфа объекта управления.
Одним из самых изящных решений задачи оказывается использование в качестве датчика яркости пламени миниатюрного элемента солнечной батареи из тех, что применяются на искусственных спутниках Земли и в карманных калькуляторах для преобразования лучистой энергии в электрический ток питания аппаратуры. Дело в том, что подобный элемент хорошо улавливает и преобразует в колебания электрического тока не только низкочастотные пу--льсации, видимые глазу, но и сравнительно высокочастотные, вплоть до десятков килогерц (то есть даже в звуковой и ультразвуковом диапазонах). А эти последние едва ли не в большей степени определяют наилучшйй режим горения, чем колебания на низких частотах.
Кроме того, выходной сигнал солнечного элемента достаточно мощен, чтобы не требовать какого-либо усиления, — он непосредственно может вводиться в вычислительное устройство.
Для того Чтобы отделить в выходном сигнале датчика яркости пламени переменную составляющую, характеризующую эффективность сжигания топлива, от постоянной, соответствующей среднему уродню и не несущей полезной информации, необходимо ввести фильтр верхних частот. Таким фильтром может служить электрическая цепь, состоящая из последовательно включенного конденсатора С, и сопротивления Rx (рис. 1.12) и называемая квазидифферен-цируюшим звеном.
Действие цепи основано на том, что конденсатор является бесконечно большим сопротивлением для сигналов постоянного тока, в то время как для сигналов переменного тока достаточно высокой частоты его сопротивление становится практически пренебрежимо мал^м.
Далее, после отделения сигнала переменного тока необходимо вычислить некоторую меру его амплитуды. Такой мерой может служить либо абсолютная величина этой амплитуды, либо средняя величина ее квадрата, то есть так называемая дисперсия. Последний
36 Глава 1. Назначение, структуры и основные блоки САУ
Рис. 1.12. Схема измерения пульсаций пламени на базе солнечной батареи как датчика
термин в принципе относится к случайным процессам, но пульсации пламени близки по своему характеру к процессам такого тира, и потому этот термин здесь вполне уместен. Таким образом, естественно поместить после ЯС-фильтра верхних Частота схеме рис. 1,12 узел, именуемый квадратором, напряжение на выходе которого пропорционально квадрату напряжения на входе. В силу того, что квадрат некоторой величины положителен независимо от знака этой Величины, сигнал на выходе этого узла будет сугубо положительным напряжением.
На рис. 1.12 показаны примерные формы сигналов в точках схемы. Пульсирующий сигнал на выходе квадратора еще мало пригоден в качестве сигнала критерия для поиска максимума, так как он изобилует случайными всплесками и провалами. Для усреднения значений этого сигнала на выходе квадратора необходимо поместить фильтр низких частот, в качестве которого может служить другая простейшая ЯС-цепь на Я2 и С2, именуемая апериодическим звеном. В силу того, что конденсатор этой цепи фильтрует переменную составляющую выхода квадратора на нулевую общую шиНу, на самом конденсаторе остается среднее значение сигнала выхода квадратора. Вот это среднее значение, пропорциональное дисперсии пульсаций пламени, и может служить критерием достижения нами точки А на графиках рис. 1.10.
Таким образом, замена критерия в задаче на эквивалентный Позволила вместо поиска минимума одной величины отыскивать максимум другой. Это очень часто встречающаяся ситуация в задачах на минимум или максимум (на поиск экстремумов), когда вместо поиска экстремума «неудобной» величины отыскивается экстремум «удобной» при известном соответствии их друг другу.
Задачи и методы управления 37
Задача отыскания наилучшего режима горения является относительно «хорошей» задачей, так как поиск модели сам по себе не вызывает особых затруднений, а достаточно простые спекулятивные рассуждения указывают на способ, которым надо действовать.
Во многом это определяется тем, что динамические свойства объекта, то есть скорость его реакции на внешние воздействия, в этой задаче являлись по своему характеру второстепенными, и вопрос состоял только в том, как поступить, если они мешают решению основной задачи. Однако уже здесь видно, что динамические характеристики объекта управления играют решающую роль в переходных режимах, когда процесс нестационарен.
1.4.2. Программное управление и нестационарные объекты
Программное управление — это управление каким-либо процессом по заданному закону — программе. В простейшем и наиболее рас-прдстранённом случае программа не зависит от результатов процесса ее выполнения в-целом или на некотором этапе.
Это наиболее чётко выраженный вариант разомкнутого управления.
Сама программа готовится вручную или путём предварительной разработки — проектирования на универсальном компьютере. Подготовленная так программа переносится на носитель или в запоминающее устройство управляющего компьютера. Традиционно для управления технологическими объектами программа задавалась аналоговой записью — кривыми на бумаге, кино- и магнитной ленте, в виде профилированных шайб, кулачков и тому подобных механических деталей — или кодовой записью — на магнитной ленте, про-бивка^и отверстий на перфолентах или перфокартах. Эти способы задания программ используются и до сих пор при отсутствии управляющего компьютера.
Для управления процессом статическая информация носителя программы преобразуется с помощью барабанных и лентопротяжных механизмов с часовым, электрическим и другими приводами в динамическую форму — сигнал управления как функцию времени. Сигнал управления может быть непрерывным или дискретным. Наиболее употребительна импульсная числовая запись унитарным кодом (в виде последовательности двоичных нулей и единиц) и импульсная или непрерывная запись фазомодулированными сигналами. Сигнал управления преобразуется в заданные программой дви
38 Глава 1. Назначение, структуры и основные блоки САУ
жения при помощи воспроизводящих устройств разомкнутого или замкнутого типа.
В современных системах программного управления программа целиком находится в памяти управляющего компьютера. В зависимости от сложности системы и самой программы это может быть компьютер универсального типа или микропроцессорная специализированная система. При необходимости частой смены программ они хранятся на компакт-дисках, дискетах или других подобных носителях.
В качестве воспроизводящих устройств систем программного управления разомкнутого типа применяются импульсные шаговые электродвигатели и другие электромагнитные устройства. В системах с обратной связью информация сигнала управления с помощью датчиков сравнивается с информацией о текущем значении управляемой величины.
Типичная информационная структура системы программного управленйя показана на рис. 1.13. При программе, не зависящей от результатов ее выполнения, внешний контур программного управления, включающий носитель программы, всегда остается разомкнутым. Кодовая информация в процессе преобразования в сигнал управления предварительно дешифруется. При этом в ряде случаев, например, при программном управлении металлорежущими станками, возникает необходимость вычисления большого числа промежуточных точек по опорным точкам, заданным программой; Для этого используются специализированные вычислительные устройства или программы-интерполяторы.
Наибольшее развитие программное управление получило в машиностроении, применительно к фрезерным, токарным и другим станкам, а также в автоматических линиях (станки и линии ЧПУ —
Рис. 1.13. Структура системы программного управления
Задачи и методы управления 39
с числовым программным управлением) и в электронной промышленности при изготовлении микросхем и других компонентов, печатных плат и сборке готовых узлов. Системы ЧПУ делятся на две разновидности:
1) системы координатного управления для стартстопного перемещения рабочих органов механизма из одного положения в другое, с остановкой в каждой позиции для выполнения технологических операций;
2) контурные системы с передвижением инструмента и/или изделия по непрерывным плоским и пространственным траекториям, например, с целью обработки изделий сложной формы.
Воспроизводящие устройства систем ЧПУ станками являются разновидностью следящих систем и отличаются весьма высокими требованиями к динамической и статической точности. Прдграммы для станков разрабатываются с помощью специализированных пакетов прикладных программ на универсальных компьютерах — рабочих станциях с развитой компьютерной графикой. В некоторых случаях используется запись образцового цикла обработки изделия при ручном управлении станком. В процессорах ЧПУ, кроме интерполирования, могут быть предусмотрены и другие стандартные вычисления поправки на радиус инструмента, вычисление оптимальных технологических скоростей и так далее. Эти стандартные программное блоки вместе со следящими системами для управления приводами являются основной частью систем ЧПУ.
В машиностроении системы ЧПУ имеют особое значение при автоматизации производств с индивидуальным и мелкосерийным выпуском изделий или с частыми изменениями их конструктивных и технологических параметров (гибкие производства). При этом экономится время на подготовительные и наладочные операции; увеличивается точность и однородность изготовления изделий.
Основные проблемы при создании и эксплуатации систем программного управления и ЧПУ лежат вне сферы автоматического управления как такового. Главные трудности возникают в разработке и изготовлении прецизионных и малоинерционных исполнительных механизмов и датчиков высокой точности. Поэтому возможности создания ЧПУ существенно возросли с внедрением лазерных технологий.
Очень сходная ситуация возникает при управлении нестационарными объектами, когда технологический или иной управляемый процесс по существу заключается в переходе объекта в течение конечного отрезка времени из некоторого начального состояния в заданное конечное при заранее непредсказуемых полностью условиях.
40 Глава 1. Назначение, структуры и основные блоки САУ
В этом случае программа управления объектом должна вырабатываться или изменяться в процессе управления в зависимости от текущего состояния объекта с тем, чтобы достичь цели управления в условиях, когда ситуация может меняться заранее непредсказуемым образом. Проблемы создания динамической модели управляемого объекта или процесса здесь начинают играть решающую роль.
Примерами такого рода объектов могут служить абсолютное большинство действующих в настоящее время металлургических агрегатов по выплавке металлов, где целью переходного процесса в агрегате является получение конечного продукта с заданными свойствами.
Чтобы не вдаваться в тонкости металлургической технологии, рассмотрим знакомый каждому процесс, с точки зрения управления представляющий собой типичный нестационарный технологический процесс конечного типа, — процесс заварки чая.
Один из способов заварки состоит в следующем: в чайник, предварительно прогретый, закладывают ложку чая и заливают небольшим количеством кипятка, далее чайник прогревают при температуре немного ниже 100 °C и доливают кипятком. Всем известно, как важно, с одной стороны, в максимальной степени прогреть чай, чтобы извлечь в раствор максимум теина, дубильных веществ и других ингредиентов, составляющих букет чая, но, с другой стороны, не дать ему закипеть. Итак, имеется критерий — например, получение максимальной концентрации в растворе полезных веществ, имеются ограничения — по температуре и по длительности процесса и управляющее воздействие — подогрев — тепловая нагрузка (непрерывное воздействие).
В момент прекращения ее воздействия, совпадающий с доливанием заваренного чая кипятком, происходит ее переключение на нуль. Введение новой порции кипятка — тоже своего рода импульсное управляющее воздействие.
Фазовыми координатами процесса являются температура 0, концентрация полезных веществ в растворе с и объем раствора. Изменения 0 и с во времени можно представить графически так, как это показано на рис. 1.14. Температура остается почти постоянной, в то время как остальные переменные меняются в значительных диапазонах.
Характерным в Этом примере является отсутствие информации о важнейших параметрах процесса во время его протекания.
Однако в нашем примере есть признак, по которому следует переключить управляющее воздействие U, — момент всплывания чая на поверхность. Кстати, заметим, что с точки зрения теории управ-
Задачи и методы управления
41
Рис. 1.14. Временные диаграммы процесса заварки чая с точки зрения управления: 1 — переключение управления — тепловой нагрузки; 2 — начало разбавления кипятком; 3 — конец разбавления. Обозначения: 0 — температура, с — концентрация, U — тепловая нагрузка
ления процесс, показанный на рис. 1.14, оптимален. Это следует из его плавного характера — процессы такого типа называются процессами первого порядка, и для них действительно наилучшим способом управления является однократное переключение управления.
Предположим теперь, что мы не можем проследить за признаками, указывающими на необходимость изменения управления. Есть несколько возможностей обойти возникающие при этом трудности, и на них следует остановиться.
Первая возможность состоит в построении точной модели процесса, описывающей его динамику, — развитие во времени. Эта модель должна учитывать такие параметры, как скорость выхода полезных веществ в раствор, коэффициенты их диффузии в нем с учетом конвекционных потоков, теплоемкость раствора, теплоёмкость чайника, его способность отдавать тепло в окружающую среду и т. д.
Фактически такое полное описание процесса может оказаться весьма громоздким, управление процессом потребует значительной информационной производительности от вычислительного устройства, управляющего Нагревательным прибором и определяющего момент готовности чая для прекращения нагревания и дополнительной заливки его кипятком.
42 Глава 1. Назначение, структуры и основные блоки САУ
Очевидно, что этот последний момент — отключение подогрева и дополнительная заливка — должен быть вычислен заранее, чтобы эти операции были вовремя произведены.
Таким образом, процедура функционирования вычислительного устройства должна быть следующей: получив информацию об исходных параметрах (начальных условиях), то есть температуре, качестве чая и т. п., устройство должно вычислить прогноз нескольких вариантов процесса, выбрав из них тот, который обеспечит его оптимальный ход. Критерием может быть одна из двух величин: либо максимум концентрации полезных веществ в растворе (максимальное их извлечение), либо минимальная длительность процесса с заданной конечной концентрацией полезных веществ в растворе. Последняя задача называется задачей об оптимальном быстродействии.
Как видно, этот способ решения задачи выбора управлений требует тщательного изучения физико-химических основ процесса и определения множества коэффициентов.
Однако в большинстве практических случаев количество факторов, влияющих на технологический процесс, столь велико, что роль случайности в исходе оказывается значительной. Поэтому часто прибегают к совсем иному методу поиска управления.
В основе его лежат идеи английского математика Томаса Байеса об определении вероятности исхода эксперимента со случайном исходом, когда известен результат предыдущего эксперимента. Смысл этого метода заключается в постепенном накоплении опыта на основе полученных результатов. Впервые такой подход был развит российским ученым А. А. Фельдбаумом, который назвал его дуальным управлением — управлением с одновременным исследованием свойств управляемого объекта и соответственно постепенным накоплением опыта. Здесь снова вспоминается игра в «Известных людей», которая начинается с отсутствия какого-либо предварительного знания.
Возможен, наконец, компромиссный вариант, когда общая структура модели принимается заданной, а на основе опыта, получаемого в процессе управления, уточняются отдельные коэффициенты модели или отдельные взаимосвязи в ней.
Так или иначе, но идеологической основой построения системы управления оказывается достаточно адекватное знание свойств объекта, получаемое в результате идентификации его свойств, то есть процедуры определения соответствия его реакции на внешние возмущения и воздействия некоторым формальным построениям, в том числе математическим.
Задачи и методы управления 43
Контрольные вопросы
1. Перечислите и назовите блоки и устройства, входящие в САУ. Объясните их функции в системе.
2. В чём принципиальное различие между разомкнутыми и замкнутыми САУ?
3. В чём преимущества и недостатки управления по возмущению по сравнению с управлением с обратной связью?
4. Чем отличаются автоматические системы управления от автоматизированных?
5. Погрешность некоторого аналогового датчика составляет 0,25 %. Сколько двоичных разрядов (как минимум) должно быть у аналого-цифрового преобразователя, преобразующего сигналы этого дат- ~ " чика? Какое количество информации содержится в сигнале датчика?
6. Приведите примеры статически устойчивых и неустойчивых объектов.
7. Приведите примеры статических и астатических объектов.
8. Объясните различия между понятиями интегральной и дифференциальной нелинейности. Приведите примеры характеристик, для которых эти понятия совпадают.
9. В чём на ваш взгляд принципиальные отличия управления стационарными и нестационарными объектами?
10. Каково назначение систем программного управления?
Глава 2 ЛИНЕЙНЫЕ ЗВЕНЬЯ И РАЗОМКНУТЫЕ СИСТЕМЫ
2.1. Линейные системы и преобразование Лапласа
Линейным будем называть блок — систему (звено или совокупность соединенных между собой звеньев), если его поведение описывается линейным дифференциальным уравнением. Если поведение блока зависит только от времени и его параметры постоянны, то это будет обыкновенное дифференциальное уравнение относительно реакции системы у(0 на входное воздействие (возмущение) x(t) и его производные
ДоУ + а,у' + а-у" +... + aj/"’ = b^x + btx' + b^x" +... + ЬтЖт\ (2.1)
где а0, я,, а2, ...; а„, Ьо, bit Ь2, —, Ьт — постоянные и производные берутся по времени t.
Отметим сразу, что условием возможности физической реализации блока является неравенство п > т. Почему это так, будет пока-зано ниже.. 1
Если правая часть уравнения равна нулю, то решение у(0, описывающее поведение блока при заданных начальных условиях и при отсутствии возмущения, называется свободным движением или свободной составляющей переходного процесса. Полное решение уравнения (2.1) при заданной функции х(Г) и её производных включает в себя реакцию блока на приложенное в момент t = 0 воздействие (вынужденное движение), свободную составляющую и, если x(t) — периодическая функция, установившуюся реакцию, остающуюся после затухания переходного процесса.
Основное свойство линейных систем состоит в том, что к ним применим принцип суперпозиции, который гласит: реакция системы на сумму воздействий равна сумме реакций на отдельные воздействия.
В зависимости от типа звена те или иные постоянные коэффициенты уравнения (2.1) могут быть равны нулю: Например, если все коэффициенты, кроме д0 и Ьй, в (2.1) равны нулю, то получается
Линейные системы и преобразование Лапласа 45
уравнение безинернионного линейного статического звена, которое будем называть пропорциональным звеном'.
У^кх((), (2.2)
где к* bQ/a0 коэффициент передачи или усиления.
Ерли только at .* 0 и Ьо * 0, то получаем астатическое или интегрирующее звено (1.5). Так как
в|У' = М0, (2-3)
то
/= (1/Ти)|х(Г)Л + С, (2.4)
где постоянная времени интегрирования Ти == Ьй/а}, а С — произвольная постоянная.
Решение линейных дифференциальных уравнений существенно упрощается благодаря применению операторного метода, в котором дифференциальное уравнение преобразуется в алгебраическое путем заменк символа дифференцирования оператором р. Этот метод основан на преобразовании Лапласа:
F(j>y~]er*f(fydt, (2.5)
о
которое ставит В соответствие функции /(/) действительной переменней t (0 $ t s оо) функцию /(/>) переменной р. Функцию Г(р) называют изображением (по Лапласу) функции /(г), а функцию f(ty — оригиналам (изображения Р(рУу.
Здесь и далее функции — оригиналы обозначаются малыми, а соответствующие, им изображения — теми же большими буквами.
На самом деле, оператор р есть не что иное, как независимая комплексная переменная р = г+&, где г — действительная, со — мнимая части р иу = (-4)|/2 мнимая единица. Область допустимых значений г подбирается так, что интеграл (2.5) сходится.
Уравнение (2,5) сокращенно записывается в виде
Л[р) = £[/(0]. (2.6)
В физических приложениях, где t чаше всего имеет размерность времени, считается, что р имеет размерность круговой частоты со, то есть размерность (время)"1. Поэтому показатель экспоненты в (2.5) представляет собой безразмерную величину. Размерность F(py в ра
46 Глава 2. Линейные звенья и разомкнутые системы
венстве (2.5) есть размерность /(0, умноженная на время. Проверка размерности в уравнениях, содержащих р, часто бывает полезной.
Переход от изображений к оригиналам производится с помощью обратного преобразования Лапласа или обращения преобразования Лапласа:
/(О = (1/2лJ) J^F{p)dp при t> О, (2.7)
r-jo)
которое в сокращенном виде записывается так:
Л0 = 1_,[Лр)1- (2.8)
Связь между f(t) и Др) называется также соответствием и обозначается посредством знака соответствия:
ЛО « ДР)-
Некоторые соответствия оригиналов и изображений даны в Приложении 2. Подробные таблицы соответствий и изложение основных аспектов теории содержатся в (12]. Глубокое изложение теории преобразования Лапласа и весьма обширные таблицы можно найти в книге [6]. Наиболее полное собрание соответствий см. в справочнике [15].
При практических расчётах с использованием преобразования Лапласа использовать формулы (2.5) и (2.7) приходится чрезвычайно редко. Как правило, табличных соответствий оказывается вполне достаточно.
2.2. Грамматика преобразования Лапласа
При использовании преобразования Лапласа оперировать приходится не функциями времени, а их изображениями. Г. Деч уподобляет преобразование Лапласа переводу с одного языка на другой. Роль словаря при этом отводится таблицам соответствий, но одного словаря для перевода недостаточно. Необходимо ещё знать грамматику языка, на который делается перевод. Эго означает, что, если над оригиналами проводится какая-то операция, то должна проводиться соответствующая ей операция над изображениями.
Рассмотрим важнейшие «грамматические правила» преобразования Лапласа. Ряд дополнительных правил дан в Приложении 2.
Грамматика преобразования Лапласа 47
2.2.1. Сложение и умножение функций на постоянный коэффициент
Это правило устанавливает, что изображение суммы двух функций времени равно сумме изображений функций, взятых по отдельности. Умножению оригинала на постоянный коэффициент соответствует умножение на него изображения и обратно. Таким образом,
W + bf2(t)] =₽ fе-'ШО + bf2(t)]dt = о
= e~l"fi(t)dt + й] e-"'f2(t)dt = aF.fp) + bF2(p). (2.9)
о о .
Иными словами, суперпозиции оригиналов соответствует суперпозиция изображений.
2.2.2. Умножение аргументов на постоянный коэффициент (теорема подобия)
Умножение аргумента оригинала на постоянный коэффициент а > О приводит к делению аргумента изображения и, вместе с тем, самого изображения на этот постоянный коэффициент:
Да/) <=> F{p/а)/а. (2.10)
Эта теорема имеет ясный физический смысл. «Растяжение» шкалы времени в а раз приводит к аналогичному растяжению периодов всех колебаний, содержащихся в сигнале. Следовательно, частоты этих колебаний должны уменьшиться в а раз. Отсюда и следует необходимость деления р на а, если вспомнить, что р имеет размерность частоты.
Умножение аргумента изображения на постоянный коэффициент а>0 приводит к делению аргумента оригинала и, вместе с тем, самого оригинала на этот постоянный коэффициент:
Дар) ^f(t/a)/a. (2.11)
Случай, противоположный предыдущему. Умножение р на а равносильно росту в а раз всех частот, содержащихся в сигнале. Этому соответствует сжатие шкалы времени в а раз.
48 Глава 2. Линейные звенья и разомкнутые системы
2.2.3. Сдвиги оригинала по времени (теоремы смещения)
Сдвиг оригинала по оси времени вправо (запаздывание) на постоянное число т > 0 приводит к умножению изображения на е“рт:
(2.12)
При этом нельзя забывать,, что при отрицательных значениях аргумента функция f(t-x) должна быть равна нулю! Следовательно, график функции f(t-x) получается из графика функции f(t) (рис. 2.1, а) смешением последнего вправо на т и дополнением его в промежутке оси t между 0 и т нулевымй значениями (рис. 2.1, б). Эта теорема запаздывания играет важную роль при построении САУ, особенно в случае объектов с транспортным запаздыванием.
Рис. 2.1. Теоремы смешения. Показаны сдвиги оригинала (а) по оси времени при запаздывании (6) и опережении (в)
При переходе от изображения к оригиналу соответствие (2.12) указывает, что при t < т оригинал равен нулю.
Сдвиг оригинала по оси времени влево (опережение) на постоянное число х > 0 приводит к соответствию:
f(t + т) €> - Je~p,f(t№). (2.13)
о
Здесь график функции f(f) смешён по оси t влево на отрезок т (рис. 2.1, в). Такое смешение ведёт к исчезновению начальной части функции /(/) на промежутке оси t между 0 и т, так как новая функция — оригинал имеет «право на существование» только при значениях /й 0. Поэтому изображение Пр) не связано непосредствейно с усечённой слева функцией f(t+x), и в правой части соответствия появляется «конечный интеграл Лапласа» под знаком которого оказывается исчезнувшая начальная часть функции /(г).
Грамматика преобразования Лапласа 49
2.2.4. Сдвиг изображения (теорема затухания оригинала)
е-“'/(г)«>Лр + а). (2.14)
Хотя а может быть произвольным комплексным числом, действительное затухание оригинала будет только тогда, когда а — положительное вещественное число и функция /(/) — ограниченная.
2.2.5. Изображения производных оригинала (теорема дифференцирования оригинала)
Основное назначение преобразования Лапласа — решение линейных дифференциальных уравнений. Преобразование дифференциального уравнения требует, прежде всего, чтобы была преобразована каждая производная.
Рассмотрим
- . ЦЛ0] = р-'7’('И- ' о
Интегрируя по частям, получим:
= [e-'fif )]оя + 4 e^ftDdt = -/(0) + pF(p).
0 1
Аналогично
Ц/"(О] = = le-V(01o + =
О о
= -/'(0)-р/(0) + р7(р).
И вообще
£[/(я)(0] = -f(n~'XO) -pf{”-2\0) -р2/^-3^) - ... - /-’/(О) + /F(p).
3десь/(0),/'(0)./"(0), ...,/<я'|)(0) суть начальные значения функции f(t) и ее производных при t- 0. Таким образом, для преобразования дифференциального уравнения (2.1) необходимо знать все начальные условия.
Важность этого правила трудно переоценить, так как оно позволяет заменить процесс дифференцирования на элементарную операцию умножения. При пользовании этим правилом следует учитывать, что/(0),/'(0),/"(0)> •••> /(л-1>(0) — это не значения соответству
50 Глава 2> Линейные звенья м разомкнутые системы
ющих функций при 1*0 (они не всегда определены), а предельные значения этих функций при t -> 0 справа. Иными словами, Это значения, с которых f(t) и её производные начинают от точки t= 0 своё непрерывное изменение слева направо. Это отличие между «значением функции в точке» и «предельным значением при приближении к этой точке» очень существенно.
Применение этого правила подразумевает, что наивысшая производная существует и имеет изображение. Если производная имеет изображение, то им обладает и первообразная функция. Однако наличие изображения у первообразной функции не означает его наличия у производной. Например, функция In t имеет изображение, но её производная \/t изображения не имеет, так как
In /-» -со при г-> 0.
2.2.6. Оригиналы производных изображения (теорема дифференцирования изображения)
Изображение всегда обладает всеми производными по р, поэтому при его дифференцировании нет проблемы существования оригинала. Производные изображения без труда получаются дифференцированием (2.5) под знаком интеграла. Это приводит к следующим соответствиям:
t2f{t)« F"(p)-,
Здесь проявляется глубокая симметрия преобразования Лапласа. Подобно тому как дифференцированию оригинала соответствует умножение изображения на р, дифференцированию изображения соответствует умножение оригинала на -t.
2.2.7. Изображения интегралов оригинала
Применив интегрирование по частям, получим:
£[fZ(t)A] * jr"[f /(г)Л]Л = F(p)/p. 0 0 0
Грамматика преобразования Лапласа 51
Изображение функции /(г), проинтегрированной п раз от 0 до t, имеет вид
Лр)//-
2.2.8. Интегрирование изображения
Интегрирование изображения — достаточно сложная операция на комплексной плоскости и применяется Крайне редко. Поэтому это правило здесь приводится только ради полноты. Правило симметрично правилу интегрирования оригинала и имеет вид:
. р
Применение этого правила основано на предположении, что имеет изображение, а потому f{t) и подавно обладает изображением. _
2.2.9. Интеграл свёртки и произведение изображении
Предположим, что требуется оценить суммарный эффект от некоторого физического процесса, выходная переменная которого описывается функцией /(т), а сам процесс длится от т = 0 до т = /. Этот эффект, очевидно, описывается интегралом
о
Представим теперь, что на процесс действует некоторый фактор, зависящий от временного интервала t- т и воздействие этого фактора на процесс можно описать, умножая/(т) на весовую функцию f2(t- т). Тогда эффект от процесса будет иметь вид
J / (*)/(' - x)dx. о
Этот последний интеграл называется интегралом свёртки или просто свёргпкой функций/ и / и символически обозначается / ♦/. Этот символ не зря подобен символу произведения, так как свёртка имеет многие свойства последнего.
52 Глава 2. Линейные звеньям разомкнутые системы
А именно, свёртка обладает коммутативностью, то есть г
/i*/2=/2*Z> и ассоциативностью:
Откуда следует, чТо свёртывание нескольких функций приводит к Одинаковому результату независимо от последовательности свёрты- ; вания.
Операция свёртки играет огромную роль в'описаний многих процессов в физике и технике, но её важнейшая роль в проектировании и анализе САУ и электронных цепей обусловлена тем, что изображение свёртки оригиналов есть произведение изображений свёрнутых функций:
/1 */2 ♦—•/„«> РА ... F„.
Применение этого правила основано на предположении, что изображения сворачиваемых функций существуют, и интеграл Лап- ласа абсолютно сходится хотя бы для одной из них. Последнее озна- • чает, что всегда можно подобрать числа Л и а такие, что функция i Аеа' будет превосходить абсолютную величину f
2.2.10. Комплексная свёртка и произведение оригиналов
Симметричным к правилу свёртки оригиналов является правило свёртки изображений, которое символически представляется так:
и соответственно обладает коммутативностью и ассоциативностью. В развёрнутой форме изображение произведения функций /,(/) и /2(0 имеет вид:
Z(')/20) = (1/2я/р^)/№ - s)dp = (l/2itj) f“\(р - s)F2(p)dp. r-Jn r-Jm
Операция комплексной свёртки требует достаточно изощрённой техники интегрирования в комплексной плоскости и применяется не часто. Подробности и примеры применения комплексной свёртки можно найти в руководстве [12], а также в книгах [6, 14].
/ролоуллшкя <феобрдзо«аиияЛаллдса S3
2.2.11. Теорема о начальном значении оригинала
Если /(0) существует, то
/(0) « lim /(/) = lim pF{p).
f-»0
Эта теорема даёт возможность, зная изображение Др), определить начальное, при г-> 0, значение оригинала /(г), не вычисляя сам оригинал, что очень полезно и удобно в очень многих задачах.
Теорема имеет достаточно ясный физический смысл: «сжатию» оси времени к нулю соответствует предельный переход р, имеющего размерность частоты, к бесконечности, Но, применяя данную теорему, следует неукоснительно помнить о необходимости быть уверенным в существовании конечного (хотя и неизвестного)/(0), иначе легко попасть впросак.
Например, оригиналу
/(0 = (1/б,/гсоз(1/0
соответствует изображение
Др)— Дд) а (2л)|/2/ле"5 cos з,
где s = (2р)|/2.
Нетрудно видеть, что Нт рДр)» 0 При р -> да, но Пт/(г) при, /-» 0 не существует (/(0) -» да).
На практике существование /(0) обычно очевидно из физических соображений. Важно Не сделать Ошибки при вычислении Др) и lim рДр).
2.2.12. Теорема о конечном значении оригинала
Если стационарное значение fit) при / -» да [обозначаемое /(да)] существует, то
/(да) = lim /(/) = lim рТ(р).
Эта теорема даёт возможность, не вычисляя сам оригинал, но зная изображение Др), определить стационарное, при / -» да, значение оригинала/(/). При её применении следует соблюдать такую же осторожность, как и при применении теоремы 2.2.11, то есть необходимо быть уверенным в существовании конечного (хотя и неизвестного) /(да).
54 Глава 2. Линейные звенья и разомкнутые системы
Например, оригиналу
f(t) = sin at соответствует изображение
Др) = и/Ср2 + со2).
Нетрудно видеть, что limрДр) «О прир-> 0, но limf(t) при не существует (/(/) — периодическая функция).
В Данном случае существование /(<») далеко не всегда можно выяснить из физических соображений.
Физический смысл теоремы состоит в том, что «растяжению» оси времени соответствует «растяжение» периодов всех частот, содержащихся в сигнале.
2.3. Единичная ступенчатая функция Хевисайда, 5-функция Дирака, их изображения и переходные функции линейного блока
Единичная импульсная функция Хевисайда и(0 равна нулю при Г<0 и равна единице при t>0 (рис. 2.2, а). Таким образом, в момент времени t = 0 эта функция совершает скачок, образуя ступень, откуда и её названия «ступенчатая функция» и «единичный скачок». Значение и(0) не определено, обычно при необходимости принимают w(0) = 1/2 или w(0) = 1.
Изображение единичного скачка есть:
u(t)« U{p) = 1/р. (2.15)
Если единичный скачок произошёл не при t = 0 , а при / = т > 0 , то соответствующая ступенчатая функция имеет вид и(/-т) (рис. 2.2, б), а её изображение получается из правила сдвига (2.12):
u(t - т) « е~* U(p) * ё^/р. (2.16)
*(0 *(М
____________t -* г Г~ J
"oi “оь б)
Рис. 2.2. Единичная ступенчатая функция
ЕдиничиаЯсгНугкнчатая функция Хевисайда ' 55
С точки зрения классического математического анализа производная единичного скачка u'(i) всюду, кроме точки / = О, равна нулю, а в точке 0 не существует и
м'(0) -> оо, если t -> 0.
Понятно, что для функции «(г- т) производная u'(t - т) -> оо при 7 -> ’t-
однако действуя формально, можно получить изображение u'(t) в соответствии с правилом дифференцирования оригинала:
1[«'(О]/=рЦ«0)»Р^ (2.17)
Соответственно
L[u'(t~T)]^pL[u(t-r)]^pe^U(p)=p(e-in/p)^e-'’\ (2.18)
Функцию, изображение которой есть 1, называют 5-функцией Дирака 5(0, и она играет огромную роль в математической физике, теории электрических цепей и при анализе и исследовании систем
управления. Эту функция равна 0 всюду, кроме точки («О (или
при 5(Г- т)), в которой она бесконечно велика- Функцию 5(0 можно
рассматривать как воздействие бесконечной женное к системе на бесконечно Малом интервале времени. Грубая графическая интерпретация такой ситуации показана на рис. 2.3. Если длительность интервала времени воздействия есть А/, а «мощность» воздействия обратно пропорциональна этому интервалу и, следовательно, равна 1/Аг, то «работа» этого воздействия всегда будет равна единице, даже при А/ = 0.
«мощности», прило-
5(0 8(м)
Рис. 2,3. Модель 8-функций в виде коротких прямоугольных импульсов
Таким образом, 5-функция обладает следующими свойствами, которые являются для нее определяющими:
Свойство 1.
Функция 5(0 = 0 при f * 0 и 6(0 -> оо при /= 0.
Свойство 2.
js(O<ft»l'
(2.19)
56 Глава 2. Линейные звенья а разомкнутые системы
С практической точки зрения важнейшим является фильтрующее свойство 5-функции (рис. 2.4):
jx(t - т)5(т)Л = Jjc(t)5(/ - x)dx = x(t). (2.20)
Рис. 2.4. Фильтрующее свойство 6-функции
При использовании преобразования Лапласа (2.5) нижние пределы интегралов в (2.19) и (2.20) берутся равными нулю, а само свойство, выражаемое соотношением (2.20), есть непосредственное следствие правила свёртки (см. 2.2.9). Здесь необходимо отметить существенную тонкость. Если нижний предел интегралов в (2.20) взят -оо, то предполагается, что 5-функция имеет значение -ню строго в точке t = 0. Но тогда
' J6(r)dt = 1/2.
о
Поэтому при использовании интеграла Лапласа в форме (2.5) с нижним нулевым пределом предполагается, что 5(0 = и в точке / = +0, то есть правее точки t= 0 на бесконечно малую величину. Это равносильно тому, что принято и(0) =1.
Формула (2.20) непосредственно следует и из операционного соотношения:
£[х(0]- W)] = A(p)- 1=Х(р). (2.21)
Из других свойств 5-функции отметим во-первых соотношение
5(аГ)« 5(г)/|а|, (2.22)
где а — произвольное действительное число.
Во-вторых, заметим, что так как
£(8(1”(/)]=/, (2.23) !
Единичная ступенчатая функция Хевисайда 57
то формулу (2.21) можно обобщить так:
Дх(0] • £[8(я>(0] = XW = Z[x<">(/)]. (2.24)
Помимо представления 8-функции в виде прямоугольного импульса единичной площади и бесконечно малой длительности её можно рассматривать как предел целого ряда «гладких» функций. Например:
8(0 = lim a е41' при а -> <ю.
Другая аппроксимация 8-функции — представление её в виде
8(0 =* Пт а/л(а2/2 + 1) При а -> а>.
Эта аппроксимация показана на рис. 2.5. Она особо полезна для наглядного представления поведения производной 8-функции (рис. 2.6).
Рис. 2.5. Аппроксимация 8-функции распределением Коши
Рис. 2.6. Аппроксимаций производной 6-функции дифференцированием функций рис. 2.5
Единичный скачок и б-функция играют ключевую роль для сравнения характеристик линеййых систем и вычисления их реакций на произвольное возмущение. , .
Положим, что' на входе лййейной системы или блока появляется воздействие в виде единичкой импульсной функции — 5-функции. Реакция или отклик системы на такое воздействие называется импульсной переходной функцией системы, которую обозначим w(/). Если воздействие приложено не при t = 0, а при t- х > 0, то оно имеет вид 5(Г-т) и соответственно будем Иметь w(t- т).
Любую функцию времени можно представить суммой большого числа близко расположенных импульсов малой длительности, причем высота каждого импульса равна значению функции времени в момент появления импульса (рис. 2,7). Вычислим реакцию линейной системы на воздействие В виде произвольной функции времени! x(f). Для этого найдем вначале реакцию системы на каждый отдельный импульс в последовательные моменты времени t и затем просуммируем выражения реакций на каждый импульс. Тогда, как это
Единичная ступенчатая функция Хевисайда 59
Рис. 2.7. Представление функции времени как суммы близко расположенных импульсов малой длительности (на рисунке показан один из этих импульсов) и реакция системы на этот импульс
следует из принципа суперпозиции, сумма этих реакций будет как раз реакцией системы на произвольное воздействие.
Функция времени х(7), изображенная на рис. 2.7, воздействует на систему — блок, начиная-С 7 = 0, и равна 0 для 7<0. В момент времени t реакция на-5-функцию, приложенную в некоторый предшествующий момент т, равна импульсной переходной функции w(7- г). Если импульс, приложенный в момент т имеет длительность Дт, то его площадь равна х(т)Дт. Если рассматривать этот импульс как аналог 8-функций, то реакция на него системы в момент времени /> т есть
x(r)w(t-т)Дт.
Следовательно, суммарная реакция блока на все импульсы, содержащиеся в х(г) до момента времени т, составляет
У(7) = ^x(t)w(7 - т)Дт.
t«0
При Дт —> 0 эта сумма превращается в интеграл
У (7) = Jx(t)w(7 - т)А. (2.25)
о
Простой заменой переменных этот интеграл преобразуется к виду
y(t) = jx(e- t)w(t) dx. (2.26)
о
60 Глава 2. Линейные звенья и разомкнутые системы
Равенства (2.25) и (2.26) представляют два вида записи интеграла свертки. Согласно правилу «грамматики преобразования Далласа» 2.2.9 при переходе к изображениям имеем
у(Г) = |х(/-т)и’(т)А<=>Г(р) = Л(р)И'(р), (2.27)
О
где Y(p), Х(р) и И1» — изображения функций у(/), x(f) и w(t) соответственно.
Равенства (2.25)—(2.27) называют также теоремой Дюамеля, и оно выражает важнейшее свойство линейных систем: изображение выходного сигнала линейной системы есть произведение изображения входного сигнала на изображение импульсной переходной функции системы.
На практике, однако, экспериментально получить импульсную переходную функцию w(r) какого-либо объекта по меньшей мере трудно, ибо это связано с заданием Мгновенного и очень интенсивного входного ударного воздействия, имитирующего 5-функцию. Поэтому для исследования переходных процессов используются (если это допустимо) воздействия в виде единичного скачка и(Г) ограниченной амплитуды.
Если входное воздействие цд систему, находящуюся в начале в состоянии цокбя, имеет вид единичного скачка «(/), то реакция системы, называемая переходной функцией, будет иметь вид
Л(Г). = J "(О А Я(р) = И/(р) U(p) = W(p)/p, (2.28)
о
и импульсная переходная функция вычисляется как w(0 = А'(/).
Соответственно интеграл Дюамеля (2.25), выражающий реакцию системы на произвольное входное воздействие x(t), получает вид
y(t) - d|х(т)Л(/ - т) А / dt. (2.29)
о
Следовательно,
П₽)’Л)Я(Р). (230)
Итак, для определения реакции линейной системы на произвольное входное воздействие достаточно знать её реакцию на сигнал в виде 6-функции (импульсную переходную функцию системы) или реакцию на единичный скачок (переходную функцию системы).
Передаточная функция разомкнутой лилейной системы 61
2.4. Передаточная функция разомкнутой линейной системы
Поведение линейной системы без запаздывания в общем виде определяется уравнением (2.1). Вычислим изображение Y(p) реакции (отклйка) y(t) этой системы на произвольное входное воздействие x(f) с изображением Х(р). Применим к обеим частям уравнения (2,1) преобразование Лапласа. Тогда:
a0Y+ alYp + a2Ypl + ... + a„Yp" = Ь^Х+ biXp + b2Xp2 + ... + bm Xpm, (2.31)
где аргументы в скобках (р) опушены для простоты записи.
После простейших преобразований получим:
Y(p) = ИШ)- (2-32)
где
W(p) = (b0 + btp + b2p* +... + ЬтрГ) / (а0+ а}р + а2р2 + ... + a„pf). (2.33)
Функция комплексного переменного ИфО называется передаточной функцией системы, так как она связывает изображения входного И выходного сигнала. Из сравнения (2.32) и (2.27) можйо видеть, что Мр) есть не что иное, как изображение импульсной переходной функции системы.
Другое, эквивалентное определение передаточной функции: передаточная функция системы есть отношение изображений по Лапласу выходного сигнала ко входному.
Если статическая система устойчива, то её коэффициент передачи можно получить из (2.33), используя теорему о конечном значении оригинала 2.2.12. Зададим на вход системы единичный скачок х(0 » и(0- Изображение отклика системы на него — переходной функции системы у(0 = Л(0 получим подстановкой (2.15) в (2.32):
Y[p) = И(р) = W(p)/p. (2.34)
Чтобы получить значение коэффициента передачи, надо вычислить
lim y(O/x(f) = Нтй(г)/и(/) = Пт й(0.
/->х /-♦«
Здесь принято во внимание, что
lim и(/) = 1.
1-*<П
62 Глава 2. Линейные звенья и разомкнутые системы
Согласно теореме о конечном значении оригинала, учитывая (2.34), имеем:
НтЛ(О - limp//(p) = lim И'(р). (2.35)
/-♦х />->0 р—*0
Таким образом, коэффициент передачи устойчивого линейного статического блока — звена или системы равен пределу его переходной функции при t -> да или пределу передаточной функции при р -> 0. Подчеркнём, что в этой интерпретаций понятие коэффициента передачи применимо только к статическим звеньям и системам.
Представим Теперь, что два блока с передаточными функциями ^(р) и Wj(p) соединены последовательно, как это показано на рис. 2.8, а- Изображение сигнала йа выходе первого из них будет иметь вид:
Щр\^Х(р)Щр), а на выходе второго
Ш = Y&) WS(p) = Х(р) ^,(р) ОД>), следовательно, передаточная функция И^р) системы из последовательно соединённых блоков есть произведение передаточных функций этих блоков'
^)= W^) s W W (2.36)
Понятно, что это правило перемножения передаточных функций распространяется на произвольное число последовательно соег динённых линейных блоков.
При параллельном соединении блоков их входы объединены, а выходные сигналы суммируются (рис. 2.8, <5). Следовательно, для схемы рис. 2.8, б можно записать
ПР) = И(Р) + И(Р) = %(р) «№) + %(Р) Щр) = Х(р){ V,(p) + ^(р)],
Рис. 2.8. Последовательное (а) и параллельное (б) соединение блоков
Передаточная функция разомкнутой линейной системы 63
откуда передаточная функция всей системы есть
»Цр) = Цр)/Др) = ^(р) + И<(р). (2.37)
Таким образом, при параллельном соединении линейных блоков их передаточные функции суммируются.
Представление №(р) в виде частного двух полиномов относительно р не позволяет достаточно полно судить о свойствах системы. Поэтому желательно представить систему в виде комбинации последовательно и/или параллельно соединённых простых звеньев.
Из основной теоремы алгебры следует, что любой полином с действительными коэффициентами, например,
an+alp + ct2pl + ..+aljf
.может быть разложен на множители следующим образом:
a0 + atp + а^ + ... + а„р^ а„(р - pt)(p - р2)... (р-р„),
где pj, р2, ..., рп — корни характеристического уравнения относительно р:
ай/а„ + а\р/а„ + а2рг/а„ + ... + р" = 0. (2.38)
Среди этих корней некоторые могут быть равны друг другу (кратные корни). Кроме того, корни могут быть комплексными числами вида otjQ. В любом случае общее число корней равно степени полинома л. Комплексные корни могут быть только попарно комплексно сопряженными. Это означает, что если имеется корень c+jCl, то обязательно присутствует и корень c-jQ. Положим v = -о, тогда произведение двух сопряженных корней даёт квадратный двучлен с действительными коэффициентами вйда
р2 + 2vp + v2 + О2.
Следовательно, полиномы в числителе и знаменателе (2.33) могут быть разложены на множители, и передаточная функция представлена в виде:
^(Р) = k'oft (Р + МЙ^2 + 2v,p + V,2 + П?)х
хЙ‘/(р+Л/)Й1/о»2 + 2v,p + v2 + О,), (2.39)
<=i м
где — масштабный множитель, П — знак произведения, -X, — действительные корни числителя или знаменателя, -v, — действи-
64 Глава 2. Линейные звенья к разомкнутые системы
тельиые части комплексно сопряжённых корней числителя или знаменателя, Q, — мнимые части комплексно сопряжённых корней числителя или знаменателя, М — число действительных корней числителя, Р — число пар сопряженных корней числителя, N — число действительных корней знаменателя, Q — число пар сопряженных корней знаменателя.
Таким образом, линейная система может быть представлена как последовательное соединение пропорционального звена с переда-
точной функцией
*1» = ^ (2.40)
и звеньев с передаточными функциями следующих типов: + (2.41)
ИЧ» = р2 + 2vp + v2 + Q2; (2.42)
И4>) = 1/(р + Х); (2.43)
l/(p2 + 2vp + v2 + Q2). (2.44)
Звенья с передаточными функциями (2.41) и (2.43) называются | звеньями первого порядка, звенья (2.42) и (2.44) — второго порядка. ’
Выходной сигнал системы (2.1) может зависеть от значений I входного сигнала и его производных, сдвинутых в прошлое на не- S кий фиксированный интервал времени т. Так бывает, например, ] если объект имеет значительные размеры, и вследствие этого эф- 1 фект от управляющего воздействия возникает не сразу (транспорт- 1 ное запаздывание). Поэтому к перечисленным типам звеньев необ- I ходимо добавить звено чистого Запаздывания. В этом случае в пра- I вой части уравнения (2.1) должно подставляться t-т вместо 1, и в | соответствии с теоремой смещения 2.2.3 правые части уравнений | (2.31), (2.32) и (2.33) умножаются на еЛ Таким образом, передаточ- | ная функция звена чистого запаздывания есть |
И4» = ег\ (2.45) ]
Само по себе нахождение корней числителя и знаменателя вы- | ражения (2.33) может оказаться достаточно непростой задачей по- | стольку, поскольку это связано с решением алгебраических уравне- | ний выше третьего порядка. Поэтому обычно стараются на основе 1 анализа технической структуры системы и составляющих её элемен- | тов сразу получить передаточную функцию системы в виде комби-нации простых звеньев с передаточными функциями (2.40)—(2.45). л
Передаточнаяфунйция разомкнутой линейной системы 65
Для анализа систем форма представления передаточных функций (2.39) и (2.41)—(2.44) — не самая удобная. Дело в том, что передаточные функции (2.41)—(2.44) — величины, имеющие размерности — либо частоты [(2.41) и (2.42)], либо времени [(2.43) и (2.44)]. Гораздо удобнее представить систему в виде последовательного соединения звеньев с безразмерными передаточными функциями, зависящими от р, и одного пропорционального звена с коэффициентом передачи, размерность которого равна отношению размерности выходного сигнала к размерности входного. Технику подобных преобразований лучше всего увидеть на конкретных примерах.
Пример 1. Рассмотрим передаточную функцию:
------- W» = i^(p+X)/y + 2vp + v2 + Q2), (2.46)
в которой X, v и Q не равны нулю. Вынесем X и v2 + Q2 за скобки и обозначим Т( а 1/X и Т22 = l/(v2 + Q2), тогда
W) = Л^Х(р/Х + 1) / «V2 + Q2) [р2/(v2+п2) + 2vp/(v2 + П2) + 1 ]} =
= адр+1)/(Т2У + 2^Т2р+1), (2.47)
где Kq = Ку^/(уг + П2) и ^ = vT2. Теперь размерность Bi» есть размерность Ко, а остальная часть В4» стала безразмерной величиной.
Пример 2. Пусть теперь в передаточной функции (2.46) 1 = 0, но по-прежнему v * 0 и Q * 0. Теперь X нельзя выносить за скобку, и рационально преобразовать Bi» следующим Образом:
И4» = КооР / {(v2 + Q2) [»/(? + П2) + 2vp/(v2 + Q2) + 1]} =
= ^Т2р/(7?» + 2^Т2р+1), (2.48)
где Kg= KoqT2. В числителе здесь появилось «безразмерное» звено вида Т2р.
Пример 3. Исходная передаточная функция имеет вид:
ад = А^/(р + Х)(р + у), (2.49)
где X # 0 и v * 0. Вынося X и v за скобки и приняв 1Д = Г] и 1/v = Т2, получим:
тр) = Ко/(Т,р + 1)(Т2р+1), (2.50)
где Kq — Kqq / Xv.
3- 8764 Гальперин
66 Глава 2, Линейные звенья и разомкнутые системы
Пример 4. Исходная передаточная функция имеет вид (2,49), но X * 0 и v = О, поэтому выносить v за скобки нельзя. Приняв 1/Х = Т\ и X/Xqo = Т2, получим:
W{p) = \/T2p(T\p + 1), (2.51)
где при совпадении размерности входа и выхода «исчезает» — в данном случае в нём просто нет необходимости. Здесь система состоит из двух звеньев первого порядка, одно из которых есть интегрирующее звено (см. правило 2.2.7) с постоянной времени интегрирования Т2.
2.5. Условия статической устойчивости
Рассмотрим передаточные функции основных типов звеньев (2.40)—(2.45). Прежде всего отметим, что звенья с передаточными функциями (2.41) и (2.42) не, могут существовать сами по себе как отдельные системы, ибо такие системы физически не реализуемы. Следовательно, эти звенья непременно должны входить в состав более сложных блоков с передаточными функциями типа
W = (p + X)/(p2 + 2vp + v2 + Q2), (2.52)
lH>) = (p + X)/(p + v), , (2.53)
<9
Импульсные пе-функции устой-
Рис. 2.9. реходные чивых статических звеньев
1Цр) = (р2 + 2Хр + X2 + у2) / (р2 + 2vp + v2 + Q2), (2.54)
где греческими буквами по-прежнему обозначены корни полиномов или их части, взятые с обратным знаком.
вспоминая, что W(p) есть изображение импульсной Переходной функции и воспользовавшись таблицами Приложен ния 2 и правилом 2.2.1, нетрудно заметить, что все импульсные переходные функции звеньев (2.43), (2.44), (2.52), (2.53) и (2.54) содержат множители е“'", где -v — действительная часть корня (или корней) знаменателя. Это означает, чтб при v > 0 импульсная переходная функция неограниченно затухает, стремится к нулю при t <ю (рис. 2.9).
Отсюда следует, что при v > 0 нац& звенья статически устойчивы, ибо при лю-
Условиястатической устойчивости 67
Рис. 2.10. Импульсные переходные функций неустойчивых звеньев
бом входном воздействии (вспомним интеграл Дюамеля (2.25)—(2.27)) они возвращаются в исходное состояние покоя, когда это воздействие прекратится.
При v < 0 импульсная переходная функция неограниченно растёт при г -> <ю, так как растёт быстрее любой другой функции, входящей в решение линейного урав-. нения. Поэтому при v < 0 отклик звена на любое, сколь угодно малое входное воздействие (а'таковое всегда найдётся из-за шумов) . будет неограниченно расти, и звено никогда не вернётся в. исходное состояние,
если к нему не приложить некое компенсирующее воздействие или если его свойства радикально не изменятся (рис. 2.10). Звено статически неустойчиво. ’
* Вспомним двухколёсный велосипед — пример классической статической неустойчивости. Он обязательно начнёт падать, если к нему не прикладывать управляющее воздействие, компенсирующее наклон, и он будет падать, пока его свойства как системы радикально не изменятся после падения на землю.
Особыми случаями являются ситуаций, когда v = 0.
Если это звено первого порядка с передаточной функцией вида
1Цр) = 1/Г2р, ’ (2.55)
то это — интегрирующее звено. Подобная ситуация была р Примере 4 предыдущего параграфа. Интегрирующее звено — звено астатическое, но устойчивое. Его выходной сигнал не будет бесконечно расти под действием возмущения в виде 5-функции, но и не вернётся к исходному состоянию/ На выходе звена образуется ступенчатая функция с амплитудой, обратно пропорциональной Т2:
Г,[1/Т2р] = «(П/Т2. (2.56)
Второй особый случай — звено второго порядка С передаточной функцией (2.44). При v = 0 его передаточная функция получает вид:
1Ир)=1/(р2 + П2). (2.57)
Оригиналом этого изображения, то есть импульсной переходной функцией звена, будет синусоида '
£~'f 1/(р2 + О2)] = (1/Q) sin ОЛ. (2.58)
68
Глава 2. Линейные звенья и разомкнутые системы
Это значит, что (2.57) есть передаточная функция классического математического маятника или иначе консервативного колебательного звена. Так же как и интегрирующее звено — это звено устойчивое в том смысле, что его реакция на 5-функцию — ограниченные по амплитуде устойчивые колебания. Но в отличие от интегрирующего звена практически реализовать настоящее консервативное звено не удаётся, — всегда присутствует в той или иной форме рассеяние энергии колебаний, что равносильно v > 0, пусть и очень малому. В случаях механических систем энергия рассеивается за счёт трения, в электрических и электронных приборах — за счёт потерь в активных сопротивлениях (тепловое рассеяние) и за счёт излучения электромагнитных волн.
Резюмируя сказанное, можно сформулировать следующую важную теорему:
Условием статической устойчивости линейной системы является отсутствие у знаменателя передаточной функции системы корней с положительной действительной частью.
Нетрудно убедиться, что если все корни полинома имеют отрицательную действительную часть, то все коэффициенты этого полинома имеют один и тот же знак (или часть их равна нулю). .
Следовательно: . :
Для устойчивости линейной системы необходимо, чтобы знаки всех коэффициентов знаменателя её передаточной функции были оди-; наковы, I
Здесь необходимо сделать два важных замечания:
1. Для того, чтобы разомкнутая система, состоящая, из последовательно и/или параллельно соединённых линейных звеньев, в целом оказалась статически неустойчивой достаточно, одного единственного > статически неустойчивого звена в её составе. < )
2. Если даже все коэффициенты знаменателя передаточной функ- я ции имеют один и тот же знак, это не означает, что система устойчива, ч Это условие необходимое, но не достаточное! Достаточным это условие является только для звеньев первого и второго порядка. q
р п 2.6. Частотные характеристики
Передаточная функция полностью определяет поведение линейной системы при любых входных сигналах. Переходные функции показывают реакцию системы на разовые ударные воздействия — вХод-^П
Частотные характеристики 69
ные сигналы. Для исследования поведения систем в установившихся режимах используются входные синусоидальные сигналы в предположении, что эти сигналы действуют настолько долго, что все переходные процессы закончились. Синусоидальный сигнал имеет то преимущество при анализе линейных систем, что реакция системы на Него есть также синусоида той же частоты. Это следует из того1, что синусоидальный сигнал
- < х(0 = « sin (<о/ +ф),
где а амплитуда сигнала, со — угловая частота и ф — фазовый сдвиг, можно представить в комплексной форме. Воспользуемся для этого формулой Эйлера для. комплексных чисел:
a(cos а + j sin а) = ае^.
. Тогда
х(Г) = а(е*‘,+” - (2.59)
Это представление равносильно изображению сигнала в виде вектора на комплексной плоскости. В силу того, что при дифференцировании и интегрировании экспоненциальных функций получаются те же экспоненциальные функции только с другими постоянными коэффициентами, при Задании на вход линейной системы синусоидального сигнала на выходе получится сигнал, отличающийся от входного амплитудой и фазой, но той же частоты.
В линейной системе, описываемой уравнением (2.1), в том числе с запаздыванием; при задании на вход смеси сигналов на выходе системы оказывается сумма реакций на каждый из этих сигналов. Следовательно, в сумме синусоидальных сигналов амплитуда и фаза каждого сигнала передаются на выход так, как если бы каждый сигнал подавался в отдельности.
Поэтому, есди положить действительную часть комплексной переменной р = г+7® равной нулю г* О, придать и физический смысл частоты и подставить в ИИ(р) р = ja>, то можно записать выражение, подобное (2.32):
Г(усо) = Щу©)Я/«>). (2.60)
, Функцию И^/®) называют (комплексным) коэффициентом передачи или амплитудно-фазовой характеристикой (АФХ) системы.
70 Глава 2. Линейные звенья и разомкнутые системы
Её можно представить в различных формах. Во-первых, в виде произведения
ИХ» = к(<о)еМа\ (2.61)
где Л(со) есть отношение амплитуды выходного сигнала к амплитуде входного сигнала на частоте со и ср(со) — разность фаз выходного и входного сигнала на частоте со. Функцию Л(со) называют амплитудно-частотной характеристикой (АЧХ) системы, а ср(ш) — фазо-частотной характеристикой (ФЧХ) системы.
Во-вторых, ИХ» можно представить в векторной форме на комплексной плоскости (рис. 2.11, а).
Модуль этого вектора | ИХусо)| = £(«>), а угол наклона сдвиг фазы <р(со) выходного сигнала по отношению ко входному. По теореме Пифагора величина Л(со) есть
= | ИХ» | = {Re2[ ИХ»] + Im2[ ИХ»]}1/2, (2.62)
где символ Re означает Действительную часть ИХ», a Im — его мнимую часть. При векторном представлении ИХ» фазовый сдвиг выходных колебаний относительно входных может быть вычислен по формуле:
Ф (со) = arctg {Im( ИХ»] / Re[ ИХ»]}. (2.63)
При изменении частоты со конец вектора АФХ описывает на комплексной плоскости траекторию, называемую годографом АФХ. Пример годографа АФХ приведен на рис. 2.11, а.
Помимо представления АФХ в виде годографа на комплексной плоскости широко используется и весьма удобно для анализа и синтеза линейных систем раздельное построение АЧХ и ФЧХ как функций со.
АЧХ строят в двойном логарифмическом масштабе. Это значит, что по оси абсцисс линейно откладывают десятичный логарифм частоты со, а по оси ординат — АЧХ, выраженную в децибеллах (сокращённо дБ):
Л(ю)[дБ] = 20 log, 0 k(a) = 201g £(со).
Построенную таким образом АЧХ называют ЛАЧХ (логарифмическая АЧХ). При построении ЛАЧХ по оси абсцисс удобнее откладывать логарифм безразмерной величины — произведения частоты
Частотные характеристики
71
Рис. 2.11. Представление АФХ W(/to) в виде годографа на комплексной плоско- - сти (а) и как совокупности ЛАЧХ и ФЧХ (5)
j ' ’ •
на одну из постоянных времени системы. Такой приём и будет использован ниже.
ФЧХ, соответствующую ЛАЧХ, строят в полулогарифмическом масштабе, используя такую’ же ось абсцисс, что и для ЛАЧХ. Пример построения ЛАЧХ и ФЧХ приведен на рис. 2.11, б.
Термийы, применяемые при построении и анализе ЛАЧХ и ФЧХ, взяты из акустики. Если две частоты ш, и <о2 отличаются в два раза или ш2 /ю, = 2, то говорят, что они отличаются на октаву, если отношение со2 /со2 » 10, то говорят об отличии на декаду. Изображая изменения амплитуды и Частоты в логарифмическом масштабе, можно аппроксимировать многие АЧХ прямыми или отрезками прямых. Это возможно благодаря тому, что при перепадах частоты, превышающих декаду, АЧХ большинства звеньев изменяется пропорционально целой (положительной или отрицательной) степени частоты, то есть
Л(«>) ~ а>".
Поэтому £(<о) [дБ] = 20 л 1g со + С, где С — некоторое исходное значение £(о)0) [дБ] на частоте со0. При таком подходе аппроксимация ЛАЧХ представляется прямой с наклоном 20л децибелл на декаду, сокращённо [дБ/дек.]. Иногда в качестве единицы наклона ЛАЧХ используют децибелл ы на октаву [дБ/окт.], причём 20л [дБ/дек.] • бл [дБ/окт.]. Таким образом, звенья первого порядка (2.41) и (2.43) имеют наклон прямых, аппроксимирующих ЛАЧХ, ±20 дБ/дек., звенья второго порядка (2.42) и (2.44) — ±40 дБ/дек.,
72
Глава 2. Линейные звенья и разомкнутые системы
звенья нулевого порядка, — пропорциональное и задержки,' — нуле4 вой наклон.
Для комплексного коэффициента передачи сохраняют силу правила последовательного и параллельного соединения звеньев, установленные для передаточных функций (2.36) и (2.37). Рассмотрим последовательное соединение двух линейных устойчивых блоков (рис. 2.8, а) с комплексными коэффициентами передачи
И'Х» = Л1(ш)еЛ<‘‘) (2.64)
и
И"2ОЪ) =Jt2(®)eJ*(B), (2.65)
где А:,(со) и Aj/co) — амплитудно-частотные, а <р(©) и у(со) — фазо-частотные характеристики.
АФХ последовательного соединения получим из (2.64) и (2.65), учитывая (2-36):
= ^U(o)»SC/®)» 4l(©)^(»)e/We,+^e>’. ‘ (Ж)
Из (2.66) следует, что при последовательном соединении линейных блоков их АЧХ перемножаются, а ФЧХ -г алгебраически суммируются.
Для параллельного соединения не существует столь простых правил, Здесь приходится вычислять передаточную функцию суммы Wj>) в соответствии с (2.37) и, подставив в неё p-j®, далее по W(ja) «честно» вычислять АЧХ и ФЧХ.
В силу того, что АЧХ при последовательном соединении перемножаются, их логарифмы складываются, а потому имеет место соотношение:
А(оэ)[д Б] = 201glo^(©)A:2(m) :=± 20[lgiefc, (и) + J =
= Л,(®)[дБ] + Л2(ф)(дБ]. (2.67)
Таким образом, при последовательном соединении и ЛАЧХ, и ФЧХ просто суммируются — обстоятельство, чрезвычайно упрощающее расчёт линейных систем.
«Технологию» построения годографов АФХ, ЛАЧХ и ФЧХ полезно рассмотреть на конкретных примерах отдельных Динеййых звеньев и их стандартных сочетаний.
Типовые линейные звенья
73
2.7. Типовые линейные звенья
2.7.1. Пропорциональное звено
Пропорциональное звено с передаточной функцией (2.40) умножает сигнал на заданный коэффициент, никак не влияя на его форму, то есть
А(а>)= Kq = const
и
ф(<») = 0.
Если Ко — безразмерной коэффициент передачи (коэффициент усиления или коэффициент ослабления), то это — усилитель или " аттенюатор (делитель) соответственно. Если Кд имеет размерность, то его можно назвать масштабным коэффициентом или коэффициентом преобразования.
Это звено «в чистом виде» физически не реализуемо из-за того, что потери сигнала вследствие рассеяния энергии зависят от частоты. Поэтому пропорциональное звено всегда находится в комбинации с другими звеньями, хотя это и не всегда принимается во внимание. При Ко> 1 усилительное звено всегда требует подключения внешнего источника энергии.
2.7.2. Апериодическое звено
Звено с передаточной функцией (2.43) называется апериодическим или инерционным (1-го порядка). После приведения к безразмерному виду знаменателя его передаточная функция есть
М»=1/(1 + Гр), (2.68)
где Т — постоянная времени звена, а постоянный коэффициент, равный Т, отброшен. Соответствующая (2.68) импульсная переходная функция равна нулю при t< 0 и просто затухающая экспонента при t i 0:
и<г) = £-'[ И4»] = е,1Т1Т. (2.69)
Реакцию звена на единичный скачок можно вычислить, интегрируя w( г) по г или обращая изображение
Н(р) = 1/А1 + Тр). (2.70)
Отсюда получаем
Л(0=1-е-,/г. (2.71)
74
Глава 2. Линейные звенья и разомкнутые системы
На рис. 2.12, а показаны переходная и импульсная переходная функции апериодического звена.
Амплитудно-фазовую характеристику получим, подставив p=j& в (2.68):
1Ц»=1/(1+>7). (2.72)
Чтобы отделить действительную часть Wfjw) от мнимой, умножим числитель и знаменатель (2.72) на величину, комплексно сопряжённую знаменателю, то есть на 1 -JaT. В результате получим
Ж» = (1->Т) / (Г+>Г)(1
’ х[1/(1 + (в2Т2Я-/[<й77(1-Ршг7’г)].
Таким образом, действительная и мнимая части И^/©) есть
> ke(W»] = l/(l+©2T2)
« .' ’ . " ' ' 'х.. , .. ,....
Рис. 2.12. Апериодическое звено: а — переходная и импульсная переходная фун-. кции, б — годограф АФХ, в — ЛАЧХ и ФЧХ, г и 4 — электрические цепи — апё-1 риодические звенья J
Типовые линейные звенья
75
Используя (2.62) и (2.63), получаем
к(а) ~ | »U©)| = 1/(1 + со2Т2),/2; (2.73)
и
<р(о>) = arctg (-шТ). (2.74)
На рис. 2.12; б показан годограф АФХ апериодического звена, построенный по уравнениям (2.73) и (2.74) и представляющий собойполуокружность в комплексной плоскости.
Частотные характеристики апериодического звена показаны на рис. 2.12, в. Пока (о мала, то есть со« 1/Т и ы2Т2«. 1, величина Цю) = 1 и Л(®)[дБ] = 0. Напротив, при & » 1/Т и ®2Т2» 1 величина ’£(©) э (®2Т2)~|/2= 1/®Т. Следовательно, полоса пропускания апериодического звена, — плоская часть ЛАЧХ, — слева не ограничена, но, начиная с круговой частоты ®с= 1/Т, начинается спад А;(со)[дБ] с наклоном, асимптотически приближающимся к -20 дБ/дек., а фазовый сдвиг асимптотически стремится к -л/2. Эта частота мс называется сопрягающей, так как на ней горизонтальная, плоская часть ЛАЧХ переходит В наклонную. В данном случае угловая частота <ос одновременно является верхней границей полосы пропускания эвена. Соответствующая ей частота называется верхней граничной частотой
s 2лмс.
•Г гр. В I с
На этой частоте k(ts>e) = 1/21/2 или Цмс)[дБ] s-3 дБ и ф(®с) = = _л/4 = _45°.
Примерами апериодических звеньев могут служить схемы, показанные на рис. 2.12, гид при условии, что на их входах действуют источники с нулевым внутренним сопротивлением, а выходы не нагружены. Выходное напряжение схемы рис. 2.12, г рассчитывается обычным образом:
Ивых(» = KM(»(1/>Q / (Я + 1/>Q = Ивх(у®) / (1 +>Т), где Т= RC. Для схемы рис. 2.12, д получим тот же результат, но T-L/R. Следовательно, комплексный передаточный коэффициент обеих схем >
И4>)= 1/0+>Л-
В этих уравнениях можно произвести замену р и говорить соответственно о реактивных сопротивлениях 1/рС и Lp, а В^р) рассматривать как передаточную функцию соответствующей цеПИ.
76
Глава 2. Линейные звенья Л разомкнутые системы
2.7.3. Дифференцирующие звенья
Названия этих звеньев связаны с тем, что их выходной сигнал y(f) прямо пропорционален производной входного сигнала х(/) по времени
y(t) ~ dx(J)/dt.
Из правила 2.2.5 следует, что умножению изображения на р соответствует дифференцирование Оригинала. Поэтому звено с передаточной функцией (2.41) можно рассматривать в качестве параллельного соединения идеального дифференцирующего звена и пропорционального звена с масштабным коэффициентом- А,. При этом тот факт, что передаточная функция имеет размерность частоты, то есть [1/время], не должен смущать, так как при операции дифференцирования размерность операнда делится на время. Физически реализовать одиночное Дифференцирующее звено невозможно, однако формальное его введение в рассмотрёййё допустимо, и операция дифференцирования может быть приближенно реализована в управляющем устройстве САУ с высокой точностью.
Рассмотрим сначала ситуацию, когда в выражении (2.41) Х = 0. Преобразуем передаточную функцию (2.41) к безразмерному виду, введя масштабный множитель — постоянную времени дифференцирования Т с размерностью времени:
И1>)=7>. (2.75)
Переходная функция звена будетсогласно равенству (2.17) просто 8-функциеЙ, нормированной на Т, а импульсная переходная функция — производной от неё (см. рис. 2.6). АФХ Звена
WU^jnT (2.76)
имеет действительную часть, равную нулю, поэтому фазовый сдвиг не зависит от частоты:
<р(со) = arctg (+<ю) = const = л/2. (2.77)
Амплитудно-частотная характеристика есть
Л(ю) = | у©7'| = ©Т, (2.78)
следовательно, годограф АФХ дифференцирующего звена сливается с положительной полуосью мнимой оси комплексной плоскости, а ЛАЧХ представляет собой прямую с наклоном 20 дБ/дек!. (рис. 2.13, а, б), пересекающую ось частот в точке © = 1/Т.
Типовые линейные звенья
77
Рис. 2.13. Идеальное дифференцирующее звено: а — годограф АФХ, б — ЛАЧХ
Вернёмся й'передаточной функции (2.41) и рассмотрим случай, когда 0. Преобразуем (2.41) следующим образом:
. 1Цр)=р + Х = (1 + ТрУк)
где Т = 1Д. В этом виде звено превратилось в последовательное соединение пропорционального звена с масштабным коэффициентом X и звена с безразмерной передаточной функцией вида:
1Цр) = 1 + Тр, (2.79)
которая соответствует пропорциональному звену с Я^=1, включённому параллельно рассмотренному выше дифференцирующему звену. Импульсная переходная функция такого звена несколько экзотична — это сумма 8-функции и её производной, нормированной на Т. Переходная функция равна сумме единичного скачка и нормированной На Т 8-функнии (рис. 2.14, а).
h(fi
T8(t)
1
0| t
a) ico->oo
1 e>»0 Re
6)
Рис. 2-14. Параллельное соединение идеального дифференцирующего и пропорционального звеньев: а — переходная функция, б —* годограф АФХ, в — ЛАЧХ и ФЧХ
78 Глава 2. Линейные звенья и разомкнутые системы
Комплексный передаточный коэффициент звена (2.79) есть
И'(»=1+>7’. (2.80)
Вычисляем:
М<о) = 1ЯМ1 = (1 + <о2Т2)|/2 (2.81)
и
<р(ю) = arctg <оТ. (2.82)
Годограф АФХ звена есть полупрямая, параллельная положительной части мнимой оси и отстоящая от неё на 1 (рис. 2.14, б). ЛАЧХ и ФЧХ показаны на рис. 2.14, в. Прй со 1/Ги ®2Т'2 <к 1, поэтому и &(<») = 1, а Л(си)[дБ] s 0. В то же время при со » 1/Тц а2Т2 >1 величи-на А(<о)з(<о2Та)1/2 = <йГ, а потому /:(<в)[дБ] растёт и ее наклон асимптотически приближается к 20 дБ/дек. На сопрягающей частоте к>с = 1/Г имеем к (ис) = 2|/2 или *(<ос)[дБ] s 3 дБ и <p(toc) * п/Ь = 45°.
2.7.4. Квазмдиффвренцирующее звено
Квазидифференцирующим называют звено, имеющее передаточную функцию
W(p)=Tp/(\ + Tp), (2.83)
где Т — постоянная времени звена. Это звено можно рассматривать как последовательное соединения идеального дифференцирующего звена с передаточной функцией (2.75) и апериодического звена с передаточной функцией (2.68), имеющих одинаковые постоянные времени.
Сравнивая выражения (2.68) и (2.83), можно видеть, что импульсная переходная функция квазидифференцирующего звена с точностью до множителя есть результат дифференцирования импульсной переходной функции апериодического звена (2.69). Воспользовавшись правилом (2.2.5) и не забыв при этом о том, что функция (2.69) равна нулю при t < 0 и скачком получает единичное значение при t = 0, получим
< м<0 = 8(0)-е-'/г/Г.
Переходная функция — реакция на единичный скачок будет иметь вид
h(t) = e~,/T.
Ц
Функций w(0 и h(t) показаны на рис. 2.15, а и б.
> Типовые линейные звенья
79
Рис. 2.15. Квазидифференцирующее звено: а — импульсная переходная функция, б — Переходная функция, в — годограф АФХ, г — ЛАЧХ и ФЧХ, д и е — - -- электрические цепи — квазидифференцирующие звенья
Передаточный коэффициент звена есть
’ HW=>77(1+>D- (2.84)
Отделим действительную и мнимую части Ддо). Умножая числитель и знаменатель (2.84) на величину \-J<aT, комплексно сопряжённую знаменателю, получим
И</«>) = [ушД!-j&T) / (1 +У<вТ)(1 -jcoT)] =
= [со2?’2 / (1 + со2/’2)] +ЛшГ/ (1 + ш2Т2)];
Ие[1Ц»] = ©2Т2/(1 + <о27’2);
= ШТ/(1+со2Г2), откуда
£(ш) = |Х(>)| = ®//(1+ш2Т2)1/2 (2.85)
и
т <p(co) = arctg(l/wT). , (2.86)
Тот же результат можно получить, перемножая Л(со) дифференцирующего и апериодического звеньев [см. (2.73) и (2.78)) и суммируя ср(со) этих звеньев:
1 л/2 + arctg (-соТ) = arctg (1/соТ).
Годограф АФХ квазидифференцирующего звена показан на рис. 2.15, в. Он представляет собой полуокружность — зеркальное отражение годографа АФХ апериодического звена.
so
Глава 2. Линейные звенья и разомкнутые системы
На рис. 2.15, г показаны ЛАЧХ и ФЧХ квазидифференцирую-шего звена, построенные путём суммирования соответствующих характеристик дифференцирующего и апериодического звеньев. На частотах о « 1/Г, когда и о2 Г2 «к 1, величина k(a) s шТ, и Цсо)[дБ] растёт с наклоном 20 дБ/дек., а фазовый сдвиг близок к л/2. При со —> 0 наклон Аг(ю)[дБ] асимптотически приближается к 20 дБ/дек., а фаза — к я/2. Когда со»1/Т и со2Т2» 1 величина ми) = s со77(со27'2)|/2 = 1, а потому М<о)[дБ] = 0. На сопрягающей частоте сос = 1/7' имеем М<ос) = 2’1/2 или Л(сас)[дБ1 s -3 дБ и $(сос) = л/4 = 45°.
Таким образом, полоса пропускания звена ограничена снизу на частоте сос = \/Т. Частота
Угр.н — 1/2яюс
называется нижней граничной частотой.
Примерами электрических цепей — квазидифференцирующих звеньев могут служить схемы, показанные на рис. 2.15, д и е при условии, что на их входах действуют источники с нулевым внутренним сопротивлением, а выходы не нагружены. Постоянные времени этих цепей соответственно равны Т= RC и Т= L/R.
2.7.5. Форсирующее звено
В безразмерной форме передаточная функция форсирующего звена имеет вид
Wlp) = (\ + T^(l + Tp), (2.87)
где То > Т.
Отличие его от квазидифференцирующего звена состоит в том, что оно пропускает постоянную составляющую сигнала, что можно видеть из его переходной функции
Й(П = [Т+(ТО-7)НГ]/Т, (2.88)
показанной на рис. 2.16, а.
АЧХ звена получим, перемножая (2.81) и (2.73) (разумеется, подставив в (2.81) Т= То):
Ма>) = [(1 + со2То2) / (1 + со27’2)]|/2, (2.89)
а ФЧХ — складывая (2.82) и (2.74):
<р(со) = arctg (соГо) + arctg (-соТ). (2.90)
Частотные характеристики звена приведены на рис. 2.16, б и в. ЛАЧХ этого звена имеет две сопрягающие частоты сос1 = 1/Т0 и
Типовые линейные звенья
81
Рис. 2.16. Форсирующее звено: а — переходная функция, б — годограф АФХ, в — ЛАЧХ и ФЧХ, гид — электрические цепи — форсирующие звенья
1/Т. На рис. 2.16, г и д показаны электрические цепи, обладающие свойствами форсирующего звена. в
2.7.6. Интегродифференцирующее звено
Это звено имеет передаточную функцию вида (2.87), но при То < Т. Соответственно сохраняют свой вид и формулы для АЧХ и ФЧХ (2-89) и (2.90). Однако переходная функция
Л(0=1-(Т- Тй)е~',т/Т (2.91)
существенно отличается по форме от форсирующего звена (рис. 2.17, в). На рис. 2.17, б и в приведены характеристики интегродифференцирующего звена (это зеркальные отражения характе-
Рис. 2.17. Интегродифференцирующее звено: а — переходная функция, б — годограф АФХ, в — ЛАЧХ и ФЧХ, гид— электрические цепи — интегродиффе-ренцируюшне звенья
82
Глава 2. Линейные звенья и разомкнутые системы
ристик форсирующего звена), а на рис. 2.17, гид — электрические цепи с его свойствами.
2.7.7. Интегрирующее звено
Безразмерная Передаточная функция интегрирующего звена есть
1И(р)=1/7р, (2.92)
где Т — постоянная времени интегрирования. Импульсная переходная функция есть единичный скачок, а переходная функция — полупрямая линия, исходящая из начала координат (рис. 2.18, о):
Передаточный коэффициент интегрирующего звена
1К(>)= 1/>Т=-у/®Г (2.93)
не имеет действительной части подобно передаточному коэффициенту дифференцирующего звена. Из (2.93) непосредственно следует, что годограф АФК совпадает с отрицательной полуосью мнимой оси, АЧХ есть
к(<й) = <£>Т, (2.94)
и фазовый сдвиг постоянен и равен -я/2. Характеристики звена приведены на рис. 2.18, б и в.
IfflA
О_________Re
! (©-*00*
Рис. 2.18. Интегрирующее звено: а — переходная функция, б — годограф АФХ, в — ЛАЧХ
Интегрирующее звено может быть образовано, например, источником электрического тока, заряжающим ёмкость.
Типовые линейные звенья
83
2.7.8. Звенья второго порядка — колебательное, дифференцирующее, режекторное и резонансное
Звено с передаточной функцией (2.44) является звеном второго порядка. Безразмерная форма (2.44) имеет вид [см. выражение (2.47)]:
1Цр)=1/(ТУ + ад+1), (2.95)
где £ — параметр, называемый декрементом или постоянной затухания. Свойства звена зависят именно от величины !•. Действительно, корни полинома знаменателя определяются формулой:
А,г»Ч/Т±Й2-1),/2/Т.
'Если £ > 1, то знаменатель имеет два разных действительных отрицательных корня. При £ = 1 знаменатель имеет также два корня, но одинаковых. В обоих случаях звено с передаточной функцией (2.95) есть проста последовательное соединение двух устойчивых апериодических звеньев. Таким образом, колебательным звеном можно считать звено с передаточной функцией (2.44) или (2.95) при £<1-
Импульсная переходная функция колебательного звена имеет вид:
МО = Г-*(1 - ^2У'/2 e^sin [Г (1 - ^)'/7Г]. (2.96)
Соответственно переходная функция есть
Л(0 = 1 - е^/т cos [/ (1 - ^2)|/2/Т] -
- £(1 - ^2)-I/2e4'/rsin [Г (1 - ^2)|/2/Т]. (2.97)
Графики этих функций показаны на 2.19, а и б.
Комплексный коэффициент передачи колебательного звена с помощью обычного приёма — умножения числителя и знаменателя на комплексно сопряжённую знаменателю величину — можно представить в виде:
»U<o) = 1/(1 - ш2Т2 +>2^7) =
= (1 - со2Г2 ->2^Т) / [(1 - о? Г2)2 + 4§2со2Т21. (2.98)
Из (2.98) в соответствии с (2.62) и (2.63) следует:
к(ю) = 1/[( 1 - <в2Т2)2 + 4^2<в2 Т2]1/2; (2.99)
<р(а>) = arctg [~2^Т/ (1 - <d2T2)). (2.100)
84
Глава 2. Линейные звенья и разомкнутые системы
Рис. 2.19. Колебательное звено: а — импульсная переходная функция, б — переходная функция, в — годограф АФХ, г — ЛАЧХ и ФЧХ
На низких частотах, когда ю<к!/Т и <в2Т2«1, fc(co) = 1, &(сп)[дБ] = 0 и <p(co)sO. При со:» 1/7 и со272»1 величина Цсо) = \/(£>2Т2, а потому &(<о)[дБ] спадает с наклоном, асимптотически стремящемся к -40 дБ/дек. В этом последнем диапазоне фазовая характеристика, пройдя -тг/2 на сопрягающей частоте <лс = 1/7
Типовые линейные звенья
85
продолжает спадать, асимптотически приближаясь к -л. На частотах, близких к резонансной частоте:
Мр = (1 - &''2/Т,
при £ < 0,6 происходит подъём АЧХ. При малых £:
*(®Р) = 1/2$.
На рис. 2.19, в и г представлены АФХ, ЛАЧХ и ФЧХ колебательного звена.
Дифференцирующее звено второго порядка имеет передаточную функцию (2.42), которую можно привести к безразмерной форме
- ' И^(р) = Т2р2 + 2^Тр + 1, (2.101)
откуда видно, что оно может рассматриваться как комбинация дифференцирующих звеньев и пропорционального звена с единичным коэффициентом передачи.
Подставив в (2.101) р = ja>, получим после обычных вычислений АЧХ и ФЧХ в виде:
£(и) = [(1 - а>272)2 + 4$2а>2Т2],/2; (2.102)
<р(й) = arctg [2<в$Т/(1 - и2Г2)]. (2.103)
На рис. 2.20, а показаны ЛАЧХ и ФЧХ дифференцирующего звена второго порядка.
Рис. 2.20. ЛАЧХ и ФЧХ дифференцирующего звена второго порядка (а) и режекторного звена (б)
86
Глава 2. Линейные звенья и разомкнутые системы
Само по себе такое звено физически не может быть реализовано, но входит в состав режекторных («отбраковывающих») звеньев, предназначенных для подавления помех или сигналов фиксированной частоты. Примером такого звена может служить звено (или скорее целый блок) с передаточной функцией
Ж(р) = (Г2р2 + 2^Тр +!)/(! + Гр)2(1 + Тор), (2.104)
где ТоТ. Звено представляет собой последовательное соединение дифференцирующего звена второго порядка и трёх апериодических звеньев. Здесь 1/Г0 выбирается выше, чем максимальная частота полезного сигнала, а юр= 1/Тберётся равной частоте подавляемой помехи. Типичные ЛАЧХ и ФЧХ режекторного звена с передаточной функцией (2.104) показаны на рис. 2.20, б.
Резонансное звено можно рассматривать как последовательное соединение звеньев колебательного и дифференцирующего 1 -го порядка, имеющего постоянную времени, равную коэффициенту при р колебательного звена:
»Я>) = 2^Гр/(ТУ + 2^Тр+1). (2.105)
Соответственно, его импульсная переходная и переходная функции могут быть получены дифференцированием выражений (2.96) и (2.97) и умножением результата на 2^Т. Поэтому, в частности, переходная функция резонансного звена совпадает с импульсной переходной функцией колебательного звена с точностью до множителя 2^ Т. ЛАЧХ и ФЧХ резонансного звена можно получить как суммы этих характеристик колебательного и дифференцирующего звеньев. Переходная функция и характеристики резонансного звена приведены на рис. 2.21, а—в.
Электрические цепи с параллельным и последовательным колебательными контурами, показанные на рис. 2.21, г и д, — типичны^ примеры резонансных звеньев.
Для «идеальных» параллельного и последовательного колебательных контуров значения комплексного сопротивления на резонансной частоте становятся соответственно бесконечно большим и бесг конечно малым, так как векторы полных сопротивлений индуктивности и ёмкости ja>L и l/ja>C в этих цепях на резонансной частоте оказываются равными и направленными в противоположные стороны. Когда контур включён в цепь, содержащую активные сопротивления, то возбуждённые в нём колебания затухают из-за потерь, которые характеризуются декрементом затухания На резонансной
Типовые линейные звенья
87
Рис. 2.21. Резонансное звено: а — переходная функция, б — годограф АФХ, в — ЛАЧХ и ФЧХ, гид— электрические цепи — резонансные звенья
частоте контура а>р= 1/(ZQI/2 значение к(а) максимально и равно &(<йр) = 1, а <р(<й) = 0.
2.7.9. Звено задержки (чистого запаздывания)
Это звено описывает ситуацию, когда сигнал без искажения передаётся с задержкой во времени т. Для этого звена из формулы (2.45) имеем:
И^/Ф) = ехр(-усот). (2.106)
Чтобы выделить действительную и мнимую части комплексного коэффициента передачи звена, воспользуемся формулой Эйлера
I, H'ijco) = ехр(-усот) = cos сот - J sin сот, (2.107)
88
Глава 2. Линейные звенья и разомкнутые системы
из которой следует, что АЧХ звена £(со) = (cos2o>T + sin2on)l/2 = 1 (2.108)
и ФЧХ
ср(ф) = arctg (-sin сот / cos car) = arctg (-tg cor) = -cot. (2.109)
Следовательно, АФХ звена задержки есть окружность единичного радиуса (рис. 2.22, а), Лг(а>)[дБ] s 0, а ФЧХ — прямая в линейном масштабе и показательная функция со знаком минус — в полулогарифмическом масштабе (рис. 2.22, б).
а) б)
Рис. 2.22. Звено задержки (чистого запаздывания): а — годограф АФХ, б — ФЧХ
2.8. Связь между амплитудно-частотной и фазо-частотной характеристиками.
Неминимально-фазовые звенья
Рассматривая характеристики различных звеньев и их комбинаций в предыдущем параграфе, можно сделать вывод, что для многих из них существует тесная связь между амплитудно-частотной и фазо-частотной характеристиками. Установив эту связь, можно однозначно строить ФЧХ по данной амплитудно-частотной характеристике и вычисления фазового сдвига становятся ненужными. Однако для этого необходимо знать правила такого построения ,и условия, при которых эти правила применимы. /
Правило определения минимально возможного фазового сдвига при данной форме АЧХ было указано в 1940 г. Г. Боде. Элементы, подчиняющиеся этому правилу, называются минимально-фазовыми элементами. Под минимальной фазой понимается минимальное фа-г зовое запаздывание или вообще минимальный фазовый сдвиг при заданном наклоне ЛАЧХ. При построении САУ, а особенно в систе
Связь между амплитудно- и фазо-частотной характеристиками 89
мах с обратной связью следует, вообще говоря, избегать применения неминимально-фазовых элементов, так как они вносят добавочное запаздывание по фазе и увеличивают возможность неустойчивости, однако невозможно избежать неминимально-фазовых характеристик у объектов управления и некоторых типов датчиков и исполнительных механизмов.
В каждом элементе, очевидно, можно увеличить фазовое запаздывание, не оказывая влияния на амплитуду. Для этого достаточно последовательно подключить элемент задержки, например идеальную длинную линию передачи сигнала, коэффициент усиления которой не зависит от частоты, но которая вносит запаздывание по фазе в соответствии с соотношениями, полученными в 2.7.9. Таким -образом, максимальное запаздывание по фазе для данной амплитудно-частотной характеристики нельзя определить однозначно.
Связь между амплитудой и фазой у минимально-фазовых линейных блоков довольно, громоздка [26], но для практических нужд достаточна ее оценка, существенная при использовании амплитудно-частотных и фазо-частотных характеристик. Фазовый сдвиг на данной частоте а>0 в основном определяется наклоном амплитудно-частотной характеристики на этой частоте. На фазовый сдвиг оказывает также влияние наклон амплитудно-частотной характеристики в окрестности а>0. Однако это влияние быстро уменьшается с увеличением модуля разности частот |<в - <о0|. Если наклон амплитудно-частотной характеристики постоянен в некотором диапазоне частот, то фазовый сдвиг в середине диапазона <в0 стремится к величине
<р(<в = <в0) = (л/40) d{k(a>)[дБ]} / da> [радиан]. (2.110)
Таким образом, амплитудно-частотная характеристика, изменяясь с ростом частоты со скоростью ^/{Лг(<о)[дБ]} / da> = ±20л дБ на декаду, вызывает сдвиг по фазе, равный ±лп/2 радиан. При л = 1 фазовый сдвиг равен я/2 радиан (сравни с частотными характеристиками звеньев в 2.7).
Основанный на соотношении (2.110) подход очень полезен при экспериментальном исследовании систем и их элементов, когда есть уверенность в том, что все элементы в системе минимально фазовые (условие, которое обычно очевидно, например, из схемы электронного усилителя). Однако в тех случаях, когда нет уверенности в отсутствии неминимально-фазовых элементов, применение этого метода может привести к очень неприятным неожиданностям, вызванным добавочным запаздыванием по фазе. Поэтому в сомнительных случаях необходимо производить измерение и амплитуды и фазы.
90
Глава 2. Линейные звенья и разомкнутые системы
Определение неминимально фазовых элементов было дано Боде:
Если элемент устойчив, то есть знаменатель его передаточной функции не имеет корней с положительной действительной частью, то он обладает неминимально-фазовыми свойствами, если числитель его передаточной функции имеет такие корни.
Таким образом, «подозрительными» оказываются передаточные функции, включающие звенья вида (2.41) и (2.42). Если у такого звена коэффициенты имеют разные знаки, то это верный признак его неминимально-фазовых свойств. Классическим неминимально-фазовым звеном является, конечно, звено чистого запаздывания. Неминимально фазовыми свойствами этого звена обладают такие электрические звенья, как линии передачи и подобные им блоки с распределенными параметрами, например, теплообменники и тру-t бопроводы. Идеальная линия передачи имеет усиление, равное един нице на всех частотах, и сдвиг по фазе, пропорциональный частоте/
Неминимально-фазовыми характеристиками обладают многий электрические цепи. Фазо-врашаюшая цепь, изображенная на рис. 2.23, а является примером четырехполюсника с неминималь^ но-фазовыми свойствами. i
Мостовые и другие режекторные схемы, предназначенные для сильного ослабления определенной частоты (например, для подав*-ления сетевых помех), могут обладать неминимально-фазовыми свойствами, но это зависит от значений параметров. Пример такой схемы — двойной Т-образный мост, изображенный на рис. 2.23, 6. Если тщательно сбалансировать мост (так, что 4А1С1 = Я2С2), то можно достичь почти полного подавления тока на частоте и = (2С|2Л|Л2)_|/2. Небольшой разбаланс приводит к одной из двух возможностей. По одну сторону от баланса мост обладает свойства^ ми минимально фазовой цепи. По другую сторону от баланса амплитудно-частотная характеристика может иметь ту же общую форму, что и раньше, но фаза поворачивается на -2л радиан с увеличение^
Рис. 2.23. Неминимально-фазовые электрические цепи: а — фазоврашаюшая цепь и б — двойной Т-образный мост
Связь между амплитудно- и фазо-частотной характеристиками 91
частоты и, следовательно, является неминимальной. Числитель передаточной функции этой мостовой схемы представляет собой кубический многочлен относительно р, и условия неминимальной фазы имеют место, когда корни соответствующего кубического уравнения имеют положительные действительные части. При точном соблюдении баланса и работе моста на короткозамкнутую цепь числитель вырождается в квадратный двучлен.
Общим в фазовращающей цепи и в двойном Т-образном мосте является то, что входной сигнал передается по двум параллельным цепям и затем, складываясь, образует выходной сигнал. Всегда, когда такое явление имеет место, следует предполагать возможность неминимально-фазовой ситуации.
"Многие элементы являются неминимально-фазовыми. Одним из примеров может служить обычный стеклянный термометр, где входная и выходная величины представляют собой окружающую температуру и высоту ртути соответственно. При внезапном повышении окружающей температуры стекло расширяется, вызывая временное понижение уровня ртути, до которой поток тепла доходит за некоторое время — здесь имеет место транспортное запаздывание потока тепла. Только потом сама ртуть нагреется и расширится, на что также требуется время. Таким образом, на высоту ртути влияют два противоположных фактора — расширение стекла и расширение ртути, и это является аналогом параллельных цепей в мостовой схеме. Другим интересным и практически важным примером неминимально-фазового объекта являются некоторые старые системы управления самолетами. Когда такой самолет летит горизонтально и пилот хочет набрать высоту, он отклоняет рули высоты вверх. Немедленным результатом этого является понижение положения центра тяжести. Но когда продольная ось самолета отклонится вверх относительно линии полета, давление воздуха на нижнюю часть крыльев и фюзеляжа вызывает подъемную силу, в результате чего центр тяжести начинает подниматься. Частотная характеристика, связывающая угол подъема и ускорение центра тяжести, оказывается неминимально-фазовой. Изменение расположения акселерометра (датчика ускорения) позволяет устранить этот эффект.
Контрольные вопросы
1. В чём отличие свободного движения системы от вынужденного?
2. Сформулируйте принцип суперпозиции. Как он связан с линейностью системы?
92
Глава 2. Линейные звенья и разомкнутые системы
3. Выпишите дифференциальное уравнение колебательного звена.
4. Перечислите основные правила «грамматики» преобразования Лапласа. Почему это преобразование надо считать лилейным? >
5. Определите начальное и конечное значения оригинала изображения: (a,p + а2р2 + Ojp3 + а0)/(Ь|Р + Ь2р2 + b^p? + Ьлр‘). ' Назовите условия, при которых ваши ответы будут правильными.
6. Какие физические явления можно описать как воздействие в виде 8-функции и функции единичного скачка на некоторый объект? Приведите примеры.
7. Перечислите основные свойства 8-функции.
8. Что называется импульсной переходной функцией системы? Как связаны между собой импульсная переходная функция системы и реакция системы на единичный скачок? с. )
9. Объясните физический смысл интеграла Дюамеля.
10. Сформулируйте два возможных определения передаточной функции ) линейной системы. ,
11. Почему понятие коэффициента передачи неприменимо к астатиче- , ским системам? ,
12. Выведите правила вычисления передаточных функций последователь-^ него и параллельного соединения звеньев и блоков.
13. Выпишите 6 основных типов линейных звеньев. Какие из них физиче-“ ски нереализуемы, а реализуются только в последовательной комбинации с другими? 1
14. Сформулируйте условие статической устойчивости системы. Объяс- ( ните его.
15. Дана передаточная функция системы W(p) = Ко(1 + Тор)/(1 + Г,р)(Г2р2 + 2$Тр + 1), где Ко = 100, Го = 1 /20л: с, Г, = 1/2л с, Г = 1/200л с, £ = 0,2. Построить ЛАЧХ и ФЧХ системы.
16. Дана передаточная функция системы . i
W) = Ко(1 + Topj/T.pfl + Г2р)(Т2р2 + 2Цр + 1), где Ко = 1000, То= 1/20лс, Г, = 1/20лс, Г2 = 1/200л с, Г= 1/200л с, £ = 0,5. Построить ЛАЧХ и ФЧХ системы.
17. Дана передаточная функция системы
W(p) = К0Та р/(1 + Т,р)(Т2р2 + 2$Тр + 1), и '
где Ко = 10, Го= 1/20л с, Г, = 1/200л с, Г = 1/200л с, Е, = 1. По- : строить ЛАЧХ и ФЧХ системы.
18. Как соотносятся ЛАЧХ и ФЧХ минимально-фазовых систем? Приведи- ii те пример неминимально-фазового звена. < н
I г.
Глава 3
ЛИНЕЙНЫЕ СИСТЕМЫ
С ОБРАТНОЙ СВЯЗЬЮ И СИСТЕМЫ АВТОМАТИЧЕСКОГО РЕГУЛИРОВАНИЯ
3.1. Влияние обратной связи на передаточную функцию
Одноконтурная система с обратной связью графически может быть изображена в виде блок-схемы, представленной на рис. 3.1, где И^р) — передаточная* функция прямой цепи и р(р) передаточная функция цепи обратной связи. Входной сигнал х(Г) складывается с сигналом обратной связи г(0, их сумма воздействует на прямую цепь и вызывает на выходе реакцию у(0- Соотношение между изображениями входного сигнала и реакции на него получается, согласно рис. 3.1, следующим образом (как и выше изображения величин обозначаются соответствующими прописными буквами):
Y(p) = W(p)[X(p) + R(p)],
но
R(p) = р(р)У(р),
следовательно,
И'с (р) = У(р) / ТО = ТО / П - Р(р) ТО]- (3-1)
Это выражение является основным для одноконтурной системы с обратной связью, Wc (р) называется передаточной функцией замкнутой системы (общей передаточной функцией) и (р) = р(р) 1У(р) —
передаточной функцией разомкнутой системы.
Предположим, что и прямая цепь, и цепь обратной связи — линейные устойчивые статические блоки. Согласно уравнению (2.35) коэффициент передачи устойчивого линейного статического блока — звена или системы равен пределу его переходной функции при t -> оо или пределу передаточной
Рис. 3.1. Блок-схема одноконтурной системы с обратной связью
94 Глава 3. Линейные системы с обратной связью
функции при р -> 0. Поэтому при р -> 0 передаточная функция И^сСр) вырождается в число — коэффициент передачи замкнутой системы, не зависящий от частоты:
Кс = lim Wc (р) = lim ГК(р) / [1 - lim Р(р) • lim И^(р)] =
= ^/(1-^p), (3.2)
где KD и Лр — соответственно коэффициенты передачи прямой цепи и цепи обратной связи. Произведение К= K^KD называют петлевым усилением.
Термины отрицательная и положительная обратная связь употребляются для того, чтобы описать воздействие обратной связи по отношению к реакции системы. Изредка употребляются также термины дегенеративная и регенеративная обратная связь. Например, регулятор температуры имеет чувствительный элемент, обнаруживающий изменение температуры. Сигнал от этого элемента, указывающий на уменьшение температуры, вызывает увеличение подачи тепла к регулируемому устройству. Увеличение подачи тепла противодействует уменьшению температуры, вызвавшему это увеличение. Таким образом, в системе имеется отрицательная или дегенеративная обратная связь.
На рис. 3.2 показана зависимость между коэффициентом передачи прямой цепи KD и общим коэффициентом передачи замкну-
Рис. 3.2. Зависимость коэффициента передачи замкнутой системы Кс от коэффициента передачи прямой цепи Ар при положительном постоянном значении К^
Влияние обратной связи на передаточную функцию
95
той системы Кс в случае, когда — положительная постоянная величина.
Если Ар > 0 и KD — отрицательная величина, то и Кс отрицателен и по абсолютной величине меньше, чем KD. При больших по абсолютной величине значениях KD величина Кс стремится к — 1 /ЛГр и, таким образом, общий коэффициент передачи Кс становится независимым от коэффициента передачи прямой цепи. При KD > 0 коэффициент Передачи замкнутой системы становится больше KD. Когда петлевое усиление приближается к 1, общий коэффициент передачи делается бесконечно большой величиной. При К= K^KD> 1 система становится неустойчивой.
Формально положительный коэффициент передачи разомкну-"той системы К = K$KD > I приводит к конечному значению Кс, стремящемуся к -1/Кр при стремлении коэффициента передачи разомкнутой системы к бесконечности. Однако «попасть» на правую ветвь характеристики рис. 3.2 физически невозможно — для этого всегда приходится «пройти» через точку К = K^KD - 1, а это неизбежно ведёт к потере устойчивости.
Введение обратной связи может преследовать две основные цели в зависимости от типа обратной связи:
1) положительная обратная связь используется для создания режимов автоколебаний, преимущественно в электронных схемах генераторов, и почти не используется в контурах САУ;
2) отрицательная обратная связь широко используется для стабилизации самых разных систем, в том числе при построении САУ. В последнем случае цель её введения — придать объекту управления некие желательные свойства, заставить его реагировать должным образом на входное воздействие и минимизировать или практически исключить влияние собственных шумов и нелинейностей объекта.
Поэтому далее будут рассматриваться системы с отрицательной обратной связью.
В любой физической системе коэффициент передачи разомкнутой системы и, следовательно, общий коэффициент передачи зависят от частоты. Это имеет место при наличии в системе с обратной связью элементов, накапливающих или рассеивающих энергию. Накопителями электрической энергии являются емкость и индуктивность. В механических системах аналогичными элементами являются масса и упругость. Нагрев активных сопротивлений и трение в механических системах ведут к энергетическим потерям. Поэтому все системы с обратной связью содержат элементы, соответствую-
96 Глава 3. Линейные системы с обротям/ связью
шие апериодическому (или интегрирующему) звену и, возможно, колебательному звену с затуханием. Если, однако, такие элементы, оказывающие свое действие в рабочем диапазоне частот, отсутствуют, то все-таки остаются элементы, оказывающие свое влияние на частотах, лежащих вне нормального рабочего диапазона: например, паразитные емкости и индуктивности в электрических цепях. Наличие в системе элементов, накапливающих энергию, приводов к зависимости петлевого усиления от частоты. При этом м определяют частотно-независимую часть соответствуют^ передаточной функции W(p) и ₽(/>).
Рассмотрим простейшую систему с обратной связью > прямой цепи которой имеется одно апериодическое звено. Эта звено существенно влияет на свойства системы, и характер этого.влияния радикально зависит от знака петлевого коэффициента передачи Пусть передаточная функция разомкнутой системы равна
И4>) = ЗД/(1 + 7Ж (3.3)
где Т — постоянная времени апериодического звена В прямой цепи. К в — коэффициент передачи прямой цепи. — коэффициент Передачи цепи обратной связи. Тогда из уравнения (3.1) следует:
И^С(Р) - IWU + Гр)] / [1 - ад/<1 + Тр)\ = (^/Г)Ц/(Р + а)), (3.4) где
а = (1-^)/Г. (3.5)
Единственный корень знаменателя выражения (3.4) равен, очевидно, -а. Этот корень — действительный и отрицательный, если KDK9< I. При этом выполняется условие устойчивости системы с передаточной функцией (3.4). Если же > 1, то система оказывается неустойчивой.
Это условие устойчивости системы в данном простом случае можно вывести и непосредственно.
Обозначим К= KDK^. Обратное преобразование Лапласа функции Ис(р) (см. приложение 2) даст импульсную переходную функцию рассматриваемой системы с обратной связью
wc(0 = (^/7')e(^l),/r. (3.6)
При К= KDK? < 0 величина а всегда больше нуля и «память» системы с обратной связью, то есть продолжительность реакции на импульсное возмущение всегда короче, чем системы, не охваченной обратной связью. При К= КоК^>0, но меньшем 1 «память» замкну-
Влияние обратной связина передаточную функцию
97
той системы больше, чем у системы без обратной связи. При коэффициенте усиления разомкнутой системы, большем единицы, импульсная переходная функция становится возрастающей. В этих случаях говорят, что система неустойчива. На рис. 3.3 показано, как меняется форма импульсной переходной функции с изменением знака и значения К = KDK$. Коэффициент усиления прямой цепи Ад при этом поддерживается постоянным, а меняется только Ар или, как иногда говорят, глубина обратной связи. Когда коэффициент пере-
Рис. 3.3. Импульсные переходные функции замкнутой системы при различной глубине обратной связи
дачи разомкнутой системы равен 1, реакция на 5-функцию становится ступенчато# функцией, и система ведет себя как интегратор; ее «память» бесконечно велика.
Поэтому, если требуется, чтобы система была устойчивой, то в данной системе петлевое усиление должно находиться в пределах -оо < KDK? < 1. До тех пор, пока -оо < А= А0Ар < 0 обратная связь будет отрицательной. Этой ситуации соответствует отрицательная часть левой ветви характеристики на рис. 3.2. На отрезке О < К- KDK^ < 1 обратная связь — положительная, но система сохраняет устойчивость. Когда К = А0Ар > 1 система теряет устойчивость.
Реальные сигналы всегда содержат гармонические составляющие различной частоты. Даже при отсутствии сигнала в системе всегда присутствуют шумы со всевозможными гармоническими составляющими. Когда сигналы или шумы попадают на вход системы, обратная связь может менять свой знак в зависимости от частоты входного возмущения. Это происходит благодаря фазовым сдвигам в прямой цепи и цепи обратной связи. На рис. 3.4 показан пример такого рода.
Здесь приведены частотные характеристики некой гипотетической устойчивой разомкнутой системы. Положим, что система замыкается, и в ней реализована необходимая инверсия знака сигнала так, что вплоть до частоты <окр обеспечена отрицательная обратная связь. На частоте <окр фазовый сдвиг в системе достигает л. Это значит, что сигнал обратной связи поменял свой знак на противоположный — обратная связь из отрицательной превратилась в положительную. Если при этом модуль коэффициента петлевого усиле-
4 - 8764 Гальперин
98
Глава 3. Линейные системы с обратной связью
Рис. 3.4. Механизм возникновения неустойчивости при замыкании отрицательной обратной связи
ния, то есть АЧХ разомкнутой системы, больше единицы, то замкнутая система оказывается неустойчивой. При этом то обстоятельство, что устойчивость теряется «только начиная с частоты сокр» не меняет результат. Устойчивость не бывает частичной — она или есть или её нет. Математически это означает, что у знаменателя передаточной функции замкнутой системы имеются корни с положительной действительной частью.
3.2. Устойчивость линейных систем с обратной связью
В результате охвата обратной связью некоторого устойчивого блока получившаяся система с обратной связью часто становится неустойчивой, даже если обратная связь отрицательная (рис. 3.4). На практике это означает, что при замыкании системы сигналы в такой системе начинают самопроизвольно колебательно или апериодически возрастать. Достаточно малых флуктуаций внутри системы, чтобы вызвать расходящийся переходный процесс. Такие флуктуации возникают самопроизвольно, в виде помех при отсутствии внешних возмущений. В силу физической природы элементов, процессы в системе никогда не могут неограниченно возрастать; они ограничиваются насыщением какого-либо каскада электронного или магнитного усилителя, механическими параметрами или огра-
Устойчивость линейных систем с обратной связью
99
ниченным запасом энергии питания. Эти ограничения по своей природе нелинейны и во многом предопределяют тип поведения системы, потерявшей устойчивость (рис. 3.5). Однако здесь будут рассматриваться условия сохранения устойчивости в линейном рабочем диапазоне сигналов в системе, так как с практической точки зрения важно, прежде всего, обеспечить устойчивость.
Рис. 3.5. Пример автоколебаний в неустойчивой замкнутой системе с ограничением
Потеря устойчивости системой — это аварийный режим, при котором свойства отдельных блоков и системы в целом радикально меняются. Анализ таких режимов — совершенно другая, хотя и очень важная инженерная задача, к анализу устойчивости прямого отно-
шения не имеющая.
Неустойчивость систем с обратной связью впервые была исследована в 1868 г. Д.1с Максвеллом, описавшим колебания регулятора в случае, когда действительные части комплексных корней ха-рактеристического~уравненИя, соответствующего уравнению движения, становятся положительными. Заметим, что характеристическое уравнение — это как раз уравнение (2.38) для знаменателя передаточной функции.
Согласно сказанному в 2.5, условие устойчивости любой системы состоит в том, чтобы корни знаменателя её передаточной функции не имели положительной действительной части, так как такие корни вызывают неустойчивость системы. Граничный случай получается, когда корни чисто мнимые. В выражении импульсной переходной функции этим корням соответствуют незатухающие колебания с постоянной амплитудой [см. выражения (2.57) и (2.58)], которые, однако, в любом реальном устройстве будут неизбежно медленно затухать или возрастать благодаря малым изменениям характеристик элементов, появляющихся с течением времени. Такая система не неустойчива в математическом смысле, но её нельзя считать устойчивой с практической точки зрения.
В случае замкнутых систем уравнение (2.38) для знаменателя обшей передаточной функции может быть и обычно бывает 3-го и более высоких порядков. Соответственно отыскание корней этого уравнения становится очень непростой задачей. Между тем, для суждения об устойчивости системы знания точных значений этих корней не требуется. Достаточно уверенности в отсутствии корней с положительной действительной частью. Для решения этой задачи был разработан ряд критериев, к которым относятся критерий
100 Глава 3. Линейные системы с обрдтиой связью
Рауса—Гурвица и критерий Михайлова [1, 2, 16]. Следует подчеркнуть, что эти критерии относятся к любым системам, описываемым передаточными функциями, — замкнутым и разомкнутым.
Другой подход к исследованию устойчивости основан на критерии Найквиста [1, 26], который позволяет судить об устойчивости замкнутой системы по Передаточной функций разомкнутой системы. ' '. '
С практической точки зрения расчёты по критериям Рауса—Гурвица в форме, предложенной Раусом, и по критерию Найквиста оказываются наиболее удобными. •
3.2.1, Критерий устойчивости Рауса
Предположим, что характеристическое уравнение знаменатели передаточной функции системы имеет вид (ср, с уравнением (2.38))'-
а^ + а^'1+ а2Р"~2 + ... + а„_1р + р„ = 0. (3.7)
Здесь принято, что коэффициент а0 положителен, и все коэффициенты — действительные величины.
С помощью метода Рауса можно определить наличие у уравнения (3.7) корней с положительнойдействительной частью, рассматривая все коэффициенты от а0 до ап.
Сначала коэффициенты (включая равные нулю) выписываются в две строки.
Страка !: а$ аг ... й т. д. (все коэффициенты с чётными номерами);
Строка 2; а1 а3 а3 ... и т. д. (все коэффициенты с нечётными номерами).
Перекрестным перемножением первого столбца, на каждый последующий по очереди образуются следующие (п- 1) строка: V
Строка 3: aj/jj - а^ау = Ь\ (цщ- oqUs = Aj а$ - 4о<*7 = by ... и Т. д.
Строка 4: д|в3 - а^ = q />ta3 - в|*з = Сг 07 т a\h =.с3... и т. д.
и т. д.
Критерий Рауса формулируется так: характеристическое уравнение (3.7) не содержит корней с положительной действительной частью тогда и только тогда, когда всё члены первого столбца положительны. При выполнении этого условия все члены во всех строках также положительны.
Устойчивость мнейныхсцствмс обраткой связью 1 1Q1
{i Пример 1. Рассмотрим передаточную функцию второго порядка
= l/(aQp2 + ахр + а2).
Запишемстроки:
1- °о а1
2. а}
3. ata2
прйчем а0 > 0. Следовательно, условия устойчивости имеют вид:
ч . af > О,> 0.
Пример 2. Передаточная функция третьего порядка
#c(p) = 1/(а0Р' + «У + OiP + аз)- ; >
Строки:
1. ЙО «2
2. й| а3
3. й|Gj — ОдД3
4. а3(й|й2 - о^з).
При д0>0 условия устойчивости имеют вид
а, > 0, а3 > 0, в(а2 - аоа} > 0.
Критерий устойчивости Рауса очень удобен для численной проверки устойчивости при известных коэффициентах характеристического уравнения, но имеет три недостатка:
1. При экспериментальном исследовании систем й устройств для применения критерия необходимо определять все коэффициенты уравнения (3.7) по отдельности и с достаточной точностью, что далеко не всегда возможно.
2. Критерий не даёт однозначной и ясной информации о том, как сделать систему устойчивой.
3. Критерий становится очень громоздким при анализе систем высоких порядков В общем (буквенном) виде.
3.2.2. Критерий устойчивости Найквиста
Наиболее наглядная и поддающаяся физической интерпретации оценка условий, необходимых для устойчивости линейных систем с обратной связью, получается при рассмотрении процесса возбуждения системы синусоидальными воздействиями, так как в этом случае процессы в линейной системе тоже будут синусоидальными (см. 2.6).
102 Глава 3. Линейные системы с обратной связью
Комплексный коэффициент передачи замкнутой системы можно получить, подставив р = усо в уравнение (3.1):
ИН» = Г(» / X(J<o) = WV®) /[1 - ₽(/•«) ии<о)]. (3.8)
Обозначим комплексный коэффициент передачи разомкнутой системы или её АФХ 1И£(у(о) = ₽(j<o) Ж(у®).
Нетрудно видеть, что величина И^/со) становится бесконечно большой, то есть система теряет устойчивость, когда произведение = Р(У«) IH'J®) равно единице. Амплитудно-фазовые характеристики разомкнутой системы Ж4(/ю), а также величины 1 - WL(j<o) могут быть представлены в виде годографов векторов на комплексной плоскости (см. рис. 2.11 и формулы (2.62) и (2.63)). Чтобы обратная связь была отрицательной, сигнал в петле обратной связи должен инвертироваться, то есть менять знак на противоположный. Это равносильно исходному фазовому сдвигу на ±л. Если же за счёт дополнительных сдвигов суммарный фазовый сдвиг станет равным нулю или достигнет ±2л, то обратная связь станет положительной. Следовательно, для того чтобы обеспечить устойчивость замкнутой системы, модуль вектора АФХ разомкнутой системы Л(®) = = ^(<6)^0(ю) должен быть меньше единицы на частотах, при которых фазовый сдвиг в контуре равен нулю или кратен 2л радиан. Если к(<х>) на какой-то из этих частот больше единицы, то нельзя сказать сразу, что система неустойчива, но, скорее всего, она будет неустойчива. Частота, на которой в системе возникают резонансные колебания, лежит в диапазоне частот, где частотная характеристика близка к единице, и чем ближе система к разобранным критическим условиям, тем медленнее в ней затухают резонансные колебания при импульсных возмущениях.
Эти соображения «на пальцах» в строгой форме выражены в критерии Найквиста.
1. Предположим, что передаточная функция WL(p) соответствует устойчивому статическому блоку, инвертирующему сигнал, тогда
WN(p) = 1 - р(р) W(p) = 1 - WL(p) (3.9)
также соответствует устойчивому статическому блоку.
Если разомкнутая система статическая и устойчивая, то необходимое и достаточное условие устойчивости замкнутой системы с передаточной функцией
И'сОО = W(p) / [1 - Р(р) WW] = W(p) / [1 - WL(p)] состоит в том, чтобы годограф H^(jto) = 1 - И^(р) при изменении частоты <о от 0 до -к» не охватывал начала координат комплексной плос
Устойчивость линейных систем с обратной связью 103
кости, или, иначе говоря, годограф ЛФХ разомкнутой системы не охватывал точку с координатами Re = 1, Im = 0 на комплексной плоскости. Годограф И^С/го) называют годографом Найквиста.
Примеры годографов Найквиста разомкнутых устойчивых статических системообразующих при замыкании как устойчивые, так и неустойчивые замкнутые системы приведены на рис. 3.6 и 3.7. Особо интересным представляется годограф на рис. 3.6, в. Он соответствует устойчивой системе и опровергает интуитивный результат. Оказывается, что £(ю) может быть больше 1 при дополнительном фазовом сдвиге, большем ±л, и при этом замкнутая система остаётся устойчивой. Такие системы называются условно устойчивыми системами. Интересно, что если в системе уменьшить усиле------нйе, то она потеряет устойчивость.
Рис. 3.6. Примеры годографов Найквиста разомкнутых устойчивых статических систем, сохраняющих устойчивость при замыкании
Рис. 3.7. Примеры годографа Найквиста разомкнутой устойчивой статической системы, неустойчивой при замыкании
2. Пусть передаточная функция WL{p) принадлежит неустойчивому блоку, у которого знаменатель имеет N корней с положительной действительной частью. При выполнении определённых условий замкнутая система и в этом случае может быть устойчивой.
Если разомкнутая система статическая, неустойчивая и имеющая N корней с положительной действительной частью знаменателя, то Не-
104 Глава 3. Линейные системы с обратной связью
обходимое и достаточное условие устойчивости замкнутой системы состоит в том, чтобы угол, под которым годограф = 1 - WL(p)
огибает начало координат, составлял Nit. При этом годограф Найквиста огибает точку с координатами Re = 1, Im = 0 на комплексной плоскости также под углом Nit.
3. Пусть передаточная функция (р) принадлежит астатическому блоку, то есть блоку, в котором имеется последовательно включённое интегрирующее звено. В этом случае и ^(р) также соответствует астатическому блоку. Из формулы (2.94) и рис. 2.18, б видно, что к(а>) астатического блока стремится к +оо при а> -> 0.
Положим, что независимая переменная со меняется не от 0 до +со, а от -оо до +оо. Тогда каждому годографу И^С/Ф) на комплексной плоскости будет соответствовать его зеркальное отражение по вертикали В теории функций комплексного переменного
доказывается, что при изменении со от бесконечно малой положительной до бесконечно малой отрицательной величины бесконечно удалённый конец вектора к^а) опишет на комплексной плоскости полуокружность бесконечного радиуса. АФХ интегрирующего звена при этом получает вид, показанный на рис. 3.8, а. Поэтому при анализе устойчивости астатических систем годографы И7(усо) строятся в пределах от со = -оо до со = +оо, но правила, указанные в пунктах 1 и 2, сохраняют силу. На рис. 3.8, бив приведены примеры годографов Найквиста для устойчивой и неустойчивой астатических систем.
Рис. 3.8. Годографы астатических систем: а — годограф интегрирующего (астатического) звена с полуокружностью бесконечного радиуса, б — пример годографа Найквиста астатической системы, устойчивой при замыкании, в — пример годографа Найквиста астатической системы, неустойчивой при замыкании
Устойчивость линейных систем с обратной связью 105
3.2.3. Использование ЛАЧХ и ФЧХ для анализа устойчивости
Если частотные характеристики разомкнутой системы; известны и разомкнутая система устойчива, то критерий Найквиста может быть применён в модифицированной форме, основанной не на анализе поведения годографов в комплексной плоскости, а на анализе ЛАЧХ и ФЧХ.
Пример такого подхода был приведен на рис. 3.4, где показаны характеристики системы явно неустойчивой в замкнутом состоянии. На рис. 3.9 приведен ещё ряд характерных примеров ЛАЧХ и ФЧХ для устойчивых и неустойчивых систем. При построении ФЧХ общий фазовый сдвиг ±л, обеспечивающий инверсию сигнала в цепи
Рис. 3.9. Примеры ЛАЧХ и ФЧХ разомкнутых систем: а — абсолютно устойчивой при замыкании, б — неустойчивой при замыкании, в — условно устойчивой и г — неустойчивой при замыкании вследствие положительного фазового сдвига на низких частотах
106 Глава 3. Линейные системы с обратной связью
обратной связи, здесь учитывать не принято — его наличие подразумевается. Особо следует выделить примеры в и г. Характеристики на рис. 3.9, в соответствуют условно устойчивой системе, годограф Найквиста которой показан на рис. 3.6, в. Фазовое запаздывание в разомкнутой системе существенно превышает п на частотах, где к(а>) » 1, однако на частоте соср, когда к(а) = 1, фаза успевает вернуться к значению около л/2, и замкнутая система остаётся устойчивой. Заметим, что здесь оказывается недопустимым снижение петлевого усиления на 20 дБ или более, так как это приведёт к потере устойчивости.
Таким образом, для устойчивости замкнутой системы требуется, чтобы дополнительный фазовый сдвиг в разомкнутой инвертирующей системе был меньше л именно на частоте, где к(а) = 1. Эта частота называется частотой среза разомкнутой системы.
Другой важный случай показан на рис. 3.9, г. Здесь у разомкнутой системы имеется фазовое опережение, большее л, на частоте соср, когда Л(со) = 1. Это ведёт к потере устойчивости точно так, как и фазовое запаздывание. Невнимание к большим положительным сдвигам фазы в системах с обратной связью — весьма распространённая и опасная ошибка. Она особенно часто встречается в схемах усилителей переменного тока.
3.3. Автоматические регуляторы и следящие системы. Качество процессов регулирования
3.3.1. Структуры систем регулирования и следящих систем
Блок-схема одноконтурной системы автоматического регулирования САР изображена на рис. 3.10, а.
На этой схеме tV0(p) — это передаточная функция объекта регулирования 1Уя(р) — передаточная функция собственно автоматического регулятора (управляющего устройства); И$(р) — передаточная функция исполнительного органа или механизма, преобразующего
Рис. 3.10. Блок-схема одноконтурной системы автоматического регулирования (а) и её упрощенное представление (б)
Автоматические регуляторы и следящие системы
107
выходной сигнал регулятора в сигнал управления объектом; WM(p) ~ передаточная функция датчика и измерительного преобразователя.
Входное воздействие x(t) есть уставка, то есть внешний сигнал, соответствующий желаемому значению регулируемой величины y(J). На исполнительный механизм подаётся выходной сигнал регулятора г(/), а помимо управляющего воздействия с(/) к объекту может быть приложено внешнее возмущение или помеха s(t).
Среди внешних возмущений обычно различают нагрузку, настройку и собственно помеху.
Под нагрузкой понимают внешнее воздействие, приложенное к объекту помимо управляющего и изменяющее режим работы объекта.
Настройкой называют возмущения, специально вводимые в систему с целью изменения регулируемой величины.
Помехи — это паразитные воздействия или шумовые сигналы, возникающие в системе или попадающие в неё извне только потому, что конструкцией системы их не удалось устранить.
На рис. 3.10,~п в качестве точки приложения помехи или возмущения s(t) указан вход объекта, где эта помеха складывается с управляющим воздействием. На самом деле помехи и возмущения в системе могут возникать в самых разных местах, и чаще всего они связаны с изменением нагрузки на объект или изменениями свойств самого объекта. Однако умножив или разделив изображение возмущения на соответствующую передаточную функцию, можно привести его в любую точку петли обратной связи.
Если x(f) = const является неизменной или задаваемой вручную опорной величиной, то такую систему автоматического регулирования САР обычно называют системой стабилизации. Пример — электронные стабилизаторы напряжения. Если x(f) автоматически меняется во времени по закону, задаваемому от внешнего источника, то такую САР называют следящей системой.
В любом случае назначение системы — заставить y(t) повторить х(/) с возможно большей точностью, то есть получить минимальное рассогласование между ними
е(г) = x(f) - y(f) -> 0. (3.10)
Величина е(Г) есть ошибка регулирования.
Если датчик с измерительным преобразователем практически идеальны или в них нет необходимости и y(f) непосредственно сравнивается с х(/), как часто бывает в простых механических и электромеханических системах, то WM(p) = 1.
108 Глава 3. Линейные системы с обратной'связыо
3.3.1. Ошибка статизма
Рассмотрим работу системы, считая измерительное устройство идет альным, то есть WM(p) si, й условия устойчивости замкнутой системы выполненными. Кроме того, предположим сначала, что помехи в системе отсутствуют, s(t) = Q. Тогда исполнительный механизм можно считать частью объекта и блок-схему САР упростить и представить, как показано на рис. 3.10, б.
Йередатбчная функция замкнутой системы будет иметь вйд (3.1), где в данном случае
mp) = WL(p)^ ВД^(Р)- (3-11)
Запишем изображение ошибки регулятора. Из (3.10) и (3.1), учитывая инверсию сигнала в узле сравнения, получаем:
Е(р).=, Х(р) -Y(p)~ Х(р)~ Х(р) Щр) / [ 1 + Р(р) 1И(Р)] =
= Х(р)[1 + р(р)1Ир)- WW[1 + ₽(P)TOL (3.12) откуда получаем передаточную, функцию ошибки замкнутой системы:
^E.c(P) - Е(р)/А(р) = [ 1 + Р(р W) - w(p)]/[ I +. Р(р) иш (3-13)
дающую возможность вычислить погрешность регулирования при любых входных воздействиях-
Передаточная функция цепи обратной связи р(р) = L поэтому для САР имеем ' ,
Е(р) = *(р)/[1 +И4»], (3.14)
и
^с(р) = 1/[1 + WL (3.15)
Оценим, прежде всего, погрешность регулирования при постоянном входном воздействии. Для этого воспользуемся соотношением (3.2). Если система статическая, то есть И4р) не содержит интегрирующих звеньев, то получаем при р -> 0 коэффициент передачи ошибки в виде:
КЕ = lim WE(p) = 1 /(1 + Л), (3.16)
где К — петлевое усиление. Отсюда видно, что для минимизации ошибки при постоянном входном сигнале, называемой ошибкой статизма, желательно иметь как можно большее петлевое усиление.
Автоматические регуляторы и следящие системы 109
II й .Г |’1 HI fill 117*1 I. rt 1U1 ' "1 111 г Г1 .. ,! I I1.1 I -«.иг- ин.
Рассмотрим случай, когда разомкнутая сиСтема содержит интегрирующее звейо. Пусть, например, передаточная функция разомкнутой системы имеет вид:
: *и»+1/т/>,
где !F(p) — некая передаточная функция статической Части системы; Тогда из (3 Л 5) следует:
ад)=Тр/[1 + 7р+ГрИ^)]. (ЗЛ7)
Совершенно очевидно, что lim FKEC(p) * 0 при р 0, и, следовательно, ошибка статизма равна нулю. Точно'также при передаточ-- - ной функции разомкнутой системы вида W(p)/Tp получим
<c(P)’^/[Tp+mp)t (3.18)
При р -» 0 lire Мр) = К, то есть конечной величине, и Потому lim = 0. , • .
Таким образом, если разомкнутая система астатическая, то есть содержит интегрирующее звено, то ошибка статизма замкнутой системы равна нулю.
Это. очень важное обстоятельство, так как оно позволяет строить Системы с нулевой статической ошибкой без риска потери устойчивости. ,
Рассмотрим пример. На рис. 3.11 показаны ЛАЧХ и ФЧХ объекта с передаточной функцией третьего порядка, нуждающегося в регулирований. Предположим сначала, что в качестве регулятора выбран просто усилитель, то есть WR(p) » Кк. Наличие Инверсии сигнала в цепи обратной связи здесь по-прежйему подразумевается. Из рис. 3.11, б видно, что коэффициент усиления такого пропорционального статического регулятора усилителя в данном случае нельзя делать больше ЗОдБ, иначе замкнутая система станет неустойчивой, — дополнительный фазовый сдвиг достигнет -Я на частоте, где £(<»)*= 1. Это зйачит, что предельное максимальное значение Хд*31,6, и при этом замкнутая система окажется на грани устойчивости. И даже при таком KR ошибка статизма составит около 0,03 s 3 % от входного сигнала. Введём в качестве регулирующего устройства интегрирующее звено и положим И^Ср) = 1/Т„р, где Выберем Как можно видеть из рис. 3.11, в, теперь фазовый сдвиг в разомкнутой системе стал около -Зтс/4 на частоте, где Jt(<x>) =* 1, замкнутая система устойчива и, вместе с тем, имеет нулевую ошибку статизма.
по
Глава 3. Линейные системы с обратной связью
Iwe.c(^)Iw
в)
Рис. 3.11. Пример'выбора закона и параметров регулирования по ЛАЧХ И ФЧХ: а — ЛАЧХ и ФЧХ объекта, б — ЛАЧХ и ФЧХ разомкнутой системы при пропор-циональном законе регулирования и выборе коэффициента усиления регулятора на грани устойчивости, в — использование астатического регулятора, г — ЛАЧХ ошибки при астатическом законе регулирования
Однако это не означает, что таким образом удалось получить хорошую систему регулирования. С ростом частоты погрешность будет возрастать, и на частотах, превышающих e>h погрешность становится практически равной входному сигналу (рис. 3.11, г), С точки зрения возможных изменений входного воздействия x(f) это не слишком неприятное обстоятельство, если обеспечить плавное изменение х(/), но в системе всегда может возникнуть возмущение или помеха s(f), связанные исключительно с объектом. И возмуще
Автоматические регуляторы и следящие системы 111
нИя эти, как правило, имеют вид функции единичной ступени или даЯсе 8-функции. Передаточная функция замкнутой системы для возмущающего воздействия будет иметь вид:
^s.c(p)= ед/[1 +^0(р)И^(р)]. (3.19)
Нетрудно убедиться, что помехи на частотах выше со, астатический регулятор не сможет подавить.
3.3.3. Запас устойчивости
Формального выполнения условий устойчивости и получения удов-_ - летворительного значения ошибки статизма далеко не достаточно для обеспечения хорошей работы системы регулирования. Другие проблемы ещё серьезнее. При анализе разомкнутая система рассматривалась как линейная со строго постоянными по времени параметрами. Действительно, обеспечить эти свойства для управляющего устройства сравнительно несложно, измерительную часть системы также можно сделать в большинстве случаев линейной и стабильной во времени. Но ожидать полную линейность и абсолютную стабильность во времени от объекта и исполнительного механизма по меньшей мере наивно. Их параметры со временем могут изменяться, дрейфовать. Статические характеристики объекта могут содержать не выявленные участки с дифференциальной нелинейностью и повышенным значением коэффициента передачи. Наконец, такие изменения характеристик могут возникнуть в силу случайных внешних причин. Отсюда — необходимость иметь запас устойчивости.
Запас устойчивости системы оценивают по-разному. Один из подходов основан на отыскании корня (или корней) характеристического уравнения с наибольшей действительной частью смин (то есть наименьшей по абсолютной величине) и значение |смии| называют степенью устойчивости системы. Понятно, что если омин > 0, то система неустойчива. Но амин — величина размерная, имеет размерность частоты, а потому она оказывается не слишком удобной характеристикой именно устойчивости, но зато одной из наиболее эффективных характеристик качества систем регулирования.
Наиболее информативными характеристиками запаса устойчивости являются запас по амплитуде и запас по фазе. Запасом по амплитуде называют значение ££(со)[дБ] разомкнутой системы на частоте, где фазовый сдвиг в разомкнутой системе достигает ±л, то
112 Глава 3. Линейные системы с обратной связью
------------------------------------.---------------------------
есть отрицательная обратная связь в замкнутой системе становится положительной (см. 3.2.3). Обычно при проектировании САР запас по амплитуде берётся от 7 до 10 дБ. Запасом по фазе называют величину ’
[ф] = к - |ф(шср)|, (3,20)
где ф(а>ср) — фазовый сдвиг (помимо инверсии) в разомкнутой системе на её частоте среза, когда &Л(<о)[дБ] = &£(<оср)[дБ] = 0. В качестве минимально допустимого запаса по фазе обычно принимается величина [ф] = п/4.
3.3.4. Степень устойчивости и отношение колебательности
Вычисляя оригиналы ошибки е(Г) обратным преобразованием (3.14) при различных входных сигналах и потенциально возможных помехах, можно получить достаточно полную информацию о поведении системы. Однако далеко не всегда петлевая передаточная' функция известна, и часто требуется решить другую задачу — оценить свойства системы по экспериментальным данным.
В качестве пробного сигнала естественно использовать единичный скачок (2.15) и далее по реакции на него (переходной функции) системы судить о её точности.
На рис. 3.12 показаны типичные для линейных систем переходные функции и соответствующие им переходные процессы ошибки е(Г). Прежде всего, по переходным функциям можно оценить степень устойчивости системы. Затухание переходного процесса — переход выхода системы к стационарному уровню определяется наибольшей постоянной времени в знаменателе передаточной функции или обратной ей величиной |омнн|. В случае апериодического процесса рис. 3.12, а и б затухание процесса аппроксимируется экспоненциальной зависимостью:
h(t) = й(оо)(1 - е~'/г),
где Т — постоянная времени затухания и й(оо) — установившееся значение переходной функции. Соответственно:
е(?) = й(оо)е_,/г.
Далее находятся две точки — моменты времени, когда остаточное отклонение от стационарного значения максимально и когда . оно составляет 1/es 0,368... от максимального отклонения. По ин-
Автоматические регуляторы и следящие системы 113
Рис. 3.12. Типичные переходные функции линейных систем и соответствующие им переходные Процессы ошибки
тервалу времени между этими точками Дт = Т находится степень устойчивости |<тмин|:
|оМии1^1/Ат. (3.21)
Если переходный процесс носит колебательный характер (рис. 3.12, в), то грубо его можно аппроксимировать выражением
й(1) = й(оо){1 - е^'/т cos [/(1 (3.22)
где й(оо) — по-прежнему установившееся значение переходной функции.
Здесь экспоненциальный множитель во втором члене в фигурных скобках в правой части определяет затухание колебательного переходного процесса. Наличие колебаний в переходном процессе с периодом
Дт = Ъ.Т/ (1 - $2)1/2 , (3.23)
свидетельствует о том, что знаменатель передаточной функции системы имеет пару комплексно сопряжённых корней
А>2»ч/т±а2-‘1)'/77’,
114 Глава 3. Линейные системы с обратной связью
действительная часть которых и есть степень устойчивости — величина, обратная постоянной времени затухания:
|о„ин| = !;/7'. (3.24)
В этом случае необходимо знание не только степени устойчивости, но и частоты колебаний, а, главное, соотношения между ними. Это видно из рис. 3.12, г. Интуитивно ясно, что при одинаковом затухании система с большей частотой колебаний обладает большей склонностью к потере устойчивости. Таким образом, в качестве безразмерного отношение колебательности g целесообразно использовать отношение постоянной времени затухания T/t, к периоду колебаний4:
д = (1-^),/2/2^. (3.25)
При g -> оо (£, -» 0) затухание вообще не происходит, система теряет устойчивость. При £ = 1, когда корни знаменателя передаточной функции становятся действительными, отношение колебательности равно нулю. В большинстве случаев g = 1 надо считать разумным верхним пределом. При этом подъём ЛАЧХ системы на резонансной частоте составляет около 4 дБ. Если g < 0,2, что соответствует £, > 0,6, колебательность практически отсутствует.
Оценка отношения колебательности и степени устойчивости по переходному процессу имеет свои тонкости. Дело в том, что интервалы времени между вершинами пиков (рис. 3.12, в), не равны периоду косинусоиды в выражениях (3.22) и (3.23), так как затухание сдвигает вправо максимумы косинусоиды, причём по разному в зависимости от амплитуды в данный момент времени. Поэтому оценки и периода колебаний Дт, и степени устойчивости по максимумам (или минимумам) переходного процесса некорректны, они могут содержать трудно оцениваемые ошибки. Единственные «несмещённые» затуханием точки колебаний соответствуют нулям функции косинуса, а потому интервалы между этими точками дают точное значение периода колебаний Дт. Вместе с тем, значения h(t) в
4 Для характеристики колебательности часто используют отношение максимума АЧХ к значению АЧХ на нулевой частоте, называемое показателем колебательности. В случае колебательного звена — это просто 1/2^. Однако для систем, имеющих нулевое усиление на нулевой частоте (например, усилители переменного тока) этот показатель не пригоден. Часто используются более удобная характеристика, близкая по сути к отношению колебательности — логарифмический декремент затухания тс^/(1 -£2)'/2, характеризующий отношение предыдущей амплитуды к соседней последующей.
Автоматические регуляторы и следящие системы
115
серединах этих интервалов соответствуют моментам времени, когда функция косинуса в выражении (3.22) равна единице. Положим, что середины двух соседних интервалов соответствуют моментам времени /=0 и /=0 + Дт. Если значения h(t) известны в этих точках, то
й(оо)е^0/г= й(0) - й(оо);
й(оо)е-«0 + Дх)/г= й(0 + Дт) - й(оо),
где й(оо) = 1 — установившееся значение переходной функции.
Разделив первое из этих равенств на второе, получим уравнение для вычисления |смии| = %,/Т:
&“,Т= [Й(0) - й(оо)]/[й(0 + Дт) - й(оо)], (3.26)
откуда
KJ = V7’= Cl/Дт) In {[й(0) - й(а>)] / (й(0 + Дт) - й(оо)]}. (3.27)
Понятно, что при экспериментальном исследовании систем отношение колебательности g определяется не из уравнения (3.25), а по данным измерений из соотношения
<;= 1/|<змин|Дт, (3.28)
а по нему при необходимости рассчитывается £ из уравнения (3.25).
3.3.5. Оценки качества процесса регулирования
Для оценки качества регулирования и динамических ошибок САР используется ряд критериев. Наиболее распространёнными и, вместе с тем, грубыми являются время регулирования и перерегулирование (рис. 3.13).
1. Время регулирования ае — это время, за которое отклик системы на ступенчатое входное воздействие выходит на стационарное значение. Теоретически переходный процесс в линейной системе продолжается бесконечно долго. С практической точки зрения можно считать, что он заканчивается в момент времени, после которого модуль отклонения регулируемой величины от ожидаемого стационарного значения й(оо) не превышает заданную долю от й(оо). В случае статических систем часто принимают, что это отклонение |й(ае) - й(оо)| должно составлять меньше 5 % ошибки статизма. Отме-
116 Глава 3. Линейные системы с обратной связью
Рис. 3.13. Характеристики переходных процессов: о — без перерегулирования, б — с перерегулированием.
Заштрихованы области переходных процессов
Тйм, что время регулирования не всегда однозначно связано со степенью устойчивости.
Поэтому вопрос о том, когда можно И когда нельзя определять оптимальные параметры, минимизируя степень устойчивости, может быть решен лишь опытом расчета и наладки конкретных систем. В связи с этим для оценки качества регулирования не ограничиваются этой, наиболее просто, вычисляемой, но и самой примитивной оценкой, й вводят в рассмотрение более сложные оценки.
2. Отклонения регулируемой координаты в процессе регулирования от того значения, которое должно установиться после окончания переходного процесса, — важная характеристика системы регулирования. Так как любая реальная система обладает инерционностью, то в момент задания скачка на входе и(Г), при ? = 0, и й(/= 0) = 0, а следовательно, в первый момент и разность Л(оо) - й(г) всегда будет максимальна. Поэтому определять отклонение в первый момент времени заведомо бессмысленно.
Если отношение колебательности системы меньше 0,2, то переходная функция будет выходить на стационарное значение «снизу», нигде его не превышая. Но при колебательности, большей 0,2, отклик системы в какой-то момент времени становится больше Л(оо).
Наибольшее отклонение регулируемой величины от её стационарного значения й(оо) во время переходного процесса, совпадающее по знаку с й(оо) называется перерегулированием. Перерегулирование оценивают часто в процентах от й(от).
Если время регулирования и перерегулирование заданы, то тем Самым заданы и границы области, внутри которой должен лежать переходный процесс, удовлетворяющий предъявляемым к ним требованиям (рис. 3.13).
Переходный процесс был бы идеальным, если бы в момент возникновения единичного возмущения выход системы мгновенно
Автоматические регуляторы й следящие системы 117
приобретал бы свое новое установившееся значение и более не менял бы его до возникновения нового возмущения (рис. 3.14, а). В реальных системах такое протекание процесса невозможно, но процесс тем ближе к идеальному, чем меньше площадь А, заключенная между кривыми истинного и идеального процессов (заштрихована на рис. 3.14, б). Й том случае, когда нет перерегулирования как на рис. 3.14, б или перерегулирование практически отсутствует, указанная площадь определяется интегралом
00
Л = |[Л(оо)-Л(О]Л. (3.29)
о
. _ В иных случаях этот интеграл не определяет площадь А, так как при подсчете интеграла отдельные площади суммируются с учетом знака разности ординат (рис. 3.14, в). Например, в случае слабо затухающих колебаний независимо от амплитуды интеграл будет мал, хотя площадь, характеризующая отклонение истинного процесса от идеального, может при этом быть сколь угодно большой.
Когда интеграл~(3.29) определяет указанную площадь А, он служит удобным средством для выбора параметров системы: параметры выбираются так, чтобы значение интеграла было минимальным. Разумеется, такая оценка является косвенной, а такой выбор параметров — предварительным, так как возможно самое различное протекание даже монотонных процессов при равных площадях. Несмотря на это, применение такой оценки часто позволяет быстро подобрать исходные параметры, проверяя правильность их выбора последующим построением процесса.
Если изображение переходной функции h(t) или передаточная функция Замкнутой системы известны, то вычисление интеграла
Рис. 3.14. К определению интегральных характеристик качества процессов регулирования
118 Глава 3. Линейные системы с обратной связью
(3.29) упрощается. Согласно теоремам об интегрировании оригинала 2.2.7 и о конечном значении оригинала 2.2.12 получим:
А = lim f[А(оо) - h(t)] dt = lim р[й(оо)/р1 - Н(р)/р] = г-+х J О-+0
О
= lim [й(оо) - W'tp'fl/p.
/>->0
Практическое использование такой простой оценки А затруднено тем, что только в редких случаях заранее известно, что процесс не имеет перерегулирований или что в астатическом случае в ходе процесса не меняется несколько раз знак разности й(<ю) - h(t). Если процесс колебательный, то близость переходного процесса к идеальному можно было бы оценить по значению интеграла:
||й(оо) -h(t)\dt, (3.30)
о
но его обычно трудно подсчитать. *
Удобнее пользоваться оценкой:
А = |[й(оо)-й(г)]2Л. (3.31)
о
Если выбирать параметры системы из условия минимума интеграла (3.31), то переходный процесс обычно получается чрезмерно колебательным. Чтобы избежать колебательных процессов с малым затуханием, был предложен целый ряд модификаций интеграла (3.31), в частности выбирать параметры так, чтобы был минимальным интеграл:
А = j {[й(оо) - Л (г )]2 + [й’(г )/а ]2} dt, (3.32)
о
где параметр а, имеющий размерность частоты, подбирается так, чтобы «наилучший из возможных» переходный процесс, минимизирующий (3.32),
й(Г) = й(оо)(1-е-“') f 1
с запасом удовлетворял поставленным техническим требованиям.
Выбор параметров системы из условия получения минимально-1 го значения интеграла (3.32) при удачном выборе значения свобод- <
Методы улучшения процессов регулирования и синтеза САР 119
ного параметра а позволяет получить достаточно хороший переходный процесс с небольшим перерегулированием, а часто — монотонный процесс.
3.4. Методы улучшения процессов регулирования и синтеза САР. Законы регулирования
3.4.1. Синтез САР и выбор закона регулирования
Если бы существовали способы точной оценки перечисленных выше основных параметров, характеризующих качество процесса регулирования, по виду дифференциального уравнения системы или её передаточной функции, то не было бы необходимости доводить до конца интегрирование этих, уравнений. Такие способы пока не разработаны, и хотя часто важно знать не протекание всей интегральной кривой, а лишь некоторые параметры, характеризующие ее протекание, единственный вполне достоверный способ вычисления этих параметров состоит пока в построении интегральной кривой. Задача синтеза САР усложняется, когда накладываются дополнительные условия на протекание переходного процесса. Требуется, например, чтобы процесс был монотонным или чтобы число колебаний за время процесса было не более заданного и т. д.
В большинстве случаев, чтобы построить кривую процесса регулирования при некоторых фиксированных значениях параметров, требуется произвести трудоемкие выкладки. Для выбора оптимальных значений параметров надо эти выкладки много раз повторить. В связи с этим было разработано множество приближенных методов построения и оценки переходных процессов, а в настоящее время особое значение приобрело компьютерное моделирование переходных процессов в САР.
Подход к проектированию САР, основанный исключительно на расчётах и компьютерном моделировании, очень редко бывает возможен и ещё реже ведёт к успеху. Проблема заключается в том, что свойства объекта почти всегда известны только приблизительно, не говоря уже о значениях коэффициентов в передаточной функции объекта. Кроме того, требования к переходной функции системы часто бывают противоречивы. Например, требование малого времени регулирования может противоречить требованиям к запасу устойчивости или к форме переходной функции.
120 Глава 3. Линейные системы с обратной связью
Поэтому обычно, исходя из имеющихся сведений об объекте и общих требований к САР, прежде всего выбирают тип регулятора. В простейших случаях — это может быть так называемый пропорциональный регулятор с передаточной функцией
WR(p) = KR. (3.33)
Однако как было показано в 3.3.2 получить малую ошибку ста-тизма при такой WR(p) можно только в простейших случаях. Поэтому регуляторы с пропорциональным законом регулирования (П-регуля-торы) применяются там, где требования к точности регулирования невелики. Вместе с тем, у них есть важное достоинство — малое время регулирования ге. Включение параллельно пропорциональному звену с передаточной функцией (3.33) интегрирующего звена приводит к передаточной функции регулятора в виде
ВД = ^+1/Тир, (3.34)
где Ги называется постоянной времени интегрирования. Регулятор с таким пропорционально-интегральным законом регулирования называется ПИ-регулятором. Распространено и другое название таких регуляторов — изодромные регуляторы.
Иногда передаточную функцию ПИ-регулятора пишут в виде:
WR(p) = KR(\ + \/T„p), (3.35)
подчёркивая тем самым, что при изменении в процессе настройки KR одновременно и пропорционально меняется и Ги. Принципиально может использоваться и чисто интегральный закон регулирования, когда в (3.34) KR = 0. Выше в 3.3.2 было показано, что использование астатического, интегрирующего звена даёт возможность исключить ошибку статизма системы. ПИ-закон регулирования — наиболее распространённый среди промышленных САР.
ПИ-регуляторы имеют ряд важных особенностей. Дело в том, что разные настройки параметров регулятора KR и Ги могут приводить к одной и той же степени устойчивости |стмин|, но совершенно различным переходным процессам при одинаковых воздействиях на систему. При одной и той же |стмин|, если она обеспечивается при разных соотношениях параметров, не только перерегулирование, но и время регулирования может изменяться в несколько раз.
Кроме того, часто к ПИ-регуляторам понятие степени устойчивости вообще оказывается неприменимо по следующей причине.
Положим, что на вход изодромной САР подан ступенчатый сигнал м(/). Процессы в такой системе могут быть разбиты на два уча-
Методы улучшения процессов регулирования и синтеза САР 121
Рис. 3.15. Переходный процесс в изодромной САР
стка А и Б (рис. 3.15). Участок А на графике функции ошибки е(г) соответствует установлению выходного значения h(t) с точностью до - - статической ошибки е^, определяемой статической частью регулятора, то есть Лд, а участок Б — снятию этой статической ошибки интегрирующим звеном. Обычно длина участка Б значительно больше длины участка Д. Наибольший же интерес представляет не суммарное время, соответствующее участкам А и Б, а время, соответствующее участку Ад Даже в тех случаях, когда степень устойчивости связана с временем регулирования, она определяет суммарное время процесса, а не время «работы» пропорционального звена.
Третью компоненту — дифференциальную в закон регулирования вводят, как правило, в двух случаях. Во-первых, если в системе возможны быстрые большие возмущения — резкие изменения нагрузки и/или помехи. Во-вторых, для увеличения запаса устойчивости по фазе, особенно при наличии у объекта транспортного запаздывания. Передаточная функция регулятора получает вид:
ДГл(р)=Х,+ 1/Тир+Тдр, (3.36)
или, переобозначая Тк и Та,
^(р) = ^(1 + 1/Тир+Тдр), (3.37)
где Та — постоянная времени дифференцирования. Закон регулирования с передаточной функцией (3.37) называется пропорциональ-но-интегрально-дифференциальным законом регулирования, а сам регулятор — ПИД-регулятором.
Введение дифференцирующего параллельного канала уменьшает инерционность регулирования за счет того, что изменение регулируемой переменной обнаруживается регулятором с упреждением, ещё до того, как это изменение произойдет (или закончится). В тех случаях, когда шумы процесса велики, можно ограничить при помощи низкочастотного фильтра диапазон частот, в котором
122 Глава 3. Линейные системы с обратной связью
эффективно проявляется действие дифференцирующего звена. В аналоговых регуляторах такой фильтр в какой-то форме присутствует всегда, так как идеальное дифференцирующее звено физически нереализуемо. В этом случае передаточная функция (3.37) приобретает вид:
WR(p) = *л[ 1 + 1/ ГИр +ТдР/( Тфр + 1)], (3.38)
где Гф — постоянная времени фильтра низких частот, причём ?Ф с 7д-
Таким образом, связь между переменной на выходе регулятора АО и сигналом ошибки е(г) системы на его входе для разных типов регуляторов описывается следующими выражениями:
П-регулятор:
М = (3.39)
ПИ-регулятор:
= KR[e(t) + <1/Ти)}е(0Л], (3-40)
о
ПИД-регулятор:
АО = Кл[е(0 + (1/Ги)}е(г)Л + Тде'(0]. (3.41)
о
Эти выражения, однако, соответствуют идеалу, практически достижимому только при реализации законов регулирования с помощью компьютерных программ, но в аналоговых электронных, пневматических или механических регуляторах, реализованных в виде специализированных устройств, между указанными параметрами регулирования всегда существует определенное взаимное влияние.
Процедура выбора структуры и параметров регулятора состоит, прежде всего, в обеспечении устойчивости. После этого выбирается критерий качества процессов регулирования, например, задаваемый формулой (3.31), и при заданных ограничениях по запасу устойчивости, времени регулирования, перерегулированию и т. д., отыскивается совокупность параметров регулятора, дающих максимум выбранному критерию. Эти параметры, например, KR, Ги и Гд в ПИД-регуляторе (3.38) и (3.41), называются настройками регулятора.
Но даже самые тщательные предварительные расчёты и компьютерное моделирование не могут обеспечить полное согласование
Методы улучшения процессов регулирования и синтеза САР 123
регулятора и объекта управления. Поэтому после подключения регулятора к объекту неизбежна процедура настройки САР.
3.4.2. Настройка системы регулирования
Чтобы согласовать регулятор с процессом и получить наилучшую из возможных характеристик регулирования, необходимо знать частотные характеристики как регулятора, так и процесса. Если бы реакция процесса на регулирующее воздействие была точно известна, то можно было бы аналитически определить настройки системы, при которых достигается максимальная устойчивость, а значение ошиб-_ . ки в установившемся режиме минимально. Однако на практике редко бывает так, чтобы усилия, затраченные на получение абсолютно точной частотной характеристики процесса, дали требуемые результаты. Поэтому обычно вместо определения такой характеристики исследуется устойчивость процесса регулирования к вносимым возмущениям, после чего записи откликов системы на возмущения анализируются с целью последующего выбора настроек. Рассмотрим методы определения динамических характеристик и их использование для первоначальной настройки регулятора.
Два метода наиболее широко применяются на практике для определения значений настроек регулятора: метод замкнутого контура и так называемый метод заданного затухания. Первый метод хорошо подходит для большинства процессов, в то время как второй лучше всего применять для настройки очень медленно протекающих процессов регулирования. В обоих методах учитываются требования к устойчивости контура регулирования и обеспечивается в конечном итоге 4-х кратное затухание амплитуды колебаний выхода регулятора за каждый период этих колебаний. И тот, и другой методы обеспечивают точные результаты, поскольку учитывают динамические характеристики и объекта, и регулятора.
В методе замкнутого контура настройки пропорционального, интегрального и дифференциального звеньев регулятора вначале фиксируются; к выходу регулятора подключается записывающее устройство. Затем коэффициент пропорционального усиления KR постепенно увеличивают до тех пор, пока исполнительный механизм не начнет устойчиво колебаться, как показано на рис. 3.16, а. Значение KR, при котором начинаются устойчивые колебания, называют предельным усилением KRmxc. Обозначим длительность предельного периода колебаний через X. Тогда рекомендуемые настройки регулятора в зависимости от закона регулирования опреде-
124 Глава 3. Линейные системы с обратной связью
ляются из следующих формул (для большей достоверности требуется провести запись не менее четырех циклов колебаний): >
П-регулятор: *я = 0,5*Ямакс; (3.42)
ПИ-регулятор: К к = 0,45^Янакс, (3.43, а)
= VI,2; . (3.43, б)
ПИД-регулятор: Ak = 0,6£Лмакс, (3.44, о)
7и = V2; (3.44, б)
7д = V8- (3.44, в)
Выход на режим автоколебаний далеко не всегда допустим.
Кроме того, в случае настройки регуляторов очень медленно протекающих процессов описанный выше метод оказывается очень трудоемким. В этих случаях используется метод заданного затухания. При его использовании точно также исходные настройки выбираются в области устойчивости системы. Но находят значение
= Кю, при котором ступенчатый скачок уставки вызывает затухающие колебания в системе такие, что их амплитуда затухает в 4 раза за каждый полупериод. Получение показанного на рис. 3.16, б переходного процесса с 4-х кратным затуханием за полупериод требует меньше времени, так как при этом необходимо просмотреть всего два неполных цикла колебаний. Однако в данном случае для оценки затухания требуется проведение дополнительных измерений и вычислений. Данный метод имеет то важное преимущество, что система не выходит за границы устойчивости, так как он не требует возникновения незатухающих автоколебаний. Рекомендуемые в дан-
Рис. 3.16. Процессы в САР при различных методах настройки регулятора
Методы улучшения процессов регулирования и синтеза САР 125
ном случае значения настроек регулятора определяются по
следующим формулам: П-регулятор: (3.45)
ПИ-регулятор: ^ = 0,9/Гда, (3.46)
= X; (3.47)
ПИД-регулятор: (3.48)
= X; (3-49)
• Гд = Х/4. (3-50)
Описанные методы настройки регуляторов предусматривают
введение в систему возмущения в виде ступенчатого скачка в значении задающего воздействия — уставки. Тем самым настройка производится по изменениям сигнала в точке введения этого задающего воздействия. Однако система реагирует на изменения не только задающего воздействия, но и нагрузки процесса. Изменения настроек играют основную роль в периодических процессах, тогда как в большинстве непрерывных процессов преобладают изменения нагрузки. Задающая переменная (уставка) используется для внесения возмущения в систему просто потому, что ее легче изменить. Принципиальная разница в настройке по изменениям нагрузки состоит в том, что она обычно дает несколько меньшие значения постоянно# времени интегрирования. На практике этот факт обычно можцо учесть при описанных процедурах настройки, если основной функцией регулятора является отслеживание изменений нагрузки.
3.4.3. Многоконтурные САР
В тех случаях, когда объект представляет из себя совокупность последовательно включенных агрегатов, обеспечить высокое качество процессов в САР бывает очень трудно, а иногда и невозможно. В таких ситуациях характеристики системы можно обычно улучшить путем введения покаскадного и многоконтурного регулирования. Дополнительный выигрыш, получаемый при этом, — уменьшение чувствительности к шумам объекта. Пример такой структуры
126
Глава 3. Линейные системы с обратной связью
приведен на рис. 3.17. Здесь выход ведущего регулятора служит задающим воздействием для ведомого регулятора, охваченного контуром местной обратной связи. Обычно во внутренний контур регулирования помещают пропорциональный регулятор, а во внешний контур включают ПИ-регулятор. При этом, однако, необходимо, чтобы время отклика внутреннего контура было меньше, чем внешнего, или равно ему. Настройка регулятора производится так же, как и обычно, но внутренний контур настраивается первым.
Рис. 3.17. Структура двухконтурной САР
В пределе (при установившемся выходе) передаточная функция внутреннего контура в каскадной схеме фактически равна 1. Внешний контур обычно настраивают так, чтобы установление выхода внутреннего контура при изменении уставки, задаваемой внешним контуром, происходило быстрее (примерно в 4 раза), чем может изменяться значение этой уставки.
3.5. Дискретные системы
3.5.1. Принципы устройства дискретных систем
Компьютеры и, в частности, микропроцессоры, а точнее компьютерные программы, постепенно вытесняют специализированные аналоговые регуляторы в системах управления самыми разными устройствами и агрегатами. При этом реализуются два подхода к построению САУ.
Первый подход состоит в том, что частота, с которой компьютерная программа рассчитывает управляющее воздействие (частота дискретизации или квантования времени в системе), столь велика, что ни исполнительный механизм, ни объект управления «не замечают», что изменения управляющего воздействия поступают не непрерывно, а через некие малые дискретные интервалы времени. Если при этом и шаг квантования сигналов по уровню достаточно мал (разрядность преобразователей на входе и выходе управляющего цифрового процессора достаточно велика), то САУ практически не
Дискретные системы
127
отличается от обычной линейной САУ в той мере, в какой исполнительный механизм и объект управления можно считать линейными.
Иная картина наблюдается, когда период дискретизации управляющего воздействия оказывается сопоставим с длительностью переходных процессов в системе. Такая ситуация часто возникает, когда один и тот же центральный процессор используется для расчетов управляющих воздействий в нескольких САУ, для многих объектов. Именно в этом случае эти САУ следует считать дискретными системами, и их приходится рассматривать с применением специально для них предназначенного аналитического аппарата.
В технике связи и управления квантование времени часто находит себе применение, и системы, где оно используется, называются дискретными или иногда импульсными. К импульсным системам относятся и устройства, в которых информация кодируется в виде не только амплитуды, но и других параметров импульсов (частота следования, длительность импульсов и т. д.). Поэтому здесь для систем с квантованием времени будет употребляться наименование дискретные, а термин импульсные системы сохраним для обозначения более широкого класса систем. Некоторые из них рассмотрены в четвёртой главе.
Дискретные системы бывают как замкнутыми, так и разомкнутыми. На рис. 3.18, а показана структурная схема разомкнутой импульсной системы. Импульсный элемент ИЭ является преобразователем представления сигнала, осуществляющим амплитудно-импульсную модуляцию. Этот элемент преобразует входной сигнал х(0 в последовательность импульсов х*(г), амплитуды которых пропорциональны значениям х(г) в дискретные моменты времени t=nT, где и = 0, 1, 2, ... — последовательность целых чисел (рис. 3.18, б). Эти моменты времени называются моментами съема или тактовыми точками, а интервал времени Т — периодом дискретизации. Про-
в)
Рис. 3.18. Структура разомкнутой дискретной системы (а), амплитудно-импульсная модуляция сигнала (б) и структура замкнутой дискретной системы (в)
128 Глава 3. Линейные системы с обратной связью
должительность импульсов равна q = yT, где у < 1. В дискретных системах у и Г — постоянные величины.
Последовательность импульсов х*(г) подается на вход непрерывной части системы НЧ, которую будем считать линейной системой обычного типа. Выходной сигнал НЧ обозначенный y(t), является выходным сигналом всей системы.
В замкнутой дискретной системе (рис. 3.18, в) выходной сигнал системы у(г) подается на вход системы по цепи обратной связи и вычитается из входного сигнала. На импульсный элемент ИЭ поступает разность входного х(г) и выходного y(t) сигналов:
е(Г) = х(0 - у(0- (3-51)
Как видно из рис. 3.18, б, в дискретных разомкнутых системах представляют интерес не любые значения функции х(г), а лишь значения х(пТ) в тактовых точках, при t=nT. Точно также существенны не любые значения входного и выходного сигналов замкнутой системы, а лишь значения х(пТ), у(пТ) и е(лТ) в тактовых точках. Из уравнения (3.51) следует, что для схемы рис. 3.18, в имеет место равенство:
е(пТ) = х(пТ)-у(пТ). (3.52)
Дискретные системы нашли широкое применение не только в связи с использованием цифровых устройств, прежде всего микропроцессоров. Они имеют ряд связанных с квантованием времени преимуществ перед непрерывными системами. Эти преимущества во многих случаях выражаются в увеличении помехоустойчивости при передаче информации, в возможности неограниченно долго хранить и запасать полученную информацию, в простоте элементов схем, простой возможности осуществления многоканальной связи и управления по многим каналам. Часто измерительные датчики и подсистемы выдают результат в форме квантованных по времени показаний, например, измерительные устройства, основанные на накоплении электрического заряда.
3.5.2. Идеальный импульсный элемент и фиксирующее звено
В большинстве практически важных случаев длительность импульсов х*(г) значительно меньше продолжительности периода Т, то есть осуществляется условие
q<^T или у « 1.
(3.53)
Дискретные системы
129
Рассмотрим воздействие одного короткого импульса х*(г) (см. рис. 3.19, а) на непрерывную часть системы НЧ, изображенной на рис. 3.18, а. Пусть w(f) — импульсная переходная функция этой части. Тогда ее выходной сигнал y(t) выражается интегралом Дюамеля (см. (2.25) и рис. 2.7):
y(t) = | х* (x)w(r - х)Л. (3.54) о
Рис. 3.19. Воздействие короткого импульса на непрерывную часть системы
где t — момент наблюдения. Если продолжительность импульса q настолько мала, что за это время функция w(t - х) мало изменяется, то
/ я
y(t)*= j X* (x)w(r - x)dx = j x* (x)w(Z - x)dx = о 0
я
= w(t)j x* (x)dx = w(t)S, (3.55)
0
где буквой 5 обозначена площадь импульса:
5 = Jx*(x)flft. (3.56)
о
Из формулы (3.55) следует, что действие короткого импульса не зависит от его формы и определяется лишь его площадью. Если S= 1, то у(г) = w(f), то есть отклик НЧ на действие импульса совпадает с импульсной переходной функцией или, иначе, аналогичен реакции НЧ на 8-функцию. Поэтому из формулы (3.55) также следует, что можно заменить узкий импульс произвольной формы, действующий на входе системы НЧ, импульсной функцией 8(г)5. Импульсный элемент, на выходе которого имеются такие импульсные функции, называется идеальным импульсным элементом и сокращенно обозначается ИИЭ. На рис. 3.20, а показана структурная схема разомкнутой системы, в состав которой входит ИИЭ и непрерывная часть НЧ.
Даже в том случае, когда импульсный элемент в действительности создает не узкие импульсы, а импульсы любой длительности q<T можно представить структурную схему системы в таком виде, чтобы в её состав вошел идеальный импульсный элемент. Нужно
5 - 8764 Гальперин
130
Глава 3. Линейные системы с обратной связью
Рис. 3.20. Дискретная система с идеальным импульсным элементом (а) и включение в неё фиксирующего звена (6)
х*(яТ)8(Г- пт)
_____
/(О
t
Рис. 3.21. Сигналы на входе и на выходе фиксирующего звена
лишь включить последовательно с ИИЭ еще один блок — фиксирующее звено ФЗ, на выходе которого получается реальный импульс х*(Г) (рис. 3.20, б). На рис. 3.21 условно показаны входной сигнал x*(nT)b(J- пТ), поступающий на вход фиксирующего звена, и выходной сигнал ФЗ у*(/).
При х(/) = u(f) = 1 функция у*(г) есть реакция фиксирующего звена ФЗ на 8-функцию, приложенную к его входу, следовательно, в Этом случае у*(г) есть импульсная переходная функция фиксирующего звена Таким образом, ди-
намические свойства фиксирующего звена полностью определяются
формой сигнала, изображенной на рис. 3.21. Лапласово изображение этой функции представляет собой передаточную функцию фик-
сирующего звена.
Для определенности положим пТ= 0, и будем считать амплитуду сигнала у*(1) (высоту нижнего прямоугольного графика на рис. 3.21), равной единице при х(0) = 1. Представим у*(Г) в виде разности двух единичных функций u(f) и u(t- q):
у*(0 = w*(0 = u(t) - u(t - q).
Преобразовав это выражение по Лапласу, получим передаточную функцию фиксирующего звена:
1Г(р) = £[w*(/)] = 1/р - е-п/р = (1 - е-’О/А (3.57)
Фиксирующее звено можно объединить с непрерывной частью НЧ в одну общую непрерывную часть системы, как показано пунктирным прямоугольником на рис. 3.20, б. Таким образом, можно придти опять к схеме типа рис. 3.20, а, в которой имеются идеальный импульсный элемент и непрерывная часть. Поэтому импульсный элемент можно всегда считать идеальным.
Дискретные системы
131
Сразу отметим, что рассмотренная модель процессов в дискретных системах прекрасно отражает процессы регулирования и управления, осуществляемые с помощью цифровых процессоров, будь это управляющий компьютер — сервер, работающий в многоканальном режиме или специализированное устройство на базе микропроцессора. Дискретизация происходит в момент, когда сигнал у(г) от объекта управления преобразуется в код. После программной обработки процессором (а её можно считать аналогом непрерывного управляющего устройства системы) сигнал в виде выходного кода поступает на устройство, так или иначе запоминающее его значение и задающее его на объект управления до прихода следующего выходного кода. Таким образом, в этом случае управляющая часть системы отличается от структуры рис. 3.20, б тем, что комбинация «идеальный импульсный элемент — фиксирующее звено» находится как на входе, так и на выходе НЧ. Управляющее воздействие здесь задаётся на объект в виде кодов, вырабатываемых процессором в тактовых точках времени пТ и преобразуемых в аналоговый сигнал, то есть оно сразу поступает в виде х*(пТ).
3.5.3. Дискретное преобразование Лапласа и z-преобразование
Из формулы (3.56) следует, что площадь импульса 5 пропорциональна х*(?) в момент, соответствующий тактовой точке, то есть значению сигнала x(t) в этот момент времени (см. рис. 3.18, б). Функция на выходе импульсного элемента ИИЭ в л-й тактовой точке, то есть при Г = пТ, равна х(лТ)5(г- пТ).
Выходной сигнал импульсного элемента ИИЭ x*(t) есть сумма нормированных сигналом x(t) 5-функций указанного выше вида:
х*(0 = £х(лТ)5(Г - лГ). (3.58)
л-0
При этом до момента t = 0 функция x(f) = 0. На рис. 3.18, б дискреты х*(0 показаны равными х(лТ) в моменты t=nT. Эти величины следует еще умножить на соответствующие 5-функции, чтобы получить выходную величину, выражаемую формулой (3.58).
Преобразуем обе части равенства (3.58) по Лапласу. Получим:
Дх*(/)] = £х(лТ)е-и7>. (3.59)
л=0
Если обе части (3.59) умножить на передаточную функцию фиксирующего звена (3.57) при q= Т, то изображение функции х*(?)
132
Глава 3. Линейные системы с обратной связью
превратится в изображение кусочно-постоянной функции ***(/)’, показанной на рис. 3.22: '•
£[***(/)] = [(1 - е-Т')/р&х{пТ)е-пТ'>. (3.60)
Это выражение практически точно описывает то, что происходит с аналоговым сигналом, когда он преобразуется в числовой Код и фиксируется в памяти цифрового процессора.
Примем Т= 1 и введём обозначение z = е?, тогда выражение (3.59) перепишется в виде:
Х*а) = 2[х(л)] = £х(п)г“я. л=0
(3.61)
Величина Z[x(/i)] есть функция переменной Z- Преобразование (3,61) называется ^-преобразованием. Оно переводит оригинал г-последовательность х(пТ} в изображение X*(z). Таким образом, z-преобразованце есть некий аналог преобразования Лапласа для последовательностей дискрет и, соответственно, является аппаратом для анализа систем с квантованным временем и решения конечно-разностных уравнений.
Замечательно то, что для ^-преобразования можно указать ряд грамматических правил — аналогов правилам для преобразования Лапласа, приведенным в 2.2. Эти правила позволяют установить соответствия между операциями над последовательностями — оригиналами и их z-изображениями. Знак соответствия, принятый Для преобразования Лапласа во второй главе, будет использоваться и для ^-преобразования, Например, выражению (3.61) эквивалентно выражение:
X*(z) « х(л).
Дискретные системы
133
При рассмотрении грамматики ^-преобразования оригинал — последовательности обозначим /(«), а их изображения F*(^), чтобы подчеркнуть общность этих правил.
Теоремы смещения
1> Смешение последовательности вправо по оси времени (запаздывание); _
при £ = 0, 1, 2, ... и условии, что при n-k<Q принимается /(н-Л) = 0.
2. Смешение последовательности влево по оси времени (опережение):
f(n + k)^^(z)-^f(m)zm] т=0
При k= 1, 2, ... . ~
Составление разностей
(дискретный аналог дифференцирования)
Составлениям разностей в пространстве оригиналов
Д/(л) =/(« + I)
^f(n) = [Дт”7(»)]
при m .= 1, 2, ... и b°f(n) f(n) соответствуют в пространстве изображений операции:
&f(n)c*(z-))F4z)-f(Q)z,
Д7(«) U - D W)-/(O)z(z - 1) + Д/(0)г,
и так далее.
Суммирование дискрет (дискретный аналог интегрирования) g/(w)«F*(z)/U- 1); 1).
Затухание
anf(ri) о F*(az),
где a * 0 — произвольное число.
134 Глава 3. Линейные системы с обратной связью,
Дифференцирование изображений
nf(n) <=> -zdF*(z)/dz.
Свёртка оригиналов — последовательностей
Свёртке двух оригиналов — последовательностей соответствует умножение их изображений:
m=Q
Начальное значение оригинала
Если изображение F*(z) существует, то
/(0)=limF*(z). «-♦80
Отсюда в соответствии со второй теоремой смещения получаем
/(l) = limz[F*a)-/(0)], «-♦ос
Л2)=шпги*а) -/(0) -лоИ
«-♦оо
и так далее. Это правило, таким образом, даёт возможность вычислять оригинал по изображению.
Конечное значение оригинала
Если lim f(ri) при п -> <ю существует, то
lim /(л) = lim (z - l)F*(z). л-ко «-♦!
Здесь, так же как и в случае теоремы 2.2.12 необходима уверенность в существовании искомого неизвестного предела.
В Приложении 3 приведена таблица некоторых соответствий для z-преобразования.
3.5.4. Метод z-преобразования в дискретных системах
Вернёмся к разомкнутым импульсным системам рис. 3.18, а и рис. 3.20, а. Когда на вход непрерывной части системы приходит последовательность импульсов (3.58), то реакция непрерывной части системы в любой момент времени будет суммой её реакций на все пришедшие импульсы (понятно, что НЧ считаем линейным блоком).
Дискретные системы 135
В импульсной системе важно знать значения y(f) только в тактовых точках, то есть в моменты t-nT'.
у(тТ) ^^x(nT)w(mT - пТ). (3.62)
л=0
Здесь w(mT-nT) — значения импульсной переходной функции в соответствующих тактовых точках, m = 0, 1, 2, ...
В качестве реакции системы должна быть рассмотрена величина: %у(тТ)8(Г-тТ): (3.63)
т=0
• - -Выражение (3.63) — это полный аналог (3.58), только отнесенный к выходу системы. Подставляя (3.62) в (3.63), меняя порядок суммирования и учитывая, что по определению w(mT- пТ) = 0, когда п > т, получим:
y»(^=£x(«7’)Jw(/wr-«7’)5(r -mT). (3.64)
Л*0 т*0
Применив к (3.64) преобразование Лапласа и полагая i = m- п, получим:
i[Z(0]=£x(nr)2w(/rK',7)’e-/7i’. (3.65)
л=0 /=-л
Но w(iT) = 0 при г < 0, а потому
ЫУЧО] =£ Х(п Т) е'пТр £ w(/T) e~iTp. (3.66)
л=0 /=0
Отсюда по определению ^-преобразования следует:
У*(г) = W*(z)X*(z), (3,67)
где JF*(z) — z-преобразование импульсной переходной функции непрерывной части системы. Функцию
#"(*)* Y*(z)/X*(z) (3.68)
назовём z-передаточной функцией системы.
Аналогичным образом можно найти, что для замкнутой дискретной системы имеет место соотношение, подобное (3.1):
Wc4z) = W*(Z) / [1 - P*U) W*(z)]. (3.69)
Здесь p*(z) — z-передаточная функция цепи обратной связи.
136 Глава 3. Линейные системы с обратной связью
Эти формулы имеют тот же физический смысл, что и в непрерывной системе. Они определяют реакцию импульсной системы на входное воздействие. Конечно, эта реакция рассматривается лишь как дискретная функция, то есть учитываются лишь дискреты в тактовых точках.
Так же как и в непрерывных системах, можно строить амплитудную и фазовую частотные характеристики дискретных систем.
Переходя от z-изображений Y*(z) к оригиналам (для этого можно воспользоваться таблицами соответствий оригиналов — последовательностей и z-изображений — см. Приложение 3), можно вычислять процессы — последовательности у(пТ). Однако способ непосредственного определения переходного процесса при использовании z-преобразования имеет те же недостатки, что и в непрерывных системах. Для исследования переходных процессов и устойчивости в импульсных системах можно применять методы, аналогичные косвенным методам исследования непрерывных систем. Здесь применимы и методы частотных характеристик, и методы распределения корней, и аналоги интегральных методов. Необходимые подробности можно найти в книге [14].
Контрольные вопросы
1. Выведите формулу передаточной функции замкнутой системы при известной передаточной функции разомкнутой системы.
2. Объясните влияние отрицательной и положительной обратной связи на свойства системы.
3. Объясните механизм потери устойчивости системами с отрицательной обратной связью.
4. Сформулируйте критерий устойчивости Найквиста.
5. Дана передаточная функция объекта регулирования “
W(p) = Ко/( 1 + Т,р)( Т2р2 + 2^Тр + 1),
где Ко = 100, Г, = 1 /2л с, Т = 1 /20л с, = 0,2. Выбрать параметры ПИД-регулятора для этого объекта.
6. Дана передаточная функция объекта регулирования
W(p) = Ко е-р7(1 + Гр).
где Ко = 100, Т - 1 /2л с, т = 1 /20л с. Выбрать параметры ПИД-регулятора для этого объекта.
7. Дана передаточная функция объекта регулирования
W(p) = Ко /(1 + Т,р)(Т2р2 + 2$Тр + 1), где Ко = 100, Г] = 1/2л с, 7= 1/20л с, 1. Выбрать параметры ПИД-регулятора для этого объекта.
Дискретные системы
137
8. Дана передаточная функция замкнутой системы W(p) = 1/(1 + Т,р)(Т2р2 + 2^Тр + 1), где Г, = 1 /20л с, Г = 1 /200л с, = 0,1. Определить степень устойчивости и отношение колебательности системы.
9. Дана передаточная функция замкнутой системы Мр) = 0 + ТоР)/(1 + Т,р)(Т2р2 + 2(jTp + 1), где То — 1/20л с, Г, = 1/2тс с, Т = 1 /200л с, i; = 0,25. Определить степень устойчивости и отношение колебательности системы.
10. Дана передаточная функция замкнутой системы W(p) =.1/(1 + тор)(1 + Т,р)(Т2р2 + 2£Jp + 1), где То = 1 /20л с, Т\ = 1/2л с, Т = 1/200л с, = 0,1. Определить степень устойчивости и отношение колебательности системы.
11. В системе из примера 8 оценить время установления и перерегулирование.
12. В системе из примера 9 оценить время установления и перерегулирование.
13. В системе из примера 10 оценить время установления и перерегулирование.
14. Сравните между собой интегральные критерии качества переходных процессов.
15. Перечислите известные вам законы регулирования и дайте характеристику эмпирическим методам настройки регуляторов по переходным процессам.
16. Что называется идеальным импульсным элементом?
17. Выведите передаточную функцию фиксирующего звена.
18. Дайте определения z — передаточных функций разомкнутой и замкнутой дискретных систем.
Глава 4
НЕЛИНЕЙНЫЕ И САМОНАСТРАИВАЮЩИЕСЯ СИСТЕМЫ УПРАВЛЕНИЯ
4.1. Нелинейные системы
4.1.1. Влияние нелинейностей на свойства систем
В главе третьей процессы регулирования в реальных системах приближенно рассматривались как процессы в линейных системах с постоянными коэффициентами. Тем самым анализ реальной системы заменялся анализом ее линейной модели.
При рассмотрении условий устойчивости линейной модели было установлено, что устойчивость или неустойчивость линейной модели зависят только от свойств системы и совершенно не зависят от величины начального отклонения, входного сигнала или возмущения. Было показано, что у неустойчивой линейной системы значения отклонений от любых начальных условий неограниченно растут.
Если не рассматривать системы, параметры которых точно соответствуют границе области устойчивости, то оказывается, что в линейной системе возможны лишь два типа движений. Устойчивая линейная система после любого отклонения с течением времени стремится (монотонно или немонотонно) к положению равновесия. Неустойчивая линейная система, наоборот, после любого начального отклонения монотонно или немонотонно уходит от равновесия, и её выходной сигнал неограниченно растёт по абсолютной величине. При параметрах, точно соответствующих границе области устойчивости, возможны незатухающие колебания. Амплитуда этих колебаний зависит от начальных условий. При самом незначительном изменении параметров колебания превращаются в затухающие или неограниченно нарастающие. Никакие иные движения в линейной модели невозможны.
Движения в реальных системах могут быть значительно разнообразнее движений, возможных в линейной модели.
‘ Например, в реальных системах часто наблюдается возникновение незатухающих колебаний. Эти колебания обладают определен
Нелинейные системы
139
ной устойчивостью: после возмущения они восстанавливаются с те-чением^ времени, то есть восстанавливаются и форма колебаний, и их частота. Форму и частоту этих колебаний можно изменять, меняя параметры системы.
Реальная система отличается от её линейной модели не только возможностью возникновения незатухающих колебаний, но и тем, что в ней (реальной системе) характер движений часто зависит от величины вызвавшего их начального возмущения. В реальной системе может существовать такой порог, что начальные возмущения, не превосходящие этот порог, вызывают движение, сходящееся к положению равновесия, а в результате возмущений, превосходящих указанный порог, в системе устанавливаются устойчивые незатухающие колебания.
В ряде случаев в системах автоматического регулирования возможны не один, а несколько режимов незатухающих колебаний, причем только от величины начального возмущения зависит, какие из этих колебаний установятся в системе. Так, например, нередко можно наблюдать, что после небольших начальных возмущений, не превосходящих определённого порога, в системе устанавливаются высокочастотные незатухающие колебания с амплитудой, меньшей этого порога. Если же начальные возмущения превзойдут этот порог, то в системе устанавливаются низкочастотные незатухающие колебания, имеющие значительно большую амплитуду.
Явления подобного рода могут быть обусловлены только факторами, не учитываемыми при рассмотрении линейной модели. Такими факторами являются нелинейности, которые при использовании линейной модели заменяются линейными зависимостями (в случае линеаризуемых нелинейностей) или вообще выбрасываются из рассмотрения (в случае нелинеаризуемых нелинейностей). Для того чтобы описать указанные движения и, в частности, незатухающие колебания, необходимо учесть наличие нелинейностей. Отметим, что при линеаризации, осуществляемой в системе (а не только в её модели!) с использованием функционального блока с обратной нелинейностью, система или её линеаризуемая часть действительно становятся линейными (см. 1.3.1 и рис. 1.7).
Незатухающие колебания в системах автоматического регулирования, о которых выше шла речь, возникают при отсутствии внешних периодических воздействий только за счет внутренних свойств системы регулирования. Их частота целиком определяется свойствами системы и меняется при изменении ее параметров. Это — типичные автоколебания, возникающие благодаря равенству потерь энергии за период колебаний притоку энергии от внешнего источ
140 Глава 4. Нелинейные и самонастраивающиеся системы
ника. Таким внешним источником энергии служит обычно регулируемый объект или имеющиеся в системе усилители сигнала. Только благодаря наличию нелинейностей возможен указанный выше баланс энергии за колебательный цикл, и вычисление условий,-существования незатухающих колебаний сводится, по существу, к определению условий реализации этого баланса.
Исследование Всех движений, возможных в нелинейных системах, — задача очень сложная. До сиХ пор не разработаны аналитические методы решения задач такого рода в сколько-нибудь общих случаях. Наибольшие трудности возникают при определении порогов для начальных возмущений, разграничивающих области с различными .типами переходных процессов. Внутри каждой из таких областей процессы сходятся к одинаковым (Или однотипным) установившимся состояниям (например, к равновесиям или к незатухающим колебаниям). Аналитические методы Позволяют решать частные нелинейные задачи двух типов.
Во-первых, это определение условий, при которых после любого Возмущения система движется к Положению равновесия, то есть условия, при которых нелинейная система Ведет себя с практической точки зрения подобно устойчивой линейной системе.
Во-вторых, это нахождение (чаще всего Приближенно) возможных в системе периодических режимов вне зависимости от Их устойчивости и, тем более, без точного определения границ устойчивости этих периодических режимов.
Сколько-нибудь более полное аналитическое исследование нелинейных систем удается проводить лишь в частных случаях, например в некоторых системах, описываемых дифференциальными уравнениями второТо или третьего порядка или в системах, дифференциальные уравнения которых содержат специальным образом входящие малые параметры. Поэтому За последние десятилетия интенсивно развивается иной подход, основанный на Компьютерном моделировании Нелинейных систем. Современные продвинутые методы решения сложных систем нелинейных дифференциальных уравнений позволяют путём многократных прогонов задач получать достаточно полные картины поведения нелинейных систем при самых разных возмущениях и вариациях параметров систем. На первый план выдвинулась задача не получения точных решений аналитическим путём, а построения моделей, адекватно описывающих поведение системы. И тут очень важными являются Предварительные качественные оценки поведения системы, получаемые из аналитических построений. Одним из наиболее Эффективных и нагляд
Нелинейные системы
141
ных методов качественного исследования поведения систем является построение их фазовых Портретов.
4.1.2. Фазовые Портреты линейных систем
Движения выходного сигнала системы регулирования описываются обыкновенным дифференциальным урайнением л-ro порядка, где л называют порядком системы. Известно, что любое уравнение л-го порядка может быть преобразовано в эквивалентную еМу систему уравнений первого порядка введением (л - 1) дополнительной переменной, соответствующей производным выходного сигнала. Исследование поведения системы можно существенно упростить и сделать нагляднее, анализируя движения не одной, а указанных л переменных.
Рассмотрим сначала систему, которая описывается двумя дифференциальными уравнениями первого порядка: ‘
. x;=dx, + 6x2; (4.1, а)
х2 = СХ( + dx2, (4.1, б)
где а, Ь, с и d — заданный числа (некоторые из них Могут быть Нулями). Напомним, что к подобной системе сводится, в частности, линейное дифференциальное уравнение второго порядка
х" + ах' + ух = О,
если Положить х = хь х[ = х2, х2 = -ух, - ах2.
Предположим, что уравнения (4.1) проинтегрированы, то естьх, и х2 найдены как функции времени t И начальных условий х,0 и х20:
X| =xx(t, х10, х20); (4.2, а)
х2 = xjt, Х|0, х20). (4.2, б)
Здесь и далее будем полагать, что регулируемый режим, Который должен поддерживаться в системе регулирования, соответствует комбинации значений переменных х, = х2 = 0. В принципе система должна Возвращаться к регулируемому режиму при любых начальных отклонениях от него или привносимых возмущениях. Таким образом, исследование системы сводится к анализу её свободного движения после различных начальных возмущений.
Положим, что в результате возмущения переменные х, и х2 получили некоторые значения х)0 и х20. Для каждой комбинации фик-
142
Глава 4. Нелинейные и самонастраивающиеся системы
Рис. 4.1. Интегральные кривые движения фазовых координат системы при различных начальных условиях
сированных значений х10 и хм можно построить графики функций (4.2) в плоскости х,, t и в плоскости х2, t (рис. 4.1). Для какого-либо другого сочетания значений начальных условий Х|Оа и х20а эти графики пойдут иначе и могут в разных точках пересекаться с графиками, построенными для начальных условий х10 и х20.
Начальные условия здесь оказываются параметрами, от которых Зависит поведение функций (4.2). Иными словами, функции (4.2) в совокупности определяют два двухпараметрических семейства кривых: в. плоскости xh t и в плоскости х2, t, причем через каждую точку оси х, (и, соответственно, оси х2)
пройдёт бесконечно большое число кривых. Все эти кривые могут
пересекаться друг с другом. Такие графики очень неудобны для
представления процесса регулирования при разных начальных условиях.
Значительно удобнее обойтись одним семейством кривых, сде-
лав параметром время А
X|, х2 (Г — параметр).
Рис. 4.2. Фазовые траектории системы При различных начальных условиях
Зафиксируем аргументы х,0 и х20 в функциях (4.2) и будем рас-
сматривать их как параметрические уравнения кривой в плоскости
Дадим t какое-либо значение /=/,. Тогда из уравнений (4.2) при фиксированных х10 и х^ можно вычислить значения X] и Х2, то есть точку в плоскости хь х2. Дадим t другое значение t=t2, и получим новые X! и х2, то есть ещё ОДНУ, НОВУЮ ТОЧКУ В ПЛОСКОСТИ X], х2. И вообще, если непрерывно менять t от 0 до оо, то и точка с координатами X,, х2 (ее называют изображающей тачкой) будет непрерывно перемещаться в плоскости Х|, х2 и прочертит линию — фазовую траекторию. Если система устойчива, то есть если при t -> оо и х, -> 0, и х2 -» 0, то изображающая точ
Нелинейные системы
143
ка по фазовой траектории стремится при t -> оо к началу координат (рис. 4.2), а система — к регулируемому режиму.
Аналогично можно построить в этой же плоскости фазовую траекторию, соответствующую каким-либо иным значениям х|Оа и х20а. Если точка, соответствующая х10а и х20а, окажется на старой траектории, начинающейся из точки х10, х20 (например, точка а на рис. 4.2), то изображающая точка будет далее двигаться по этой же фазовой траектории. Если же точка х|Оа, х20а окажется где-либо вне старой траектории, то из неё начнётся новая фазовая траектория, которая может быть Построена аналогичным приемом (рис. 4.2).
Таким образом, уравнения (4.2) определяют для разных начальных условий х10 и х20 семейство кривых, заполняющих всюду плотно * - плоскость х,, х2. Плоскость х„ х2 называется фазовой плоскостью системы. Фазовая плоскость, заполненная всей совокупностью фазовых траекторий, называется фазовым портретом системы.
Начало координат фазовой плоскости соответствует регулируемому режиму.
В отличие от семейства интегральных кривых (рис. 4.1) на фазовом портрете (рис. 4.2) траектории могут пересекаться лишь в ограниченном числе точек, а применительно к рассматриваемому пока линейному случаю — только в одной точке — в начале координат.
Действительно, дифференциальное уравнение фазовых траекторий получается делением уравнения (4.1, а) на уравнение (4.1, б):
dxt/dx2 = (ах, + bx2) / (сХ| + dx2). (4.3)
При любых значениях Х| и х2 (кроме х, = х2 = 0) уравнение (4.3) определяет единственное значение dxjdx^. Следовательно, в любой точке фазовой плоскости, кроме начала координат, к фазовой траектории может быть проведена только одна касательная, а это свидетельствует о том, что фазовые траектории не пересекаются друг с другом где-либо вне начала координат.
В начале координат (где х, = х2 = 0) из уравнения (4.3) получаем неопределённость dxjdx2 = 0/0, то есть начало координат является особой точкой. Она соответствует равновесию системы, так как в этой точке х{ = х2 = 0.
Устойчива или неустойчива линейная система — это не зависит от величины начального отклонения. В силу этого фазовый портрет устойчивой линейной системы всегда такой, что изображающая точка из любой точки фазовой плоскости перемещается по направлению к началу координат. Область притяжения особой точки — начала координат — охватывает всю фазовую плоскость.
144 Глава 4. Нелинейные и самонастраивающиеся системы
Точки и другие части фазового пространства, притягивающие к себе траектории, называются аттракторами. Каждый аттрактор имеет свою область притяжения. В случае устойчивой линейной системы начало координат — единственный аттрактор на фазовой плоскости, и вся плоскость — его область притяжения.
У неустойчивой линейной системы изображающая точка из любой точки фазового пространства по фазовой траектории неограниченно удаляется от начала координат. «Область отталкивания» особой точки — начала координат — охватывает всю фазовую плоскость, кроме линии устойчивых колебаний в одном из типов фазовых портретов.
На рис. 4.3 показаны два возможных типа фазовых портретов устойчивой линейной системы. В случае рис. 4.3, а особая точка называется устойчивым узлом, в случае рис. 4.3, б — устойчивым фокусом.
На рис. 4.4 показаны три возможных типа фазовых портретов неустойчивой линейной системы.
Особая точка в случае рис. 4.4, а называется неустойчивым узлом, в случае рис. 4.4, б — неустойчивым фокусом, а в случае рис. 4.4, в — седлом.
В линейной системе возможно только одно положение равновесия и соответственно только одна особая точка — начало координат. Кроме того, в линейной системе невозможны незатухающие колебания за исключением точек, расположенных на линии аа в случае седла (рис. 4.4, в). Соответственно фазовый портрет линейной системы не содержит замкнутых фазовых траекторий.
Рис. 4.3. Два типа фазовых портретов устойчивых линейных систем: а — устойчивый узел, б — устойчивый фокус
Нелинейные системы
143
а — неустойчивый узел, б — неустойчивый фокус, в — седло
Для простоты была рассмотрена система двух линейных дифференциальных уравнений первого порядка (4.1), Все изложенное выше непосредственно распространяется на систему, состоящую из любого числа линейных дифференциальных уравнений первого порядка, а значит, и на любую линейную систему, так как каждое уравнение более высокого порядка может быть заменено несколькими уравнениями первого порядка с помощью упомянутого выше приема. Надо лишь вместо двумерной фазовой плоскости рассматривать фазовое пространство, у которого число измерений равно числу уравнений первого порядка в рассматриваемой системе.
Основные свойства описанных выше фазовых портретов систем двух уравнений остаются в силе и в этом случае. Если система линейна, то:
а) фазовое пространство содержит только одну особую точку — начало координат;
146 Глава 4. Нелинейные и самонастраивающиеся системы
б) область притяжения этой особой точки, если система устойчива (или «область отталкивания» — если система неустойчива), охватывает все фазовое пространство;
в) в фазовом пространстве не содержится замкнутых фазовых траекторий.
Иначе дело может обстоять, когда рассматриваемая система уравнений содержит хотя бы одно нелинейное уравнение.
4.1.3. Фазовые портреты нелинейных систем
Совершенно так же, как и в линейной системе, процесс регулирования, описываемый уравнениями, содержащими нелинейности, может быть представлен на фазовой плоскости или в фазовом пространстве.
Рассмотрим и здесь в качестве основного примера случай, когда движения описываются двумя дифференциальными уравнениями первого порядка:
х\ = f{(x{,x2\, (4.4, а)
х'2 = fitx^Xi), (4.4,6)
где /(Х|, х2) и f2(x{, х2) — заданные, в общем случае нелинейные функции указанных аргументов.
Дифференциальное уравнение фазовых траекторий получается из (4.4), если вместо производных по времени ввести производную dxjdx^.
Получаем:
dxx/dx2 =/(%,, x^lf2(xx, х2). (4.5)
К фазовой траектории может быть проведена только одна касательная, и, следовательно, фазовые траектории не пересекаются во всех тех точках фазовой плоскости, где не обращаются одновременно в нуль/(*!, х2) и /2(xj, х2). Особые точки системы находятся из условия dxjdx2 - 0/0, то есть определяются как общие корни двух уравнений:
Z1(X1; х2) = 0;
/2(х„ х2) = 0.
(4.6, а)
(4.6, б)
Нелинейные системы
147
В предыдущем случае при рассмотрении линейной системы было:
У|(Х[, х2) = ах, + Ьх2 = 0;
f2(x\, х2) = ex, + dx2 = 0,
и уравнения (4.6) имели только одно общее решение: х, = х2 = 0. В плоскости Х|, х2 условия (4.6) в случае линейной системы (4.1) определяют две прямые линии, пересекающиеся в начале координат (рис. 4.5, а). Если же функции /1(х,, х2) и f2{xx, х2) нелинейны, то кривые, соответствующие уравнениям (4.6), могут пересекаться и вне начала координат. Система (4.6) имеет в этом случае, кроме решения х, = х2 = 0, и другие решения. В этом случае, кроме регулиру-Ъмого режима, соответствующего началу координат, в системе возможны и иные положения равновесия (рис. 4.5, б), и характер движения в системе зависит от величины отклонения от начала координат, вызванного возмущением.
В рассматриваемом нелинейном случае особые точки могут быть лишь тех же типов, что и в линейной системе (фокусы, узлы и седла). Чтобы в нелинейном случае определить тип особой точки, надо составить соответствующее этой особой точке уравнение линейного приближения, разложив в окрестности этой точки в ряды правые части уравнений (4.6) и сохранив затем в этих рядах только линейные члены. Эта операция эквивалентна «локальной» линеаризации системы вблизи особой точки.
На рис. 4.6, а в качестве примера показан фазовый портрет системы (4.4) для случая, когда кривые j\(x\, х2) = 0 и f2(x\, х2) = 0 пересекаются в двух точках. Кроме начала координат, где находится осо-
а) б)
Рис. 4.5. Графики, соответствующие уравнениям (4.6) для линейной (а) и нелинейной (6) систем
148
Глава 4. Нелинейные и самонастраивающиеся системы
а) б)
Рис. 4.6. Фазовые портреты нелинейных систем: а — с устойчивым фокусом и седлом, б — с устойчивым фокусом и предельным циклом: В обоих случаях имеются заштрихованные области устойчивости
бая точка — аттрактор — устойчивый фокус, они пересекаются ещё в одной точке — неустойчивом узле, где располагается седло. Жирной линией показана траектория, проходящая через седло и выделяющая область притяжения устойчивого равновесного режима, то есть аттрактора типа «устойчивый фокус», расположенного в начале координат (эта область заштрихована на рисунке).
До тех пор, пдка изображающая точка на фазовой плоскости рис. 4.6, а находится внутрй заштрихованной области, с течением времени фазовые траектории системы будут стремиться к началу координат, и по отношению к таким начальным состояниям система является устойчивой. Если же в результате возмущения изображающая точка окажется вне заштрихованной области, то исходящая из этой точки фазовая Траектория уходит в бесконечность, и по отношению к такому возмущению система неустойчива. Заштрихованную область притяжения особой точки, расположенной в начале координат, поэтому можно назвать областью устойчивости системы. Фазовый портрет, показанный на рис. 4.6, а, так же, как и фазовый портрет линейной системы, не содержит замкнутых фазовых траекторий. Между тем в нелинейных системах, как в том случае, когда имеется одна особая точка, так и в случае нескольких особых точек, могут содержаться замкнутые траектории.
Нелинейные системы
149
На рис. 4.6, б показан пример системы, имеющей только одну особую точку в начале координат (устойчивый фокус) и одну замкнутую траекторию, охватывающую начало координат. Фазовые траектории не могут пересекаться где-либо вне особой точки, и поэтому замкнутая Траектория (ее называют предельным циклом) отделяет облить притяжения особой точки — заштрихованную область устойчивости системы от «(внешней» части фазовой плоскости, где система Неустойчива. Внутри предельного цикла фазовые траектории «сматываются» с него и «наматываются» На начало координат. Снаружи фазовые Траектории «разматываются» с предельного цикла, И по Любой фазовой Траектории изображающая точка уходит в бесконечность. Сам предельный цикл соответствует незатухающим колебаниям, но .в данном случае они неустойчивы, поэтому такой предельный Цикл называется неустойчивым предельным циклом. Достаточно сколь угодно малого возмущения, чтобы изображающая точка, сойдя с предельного цикла, более уже не возвращалась на него, а перемещалась бы по соответствующей траектории к началу координат или в бесконечность. Незатухающие колебания в такой Системе реально не наблюдаются, а роль предельного цикла состоит лишь в ограничении области действия аттрактора.
Другой пример системы, имеющей одНу особую точку («неустойчивый фокус») и один охватывающий ее предельный цикл, показан на рис. 4.7, а.
Здесь положение равновесия неустойчиво, но «Область отгадки -вайия» или неустойчивости системы ограничена предельным циклом (Эта область заштрихована на рис. 4.7, а). При начальном положении изображающей точки Внутри заштрихованной области система будет двигаться по траекторий, соответствующей колебаниям с нарастающей амплитудой, и постепенно в системе установятся незатухающие колебания, соответствующие предельному циклу. Наоборот, При начальном положении Вне заштрихованной области, колебания затухают до тех пор, пока точка не попадёт на предельный цикл, и установятся колебаний, соответствующие предельному циклу. Он в этом случае не только разделяет две области фазового портрета, но и определяет устойчивые незатухающие колебания в системе (устойчивый предельный цикл). В данном случае предельный цикл является аттрактором.
На рис. 4.7, б показан фазовый портрет системы, содержащий два предельных цикла, охватывающих единственную особую точку — устойчивый фокус. Эта система имеет два аттрактора.
Область притяжения первого аттрактора — фокуса в начале координат, соответствующего регулируемому равновесию, ограничена
150 Глава 4. Нелинейные и самонастраивающиеся системы
а) б)
Рис. 4.7. Фазовые портреты нелинейных систем с предельными циклами: а — в системе один аттрактор — устойчивый предельный цикл, его область притяжения — вся фазовая плоскость, б — система с двумя предельными циклами (устойчивым и неустойчивым) и одним устойчивым фокусом
внутренним неустойчивым предельным циклом. Если возмущения не выводят систему за пределы области, охватываемой внутренним предельным циклом, положение равновесия восстанавливается и система сохраняет устойчивость. Если же система окажется вне внутреннего предельного цикла, она попадает в область притяжения второго аттрактора — внешнего устойчивого предельного цикла, и в системе с течением времени устанавливаются незатухающие колебания, соответствующие внешнему циклу.
На рис. 4.3, а показан аналогичный фазовый портрет для случая, когда положение регулируемого равновесия неустойчиво, и в начале координат располагается неустойчивый фокус. Если начальное состояние этой системы лежит в любой точке фазовой плоскости, лежащей внутри внешнего предельного цикла, то в системе устанавливаются незатухающие колебания, соответствующие единственному аттрактору — внутреннему предельному циклу. Если же начальное состояние окажется вне внешнего предельного цикла, то в системе возникают колебания, амплитуда которых неограниченно растет.
Система может иметь предельные циклы и тогда, когда фазовый портрет содержит более одной особой точки. Пример такого рода показан на рис. 4.8, б. Здесь регулируемое равновесие неустойчиво
Нелинейные системы
151
а) б) .
Рис. 4.8. Фазовые портреты нелинейных систем, не имеющих устойчивых особых точек: a — система с двумя предельными циклами, из которых только внутренний устойчив, б — система с устойчивым предельным циклом И седлом
(в. начале координат — неустойчивый фокус), предельному циклу соответствуют устойчивые незатухающие колебания, которые устанавливаются с течением времени, если начальная точка лежит внутри области, выделенной фазовой траекторией, проходящей Через вторую особую точку — седло. Эта траектория Выделена на рис. 4.8, б жирной линией.
Если фазовый портрет системы содержит более одной особой точки или если он содержит замкнутые траектории (предельные циклы), то область устойчивости не может охватывать всей фазовой плоскости подобно тому, как это имеет место в линейной системе. В этом случае область устойчивости всегда ограничена предельным циклом или фазовой траекторией, проходящей через особую точку.
Разумеется, фазовый портрет нелинейной системы (4.4) может и не содержать дополнительных особых точек или замкнутых траекторий. В этом Случае область влияния начала координат фазового пространства может охватывать всю фазовую плоскость и, так же, как в линейной системе, устойчивость не зависит от величины начального положения изображающей точки и величины возмущений.
До сих пор рассматривалась система, для описания которой достаточно двух уравнений первого порядка.
152
Глава 4. Нелинейные и самонастраивающиеся системы
В большинстве случаев при решении практических задач теории автоматического регулирования приходится иметь дело с уравнениями более высоких порядков.
Если порядок уравнения системы п больше, чем второй, то вместо двумерного фазового пространства — плоскости рассматривают л-мерное пространство, то есть такое пространство, в котором для задания точки надо задать л чисел — координат.
Если система дифференциальных уравнений имеет периодическое решение, то этому решению в фазовом пространстве соответствует замкнутая кривая. На плоскости замкнутые кривые являлись границами областей. В пространстве же ограничивать определенные области могут только поверхности, а не кривые. Поэтому замкнутая траектория по-прежнему соответствует периодическому решению рассматриваемой системы дифференциальных уравнений, но не служит границей области.
Существуют два принципиальных различия между фазовой плоскостью и фазовым пространством.
1. На фазовой плоскости предельный цикл является не только образом колебательного движения, но и границей области устойчивости для другого предельного цикла или особой точки.
Иногда границей служат и сепаратрисные кривые, но это имеет место в сравнительно редких случаях (главным образом при наличии нескольких особых точек, когда сепаратрисами служат траектории, проходящие через седла — см. рис. 4.6, а и рис. 4.8, б).
В фазовом же пространстве никакая кривая (в том числе и предельный цикл) не может быть границей области.
Области ограничиваются сепаратрисными поверхностями, целиком состоящими из фазовых траекторий.
В результате для фазовой плоскости нахождение особых точек и предельных циклов часто решает задачу и об областях устойчивости «в большом». В фазовом же пространстве нужно для этого найти и сепаратрисные поверхности — задача чрезвычайно сложная.
2. В системах второго порядка колебания могут быть только периодическими на одной определённой частоте.
При более высоких порядках могут сосуществовать колебания разных частот, например:
х(0 = A sin at + В sin Qr.
Если частоты со и Q не связаны целочисленным соотношением к со = т£1 (где к и т — целые числа), то сумма этих двух колебаний есть тоже колебание, но непериодическое.
Нелинейные системы
153
Рис. 4.9. Тороидальная поверхность, образуемая колебаниями в системе _ третьего порядка
Такое колебание в фазовом пространстве образует уже не замкнутую траекторию, а траекторию, полностью заполняющую некоторую замкнутую поверхность (например, тор — см. рис. 4.9).
4.1.4. Пространство параметров. Бифуркации
Фазовые портреты особенно удобны для оценки качественной картины движений, возможных в системе. Одного взгляда, например, на рис. 4.7, б достаточно для того, чтобы утверждать, что в системе, имеющей такой фазовый портрет, положение равновесия устойчиво по отношению к возмущениям, не превосходящим определенного порога, а при возмущениях, превосходящих этот порог, устанавливаются незатухающие колебания, амплитуда и частота которых совершенно не зависит от того, насколько превзойден указанный выше порог. Эта картина сохраняется вне зависимости от размеров предельных циклов; от этих размеров зависят лишь пороговые значения возмущений, а также амплитуда и частота незатухающих колебаний, то есть количественная, а не качественная сторона дела.
Качественная же картина движений целиком определяется топологической структурой фазового пространства, а именно наличием, типом и взаимным расположением особых траекторий — особых точек, предельных циклов, сепаратрис.
154 Глава 4. Нелинейные и самонастраивающиеся системы
Пусть теперь в некоторой системе фиксированы значения всех параметров, кроме какого-либо одного (например, кроме постоянной времени или коэффициента усиления какого-либо звена). Назовем его параметром а. Положим, что при некотором значении а = а, все параметры системы определены и может быть тем или иным способом построен фазовый портрет системы. Пусть, например, он имеет вид, показанный на рис. 4.7, б. Изменим теперь значение а. Новому значению а соответствует новый фазовый портрет. Таким образом, каждому значению а может быть поставлен в соответствие определенный фазовый портрет. Из теоремы о непрерывной зависимости решений дифференциальных уравнений от параметров следует, что при малом изменении а фазовый портрет также меняется мало. Если точке а = а, соответствовал фазовый портрет, имеющий топологическую структуру рис. 4.7, б, то такую же топологическую структуру будет иметь фазовый портрет при а = а, ± е, по крайней мере, если |е| достаточно мало. С ростом s может быть достигнуто значение s, при котором структура фазового портрета изменится. Это может произойти, например, при слиянии отдельных особых траекторий или при потере или приобретении ими устойчивости. Так, например, на фазовом портрете на рис. 4.7, б внутренний предельный цикл может по мере увеличения а стягиваться к началу координат и при некотором значении а = а2 слиться с ним, так что при дальнейшем изменении а фазовый портрет будет содержать лишь один предельный цикл, и особая точка в начале координат станет неустойчивой. Эта новая структура фазового пространства будет сохраняться при а > а2, если не будет далее достигнуто новое значение а = а3, при котором вновь изменится топологическая структура фазового портрета.
Таким образом, при изменении какого-либо параметра количественные характеристики фазового портрета меняются непрерывно, а качественная характеристика фазового портрета, — его топологическая структура, — претерпевает резкие изменения при дискретных значениях параметра. Эти дискретные значения параметра называются бифуркационными.
Бифуркационные точки разделяют всю область возможных значений параметра а на участки, соответствующие системам, имеющим одинаковую структуру фазового пространства.
У линейных систем возможны только две топологические структуры фазового пространства: особых траекторий нет, единственная особая точка в начале координат (устойчивая при одной структуре и неустойчивая при другой), область устойчивости или неустойчиво
Нелинейные системы
155
сти не ограничена. Смена этих топологических структур происходит при дискретных значениях изменяемого параметра — на границе области устойчивости. В этом смысле значение параметра на границе области устойчивости является бифуркационным. Но у нелинейных систем понятие бифуркации более общее. Бифуркационное значение параметров может соответствовать не только смене устойчивости особой точки, но и исчезновению, либо зарождению предельного цикла, изменению числа особых точек и т. д.
До сих пор для простоты речь шла об одном параметре системы и его влиянии на фазовый портрет. Нетрудно обобщить введенное понятие на пространство параметров любого числа измерений подобно тому, как обобщается понятие «область устойчивости» у линейных систем.
Пусть для полного определения уравнений движения системы надо задать т параметров.
В /и-мерном пространстве этих параметров каждой точке соответствует определенная структура фазового пространства и, следовательно, может быть указана гиперповерхность, разделяющая пространство параметров на области, соответствующие системам, имеющим одинаковую топологическую структуру фазового пространства. В частном случае, когда рассматриваемая система может быть однозначно определена заданием двух параметров, пространством параметров служит обычная плоскость, а бифуркационные значения параметров определяют кривую в этой плоскости.
4.1.5. Устойчивость нелинейных систем «в малом», «в большом» и «в целом». Системы, эквивалентные устойчивым линейным.
Абсолютная устойчивость
Задача расчёта нелинейной САУ может считаться полностью качественно решенной, если определены фазовые портреты, возможные в этой системе, и если в ее пространстве параметров определены бифуркационные границы. Количественное решение задачи требует, кроме того, определения формы и расположения предельных циклов и сепаратрис (или сепаратрисных поверхностей) для каждой точки пространства параметров.
Аналитически столь полно решить нелинейную задачу удается лишь в отдельных частных случаях и, как правило, при существенной идеализации задачи.
Для практики наибольшее значение имеют две частные задачи, упомянутые в 4.1.1. С геометрической точки зрения, первая задача
156 Глава 4. Нелинейные и самонастраивающиеся системы
состоит в выделении нелинейных систем, у которых фазовое пространство имеет наиболее простую топологическую структуру: единственная особая точка (устойчивый фокус или узел) расположена в начале координат, иных особых траекторий нет, и область устойчивости (притяжения) особой точки охватывает все пространство. Именно такую топологическую структуру имеет фазовое пространство устойчивой линейной системы. В этом смысле задача сводится к отысканию условий, при выполнении которых нелинейная система топологически эквивалентна (условно мы будем говорить просто «эквивалентна») устойчивой линейной системе.
Вторая задача связана с определением периодических решений систем дифференциальных уравнений. Знание возможных периодических решений играет разную роль для систем, имеющих второй порядок, и для систем, имеющих более высокий порядок. В любом случае знание периодических решений важно само по себе: если периодическое решение устойчиво, то оно определяет незатухающие колебания, возможные в системе. Но для систем второго порядка знание периодических решений (то есть предельных циклов) и возможных равновесий (особых точек) позволяет часто восстановить фазовый портрет системы, а условия появления периодических решений позволяют восстановить ее бифуркационные границы. Иначе обстоит дело для систем, порядок которых выше двух. У таких систем знание особых точек и предельных циклов недостаточно для восстановления фазового портрета — решающую роль играют сепа-ратрисные поверхности.
Когда говорят об устойчивости линейных систем, имеют в виду просто сходимость к положению равновесия процесса, вызванного произвольным начальным отклонением или возмущением. Используя геометрический образ фазового пространства, можно уточнить теперь понятие устойчивости нелинейной системы.
Равновесие называется устойчивым «в малом», если ему соответствует в фазовом пространстве системы устойчивая особая точка, то есть можно указать в фазовом пространстве область, из любой точки которой фазрвые траектории ведут к точке равновесия.
Таким образом, утверждение, что регулируемый режим устойчив «в малом», означает лишь наличие точки — аттрактора, но не определяет как-либо границ её области притяжения. Пусть фазовый портрет системы построен и выделена область притяжения особой точки (область устойчивости). Назовем ее областью А.
Укажем теперь на фазовой плоскости область, в пределах которой могут оказаться значения координат х,, х2 рассматриваемой системы автоматического регулирования в соответствии с условиями ее
Нелинейные сшстемы
157
технической эксплуатации, то есть область рабочих диапазонов х, и х2. Назовем ее областью В.
Если все точки области В принадлежат области А, то регулируемый режим называется устойчивым «?в большом».
На рис. 4.10 показан пример фаэзового портрета, в котором область устойчивости ограничена неусттойчивым предельным циклом. Две области значений х,, х2 при любых физически возможных возмущениях системы заданы в виде- прямоугольников. В случае рис. 4.10, а система устойчива «в болпьшом», а в случае рис. 4.10, б она устойчива «в малом», но не устойгчив^ «в большом», так как при некоторых значениях и х2, возможных в системе, регулируемый режим не восстанавливается.
Если область притяжения особо® точки (область устойчивости) не ограничена и охватывает все фазсввое пространство, то есть система устойчива после любых начальных отклонений, то она называется устойчивой «в целом». Если лманейная система устойчива, то она всегда устойчива «в целом». Нелинейные системы, имеющие единственное положение равновесияустойчивое «в целом», составляют класс нелинейных систем, в смысле топологической структуры фазового пространства эквивалентные линейным.
Разработано множество аналитигческих методов исследования нелинейных систем. Однако как было отмечено выше, все они включают в большинстве случаев суицественные упрощающие предположения. Между тем, использовакие современных быстродействующих компьютеров позволяет за сравнительно короткое время
а) б)
Рис. 4.10. Области устойчивости сисстемы в фазовой плоскости: а — «в большом» и б- — «в малом»
158
Глава 4. Нелинейные и самонастраивающиеся системы
строить реальные фазовые портреты систем без упрощающих предположений. При этом путём прямых компьютерных экспериментов удаётся в большинстве случаев выявить бифуркационные границы и установить комбинации параметров системы, обеспечивающие её устойчивость в целом.
4.2. Импульсные (релейные) системы в скользящем режиме
Существуют обширные классы объектов, в которых не требуется поддерживать точное значение выходной величины, а достаточно удерживать эту величину в заданных пределах. Режим автоколебаний в заданных пределах назовём скользящим режимом управления. Для организации скользящих режимов и управления такими объектами могут использоваться управляющие устройства со специально подобранными сильно нелинейными (релейными) статическими характеристиками.
Два простых и общеизвестных объекта такого рода: домашний компрессионный холодильник и система электропитания автомобиля в части поддержания аккумулятора в заряженном состоянии. С точки зрения принципов работы эти две системы практически не отличаются друг от друга. Обе они работают в скользящем режиме. Рассмотрим подробнее работу первой из них.
В холодильнике двигатель компрессора, обеспечивающего циркуляцию хладагента, включается только тогда, когда температура в некоторой точке морозильной камеры повышается выше заданного значения. В первом приближении можно считать, что система охлаждения, когда она работает, оказывает постоянное охлаждающее воздействие на морозильную камеру, причём скорость охлаждения пропорциональна разности температур в камере 0 и кипения хладагента 0А. Повышение температуры в камере происходит за счёт «утечки холода», скорость которой пропорциональна разности температур в камере и наружного воздуха 0О. Таким образом, динамика температуры в холодильнике, когда компрессор работает, может быть описана уравнением (для упрощения письма рассматриваем абсолютную температуру в градусах Кельвина):
de/dt = -(в - 0А)/ ГА + (0О - 0)/ То,
где ТА — постоянная времени охлаждения, То — постоянная времени «утечки холода» и 0А < 0О (иначе зачем нужен холодильник?!). Из
Импульсные (релейные) системы в скользящем режиме 159 этого уравнения, в частности, следует, что процесс охлаждения будет происходить по экспоненте, и нижний предел, к которому будет стремиться температура в камере есть
0пред = (0А7’о + Оо7’А)/(7’о+7’А)1
откуда ясно, насколько важно соблюдение условия Го» ГА, то есть хорошая теплоизоляция камеры. При соблюдении этого условия впред = 0А + 00 / Не-
когда компрессор отключён, имеем:
de/dt=(e0-e)/T0.
Отсюда следует тривиальный вывод, что при отключённом компрессоре температура в камере экспоненциально стремится к температуре окружающего воздуха.
Положим сначала, что 0Аи 90 - постоянны. Пусть нижний предел температуры в холодильной камере есть 0МИИ > 0прел, а верхний — 0макс < 0О. Холодильник снабжается термореле, которое включает компрессор, если 0 > 0макс и отключает его при 0 < 0МИН. Благодаря этому температура в камере будет совершать колебания, показанные на рис. 4.11, а, между 0макс и 0МИИ. Характеристика термореле должна иметь вид, показанный на рис. 4.11, б, и обладать петлёй гистерезиса шириной 0макс - 0ЧИН. Ширина этой петли определяет не только
Рис. 4.11. Автоколебания в релейной системе регулирования холодильника (а) и статическая характеристика термореле (б)
160
Глава 4. Нелинейные и самонастраивающиеся системы
размах колебаний температуры, но и частоту включения — отключения компрессора. Чем уже петля гистерезиса, тем выше частота этих автоколебаний. Отсюда — технические ограничения подобного рода систем. Проблема состоит в том, что попытки слишком сузить диапазон 0макс - 0МИН, что эквивалентно увеличению точности регулирования, приведут сначала к повышенному износу электромеханических узлов системы. При дальнейшем сужении диапазона регулирования начнут играть роль времена разгона и останова компрессора, что приведёт к потере системой работоспособности.
Понятно, что роль реле в подобных системах могут выполнять самые разнообразные устройства, а не только электромеханические реле. Важно только наличие у этого устройства петли гистерезиса, охватывающей Искомое значение регулируемой величины и имеющей ширину, соответствующую требованиям к системе.
В случае холодильника или автомобильного аккумулятора внешняя нагрузка на объект регулирования обеспечивает возвратное движение выхода объекта. Холодильная камера нагревается от наружного воздуха, а аккумулятор разряжается за счёт электрической нагрузки или саморазряда.
Во многих объектах нагрузка не влияет подобным образом, и система должна сама обеспечивать нахождение регулируемого параметра в заданных пределах. Структура такой системы показана на рис. 4.12, а. В этой системе управляющее устройство имеет статиче-
б)
Рис. 4.12. Релейная система регулирования с управляющим устройством типа поляризованного реле: а — структура системы, б — статическая характеристика управляющего устройства
Импульсные (релейные) системы в скользящем режиме 161
скую характеристику поляризованного реле, показанную на рис. 4.12, б, а исполнительный механизм (например, электродвигатель) должен быть реверсируемым. На входе управляющего устройства формируется сигнал ошибки — разности между сигналом регулируемого параметра у и уставкой х:
е = у - х.
До тех пор, пока сигнал ошибки лежит в допустимых пределах -емакс Е - + £макс> выходной сигнал управляющего устройства равен нулю, и исполнительный механизм бездействует. При отклонении выходной величины объекта от уставки х в положительном направлении, когда е становится больше емакс, управляющее устройство выдаёт сигнал на включение исполнительного механизма, который воздействует на объект так, чтобы значение у уменьшалось. И наоборот, когда с оказывается меньше -Емакс, выдаётся сигнал управления на рост у. Как и в предыдущем случае, тонкость состоит в ширине петель гистерезиса g управляющего устройства (рис. 4.12, б). Положим, что некое внешнее возмущение вызывает увеличение у. Тогда в системе возникнет скользящий режим автоколебаний в пределах правой петли. Если ширина петли гистерезиса g будет мала, то, как это было показано в примере с холодильником, частота автоколебаний будет неоправданно высокой, а амплитуда — малой. Поэтому в данном случае желательно иметь значение g, близкое к |емакс|, но ни в коем случае не большее |емакс|.
Скользящие режимы могут успешно использоваться не только для регулирования, но и для автоматического управления переходными режимами технологических объектов. На рис. 4.13, а показана структура САУ технологической установкой — химическим реактором, процесс в котором ведётся под очень высоким давлением, которое подлежит регулированию во всех режимах работы установки. В реакторе протекает экзотермическая реакция со значительным выделением тепла и потому имеется система водяного охлаждения. Скорость реакции, а следовательно, и тепловыделение существенно растут с ростом давления. Тем не менее, нельзя допускать, чтобы температура в реакторе G превысила заданное максимальное значение 0макс. Воздействовать на температуру можно, только резко уменьшая давление.
В первом приближении этот объект можно описать как последовательное соединение двух звеньев: апериодического звена, выходным сигналом которого является давление, и последовательно соединенного с ним форсирующего звена, на входе которого сигнал
6 - 8764 Гальперин
162 Глава 4. Нелинейные и самонастраивающиеся системы
а)
б)
Рис. 4.13. Структура САР химическим реактором (а) и процессы в ней при пуске реактора в скользящем режиме (б)
давления, а на выходе — температура в реакторе. Контур давления охвачен обратной связью через ПИД-регулятор. На сравнивающее звено на входе ПИД-регулятора подаются сигнал давления у и уставка давления х рабочего режима реактора. Пока система охлаждения справляется с потоком тепла, идущим из реактора, и температура 0<0макс, внешний температурный контур отключён релейным устройством, и ПИД-регулятор удерживает равенство у - х. Но как только температура превышает 0макс, устройство управления уставкой снижает уставку давления со значения х на меньший уровень. Давление падает, и вместе с ним падает температура не только из-за замедления реакции, но и вследствие падения давления. Относительное изменение температуры происходит быстрее и сильнее, чем давления, поэтому реактор быстро возвращается в рабочий режим.
Самонастраивающиеся системы с оптимизацией
163
Эта же система температурной защиты позволяет производить безопасный разгон реактора при пуске от дремлющего к рабочему режиму. При пуске реактора (рис. 4.13, б) на входе системы уставка х1( соответствующая дремлющему режиму. С ростом х давление начинает расти от начального значения у,. В какой-то момент температура «обгоняет» давление и становится выше 0макс. Рост уставки сразу прекращается, давление стабилизируется и температура снижается благодаря системе охлаждения. Когда температура снижается до некоторого уровня 0О, подъём х, а следом и у продолжается. Возникают автоколебания — скользящий режим, при котором давление почти плавно нарастает с максимально возможной скоростью.
Фактически в системе автоматически решается задача об оптимальном быстродействии при смене режимов объекта управления. Этот принцип организации скользящего режима с ограничением по неуправляемой непосредственно фазовой координате широко используется в различных технических устройствах, начиная от технологических агрегатов вроде рассмотренного реактора и кончая системами блокировки-тормозов в автомобилях, предохраняющих от заноса на скользкой дороге.
4.3. Самонастраивающиеся системы с оптимизацией фазовых координат объекта
Самонастраивающимися или адаптивными системами управления обычно называют САУ, в которых для повышения точности управления неполнота исходной информации об объекте восполняется за счёт данных, получаемых в процессе управления путем испытаний или измерений.
При этом возможны два подхода. Первый основан на автоматическом отыскании таких уставок регуляторов или выходов других управляющих устройств, управляющих фазовыми координатами объекта или технологического процесса, которые обеспечивали бы в каком-то заданном смысле оптимальные значения этих фазовых координат. Внутренние структуры и параметры настроек регуляторов и управляющих устройств при этом не меняются. Второй подход включает в себя изменения внутренней структуры и/или параметров самих управляющих устройств, а точнее — алгоритмов управления. Эти изменения, разумеется, имеют конечной целью оптимизацию работы САУ путём воздействия на объект, но воздействия, опосредованного через настройку алгоритмов управления. Здесь будут рас
164
Глава 4. Нелинейные и самонастраивающиеся системы
смотрены системы, основанные на первом подходе, а второй подход — в следующем параграфе.
4.3.1. Экстремальные регуляторы
При рассмотрении систем регулирования всюду выше предполагалось, что желаемое значение регулируемой величины заранее известно, Однако это далеко не всегда так. Очень часто возникает задача
автоматического отыскания оптимального значения некоторого параметра или фазовой координаты технологического процесса, при котором этот процесс идёт наилучшим образом, обеспечивая, на
пример, максимум производительности при заданном расходе энергии и сырья или, наоборот, минимум энергетических затрат при заданной производительности.
Регуляторы с такими функциями называются экстремальными.
Одна из подобных задач уже обсуждалась в главе первой. Здесь структуры и методы экстремального регулирования будут рассмотрены в более общем виде и подробнее.
Обозначим значение сигнала на регулируемом выходе объекта через у, а управляющего им сигнала с выхода управляющего устройства — через х. Положим, что статическая характеристика объекта у = Дх) имеет экстремум (максимум или минимум). В зависимости от различных факторов функция Дх) изменяется, и точка, соответствующая экстремуму, перемещается в плоскости ху (рис. 4.14).
Требуется непрерывно автомати
Рис. 4.14. Дрейф экстремальной статической характеристики объекта во времени
чески находить и поддерживать значение х, соответствующее экстремуму — максимуму функции
У=Ях).
На рис. 4.15 показана простейшая схема экстремального регулятора, решающего эту задачу. Измеренное значение регулируемой величины у подается на вход дифференцирующего устройства. Сигнал на выходе этого устройства пропорционален производной у по времени dy/dt. Далее по цепи расположено делительное устройство. На его вход подаются сигналы, пропорциональные dy/dt и ско-
Самонастраивающиеся системы с оптимизацией
165
Рис. 4.15. Простейшая схема экстремального регулятора
рости изменения управляющего сигнала dx/dt, а сигнал на выходе - пропорционален их отношению dy/dx.
При изменении знака этой производной реле реверсирует исполнительный механизм, то есть меняет направление перемещения регулирующего органа. Все устройство в целом можно рассматривать в качестве обычного регулятора, удерживающего величину dy/dx на значении dy/dx = 0. Измерительные устройства, реагирующие на х и у, в совокупности с дифференцирующими и делительным устройствами могут рассматриваться как чувствительный элемент, реагирующий на отклонение «регулируемого параметра» dy/dx
от нуля.
Но значение dy/dx становится неопределенным, если одновременно dx/dt =§ и dy/dt = 0. Поэтому такой регулятор может работать, только если регулирующий орган не останавливается при достижении максимум^ у=Дх). Это обеспечивается применением
двухпозиционного реле-переключателя, то есть построением регу-
лятора по схеме импульсного регулятора, работающего в скользящем режиме. Достигнув максимума
у = Дх) регулятор колеблется около него, совершая некое подобие пробных шагов. Естественно, что размах этих колебаний должен находиться в определённых, допустимых пределах.
Основной недостаток регулятора такого типа состоит в том, что он очень чувствителен к помехам. Из-за наличия помех характеристика у -f{x) имеет много небольших локальных
Рис. 4.16. Локальные и глобальный максимумы на статической характеристике объекта
экстремумов (рис. 4.16). Для того чтобы описанный регулятор отличал искомый (истинный) глобальный макси
166
Глава 4. Нелинейные и самонастраивающиеся системы
мум — экстремум от ложных экстремумов, его приходится либо заметно усложнять, либо делать достаточно грубым за счёт гистерезиса реле.
На рис. 4.17 представлена иная схема экстремального регулятора. На регулирующий орган воздействуют как исполнительный механизм регулятора, так и колебания постоянной частоты, создаваемые специальным генератором.
Рис. 4.17. Структура экстремального регулятора с генератором пробных колебаний
Предположим сначала, что регулирующий орган совершает только колебания. Колебания регулируемой величины у на выходе объекта совершаются с той же частотой, но их фазовый угол зависит от знака dy/dx характеристики у = f(x). При прохождении через экстремум характеристики изменяется знак фазового сдвига.
В схеме, представленной на рис. 4.17, значение у подается на вход фазового детектора [9], реагирующего на знак фазы колебаний и, в зависимости от этого знака, переключающего реле, которое реверсирует исполнительный механизм.
В результате регулирующий орган участвует одновременно в двух движениях — поступательном и колебательном. Колебательное движение используется для получения сигнала о достижении искомого экстремума. При прохождении экстремума изменяется направление поступательного перемещения регулирующего органа.
Иной способ построения экстремальных регуляторов используется в схеме рис. 4.18, а.
Регулируемая величина одновременно подается на входы запоминающего и сравнивающего устройства. В запоминающем устройстве запоминается наибольшее (либо наименьшее) значение, достигаемое регулируемой величиной. В сравнивающем устройстве значение регулируемой величины, которое находится в запоминающем устройстве, сравнивается с текущим ее значением.
Самонастраивающиеся системы с оптимизацией
167
а)
Рис. 4.18. Экстремальный регулятор с запоминанием экстремума: а — структура, б — графики, поясняющие принцип работы
До тех пор, пока регулируемая координата растет, то есть до достижения точки максимума (рис. 4.18, б), на оба входа сравнивающего устройства подается одна и та же величина — текущее значение у.
После прохождения точки максимума в памяти хранится соответствующее ему значение у = умакс, и эта величина подается на один из входов сравнивающего устройства, а на второй его вход подается текущее значение у, которое теперь, после прохождения точки максимума, уменьшается. В момент, когда разность между ними достигает заданной величины (например, 0,5 % или 1 % от значения, которое зафиксировано в запоминающем устройстве), на выходе сравнивающего устройства вырабатывается сигнал, который выполняет две функции: переключает реле, реверсирующее направление перемещения исполнительного механизма, и очищает «память» запоминающего устройства, после чего меняется направление поиска.
Здесь приведены лишь простые примеры устройств экстремальных регуляторов для поиска экстремума функции одной переменной. В практике используются множество иных способов построения таких регуляторов. Слишком структура экстремального регуля
168 Глава 4. Нелинейные и самонастраивающиеся системы
тора и метод поиска экстремума зависят от специфики объекта, чтобы здесь можно было выработать некие универсальные рецепты.
Заметим, что все приведенные здесь структуры экстремальных регуляторов можно и нужно рассматривать как алгоритмы поиска экстремума, которые без проблем могут быть реализованы в виде программ специализированных микропроцессорных устройств или универсальных управляющих компьютеров.
Описанные выше принципы могут быть использованы и при построении экстремальных регуляторов для поиска экстремума функции нескольких переменных. Такой регулятор управляет несколькими регулирующими органами.
Допустим, например, что регулируемый объект имеет несколько регулирующих органов, например, два. Обозначим их выходные величины соответственно через х, и хг. Пусть регулируемая координата у=/(Х], х2) имеет минимум при некоторых их значениях х10 и х20 (рис. 4.19). Поверхность у =/(Х|, х2) непрерывно меняется, меняются значения х10 и х20, соответствующие экстремуму, и необходимо, чтобы регулирующие органы все время устанавливались в эти положения Х,о И Хэд-
Рис. 4.19. Двумерная статическая характеристика объекта (поверхность отклика) с одним экстремумом — минимумом
Для достижения этого может быть использован обычный экстремальный регулятор, если с его помощью перемещать регулирующие органы поочерёдно (рис. 4.20, а). Предположим, что поиск минимума начинается из точки с координатой х, =хн, и регулятор
Самонастраивающиеся системы с оптимизацией
169
а)
в)
Рис. 4.20. Поиск минимума характеристики рис. 4.19: а — по алгоритму покоординатного спуска (метогГаусса—Зейделя); б — по градиенту; в — методом наискорейшего спуска. Нанесены линии равного значения функции Х*!,*:), показанной на рис. 4.19, на плоскость её аргументов
управляет вторым регулирующим органом. Он работает тогда по характеристике, которая получается, если рассечь поверхность у = Дх,, Х2) ПЛОСКОСТЬЮ Х| = Хц = const и выводит у в точку минимума в этом сечении а2. После этого фиксируется координата х2 точки а2 х2 = х22 = const, и этот же регулятор управляет первым регулирующим органом и так до достижения абсолютного экстремума. Этот метод носит название метода Гаусса—Зейделя или покоординатного спуска.
Иной путь управления несколькими регулирующими органами состоит в том, что с помощью «пробных шагов» находится направление, противоположное вектору градиента функции /, то есть направлению наискорейшего спуска по поверхности у=Дх1; х2) в данной точке, и регулирующие органы перемещаются так, чтобы общее небольшое перемещение произошло в этом направлении. После такого малого «шажка» в новой точке снова отыскивается градиент. Этот алгоритм поиска минимума называют градиентным спуском (рис. 4.20, б). Его недостаток — большое число пробных шагов в близко расположенных точках.
Усовершенствованный вариант градиентного метода, называемый методом наискорейшего спуска, отличается тем, что спуск в
170 Глава 4. Нелинейные и самонастраивающиеся системы
выбранном, противоположном градиенту направлении продолжается до тех пор, пока y=f(xltx2) не начинает возрастать. И только в этой точке снова определяется градиент (рис. 4.20, в). Хотя спуск идёт не по наилучшей траектории, количество пробных шагов, как правило, существенно сокращается и соответственно ускоряется поиск минимума. Фактически метод наискорейшего спуска — это гибрид градиентного метода и метода Гаусса—Зейделя.
Возможны и иные пути решения этой задачи. Когда поверхность отклика имеет сложный рельеф, используется метод движения вдоль оврагов. В особо трудных случаях применяется случайный поиск (метод Монте-Карло).
Заметим, что экстремальные регуляторы можно рассматривать как нелинейные системы с особой точкой — аттрактором, соответствующей экстремуму.
Во всех описанных системах регулируемой величиной может быть как координата, непосредственно замеряемая в объекте, так и сводный, обобщённый показатель, вычисляемый по результатам замеров нескольких координат управляемого объекта.
Регуляторы подобного рода позволяют принципиально иначе, чем обычные регуляторы, построить систему управления объектами с несколькими регулируемыми координатами даже и в тех случаях, когда ставится не задача поддержания экстремума, а обычная задача стабилизации заданных значений регулируемых координат. Для этого регулируемые координаты у,, у2, ... подаются на вход вычислительного устройства, которое вырабатывает на выходе некоторую функцию этих величин K=/(yt, у2,...). Эта функция выбирается так, чтобы она имела острый минимум (или максимум) при значениях Ую, у20, которые необходимо поддерживать. Затем V подается на вход экстремального регулятора, который перемещает все регулирующие органы до достижения экстремума функции V, то есть до тех пор, пока у,, у2, ... не примут требуемых значений у)0, у20, ... . Разумеется, положения, в которые экстремальный регулятор переставит для этого регулирующие органы, будут зависеть от внешних возмущений.
Экстремальное регулирование в случае отыскания экстремумов функций многих переменных практически всегда должно осуществляться с использованием микропроцессоров или управляющих компьютеров и термин «экстремальный регулятор» скорее можно рассматривать как условное название соответствующих компьютерных программ, а не обозначение физически реализованного специализированного устройства.
Самонастраивающиеся системы с оптимизацией 171
4.3.2. Экстремальное управление непрерывными технологическими процессами и установками
Производственные процессы во многих технологических установках непрерывного действия как объекты автоматического управления могут быть описаны следующим образом (рис. 4.21).
Имеется некоторое количество (W) параметров настройки процесса, включая настройку машин, аппаратов и регуляторов, обеспечивающих ведение технологического процесса. Как нормальное течение самого производственного процесса, так и параметры (качество) продукции зависят от указанных параметров настройки. Наряду с параметрами настройки, на течение процесса и параметры продукции оказывают влияние различные возмущающие факторы (изменения параметров сырья, материалов, износ машин и инструментов, изменения температуры и другие факторы). Действие некоторых из этих факторов в отношении параметров продукции полностью аналогично изменению параметров настройки процесса. Эти возмущающие воздействия, таким образом, могут быть приведены (пересчитаны) к эквивалентным изменениям параметров настройки и эти пересчитанные возмущения обозначим через х,, х2, xN. Прочие возмущающие воздействия на рис. 4.21 имеют обозначения S|, s2, ..., sM.
Параметры продукции, выпускаемой в данный момент времени, являются в общем случае функциями предшествующих значений настроек и возмущающих воздействий. Качество продукции характеризуется некоторыми показателями, или критериями качества, зависящими от параметров продукции. Такими показателями качества
Рис. 4.21. Структура системы управления непрерывным технологическим процессом
172 Глава 4. Нелинейные и самонастраивающиеся системы
могут служить, например, оценки отклонений параметров изделия от параметров эталона.
Параметры продукции непрерывно или дискретно (но с достаточно малыми интервалами дискретности) контролируются специальными измерительными устройствами — датчиками информации о параметрах продукции.
Если даже в начальный момент достигнута практически идеальная настройка системы машин, обеспечивающих процесс, то по истечении некоторого времени возмущающие факторы вызовут расстройку системы и изменение параметров продукции. Для того, чтобы предотвратить выход параметров продукции за установленные допуски, необходима настройка, наладка системы машин, обеспечивающих производственный процесс.
Возможны различные пути автоматизации этих операций. Если точно известно, на какой параметр влияет та или иная настройка, и в какой мере проявляется это влияние, то можно использовать обычный принцип регулирования по отклонениям. Для этого следует сначала усреднить, сгладить результаты измерений, чтобы исключить перенастройку системы при мелких случайных отклонениях в пределах допусков. Соответствующая автоматическая обработка сигналов датчиков информации о параметрах продукции может быть основана на обычно используемых методах неавтоматизированного статистического технического контроля 113]. В управляющем процессом компьютере она может осуществляться Программ мным путём. Измеренные и усредненные сигналы отклонений параметров продукции подаются на исполнительные устройства и вызывают изменения параметров настройки процесса.
Подобные системы получили Название статистических автоматов.
Однако необходимым условием возможности их применения является достаточно полная начальная информация о характеристиках производственного процесса. Для построения обычных замкнутых контуров настройки необходимо точно знать, как и в какой мере влияет тот или иной параметр настройки на продукцию, то есть необходимо достаточно полное количественное знание функциональных связей между параметрами продукции и параметрами настройки технологического процесса.
Во многих случаях эта начальная информация отсутствует. Может оказаться, что в сложном производственном процессе функциональные связи параметров продукции и настройки не только трудноопределимы в начальный, «испытательный» период эксплуатации, но и непостоянны вообще. Изменение сырья, износ оборудования
Самонастраивающиеся системы с оптимизацией
173
меняют эти связи не только количественно, но и качественно. В этих условиях применение обычных контуров настройки (то есть статистических автоматов) практически невозможно. В результате данные компьютерного статистического анализа не могут использоваться для автоматической переналадки процесса, а решения принимаются технологами на основе их опыта и интуиции.
В качестве выхода из положения целесообразно использование системы экстремального управления.
В системе экстремального управления производственным процессом для оценки качества продукции выбираются критерии или показатели Qlt имеющие экстремум (максимум или минимум) при эталонных значениях параметров изделия. Подобной оценкой может, например, служить сумма квадратов отклонений параметров ук (к = 1, 2, ..., £) от эталонных значений ую:
О^Ук-Ук»?-к
Здесь суммирование ведётся по всем L параметрам продукта, относящимся к данному z-му показателю качества Q,. Если продукт идеален, то Q, = 0.
Качество продукции в общем случае характеризуется несколькими показателями качества. Объединяя или разделяя различные показатели, можно выбрать показатели качества (2, так, чтобы каждый из них зависел от самостоятельной, не перекрывающейся с другими, группы параметров настройки процесса. Контуры экстремального управления, соответствующие таким показателям качества, практически независимы друг от друга, и это, в частности, означает, что число критериев настройки должно равняться N, то есть числу параметров настройки.
Показатели качества Q, вычисляются по программам, заложенным в управляющий компьютер по данным датчиков информации о параметрах продукции. В системах управления непрерывными технологическими процессами контроль и вычисление Q, осуществляются непрерывно. При управлении нестационарными процессами (объектами периодического действия) — в дискретные моменты времени.
Для обеспечения основной функции системы — поддержания экстремальных значений показателей качества могут оказаться необходимыми поисковые колебания параметров настройки процесса. В качестве таковых на объектах непрерывного действия могут использоваться как естественные случайные высокочастотные колеба
174
Глава 4. Нелинейные и самонастраивающиеся системы
ния, так и искусственно создаваемые колебания органов настройки. Первый способ, разумеется, предпочтительнее, так как он не связан с каким-либо увеличением «высокочастотных» флуктуаций параметров продукции («низкочастотные» отклонения при действии самонастраивающейся системы, конечно, уменьшаются).
При втором способе поиска минимума критерия качества искусственно создаются некоторые дополнительные высокочастотные колебания, или флуктуации, параметров продукции. Хотя во многих применениях использование подобных искусственно создаваемых колебаний вполне допустимо ввиду их малости, вообще говоря, они, конечно, нежелательны.
Для того чтобы использовать естественные колебания в качестве поисковых, необходимо измерять эти колебания. Измерение поисковых составляющих производится датчиками информации о поисковых составляющих. Эти датчики воспринимают высокочастотные колебания параметров настройки или высокочастотные составляющие возмущений 5|, s2, ..., sM, приводимых к этим параметрам. Указанные датчики могут также воспринимать непосредственный результат действия обоих отмеченных факторов.
Так, например, если речь идет об автоматической настройке регуляторов, точнее, об автоматическом управлении уставками, или задающими воздействиями, то в качестве поисковых колебаний могут использоваться переменные составляющие ошибок, или отклонений, этих регуляторов. Если речь идет об управлении узлами машин, задающими геометрические размеры непрерывно выпускаемой продукции, то в качестве поисковых колебаний могут использоваться небольшие высокочастотные изменения размеров, вызванные Вибрациями, колебаниями инструмента, флуктуациями свойств материала и т. д. При этом выделение поисковых составляющих может осуществляться либо путем измерения одного из основных воздействий, порождающих колебания данного параметра продукции (например, колебаний инструмента), либо путем контроля самого этого параметра сразу за узлом настройки.
Данные о поисковых составляющих поступают на имитационную модель производственного процесса, составляющую часть программного обеспечения системы. Назначение имитационной модели заключается в преобразовании поисковых составляющих, подобном преобразованию этих составляющих в реальном процессе.
Для многих непрерывных производственных процессов основное запаздывание между входами (органы настройки) и выходом (продукция) обусловлено тем, что операции обработки, транспортировки и другие следуют друг за другом во времени и сами занимают
Самонастраивающиеся системы с оптимизацией
175
определенные промежутки времени. При этом параметры выпускаемой в данный момент продукции оказываются функциями предшествующих значений параметров процесса.
Программы имитационной модели должны учитывать эти запаздывания перед сравнением выходов модели с результатами расчёта текущих значений показателей качества продукции. Это сравнение может производиться путём простого перемножения выходов модели на соответствующие им показатели качества с последующим сглаживанием (усреднением по времени) результатов умножения. Заметим, что мгновенные значения произведений выходов модели на показатели качества могут быть любыми, но средние по времени являются индикаторами влияния флуктуаций параметров процесса на качество продукта. Фактически речь идёт о вычислении текущих коэффициентов ковариации этих величин (см. пятую главу). Понятно, что в случае заметного совпадения или антисовпадения тенденций у сравниваемых величин коэффициент ковариации становится заметно отличающимся от нуля соответственно в положительную или отрицательную стороны.
Значения коэффициентов ковариации подаются на входы соответствующих исполнительных устройств или механизмов, управляющих настройками параметров процесса.
Для реализации основного преимущества экстремального управления, — малого объема необходимой начальной информации, — поисковые колебания и сигналы, подаваемые на исполнительные устройства, должны распределяться определенным образом. А именно, если данная поисковая составляющая эквивалентна колебаниям 1-го органа настройки, то она должна сравниваться с z-m показателем качества и результат сравнения должен использоваться для управления z-м исполнительным устройством.
Процессы в системе протекают следующим образом.
Если настройка такова, что имеют место экстремумы показателей качества продукции, то флуктуации параметров продукции не вызывают согласованных с ними (коррелированных) составляющих на выходах вычислителя показателей качества. В этом случае средние значения коэффициентов ковариации равны нулю, и исполнительные устройства настройки бездействуют.
Если хотя бы один показатель качества продукции отклонится от экстремального значения, то на соответствующем выходе модели появится коррелированная с поисковыми флуктуациями составляющая. Возникает отличное от нуля значение коэффициента ковариации. Так как это значение есть результат осреднения по времени, то оно меняется медленно и приводит в действие исполнительное
176
Глава 4. Нелинейные и самонастраивающиеся системы
устройство. При этом настройка процесса изменяется и воздействует на параметры продукции в направлении приближения к экстремуму показателя качества.
Очевидно, что такая система в строго непрерывной ее форме требует полной автоматизации операций контроля и операций настройки, что может явиться основным тормозом при попытке её построения.
Однако возможны варианты таких систем как автоматизированных систем с полуавтоматическим контролем и неавтоматической настройкой. При полуавтоматическом контроле измерения осуществляются контролерами с вводом данных в компьютер. Поступление информации здесь всегда является дискретным, но если при заданном времени настройки темп поступления информации достаточно велик, то система по своим свойствам приближается к непрерывной. Разумеется, достигнуть этого тем легче, чем больше допустимое время настройки. При большом допустимом времени настройки можно обойтись и ручной или полуавтоматической настройкой процесса по рекомендациям, поступающим с компьютера. Система экстремального управления производственным процессом, в которой контроль качества продукции и изменение координат органов настройки осуществляются вручную, остается замкнутой системой.
4.4. Самонастраивающиеся системы управления с оптимизацией параметров алгоритма управления
Существует много типов самонастраивающихся систем, в которых оптимизация управления достигается за счёт перестройки параметров или даже структуры алгоритма управления. Однако по-видимому, значительную часть самонастраивающихся систем этого класса можно объединить в две разновидности: (1) системы с автоматической настройкой параметров регулирования без использования модели, (2) системы с эталонной моделью.
4.4.1. Системы с автоматической настройкой параметров регулирования без использования модели
Системы с автоматической настройкой параметров регулирования широко проверены на практике. В главе третьей (3.4.2) были описаны методы ручной настройки параметров ПИД-регуляторов, осно
Самонастраивающиеся системы управления 177
ванные на полуэмпирическом подходе. При использовании этих методов предполагается, что с одной стороны в результате настройки запас устойчивости системы окажется достаточным, а с другой стороны ошибка регулирования останется в допустимых пределах. Во многих случаях эти предположения оправдываются, но, особенно во второй части, — далеко не всегда.
В главе третьей было показано, что для уменьшения ошибки регулирования выгодно в передаточной функции любого типа регулятора (см. выражения (3.33), (3.35) и (3.37)) выбирать максимально возможное значение коэффициента усиления KR. Однако такой выбор ведёт к недопустимому снижению запаса устойчивости, а ещё раньше к увеличению отношения колебательности замкнутой систе-мы. Параметры объекта могут дрейфовать. Изменение параметров объекта приводит к тому, что даже изначально идеально настроенный регулятор перестаёт отслеживать уставку наилучшим образом или, наоборот, запас устойчивости становится недостаточным. Кроме того, сам объект никогда не бывает идеально линейным, и при смене режима работы система может потерять устойчивость, если KR будет слишком велик. Именно поэтому регуляторы приходится настраивать с большим запасом устойчивости, а следовательно, выбирать значение KR, много меньшее, чем можно было бы использовать в большинстве режимов объекта.
Отсюда возникает задача: автоматически находить и задавать максимальное значение KR, допустимое при данном режиме и текущих параметрах объекта регулирования.
Введём в систему регулирования рис. 4.22 дополнительный контур настройки значения KR в основном контуре. Проблема заключается в том, по какому признаку вести настройку — регулирование KR. На помощь приходит то обстоятельство, что в большинстве случаев в реальной системе под действием всегда присутствующих сравнительно высокочастотных шумов и помех возбуждаются малые
Рис. 4.22. Структура самонастраивающейся системы регулирования с максимальным усилением
178 Глава 4. Нелинейные и самонастраивающиеся системы
затухающие колебания. Так как система получает небольшие случайные шумовые возмущения постоянно, то и эти колебания присутствуют постоянно. На схеме рис. 4.22 x(t) — уставка, то есть внешний сигнал, соответствующий желаемому значению регулируемой величины y(i). На входе объекта (исполнительный механизм) находится выходной сигнал регулятора г(г) = c(r) + s(t), который содержит собственно сигнал управления с(/) с добавленной к нему упомянутой смесью из шумов и высокочастотных колебаний системы s(f).
Пока запас устойчивости велик, собственные колебания системы маскируются шумами. По мере уменьшения запаса устойчивости амплитуда этих колебаний растёт, а, главное, растёт время их затухания. Фактически, перед тем как потерять устойчивость, вблизи границы устойчивости система начинает сильнее «шуметь». Когда колебания становятся заметны, их среднюю за некоторый период времени амплитуду можно измерить, и этот сигнал использовать для регулирования KR основного контура. Ещё лучше измерять мощность этой смеси шумов и колебаний, то есть вычислять её средний квадрат s2(z), и сравнивать с заданным допустимым его значением Sg.
Чтобы выделить $(/) из r(f) на входе устройства сравнения должно быть включено квазидифференцирующее звено с небольшой постоянной времени, меньшей постоянных времени в передаточной функции разомкнутого основного контура. Усреднение же ?(0 должно осуществляться апериодическим звеном с постоянной времени, существенно большей, чем все постоянные времени основного контура. Таким образом, получим контур регулирования коэффициента усиления обратной связи KR, который выбирается столь высоким, как это только возможно. Поэтому такие системы получили название систем с максимальным усилением. Основным и серьёзным недостатком этого метода является то, что конструктор системы должен располагать значительной априорной информацией об объекте, то есть он должен знать передаточную функцию разомкнутой основной системы.
Это требование может быть ослаблено, если вместо s2(t) блок или программа настройки KR будет вычислять отношение колебательности g (см. выражение (3.25)) и сравнивать его с наперёд заданным значением <;0. Этот подход имеет ещё то преимущество, что, задавшись соответствующим gg, KR можно удерживать на уровне, обеспечивающем требуемое качество переходных процессов, например, по перерегулированию. Проблема заключается в измерении g
Самонастраивающиеся системы управления
179
или декремента затухания колебаний Один из способов решения этой задачи описан ниже в главе пятой (раздел 5.1), где рассмотрены методы оценки параметров объекта и его состояния, являющиеся неотъемлемой частью самонастраивающихся систем.
4.4.2. Самонастраивающиеся системы с эталонной моделью
Предложен целый ряд способов использования и эталонных, и имитационных моделей для построения самонастраивающихся систем управления. В этих идеях имеется много общего, но в то же время большая их часть обладает значительными различиями. В методах -эталонной и имитационной модели, как следует из самого названия, модель является частью самонастраивающейся системы. В большинстве случаев модель действительно является частью реальной системы, однако иногда она входит в менее явном виде.
На рис. 4.23 показана основная блок-схема, которой соответствует большинство структур адаптивных систем управления с эталонной моделью, где эталонная модель является отдельной частью системы. Эталонная модель является компьютерной программой или, иногда, аналоговой моделью, воспроизводящей желаемые динамические характеристики всей системы управления. Управляющее устройство представляет собой регулятор с перестраиваемыми параметрами. Сравнивая выходную величину объекта у(0 с выходной величиной эталонной модели у0(Г), управляющее устройство адаптирует или изменяет свои параметры так, чтобы характеристики петли регулирования объекта были как можно ближе к характеристикам эталонной модели. При этом вводится некий критерий близости этих характеристик, например, абсолютная величина разности выходов объекта и эталонной модели или квадрат этой разности и ищется минимум этого критерия.
Поиск минимума критерия производится по тем же алгоритмам, что используются в системах экстремального регулирования, рассмотренных в предыдущем разделе.
Рис. 4.23. Структура самонастраивающейся системы с эталонной моделью
180 Глава 4. Нелинейные и самонастраивающиеся системы
Контрольные вопросы
1. Как строится фазовый портрет системы и из чего он состоит?
2. В чём особенности фазовых портретов всех линейных устойчивых систем?
3. Укажите особенности фазовых портретов пинейных неустойчивых систем.
4. Дано звено второго порядка с передаточной функцией • W(p) =у(Т2р3 + 2^Тр + 1).
Нарисуйте эскизы фазовых портретов этого звена при входном воздействии в виде S-функции и = 0,1, = 0,5 и = 1.
5. В какой точке фазовой плоскости пересекаются фазовые траектории устойчивых линейных систем?
6. Что называется предельным циклом нелинейной системы? Устойчивый и неустойчивый предельный цикл. Опишите роль неустойчивого предельного цикла как границы устойчивости.
7. Понятия сепаратрисы и бифуркационного значения параметров.
8. Может ли линейная система быть устойчивой в малом и неустойчивой в большом?
9. Приведите примеры импульсных (релейных) систем, работающих в скользящем режиме. Таких систем много в бытовой технике.
10. Какие способы поиска экстремума вам известны?
11. Как используются собственные шумы объекта в самонастраивающихся системах автоматического управления?
12. Для каких целей применяются модели объекта в самонастраивающихся системах управления?
Глава 5
ПОСТРОЕНИЕ САУ
5.1. Объекты управления и их идентификация
Старый спор в биологии между сторонниками Ламарка и Дарвина о способах образования видов и приспособления живых организмов к окружающей среде находит своеобразное отражение в современных системах управления.
Грубо говоря, в биологии проблема сводилась к следующему: сторонники Ламарка считали, что под воздействием природных условий живой организм (единичная особь) может столь сильно измениться, что такое изменение приведет к образованию нового биологического вида. Дарвинисты считают, что на уровне данного, уже существующего организма изменения Не могут быть столь сильными, а образование видов происходит путем накопления и наследования признаков при передаче их из пбколенйя в поколение. Причем изменения в организмах не всегда полезны и целесообразны, как считал Ламарк, а могут быть и вредны для вида. Такие вредные изменения уничтожаются естественным отбором, так как особи, их имеющие, имеют меньше шансов выжить и дать потомство.
Этот спор блестяще решился в пользу эволюционной теории Дарвина благодаря открытиям Менделя и де Фриза и мощному развитию методов современной эволюционной генетики.
В главном, в принципе, а в деталях?! В деталях дело обстоит так, что, по-видимому, наследственность составляет тот исходный материал, на базе которого каждый организм, в зависимости от конкретных условий, развивает определенную совокупность признаков (фенотип), полученных генетически, в то время как другие признаки могут и не проявиться вовсе.
На ранней стадии развития систем регулирования и управления господствовала сугубо детерминистическая точка зрения, согласно которой перед построением системы требовалось не только построить качественную модель объекта управления, но и определить количественные соотношения в Ней во всех подробностях. Если представить себе систему управления как автомат-организм, погруженный в окружающую среду, то такая точка зрения вполне
182
Глава 5. Построение САУ
соответствует ламаркистскому подходу «оптимального соответствия» организма и окружающей его среды.
Развитие этого подхода привело к его диалектической противоположности: при первоначальном отсутствии знаний об объекте путем постепенного приобретения опыта изменять структуру и алгоритм системы управления, приспосабливаясь (адаптируясь) к объекту. При этом качество управления постепенно будет улучшаться. В этой процедуре управление и идентификация определяют процесс адаптации системы управления к объекту.
Однако очень быстро стало ясно, что тезис априорного незнания свойств объекта и постепенного накопления сведений путем обработки информации, полученной в процессе управления, приводит к чрезвычайно длительным процессам адаптации.
Более того, подобный подход является развитием первого, чисто детерминистического, ибо сам метод идентификации, ёе алгоритмы, а следовательно, и способы адаптации оказываются заранее предопределены разработчиком системы.
Информационная производительность и объемы памяти вычислительных устройств, которые при таком процессе требуются, оказались непомерно велики: для управления каким-нибудь сравнительно несложным объектом могла потребоваться вся мощность всех вычислительных машин мира!
Приведем в этой связи такой пример: для выделения полезного сигнала на фоне помех в современной радиолокационной технике дальнего действия требуется обработка данных о взаимосвязях корреляционного типа сразу между несколькими переменными. При астрономических локационных наблюдениях имеется возможность накапливать эти данные и потом «без спешки» обрабатывать их на больших цифровых вычислительных машинах. Иное дело — проблема управления локатором при слежении за целью: здесь потери времени недопустимы.
Результаты наблюдений должны непосредственно влиять на практически мгновенно принимаемые решения. А как раз это-то и не всегда успевает сделать даже самая современная вычислительная машина. Идут по пути паллиативных решений, вырабатывают компромиссы между сложностью и утонченностью требующихся методов и реальными техническими возможностями.
Вот каким образом назрела необходимость подхода к проблемам построения управляющих систем, аналогичного процедуре выделения фенотипа на базе исходного генетического материала в живой природе. Смысл его заключается в построении «априорной» грубой модели объекта и ее уточнении в процессе управления.
Объекты управления и их идентификация
183
И, таким образом, неизбежной стала потребность в предварительном изучении объекта. Если даже объект может считаться линейным в диапазоне используемых значений управляющих воздействий, определение его характеристик вызывает трудности, не всегда преодолимые на практике и сейчас.
Едва ли не наиболее трудной, но вместе с тем и основной задачей, возникающей при разработке систем регулирования и управления, является задача определения динамических характеристик объектов управления. Эти характеристики могут определяться с помощью активного или пассивного эксперимента.
В первом случае на вход объекта подают управляющее воздейст-.вие либо в виде ступенчатой функции (то есть попросту скачкообразно изменяют управляющее воздействие), либо в виде синусоидального сигнала и анализируют изменения интересующих исследователя параметров. При скачкообразном входном воздействии — это так называемые кривые разгона или переходные функции (см. главу вторую). При синусоидальном входном воздействии, изменяя частоту воздействия, определяют зависимости модуля коэффициента передачи и фазового сдвига в объекте от частоты.
Однако в большинстве случаев применить методы активного эксперимента на серьёзных объектах управления не удается. Действительно, никто не может позволить раскачивать в процессе работы турбину электростанции, ядерный или химический реактор, а тем более наносить им резкие толчки по управлению. Внесение малых возмущений может оказаться неэффективным: на выходах объектов всегда существует шум, случайные флуктуации выходных параметров, порождаемые самим объектом, на фоне которых трудно выделить полезный сигнал. Приходится прибегать к статистическим методам, усредняя данные большого числа экспериментов. Но в этом случае становится целесообразным вообще отказаться от нанесения внешних возмущений и ограничиться статистическим анализом шумов объекта.
Эти методы основаны на понятиях статистической, или, иначе, корреляционной, связи между величинами.
Если это просто числа, то говорят о коэффициенте ковариации и коэффициенте корреляции. Предположим, что нужно выявить статистическую, то есть «в среднем», связь между случайными величинами х и у. Пусть в нашем распоряжении имеется набор пар выборочных значений х и у, каждая из которых получена в результате некоего эксперимента или испытания. Проведено N экспериментов. Число этих пар также равно N, и оно называется размером или объёмом
184
Глава 5. Построение САУ
выборки. Коэффициентом ковариации двух случайных величин х и у называю ty исло:
N
^ = [№-х){У1-у)]/Ы, (5.1)
/=|
где х и у — математические ожидания величин х и у, которые оцениваются по их средним значениям:
х = £х,./м (5.2)
/=1
N
y = £y./N. (5.3)
/=!
Введём в рассмотрение дисперсии величин х и у:
а2 = £(х,-х)2/М (5.4)
/=1
°2=£(Z-y)W (5.5)
/=|
Величины ах и называются стандартными отклонениями х и у.
Коэффициентом корреляции х и у называется их ковариация, нормированная на стандартные отклонения:
р = Р/охстг (5.6)
Эта нормировка нужна, чтобы иметь возможность оценивать статистическую связь между разномасштабными величинами с разными размерностями — р является безразмерным числом.
Например, известно, что в 83 % случаев погода в Москве на следующий день совпадает с погодой сегодня. Коэффициент корреляции здесь составляет 0,7 (однозначной детерминированной связи соответствует коэффициент корреляции 1, означающий 100%-ную связь). Таким образом, если служба предсказания погоды хочет быть минимально солидной организацией, она должна обеспечить коэффициент корреляции между своими предсказаниями и действительным положением вещей по крайней мере не менее 0,7! Понятно, что величины, между которыми отсутствует линейная зависимость, имеют взаимный коэффициент корреляции, равный нулю.
В случае случайных процессов, текущих во времени, ковариацию оказывается необходимо рассчитывать между всеми значениями этих процессов.
Объекты управления и их идентификация 185
Поясним эту мысль. Пусть в некотором процессе x(f) значения случайной величины, удаленные друг от друга на определенный отрезок времени, статистически связаны между собой. Можно построить функцию, состоящую из коэффициентов ковариации, аргументом которой будет этот отрезок времени. Естественно назвать эту функцию корреляционной функцией. Если она характеризует вероятностную связь между значениями одного и того же процесса x(f), удаленными на определенный отрезок времени т друг от друга, то такая функция называется автокорреляционной. Если же она указывает на связь между значениями величин двух различных случайных процессов, то ее называют взаимно-корреляционной функцией5. Чтобы упростить письмо будем далее рассматривать центрированные случайные процессы, то есть процессы, у которых математическое ожидание равно нулю:
т
х = lim (1/2 Т) J x(r) dt = 0. (5.7)
Здесь интервал интегрирования 2 Т соответствует объёму выборки N в (5.2). Так как при конкретных вычислениях всегда можно сделать оценку х, то, рассматривая центрированные процессы, мы не нарушим общности формул.
Используя интегрирование вместо суммирования, для непрерывного центрированного процесса x(t) можно записать автокорреляционную функцию в виде:
Р«(т) = lim(l/2T) }х(г)х(Г + т)Л. (5.8)
Дисперсия о* центрированного процесса есть не что иное, как значение автокорреляционной функции при т = 0: т
a2x = lim(l/2T)jx2(t)dt. (5.9)
В выражениях (5.7)—(5.9) несобственные интегралы записаны в форме, которая подчёркивает, что в принципе статистики х, и
5 Эти определения корреляционных функций подразумевают, что рассматриваются процессы стационарные и эргодические. Стационарность процесса означает, что его математическое ожидание, дисперсия и автокорреляционная функция во времени не меняются. Эргодическим процесс является, если его статистические свойства оказываются одинаковыми у всех его реализаций. См. по этому поводу, например, [7]. В дальнейшем все рассматриваемые процессы считаются стационарными и эргодическими.
186
Глава 5. Построение САУ
Од. должны определяться на бесконечном интервале времени. На практике это невозможно, так как в нашем распоряжении всегда оказываются реализации случайных процессов конечной длительности. Автокорреляционная функция случайного процесса обладает тремя важными для дальнейшего изложения свойствами. Во-первых, она является чётной функцией, то есть pxv(t) = ра.(-т); во-вторых, рта(т) -> 0 при т -> оо и в-третьих, рхг(т) <стх, то есть при т = О р^т) имеет максимальное значение. Подробнее о свойствах корреляционных функций см. в [7]. Некоторые характерные типы автокорреляционных функций показаны на рис. 5.1.
Рис. 5.1. Типичные формы автокорреляционных функций шумов на выходах объектов управления: а — экспоненциальный тип (объект первого порядка), б — колебательный тип (объект второго порядка), в — экспоненциальный тип (объект второго порядка)
Точно так же, как автокорреляционная функция одного процесса, может быть введена в рассмотрение взаимная корреляционная функция двух процессов x(f) и y(f), которая соответственно имеет вид:
Рлу(т) = lim(l/2T) ]x(t)y(t + т)Л. (5.10)
Другой важнейшей характеристикой случайного процесса x(t) является его спектральная плотность. Это понятие основано на том, что любой случайный процесс можно представить как набор гармонических колебаний бесконечного множества частот со случайными амплитудами. Сумма дисперсий всех этих колебаний будет равна дисперсии процесса. Для каждого малого отрезка оси частот Дю можно посчитать дисперсию гармоник на этом отрезке Дох. Если отрезок Дю бесконечно мал, то и дисперсия Дстх будет бесконечно мала. Однако величина
УДю) = lim Дстх/Дю (5.11)
Дсо—>0 будет конечной величиной, которую называют спектральной плотностью процесса x(t).
Объекты управления и их идентификация 187
Корреляционные функции и спектральные плотности тесно связаны друг с другом. Эта связь выражается формулами, называемыми соответственно прямым и обратным преобразованием или интегралом Фурье:
= (2/л)|рЛ(т)сО5®тЛ; (5.12)
О
00
Рлх(т) = J 5x(<o)COS®Td<0. (5.13)
о
При прохождении случайного сигнала через линейную систему спектральная плотность на выходе системы связана со спектральной плотностью входного сигнала следующим соотношением (уравнение Винера—Хинчина):
S^) = (5.14)
где fc(co) — амплитудно-частотная характеристика системы или модуль её АФХ (см. главу вторую, 2.6).
Использовать уравнение (5.14) для определения к(а) чрезвычайно соблазнительно, но при этом возникают две серьёзные проблемы. Первая из них — ошибки в оценках спектральных плотностей по реализациям процессов конечной длительности. Вторая проблема состоит в том, что, даже получив «хорошую» оценку А:(со), мы остаёмся в полном неведении относительно фазовой характеристики объекта. Объект может оказаться и очень часто оказывается неминимально-фазовой системой (см. 2.8), а потому однозначной связи между к(а>) и фазовой характеристикой объекта нет. Между тем, для построения устойчивой системы эта информация абсолютно необходима (см. главу третью).
Основным уравнением, связывающим динамические характеристики объекта исследования и статистические параметры сигналов на его входе x(f) и выходе y(f), является интегральное уравнение Винера—Хопфа:
РхА) = f *(0р«(т + Odt, (5.15)
О
имеющее в частотной форме вид:
^,(<о) = И/ОШсо).
(5.16)
188
Глава 5. Построение САУ
В этих уравнениях w(i) и И^у'со) — импульсная переходная функция исследуемой системы и её АФХ, рхх.(т) и ^.(со) — автокорреляционная функция и спектральная плотность входного сигнала, рп.(т) взаимная корреляционная функция входного и выходного сигналов, а 5^,(со) — их взаимная спектральная плотность, то есть результат преобразования Фурье рлу(т) (соотношение Хинчина—Винера). В уравнении (5.15) неизвестной (искомой) функцией обычно является w(t), и, соответственно, в (5.16) — Wfja).
Физический смысл соотношений (5.14)—(5.16) чрезвычайно глубок. Они означают, что спектральный состав, то есть наборы гармоник корреляционной функции процесса и самого процесса, совпадают! Это очень важный факт, могущий использоваться сам по себе, независимо от его роли в вычислениях других величин.
На первый взгляд задача определения динамических характеристик объекта при использовании приведенных соотношений достаточно проста: нужно записать реализации процессов на его входе и выходе в память компьютера и по ним вычислить корреляционные функции и (или) спектральные плотности. Эти последние можно определять и непосредственно, анализируя процессы x(f) и y(f) без определения р^г) и рху(т), и, подставив их в уравнение Винера—Хопфа, решить его.
На самом деле эта задача далеко не так проста. Уравнение Винера—Хопфа для временной области и соотношение Хинчина—Винера не являются математически корректными в том смысле, что очень малые ошибки в исходных данных могут привести к сколь угодно большим погрешностям в решении, лишающим последнее какого-либо смысла.
Прямые оценки спектральных плотностей методами гармонического анализа также сопряжены с большими методическими трудностями. Ведь для таких оценок необходимо выявить в сигнале данную частотную компоненту (гармонику), определить ее относительную амплитуду и, сделав это на протяжении достаточно длительного времени наблюдения, проинтегрировать полученные за время наблюдения квадраты значений этой амплитуды. Фактически, при фиксированном времени наблюдения за процессом, будет определено среднее значение квадрата амплитуды этой гармоники или, иначе, сделана оценка его математического ожидания.
Таким способом придётся оценивать математическое ожидание значений спектральной плотности на целом ряде частот. Однако оказывается, что хотя математическое ожидание с ростом времени наблюдения за процессом (или, как говорят, длины реализации)
Объекты управления и их идентификация
189
приближается к истинному значению спектральной плотности на данной частоте, разброс между отдельными оценками остается большим. Это получается потому, что дисперсия, или, иначе, рассеяние этих оценок, с увеличением длины реализации стремится не к нулю, а к квадрату истинной величины спектральной плотности!
Практически это означает, что, взяв достаточно представительные реализации процессов x(t) и у(0 (длительностью Т) и вычислив на некоторой частоте со значения спектральных плотностей ^(со), 5„(со) и 5^(co) по соответствующим алгоритмам, можно, скорее всего, получить непредставительные оценки — оценки с очень большими погрешностями. При этом вычисляемые таким образом значения спектральной плотности на частоте со будут отличаться для разных отрезков реализации Т, Т+ ДГ, Г+ 2ДГи т. д.
Для получения представительной оценки спектральной плотности необходимо определить целый ряд её значений для разных реализаций или отрезков (быть может, для несколько сот или тысяч) и эти оценки усреднить. Полученное таким образом число может уже служить в качестве-состоятельной оценки спектральной плотности на частоте со. Но при этом потребуется очень большая суммарная длина реализации процесса. А это в свою очередь требует большого времени наблюдения и объемов памяти, если вычисления проводить непосредственно на объекте.
Существуют и иные методы, позволяющие получать состоятельные оценки спектральной плотности по значениям оценок корреляционных функций.
Отметим, что очень часто исследователь может обойтись без полного описания объекта управления (хотя это и остается желанным идеалом).
Так, сами по себе корреляционные функции несут в ряде случаев очень важную информацию об объекте (способность объекта осциллировать под действием шумов на входе, степень колебательности объекта), и их анализ позволяет, например, выявлять зоны устойчивой работы объектов, не прибегая к соответствующим дорогим и часто опасным экспериментам.
Пример такого рода приведен на рис. 5.2.
В ряде экспериментов последовательно меняли параметр Р, определяющий режим работы мощного энергетического агрегата. Каждый раз фиксировались шумы на выходе объекта, характеризующем его мощность. Далее, по этим записям шумов вычислялись автокорреляционные функции, явно показавшие склонность объекта к автоколебаниям на определенной частоте (рис. 5.2, а, б и в).
190
Глава 5. Построение САУ
.р(т) Р' P1 ₽’
MwHwv
Рис. 5.2. Определение критического режима объекта по автокорреляционным функциям шума на его выходе: а, б, в — автокорреляционные функции при различных значениях параметра Р, г — полученная зависимость декремента затухания собственных колебаний объекта от Р
Темп затухания колебаний корреляционной функции позволяет оценить способность объекта гасить свои собственные автоколебания.
Так как было замечено, что с повышением параметра Р автоколебания затягиваются, то при последовательных вычислениях автокорреляционной функции измерялся декремент затухания Полученная кривая для зависимости %(Р) экстраполировалась в сторону увеличения Р до пересечения с осью абсцисс (рис. 5.2, г). Точка пересечения этой оси соответствовала критическому значению Ркрит, при котором демпфирование колебаний прекратилось бы. Так было определено значение Р=Ркр1„, соответствовавшее аварийному состоянию объекта.
Эффективность такого подхода не вызывает сомнений — ведь каждый эксперимент, ставящий мощный агрегат на грань аварии, стоит очень дорого, даже если аппаратура аварийной защиты срабатывает исправно. Но известно, что не следует испытывать судьбу без особой необходимости, особенно если такие испытания чреваты авариями с тяжелыми последствиями.
Другая полезная сторона экспериментов подобного рода — это возможность правильного построения стабилизирующих и управляющих систем и устройств. Но это в принципе и есть прямая цель идентификации.
Таким образом, задачи идентификации требуют применения специальной аппаратуры для накопления больших массивов данных и их обработки или, во всяком случае, специальных входных устройств и программ в компьютерах достаточной мощности.
На самом деле для определения корреляционных функций и спектральных плотностей приходится пользоваться конечными, усеченными реализациями процессов, причем для получения достоверных данных длины этих реализаций оказываются очень велики.
Структурно-алгоритмическая организация САУ
191
Так, чтобы получить методическую ошибку в определении ^.(со) не более 5—10% для процесса, содержащего частоты, меньшие 1 Гц (типичный спектр промышленного объекта), приходится обрабатывать реализации длительностью в несколько суток. Такие реализации обычно оказываются нестационарны по математическому ожиданию (то есть среднее значение процесса может заметно дрейфовать). Эту проблему обычно обходят при вычислениях, вычитая из анализируемого процесса его среднюю за прошедший отрезок времени величину.
Если ведется обработка данных, поступающих непосредственно От объекта, и результаты тут же используются для управления, то, как уже говорилось выше, от компьютера могут потребоваться огромное быстродействие и объёмы памяти.
Выше уже было сказано, что идеальным следовало бы считать объединение в одной системе и функций идентификации, и функций управления. Причем оба вида функций должны осуществляться одновременно и результаты идентификации непосредственно использоваться для коррекции методики управления.
В сущности большинство систем управления сложными технологическими объектами и строится сейчас по этому принципу. На основе физико-химических данных о процессе создается его предварительная модель, коэффициенты и некоторые связи в которой уточняются статистическим анализом в процессе управления. Однако попытки строить саму модель только путем статистического анализа объекта в процессе управления, «с нуля», названные дуальным управлением, оказываются слишком громоздким методом.
5.2. Структурно-алгоритмическая организация САУ
Предварительный расчёт и проектирование системы управления включают множество этапов. Постановка задачи и идентификация объекта — только первый из них. Одновременно или почти одновременно решаются проблемы её реализации.
5.2.1. Обследование объекта управления и критерии выбора структуры системы
Любой объект автоматизации, будь то автомобиль, сборочный конвейер, химический или ядерный реактор, имеет свое специфическое лицо, и система автоматики должна соответствовать этому лицу.
192
Глава 5. Построение САУ
В самой системе можно различить две тесно переплетенные структуры — функционально-алгоритмическую и аппаратурную (техническую). По мере уточнения свойств объекта путем его исследования и имитационного моделирования должно проводиться обследование объекта для разработки этих структур. Часть данных, полученных при этом обследовании, оказываемся необходимой и для идентификации объекта. При этом такое обследование может дать результаты, радикально влияющие на объём работ по идентификации как в сторону их увеличения, так и сокращения.
Обследование объекта должно дать ответы на следующие вопросы.
1. Роль системы. Может ли объект работать без нее? Какие «блоки» информационной структуры (функции системы) абсолютно необходимы для объекта, а какие только повышают его эффективность и насколько? Каковы последствия её возможных отказов?
2. Условия работы аппаратуры. Сюда относятся:
а) условия внешней среды на объекте: наличие специальных помещений и мест установки аппаратуры, температура, давление, пыль, грязь, масляный туман, агрессивные компоненты в воздухе, влажность, вибрации и удары, возможности вентиляции. Обязательно обратите внимание на возможности организации линий связи и опасность преднамеренного и непреднамеренного механического повреждения линий связи и аппаратуры, вплоть до актов вандализма (наличие на объекте постороннего персонала с низкой квалификацией). Эти обстоятельства могут влиять на размещение и, следовательно, структуру системы, а также во многом определяют ее механическую конструкцию;
б) условия электромагнитной совместимости аппаратуры: источники и виды помех, возможность или невозможность заземления (например, вечная мерзлота, большие блуждающие токи — они свойственны объектам с большим потреблением или производством электроэнергии, например, ТЭЦ, электрометаллургическому и прокатному производству);
в) требования по искровзрывобезопасности на объекте (химические производства, транспорт, газо- и нефтепроводы и хранилища);
г) качество питающей электрической сети (наличие раздельных осветительной и силовой сетей, возможность подключения аппаратуры к первой из них). Очень полезно подключить к сети вольтметр с самопишущим прибором и проанализировать записи в течение суток, а лучше недели. Это позволит принять решение об уровне зашиты системы по питанию. Наличие на объекте мощных электро
Структурно-алгоритмическая организация САУ
193
моторов и силовых установок чревато как импульсными «бросками» сети длительностью менее 1 с, так и долговременными ее перенапряжениями (например, в обеденный перерыв). Если в соответствии с данными по п. 1 система не должна отключаться, то надо принять меры по аварийному питанию (вплоть до установки аккумуляторов или мотор-генератора).
3. Обеспечение объекта первичными преобразователями (датчиками) и возможные типы таковых, виды и уровни сигналов, точность и исправность метрологического обеспечения. Особо надо выделить датчики и устройства аварийной защиты, определить связи с ними или включение их в систему. Эта часть обследования тесно связана с проработкой информационной структуры системы и непосредственно влияет на нее.
4. Возможности технического обслуживания и ремонта аппаратуры, наличие и уровень квалификации соответствующего персонала. Необходимо сразу добиваться назначения лиц (или подразделений), ответственных за сохранность, ремонт и эксплуатацию аппаратуры.
Среди функций системы следует различать обязательные, отказ по которым влечет остановку объекта или даже аварийную ситуацию, и факультативные, такие, как оптимизация, учет готовой продукции и т. п. (обязательные функции, могущие осуществляться не в реальном, «объектном» времени, а с запаздыванием, с аппаратурной точки зрения относятся к факультативным).
Выбирая аппаратурное и структурно — алгоритмическое решение системы, приходится исходить из минимума возможных потерь
П^Пэ + П^+ХЛП^,., (5.17)
/
где Пэ — эксплуатационные затраты (главным образом на эксплуатационный персонал и ремонт); Посн — приведенные затраты на разработку, изготовление и пусконаладочные работы; Потк,- — потери, возникающие при отказе /-ой функции системы; Л, — средняя частота отказов по /-ой функции системы (параметр потока отказов) при данном варианте реализации системы.
В свою очередь
Поен — ^к.и ^разр. + ^нзг. + ^нал , (5.18)
где члены правой части — приведенные затраты на комплектующие изделия (от резисторов до готовых компьютеров) Пки, разработку
7 - 8764 Гальперин
194
Глава 5. Построение САУ
Празр (включая идентификацию и обследование объекта, покупное и вновь специально созданное программное обеспечение с учетом тиражирования), изготовление и установку Пизг и наладку Пнал.
Постоянная тенденция такова, что растёт стоимость программного обеспечения, составляющая затрат Пки, которая когда-то была основной, теперь играет все меньшую роль, а Пэ и ущерб от отказов — основную. Особо велики ущербы А,П0ТК, от отказов по обязательным функциям системы, и, так как Пэ также не могут не зависеть от Л„ то становится очевидной первостепенная важность надежности системы по этим функциям. Надежность компонентов постоянно растёт, и достигла такого уровня, что часто моральное старение аппаратуры возникает намного раньше первого отказа вследствие ее физического старения. Основными причинами сбоев и отказов стали неисправности разъемных соединений, контактных групп, окисление и разрушение паек, повреждения и помехи в линиях связи. Определённо возрастает и роль случайных сбоев и «зависаний» компьютеров при их полной исправности.
В этих условиях становится целесообразным использование иерархических (многоуровневых) функционально — алгоритмических и аппаратурных структур при наличии в системе обязательных и факультативных функций. Более простые обязательные функции сосредоточиваются в локальных устройствах, расположенных возможно ближе к объекту (или на самом объекте) и имеющих минимальный объем оборудования. Функции, связанные с обработкой больших информационных потоков и их обобщением, как правило, носят факультативный характер, и они передаются аппаратуре более высокого уровня с большим объемом оборудования (например, управляющим мини-ЭВМ, а иногда и ЭВМ большой мощности типа рабочих станций и мощных серверов). Такое разделение функций в большинстве случаев не вызывает особых трудностей с точки зрения информационной структуры системы. Однако разработчик системы должен учитывать, что сотрудники, отвечающие за программно-алгоритмическое обеспечение, предпочитают максимальное число функций выполнять с помощью одного центрального компьютера, что упрощает для них разработку. Этой тенденции не следует поддаваться, тем более, что для организации лишних каналов связи с центральным компьютером может потребоваться больше оборудования, чем весь объем аппаратуры локального устройства, выполняющего данные функции.
Структурно-алгоритмическая организация САУ 195
5.2.2. Примеры технических решений: аналоговые регуляторы и микро-ЭВМ в системах управления технологическим оборудованием
Чтобы приведенные соображения не показались слишком общими, рассмотрим характерные примеры.
Возьмем типичную ситуацию. Положим, что на некотором объекте требуется осуществить ПИД-регулирование. Реализовать ПИД-регулятор аппаратурно можно многими способами. В простейшем случае это можно сделать на одной ИМС счетверенных токоразностных усилителей. Более точную схему можно построить на операционных усилителях [9] (рис. 5.3, а). Если настройки регулятора фиксированы для данного объекта, а уставка х0 задается оператором, то такое решение в виде аналогового регулятора наилучшее. Схему можно в этом случае выполнить, например так, как показано на рис. 5.3, б.
Предположим теперь, что требуется в соответствии с ПИД-за-коном вести стабилизацию (регулирование) многих координат объекта X], х2, х3, ..., х„ ..., xN. И сразу возникают все те вопросы, о которых выше шла речь.
Рис. 5.3. Схемы аналоговых ПИД-регуляторов на операционных усилителях: а — схема с настройкой параметров, б — схема с фиксированными параметрами
196
Глава 5. Построение САУ
Случай 1. Неисправность любого регулятора ведет к останову объекта, а сам объект достаточно локален, так что длина линий связи мала и не зависит от аппаратурного решения (все равно вся аппаратура будет монтироваться в общем корпусе или шкафу). В этом случае альтернатива к установке ряда аналоговых регуляторов — использование микропроцессорной системы. Законы регулирования реализуются программным путем, причем настройки регуляторов легко меняются и даже оптимизируются. На входе микро-ЭВМ устанавливается аналоговый коммутатор и АЦП, работающие синхронно с выходным коммутатором. Для каждого объекта может быть предусмотрен недорогой ЦАП с малым быстродействием или установлен один общий ЦАП со схемами выборки-хранения на выходе. Сигналы и от датчиков, и к исполнительным устройствам подаются непосредственно по кабелям, так как линии связи коротки и достаточно простых защитных мер, чтобы обеспечить помехоустойчивость. Более того, часто сами исполнительные механизмы обладают способностью «помнить» свое положение (шаговые импульсные двигатели, вентили и т. п.), а потому нет необходимости в индивидуальных ЦАП или схемах, достаточно одного ЦАП и выходного аналогового коммутатора, а в случае шагового двигателя, например, — просто прямого задания серии импульсов от микро-ЭВМ на усилитель мощности.
Программным путем микро-ЭВМ по очереди обращается к координатам х, (работает в обегающем режиме), проводит коррекцию положения z-ro исполнительного механизма в соответствии со значением х,-х0, и принятым законом регулирования и переходит к (z + 1)-му каналу регулирования. При должной частоте обращения fo5p i каждая из координат просто «не заметит» дискретизации из-за инерционности объекта. Для того чтобы обеспечить такой режим, надо соблюдать условие
7o6p.z — I ^/Л^1макс / I 1макс.апрт> (5.19)
где | dxj Л|макс — максимальная скорость изменения координаты х,-, а | ZSx, 1макс.аПрт — максимальная допустимая погрешность по х, (надо учесть, что помимо этой, называемой иногда апертурной, ошибки существуют и другие источники общей погрешности). Это условие гораздо более жестко, чем условия часто (и ошибочно) применяемой в данном случае теоремы отсчётов Шеннона—Котельникова (см. главу первую). Согласно этой теореме для передачи по каналу связи сигнала с верхней частотой f необходимо иметь частоту считывания — квантования сигнала не менее 2/ Но применение теоре
Структурно-алгоритмическая организация САУ
197
мы отсчётов к сигналам с неизвестным спектром (или фазой) может приводить к большим ошибкам. Приведенное соотношение (5.19) фактически говорит о том же. Теорема отсчётов дает условия необходимые, а не достаточные для правильного воспроизведения сигнала в данной ситуации. В системах связи с синхронизацией эти условия могут стать и достаточными, но они не являются таковыми, когда мы имеем дело с сигналом, поступающим от объекта.
Пусть, например, объект регулирования достаточно хорошо может быть представлен как звено первого порядка с передаточной функцией КаЪ-/(Тр+ 1). Тогда при ступенчатом воздействии максимальная скорость изменения выхода составит К^/Т а верхняя граничная частота объекта /=1/2л7'. Положим для простоты Коб= 1, полный диапазон выхода также примем 0...1, а погрешность I 1макс.апрт = 0,01 • Тогда в соответствии с (5.19) /о5р,= 100/Г, а по теореме отсчетов 2/= \/кТ. Разница в 300 раз! На практике возможная скорость изменения возмущающих воздействий на объект также ограничена, и это могло бы улучшить положение. Но в большинстве случаев импульсные 'возмущения не исключены, и их скорости достаточно велики. Пусть, например, в приведенном примере Т= 100 с, тогда/обр,= 1 Гц. Если принять время «обработки» одного канала равным 1 мс, то одна микро-ЭВМ формально может обслужить до 1000 каналов. Ограничения здесь, скорее, будут связаны со скоростью ввода информации и вывода сигналов на исполнительные устройства, чем с быстродействием микро-ЭВМ.
Если число регулируемых параметров объекта больше восьми, то весьма вероятно, что система с микро-ЭВМ окажется меньше по объему оборудования, чем восемь аналоговых регуляторов. Она будет несколько дороже, но удобнее и надежнее в эксплуатации, а потому быстро окупится (вспомним, что один отказ в одном регуляторе эквивалентен отказу всей системы вместе с объектом).
Случай 2. Имеется ряд объектов — агрегатов (возможно, однотипных), способных функционировать независимо. Помимо задачи стабилизации координат х, каждого /-го объекта требуется определять и задавать уставки х0„ тем самым, например, перераспределяя нагрузку между агрегатами с учетом реальной ситуации.
На первый взгляд обе эти задачи лучше всего решить с помощью одной — единственной микро-ЭВМ в многоканальной системе. Но при таком решении отказ в этой системе означает останов всех объектов сразу. Ущерб вследствие этого может во много раз превосходить стоимость всей системы регулирования. Поэтому в данном случае целесообразнее снабдить каждый объект своим про
198
Глава 5. Построение САУ
стым, скорее всего, аналоговым регулятором и ЦАП, связанным по кабелю с центральной микро-ЭВМ для заданиям %. В этом случае микро-ЭВМ рассчитывает распределение нагрузок по агрегатам, функции регулирования выполняются локальными регуляторами и должна быть предусмотрена возможность ручного задания х0/ оператором в обход микро-ЭВМ. Такая децентрализованная система окажется значительно более жизнеспособной. В этой системе уже ясно видны два уровня управления. Наконец, при наличии многих контуров регулирования и, возможно, других функций (например, аварийного останова) система может быть построена на двух уровнях с дублированием. Многоканальное регулирование и аварийное управление каждым из агрегатов осуществляются минимальными микропроцессорными комплектами. Центральный компьютер не только задает наборы уставок на эти многоканальные регуляторы, но и берет на себя соответствующие функции в случае выхода одного из них из строя. Понятно, что в этой структуре мини-ЭВМ может выполнять параллельно и ряд других, факультативных функций.
5.2.3. Микро-ЭВМ в информационно-измерительных подсистемах систем управления технологическим оборудованием
Назначение информационно-измерительной подсистемы — преобразование сигналов, поступающих от датчиков, в стандартные виды (нормализация) для обработки в вычислительных блоках или устройствах. В случае аналоговых решающих устройств — это шкала -10 + 0 + +10 В (0 + 10 В), в случае цифровых — код, принятый в системе. Сигнал, поступающий от датчика Д, проходит путь, показанный на рис. 5.4, а. По линии связи ЛС1 он попадает па гальванический разделитель ГР, где происходит подавление синфазной помехи, далее ключ коммутатора Кл (если имеется коммутатор), нормирующий усилитель-преобразователь сигнала У, линия связи ЛС2 и АЦП или аналоговый решающий блок (АР), например регулятор. Можно считать, что при должной организации системы ошибки в передаче данных от АЦП цифровой вычислительной машине (УЦВМ) — управляющей мини-ЭВМ, микропроцессору и т. д. — отсутствуют. Здесь при необходимости применяются помехо-защищенные коды, специальные методы контроля и т. п.
В задачу нормализации сигналов помимо их детектирования и усиления может входить и линеаризация, так как сигналы таких датчиков, как термопары, тензодатчики и т. д., могут только в первом приближении считаться линейно зависящими от измеряемой
Структурно-алгоритмическая организация САУ
199
Выбор/-того
| типа датчиков ~|
От
кУЦВМ
Контрольный —* сигнал —
От других типов датчиков
Установка О и коррекция масштаба
Выбор /-того датчика или калибровка
б)
Рис. 5.4. Структуры информационно-измерительных подсистем: а — линейная структура без автоподстройки, б — самонастраивающаяся структура
величины. Линеаризация может проводиться с помощью аналоговых нелинейных преобразователей, включаемых в блок усиления У (при условии однотипности датчиков). В частности, так целесообразно ее проводить в системах с аналоговыми регуляторами и решающими устройствами. В ответственных случаях при малой общей допустимой ошибке имеет смысл зависимость параметра от показаний датчика записывать в запоминающее устройство ЭВМ в виде массива, а выход АЦП использовать как адрес для выбора значений параметра из этого массива.
В системах с большим числом датчиков и повышенной точностью целесообразно использовать специализированный микропроцессорный узел для автоподстройки. Тогда вместо большого числа дорогих и капризных прецизионных групповых и одноканальных усилителей и сложных прецизионных коммутаторов можно применить упрошенные нормирующие усилители и простые ИМС коммутаторов. В такой системе (рис. 5.4, б) микропроцессорное специализированное устройство МП не только обеспечивает обегание или выбор канала на двух уровнях коммутации (/ и J), выбор линеаризующего массива в запоминающем устройстве и т. д., но и периодически подключает каждый групповой усилитель-преобразователь через один из ключей к калибровочному сигналу (часто — к О В) и запоминает погрешность. При опросе датчиков этот сигнал ошибки вычитается из полученного значения программным путем. Это же микропроцессорное устройство может фиксировать выход сигнала в
200
Глава 5. Построение САУ
одном из каналов за пределы шкалы и задавать (через ЦАП) необходимые смешения, менять чувствительность усилителей-преобразователей, выявлять неисправные каналы или давать соответствующие аварийные сигналы. Для экономии объемов памяти в этом случае линеаризация данных проводится программно в МП (путем обратного функционального преобразования), а схема АЦП упрощается, так как функции его цифровых узлов берет на себя МП. При достаточном быстродействии [см. (5.19)] МП может выполнять и функции управления и коррекции измерительных каналов, и управляющего устройства.
5.2.4. Алгоритмы управления и программное обеспечение. Средства разработки и отладки программ
Алгоритм — это точное и однозначное описание метода решения некоторой задачи.
В частности, законы регулирования или методы поиска экстремума, используемые в экстремальных регуляторах, могут рассматриваться как алгоритмы решения соответствующих задач. Эти алгоритмы могут быть реализованы путём синтеза соответствующих технических устройств в виде, например, аналоговых электронных или электромеханических приборов. Другой путь реализации — разработка соответствующих компьютерных программ.
Логические элементы, из которых строятся компьютеры, могут воспринимать только двоичные последовательности, состоящие из сигналов нулей и единиц. Поэтому команды, поступающие в процессор и другие устройства, на самом деле являются двоичными числами, а та программа, с которой работает компьютер, есть последовательность чисел, называемая машинным кодом.
Для того, чтобы компьютер осуществлял операции в соответствии с определенным алгоритмом, этот алгоритм должен быть запрограммирован .
Программа может быть написана в машинном коде. В этом случае программист указывает двоичный код операции, двоичные адреса операндов, то есть двоичных слов, над которыми операция производится, и двоичный адрес памяти или регистра, куда должен быть помещен результат.
Написание программы в машинном коде — невероятно трудоёмкое дело, причём его трудоёмкость резко возрастает с увеличением размера программы. Помимо трудностей написания, программы в машинном коде плохо поддаются коррекции, и в них сложно
Структурно-алгоритмическая организация САУ
201
исправлять неизбежные при написании ошибки. Программирование в машинном коде приемлемо, когда размер программы не превышает нескольких десятков операций.
Тем не менее, при создании специализированных устройств Промышленной автоматики и САУ на базе микро-ЭВМ и микропроцессорных комплексов написание программ в машинном коде применяется, так как эти программы оказываются наиболее эффективными с точки зрения быстродействия системы и использования минимального объёма памяти.
Значительное упрощение программирования для микропроцессорных комплексов достигается при использовании языка ассемблера. В нём вместо кодовых комбинаций операции записываются в “мнемонической форме как сочетания букв латинского алфавита, напоминающие по форме аббревиатуры английских слов, означающих данную операцию. Например, сложение обычно обозначается как «ADD», а команда пересылки как «MOV». Команде на ассемблере соответствует команда в машинном коде. Запись команд в ассемблере много проще чем в машинном коде, упрощается поиск и исправление ошибок.
Перевод программы, написанной в ассемблере, в машинный код осуществляется программой-транслятором ассемблера, установленной на универсальном компьютере. Возможна (но нежелательна) и ручная трансляция.
Язык ассемблера у каждого микропроцессорного комплекта или микро-ЭВМ индивидуален, то есть пригоден только для конкретного устройства. В макроассемблере предусматривается возможность создания макрокоманд. Макрокоманда включает последовательность команд и получает своё собственное имя. По этому имени она может быть вызвана в любом месте программы. Макроассемблеры также ориентированы на конкретные микропроцессорные комплекты.
Для ряда микропроцессорных комплектов и микро-ЭВМ существуют и машинно-ориентированные языки высокого уровня, в которых предусмотрены мощные средства тестирования и отладки программ. Например, для микропроцессорного комплекта КР580 разработан язык PLM-80.
Создание САУ требует программного обеспечения двоякого рода. Во-первых, это программы для решения задач, возникающих при разработке системы, но не используемые в самой системе. Во-вторых, это рабочие программы самой САУ, предназначенные для реализации алгоритмов управления, аварийной защиты и других функций на объекте в процессе эксплуатации САУ. На этапе разра
202
Глава 5. Построение САУ
ботки САУ и те, и другие обычно решаются на достаточно мощных компьютерах, к которым можно отнести современные профессиональные персональные компьютеры — PC и рабочие станции. Иногда для этого требуются и многопроцессорные большие ЭВМ. При этом программирование ведётся на универсальных языках высокого уровня, таких как C++ , Fortran, или специальных проблемно-ориентированных языках. Широко используются и готовые пакеты прикладных программ. Когда алгоритмы работы САУ отлажены и проверены путём имитационного моделирования, они перепрограм-мируются для ЭВМ, устанавливаемых на объекте в составе САУ.
К задачам, решаемым при разработке САУ, относится, прежде всего, идентификация объекта. Эти задачи требуют обработки очень больших массивов данных при спектральном анализе записей собственных шумов исследуемых объектов. Для спектрального анализа разработано множество алгоритмов и готовых программ, но к их применению следует подходить с большой осторожностью. Как было упомянуто выше, задачи спектрального анализа математически некорректны. Это же относится и к решению интегральных уравнений типа уравнения Винера—Хопфа (5.15). Каждый из методов их решения основан на теоремах, в которых оговариваются условия, при которых метод «работает», то есть позволяет получить результат с ошибкой, не превосходящей некоторой приемлемой величины. Нарушение этих условий может приводить к непредсказуемым ошибкам. К сожалению, продавцы специализированных пакетов прикладных программ обычно не оговаривают условий их применимости.
Результат идентификации — построение математической модели объекта. Эта модель в свою очередь может быть реализована в виде компьютерной программы. Теперь она может войти в состав САУ, если этого требует алгоритм функционирования САУ, например, в случае самонастраивающейся системы или системы управления нестационарным объектом, в которой состояние объекта должно прогнозироваться.
Другое применение модели объекта — имитационное моделирование всей САУ на достаточно мощном компьютере. При имитационном моделировании программируются все функции управления и в него могут быть включены вспомогательные имитационные модели датчиков, измерительных подсистем, исполнительных механизмов, средств аварийной защиты. Таким образом, в компьютере получается по возможности полная модель всей САУ и её окружения. Такая модель позволяет предварительно исследовать возможное поведение системы во всевозможных режимах и ситуациях, в том чис
Структурно-алгоритмическая организация САУ 203
ле аварийных. По результатам этого исследования обычно удаётся заранее предусмотреть дополнительные меры защиты на случаи отказов отдельных блоков системы, уточнить её параметры и даже структуру. Одновременно имитационное моделирование оказывается важнейшим средством для тестирования и отладки рабочих программ самой САУ.
Контрольные вопросы
1. Выпишите уравнение Винера—Хопфа и поясните его физический смысл.
2. Выпишите соотношение между спектральными плотностями входного и выходного сигнала линейной системы. Почему это соотношение даёт важную, но неполную информацию об исследуемом объекте?
3. Как можно использовать автокорреляционную функцию шумов на выходе объекта для настройки системы управления этим объектом?
4. Перечислите основные вопросы, которые должны быть решены при обследовании объекта автоматизации.
5. Укажите основные, на ваш взгляд, преимущества и недостатки аналоговых регуляторов и регуляторов, построенных на основе микропроцессорных комплектов.
6. В чём состоят преимущества и недостатки централизованных систем управления на основе микро- и мини-ЭВМ. В чём преимущества и недостатки многоуровневых систем управления?
7. Для каких целей и в каких случаях следует использовать микро-ЭВМ в информационно-измерительных системах и подсистемах?
8. Для чего нужно имитационное моделирование САУ?
9. Укажите сравнительные преимущества и недостатки программирования в машинном коде, на ассемблере и на языках высокого уровня. Назовите области применения этих методов программирования при разработке САУ.
Приложение 1
История и перспективы развития систем автоматического управления
Автоматические устройства были известны ещё в глубокой древности (андроиды, автоматические игрушки и т. п.). Однако ни в древние времена, ни в средние века они не играли роли в производстве и, таким образом, этот период относится к предыстории автоматического управления.
Отдельные элементы и автоматические устройства начинают применяться для совершенствования производственных процессов тогда, когда человеческая сила или сила прирученных животных начинает заменяться силами природы и рутинные эмпирические приемы — сознательным применением достижений естествознания. Поэтому подлинная история автоматики начинается с последней четверти XVIII века.
Уже с самого начала применения автоматических устройств для технологических целей стали развиваться два основных их типа, используемые и ныне: с разомкнутой цепью воздействий на объект управления и с замкнутой цепью обратной связи. На первом принципе были основаны изобретённые в середине XVIII века копировальные станки. Второй принцип был впервые применён французским физиком Д. Папеном в изобретённой им кастрюле-скороварке в 1680 г., положен в основу изобретения И. И. Ползуновым автоматического регулятора питания котла (1765) и Дж. Уаттом — автоматического регулятора скорости паровой машины (1784), которому и досталась слава изобретателя центробежного регулятора. Однако первый центробежный регулятор был создан ешё в XVII веке великим голландским физиком и инженером X. Гюйгенсом6 для управления ветряными и водяными мельницами (гении часто опережают своё время и их достижения забываются). Тогда же появилось устройство оперения крыльев ветряных мельниц, регулировавшее скорость их вращения.
6 Гюйгенсу принадлежит изобретение маятниковых часов и современных оптических приборов, он первый выдвинул волновую теорию света.
Приложение 1
205
t В первый период развития автоматического управления развивается принципы механического регулирования. Помимо автоматических регуляторов Уатта, действовавших по принципу отклонения, появляются регуляторы, основанные па непосредственном учете изменения нагрузки (1830) (принцип Понселе регулирования по возмущениям), а также на принципе управления по производным (1845) (принцип Сименса), названном впоследствии А. Стодолой инерционным принципом.
В первых автоматических регуляторах для перемещения исполнительного механизма использовалось усилие, развиваемое чувствительным элементом. С увеличением мощности паровых машин этого усилия оказалось недостаточно. В 70-х гг. XIX века был изобре-- - тен усилитель — сервомотор, который существенно увеличил мощность подаваемую на исполнительный механизм. Усложнение систем автоматического регулирования и необходимость точного выбора их параметров привели к развитию теории автоматического регулирования. Основоположником теории регулирования как науки стал Джеймс Клерк Максвелл7. В работах Максвелла (1867) и И. А. Вышнеградского (1872—1978) были впервые рассмотрены проблемы, возникающие при автоматическом регулировании паровых машин, и заложены основы теории линейных автоматических систем. В 1877 г. Раус, математик из Кембриджского университета, под влиянием Максвелла разработал и опубликовал первый критерий устойчивости решений дифференциальных уравнений любого Порядка, положив начало работам в этом ключевом направлении. А. Стбдола, на основе работ Вышнеградского, рассмотрел соотношения в сложной системе регулирования турбин, включающей распределенное звено в виде трубопровода. По его просьбе А. Гурвиц в 1893 г. решил задачу об устойчивости систем автоматического регулирования, сформулировав условия, которым должны удовлетворять коэффициенты характеристического уравнения системы (критерий устойчивости Гурвица), и построив критерий устойчивости, сходный с результатами Рауса (критерий Рауса—Гурвица).
В 1899 г. Стодола разработал теорию инерционных регуляторов, осуществляющих управление не только в зависимости от изменения регулируемой величины, но также и по производным этого изменения (применительно к автоматическим регуляторам паровых машин — по угловой скорости и угловому ускорению).
7 Максвелл во многом был научным первопроходцем. Он создал теорию электромагнитного поля, он же «основал» статистическую физику.
206
Приложение 1
Перечисленные работы заложили основы классической линейной теории автоматического регулирования. Одновременно были выполнены первые работы также и в области нелинейных задач автоматического регулирования, начало которым было положено в работах Вышнеградского (1878). Значительный вклад в развитие теории устойчивости нелинейных систем был внесен в 80—90-х гг. XIX века работами А. Леоте, а также выдающейся работой А. М. Ляпунова (1892). Значение этой работы было оценено позже, когда в центре внимания теории автоматического управления оказались сложные нелинейные системы. Ляпунов дал первое в истории науки строгое определение понятия устойчивости движения и разработал общие методы исследования этой задачи.
Принципиальное значение для усовершенствования методов автоматического управления имело развитие электротехники, которое позволило использовать новые технические средства и расширило пределы действия устройств автоматического управления. Изобретение электрического реле П. Л. Шиллингом (1832) положило начало развитию сложных релейных систем автоматики. Первые электрические регуляторы были изобретены В. Н. Чиколевым и П. Н. Яблочковым в 70-х гт. XIX века в связи с появлением электрического дугового освещения. Тогда же А. П. Давыдов предложил автоматическую систему управления стрельбой, которая применялась на боевых кораблях русского флота в 70—80-х гг. XIX века. Существенными этапами развития релейных систем автоматического управления явились: изобретение в США системы автоматической блокировки на железнодорожном транспорте (В. Робинзон, 1872); разработка в 90-х гг. XIX века автоматической телефонной станции; пуск в США автоматической тяговой подстанции (1914), автоматизированной ГЭС (1917) и автоматизированного завода автомобильных рам (1920), представлявшего собой первую систему машин, охваченную электрической автоматизацией.
К этому же периоду относится появление первых систем телемеханики как средства автоматического управления на расстоянии. Они впервые были применены в 1921 г. в США для централизации управления тяговыми подстанциями, а в дальнейшем получили широкое распространение для централизованного управления энергосистемами, диспетчерского управления на железнодорожном транспорте и т. д.
Автоматика как самостоятельная область техники впервые получила признание на 2-й международной энергетической конференции в 1930 г. На этой конференции была создана секция по вопросам автоматического и телемеханического управления и зашиты.
Приложение 1
207
\ 30-е гг. XX века ознаменовались началом бурного развития радиоэлектроники. Электронные лампы как новое техническое средство, обеспечивающее быстродействие, высокую чувствительность, точность и надежность, быстро начинают находить применение в технике автоматического управления. Создаются электронные автоматические регуляторы, устройства релейного управления, использующие электронные лампы, и т. д. Огромную роль сыграло появление и начало массового применения во время второй мировой войны ламповых операционных усилителей. На их базе создаются ламповые аналоговые вычислительные машины, позволившие впервые1 вести предварительное имитационное моделирование систем регулирования. Применение операционных усилителей произвело переворот в построении аналоговых регуляторов и привело к созданию первых автоматических систем управления с прогнозированием, таких как системы управления зенитным огнём и бомбометанием. К настоящему времени операционные усилители в виде интегральных схем стали основным средством обработки аналоговых сигналов.
В 1944 г. появились первые цифровые электронные вычислительные машины, давшие начало новому направлению — автоматизации в области вычислений. С этого времени развитие автоматического управления и вычислительной техники стали неразрывно связаны.
Одновременно сильно расширился круг объектов автоматического регулирования и управления. Теория регулирования механических и тепловых процессов стала распространяться на электрические процессы. Выкристаллизовалась общая теория автоматических систем. Работы Г. Найквиста (1932) и А. В. Михайлова (1938) способствовали внедрению в теорию автоматического управления нового мощного оружия — операционного исчисления и частотных методов анализа и синтеза автоматических регулирующих систем. У математических истоков этих методов стоят великие математики — Жан Батист Фурье и Пьер Симон Лаплас. Последний, открыв своё преобразование дифференциальных уравнений в алгебраические, не посчитал это открытие важным (точно так же как Гюйгенс — изобретение регулятора). На рубеже XIX и XX веков, столкнувшись с проблемой расчёта передачи электрических сигналов по длинным линиям, О. Хевисайд «переоткрыл» преобразование Лапласа в чуть другой форме. С тех пор оно стало основным аппаратом анализа и разработки электронных усилителей, переходных процессов в электрических цепях и систем регулирования.
А. А. Андронов и его ученики обогатили теоретические основы автоматики методами фазового пространства и точечного преобра
208
Приложение 1
зования поверхностей, что дало возможность точного решения задач автоматического регулирования, поставленных еще Вышнеградским, но остававшихся нерешенными в течение 70 лет. Были сделаны важные шаги в развитии теории инвариантных автоматических систем. Серьезное развитие получила теория импульсных и дискретных систем автоматического регулирования.
Появление и быстрый прогресс вычислительной техники во второй половине XX века стали базой для дальнейшего развития САУ. Стали развиваться оптимальное управление, самонастраивающиеся системы и методы идентификации объектов управления. Особую роль стала играть теория случайных процессов и основанные на ней достижения.
Первоначально эти методы возникли во время второй мировой войны в связи с проблемой автоматического управления зенитным огнем по результатам анализа данных, поступающих от радиолокаторов. Фундаментальную роль в постановке и решении этих задач, названных задачами фильтрации и упреждения, сыграли труды А. Н. Колмогорова, основоположника кибернетики Н. Винера и Дж. фон Неймана.
Важнейшим достижением прикладной математики середины XX в. оказалось установление Н. Винером, Г. Хопфом и А. Я. Хин-чиным связи между корреляционными функциями шумов в системах и переходными функциями систем (иначе — их частотными характеристиками), а также работы по оптимальной фильтрации случайных процессов Р. Калмана.
Определение этих соотношений по существу положило основание современным методам идентификации систем, выросшим в целую самостоятельную отрасль науки об управлении.
Другим важнейшим достижением стало развитие методов оптимального управления динамическими системами и нестационарными объектами. Первоначально эти задачи приобрели остроту в связи с началом освоения космоса и необходимостью оптимизации управления космическими аппаратами.
Важнейшими достижениями в этой области стала разработка Л. С. Понтрягиным и его учениками принципа максимума (1959) и метода динамического программирования Р. Веллмана (1956—1958). Эти методы немедленно нашли широчайшее применение в разработке алгоритмов управления нестационарными технологическими процессами.
Современное состояние автоматики характеризуется широким, хотя и неравномерным для отдельных отраслей применением автоматических управляющих устройств, с переходом ко всё более слож
Приложение 1
209
ным автоматическим системам, а в промышленности — переходом о'п автоматизации отдельных агрегатов к комплексной автоматизаций цехов и заводов. Всё большее число современных производств оказывается принципиально невозможно без использования САУ.
Существенной чертой развития автоматического управления в наше время является охват едиными системами территориально разделенных объектов с образованием автоматических систем, простиравшихся на большие расстояния. При этом для связи между отдельными подсистемами применяются средства телемеханики, которые приобретают форму компьютерных сетей.
Создание и массовое распространение дешёвых и надёжных компьютеров раскрывает в области САУ технические возможности, которые трудно было предугадать ещё 10—15 лет назад. Многие задачи и проблемы, не поддававшиеся решению в полном объёме из-за вычислительных трудностей, оказываются разрешаемыми достаточно просто за счёт быстродействия современных процессоров.
Скорее всего, следует ожидать развития принципиально новых подходов к автоматизации технологических процессов, основанных на огромных достижениях вычислительной техники.
В этой связи исключительно в качестве примера открывающихся возможностей рассмотрим проблему построения самоорганизующихся систем. В 60-е годы XX века А. А. Фельдбаумом был выдвинут принцип дуального управления, упоминавшийся в первой и пятой главах. Идея его заключалась в том, чтобы проводить статистический анализ шумов объекта и по его результатам улучшать алгоритм управления.
Как известно, живая природа пошла по другому пути, осуществляя не направленный статистический анализ, а случайный поиск с пробами и ошибками, то есть то, что мы называем процессом эволюционного естественного отбора.
Глобальный подход, провозглашенный М. Уолшем, А. Оуэнсом и Л. Фогелем и в разных формах начинающий развиваться, был назван авторами «эволюционным программированием». Сущность его состоит в том, чтобы моделировать не отдельные элементы и структуры биологических информационных систем, вводя с целью адаптации обратные связи через среду, в которую они погружены, а моделировать сам процесс эволюции живых организмов. Для систем управления и идентификации промышленных процессов такой подход может оказаться очень важным.
Действительно, информационные структуры живых организмов приспособлены для решения определенного круга задач, возникающих перед ними в процессе дарвиновской эволюции, и вряд ли
210
Приложение 1
------------------------------------------------------------р можно безапелляционно утверждать, что именно эти структуры являются оптимальными для решения задач управления.
При использовании эволюционного программирования функции исследования объекта управления и самого управления, так же как и в случае системы, адаптирующейся путем анализа, совмещаются в одной, постоянно адаптирующейся (приспосабливающейся) к новым условиям, системе. j
Эволюционный подход резко упрощает процедуру адаптации. Он предполагает, что структура управляющего автомата может случайным образом изменяться, и при этом автомат воспроизводит «потомков». Выживают те из них, которые в каком-то смысле наилучшим образом реагируют на внешние возмущения. Этим потомкам предоставляется право принятия решений в текущей ситуации, а также в свою очередь производить потомство для дальнейшей эволюции.
Первоначально в систему закладывается автомат, вырабатывающий управляющие воздействия в соответствии со своими возможностями. Заметим, что этот автомат обычно есть просто программа в ЭВМ с определённой структурой и набором коэффициентов. Не следует думать, что речь идет здесь о материальном воплощении естественного отбора. Далее структуры этого автомата и его «потомков» меняются с помощью случайных «мутаций». Полученные таким путем «особи» проверяются по их реакции на уже имевшиеся в процессе управления ситуации, информация о которых хранится в памяти, и используются для дальнейшего управления и эволюции, если они превосходят «предков» по качеству управления.
Авторы эволюционного программирования моделировали дарвиновский естественный отбор среди автоматов на больших ЭВМ. При этом показателем жизнеспособности автомата была точность предсказания им символов некоторой цифровой последовательности.
Для систем управления важным является предсказывать не число, а функцию или их набор — решение системы дифференциальных уравнений, описывающей поведение системы. Если имеется программа, способная моделировать (решать) эту систему уравнений, то важнейшей задачей идентификации и управления является определение вида функций в правых частях уравнений. Эти функции показывают зависимости тенденций процесса от его текущего состояния.
Высокое быстродействие и большие объёмы памяти дают возможность конструировать динамические модели объектов с управляемой структурой и коэффициентами, которые и определяют вид функций правых частей. Сами структуры при этом хранятся (в каче
Приложение 1
211
стве отдельных особей — в терминах биологии) в памяти компьютера. В подобной системе может быть использован эволюционный подход для построения и уточнения модели динамического объекта по критерию сравнения с ранее зафиксированными переходными процессами в объекте, вызванными определенным набором управляющих воздействий при определенных начальных условиях — исходных данных о начале процесса. Скорость генерации поколений потомков при этом может быть очень высокой.
Тем самым такая программа решает две задачи — управления (настолько хорошо, насколько продвинулась эволюция) и идентификации, то есть определения вида системы дифференциальных уравнений, описывающих объект.
Увеличение степени интеграции микросхем приводит к корен-_ ной домке самих понятий элемент, узел, ЭВМ. То, что 20 лет назад считалось большой ЭВМ, теперь относится к классу микро-ЭВМ. Быть может, наиболее эффективным путём дальнейшего развития окажется путь создания сетей пороговых или нейроподобных элементов, в которых эволюция будет происходить путем изменения структуры и состава сети. Фактически многие исследования и идут в таком направлений.
Системы, построенные на больших интегральных схемах, получают способность менять свою структуру и подключать к решению задачи необходимые узлы в зависимости от возникающей ситуации. Возможно, именно это и есть пути, по которым техника будет продвигаться к созданию сплошных эволюционирующих и адаптирующихся вычислительных сред, управляющих технологическими процессами.
Приложение 2
Соответствия преобразования Лапласа
1. Операции
(1) Ftp - а) 4>f(t) е°'
(2) F(p + a) <^>f(t) ea'
(3) [Ftp -Ja) - Ftp +ja)] / 2j ^>f(t) sin at
(4) [Др -Ja) + Ftp +Ja)] / 2 <=>/(/) cos at
(5) [Др - a) - F(p + a)] / 2 &>f(t) sh at
(6) [F(p - a) + Ftp + a)] / 2 <=> f(t) ch at
2. Рациональные функции от р
(7) 1 о 5(0
(8) 1/pol
(9) \/(р-а)^
(10) 1 /(ар + 1) о е'/а/а
(П) l/^or
(12) а / (р2 + а2) <=> sin at
(13) а / (р2 - а2) <=> sh at
(14) 1 /р(р-а) <=> (6“'- 1) / а
(15) 1 /р(ар + 1) <=> 1 -е~'/а
(16) 1 / (р - а)2 tef"
(17) 1 /(ар + I)2 «> te-'la/a2
(18) 1/(р-а)(р-6)о(е°'-г)/(а-6)
(19) 1 / (ар+ \){bp + 1) <=> tp,/a - е~'/ь) / (а- Ь)
(20) 1 / (р2 + 25р + 52 + ®2) <=> (1/со) e"s' sin <ot
(21) р / (р2 + а2) <=> cos at
(22) р / (р2 - а2) <=> ch at
(23) p/(p-a)2«(l + nr) е°'
Приложение 2
213
(24) р / (ар + I)2 <» (а - t)e "а / а3
(25) р I (р - а)(р - Ъ) о (а&'- bd1') / (а - Ь)
(26) р / (ар + \)(Ьр +!)<=> (ае~,/b - be",/а) / ab(a - Ь)
(27) 1/р3<=>?/2
(28) 1 / р2(р - а) <=> (е°' - 1 - at) / а2
(29) 1 / р2(ар + 1) ае~<la + t - а
(30) 1/p(p-a)2<*[l + (at-l)e°']/a2
(31) 1 /р(ар+ I)2 <=> 1 - (а + t)e~,/a / а
(32) 1 /р(р- а)(р-/>)<=>[!+ (бе0'- ае4') / (а- 6)] / ab
(33) 1 /р(ар + \)(Ьр +!)«! + (Ье~,/ь- ае~,/а) / (а- Ь)
(34) . 1 / (р - а)3 <=> Г2е°'/2
(35) 1/(ар + I)3 <=>/2е''/0/2а3
(36) 1 / р(р2 + а2) <=> (1 - cos at) / а2
(37) 1/р(р2 - а2) « (ch а?-1) / а2
(38) р / (р- а)3 <=> (at2/2 + г)е°'
(39) р2 /(р- а)3 + 2at + 1)е°'
(40) р / (ар + 1 )3 « (t/a3 - t2/2a')e-,la
(41) р21 (ар + I)3 <=> (1/а3 - 2г/а4 + /2/2а5 * * * * * *)е-,/о
(42) (р2 + 2а2) / р(р2 + 4а2) <=> cos2 at
(43) 2а2 / р(р2 + 4а2) <» sin2 at
(44) (р2 - 2а2) / pip2 - 4а2) <=> ch2 at
(45) 2а2 / р(р2 - 4а2) <=> sh2 at
(46) (п - 1)! / (ар + 1)" <=> tn-'e-,/a/<f
3. Иррациональные функции от р
(47) р‘|/2 <=> (лг)’|/2
(48) р-*2 «> 2(t/n)'/2
(49) (р + а) р"3'2 / <=> (1 + 2а/)(лГ)’|/2
(50) (р + а)-|/2о e-a,(izt)-'12
(51) р-"-|/2 <=> 4" n\tn ~1/2 / (2и)!л1/2
(52) (In р) / р <=> -In t- С; С = 0,577... — постоянная Эйлера
(53) In [(р - а) / (р-b)]o(ebl-с°')//
(54) In [(р + а) / (р - а)] <=> (2/0 sh а/
214
Приложение 2
4. Кусочно-гладкие функции-оригиналы
(55) (1^)//ю/(/) = «(()-«(/-т)
(56) Fsfe)=W(l^)o/s(0; [ВДо/0]
(57) [©/(p’+o-J] (l+e‘’t/,/w)/(l-e'’tp/a))<=>|sin со/1
||sin©Z|
‘ГУУУ^УУ,
я/© 2Я/(Э ЗЯ/© 4Я/© 5Я/(0
(58) (e-^+/n-l)//Ao/(Z)
(59) (l-e-^)/p(l-e-^f(t)
yi Т 2Т ЗТ
(60) [o/^-+<o2J]/(l-e-^;®)o/(z)
,, _ fsin ©/ при 2ия/о< t <(2и+1)я/ю ' 10 при (2и+1)я/ш<К2пя /©
« = 0, 1,2,...
(61) (рт+1- е#«)/р-’т(1- е^)<^>/(0
АО
Т 2Т ЗТ
Приложение 3
Соответствия при z-преобразовании
(1) z/U-l)«l
(2) z/U+ 1) о (- 1)”
(3) z/(z-tf<*n
(4) ' z(z+ 1) / (z- I)3 о «2
(5) z / (z - а) » а"
(6) z/(z-а)2 па”-'
(7) (az sin т) / (z2 - 2az cos т + a2) a" sin лт
(3) z(z-a cos t) /-(z2 - 2az cos т + a2) €> a" cos m
(9) zkz - 2a cos t) sin т / (z2 - 2az cos т + a2) <=> -a" sin (n - l)r
(10) (az sh r) / (z2 - 2az ch т + a2) <=> a" sh лт
(11) z(z - a ch т) I (z2 - 2az ch т + a2) <=> cf ch m
(12) z(z - 2a ch r) sh r / (z2 - 2az ch r + a2) «> -a" sh (n - l)r
(13) In (z- I)'1 <=> 0 при n = 0 и 1/л при л S 1
(14) In (l/z+ 1) <=> 0 при л = 0 и (-1)"*'/л при л £ 1
(15)
Список литературы
Указанные в приводимом ниже списке книги можно разбить на несколько групп. Прежде всего, предполагается, что в распоряжении учащихся имеются учебники [9 и 19], содержащие материал по аппаратурному обеспечению систем автоматики. Могут быть полезны учебники [11, 18 и 20] и учебное пособие [22] или аналогичные им.
Монографии Винера [8] и Эшби [30] входят в число работ, с которых, по существу, началась эра технической кибернетики и современной автоматики. Хотя ряд разделов этих книг требует очень глубоких математических знаний, многие другие главы написаны абсолютно общедоступно, и важнейшие принципиальные вопросы автоматического управления блестяще рассмотрены именно в этих главах. Книги [7, 10, 12, 13, 17, 25 и 29] не требуют для чтения и работы с ними особой математической подготовки и вполне доступны для изучения лицам, хорошо усвоившим курс математики за 11 классов. Их можно рекомендовать как очень хорошо написанные учебные пособия. Учебники [1, 2, 4, 16, 24 и 26] предназначены для лиц с основательной математической подготовкой. Книги [3, 5, 6, 14, 21, 23, 27, и 28] — это классические работы, также требующие основательной подготовки для изучения, но знакомство с ними, хотя бы частичное, очень полезно для всех, кто намерен углублённо изучать автоматическое управление. Работы [6, 12 и 15] содержат обширные таблицы преобразования Лапласа.
1. Айзерман М. А. Теория автоматического регулирования. М.: Наука, 1966. 452 с.
2. Анхимюк В. Л., Опейко О. Ф., Михеев Н. Н. Теория автоматического управления. Минск: Дизайн ПРО, 2002. 352 с.
3. Веллман Р. Процессы регулирования с адаптацией. М.: Наука, 1964. 360 с.
4. Благодатских В. И. Введение в оптимальное управление (линейная теория). М.: Высшая школа, 2001. 239 с.
5. Браммер К., Зиффлинг Г. Фильтр Калмана—Бьюси. М.: Наука, 1982. 200 с.
6. Ван дер Поль Б., Бреммер X. Операционное исчисление на основе двустороннего преобразования Лапласа. М.: ИИЛ, 1952. 508 с.
Список литературы
217
7. Вентцель Е. С. Теория вероятностей. М.: Высшая школа, 1998. 576 с.
8. Винер Н. Кибернетика или управление и связь в животном и машине. М.: Советское радио, 1968. 328 с.
9. Гальперин М. В. Электронная техника. М.: ФОРУМ: ИНФРА-М, 2003. 304 с.
10. Гарет П. Аналоговые устройства для микропроцессоров и мини-ЭВМ. М.: МИР, 1981. 272 с.
11. Головинский О. И. Основы автоматики. М.: Высшая школа, 1987. 208 с.
12. Дёч Г. Руководство к практическому применению преобразования Лапласа и /-преобразования. М.: Наука, 1971. 288 с.
----13. Джонсон Н., Лион Ф. Статистика и планирование эксперимента в технике и науке. Методы обработки данных. М.: МИР, 1980. 612 с.
14. Джури Э. Импульсные системы автоматического регулирования. М.: Государственное издательство физико-математической литературы, 1963. 456_с.
15. Диткин В. А., Прудников А. П. Справочник по операционному исчислению. М.: Высшая школа, 1965. 468 с.
16. Ерофеев А. А. Теория автоматического управления. 2-е изд, пер. и доп. СПб.: Политехника, 2002.
17. Информатика: базовый курс / Симонович С. В. и др. СПб.: Питер, 2001. 640 с.
18. Калабеков Б. А. Цифровые устройства и микропроцессорные системы. М.: Горячая линия-Телеком, 2002. 336 с.
19. Келим Ю. М. Типовые элементы систем автоматического управления. М.: ФОРУМ: ИНФРА-М, 2002. 384 с.
20. Кочетков Е. С., Смерчинская С. О., Соколов В. В. Теория вероятностей и математическая статистика. М.: ФОРУМ: ИНФРА-М, 2003. 240 с.
21. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Государственное издательство физико-математической литературы, 1961. 392 с.
22. Попов И. И., Голицына О. П. Основы алгоритмизации и программирования. М.: ФОРУМ: ИНФРА-М, 2003. 432 с.
23. Солодовников В. В. Статистическая динамика линейных систем автоматического управления. М.: Государственное издательство физико-математической литературы, 1960. 656 с.
218
Список литературы
24. Сотсков Б. С. Основы теории и расчёта надёжности элементов и устройств автоматики и вычислительной техники. М.: Высшая школа, 1970. 272 с.
25. Тихонов А. Н., Костомаров Д. П. Вводные лекции по прикладной математике. М.: Наука, 1984. 192 с.
26. Фельдбаум А. А. и др. Теоретические основы связи и управления. М.: Государственное издательство физико-математической литературы, 1963. 932 с.
27. Фельдбаум А. А. Основы теории оптимальных автоматических систем. М.: Государственное издательство физико-математической литературы, 1963. 552 с.
28. Фогель Л., Оуэнс А., Уолш М. Искусственный интеллект и эволюционное моделирование. М.: МИР, 1969, 232 с.
29. Шеннон Р. Имитационное моделирование систем — искусство и наука. М.: МИР, 1978, 420 с.
30. Эшби У. Р. Введение в кибернетику. М.: ИИЛ, 1959. 432 с.
Содержание
Предисловие............................................3
Аббревиатуры и основные обозначения....................5
_ . Глава 1. НАЗНАЧЕНИЕ, СТРУКТУРЫ И ОСНОВНЫЕ ФУНКЦИОНАЛЬНЫЕ БЛОКИ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ (САУ)..........................8
1.1. Назначение, классификация и структуры САУ......8
1.2. Информация и сигналы..........................13
1.3. Функциональные блоки и звенья САУ.............19
1.3.1. Характеристики блоков САУ. Разбиение САУ на звенья........................19
1.3.2. Технические средства САУ................25
1.4. Задачи и методы управления....................27
1.4.1. Управление стационарными объектами. Стабилизация и оптимизация.....................29
1.4.2. Программное управление и нестационарные объекты.......................37
Глава 2. ЛИНЕЙНЫЕ ЗВЕНЬЯ И РАЗОМКНУТЫЕ СИСТЕМЫ ... 44
2.1. Линейные системы и преобразование Лапласа.....44
2.2. Грамматика преобразования Лапласа.............46
2.2.1. Сложение и умножение функций на постоянный коэффициент......................47
2.2.2. Умножение аргументов на постоянный коэффициент (теорема подобия) .................47
2.2.3. Сдвиги оригинала по времени (теоремы смещения) ............................48
220
Содержание
2.2.4. Сдвиг изображения (теорема затухания оригинала)......................................49
2.2.5. Изображения производных оригинала (теорема дифференцирования оригинала) .... 49
2.2.6. Оригиналы производных изображения (теорема дифференцирования изображения) ... 50
2.2.7. Изображения интегралов оригинала.........50
2.2.8. Интегрирование изображения...............51
2.2.9. Интеграл свёртки и произведение изображений.....................................51
2.2.10. Комплексная свёртка и произведение оригиналов......................................52
2.2.11. Теорема о начальном значении оригинала ... 53
2.2.12. Теорема о конечном значении оригинала .... 53
2.3. Единичная ступенчатая функция Хевисайда, 5-функция Дирака, их изображения и переходные функции линейного блока................54
2.4. Передаточная функция разомкнутой линейной системы.............................................61
2.5. Условия статической устойчивости ........... 66
2.6. Частотные характеристики......................68
2.7. Типовые линейные звенья.......................73
2.7.1. Пропорциональное звено...................73
2.7.2. Апериодическое звено................... 73
2.7.3. Дифференцирующие звенья..................76
2.7.4. Квазидифференцирующее звено..............78
2.7.5. Форсирующее звено........................80
2.7.6. Интегродифференцирующее звено............81
2.7.7. Интегрирующее звено......................82
2.7.8. Звенья второго порядка — колебательное, дифференцирующее, режекторное и резонансное...................................83
2.7.9. Звено задержки (чистого запаздывания)....87
Содержание
221
2.8. Связь между амплитудно-частотной и фазо-частотной характеристиками.
Неминимально-фазовые звенья.......................88
Глава 3. ЛИНЕЙНЫЕ СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ И СИСТЕМЫ АВТОМАТИЧЕСКОГО РЕГУЛИРОВАНИЯ ...........................................93
3.1. Влияние обратной связи на передаточную функцию . . 93
3.2. Устойчивость линейных систем с обратной связью ... 98 3.2.1. Критерий устойчивости Рауса..................100
3.2.2. Критерий устойчивости Найквиста...........101
3.2.3. Использование ЛАЧХ и ФЧХ для анализа устойчивости ...................................105
3.3. Автоматические регуляторы и следящие системы. Качество процессов регулирования....................106
3.3.1. Структуры систем регулирования и следящих систем...............................106
3.3.2. Ошибка статизма ..........................108
3.3.3. Запас устойчивости .......................111
3.3.4. Степень устойчивости и отношение колебательности.................................112
3.3.5. Оценки качества процесса регулирования ... 115
3.4. Методы улучшения процессов регулирования и синтеза САР. Законы регулирования . . 119
3.4.1. Синтез САР и выбор закона регулирования . . . 119
3.4.2. Настройка системы регулирования...........123
3.4.3. Многоконтурные САР........................125
3.5. Дискретные системы..............................126
3.5.1. Принципы устройства дискретных систем . . . 126 3.5.2. Идеальный импульсный элемент
и фиксирующее звено........................128
3.5.3. Дискретное преобразование Лапласа и г-преобразование ........................131
3.5.4. Метод г-преобразования в дискретных системах...................................134
222
Содержание
Глава 4. НЕЛИНЕЙНЫЕ И САМОНАСТРАИВАЮЩИЕСЯ СИСТЕМЫ УПРАВЛЕНИЯ....................................138
4.1. Нелинейные системы...........................138
4.1.1. Влияние нелинейностей на свойства систем . . 138
4.1.2. Фазовые портреты линейных систем.......141
4.1.3. Фазовые портреты нелинейных систем.....146
4.1.4. Пространство параметров. Бифуркации....153
4.1.5. Устойчивость нелинейных систем «в малом», «в большом» и «в целом». Системы, эквивалентные устойчивым линейным.
Абсолютная устойчивость..................155
4.2. Импульсные (релейные) системы в скользящем режиме............................................158
4.3. Самонастраивающиеся системы с оптимизацией фазовых координат объекта.........................163
4.3.1. Экстремальные регуляторы...............164
4.3.2. Экстремальное управление непрерывными технологическими процессами
и установками............................171
4.4. Самонастраивающиеся системы управления
с оптимизацией параметров алгоритма управления . . 176
4.4.1. Системы с автоматической настройкой параметров регулирования без использования модели.........................................176
4.4.2. Самонастраивающиеся системы с эталонной моделью........................... 179
Глава 5. ПОСТРОЕНИЕ САУ .............................181
5.1. Объекты управления и их идентификация .......181
5.2. Структурно-алгоритмическая организация САУ .... 191
5.2.1. Обследование объекта управления и критерии выбора структуры системы............191
5.2.2. Примеры технических решений: аналоговые регуляторы и микро-ЭВМ в системах
управления технологическим оборудованием . . 195
Содержание
223
5.2.3. Микро-ЭВМ в информационно-измерительных подсистемах систем управления технологическим оборудованием...................................198
5.2.4. Алгоритмы управления и программное обеспечение. Средства разработки и отладки программ........................................200
Приложение 1. История и перспективы развития систем автоматического управления..............................204
Приложение 2. Соответствия преобразования Лапласа . . . . 212
~ ‘ Приложение 3. Соответствия при z-преобразовании.......215
Список литературы......................................216
Гальперин Михаил Владимирович
Автоматическое управление
I
Учебник i
Редактор Э. Д. Тузов
Корректор В. Г. Овсянникова Компьютерная верстка И. В. Кондратьевой Оформление серии Б. А. Гомона
Сдано в набор 15.05.2003. Подписано в печать 30.11.2003. Формат 60 х 90/16.
Гарнитура «Таймс». Усл. печ. л. 14. Уч.-изд. л. 13,6.
Печать офсетная. Бумага типографская № 2. Тираж 5 000 экз.
Заказ № 8764.
ЛР№ 071629 от 20.04.98
Издательский Дом «ФОРУМ»
101831, Москва — Центр, Колпачный пер., д. 9а
Тел./факс: (095) 925-32-07, 925-39-27
E-mail: forum-books@mail.ru
ЛР№ 070824 от 21.01.93 Издательский Дом «ИНФРА-М» 127214, Москва, Дмитровское ш., 107 Тел.: (095) 485-70-18; 485-74-00
Факс: (095) 485-53-18. Робофакс: (095) 485-54-44
E-mail: books@infra-m.ru Http://www.infra-m.ru
Отпечатано в полном соответствии с качеством предоставленных диапозитивов в Тульской типографии.
300600, г. Тула, пр. Ленина,109 .