/
Автор: Воронов А.А.
Теги: регулирование и управление машинами, процессами физика теория автоматического управления
Год: 1970
Текст
А. 1. в о р о н о в ОСНОВЫ ТЕОРИИ АВТОIIIАТИЧЕсиоrо УПРАВЛЕНИЯ ЧАСТЬ 111 ОПТИМАЛЬНЫЕ, мноrОСВЯЗНЫЕ н АДАПТИВНЫЕ СИСТЕМЫ «Энерrия» Ленинrрадекое отделение 1970
УДК 62-50 6П2.15 В 75 в части третьей изложены основы теории оптимальноrо управления, теории систем экстре- мальноrо реrулирования, основные вопросы теории ноrосвязноrо реrулирования и некото- рые разделы теории адаптивных систем. Рас- СМО'l'рены самонастраивающиеся системы, ис- пользующие методы идентификации объектов, самонастраивающиеся системы с моделью и НС- ноторые алrоритмы для автоматических систем, обучаемых распознаванию образов. Rниrа предназначена для преподавателей и аспирантов специальностей «автоматика и те- лемеханииа» II MoeT быть также использована стул;ентами старших :курсов тех специализаций, I( учебном плане ноторых содержатся соответ- ствующие разделы, а также инженерами и на- учными работниками при самостоятельном изу- чении вопросов теории. ВОРОНОВ АВЕНИР АРКАДЬЕВИЧ ОСНОВЫ ТЕОРИИ АВТОМАТИЧЕскоrо УПРАВЛЕНИЯ СупероБЛОЖRа и переплет r. А. rудиова Научный редантор ю. с. Попков Редактор М. Н. Суровцева Технический редантор о. С. Житпикова !\орректор В. А. Rипруmев Сдано в произвоJtство 4/X.II 1969 r. ПоJtписано и печати 17 N 1970 r. М-15199. Печ. л. 20,5. Уч.- изд. л. 21. Бум. п. 10,25. Бумаrа типоrрафская М 1. 60Х90 1 / 1б . Тираж 20 000 экз. Цена 3 р. 01 к. 3аназ М 874. ЛенинrpаДСRое отделение издательства (,Энерrия», Марсово поле, 1. Ордена Трудовоrо RpacHoro Знамени Ленин- rрадская типоrpафия М 1 «Печатный Двор») им. А. М. rорькоrо rлавполиrрафпрома Rоми- тета по печати при Совете Министров СССР, r. Ленинrрад, rатчинсная ул., 26. 3-3-13 202-70
ВВЕДЕНИЕ Третья часть книrи «Основы теории автоматическоrо управ- ления» посвящена в основном новым разделам теории управ- ления техническими системами, возникшими в 50-60-х rодах. Для предшествующеrо периода теории автоматическоrо управ- ления были характерны сравнительно простые цели процессов управления (поддержание или изменение по заданному закону некоторых реrулируемых величин); простейший вид переработки информации (выработка сиrналов, линейно зависящих от откло- нений, их производных и интеrралов), простейший жесткий ал- rоритм управления, реализующий в основном принцип отрица- тельной обратной связи. При этом специалист по автоматике, как правило, не ставил целью сформулировать при проектиро- вании задание для системы реrулирования: он предпочитал по- лучать это задание от технолоrа как одно из технических условий. Проrноз последствий принимаемых решений также не входил в функции автоматов. В лучшем случае простейшие проrнозы частных случаев поведения автоматов делались в виде построе- ния кривых переходноrо процесс а при проектировании и расчете системы. Для реализации таких условий можно обходиться про- стейшими типами автоматических устройств с неизменной струк- турой, которые состоят из элементарных датчиков для измере- ния отклонений реrулируемых величин, самых элементарных вычислительных устройств типа усилителей, несложных преоб- разователей и корректирующих цепей и исполнительных механиз- мов, обычно стандартных. Но в 50-х rодах начинается новый этап развития промышленности, сопровождаемый развитием со- временной мощной быстродействующей электронной цифровой вычислительной техники. Задачи этоrо периода находят соответственное отражение и в развитии науки об управлении. Новый период характеризуется ростом потребности в высококачественном мноrосвязном реrули- ровании, а также усложнением задач управления, повышением требований к функционированию системы. Возникает проблема Выявления предельных возможностей систем и построения систем, 3
оптимальных по RаКО1у-ли60 техни:ко-э:кономическому показа- телю. Задачи об улучшении различных статичес:ких и динамических по:казателей систем управления ставились на протяжении всей истории развития теории управления, но проблема создания оп- тимальных, т. е. наилучших в каком-либо смысле, систем доста- точно CTporo и четко сформулирована сравнительно не так давно, Rоrда было точно определено понятие критерия оптимальности, по которому судят о качестве работы системы. Критерий опти- мальности должен удовлетворять ряду условий. Это должен быть совершенно ясный технический или технико-экономический кри- терий, математичес:кое выражение KOToporo было бы функцией или Функционалом координат процесс а и управляющеrо воздей- ствия, достижение ма:ксимальноrо (или минимальноrо) значения KOToporo и указывало бы на оптимальное состояние или поведе- ние системы. Критерий оптимальности должен выражать либо технико-экономическую выrоду (к. п. д., производительность, при- быль и т. п.), тоrда оптимальным управлением будет такое управ- ление, которое обеспечивает м:аксимум критерия оптимальности. Он может выражать также потери (расход энерrии, средств и т. п.). В этом случае, оптимальное управление должно обеспечить ero минимум. Выбор :критерия оптимальности - это инженерная или инженерно-экономическая задача, которая должна решаться на основе rлубокоrо изучения управляемоrо процесса. Трудности установления критерия оптимальности связаны с тем, что требования к системе очень часто оказываются проти- воречивыми. Почти всеrда заказчик системы хочет, чтобы она была максимально простой, надежной, дешевой и т. п. Но при практи- ческой реализации повышение надежности связано с усложне- нием и удорожанием; упрощение - с ухудшением некоторых качественных показателей и т. д. Одновременно сделать систему оптимальной по всем противоречивым критериям невозможно. Возникает проблема формулировки HeKoToporo единоrо :кри- терия, который давал бы компромиссное решение задачи. Друrая трудность связана с тем, что сложность решения за- дачи зависит от сложности формулировки :критерия оптималь- ности. Для решения задачи оптимальноrо упраВJIения необходимо, прежде Bcero, иметь инфрмацию о свойствах и состоянии объекта. Эта информация дается в виде математическоrо описания объекта и ряда данных о результатах измерения текущих значений ero координат. Информация о свойствах объекта может быть в неко- торых случаях полностью задана заранее, априори. В друrих случаях априори может быть задана лишь часть информации, друrую часть придется получать в процессе эксплуатации либо на основе только пассивноrо наблюдения за ходом процесса, либо путем орrанизации специальных пробных В08действий на объект. 4
Поэтому в зависимости от способа получения инфор:м:ации и спо- соба действия системы опти:мальноrо управления можно раз- делить па три :класса: 1) системы с полной априорной информа- цией uб объекте, 2) системы с неполной информацией и незави- СИl\IЫМ IIЛИ пассивным ее накоплением и 3) систеlЫ снеполной информацией и а:ктивным ее накоплением в процессе работы. В системах оптимальноrо управления первоrо Rласса опти- l\lальное управление вырабатывается на оснопе решения мате- матичес:кой задачи об отыскании экстреl\Iума функции или Функцио- нала. Для этоrо в со- став системы управле- ния вводится в явном или неявном виде ма- тематическая модель системы, KOTOpYIO мож- но назвать детермини- рованной моделью, по- скольку априорная ин- формация, используе- мая для построения :м:одели, считается пол- ной. В систему входит таRже вычислительное устройство для решения экстремальной задачи. Модель и вычислитель- ное устройство MoryT быть выполнены в виде специальноrо техни:че- cKoro устройства, но они MoryT представлять собою и проrраl\IМУ для решения задачи в процессе проектирования на вычислительной машине, не вхо- дящей в состав системы непосредственно. В :качестве примера автоматической системы с моделью мол{но привести систему реrулирования скорости поворотно-лопастной rидротурбины (рис. В-1). Турбина имеет два реrулирующих ор- raHa: направляющий аппарат, изменяющий площадь отверстий, ПРОПУСRающих воду в турбину, и рабочее колесо, поворотом ло- пастей KOToporo дополнительно И3lеняется вращающий момент на валу турбины. Реrулирование осуществляется так, чтобы при заданной скорости обеспечить максимальный Н. п. д., который зависит от трех переменных: ОТRрЫТИЯ направляющеrо аппарата Х 1 , уrла поворота лопастей рабочеrо :колеса Х 2 и напора воды в трубо- проводе х з ' В обычно используемой системе реrулирования от- крытие Хl устанавливается реrУЛЯТОРОl\f скорости Ре и, таким км дн Х/ XJ еНА еР/{ с Х 2 Рис. Б-1. 5
образом, может рассматриваться как заданная величина. Напор Хз, измеряемый датчиком напора ДН, также задан. Таким образом, 'Y)=f(x 1 , Х 2 , х з ) =(J) (х 2 ). в точке экстремума справедливо уравнение а дl1 = ад! = о. Х2 Х2 Это уравнение содержит три переменных Хl, Х2 И Хз. Решив ero относительно Х2, будем иметь x = 'Ф (Xt, Хз), rде звездочка указывает на то, что это оптимальное значение, при котором 11 = 11манс. В соответствии с определенными из расчета или опыта на модели турбины значениями этой функции строится кулачковый механизм КМ, устанавливающий золотник сервомотора рабочеrо колеса СРК в положение, при котором Х 2 = x. I\улачок устанавливается по двум осям с помощью связей от сервомотора направляющеrо аппарата СНА (коорди- ната X t ) и датчи:ка напора (:координата Ха). Нетрудно видеть, что TaKoro рода система оптимальноrо управ- ления состоит из обычных реrуляторов с обратной связью со сложным задающим устройством (кулачковым механизмом). Последний представляет собою своеобразное вычислительное устройство, воспроизводящее функцию для определения опти- мальноrо воздействия на рабочее колесо. Никакой коррекции истинноrо положения экстремума в данной схеме нет. TaKoro рода системы настоль:ко близки :к обычным системам проrраммноrо реrулирования, что их даже не принято относить к оптимальным системам. Системы оптимальноrо управления с детерминированной мо- делью, использующие в качестве критерия оптимальности Функ- ционал, рассматриваются в первых четырех rлавах :книrи. Пер- вые работы в этом направлении ставили целью найти способы по- строения систем управления, оптимальных по быстродействию, переводящих систему при заданных оrраничениях из одноrо со- стояния в друrое в :кратчайшее время. Пионерами этоrо направ- ления были советсткие ученые [179, 100]. В 1949-1956 rr. выходят ряд теоретических работ, заложив- ших фундамент и создавших основы общей теории детерминиро- ванных систем оптимальноrо управления. В этих работах, правда, еще це привленается R исследованию проблемы вариационное ис- числение, t(TO связано с несоответствием класса фукций, рассма- тривающцхоя в работах систем релейноrо действия, тому классу, который рассматривается в классическом вариационном исчис- лении. I
11ри изложении материала в данной Rниrе мы несколько от- ступили от хронолоrической последовательности и в rл. 1 рас- смотрели задачи, решаемые классическими методами вариацион- Horo исчисления. rлава 2 посвящена методам исследования систем при оrрани- ченияХ, накладываемых на величину управляющеrо воздействия и на координаты системы. Для таких задач акад. л. С. Понтря- rинЫМ и ero учениками был разработан метод, получивший на- звание «принцип максимума». В :качестве иллюстраций приме- нения этоrо метода использованы широ:ко известные примеры, с разработки :которых фактичес:ки началась теория оптимальноrо управления. В rл. 3 рассмотрен также метод динамическоrо про- rраммирования, разработанный в США Р. Беллманом примерно в те же rоды, что и принцип максимума. С помощью принципа максимума и динамическоrо проrраммирования :класс задач оп- тимизации был существенно расширен. Методом динамичес:коrо iIроrраммирования, в частности, был решен ряд задач оптималь- Horo оперативноrо управления предприятиями, а также эконо- м:ико-математических задач. Таким образом, в теории оптималь- Horo управления был переброmен один из первых мостиков, связавших теорию автоматическоrо управления техническими объектами с современной общей теорией управления системами более общеrо класса, ранее относивmихся только R сфере со- циально-экономических наук. В последние rоды внимание специалистов было привлечено к использованию методов функциональноrо анализа для иссле- дования ряда задач управления, в том числе оптимальноrо управ- ления. Представление сложных ситуаций и процессов в функцио- нальном абстрактном пространстве от:крывает перспективы для широких обобщений, установления единоrо подхода к мноrооб- разным явлениям. В теории оптимальноrо управления эти методы представляются весьма обещающими для полноrо изучения оп- тимальных систем с различными оrраничениями. Понятия абстракт- Horo пространства используются и в друrих разделах теории управ- ления. В данной книrе они частично используются при рассмо- трении проблем оптимальноrо управления и обучения автоматов распознаванию образов. Основная цель rл. 4 все же состоит не столько в достаточно широком рассмотрении методами Функциональноrо анализа за- дач различных типов, сколько в доведении этоrо аппарата до сведения инженеров. Значительная часть rлавы - конспектив- ное, справочное изложение некоторых основных положений функ- циональноrо анализа, даваемое, естественно, без доказательств. По-видимому, через некоторый промежуток времени этот ма- териал, как известный инженерам, будет исключаться из курсов теории управления подобно тому, как в настоящее время в них Уже не рассматривается аппарат преобразования Лапласа, 7
включавmийся в первые книrи по современной теории реrулиро- ванил. В оптимальных системах с неполной информацией и пассивным наблюдением, образующих второй :класс ПО принятой нами :клас- сификации, для выработ:ки решения об оптимальном управлении используются статистические методы. Один из вариантов этих систем представляет собой некоторый «фильтр», на который по- ступают случайные полезный сиrнал и шум. Сначала отыски- ваются структура и параметры «оптимальноrо фильтра», выходная величина KOToporo в не:котором статистическом смысле будет наи- более близка к желаемой, т. е. будет в наименьшей степени искажаться помехами. Оценка близости производится по неко- торому статистическому критерию оптимальности (например, по ожидаемой среднеквадратичной интеrральной ошибке). Rоrда ОПТИl\JIальный фильтр найден, он разделяется на объект и управ- ляющее устройство, и этим решение задачи теоретическоrо син- теза завершается. Часть примеров систем этоrо класса (класси- ческие задачи Rолмоrорова, Винера и некоторые друrие) рассма- тривались нами в ч. 2 моноrрафии. Здесь, в rл. 5, мы рассмотрим некоторые дополнительные при:меры, использующие методы тео- рии статистических решений. В этой же rлаве рассматриваются также системы третьеrо класса - с неполной информацией и ее активным накоплением, в которых управляющее устройство оказывает на объект специально орrанизованные пробные по- исковые воздействия. Анализируя реакцию объекта на эти воз- действия, автомат восполняет информацию об объекте и опре- деляет вид оптимальноrо управляющеrо воздействия. Воздей- ствие автомата на объект имеет, та:ким образом, двойственный или, по терминолоrии А. А. Фельдбаума, дуальпый характер: оно является с одной стороны изучающим, с друrой - направ- ляющим. Если :критерий оптимальности выIажаетсяя фун:кцией текущих значений координат системы, то задача автомата изменяется и сводится к удержанию системы вблизи экстремума в каждый данный момент времени. Наиболее распространенный путь оп- ределения отклонения состояния системы в данный момент вре- мени от экстремума - это также путь использования дуальноrо управления в виде поис:ка. Одним из видов систем дуальноrо управления, отыскивающих э:кстремум функции методом поиска, являются rруппы систем экстремальноrо реrулирования, кото- рые рассмотрены в rл. 6 и 7. rлава 6 содержит описание ряда принципов построения систем ЭI{стремальноrо реrулирования, седьмая - некоторые вопросы динамики действия этих систем. Восьмая rлава несколько выпадает из общеrо плана. Она рассматривает некоторые проблемы, относящиеся к теории МНО- rосвязпоrо реrулирования. Исторически один из ее разделов (теория автопомноrо реrулирования) появился еще в «класси- 8
qеский» период развития теории автоматическоrо реrулирования. 1'еор:иЯ :мноrосвязноrо реrулирования рассмотрена неполно, из- ложены лишь три своеобразных подхода R синтезу l\'1ноrосвязных истем: 1) с позиций автономности, при котором стремятся сде- лать независимыми друr от друrа контуры реrулирования от- дельных величин; 2) с позиций инвариантности, при котором пре- следуюТ цель подобрать связи в системе так, чтобы изменение определенных внешних воздействий не СRазывалось на изменении некотоРЫХ (или всех) координат, и 3) с позиций уменьшения оши- бок системы по всем координата}.!! путем использования структур, допускающих неоrраниченные коэффициенты усиления. В этой же rJIaBe излаrаются понятия управляемости и наблюдаемости. В последние rоды переход R управлению объеRтами с изменяю- щимися случайным образом: в широких пределах хараRтеристи- нами и параметрами вызвал !{ жизни новый класс систем управ- ления - адаптивных, т. е. автоматичеСRИ приспосабливающ:ихся R изменению внешних условий систем. Последняя rл. 9 содержит изложение теории неноторых типов адаптивных САУ. Рассмотрены самонастраиваlощиеся системы с :м:оделью, системы, осуществляющие индентификацию объеRта (Т. е. определение ero характеристики) по данным опыта, и неко- торые статистичеСRие методы индентификации. Далее рассматри- ваются некоторые принципы обучения автоматичеСRИХ устройств, позволяющие решать проблемы классификации сложных ситуаций. Рассмотренные в rлаве пятой принципы дуальноrо управления, основывающиеся на методах статистических решений, предстаВЛЯIОТ u оольшои интерес для осуществления оптимальноrо управленин сло- жными системами и в условиях неопределенности, причиной кото- рой :M:oryT быть случайные помехи или же недостаток информа- ции о характеристиках объекта и среды. Но, как можно было ви- деть из проводимых в rлаве примеров, даже для таких простых систем, как линейные системы nepBoro порядка, анализ и синтез связаны с весьма rромоздкими вычислениями. Поэтому в настоя- щее врем:я, коrда ещё не разработаны достаточно удобные для прак- тическоrо использования l\Iетоды, алrоритмы и вычислительные проrраммы для дуальноrо управления, инженерные приложения l\1етода существенно оrраничены. Tel\I не менее изложение теории дуальноrо управления в книrе приводится, так как ero основные идеи предстаВЛЯIОТСЯ веСЬ1vlа перспективными. В поисках более удобных для практической реализации мето- дов опти:мизации управления в условиях неопределенности мысль исследователей обратилась к вероятностным итеративным мето- дам, в частности - методам стохастической аппроксимации. Эти методы былиизвестны ДОВОЛЬНО давно,НО до последних лет они прак- тически не находили прим:енения для решения технических за- дач. В последнем параrрафе rлавы девятой приводится краткое иаложение разработаппоrо в [л. 194] иптереспоrо общеrо подхода 9
R решению задач адаптации, обучения и самообучения, oCHoBaHHoro на методе стохастической аппроксимации. При этом подходе вы- бор шаrа, приближающеrо систему к оптимальному значению сто- хастичеСRоrо критерия оптимальности, осуществляется на основе анализа по различным алrоритмам измеренных значений реализа- ций приращений критерия оптимальности. Рассмотренный материал подrотавливает читателя в извест- ной мере к изучению новейших разделов теории управления, относящихся к исследованию «больших систем», в функциониро- вании RОТОрЫХ участвуют люди, машины, материальные и денеж- ные средства. Это исключительно важная и большая проблема, которой надлежит посвятить отдельную книrу. Автор выражает rлубокую блаrодарность чл.-корр. АН СССР проф. А. А. Красовскому, внимательно прочитавшему РУRОПИСЬ и в рецензии сделавшему MHoro ценных замечаний, к. т. н. ю. с. ПОПRОВУ, приложившему MHoro труда для выполнения трудной работы по научному редактированию и э. с. Мезено- вой, оказавшей большую помощь в быстром и качественном офор- млении рукописи. Пожелания и замечания просим направлять по адресу: r. Ле- нинrрад, Д-41, Марсово поле, 1, Ленинrрадское отделение изда- тельства «Энерrия».
rЛАВА ПЕРВАЯ ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ОПТИМАльноrо УПРАВЛЕНИЯ 1-1. Постановка вариационноЯ задачи об оптимальном управлении Для Toro чтобы поставить и решить задачу об оптимальном управлении, нужно выполнить ряд условий. Прежде Bcero нужно иметь достаточно точное математическое описание объекта, ко- торым мы управляем; цели, которая поставлен перед управле- нием; среды, в которой работает объект и которая влияет на ре- зультат управления. Далее должна быть дана математическая формулировка критерия оптимальности, имеющеrо в рабочей области экстремум, достижение KOToporo и УRазывает на опти- мальное состояние или поведение системы. Пусть критерий оптимальности выражается функционалом от координат Хl, Х 2 , . . . , Х N И управляющих воздействий (в дальней- шем они для краткости называются просто управлениями) иl, и 2 , . . . , и т , величина KOToporo зависит от вида функций x(t) и u(t). Задача состоит в выборе управления u(t) таким образом, чтобы обеспечить экстремальное значение функционала за все время процесса управления и, следовательно, движение системы по оп- тимальной траектории, называемой экстремалью. Решение этой задачи наиболее адекватным математическим аппаратом осуществляется с помощью методов вариационноrо исчисления. Вариационные задачи, рассматриваемые в данной rлаве, детерминированные. Для их решения требуется полная информация об объекте, среде, цели управления, оrраничениях, показателе оптимальности и состоянии системы. В терминах ва- риационноrо исчисления должны быть заданы: 1) информация об объекте и ero связи со средой в виде дифференциальных, раз- НОстных или разностно-дифференциальных уравнений, связы- вающих между собою координаты объекта, управления и воз- Мущения, на Hero действующие; 2) информация о среде в виде задания управлений и возмущений, действующих на объеl{Т как 11
функций времени, и, если надо, I{оординат системы; 3) информа- ция о цели управления в виде rраничных условий, например, начальных значений координат, характерпзующих состояние, с KOToporo начинается управление, :и копечныIx значений, харак- теризующих конечное состояние, в которое управление должно привести систему; 4) информация о показателе оптимальности, выраженная обычно Функционалом: потерь или выrоды, который в процессе управления надлежит соответственно минимизировать или максимизировать; 5) информация об оrран:ичениях, выра- женная в зависимости от природы оrраничений уравнениями, неравенствами и т. п. (например, изопериметрическая задача). На основе всей этой ИНфОРfац:ии строится детеРIинированная модель системы. Задача состоит или в анализе, т. е. нахождеНИII оптимальноrо управления при заданных структуре системы, rраничных усло- виях, возмущающих воздействиях, оrраничениях и показателе ОПТИl\fальности, IIЛИ в синтезе управляющеrо устройства, т. е. в нахождении ero структуры и параметров при заданных прочих данных. Предполаrается, что читатель знаком с основами вариацион- Horo исчисления, поэтому ниже приводятся в порядке напоми- нания лишь краткие справочные сведения из вариационноrо исчисления. При необходимости более детальноrо и rлубокоrо изучения читателю рекомендуется ознакомиться с [97, 204]. В технике управления вначале делались попытки решения ча- стных задач оптимизации, не прибеrая к вариационно:му исчис- лению, т. е. эвристическим путем. Эти попытки иноrда приводили к решениям, которые при послеДУIощей проверJ{е оказывались весьма близкими к оптимальным. R числу таких решений можно, например, отнести введение в 1935 r. Д. и. Марьяновским и д. В. Свечарником квадратичной обратной связи для форсирования переходных процессов в электроприводе нажи:мноrо устройства блюминrа. В конце 40-х rодоn при проектировании систем управ- ления сам:олетами начала использоваться в качестве критерия оптимальности квадратичная интеrральная ошибка, однако при этом подход R оптимизации был оrраничен тем, что структуры объекта и реrулятора считались заданными и отыскивались лишь параметры настройки реrулятора, обеспечивающие при этих оrраничениях минимум среднеквадратичной ошибки. Задачи TaKoro рода не принято относить к теории оптимальноrо управ- ления, они были рассмотрены вч. 1, в разделе качества [32, стр. 342] Несколько иной была постановка задачи о получении мини- мума среднеквадратической ошибки при воспроизведении в ра- ДИОЛОRационных системах управляющеrо воздействия при наличии случайных помех. Эта статистическая задача об оптимальном управлении была решена с помощью специальноrо математиче- CKoro аппарата, разработанноrо А. Н. Колмоrоровым [67] и Н. Ви- 12
пером [269]. Ее результатом был синтез оптимальноrо фильтра, обеспечивающеrо воспроиаведение сиrнала на фоне шума с наи- меньшей ошибкой. Теория оптимальной фильтрации вошла в теориЮ оптимальноrо управления как один из важных ее раз- делов, но из чисто методических соображений в данной работе она была также рассмотрена ранее, в ч. 11 [32, стр. 81-122]. К первым серьезным попыткам решить оптимальные задачи ав- томатическоrо управления на базе вариационноrо исчисления относятся частные задачи управления ракетами. В период 1946- 1952 rr. был опубликован ряд работ по решению экстремальных задач в теории движения объектов с переменной массой [69, 262]. К 50-м rодам относится также ряд работ по постановке вариа- ционных задач в технике управления электроприводами шахт- ных подъемников и прокатных станов [65, 66, 156, 157]. В первых из этих работ обнаружились трудности решения задач, связанные с получением нереализуемых решений. Проиллюстрируем постановку вариационной задачи управления на простом примере. Рассмотрим в качестве объекта управления двиrатель постоянноrо тока, уравнения KOToporo имеют вид: 1 + k 1 X l = k 2 u - {; } Х2 = Хl' (1-1) rде Хl - скорость вращения вала двиrателя; Х 2 - уrловое перемещение вала; и - управление (напряжение, подводимое к якорю двиrателя); f - возмущение (паrрузка); k 1 , k 2 - постоянные коэффициенты. Допустим, что / = const. (1-2) Таким образом, мы сформулировали первые две rруппы заданий: урав- нение объекта (1-1) и уравнение возмущений (1-2). Требуется перевести бывший ранее неподвижным двиrатель из состоя- ния, определяемоrо уrлом поворота ротора Х 2 (О) = Х21' В состояние Х 2 (Т) = == Х 22 (т. е. повернуть ротор на заданный уrол д'Х 2 = Х22 - Х 2 1) за наимень- шее время Т. Таким образом, третья rруппа заданий, описывающая цель управления, формулируется в виде rраничных условий: Хl (О) = О, Х2 (О) = Х21 при t = О; } Хl (Т) = О, Х2 (Т) = Х22 при t == Т. т Х,2 Х" \ dt dX2 . Т -'= dt = - dX2 = - = mlD. dX2 Хl 1 t (1-3) (1-4) Часто удобнее вместо rраничных условий Х 2 (О) = Х 2 1 И Х2 (Т) = Х 22 И функционала (1-4) использовать функционал т АХ2 = Хl dt, О (1-5) 13
величина 6Х2 KOToporo, равная ПОЛНОМУ перемещепию вала, задана, и ФУВК- ционал (1-4) выразить в тривиальном виде: т т = dt =шin. (1-6) Задание приведенных выше четырех rpynn условий часто ока- зывается недостаточным для решения задачи. Это выражается или в том, что обнаруживается, что искомый экстремум не сущест- вует, или в том, что наименьшее значение функционаJlа дости- rается при физически нереализуемых управлениях или координатах (беснонечно больших по величине или же изменяющихся с бес- конечно большими скоростями и т. п.). Поэтому решение задачи ищется в классе допустимых ФУНI{ЦИЙ (обычно непрерывных, имеющих непрерывные производные), И, если решение в этом классе фУНI{JИЙ не существует, на систему накладывают дополнитель- ные оrраничения, которые, с одной стороны, позволяют доста- точно просто решить задачу, с друrой стороны, имеют ясный фи- зический смысл и техническое обоснование. Так, часто используются оrраничения, выражаемые интеrра- лами от квадратичных форм: т J === (l: aijxix j + Ьu) dt. о (1-7) Оrраничение состоит в том, что задается максимально допу- стимая величина J А. Введение функционала (1-7) часто позволяет просто и изящно свести задачу оптимальноrо управления линейным объектом к кусочно-линейной и даже просто к линейной задаче. Но прежде чем поддаться соблазну использовать эту методику, необходимо проанализировать, какой смысл имеет этот функционал для дан- ной конкретной технической задачи. В ряде случаев функционалы рассматриваемоrо типа имеют более или менее ясный смысл и MoryT рассматриваться как пря- мые или косвенные оценки качества управления. Так, в ч. 1 дан- ной книrи [32] мы имели дело с интеrральной квадратичной ошиб- а:: кой J 1 === в 2 dt, введенной взамен трудно вычислимой, но о OJ несколько более ясной оценки I в I dt, которая косвенным о образом характеризовала время переходноrо процесса Т р , хотя прямую связь между 11 и Т р установить не удается. Довольно сильная колебательность переходноrо процесса в системе, в ко- торой выполнены условия минимизации 11' вынудила перейти к друrой косвенной так называемой «улучшенной» оценке 14
ф 00 \ (х 2 + 2 Х 2 ) dt и к обобщенным оценкам вида т1 [X(i»)2 dt. RJIИЯ- о О ние этих оценок на :качество несомненно, но, так как все это пока очень приблизительно и основывается на интуитивных представлениях, системы, базирующиеся на их минимизации, практик может считать оптимальными лишь условно. Более ясный физический смысл функционал вида (1-7) имеет тоrда, Rоrда он выражает величину энерrии, затрачиваемой на реrулирование. Так, если за управляющее воздействие принят т ТОК якоря i двиrателя, то i 2 R dt выражает электричеСRие потери о в двиrателе, идущие в основном на HarpeB оБМОТRИ. Ряд задач на управление, минимизирующее этот функционал, рассмотрен в [127, 156, 157]. При управлении от оrраниченных по мощности источников питания часто бывает важно минимизировать не по- тери на паrрев, но полную затрату энерrии на управление, опре- т деляемую в электрических установках интеrралом вида ui dt. о Друrой тип оrраничений, рассматриваемых в вариационных задачах, это rолономные и неrолономные связи. Для упрощения исследования обычно «вырывают» объект из системы реrулиро. вания и ищут, каким должно быть воздействие на реrулирующий орrап, не думая о том, что это воздействие вырабатывается управ- ляющим устройством, обладающим инерцией. Если решение по- лучается нереализуемым, то можно ввести управляющее устрой- ство в рассматриваемую схему и искать уже воздействие на ero вход. Уравнение этоrо устройства даст дополнительное уравнение связи - rолономной, если оно не содержит производных, и не- rолономной, если оно их содержит. Обычно неrолономные связи выражаются дифференциальными уравнениями. Кроме упомянутых оrраничений, MoryT быть оrраничения на абсолютные величины координат, например /X i ! A i , И управ- лений, например 1 U i , B i . Такие оrраничения переводят задачу из открытой области в закрытую и для их решения классические методы часто оказываются затруднительными или недостаточ- ными. Классические вариационные задачи в закрытой области и неклассические вариационные задачи будут рассмотрены в следующих rлавах. Напомним некоторые положения вариационноrо исчисления, которые будут использованы в следующих примерах. Пусть дан функционал J, зависящий от независимой переменной t (напри- мер, эта зависимость может войти через возмущающее воздействие) и не- скольких координат системы Xi, являющихся функциями независимой пере- менной: t 1 J = F (t, Х1' Х;, ..., xт), ..., Х n , ж, ..., xт») dt. (1-8) '. 16
Функция F - заданная функция всех своих apryMeHToB, которая в не- которой области В (Х1'...' Х n ) считается непрерывной вместе с ее производными. Пусть также заданы значения функций Xi (to), Xi (t 1 ) и ИХ производных до m - 1 включительно на концах интервала t = t o , xk) (1) = xk) (t o ); t = t 1 , xk) (t) = xk) (t1); k=O, 1, ... т-1; (1-9) i=1,2, .. n. Выделим класс допустимых функций, удовлетворяющих дополнитель- ному оrраничению: они должны иметь 2т непрерывных производных. Класс допустимых в этом смысле функций называют классом С 2т . Задача вариационноrо исчисления состоит в том, чтобы найти такие функции Xi (t) в классе допустимых функций, чтобы функционал (1-8) имел при этом экстремальное значение. Необходимые условия для решения поставленной задачи даются урав- нениями Эйлера - Пуассона: d а т F Xi - dt FXi + dt 2 Fx 'i - ...+ (-1)Тn dtт Fx(m) =0, (1-10) 1. i = 1, 2, ..., п, д rде F (k) = ---w F. х. дх 1. Каждое из уравнений (1-10) есть дифференциальное уравнение порядка 2т. Решение системы этих уравнений содержит 2тn произволъных постоян- ных, так как Bcero таких уравнений n, и, следовательно, необходимо задать 2тп начальных условий вида (1-9). Решения уравнений Эйлера называются а-псmре,м,аля.ми. В практических задачах мы часто имеем дело с функциями F, завися- щими только от координат и их первых производных. Тоrда уравнения Эйлера принимают вид J? - д: = о. X i dt aXi (1-11) Левая часть уравнений (1-10) и (1-11) представляет собой величину, пропорциональную вариации БJ(хд, обусловленной вариацией Xi. Поясним это следующим образом. Пусть функционал имеет вид t 1 J = \ F (t, х, !х) dt. 1. Пусть х* (t) - функция, доставляющая экстремум функционалу. Заме- ним ее в интервале [t o , t 1 ] друrой функцией Х (t) = х* (t) + б [х (t)], rде о [х (t)] - малая вариация функции х* (t). Полаrаем, что б (х) функция, принадлежащая классу С 1 (т. е. имеющая непрерывную первую ПРОИ3ВО,7];ную в промежутке [to, t 1 ], и обращающаяся в нуль на концах промежутка: б [х (t o )] = б [х (t 1 )] = о. Представим о [х (t)] в виде б [х (t)] = af) (t), 18
rде сх - малая величина. ФУНRционал J можно представить как некоторую ФУНКЦИЮ СХ, стремящуюся к J* при сх -. О: t 1 J (а) = F [t, х* (t) + а1) (t), * (t) + cx (t)] dt. t o Разлаrаем J (а) в ряд по степеням а: J (а) = [J (а)]а O + а ( :J ) + ( 2 ) +... а а-О . а а-О Если функцией х* (t) обеспечивается экстремум функционала, то первая вариация этоrо фУНRционала обращается в нуль: t 1 ( aJ \ \ I д Ji' д F · ] БJ (а)а-О = а да )o.o == а J дх 1) (t) + дх 1) (t) dt = о. t o Интеrрируем по частям второе слаrаемое: t. t 1 (' дР. l aFJ l l (l (дР) дх 1) (t) dt = 11 (t) дх t o - J 11 (t) dt дх dt = о. '0 'п Первое слаrаемое здесь равно нулю, так как 1] (to) == 1] (t 1 ) === О. Тоrда БJ (а) = ' т] (t) I : - ;t ( :: ) ] dt = О. t o Равенство должно быть справедливо при любой форме вариации, т. е. при любой функции 1') (t). Отсюда и вытекает уравнение Эйлера: Jli' d (дР) _ О дх - dt дх - · Так же как при отыскании экстремума функции / (х), уравнения /х = О было недостаточно для нахождения экстремума и требовалось еще исследо- вание высших производных в точке, обращающей /х в нуль, так и в нашем случае для нахождения экстремума функционала F необходимо, чтоБJlI помимо уравнений Эйлера вьmолнялся ряд дополнительных условий. Однако так как нахождение необходимых и достаточных условий представляет собою обычно весьма трудоеМКУIО задачу, в практике оrраничиваются исследова- нием уравнений Эйлера и численной проверкой значений функционала в ок- рестности найденной экстремал:и или же проверкой некоторых дополнитель- ных условий, например, условий Лежандра, которые заключаются в сле- дующем. Чтобы на экстремали х* (t) имел место минимум функционала (1-8), необходимо, чтобы вдоль экстремали выполнялось условие Р. · о. (1-12) хх Аналоrично, для Toro чтобы экстремаль давала функционалу максимум, необходимо выполнение условия Р..Е;О. хх (1-12') Если кроме задания Функционала (1-8) на систему накладываются до- полнительные оrраничения, то реIПение задачи несколько видоизменяется. 17
Рассмотрим основные виды оrраничений, при которых вариационная задача остается в рамках КJIассических задач. А. Изопериметрические оrраничения, заключающиеся в том, что задается ряд друrих функционалов: [ 1 J i == Gi (t, х, х) dt = ai, (1-13) t. i==1,2, ..., k, которые должны иметь заданные постоянные значения ai. Название «изопе- риметрический» произошло от задач, в которых находилась максимальная площадь, оrраниченная кривой заданноrо периметра. При наличии изопери- метрических оrраничений уравнения Эйлера составляются для функции k Н = F + ЛiGi, (1-14) i=1 rде л'i - постоянные произвольные множители Лаrранжа. Для определения произвольных постоянных и этих произвольных мно- жителей к rраничным условиям (1-9) добавляются условия (1-13). Для изопериметрических задач весьма важное значение имеет принцип взаимности. Если мы запишем функцию Н в виде k Н = л'оF + ЛiGi, i=l (1-15) rде Ай - новый произвольный множитель, то экстремаль для Н не изменится. Так RaR F i и Gi входят в выражение Н симметрично, то, отыскивая экстре- мум интеrрала (1-8) при условии, что интеrралы (1-13) сохраняют заданные постоянные значения, мы получим ту же самую экстремаль, как и в резуль- тате нахождения экстремума любоrо из интеrралов (1-13) при условии, что все остальные интеrралы и интеrрал (1-8) сохраняют постоянные значения. Б. Оrраничения типа rолономных связей: G i (t, Х l' ..., Х n ) = о, i = 1, 2, ..., k. В этом случае функция Н имеет вид k Н = F + Лi (t) G i . i=1 (1-16) ( 1-17) Произвольные множители Лi в (1-17) являются в общем случае функ- циями времени. В. Оrраничения типа неrолономных связей, выражаемых диффереНЦИ-J альными уравнениями Gi (t, х, Х, Х, ..., Х N , х N , ...) = о. (1-18) Функция Н имеет также вид (1-17). В уравнения Эйлера войдут произ- водные функций л'i (t) по времени. Кроме приведенных оrраничений, часто накладываются оrраничения вида I Xk I ::::; Ak, накладываемые на управления и Rоординаты. Задачи при таких оrраничениях относятся R типу неRлассических вариационных задач. Если оrраничиваются управления, то задача вообще не решается методами классическоrо вариа- циовноrо исчисления. 18
1-2. Некоторые аадачи минимиаации функционалов ОТ квадратичных форм при управлении линеАными объектами Рассмотрим сначала задачу, об оптимизации управления линейным объектом, описываемым уравнением D (р) х == (аорn + . . . + а 11 ) х == и - fl, (1-19) l'де возмущающее воздействие f.'" считается постоянным, f.'" == const. IIри управлении требуется минимизировать функционал "['о J == (х 2 + т 2 х 2 ) dT. о ( 1-20) Если бы мы оrраничились только такими условиями, то поста- новка задачи была бы нестроrой, так как управление и не входит в функционал J и никак не оrраничено. R таким ничем не orpa- ченным функциям методы вариационноrо исчисления, упомя- нутые выте, вообще применять нельзя. Чтобы можно было ре- шить данную задачу классическим методом вариационноrо исчис- ления, мы должны потребовать, чтобы функциих(i), i == 1,2,..., п принадлежали к классу С 2п , т. е. имели бы 2п непрерывных производных. Так как в (1-20) п == 1, функции х и и должны при- надлежать к классу С 2 , Т. е. иметь две непрерывных производных - нулевую и первую. Это дополнительное оrраничение, исключаю- щее скачки функций и их первых производных, даст возмож- ность решить задачу с помощью уравнений Эйлера. Допустим, что х и и принадлежат к классу С 2 . Составляем функцию Н: н == х 2 + т 2.1;2 + Л [D (р) х - и]. I-Iаходим уравнения Эйлера ( 1-21) ) I д Н d д Н _ 2 2...j , дх = 2х + "латр dt дх - т х + ""a п - 1 . ) all d aff ди == Л, dt д[; == О, л = О, ( 1-22) Обратим внимание на то, что 'А оказалась постоянной вели- чиной, тождественно равной нулю независимо от степени поли- нома D (р). Это объя.сняется тем, что управление и входит в урав- нения только линейно, а ero производные не входят явным обра- зом ни в исходное уравение (1-19), ни в функционал (1-20). Учитывая равенство 'А и ero производных нулю, уравнение Эйлера приводим R виду тп 2 х -х==о. ( 1-23) 19
Решение этоrо уравнения имеет вид: 1 1 --! -! х* = С 1 е т + С'2 ет . ( 1-24) Поставив найденное значение х * в (1-19), находим 1 1 и* =D ( - ) С 1 е- т т +D ( ) С 2 е т т + fL. (1-25) Пусть требуется перевести объект из состояния х (О) == х о в состояние х (То) == О эа заданное время 1:'0 так, чтобы величина функционала J была минимальной. rраничные условия 1:' == О, х (О) == х о == С 1 + С 2, 1 1 -- 1'0 -1'0 1:'== То, X(To)==0==C1e т +С 2 е т , откуда находятся постоянные интеrрирования Х e 'tolm С - о; 1 - e1'o/m _ е- '(о/т' xoe-1'o/ffl с==- - 2 e1'olm _ e-to/m. (1-26) Подставив найденные значения С 1 и С 2 В (1-24) и (1-20) и осуще- ствив интеrрирование, найдем J == тх'2 cth 1'0 о т' т. е. J убывает с ростом То и при То = СХ) принимает минимальное Q значение, равное тхо. При То == СХ) получаем х* == хое- 1'lm, \ и* == D (- 11т) хое- 't'/m. f (1-27) Экстремаль в данно:м случае является решением уравнения (тр + 1) х* == О (1-28) при начальном условии х (О) == хо. Закон управления также может реализоваться с помощью линейноrо управляющеrо устрой- ства, описываемоrо уравнением первоrо порядка. Этот резуль- тат был получен иным способом в ч. 1 (стр. 348). Представляет интерес найти передаточную функцию управляю- щеrо устройства, включенноrо как обычный реrулятор по схеме обратной связи. Так как порядок уравнения подобной системы с одной стороны должен, как это вытекает из (1-27), равняться единице, а с друrой стороны оп равен сумме порядков уравнений объекта и реrулятора, то реализация физически возможна лишь в том случе, если D (р) имеет первый, а уравнение реrулятора - 20
нулевой порядок, т. е. если реrулятор безынерционный. В общем ,не случае реrулятор может осуществлять лишь приближенное J{ оптимальном:у управление, кан это было рассмотрено в ч. 1. Расс:м:отрим в начестве друrоrо ПРИ1\-iера схему управления двиrателем постоянноrо TOI{a Д со стороны якоря с помощью электромашинноrо усилителя ЭМУ (рис. 1-1). Пренебреrая постоян- ной времени обмотни управления ЭМУ, электромаrнитной посто- янной времени двиrателя и считая все хараIтер:истини машины линейными, получим следующие уравнения: (Т уР + 1) u л == kyu y ; J pu) == ki - М с; U я = R/ + ею, rде Ту - постоянная вре:мени ЭМУ; k y - коэффициент усиления Эl\1У по напряжению; и у - напряжение, подведенное к обмот- ке возбуждения ЭlVIУ; u л - напряжение, подведенное к якорю двиrателя; J - мо- l\Iеит инерции двиrателя; ю - уrловая скорость вра- щения вала двиrателя; i - ТОК якоря, М С - мо- мент сопротивления; R - сопротивление цепи якорей; k, с - элеКТрО}уlашинные постоянные. Требуется повернуть ротор двиrателя на заданный уrол сх. Это задание выражается с помощью следующеrо Фуннционала (изопеРИ?vIетрическоrо оrраничения): т ю dt==a, о ( 1-29) {'Y3 1., ----- --5J f ИЯ R Рис. 1-1. ( 1-30) rде Т - интервал управления. До начала управления ротор двиrателя предполаrается непод- вижным, в конце управления он также должен остановиться. Это обстоятельство выражается rраничными условиями: ю (О) == О; t ю (Т) == о. f (1-31) Рассмотрим процесс при постоянном моменте наrРУ8КИ М с = const. Управление требуется осуществить таким образом, чтобы электрическая энерrия, затрачиваемая на управление двиrателем, была наименьшей, т. е. требуется минимизировать функционал т Jo= uяidt. о ( 1-32) 21
Подставляя u я = Ri + со), получаем т т J o == i 2 R dt + сюi dt. о о (1-33) . J. М с Рассмотрим второе слаrаемое. Подставляя в нем l == k ю + k ' получим т т т (u (1') Т С roi dt = с: \ ты dt + c с \ т dt = с: т d т + с с т dt. о (u (О) О Учитывая, что верхний и нижний пределы в первом слаrае- мом одинаковы в СИJIУ (1-31), а интеrрал во втором слаrаемом на основании (1-30) равен сх, получаем т . d cAf c с J Cйl t == k сх. о (1-34) Второе слаrаемое в выражении J o постоянно. Очевидно, чтобы минимизировать J o , нам достаточно минимизировать первое сла- raeMoe, выражающее тепловые потери в обмотке якоря, или же, опуская постоянный множитель R, минимизировать функционал т J R == i 2 dt. О ( 1-35) При постоянном моменте М с' минимизируя J R, мы минимизи- руем и полные электрические потери на управление. Если же М с является функцией времени, то данное утверждение уже не будет справедливым. Учитывая (1-29), (1-30) и (1-35), составляем функцию Н: Н == i 2 + Л 1 (Т УUЛ + u л - kyu y ) + "'2 (J ffi- - ki + М с ) + Аз (u л - Ri - ею) + л 4 ю. (1-36) Найдем уравнение Эйлера, составленное для переменной и у : ан d ан ди у = - лtk у , dt дй у = О, откуда Л1 == о. (1-37) Таким образом, уравнения усилителя мы можем не рассма- тривать. Это обстоятельство облеrчает задачу, но оно должно и настораживать, так как отбрасывание оrраничения может при- вести к нереальным законам изменения и у , так как на эту величину 22
мы не накладывали ПОI{а никаких оrраничений. Проделаем все же эту задачу до конца. Учитывая Лl === О, получаем: ан d ан дu я == Аз; dt дu я == О; Аз == о. а: = 2i - л 2 k; :е а: = О; 2i - л 2 k = О; j 2i Л 2 == k. ан d ан · 1 дro == А 4 , dt аоо == Jл 2 , А 4 -J Л 42J .: i' = О, j} "'4 == k 1, · (1-38) ( 1-39) (1-40) Составляем систему уравнений объекта, усилителя и уравне- ний Эйлера. При этом учитываем, что Л 4 как произвольный мно- житель при функции, выражающей изопериметрическое оrрани- чение, равен постоянной. Перенесем эту, пока неизве стную, по стоянную В правую часть. ku y - (ТуР + 1) и н == О, U я - Ri - ею == О, ki-Jрю == М с , 2] pi === kл 4 . (1-41 ) Переменную и у содержит только первое уравнение, которое поэтому может быть рассмотрено независимо от остальных. Чет- вертое уравнение, поскольку л'4 постоянная, также может быть сразу решено независимо от остальных. i == То + At. (1-42) Так как rраничные условия выражены для ю, то нам удобнее сначала на основании третьеrо уравнения системы (1-41) найти ю: k kA t 2 м с Ю==Jl о t+ У 2:-J t, или, обозначив М с == kl c , rде I с - установивmееся значение тока, соответствующее моменту М с' имеем _ k (1 1) kA 2 ю - J о - с t + 2J t · (1-43) Первое rраничное условие ю (О) == О в этом уравнении мы уже использовали, положив равной нулю произвольную постоянную при интеrрировании. Используем второе rраничное условие: k kAT2 ro{T)=J{Io-Iс)Т-t- 2J =0, 23
откуда и АТ Io-I c == -2 ro = 1 (t 2 - Tt). ( 1-44) (1-45) Использование rраничноrо условия позволило нам уменьшить число произвольпых постоянных до одной. Чтобы найти эту произ- вольную постоянную, воспользуемся условием (1-30): т \ kA (та ТЗ) kАТЗ (J) dt = 2J- \3 - 2 = - - 12J = а. о ( 1-46) ОТRуда А - 12Ja - - kТЗ . (1-47) Теперь все переменные выражаIОТСЯ через интервал управ- ления Т: _ 6а (Т 2). (J) - ТЗ t - t , i - М с + 6Ja (1- 2t _) . - k kT2 Т ' - Al c R 6ас [Т т т 2Т) 2 ия-+ ТЗ тп +( - тп t--t]. 1 ! (1-48) rрафики этих функций показаны на рис. 1-2. Решение может идти следующими тремя путями: 1. Интервал управления Т задан. Тоrда задача нахождения оптимальных Ф, i и ил решена. 2. ЗадаНfJI ДОПУСТИ}Iые потери в ЯI<оре w. Тоrда минимально возможное Т определяется из соотношения т M2R 12RJ 2 a 2 R i2dt=-T+ -----w . k 2 k 2 T3 - , о (1-49) после чеrо задача таI\же будет решенной. 3. т выбирается из условия минимума потерь в якоре. Нахо- дим условие, при котором J становится минимаЛЬНЫI: aW M'1R 36RJ 2 a 2 ат- = k -k2 Тt ==0, (1-50) откуда оптимальное значение Т будет /- 6Ja т опт = V м с . (1-51) Мы видим, что оптимальное время управления и вообще опти- мальные управление и координаты зависят от М С. В частности, ив (1-51) видно, что чем сильнее заrружев двиrатель, тем меньше 24
величина Т ОПТ. I-Ia холостом же ходу минимизация расхода энерrии становится практически нереализуемой: Т увеличивается до бес- нопечности, а величины и но и [о стремятся к нулю. Все это сильно затрудняет реализаЦИIО автоматическоrо управляющеrо устрой- ства, осуществляющеrо оптимальное управление. Мы видим, что уравнение для оптимальноrо i IIолучалось независимо от осталь- ных. Поэтому решение задачи совпало с тем, которое было дано в [127], rде ток рассматривался нак управление. Мы уже отмечали, что это было связано с тем, что на и у ни- каких оrраничений наложено не было. Определив теперь и у из первоrо из уравнrIИЙ (1-29), мы видим, что так как в начальный момент t = О, ток i и напряжение U я изменяются скачком, то и у должно в момент времени t = О равняться ш,I,Uа дельта-функции, Т. е. представлять собою импульс бесконечно большой амплитуды. Управление в рассма- триваемой схеме, таким образом, оказывается нереализуемым. Резуль- таты примера можно использовать лишь в том случае, коrда мы имеем возможность скачком изменять на- пряжение U я и коrда можем пр ене- бречь электромаrнитной инерцией якоря. Чтобы найти реализуемое реше- ние, следует наложить оrраничение на и у . Один из способов KocBeHHoro ero оrраничения состоит в том, что мы вводим и у в фупкционал, выражающий критерий оптимальности, " например, положив ero равным сум:м:арным потерям в силовои цепи двиrателя и в обмотке возбуждения ЭМУ: т J п = ( : + i 2 R) dt. о иа t , , I Рис. 1-2. ( 1-52) Ход решения остается таким же, но задача сильно услож- няется. Оптимальные управления теперь находятся, как решения дифференциальноrо уравнения четвертоrо порядка. Такой не- сколько искусственный метод, позволяя решить задачу методами классическоrо вариационноrо исчисления, не rарантирует, од- нако, от чрезмерно больших мrповенпых значений и у при опти- мальном управлении. Более ясным физически будет оrрапичение управляющеrо напряжения по модулю I и у I UМаИС. ( 1..53) 25
Введение этоrо оrраничения переводит, однако, задачу в раз- ряд неклассических вариационных задач, рассмотрению которых посвящается следующая rлава. 1-3. «Аналитическое конструирование» оптимальных р еrуляторов «Аналитическим конструированием>) в [104] названа методика нахождения дифференциальных уравнений устройства, осуще- ствляющеrо автоматическую оптимизацию заданноrо объекта при заданных оrраничениях и критерии оптимальности. При этом учи- тываются некоторые элементарные условия физической реализу- емости получаемых уравнений. Вообще уравнения:м:и, описывающими поведение управляю- щеrо устройства, MoryT быть уравнения Эйлера, но они не всеrда оказываются реализуемыми и, кроме Toro, обладают на первый взrляд неприятным свойством: если время процесса управления в непрерывной системе конечно, то уравнения Эйлера, рассма- триваемые совместно с уравнениями объекта, соответствуют неустойчивой системе реrулирования. Так, в случае линейноrо объекта и квадратичноrо функционала уравнения Эйлера полу- чаются линейными, причем, как это будет показано в следующем параrрафе, среди корней характеристическоrо уравнения обяза- тельно будут как левые, так и правые корни. Очевидно, что если присоединение реrулятора делает систему неустойчивой, то это присоединени:е не может быть длительным. Если известно, что процесс оптимальноrо управления носит спо- радический характер, то можно пойти на использование неустой- чивой системы, включая ее лишь на тот момент, коrда возникла необходимость осуществить оптимальное управление, и обяза- тельно отключая ее после совершения управления. В тех же случаях, коrда реrулятор должен быть все время под- ключен к объекту, необходимо принять меры к обеспечению устой- чивости системы. Эта задача может быть решена с помощью приема, аналоrич- Horo тому, который мы рассматривали в ч. 11, в параrрафе об оп- тимальной фильтрации помехи. Неустойчивую структуру мы счи- таем недопустимой, осуществляем расщепление и факторизацию полученной при синтезе передаточной функции, выделив в ней множители, обладающие только левыми и только правыми полю- сами, и реализуем лишь первую ее часть. В [104] эта задача решается путем отбрасывания в решении уравнения составляющих, соответствующих положительным кор- ням. При этом время управления становится бесконечно большим, но зато функционал приобретает наименьшее из всех возможных для разных Т значение. Частный случай TaKoro рода системы был уже рассмотрен выше в 9 1-2. Рассмотрим примеры несколько более общеrо характера. 26
Пусть дана замкнутая система реrулирования (рис. 1-3), в которой заданы уравнения объекта О: n dl1l dt = blaТfa+тl6' l=1, 2, ..., п, а=1 и ищутся уравнения реrулятора (1-54) n п р (р) == м pi (р) l1i' i=1 действующеrо таким образом, чтобы при ликвидации возникших скачкообразно возмущений на- чальных условий 111 (О) == 'YJ10, ..., 11n (О) == 11n о' (О) == o 00 J () == V dt о от положительно определенной квадратичной формы V == a i 111 + С6 2 + k2 i (1-56) реrулятор привел систему в устойчивое установившееся со- стояние: 111 (ею) == 'YJ2 ( (0) == . . . = fJп (ею) == =6(00)==0, (1-57) так чтобы Функционал (1-58) (1-55) '2 о 'lп Е. р Рис. 1-3. (1-59) имел минимальное значение. Положим сначала k == О. Составим функцию Н: Н = V + Лi (i- ЬiаТ]. - т i S } Имеем ан d ан · a1]i = 2a i l1i - ЛаЬ а i; -dt дУН == Л i . а "Уравнения Эйлера: ;'i = - 2: ь jiЛj + 2ai1)i; \ ; J ( 1-60) О:;:: 2c- тjЛj. 27
Определитель системы (1-54) и (1-60) имеет вид Ь 11 - Р · · .. Ь 1n т 2 1 2ё . . . . тl т n 2с ......... ....... = b п1 · · о. Ь пН - - р Jn l1 /пl 2 т 1l (1-61 ) 2а 1 . . .. о 2с .... 2с - Ь J.l -- Р · · · · - Ь п1 ............ о ... . 2а п - Ь 1п · · .. - Ь пп - Р Если корни характеристическоrо уравнения простые, то они располаrаются симметричными парами -+- Рl' + Р2,'.., -+-Р n (дока- зательство см. ниже в Э 1-4). Решение уравнения будет состоять из линейной комбинации экспоненциальных функций вида С е -Рl! С е- pn t С Pl! С pnt 1 , ..., n 'п -1- 1 ,.. . J 2n · Чтобы система была устойчивой, выберем схему и параметры реrулятора так, чтобы постоянные С n-l- 1'. · ., с 2n тождественно обращались в пуль. Выписав 2п выражений ДЛЯ 'tli и Л j через Che-Pk l , исключаем из этих выражений фупн:ции Cke-Pk t , в резуль- тате чеrо находим выражения Л j = ja'tla, i = 1, 2, ..., п, (1-62) а rде р j а - постоянные. Подставляя полученные выраrкения в (1-61), находим искомое уравнение реrулятора. При k = О оказывается, что оно имеет вид == 1'а'У}а, а == 1, 2, ..., п, (1-63 а rде 'Уа - постоянные, т. е. реrулятор должен быть безынерцион- ным. Такие реrуляторы нереализуемы, поэтому в [104] предла- rается мипимизировать друrой функционал, в котором присут- ствует 2 и k = 1. Решение задачи аналоrично предыдущему. Проиллюстрируем сказанное на примере. 11 р и м е р. Система nepBoro порядка: i = b'I'J + 1n6. J = a'I'J2 + С6 2 + 2. (1-64) Составляем функцию Н: Н = Qf}2 + Ci + t 2 + Л <ч - bf) - т); ан d дН · -д11 = 2af} - Ьл; dt дч = л; ан d ан .. -- = 2c -лт; --;- = 26. а, dt д; 28
Система уравнений объекта и уравнений Эйлора: =bТ)+т; J = - Ьл + 2atl; 2 = 2С6 - тл. Характеристическое уравнение имеет ВИ/ р4 -(Ь 2 + с 2 ) р2 + aпt',; + сЬ 2 === О У равнение имеет решение 11 = С 1 е- J.tl t + С 2 е- J.t2 t ; t = _ I-tl + Ь С е- J.tl i _ I-t2 + Ь С е- J.tzt . 'с т 1 т 2 , (1-65) (1-66) t _ I-tl (I-tl + Ь) С - J!l t + I-t2 (I-t2 + Ь) С -- lt - # "1, т Приняв Cle-Jtlt, + С 2 е- J.ta t за неизвестные, мы ПОЛУЧI1М условие СОВ- меСТНОСТII выписанных трех уравнений с двумя неизвестными: 1 1 -1'11 J-tl + Ь t2 + Ь ,п 'n == 1). I-tl (I-tl + Ь) t2 (f!2 + Ь) . - п1- п Раскрывая, получаем уравнение реrулятора' + (ftl + f.i2 + Ь) = - (111 + _l (1-12_+ Ь) 11. lп ( 1-67) Аналоrичным обраЗОI M:Oi-КНО решить задачу 11 для объектов более BblcOKoro порядка, только выlладкии становятся rораздо более rромоздкими. Добавление каf\ДОЙ новой кооринаты добав- ляет одну переменпую вида С ke- tkt и одно уравнение; порядок определителя, из KOToporo находится уравнение реrулятора ра- стет, но уравнение реrулятора вродолжает оставаться уравнением nepBoro порядка. Задача сильно усложняется, если координаты k не MoryT быть непосрецтвенно измерены. Тоrда уравнение реrулятора будет иметь п}JоизводныIe в правой части и, чтобы можно было реализовать такой реI'УЛЯТОР, нам придется добав- лять в функционал члены, содеРfнащие квадраты высших про'" нзводных от ;. При этuм смысл caMoro критерия оптимальности становится неясны:м:, и об опти:мальном управлении мы уже можем rоворить лишь условно Отметим также, что при возмущениях иноrо типа, чеl\1 ВО3l\lущения начальных условий, система пере- стает быть опти?\1алыiй.. TaKoro рода задачи обычно встречаются в задачах типа стрельбы или поrони, rде задано начальное рас- соrласование, а в процессе полета возмущения отсутствуют. Развитие аналитическоrо конструирования с распростране- ниеl\'l ero на разные случаи оrраничений дано в 150, 64, 82, 83, 29
105, 160], rде эти методы были существенно расширены. В этих работах широко используется функциональное уравнение Бел- мана, рассматриваемое ниже в rл. 3. Решение общих задач анали- тическоrо конструирования реrуляторов линейных объектов до- ведено до уравнений для определения коэффициентов оптимальных управлений. В данной книrе мы не имеем возможности более rлу- боко рассмотреть проблему аналитическоrо конструирования, хотя ниже частично касаемся некоторых методов ( 3-2). 1-4. Обобщение на MHoroMepHbIe и на дискретные системы. Свойства корней характеристических уравнении линеRных оптимальных систем Пусть даны дифференциальные уравнения системы d dt x(t)=![t, x(t), u(t), v(t)], oe<T (1-68) rраничные условия g [Т, х (t)] = о (1-69) и Rритерий эффеRТИВНОСТИ т J = \ F [t, Т, х (t), u (t), v (t)] dt (1-70) или же разностные уравнения L\x [т] = ! (т, х [т ], u [т], v [т ]) и Rритерий эффективности т J== L\F(т, Т, x[пt], u [т], v[т]). т=О В этих выражениях х представляет собою п-мерный [п - порядок урав- нений (1-68) или (1-71)] вентор состояния системы х = (Хl, Х2'...' Х n ); Хl' Х 2 ,..., Х N - координаты системы; u - вентор управления, v - вентор неуп- равляемых видов возмущения; А означает символ упреждающей разности; v (t) есть функция Rласса п о (непрерывная, за исключением, может быть, Rонечноrо числа скачков nepBoro рода); f и F - функции класса С 1 (Т. е. имеющие непрерывные первые производные) относительно х и u и класса D o относительно t. Система уравнений объеRта, rраничных условий и уравнений Эйлера для данных систем имеет вид: (1-71) (1-72) x(t) =f{t, x(t), u(t), v(t)}, Ot<T; I d t л (t) = \7 х р {t, Т, х ( t), u (t), v (t)} - -[Jx(f{t, x{t), u(t), v(t)}]Тл(t), Ot<T; \7 т F {t, Т, х (t), u (t), V (е)} ] = = r J w (' {e х (е). (t}1 v (е)} ]Т 1 (е), О t < r; (1-73) 30
длЯ разностных уравнений: х [т] === f {т, х [т ], u [т], v [ т ]} ], т = О, Т р, 2 7 1 р , ..., т - т р; )., [т] = '\7 хР' {т, Т, х [т], U [т], v [т ]} - -[Jx(f {т, х[т], u[т], v[т]})]T л[т]; vтF(т, Т, х[т], о[т], v[т])= = [J т (' {т, х [ т ], u [ т], v [ т]} ) ] т л [т]. (1 74) в принятых обозначениях отметим следующие особенности. Б малые :квадратные скобки заключен дискретный артумент [т]. Большие квадратные снобки обозначают: [ ] - прямоуrольную матрицу, [ ]Т - транспониро- ванНУЮ матрицу; V х - символ rрадиента: \7х Р = ( : , : , ...); (1-75) J - символ Якобиана: aft afl aXl 8Х2 Jx(f{x})= af 2 af2 aXl 8Х2 (1-76) Б результате решения уравнений находим оптимальное управление ll* (t), экстремизирующее функционал J: u* (t) ="8 [t, x(t), v (t) Т]. Заметим, что так как при L\ -+ О требуется существование только пра- вото предела для х (t) и только левоrо предела для i: (t), то х и i мотут быть не непрерывными. Таким образом, нет необходимости требовать непрерыв- ности функций " F, [! х (f)], [! т (1)], [v х F и V т F ] в отношении t, но должно существовать и быть оrраниченным так, чтобы /.., была дифференцируемой функцией. Приведенные решения справедливы для случая, коrда Т фиксировано. Нахождение «оптимума оптиморума» путем приравнивания нулю вариации Т возможно, если g [Т, х (Т)] является дифференцируемой функцией по х (Т). ДЛЯ случаев, котда эта функция определена лишь для дискретных значений Т еще нет общих методов решения, позволяющих точно найти оптимум опти- морум. Симметричные свойства матриц линейных уравнений Эйлера приводят 1\ неустойчивости решений этих уравнений. Рассмотрим уравнения х=[Р]х+[R]л; = [Q]x - [р]Т Л, } (1-77) rде [Р] = [f x ] - [f u ] [Fuu]-t [F ux ]; ) [ Q] = [F хх] - [F хи] [F ии] -1 [Р их ]; [В] = [f u ] - [Fпu]-l [fu]T, [ ]-1 _ обозначение обратной матрицы. (1-78) 31
В последних выражениях приняты обозначения: [ f х] = [J х (С {t х*, u *, v})]; } [F иx ] = [J x (\7и F {t, Т, х*, u*, v})]; I [F хх] = [J х Cv' x F {t, Т, х*, u *, v})]; } [f u ] = [J и (С {t, х*, u*, v} )]; [F xu ] = [J u CVx F {t, Т, х*, u*, v} )]; J [F uu ] = [JuCVuF {t, 1\ х*, u*, v})]. (1- 79) Звездочками отмечены оптимальные решения уравнений. Если сущест- вует точка равновесия, то в ее окрестности [Р], [Q] и [R] - постоянны, по- этому для исследования устойчивости в окрестности точки равновесия MOiKHO использовать преобразование Лапласа уравнений (1-77): {[Р] - [1] s} х (8) + [В] л (s) = const; } (1-80) [Q] х (8) - {[р]т + [1] s} л (5) = const. Рассмотрим расположение корней полинома [ [Р] - [1] s D (8) = [Q] [R] ] -[Р]Т+[1]s (1-81) в комплексной плоскости s. Так как определитель матрицы равен определителю ее транспонирован- ной матрицы, то [ [Р] - [1] S [R! ] = [[р]т - [1] s [Q] ] . (1-82) [Q] _(р]т - [1] s [В] - [Р] - [1] s Перестанавливая местами столбцы и затем строки во втором определителе, меняя знаки одной из строк и одноrо из столбцов и заменяя s на -8, получим равенство [ [P]-[1]S [В] ]1 1[[P]-[1](-S) [В] ] [Q] _ [Р]Т _ [1] s - I [Q] - [Р)Т - [1]( -s) · (1-83) Таким образом, полином содержит лишь четные степени s, и поэтому корни располаrаются симметричными парами относительно не только веществен- ной, но и мнимой оси. Аналоrично, для разностных Эйлеровых уравнений можно получить I [ [Р] - [1] Z [В] ] _ [[Р] - [1] z-l - [В] ] (1-84) - [Q] [Р]Т _ [1] Z-l - - [Q] [Р]Т - [1] z . Поэтому каждому корню в z-плоскости, расположенному внутри единичноrо Kpyra, соответствует взаимно-обратный корень вне Kpyra. В фаЗ0ВОЙ плоскости такие точки равновесия представлены неустойчи- выми особыми ТОЧRами типа седла. В [236] пока38ПО, что при Т -+ 00 система становится устойчивой. rpa- ничные условия с.тановятся такими, что решение в фазовой плоскости по мере стремления Т к бесконечности приближается к седловой точке.
rЛАВА ВТОРАЯ РЕШЕНИЕ «НЕКЛАССИЧЕСКИХ» ВАРИАЦИОННЫХ ЗАДАЧ НА ОСНОВЕ ПРИНЦИПА МАКСИМУМА 2-1. ВО8никновение «неклассических» аадач оптимальноrо управления «Неклассические» задачи оптимальноrо управления были пер- выми по времени, и именно они послужили темой для ряда работ, заложивших фундамент теории оптимальноrо управления. В этих работах в качестве показателя оптимальности принимал ось время перехода системы из одноrо состояния в друrое. Такие оптималь- ные по быстродействию системы представляют значительный ин- терес во мноrих устройствах - прокатных станах, подъемниках, системах управления курсом подвижных объектов, системах по- rони и т. д. В 1949 r. выходит в свет работа А. А. Фельдбау:ма [179], в ко- торой рассматривается релейная система с линейной частью вто- poro порядка. Исследование ведется, не прибеrая к вариацион- ным методам, с помощью фазовой плоскости. Показывается, что модуль оrраничиваемой по техническим условиям величины в про- цессе оптимальноrо управления должен поддерживаться, на мак- симуме, а ее знак один раз изменится в процесседвижения. В 1950r. сходная задача о системе BToporo порядка с кусочно-линейной ха- рактеристикой типа насыщения была решена Хопкиным [226]. в работе А. я. Лернера [100] дается дальнейшее расширение по- становки задачи на некоторые системы п-ro порядка с веществен- ными корнями характеристическоrо уравнения линейной части при отработке начальноrо рассоrласования и нулевых начальных условиях. В работе была высказана идея, что и при наличии не- скольких оrраничений модули оrраничиваемых величин должны поддерживаться на максимальном уровне. Полезным оказалось введение понятия изохрон [101]. Эти результаты подытожены в [102]. в этих работах были также указаны пути приближенной реализации рассмотренных оптимальных систем с помощью 33
нелинейных обратных связей и построены быстродействующие автоматические компенсаторы, работающие по этому принципу. Таким образом было дано теоретическое обоснование средств реа- лизации простейших оптимальных систем, которые ранее в том или ином виде предлаrались из чисто интуитивных соображений. Не все процессы, предложенные в [100], оказались cTporo оп- тимальными, хотя и довольно близкими к ним. Примерно в это же время в зарубежной печати также выходит ряд работ, rде рас- сматриваются либо различные случаи систем BToporo порядка, либо частные принципы, применение которых, позволяя улучшить динамические хараI{теристики системы, еще не делает ее оптималь- ной. В работе [212] используется идея скачкообразноrо изменения демпфирования, которое принимает малое значение в начале пе- реходноrо процесса и большое - в конце. Использование нелинейноrо элемента для управления реле, осуществляющеrо переключения тормозноrо момента, рассмотрены в [259]. в [246] показано, что существенное улучшение качества систем BToporo порядка можно получить при переменном управ- ляемом демпфировании, зависящем от координат. Интересно отметить работу [213], в которой показано, что в оп- тимальной по быстродействию системе BToporo порядка, характе- ристический полином которой имеет комплексные корни, число интервалов переключения в зависимости от начальных условий, :м:ожет быть сколь уrодно велико, хотя и конечно. Дальнейшее существенное развитие теория оптимальноrо уп- равления получила в работах [180, 181], rде дано обобщение по- нятия оптимальноrо управления на случай неавтономной системы, в которой требуется в кратчайшее время привести движение си- стемы Х (t) на заданную траекторию х о (t). Там же впервые дока- зана «теорема об п интервалах», рассмотренная ниже в 2-3. В [193] были изложены основные положения теории оптималь- ных процессов в релейных системах. В [100, 101] дано дальнейшее развитие теоремы об п интервалах, для случая оrраничений, на- кладываемых на несколько координат. R разработке проблем оптимальноrо управления были привле- чены крупные математики, так как дальнейшее развитие теории сдерживалось отсутствием необходимоrо математическоrо аппа- рата. Цикл упомянутых выше работ послужил стимулом для соз- дания TaKoro аппарата. С небольшими интервалами времени в 50-х rодах получили развитие три новых направления: принцип мак- симума в СССР, динамическое проrраммирование в США, исполь- зование методов функциональноrо анализа в СССР и Польше. Одновременно проводились работы и по распространению клас- сических методов вариационноrо исчисления на новые задачи. Трудности здесь связаны с тем, что расширение класса функций, с которыми оперирует вариационное исчисление, приводит к на- растанию трудностей при решении задачи. Введение изломов 34
В функцию приводит К необходимости помимо уравнений Эйлера ВВОДИТЬ для точек излома в рассмотрение дополнительные усло- вия Эрдмана-Вейерштрасса. При появлении в функциях раз- рывов выражения вариаций сильно усложняются, вследствие чеrо в обычных курсах вариационноrо исчисления такие задачи уже не рассматриваются. Замыкание области координат также приводит к дополнительным усложнениям. Для преодоления этих затруднений в рамках классическоrо вариационноrо исчисления был предложен ряд методов. R числу интересных работ, rде для решения неклассических задач применен формализм классиче- CKoro вариационноrо исчисления, относятся работы Вольца и Май- ера [210], Н. Н. repHeT [43] и др. В последние rоды расширение Rpyra неклассических задач, решаемых классическим вариацион- ным исчислением, было дано в [177]. Тем не менее, потребность в расширении рамок вариационноrо исчисления и в создании но- вых методов, обладающих большей общностью, ощущалась все сильнее, что в конце концов и привело к возникновению упомя- нутых выше новых разделов вариационноrо исчисления. 2-2. Приицип максимума Одним из наиболее часто встречающихся в технике видов orpa- пичений, налаrаемых на переменные, к которым относятся как координаты, так и управления, является оrраничение по модулю, налаrаемое либо на отдельные координаты I xil A i , I Yj I B j , либо на некоторые функции переменных и их производных. Так, в системе управления самолетом оrраничены перемещения рулей, в электрических установках оrраничиваются величины напряжений по условиям электрической прочности, токов - по условиям на- rpeBa, моментов - по условиям механической прочности. Но если в электрической цепи, описываемой уравнением (Lp + R) i === = и, оrраничено и, то тем самым оrраничена и линейная форма (Lp + R) i. Если некоторое управление, изображаемое вектором u в п-мер- нам пространстве и = {иl' и 2 , ... , ин}, rде иl' ... , и п - проекции Bel\Topa u на координатные оси, принадлежит множеству и этоrо пространства, то для технических задач обычно характерна зам- ннутость множества и. Часто встречаются задачи, в которых Of- раничены по модулю проекции вектора IUilUim=const, i=1, 2, ..., n. Тоrда множеству и соответствует п-мерный параллелепипед. В несколько более общем случае, КОl"да оrраничения выражаются линейными неравенствами п 1: ai:/u i b j , i =-= 1. 2, ..., т, i= 1 35
множество и представляет собой замкнутый ВЫПУКJIЫЙ MHororpaH- ник. В этом случае оптимальное управление, как мы увидим ниже, осуществляется путем MrHOBeHHblX переходов точки {иl, и2, ... , и n } В разные вершины мноrоrранника. При решении подобных задач классическими методами вариационноrо исчисления встре- чаются серьезные затруднения. 11ринцип максимума дает один из наиболее рациональных путей преодоления этих затруднений. Пусть дана система дифференциальных уравнений, описываю- щих движение рассматриваемоrо объекта: dx. d/ == ti (х 1 , Х 2 , ..., Х п , п), i===1, 2, ..., п. Пусть заданы начальные X i (О) и конечные x i (Т) состояния системы: (2-1) X i (О) == x i о; J x i (Т) === X ih ; i==1, 2, ..., п. Далее задано, что управление 1.1, которое может перевести си- стему из состояния Х (О) в состояние х (Т), должно принадлежать некоторой замкнутой области И: (2-2) пЕ и, (2-3) Затем задано таI{же значение функционала J, !(оторое наДJIежит :минимизировать надлежащим выбором п. т J==fo[x(t), u(t)Jdt. о (2-4) Введем в рассмотрение дополнительную координату Х о , опреде- ляемую из уравнения dx o I ( . dt === /0 Х 1 , Х 2 ' ..., Х п ' и). (2-5) r!, оrда задача сводится к нахождению TaKoro решения системы уравнений: dx. d/ == ti (X 1 , Х 2 ' ..., x rp и), i = О, 1, 2, ..., п, (2-6) при котором дополнительная координата Х о (Т) == J имела бы наименьшее значение, а остальные координаты удовлетворяли бы rраничным условиям (2-2). В уравнениях (2-6) правые части не содержат явно t, т. е. си- стема стационарна. Из стационарности системы вытекает, что при сдвиrе вдоль оси t свойства управлений не меняются в том смысле, 36
что если управление u (t), О t Т переводит точку в фазовом пространстве из положения X iO в Xи И придает функционалу (2-4) значение J ik , то при любом вещественном't управление u (t + '{), l' :::;; t Т + l' также переводит фазовую точку из положения XiO в положение X ih , т. е. придает функционалу (2-4) то же значе- ние J ik , и, кроме Toro, X i (t + 1'), обусловленное управлением 11 (t + 1'), равно X i (t), обусловленному управление1 u (t). Пусть дана система точек X iO ' X i 1, ... , X ik фазовоrо простран- ства Х и существует управление U z , переводящее фазовую точку из положения Xi, l-1 в ПОЛQжение Xil и придающее функционаJIУ (2-4) значение Jz, l == 1,2, ... , k. Тоrда существует управление и, переводящее фазовую точку из положения X iO в X ik И придающее функционалу (2-4) значение J == J 1 + J 2 + ... + J k . Это выте- кает из указанной возможно- сти сдвиrать управления вдоль оси времени и считать X IlОЭТОМУ отрезки, на которых определены управления U z , нримыающимии друr к дру- Х 22 ry. Отсюда можно сделать важный вывод: любой отре- зок опти:мальной траектории X2 (а также кривой, изобра- iнающей оптимальное управ- Х20 ление и* (t), также являет- ся оптимальной траекторией (или кривой оптимальноrо управления). В самом деле, пусть на отреЗRах оптимальной траек- тории [X iO , X i 1]; [X i 1, X i 2] и [X2' ХЗ] (рис. 2-1) значения функционала (2-4) равны соответст- венно J 1 , J 2 и J з , Предположим, что на отрезке [Xl' X i2 ] управление и 2 не опти- 1vIально, и существует некоторое управление v, переводящее фа- зовую точку ИЗ X i 1 В X i 2 оптимальным образом и придающее Функ- ционалу (2-4) значение J 2 < J 2. Но тоrда получим новое упраВЛЕ- ние, придающее ФункционаJIУ J' значение J' == J 1 + J 2 + J з < J, что противоречит условию, что и* оптимально и, следовательно, J имеет наименьшее возможное значение. Рассмотрим теперь, кроме основной системы уравнений (2-6), систему, составленную относительно дополнительных перемен- ных 'Фl' 'Ф2, ... , 'Фи: 1> .:: ) ,/i ' , I ,' , .,", I \). х. о Тю ХН У'2 X'J Рнс. 2-1. n "'i = _ д! а (х, u) ,,1, . О 1 2 dt дх. 'Yr.x.' t = , , ,. .., п. а=О (2-7) 37
Введем функцию 3 переменных Х 1 , ... Х 1)1'\ , 11' 'У1, , lРп' u n 3 ('1', х, u) == '1'а/а (х, u). 0=0 (2-8) Тоrда уравнения (2-6) и (2-7) можно объединить в одну систему уравнений, называемую rамильтоновой системой: dXi д3 I :_ д (J(- - aXi ' i==O, 1,2, ..., n. (2-9) Пусть существует такое допустимое управление u (t), что со- ответствующая ему фазовая траектория проходит через точки (О, Х 10 , Х 20 , ... Х пО ) и (, X 1k , X 2k , ... , X пk ), rде == Х О (Т) - произ- вольное число. л. С. Понтряrиным доказана [131, 132] следующая теорема: Для тоео, чтобь'L управление u (t) бь'LЛО оптималънь'L:М, необходи:мо, чтоБЬ"t существовала таая ненулевая непрерЬ"tвная ветор-фунция 'Ф (t) == [11'0 (t), 11'1 (t), ... , 'Фп (t)], соответствующая в силу урав- uения (2-9) фунция:м u (t) == [и1 (t), и 2 (t), ..., и п (t)] и х (t) == [Х О (t), Х1 (t), ... , Х п (t)], чтобы: 1) при любо:м t, взятом в рассматриваемом интервале времени Ot Т, фунция rЖ ['1' (t), х (t), п], расс:матриваемая a фун- ция переменноео u Е И, достиеала в точпе u == u * (t) Macи:МYMa 3 ['1'* (t), х* (t), п* (t)] == Jt ['1' (t), х (t)], (2-1()) Jt['I'(t), x(t)]==sup3('I', х, п); (2-11) аЕи rде 2) в онечнь"tЙ :момент вре:мени t == Т вЬ"tполнялисъ бь'L соотно- шения 'l'o(T)O, Jt['I'(T), х(т)]==о. (2-12) ДаJIее в [17] показано, что если величины 'Ф * (t), х* (t) и п* (t) удовлетворяют системе (2-8), (2-9) и условиям (2-10) и (2-11), то функции '1'0 (t) и Jt ['1' * (t), х * (t)] переменноrо t являются постоянными, так что проверку соотношений (2-12) можно ПРОИ3- водить В любой момент t (а не обязательно t == Т). Таким образом, для оптимальности u (t) необходимо, чтобы 3 в любой момент времени равнялась нулю, будучи отрицательной при неоптимальных управлениях. Условия, сформулированные в теореме, являются необходи- мыми, но, cTporo rоворя, недостаточными. Если найдена траекто- рия, удовлетворяющая этим условиям, то из этоrо еще не следует, что эта траектория оптимальна. Но если каким-либо образом до- казано, во-первых, что оптимальная траектория существует, т. е. 38
ЧТО система управляема, и, во-вторых, что найденная траектория, проходящая через ТОЧRИ (О, ХI0, ... , х nо ) и (, X 1k ' ... , :r rzk)' един- ственна, то эта траектория и будет оптимальной. Теорема, изложенная выше, и называется nриnципом MalftCU- мума [17, 16]. В случае оптимизации по быстродействию имеем J == т, 10 (х, и) = 1, и функция $ принимает вид: n $ == 'Фо + фv/v (х, и). v=l Обозначим n $ == 'Фvfv (х, и), v=l уравнения (2-8) и (2-9) теперь принимают вид: dXi 811 I dt:== дФi ; dФi 8Н dt- -ах;. i==1, 2, ..., п, (2-13) а условия (2-10) - (2-12) записываются так: н ['1'* (t), х* (t), и* (t)] == 111 ['1' (t), х (t)] == - 'Фо;::: О, (2-14) rде М (\1', х) == J;J ('1', х) - 'Фо. При м е р 1. Дано уравнение d 2 x dt 2 = и, (2-15) причем на управление u наложено оrраничение I и! 1. (2-16) Определим условия быстреЙIПеrо перехода фазовой точки из заданноrо начальноrо положения X10, Х 2 О В начало координат. Уравнение (2-15) преобразуем к виду dXl I dt = Х2; dX2 dt = и. (2-17) Функция Н имеет вид: н = 'Ф1 Х 2 + 'Ф2U. (2-18) Это линейная функция переменной и, и свои наибольшие значения она МОжет принимать на rраницах интервала - 1 ::::; u 1. 39
Для вспомоrательных переменных 'Фl и '1'2 В соответствии с (2-13) полу- чаем следующие уравнения: d'Фl = _ дН == О; ) dt дХl (2-19) d'Ф2 = _ aII = -"'1. dt дХ2 Откуда '1'1 == Сl' '1'2 == С2 - Сl t, rде Сl и С 2 - постоянные. Управление и найдем из следующих соображений. При положитеJIЬНЫХ 'Ф2 прямая н в функции и имеет положительный наклон R оси и и максимум Н достиrается на правой rранице интервала -- 1 и ::::; 1, т. Р. при и = -t 1. При отрицательных '1'2 наклон прямой будет также отрицательным и максимум 11 будет достиrаться на левом нонце интервала, т. е. при u == -1. Это можно записать так: и (t) == sign '1'2 (t) == sign (С2 - Cl t ). (2-20) Заметим, что если бы зависи- х, мость Н ОТ и определялась не вы- рая\ением (2-18), а была нелиней- ной, то максимум Н Mor бы до- стиrаться как на концах интерва- ла, так и в ero середине, поэтому потребовалось бы исследование функции Н(u) на максимум в пре- делах интервала - 1 и ::::; 1. Линейная функция С 2 - Сl t на отрезке О t Т меняет знак не более одноrо раза (на любом от- резке t 1 t t 2 она меняет знак только один раз). Поэтому и (t) представляет собою кусочно-линейную функ- цию, принимающую значения + 1 и имеющую не более двух интервалов по- стоянства. Оптимальная система в данном случае оказывается релейной. TaKoro рода системы, но иными методами, исследовались в [100, 179]. Для определения моментов переключения найдем на основании уравне- ний (2-1 7) значения переменных Хl и Х 2 дЛЯ и == 1, равные Х2 .... " -' 1 ,.,- ,."" "," " , '" " , ., " " ;' ., ;' ,," ., ",;' "," " 2 ,' ,.'" ,.' " """;'" Рис. 2-2. Х2 == Х20 + t; 1. 1 1 ( (Xo) x J (2-21) Хl == 2 t 2 + x 20 t + ХI0 == 2 t + х 20 )2 + Хl0 --2 = 2 + А. Фазовые траектории в плоскости Хl' Х 2 представляют собой отрезки пара- бол с вершинами, расположенными на оси Хl, И С ветвями, расположенными справа от вершин (рис. 2-2, кривые 1). При и == -1 имеем t 2 Х2 == Х20 - t; Хl = - "2 + X20 t + ХI0 == 1 (х" \ х 2 ==-2(-t+Х20)2+ Х 1 0 +- 2 О ) =- 2+ В ' (2-22) Фазовые траектории - параболы с вершинами на вещественной оси и ветвями, направленными влево от вершин (рис. 2-2, кривые 2). Изменение знака и (переключение) происходит не более одноrо раза, поэтому оно может происходить лишь на той траектории, которая проходит 40
qерез конечную точку - начало координат (на рис. 2-2 ПОRазана жирной сплошной линией). Фазовые оптимальные траектории показаны на рис. 2-2 сплошными линиями. Полученное решение применимо и к задаче об оптимальном по быстродействию управлении системой, у которой оrраничено зна- чение второй производной. Для этой цели мы принимаем оrрани- ченную вторую производную в качестве управления и получаем уравнение (2-15). Первоначально подобная задача была решена в [100, 179] на основании сле- дующих физических соображений. Вначале, чтобы получить наибы- стрейший разrон системы, следует наращивать скорость наиболее интенсивно, т. е. с максимально возможным ускорением. Но чтобы система пришла в заданную точ- l{y с нулевой скоростью, ее при- дется в какой-то момент времени Jo прихода в заданную точку начать тормозить. При ЭТО1 чем IIнтенсивнее торможение, тем: позже оно может быть начато, тем больше средняя скорость пе- рехода и тем меньше время тор- Iожения. Следовательно, тормо- жение также должно совершаться с :максимальной интенсивностью при предельном значении отри- цательноrо ускорения. ТаКИl\1 образом, оптимальный процесс полжен состоять из двух интер- -1 валов: раЗfона при предельном ускорении и торможении при предельном замедлении. Принцип l\rаксимума дает, как мы видели, cTporoe математическое обосно- вание этоrо рассуждения. Кривые оптимальноrо процесса х * (t) и управления и * ==- -=-- d 2 x/dt 2 при нулевых начальных условиях и значениях 'и! 1, Т === 2 показаны на рис. 2-3. f UЖ=!i о t f Рис. 2-3. При м е р 2. Дано уравнение х + 2hx + ЮХ = и, I u I 1. Приведем ero, положив х = Хl' К виду dXl. ) dt = Х2, dX2 ., 2h + dt = - ffi Й Х l - Х2 и. (2-23) (2-24) 41
Составим функцию Н: Н = 'Ф1 Х 2 - оо8'Ф2 Х 1 - 2h'Ф2 Х 2 + 'Ф2U' Уравнения для функций '1' имеют вид: d'Ф1 дН 2. \) dt = - дХl = ООu'Ф2, d:ft2 = - : = 2h'!'2-'!'1' Корни характеристическоrо уравнения р -00з = р2 - 2hp + ООб = О; 1 p-2h Рl,2 = h -t- Vh 2 - 006 отличаются от корней характеристическоrо уравнения системы (2-24) лишь знаком h. Рассмотрим два случая: 1. Ih\ > 10001; корни характеристическоrо уравнения вещественны. При этом (2-25) (2-26) '1'1 = '1'10 + А 1 е Р1! + A 2 e P2i ; ,,1, = d'Фl = Р1 А l e P . i + Р2 А 2 еР!! '1"2 002 dt 00 /'0'\ '! . u J J (2-27) (2-28) Так же как и в предыдущем примере, оптимальное управление и* (t) = sign '1'2 = sign [ Pl e P1t + P2 ep,tJ . _ о о (2-29) Определим, сколько раз '1'2 изменяет знак или сколько раз '1'2 по мере изменения t обращается в нуль. Если '1'2 = О, ТО РI А l e P . t = _ Р2 А 2 e P2t OO 0>5 или е(Р2 - Рl) t = _ РI А l Р2 А 2 ' ln (_ РI А l) Р2 А 2 t= Р2 - Рl (2-30) в зависимости от начальных условий решений для t либо нет совсем (если число, стоящее под знаком лоrарифма отрицательно), либо существует единственное значение t, при котором '1'2 обращается в нуль. Итак, число переключений - не больше одноrо. Но если вид функции u* (t) в рассматри- ваемой задаче определяется так же просто, как и в предыдущей, то с опреде- лением момента переключения дело обстоит значительно сложней. Путь непосредственноrо вычисления t по формуле (2-30) требует предва- рительноrо вычисления постоянных А 1 и А 2 по начальным условиям, и вы- числительное устройство для TaKoro метода решения задачи получится доста- точно сложным. Попробуем друrой путь: установим связь между значениями х и dx/dt. Расширим задачу, положив lul:::::; им. Обозначив и Хl=:&-- (a) , 42
и учитывая, что внутри интервалов между переключениями и == им постоян- на, и ее производная по вреuмени равна нулю, сведем уравнения (2-23) к системе однородных уравнении dXl ) dt == Х2; dX2 Q dt = - ФJ Х l - 2hx 2 , (2-31) Дифференциальное уравнение фазовой траектории dX 2 '> Х 2 -- == - 2h -00'0 -- dX 1 Хl IIОtстановкой z == х21Хl сведем к виду dz 003 z + Хl - == - 2h - - . dXl Z РаздеJIЯЯ переменные, получим z dz Z2 + 2hz + 005 dXl =-- Хl (2-32) При вещественных корнях знаменателя урав нение ( 2-32) имеет решение 1 1 I 2 + 2h + 21 h 1 z + h - Yh 2 - 005 + 1 С 1 - n z z 000 - _ n n == - nхl. 2 2 Yh 2 - oo Z + h + Yh 2 - 003 Возвращаясь к переменным хl и Х2' после несложных преобразований получим 1 I '> L 2h +.) I h 1 С Х2 + Х 1 (h - h 1 ) о n Х 2 -, ХI Х 2 ООО Х l - h 1 n Х2 + Хl (h + h 1 ) == (2-33) пли 11 + 2h -t- оо'! :? - С ( Х 2 + Хl (h - h 1 » )h 1 Х:1 Х 1 Х2 оХ 1 - Х2 + Х 1 (h + h 1 ) , (2-34) rAe h 1 == Yh 2 - 003. Пусть построена картина фазовых траекторий для системы (2-31). Как было показано в ч. 11 (стр. 133), эти траектории располаrаются так, как показано на рис. 2-4, а. Чтобы получить фазовый портрет для уравнения (2-33), мы можем пере- нести начало координат либо в точку Хl == luмl/ООб для u > О, либо в точку Хl == - им! /ооъ для и < о. Траектории, проходящие через эти точки, на dx рисунке показаны жирной линией. В плоскости Х, dt == Х2 оптимальная траектория, совпадающая с линией переключения, изображается траекто- рией, полученной путем смещения отмеченных жирной линией отрезков так, чтобы они прошли через начало координат (рис. 2-4, 6). Смещением и отрезанием частей, лежащих после линии переключения, получается и осталь- ное семейство оптимальных траекторий. 2. Корни характеристическоrо уравнения комплексны. При этом '1'1 == A 1 e ht sin (Фl t + А 2 ); } А (2-35) '11'12 = -+ e ht [h sin (ool t + А 2 ) + 001 сов (Фl t + А 2 )], 'у (й й rде (йl == -v 005 - h 2 . 43
Обращение функции '1'2 В нуль на интервале О < t < Т может иметь место неоднократно, и, чем больше длительность интервала Т, тем большее число переключений на этом интервале произойдет . Чтобы установить вид оптимальных траекторий на фазовой плоскости, рассмотрим сначала более простую задачу, в которой 002 == 1, h == О, lиl :::::; 1. Система уравнений принимает вид dX1 ) dt = Х2; (2-36) dX2 -- - Хl, dt rде Хl == Х + 1. Фазовыми 'траекториями в ПJIОСКОСТII Х, Х2 являются окружности с цент- ром в начале координат, в плос:кости Хl, Х 2 - окружности С центрами на ве- й) Х 2 Рис. 2-4. щественной оси смещенными на +1 или -1, в зависимости от знака и. Дви- жение фазовой точки по окружности совершается по часовой стрелке с посто- янной уrловой скоростью и за промежуток времени, равный 31, точка описы- вает половину окружности. Начнем построение оптимальной фазовой траектории с ее конца, т. е. от начала координат. Последним отрезком траектории (см. рис. 2-5) будет часть полуокружности ОА 1 М 1 (если на последнем интервале u = +1) или OB 1 N 1 (если на этом интервале u == -1). Пусть последний интервал соот- ветствует ОА 1 М 1 . Точка А 1 , из которой начинается движение по полуокруж- ности ОА 1 М 1 , определяется фазой колебаний, т. е. в конечном итоrе началь- ными условиями. Пусть каким-то образом положение точки А 1 мы определили. До точки А 1 фазовая точка двиrается по полуокружности В 2 А 1 С центром в точке (О, -1) и соответствующей u = -1. Так как интервал движения между двумя ли- ниями переключения равен 31, то дуrа А 1 В 2 точно равна полуокружности и точка В 2 симметрична А! относительно центра 0-1' и поэтому точка В 2 лежит на полуокружности N 1 N 2 , симметричной полуокружности ОМ! относительно центра 0-1. Точно также дуrа В 2 А з , предшествующая дуrе А 1 В 2 , есть полуок- ружность с центром 0+1' и точка Аз лежит на полуокружности М 2 М З , которая симметрична полуокружности N 1 N 2 относительно центра 0+1' и т. д. 44
Теперь можно указать общий способ получения любой оптимальной траектории, начинающейся в заданной точке х (О), ; (О). Если эта точка нахо- дится в верхней полуплоскости, то на первом интервале и = -1 и дуrа расположена вверх от центра, если х (О), .; (О) - в нижней полуплоскости, ТО на первом интервале и = +1 и дуrа расположена вниз от центра. Пусть х (О), х (О) лежит в верхней полynлоскости. Наносим линию пере- :Rлючения - ряд полуокружностей единичноrо радиуса OM l , M l M 2 ,..., ON 1 , N 1 N 2 ,... Из точки С координатами х (О), (О) проводим дуrу с центром х, Рис. 2-5. о -1 до пересечения с линией переключения в точке A l , затем из точки А 1 В нижней полуплоскости проводим дуrу А 1 А 2 с центром в 0+1 до пересечения с линией переключения в точке А 2 и Т. д., пока в конечном итоrе мы не придем в начало координат. Очевидно, что время движения по оптимальной траек- тории будет конечным. Если h не равно нулю и h 2 < 0)5, то отрезками траекторий будут уже не дуrи окружностей, а отрезки скрyriивающихся к центру спиралей. Линию переключения строим следующим образом. Выделяем спираль, проходящую через точку +иIO). На рис. 2-6 эта спираль отмечена штрихо- Вой линией. Передвиrаем виток спирали L 1 L 2 влево, пока точка L 1 не попадет в начало координат, а точка L 2 совпадет с точкой N 1 , затем переворачиваем виток L 2 L з BOKpyr оси абсцисс так, чтобы он леr в верХНЮIО полуплоскостъ, и передвиrаем точку L з влево до тех пор, пока она не совпадает с точкой N 1 , И Т. д. В нижней полуплоскости построение будет симметричным. Спирали, лежащие выше линии переRлючевия, получаются путем сдвиrа спиралей 46
на рис. 2-6 вправо на +и/ю, а ниже линии переключения - путем сдвиrа их на -и/(U. Приведенное выше построение было предложено Р. Бушау [213J. %2 Х/ Рис. 2-6. 2-3. Теорема об п интервалах Впервые эта теорема, но иным методом, была доказана А. А. Фельдбаумом [180]. Пусть дана система уравнений n r а;: = !aivx v + ! bipu p ' (i = 1,2, . . . , п) \'=1 р=l или В матричной форме (2-3/) dx lП=Ах+Ви, (2-38) rде матрица а 11 а 12 а 1n " а 21 а 22 а 2n А= ....... (2-39) а п1 а n2 . .. а nп 46
имеет все вещественные собственные значения. Это раВНОСИJIЬНО тому, что характеристическое уравнение системы а 11 - л, а 12 а 1п I i1 == а 21 а 22 -- л, а 2п == О (2-40) а n1 а п2 а 1lп -- л имеет только вещественные корни л'h , На управления и р наложены оrраничения ар и р P' Р == 1, 2, ..., r, (2-41) т. е. область и, к которой принадлежит вектор управления u представляет собою р -мерный параллелепипед. Тоrда для каждоrо нетривиальноrо значения вспомоrательной функции 'Ф (t) однозначно определяется управляющая функция п* (t) == {и! (t), и2 (t), ..., и (t)}. При этом каждая из функций и (t) кусочно-постоянна, при- нимает только значения ар и p и имеет не более п - 1 переклю- чений (т. е. не более п интервалов постоянства), rде п - порядок системы . (2-37) . Определим сначала функции Н и '1'. в соответствии с изложен- ными выше правилами ппп r Н == ('Ф, Ах) + ('Ф, Ви) == 'Ф11а11"Х" + "'11btpup. (2-42) 11=1,,=1 Jl,=1p=1 Вспомоrа1'ельные функции 'Ф определяются из уравнений n d'PJ == _ ан == __ а".'1I,,, jO - 1 2 п d t ах j 1 'У' -, ,. . . , · ,,=1 Или В векторной форме (2-43) d == _ ATI1I"1 dt , rде А т по отношению к А является транспонированной матрицей. Так как функция Н, рассматриваемая как функция перемен- ной u, линейна, то она либо постоянна, либо достиrае1' максималь- Horo значения лишь на rранице мноrоrранника и, 1'. е. или в од- lIОЙ вершине, или же на целой rрани, причем в последнем случае Достижение максимума возможно, как показано в [132], лишь для !\онечноrо числа значений t. Таким образом, функция U - ку- Сочно-постоянная и число ее переключений нонечно. На примере уравнения BToporo порядка мы видели, что число переключений не превышае1' единицы (Т. е. числа, на единицу :мевьmеrо, чем порядок уравнения), если все корни вещественны, и может быть сколь уrодно большим, но конечным, если корни Rомплексны. Можно показать, что в случае вещественных корней 47
в системе п-ro порядка число переКЛIочений не может превышать п -1. Пусть все корни характеристическоrо уравнения (2-40) веще- ственны и среди них имеется т попарно различных корней л'1' л'2' ... , л'tп' причем кратность i-ro корня л'i равна r i . Очевидно, так как общее число корней равно порядку уравнения, то r 1 + r 2 + . .. + r 1п == п. (2-44) Каждая из функций 'Фi (t), полученная в результате решения уравнений (2-43), будет иметь вид: 'Pi (t) == f 1 (t) е Л1t + fi 2 (t) е Л2t +. . . + firп (t) еЛт,t, (2-45) rде f ij (t) - полиномы степени r j - 1. Пусть для HeKoToporo т установлено, что функция 'Фi (t), определяемая формулой (2-45), имеет не более чем k 1 + k 2 + ... ... + k т -1- п - 1 корней. Покажем, что в случае т + 1 слаrаемых функция т+l 'Фi(t)== 2: fij(t)e'Ajt j=l имеет не более чем k 1 + k 2 + ... + k rll + k т + 1 + (т + 1) - 1 корней. Предположим, что это не так и что в случае т + 1 слаrаемых функция (2-46) имеет большее число корней, скажем k 1 + k 2 + + ... + kт+l + т + k, rде k> О. Умножим (2-46) на е- Лт + 1t , что, очевидно, не изменит числа корней. Мы получим новую функцию 'Р i (t) == 'Р i (t) е-Л т + 1 t == f i 1 е( Л 1 - л rп+ 1) t + . . . + f i т ее;.. т - л т+ 1) t + f i. 111 11 . 110 наше:му предположению эта функция имеет k 1 + k 2 + ... ... + k т + 1 + т -t- k корней. Возьмем k т + 1 производную этой функции. Так как степень полинома f i , 1пtl(t) равна k т + 1 , то (k т41 + 1) производная от Hero равна нулю и мы имеем (2-1Н) 'Pi (t)(k т '+1 + 1) == gi 1 (t) е(Л 1 -Л пн 1) t -i ...4- giт (1) е(Л rn -Л 1 'Н 1) t. (2-47) 'Так как эта функция имеет тот же вид, что и (2-45) и число слаrаемых n ней равно ,п, то ДЛЯ нее число корней не превыmает k 1 + k 2 + ... -t- k tп + т - 1. Вместе с тем, так как между каждыми двумя вещественными корнями функции лежит по крайней мере один корень ее произ- водной, то число корней функции (2-47) должно быть равным k 1 + ... - k rп + k т + 1 + т + k - (k rп + 1) == k 1 -f- ... + k 7п + + т - 1 + k. Отсюда видно, что k == О, т. е. число корней ДJIЛ любоrо т равно k 1 + ... + k т + т - 1. 48
Теперь достаточно указать какое-нибудь т, для KOToporo наше утверждение справедливо, чтобы показать, что оно в соответствии с методом математической индукции будет справедливым для лю- noro т. Нетрудно видеть, что утверждение справедливо для ,п == 1, так как функция 11 (t) е Л1t имеет те же корни, что и функ- ция 11 (t), И имеет поэтому не более k 1 корней. Итак, учитывая, что k i == r i - 1, получаем, что число корней функции 'Фi не превыmает числа )r 1 - 1) + (r 2 - 1) +. .. + (r l1 / - 1) + т -- 1 === r 1 + r 2 +. .. . . . + r пL - т + т - 1 == п - 1. Теорема об п - 1 переключении (теорема об п интервалах) доказана. 2-4. Оптимапьные процессы при оrраниченных координатах и управлениях llусть помимо управлений u == {И 1 (t), и 2 (t), ..., и 1 , (t)} оrраничены и координаты х == {Х 1 (t), Х 2 (t), ... , Хн (t)} и rраница области, внутри которой должны находиться и за пределы кото- рой не должны выходить х, определяется уравнением g(x)==O. (2-48) Условие нахождения х внутри некоторой замкнутой области G выражается неравенством g (х) == g (х 1 , Х 2 , ..., хп) о. Скалярная ФУНI{ЦИЯ g (х) определена и имеет непрерывные частные производные BToporo порядка вБJIИ3И rраницы, а вектор Bg_ (xl_ _ 'd ( ) _ , ag 8g l д - gra х -)8 ,"', д J х \ Хl Х N ниrде на rранице в нуль не обращается. Для Toro чтобы траектория х (t), соответствующая управлению 11 (t), лежала на rранице g (х) :::::: О, необходимо и достаточно, что- БыI она начиналась на этой rранице g [х (t o )] == О и чтобы фазо- вая скорость точки, Jt;вижущейся вдоль траектории, в Jlюбой мо- l\tеит времени была касательной R rранице, т. е. чтобы выполня- .лось равенство р[х, u]==O, rде n [ 8g(x) Р х, u] == - аХа fa (х, u). (l =0 (2-49) в [132] доказаны ДЛЯ этих данных следующие положения. 49
Оптимальная траектория может состоять из участнов двух видов: а) участки, лежащие внутри области G (т. е. принадлежа- щие, нан rоворят, открытому ядру области G); б) участки, лежа- щие на rранице области G. ДЛЯ определения первых участков применим обычный принцип максимума. Участки оптимальной траектории, лежащие на rpa- нице области G, определяются в соответствии со следующим: видо- изменением принципа максимума: Пусть х (t), t o t t 1 - реrулярная оптимальная траекто- рия уравнений (2-6), соответствующая оптимальному управле- нию u * (t) и целиком лежащая на rранице области С. rrоrда най- дется такая непрерывная вектор-функция 11' (t) = ['Фо (t), ... ... , 'Фн (t)], t o t ::::;; t 1 , И такая кусочно-непрерывная, кусочно- rладкая скалярная функция л (t), t o t t 1 , что на отрезке t o t ::::;; t 1 будут выполняться равенства: dx _ д (ф, х, и) - f ( ). dt - дф - х, u , d'J' == _ д ('1', х, и) + Л (t) др (х, и) . dt дх дх ' (2-50) ['Ф(t), x(t), u(t)]==т['Ф(t), x(t)]==O, rде т (tф, х) == sup и соблюдаются условия: а) 'Фо (t) == const О; б) вектор 11' (t o ) отличен от нуля и касается rраницы g (х) == О в точке х (t o ); в) во всех точках дифференцируеl\10СТИ фУНКIИИ л (t) (2-51) (2-52) dл (t) grad g [х (t)] О, (2-53) т. е. вектор (2-53) направлен внутрь области G или обращается в нуль. В точках стыка траекторий двух указанных типов должно вы- полняться одно из следующих условий скачка: ИJIИ '1'+ (Т) == 'Ф- ('t) + f-t grad g [х (Т)] '1' ('t)+gradg[x(L)]==O, t *- О, (2-54) (2-55) rпе f.1 - вещественное число. Если участок траектории, содержащий точку стыка, лежит на rранице g (х) == О, то ",+( Т) = 'Ф- ('t). (2-56) 60
Bиabz непоторых оптимальных процессов 1. Процесс с оrраничением по модулю первой и второй проив- водных: dx · с:::-- Х · dt т' d 2 x .. -<r d ['2 ---....:.:::: и 1ft' rде X rп , Х уn - постоянные. I-IачаJIьные условия: Х (О) == О, (О) === о. d 2 x I3 соответствии с принципом максимума управление II * = dt 2 .. БУl'ет. равно X rn до тех пор, пока х остается меньше Х'т. При ;)том х и х, очевидно, изменяются по закону . .. Х == Х n /' Х - 2 rп [2 - 2 · Это соответствует отрезку траектории, лежащей внутри об- ласти с. В момент Х т [1 == Х т мы попадаем на rраницу области. Далее х остается постоянной и равной Х т , а Х изменяется по закону . Х == xтt. Чтобы прийти в точку О с нулевой скоростью, мы должны в не который момент времени начать торможение. Так же как и в за- даче с оrраниченной второй производной, так как начальные и ко- нечные значения скорости равны, кривая Х (t) должна быть сим- метричной относительно точки 1/2 X k (рис. 2-7). Оптимальные фазовые траектории показаны на рис. 2-8. Случай одновременноrо оrраничения нескольких координат детально изучен А. я. Лер- нером [101] с помощью пространства состояний и метода изохрон. 2. Пространством состояний названо MHoroMepHoe простран- ство, в котором ПО осям отложены все значения координат систе- мы, включая входную. Каждому заданному закону изменения входной координаты Х п + 1 === и в пространстве состояний соответ- ствует единственная кривая, определяющая протекание процесса н системе, но вместе с тем через каждую точку пространства со- Стояний проходит бесчисленное множество траекторий, определя- емых законом изменения и. Оrраничения рассматриваемоrо типа выделяют в пространстве состояний область допустимых состоя- ний (В-область). 51
Рассмотрим в области S некоторую точку а о и найдем rеометри- ческое место точек, из которых путем выбора надлежащеrо за- кона изменения управляющеrо воздействия, мы попадаем в точ- ку а о за одно и то же врем:я (рис. 2-9). Х К --- х о t --- Х 2 Хт 1/ 2 rl< X rп Рис. 2-7. Рис. 2-8. Построить эти точки можно, приняв точку а о за начальную, задав некоторый произвольный закон изменения управления и отсчитывая время в обратном направлении. Эти rеометрические места точек дают так называемую область изохрон И 1 дЛЯ t == t 1 , И 2 ДЛЯ t == t 2 И т. д. Точка ао, относительно которой выделяется область изохрон, называется по- люсом изохрон. Можно также построить об- ласть изохрон для кривой. Об- ласть изохрон обладает следую- щими свойствами: 1. Для любоrо положительноrо t i область изо- хрон имеет то же число измере- ХК ний, что И пространство состояний, а все радиусы-векторы, проведен- ные в любую точку rраницы обла- сти изохрон, для любоrо положи- тельноrо t i имеют конечную длину. 2. Каждая точка области изо- хрон для времени t r принадле- жит также и области изохрон для большеrо времени t s > t 1 >. Если точка, изображающая начальное состояние, находится на rранице области изохрон с временем t r , то переход из этой точки за время t p в полюс изохрон возможен только при условии движения изображающей точки по траекто- рии, состоящей из отрезков кривых, расположенных на rранице S-области, и отрезков прямых, параллельных оси входной коор- Xi s о Рис. 2-9. 52
динаты системы, соответствующих скачкам координаты (рис. 2-10). ЧИСJIО т этих скачков, необходимых для приведения системы J:J заданное состояние за lинимальное время, можно определить следующим образом. Пусть система представлена в виде последовательноrо соеди- нения звеньев первоrо порядка (рис. 2-11). Это, очевидно, воз- можно, если все корни характери- сrическоrо уравнения системы веще- ственны. Допустим:, что оrраничение наJLожено 1'ОЛЬКО на входную I\OOp- rI-' )инату Х n + 1 . оrда, как это СJIедует :из теоремы об п интервалах чи- сло переключений, не превышает п - 1 (т. е. число интервалов не превышает п). Введем в рассмотре- ние число скачков т, которое равно числу переключений координаты Х п + 1 плюс начальный скачок (включение) и конечный скачок (отключение). Таким образом, число скачков при оrраничении только координаты Х п + 1 не больше п + 1, т. е. индекса этой Rоординаты. Пусть теперь, кроме входной, оrраничены также координаты X i + 1 , x pJ1 , i > р. Если бы оrраничение наI{ладывалось только на координату X pJ1 , то она совершила бы не более р + 1 скачков; но так как оrраничение наложено и на старшую по ОТНОIJlению :i Рис. 2-10. Xп I I X I t- ----- I x J х., Рис. 2-11. к Х Рт1 координату X i ,1' то, для Toro чтобы X p + 1 смоrла совершить сначок, может потребоваться i - Р + 1 скачков координаты X i + 1 , а для скачка координаты X ii1 , в свою очередь, l\Jl0жет потребоваться п - i + 1 скачков координаты .T n + 1 . Таким образом, общее число СRачков будет не более т === (n - i + 1) (i - Р + 1) (р + 1), пли, обозначая п - i === r и i - р ===8, т === (r + 1) (s -t- 1) (р + 1), (2-57) rде r, s, р - разности индексов двух ближайших друr к друrу оrраниченных координат (для младшей координаты Х р + 1 это 53
а) х о т 6) о х. 8) о Z) о х. 54 д) t t о т е) t т t т 3) о Рис. 2-12.
(5удет разность между ее индексом и индексом выходной величи- gЫ Хl). Если оrраничены все координаты, то число скачков не будет превышать 2 n , так нан разность двух смежных инденсов равна единице, каждая из скобок в произведении (2-57) равна двум, а число скобок равно числу звеньев п. На рис. 2-12 поназан ряд процессов перевода системы из од- Horo установившеrося состояния равновесия в друrое при orpa- ничениях, налаrаемых на различные производные. Схема рис. 2-11 при этом будет состоять из интеrрирующих звеньев. На рис. 2-12,а показан процесс в системе при оrраничении тольно первой про- изводной. Порядок уравнения п == 1 и т === п + 1 == 2, т. е. имеет- ся два скачка (включение и отключение), один интервал и число переключений равно нулю. На рис. 2-12, б поназан процесс при оrраничении третьей производ- ной, т == п + 1 == 3 + 1 == 4. На рис. 2-12, в оrраничены третья и первая производная, р == 3 - 1 == 2, r == 1 - О == === 1, т == (р + 1) (l + 1) == Б.На рис. 2-12, е оrраничены третья, вторая и первая производные, т == 23 == 8. На рис. 2-12, д оrраничена четвертая производ- ная, т == 5; на рис. 2-12, е оrраничены четвертая и вторая производные, т == (2 + 1) (2 + +- 1)==9; на рис. 2-12, ж оrраничены четвертая, третья и вторая производные, т == (1 + 1) (1 + 1) (2 + 1) = 12; на рис. 2-12, 8 оrраничены все четыре производные, т = 24 == 16. Если исходное и конечное состояния систем равновесны, (x(k)(O)=X(k)(T)=O, k=1, 2, ..., п-1), х,Жо t о т Рис. 2-13. ТО число скачков точно равно т, определяемому из (2-57), если же начальные условия произвольны, то число скачков может быть и меньшим. Минимальное число скачков, очевидно, равно двум, что соответствует отсутствию переключений. 3. Задача А. А. Фельдбаума об оптимальной поrопе. Задача об оптимальной noroHe детально рассматривалась в ряде работ. 1\1ы рассмотрим здесь лишь простейшую задачу, ноторая была по времени первой [180]. Пусть к динамической системе приложено некоторое задаю- щее воздействие хо (t) (рис. 2-13). (Это, например, может быть ин- формация о траектории движения экипажа, который мы должны доrнать.) Требуется осуществить управление таким образом, что- бы при оrраничении по модулю ускорения нашей системы 66
I d2X I dt 2 А координата х (t) стала бы за возможно кратчайшее время Т равной ХО (Т), причем в точке А встречи ДОЛЖНЫ выпол- няться условия касания кривых п-ro порядка: (Т) == Х О (Т). (2-58) Функцию х (t), удовлетворяющую поставленному оrраничению, будем называть допустимой. Считаом, что функция х о (t) также является допустимой. а) х,хо \ '\ " о ' t 6) Х,ХО 1М I ) I J:,o (t , ,.I I , I 1 " ,1 , I \ 11 " 1 I , 1 I , 1 I , 1 I ' I I , /: '\ о I t ' , I Т ......_(/I>! I 1 I I .. '... \, , \ , .. , ", \ \ , \ , , '\ '\ " " 2) Х,ХО \ , \ \ \ Xlt)\\ I I I I / ,. I , 8) х,хо t о I I , , , , т t ........ Рис. 2-14. Рассматриваемая система является неавтономной, но на пее также может быть распространен принцип максимума. Опти:м:аJIЬ- ное ДВИjнение здесь также будет обладать кусочно-постоянной второй производной d 2 x -+А dt 2 - - · (2..59) Интеrрируя, получаем · А А х = Хн -t XHt -1- "2 t 2 = ').., -J-- "2 (t -1l)2, (2-60) 58
. rде Хн, Хн - значения координаты и первой производной в начале рассматриваемоrо интерва:rа; л и - постоянные, очевидным об- разом зависящие от Хн и хн. Движение совершается по параболе, l{оторая при изменениях л и сохраняет форму, но перемещается так, что ее ось остается параллельной оси х. Чтобы построить оптимальный процесс, вырежем два парабо- 1 лических шаблона х == 9 А (2. O.J Задав начальные значения х (О) === О, х' (О) :-=:: Хн, проведем из начала координат прям:ук) ОМ с уI'ловыIM ноэффициентом .. (U) :и раСПОJlОЖИМ первую параболу тан:, чтобы она проходила через начаJIО координат, KaCaJlC\cb бы построенной прямой и ось се была бы параллельной оси х (рис. 2-14, б). Вторую параболу располаrаем так, чтобы она :касалась первой параболы и :кривой хо (t), а вершина ее была направлена в сторону, противоположную той, :куда направлена вершина первой параболы и ось ее также была параллельной оси х. На рис. 2-14, а показан оптимальный процесс при нулевых на- чальных условиях, а на рис. 2-14, б и в - при положительной и отрицательной х' (О). На рис. 2-14, 2 показан случай, коrда при расположении первой параболы вершиной вниз не удается ре- решить задачу (точка :касания парабол получается в левой полу- ПЛОСI{ОСТИ) и шаблоны приходится повернуть на 1800. Различные виды задач с оrраничениями рассмотрены в [189]. 2-5. Пример оптимальном системы с двумя управлениями Рассмотрим показанную на рис. 2-15 схему двойноrо управ- Jlения двиrатеlIем постоянноrо тока Д [20], питаемоrо от электро- l\'lашинноrо усилителя (ЭМУ). Требует- ся за кратчайшее время перевести вал из одноrо уrловоrо состояния в дру- 0--J roe. Одним из управлений является напряжение и у , подводимое к обмотке управления ЭМУ; друrим - напряже- Ние и в обмотки возбуждения двиrате- ля. Оrраничепия наложены на верхние Значения напряжений обеих обмоток и на нижнее значение напряжения и у обмотки возбуждения двиrателя, чтобы предотвратить опасность ero разноса при чрезмерном ослаблении поля возбуждения I И у I и у. мане, Ив. мин и в Ив. мане (2-61) При учете инерционности обмоток возбуждения и поперечной обмотки ЭМУ получается система уравнений четвертоrо порядка, L я R G Q,X2 Рис. 2-15. 57
для которой точное аналитическое решение невозможно. Прибли- женное решение и построение оптимизатора, реализующеrо при- ближенное решение, приведены в [20]. Рассмотрим упрощен- ную задачу, допускающую аналитическое решение: пренебрежеl\1 постоянными времени обмоток управления и поперечной ЭМУ и возбуждения двиrателя. Уравнения системы: dX! J-r. J dQ k" м ) == C:;, ([t== зtяlв -- в; I i (2-62) i y == k 1 и у , i B = k 2 u B ; Е'\ == k 4 i у; E 1 , - cQi B == iлR н . Пренебрежем моментом наrрузки двиrателя МВ и выберем в ка- честве базовых значений и у. мане' и в. мане И заданное перемеще- ние вала Х 1 макс' Обычным способом приведем уравнения к виду dx! dX 2 :? dt- == Х 2 , lii- == - и 2 Х 2 + аи 1 и 2 , (2-63) rде Х 1 - относительное перемещение вала; Х2 - относительное изменение уrловой скорости; и 1 и и2 - относительные значения напряжений управления ЭМУ и возбуждения двиrателя; а - по- стоянная величина. Функция rамильтона н для этой системы имеет вид: Н == 'РI Х 2 -t--'1'2 (аи 1 и 2 - X2и), (2-64) Сопряженные вспомоrательные уравнения: 'I'1 == _ дН == о. ) dt дх! ' (2-65) d\}'2 ан :3 + dt - == -- д Х 2 == 'Ф2 U 'l '1'1 · Для определения максимума функции Н найдем ее частные производные по управлениям. Так как Н линейная функция и 1 , то максимальное значение она может принимать на rраницах интервала -1, 1. Учитывая, что и 2 всеrда положительно, имеем и 1 = sign '1'2. (2-66) Частная производная Н по и 2 В точке экстремума ан -а == '1'2 (аи 1 - 2х 2 и 2 ) == о, (2-67) и2 откуда аи! и 2 =-2 . Х2 (2-68) Чтобы определить, какой из экстремумов определяется выра- жением (2-68), найдем вторую производную Н ПО и 2 д 2 Н дu == - 2'Ф2 Х 2. (2-69) 58
Рассмотрим область, в которой 'Ф2 > О И В соответствии с (2-66) иl == 1. Из (2-69) следует, что при этом в верхней фазовой полуплоскости, rде Х 2 > о, вторая производная Н по и 2 отрица- тельна и, следовательно, (2-68) определяет точку максимума, еслИ и 2 находится в допустимых пределах, т. е. а л<--<1 '- 2Х 2 или а а 2<Х 2 < 2л . (2-70) За этими предела:ми и 2 равно своим краЙНИУI значениям: и 2 == Л, а если x 2 >-v:; и 2 == 1, а если Х 2 < 2. (2-71) (2-72) в нижней полуплоскости Х 2 < О (2-68) определяет точку ми- нимума, поэтому и 2 будет равно тому своему предельному значе- нию, при котором величина 'Ф2 (а и 1 и 2 - Х 2 и) имеет наибольшее значение. Очевидно, что это будет и 2 == 1, если Х 2 < о. Перейдем к области, rде 'Ф2 < о, и 1 === -1. В верхней полу- плоскости вторая производная теперь, как это следует из (2-69), положительна и максимум достиrается при и 2 === 1, в нижней же ПОЛУПЛОСRОСТИ и 2 == Л, а (2-73) если I х 2 1 ;> -2л ; и 2 == 1, а (2-74) если \х 2 1<2:; I 1 I а а а (2-75) и 2 == I 2Х2 ' если 2 1Х21 < 2Х; и 2 == 1, если Х 2 > о. (2-76) Решение вспомоrательных уравнений (2-65) выразим через и2' считая и 2 заданной функцией времени: '1'1 == cons t, t t J lldt[ t - J и}(и J 'Ф2 == е о 'Ф 20 - 'ф 1 О е о d t . u (2-77) Так как величины иптеrралов в (2-77) изменяются при возра- стании t монотонно, то 'Ф2 имеет не более одноrо перехода через Пуль. При rраничпых условиях Х2 (Т) == Х 1 (Т) == О конечной точ- кой будет начало координат. В окрестности начала координат, если Х2 положительно, ТО, чтобы система пришла в начало 59
dX2 б u Э координат, (ft должна ыть отрицательнои. - то означает, что в окрестности начала координат на фазовой траектории, лежащей в верхней полуплоскости, проходящей через начало координат, члена и 1 и 2 должен быть отрицательным, т. е. и 1 == -1. Величина С!2 и1 при этом отрицательна, и в соответствии снеравенством (2-76) Х., и 2 " 1. Уравнение фазовой траектории, лежащей в верхней по- луплоскости и проходящей через начало координат, таким об- разом, определяется из уравнений аХ1 аХ 2 (2 78) dt == Х 2 ; --rit== - Х 2 - сх. - а) L, 6) и/=-1 _________l1.J__ 1 и2 {2 " х, с ' I I , I I I I f L_________j и# r;' и 4 =+1 L 2 Рис. 2-16. Ilолучим ( 1 \ lП\а Х2 - t1 j - х 2 =х 1 . (2-79) rrраектория показана на рис. 2-16, а (линия L 1 ). Симметрично с ней относительно начала координат в четвертом квадранте рас- положена траектория L 2 . Чтобы любая траектория, лежащая вышеL 1 , ни при каких Х2 не ушла в бесконечность, dx 2 /dt должна быть отрицательной, и из (2-63) следует, что при этом и 1 == -1. Аналоrично можно убедиться, что для траектории ниже L 2 ДОJIЖНО аХ2 быть -dt- > о и и 1 == 1. Линия L 1 L 2 , таким образом, есть линия переключения, выше которой и 1 == -1, ниже иl == 1. Линии f 1 === === а/2 и r 2 = а/2л разrраничивают части траекторий АВ, на которых движение совершается по законам, определяемым усло- виями (2-73) (выше r 2 ), (2-75) (между r 1 и r 2 ) и (2-74) (ниже r 1 ). в четвертом квадранте аналоrичную роль иrрают прямые ri == = -а/2 и r 2 == -а,/2л. На рис. 2-16, б показан оптимальный процесс, соответствую- щий траектории Ава на рис. 2-16, а. Так же как и при управле- 60
нИИ двиrателем при постоянном независимом возбуrRдении, и 1 на первом интервале иl == 1 разrоняет двиrатель, на втором и 1 == -1 тормозит ero; и 2 создает дополнительное ускорение процесса. При положительном иl и малой (или отрицательной скорости Х 2 ), lJ2 способствует разrону и потому на первой стадии процесса имеет наибольшее значение. По мере возрастания Х 2 и начинает оказы- нать тормозящее действие, поэто:му в средней стадии, коrда еще процесс разrона не закончился, но скорость Х 2 достаточно велика, [[2 начинает снижаться. На последней стадии, коrда иl == -1, и2 начинает оказывать только тормозящее действие, и так как на этой стадии торможение должно быть наиболее интенсивным, мы прикладываем макси:м:альное значение и 2 == 1. Друrой пример системы оптимальноrо управления с двумя воздействиями рассмотрен в [155].
rЛАВА ТРЕТЬЯ ДИНАМИЧЕСКОЕ проrРАММИРОВАНИЕ 3-1. Постановка задачи. Принцип оптимальности Почти одновременно с опубликованием принципа максимума американским математиком Р. Беллманом был разработан метод динамическоrо проrраммирования. Работы в этом направлении начались с 1949 r., и сначала их результаты помещались в не- публикуемых IПИРОКО отчетах фирмы Рэнд Норпорейшн в Санта Моника. Широкая публикация метода началась с 1953 r. Наиболее полное изложение метода дано в [205]. в этих работах предлаrал- ся общий метод сведения вариационных задач к решению функ- циональных уравнений. Метод был разработан для исследования систем оптимальноrо управления значительно более широкоrо класса, чем системы, описываемые дифференциальными уравне- ниями, и он применим поэтому не только к оптимальным задачаl\tI динамики, но и к весьма широкому Kpyry технических и эконо- мических задач, в которых связи между координатами, управле- ниями и критерии оптимальности MoryT задаваться как в виде уравнений весьма произвольноrо вида, так и в виде эксперимен- тально определенных rрафиков или таблиц численных данных. Первоначально увлечение динамическим проrраммированием бы- ло столь же сильным, как и увлечение принципом максимума. При обосновании метода динамическоrо проrраммирования предполаrается, что функционал, выражающий критерий опти- мальности, является дифференцируемой функцией фазовых ко- ординат. l'ак нак в ряде случаев, решаемых методом динамиче- cKoro проrраммирования, упомянутое условие не выполнялось, это дало основание Л. с. Понтряrину утверждать, что метод ди- намическоrо проrраммирования скорее представляет собою хо- роший эвристический прием, чем математическое решение задачи. После Toro как предположение о дифференцируемости функ- ционала сделано, метод приводит к уравнению в частных произ- водных (уравнение БеЛЛIана). Это вообще усложняет аналити- ческое решение, но основная сила метода заключается в том 62
ЧТО он позволяет избежать аналитическоrо решения и дает весьма прозрачные, хорошо осмысливаемые физически алrоритмы при- ближенноrо решения задачи путем расчленения ее на этапы, вы- числений на каждом этапе локальных участков оптимальных фазовЫХ траекторий без «оrлядки» на rраничные условия и целена- правленноrо перебора локальных вариантов для получения окон- чательноrо решения. Здесь как бы сочетается кусочио-линейная аппроксимация с методом динамическоrо проrраммирования, на иснове чеrо вырабатывается весьма общая процедура численноrо (пределения оптимаJIьноrо управления. Однако в сложных случаях объем вычислительной работы врИ реализации этой процедуры также оказывается зачастую не- 110СИЛЬНЫ:М даже для самых крупных современных вычис.лительных l\tlаШиН. Поэтому продолжаются попытки усовершенствовать вы- числительную процедуру динамическоrо проrраммирования. Инте- ресная попытка была сделана Мерриэмом [249; 250], предложившим аналитическую формулировку закона управления, основываIОЩУЮ- ел на беллмановском принципе оптимальности. Закон также форму- лируется в виде уравнения в частных производных. В случае, коrда критерий оптимальности представляет собою квадратичный функционал относительно управления, а уравнения системы ли- нейны, задача сводится к обыкновенным нелинейным уравнениям типа Риккатти. В друrих случаях уравнения решаются численно, причем удается обойтись меньшим количеством вычислительных операций, чем в процедуре Беллмана. ДрУI'ое усовершенствова- ние в виде метода последовательных вариантов было предложено в [114]. н работе [158] БЫJl11 рассмотрены методы Понтряrина и Белл- мана и выяснена связь между ними. Перейдеl\tl к формальному t13JIожению исходных этапов метода динаl\tlическоrо проrрамми- рования. Пусть математическое описание системы дается системой диф- ференциальных уравнений dx' d/ === ti (Х 1 , ..., Х п , и 1 , ..., и n ), i = 1, 2, ..., п (3-1) или в векторной зап:иси dx (Jt= f (х, u). (3-2) Число управлений т принято равным числу координат п, но это не сужает задачи, так как, если тп < п, '1'0 п - т управле- ний в уравнении полаrаются равными нулю. На координаты и управления MoryT быть наJIожены различ- Ные оrраничения. Пусть, например х и u должны принадлежать 63
к некоторым, определенным образом заданным множествам или областям Х и и. хЕХ, uEU. (3-3) Пусть :критерий оптимальности выражен фун:кционалом J, который может зависеть от координат х, управлений u И, в общем случае, времени t т J == F (х 1 , ..', Х1Р и 1 , ..., и п , t) dt. (3-4) lи ФункционаJJ J Hb[paiKaeT обычно ИJIИ выrоду от управления (полученное количество продукции, приБЫJIЬ, Н. п. д. и Т. д.), ИJIИ же потери (расход энерrии, штрафы и HeycTOiiI\l1, расход ре- сурсов и т. д.). Будем называть ero в первом случае ФУll"fi,цuоналож вьеодЬL, во втором - фуппцuопало'м' потерь. Мы будем рассматривать применение метода к так называе- мым терминальным задачам, rде требуется перевод системы из на- чальноrо состояния х (t o ) в конечное х (Т). В этих задачах изме- нение состояния системы изображается в фазовом пространстве координат трае:кторией с закрепленными концами. Оптимальные управления, доставляющие ЭRстреМУl\1 функцио- налу, и соответствующие им оптимальные процессы будем отме- чать звездочкой ui(t), xi(t). При найденном оптимальном управлении функционал J будет фун:кцией начальных условий и ин- тервала времени управления Т. Ero также будем от:м:ечать звез- дочкой - J * [х (t o ), Т]. ДЛЯ определенности в дальнейшем бу- дем считать, что отыскиваются оптимальные управления, достав- ляющие максиму:м функционалу выrоды. По определеНИIО J* [х (t o ), 1'] == тах J [х (t), н (t), t]. (3-5) нЕИ to t -:::: т Соотношение (3-5) представляет собою функциональное урав- нение, из KOToporo может быть найдено оптимальное управление u * (t). Выберем на промежутке t o , Т некоторую промежуточную точку t h . Ей будет соответствовать точка х * (t,J на оптимальной траек- тории, разделяющая траекторию на две части. Функционал (3-4) также разбивается при это:м на два слаrае:мых: t h т J[x(t o ), Т]== F(x, t1)dt+ F(x, п)dt. (3-6) to t k Принцип оптимальности, СфОРlиулированный Р. Беллмано:м, сводится к следующему: оптимальное управление таково, что ка- ким бы ни было начальное состояние системы и начальное опти- мальное управление (т. е. оптимальное управление, определенное для интервала t o t t,J, всеrда последующее управление u **(t) (на интервале t k t - Т) должно быть также оптимальным от- 64
IIосительно состояния, возникmеrо в результате nepBoro этапа. ;)ТО означает, что значение функционала J * в интервале t o tT на управлениях 11 * (t) и u ** (t) должно быть одинаковым. Если бы это было не так и значение функционала на управлении u ** (t) оказалось бы, например, больше значения функционала на управлении u * (t) и начальном состоянии х * (t k ), то управ- ление u * (t) можно было бы улучшить, заменив ero управлением ( f u* (t), t o t t k V t)= \u**(t}, tktT. Но если 11 * (t) оптимально, то оно не может быть улучшено, поэтому и значения функционалов на управлениях 11 * И U ** в интервале (t k , Т) должны быть одинаковы. Это озна- чает, что и управление u * (t) будет той же функцией, что и 11 ** (t) в интервале t k t Т. На рис. 3-1 показан при- мер траекторий в плоскости двух переменных t и х. Пусть ИЗ состояния х (t o ) в состоя- ние х (Т) ведет лишь одна оп- тимальная траектория АВ 2 С. Расчленим процесс на два этапа: t o - t 1 И t 1 - Т. В на- чале BToporo этапа исследуем движение из нескольких точек - xl, x, хз. Принимая эти точки за начальные, мы из каждой из них сможем на втором шаrе при- вести оптимальную траекторию. Траектории В 1 С, В 2 С, ВзС будут оптимальными для BToporo шаrа, для каждой ив них можно со- ответственно найти и оптимальные управления. Их называют условно-оптимальными, так как они оптимальны лишь для рас- ематриваемоrо отрезка времени и исходных точек. Но оптималь- ной траекторией для обоих marOB будет лишь траектория В 2 С, лвляющаяся частью оптимальной траектории АВ 2 С. Нахожде- ние оптимальноrо управления u * (t) на отрезке времени (t 1 , Т), соответствующеrо отрезку оптимальной траектории В 2 С, можно ВЫполнить с помощью функциопальноrо уравнения J*[x(t 1 ),T]== шах J[x(t 1 ), Т, и). 'U (t) Е и tltT х Х(П -----------r----------- I I 1 __________J I ХЗ с x t:. t х: xft o ) о т t o t[ Рис. 3-1. (3-7) в соответствии с принципом оптимальности выражение (3-7) ДОлжно быть равно второму слаrаемому в уравнении (3-6), по- этому J* [х (t o ), Т] = шах {lF (х, и) dt + J* [х (t 1 ), Т]} и to (3-8) 85
3-2. Уравнение 6еяямана Пусть в примере предыдущеrо параrрафа :конец оптимальной траектории закреплен, т. е. х * (Т) задано. Будем двиrаться, как это обычно делается в динамическом проrраммировании, от кон- ца траектории к началу, причем начало не фиксируется, и момент t o рассматривается как переменная величина. Поэтому начало будет обозначать не х (t o ), а х (t). Момент t 1 , разделяющий траекторию на две части, также будет переменной величиной, которая сколь уrодно близко может приближаться к t, ПОЭТОl\IУ будем вместо t 1 подставлять величину t + t. В соответствии с этим уравнение (3-8) перепишем в следующем виде: { 't + b.t } J* [х (t), Т] == шах F (х, и) dT + J* [х (t + 8t), Т]. (3-9) оЕи t Разложим интеrрал в (3-9) в ряд Тэйлора в окрестности t по степеням 8t J* [х (t), Т] = шах {tF (х, п) dт: + I d (t At) t t>.t F (х, п) dт:1 t + иЕи t t aJ* aJ* } + 81 + J* [х (t), Т] + i':-l aXi AX i + а (t + М) At + 82 · (3-10) Здесь 81 И 82, содержащие члены ряда с производными выше BToporo порядка, являются малыми высшеrо порядка по сравне- нию с t. t Слаrаемое F (х, и) dt, полученное в результате замены те- t кущеrо значения t + t значением, в о:крестности KOToporo IIpO- И8ВОДИТСЯ разложение в ряд, очевидно, равно нулю. При фиксированном t производная от опредеJIенноrо интеrрала в :квадратных с:коб:ках равна ПРОИ8ВОДНОЙ по dt и, в соответствии с теоремой о дифференцировании интеrрала по параметру , от KOToporo зависит верхний предел, равна подынтеrральной ФУНК- цИИ F [х (t + Ilt), u (t + L\t)]. Так как величина J * [х (t), Т], стоящая в фиrурных с:коб- ках, не зависит от и, ее можно вынести из под 8нака шах и со:кра- u тить с тождественным выражением левой части уравнения. Ра8- делив после этоrо все члены уравнения на L\t и устремив L\t к ну- лю, мы получим, учитывая, что 81 И 82 малые высших порядков в сравнении с L\t { ! n aJ* дх'/, aJ* } тах F[x (t), u (t)] + -д. di- + дt =0. u Е и . :1:1 1=1 (3-10) 66
F:слИ рассматривать это уравнение совместно с исходной системой дх' уравнений объекта (3-1), то мы получаем, заменяя dt 1 их выра- жениями из (3-1), { ! n 'aJ* aJ* } шах F[x(t), u(t)]-l- т-:-fi[х(t), u(t)]+a-t =0.' (3-11) u Е и . X t=1 Уравнение (3-11), называемое уравнением Беллмана, пред- ставляет собой специфическое уравнение в частных производных, решая которое, мы в конечном итоrе находим u * (t) и х * (t). Обычно непосредственное точное решение уравнений Беллма- на связано с серьезными затруднениями и для решения задачи применяют численные методы. Но в некоторых простейmих зада- чах удается непосредственно решить уравнение Беллмана. В качестве одноrо из примеров приведем задачу, рассмотрен- ную А. М. Летовым [104]. Даны линейные дифференциальные уравнения объекта: dx. d/ = b i1 X 1 + b i2 x 2 + · · · + binx n + тiu, Требуется найти уравнения реrул:ятора, который за бесконеч- ное время осуществляет перевод системы из ВО8мущенноrо состоя- ния в заданное, минимизируя при этом фУНRционал 00 n I=Vdt, v= akxl+aou2, о k==1 rде a k и а о - заданные положительные весовые коэффициенты. Уравнения динамическоrо проrраммирования (3-11) примут вид: max{v + (bi1X] + . . . + binx n + тi U ) J } = о. и Е и . X 1.=1 (3-12) Чтобы найти и, доставляющее функционалу минимум, прирав- пиваем нулю произвоДную по и от левой части (3-12): n n дУ afi aJ* aJ* ди + -ди дач = 2а о и + тi aXi =0. i=1 i=1 (3-13) Исключив из (3-12) и (3-13) и, ПОJIучаем n n ( n )2 aJ. 1 aJ* ! akx + ! (bilx 1 + · · · + binx n ) aZ i = 4ао ! тi aZ i .' (3-14) k-l i==1 i-1 87
Решение этоrо нелинейноrо уравнения ищется в виде квадратич- ной формы J* = ,,-, "" А. .ж.х.. .L..J.L..J J 1 J i j (3-15) Коэффициенты A ij определяются сравнением коэффициентов после подстановки (3-15) в (3-14). В результате параметр u находит- ся в виде и ===k 1 x 1 + k 2 X 2 + ... -t knx n . Весьма интересно, что в этом случае бесконечноrо времени реrулирования функция J * оказывается функцией Ляпунова, а функция V - ее полной производной, причем dJ* (ft =- V, т. е. в результате синтеза получается устойчивая система. Пусть критерий оптимальности задан в виде функционала потерь t+T J= {л(а)fх[Х(а)-х(а)]+lu[U(а)-u(а)]}dа, t rде и (о) и Х (о) - желаемые векторы управления и состояния; функции f x и f u обладают свойством f x (О) == f u (О) == О и явля- ются cTporo воrнутыми; л (а) - неотрицательная функция веса, учитывающая ценность критерия в различные моменты. Обычно по проmествии большоrо времени практическое значение функ- ций выrод и потерь падает. Уравнение Беллмана (3-11) принимает вид (так как J * - потери, их надо минимизировать): min {л (t) Ix [Х (t) - х (t)] + lu [U (t) - u (t)] + u Е и + V dXi aJ* [х (t), t J + aJ* [х (t), t J } = о. '- dt aXi at i=1 Рассмотрим простейmую систему nepBoro порядка dx 1 dt + То х=аи. Функции f x и tu задаются в виде: Ix (v) = lи (и) = и 2 .. 68
Уравнение Беллмана принимает вид: rnin {л (t) [Х (t) - х (t)]2 + [и (t) - и (t)]2 + иЕи + JJ* [t), t] + [аи (t) _ о Х (t) yJ* [;t), t] } = О. (3-16) Сначала рассмотрим случай отсутствия оrраничений, налаrа- еМЫХ на и (t). Продифференцируем (3-16) по и и приравняем производную нулю: _ 2 [и (t) - и (t)] + а dJ* [;t). t] = О. Отсюда находится оптимальное управление и* (t) = U (t) _ ; JJ* [;t). t] . Оптимальное управление выражено через неизвестные еще производные J *. Подставив и * в (3-16), получим дифференци- альное уравнение в частных производных: л (t) [Х (t) -х (t)]2 + JJ* [?). t] + { JJ* [;t), t] } 2 + + [аи (t) - а; JJ* [;t), t] _ о Х (t)] JJ* [t). t] = О. (3-17) Так как наивысшая степень х (t) в этом уравнении равна двум, то оrраничимся при разложении функции J * [х (t), t] в ряд по х также второй степенью и положим J* [х (t), t] = Ко (е) + К 1 (t) Х (t) + К 2 (t) [х (t)]2, (3-18) rде Ко, К 1 , К 2 - некоторые, пока неизвестные функции t. Так как JJ* [::t), t] = K (t) + к; (t) х (t) + к; (t) [х (t)]2; ) JJ* [;п, t] = К 1 (t) + 2К 2 (t) х (t), (3-19) то подставив (3-18) и (3-19) в (3-17) и сrруппировав слаrаемые по степеням х (е), получим {Чt)[Х(t)]2+Ко(t)- [K 1 (t)]2+ a U (t)K 1 (t)}+ + {-2л(t)Х (t) + K;(t) - 2 K 1 (t)K 2 (t) + 2U(t)K 2 (t) - o К 1 (t)}x (t) + +{л(t)+К;(t)-а2[К2(t)]2_; к 2 (о} [X(t)]2=O. (3-20) Так как уравнение (3-20) должно быть справедливым для лю- бых х (t), приравниваем порознь нулю каждую из фиrурных 69
скобок и получаем три обыкновенных дифференциальных урав- нения для определения функций Ко, К 1 И К 2 при rраничных ус- ЛОВИЯХ, вытекающих из равенства: 1*[x(t+T), t+T]==O, так как при этом верхний и нижний пределы интеrрала, выра- жающеrо J *, становятся одинаковыми. Отсюда нетрудно полу- чить, что Ко (t + Т) == К 1 (t + Т) == К 2 (t + Т) == о. Так как эти rраничные условия являются конечными, а'не начальными, то уравнения удобно решать «ходом назад». Даже для столь элементарноrо примера аналитическое реше- ние уравнений оказалось в U(t) r Е K f uЖ(t) В -аК х x(t) конечной форме неосуществимым. Этим иллюстрируется прак- тическая нецелесообразность решения задач динамическо- ro проrраммирования пря- мым аналитическим методом. Решение практически всеrда выполняется численным ме- тодом, путем расчленения процесса на ряд этапов, и динамическое проrраммиро- вание дает для TaKoro реше- ния алrоритм, технический смысл KOToporo обычно весь- ма ясен и наrляден. Это внимание к методу динамическоrо а 2 НЗ а -x(t) -1 K , (t) K 2 (t) Рис. 3-2. обстоятельство и привлекло проrраммирования. Ниже рассмотрим пример численноrо поэтапноrо решения за- дачи методом динамическоrо проrраммирования. Здесь же от- метим, что с помощью уравнения и* (t)::;:: [и (t) - - К 1 (t)] - аК 2 (t) х* (t) (3-21) можно получить структурную схему моделирующей установки, выполняющей решение задачи оптимизации (рис. 3-2). На этой схеме В - объект реrулирования; МВ - множительное звено, функции Ко, К 1 И К 2 получаются извне, от вычислительных устройств, решающи"\ уравнения, полученные путем прирав- нивания нулю фиrурных скобок в выражении (3-20). Извне по- дается и желаемая функция и (t). Если и (t) оrраничено, U 1 (t) и (t) и 2 (t), (3-22) 70
'1'0 решение принимает вид [104]: I U 1 (l), uO(t)?;:;Ul(t) и* (t) == и о (t), и 1 (t) и о (t) и 2 (t) U 2 (t), и о (t) и 2 (t), и о (t) == U - О,5аК 1 (t) - аК 2 (t) х (t). (3-23) rде (3-24) При этом, если и 1 и о и 2 , функции Ко, К 1 , К 2 по-преж- нему определяются из (3-20), если же и о выходит за допускаемые неравенством (3-22) пределы, то К находятся из уравнений K (t) == - аи т (t) К 1 (t)- U (t) - U т (t) -л(t) [Х (t)]2; K (t) = ;; К 1 (t) - 2аи т и)К 2 (t) + 2л. (t) Х (t); (3-25) K (t) = ;' К 2 (t) - Л(t), о которые получены из уравнений (3-16) подстановкой в них вме- сто u (t) значения u (t) == U т' а J * - из (3-18). U т берется рав- ным и 1 или и 2 В соответствии с (3-23). Решение задачи для уравнения п-то порядка рассмотрено в [104, 236, 249, 250]. 3-3. Пример решения одномерноМ задачи чиспенным методом Проследим путь численноrо динамическоrо проrраммировС1НИЯ на следующем эле:ментарном примере. Объект описывается урав- нением dx ([t==j(x, и)==и-О,6х. (3-26) Требуется найти оптимальное управление u * (t), при котором объект переходит из состояния х (О) == О в состояние х (Т) = 10 за время Т == 1, причем функционал т т J = (х 2 + k 2 u 2 ) dt == [х 2 -1-- (1 ,25u )2] dt (3-27) о о Принимает минимальное значение. Разбиваем Т и XN = Х (Т) - х (О) на интервалы. Так как надо лишь проиллюстрировать методику, то мы используем весь- Ма rрубую разбивку, расчленив Т на пять интервалов. Проведем Изохроны через точки: t o == О; t 1 === 0,2; t 2 = 0,4; t з = 0,6; t 4 = 0,8; t s = т == 1,0. На каждом из t i величина x i может принимать также множе- Ство значений, среди которых следует искать оптимальные. При численном решении считаем, что x i принимает также толь- 1\0 дискретные значения. Для упрощения разбиваем XN лишь на 71
четыре равных интервала, тем самым считаем, что x i может при- нимать одно из следующих значений: X == О; х1 == 2,5; X == 5,0; Х: = 7 ,5; x = XN = 10. Дифференциальные уравнения заменяем разностными: I1x k == X k + 1 - X k == t (x k , U k ) I1t k ; } (3-28) I1J k == F (x k , U k ) I1t k . в рассматриваемом случае tk == 0,2; } (3-29) I1x k = (u k - 0,6x k ) tk; J k == (x + 1,5625и) I1t k == [х, + 1,5625 (x k + 0,6X k )2] tk [Xk + 1,5625 ( ;: + O,6x k YJ L1t k " (3-30) Нанесем точки, соответствующие разным x i и t i , на rрафик (это будут узлы прямоуrольной сетки) и построим в этих точках окружности (рис. 3-3), в которых будем вписывать значения при- ращения функционала J при перемещении из этой точки к сле- дующей по приближенной условно-оптимальной траектории, ко- торую будем считать прямолинейной. В выражении (3-30) производная х заменена отношением при- ращений I1x/ t. Эта замена дает существенный источник поrреш- ности, уменьшить которую можно, увеличив число интервалов. В нашей задаче все tk приняты одинаковыми. Это существен- но упрощает расчет, так как на каждом этапе, независимо от ето номера, для одинаковых значений Х и x будем иметь те же зна- чения dJ. Рассчитаем ряд приращений dJ для различных зна- чений х и д.х. При этом заметим, что область, в которой следует производить вычисления, может быть значительно сужена. Прежде всето на всех перемещениях по вертикали t = О, д.х *- О, и это обстоятельство сразу исключает вертикальные пе- ремещения, которые, очевидно, не мотут принадлежать оптималь- ным траекториям, так как dJ обращается на них в бесконечность. В данном случае, основываясь на априорном опыте решения сходных оптимальных задач, можно сделать и друтое сужение об- ласти, исключив из рассмотрения отрезки, идущие сверху вниз, так как есть все основания считать, что в данном случае процесс будет монотонно возрастающим. Однако это предположение яв- ляется эвристическим и в более сложных задачах может оказаться неправильным. В тех случаях, котда такото предположения сделать нельзя, весьма полезными для сужения области вычислений оказываются оrраничения, налаrаемые на величину координаты Х. ЭТО вытодно отличает метод динамическоrо проrраммирования от друrих ме- тодов, тде подобные оrраничения обычно усложняют решение. 72
Решение задачи в методе динамическоrо проrраммирования можно начинать от одной из заданных точек - начальной или J{опечной. Начнем, как это чаще Bcero делается, с последпеrо этапа: найдем приближенные условно-оптимальные траектории, ведущие в конечную точку х1. Так как вертикальные перемещения JIСI\лючаются, то нам достаточно рассмотреть лишь те траектории, которые выходят из узловых точек предыдущеrо этапа xt, лежа- щих не выше точки х1. При этом траектории, состоящие из двух отрезков - rоризонтальноrо и вертикальноrо (например, траек- тория Х2 - Х2 - x), - исключаются по той же самой причине, х 10 хl 7.5 x 2,5 о 0.2 0.4 0.6 0.8 1.0 сек Рис. 3-3. и остается лишь рассмотреть прямолинейные траектории, исхо- дящие из точек хо, х1, x, хА, Х4 (рис. 3-3). Величины приращений J (xj) для этих траекторий, вычислен- ные по формуле (3-30), сведены в табл. 3-1. В этой таблице к вы- числению приращений на последнем этапе относятся строки 1, 3, 6, 10 и 15. Величины J надписаны над отрезками (рис. 3-3), они же вписаны в кружках, из которых эти траектории исходят. Мы видим, что в нижележащих кружках эти цифры больше, чем в вышележащих. Однако нельзя делать вывод, что отрезком окон- чательной оптимальной траектории будет обязательно верхний rоризонтальный отрезок, хотя на нем J и имеет минимальное :значение, так как оптимальная траектория, включающая этот Отрезок, может и не пройти через начальную точку. Поэтому пока Оставляем все найденные отрезки как возможные отрезки дей- СТВительной оптимальной траектории. 73
Переходим :к следующему mary - предпоследнему (четвер- тому) этапу, на котором траектории исходят из хз и входят в точ- ки Xk (рис. 3-3). При этом исключаем верти:кальные отрезки и от- рез:ки, имеющие отрицательный наклон. Расчет ведем так: tJ.J* (хо = min {(x)2 + 1,5625 ( : + 0,6x t Y + tJ.J* (х: + дх)}. (3-31) Уравнение (3-31) соответствует уравнению (3-9); только в со- ответствии с требованиями задачи вместо максимума ищется ми- нимум и вместо абсолютноrо значения J * - ero приращение. В цифрах расчет ведем по та:кой схеме: !1! (хl) ==!1! (xt) == 31,2 + 31,2 == 62,4; 3 . (17,6+ 101,5} . д] (х з ) = mш \101,5 + 31,2 = 119,1, 1 7,8 + 250 ) ! (х;) = min 80,2 + 101,5 == 181,7; 250 + 31,2 2,0 + 476,9 62,4 + 250 д! (хН = min 220,7+ 101,5 = 312,4: 476,9+31,2 ( О + 782 ) 48,8 +476,91 J(x)=min195+250 }=445. 1440 + 101,5 J t782 + 31,2 Поясним эту схему. !1! (х!) - эта цифра, которая должна быть вписана в :кружок, соответствующий точке Х4 (верхний в столбце 3). Она равна сумме приращения д.! на rоризоитальном отрез:ке верхней (четвертой) строки и цифры Toro кружка столбца 3, в :который этот отрезок входит. На всех этих отревках I1J, :как это видно из первой стро:ки табл. 3-1, равно 31,2, поэтому dJ (х!) = 31,2 + 31,2 .I1J (x) - цифра, :которая должна быть вписана в кружок, соответствующий точ:ке x. Ив этой точ:ки МО- ryT исходить, в соответствии с оrраничениями данной задачи, две трае:ктории: одна - в точ:ку хА с приращением J, р'авным 17,6, входящим в кружок с цифрой 101,5, и вторая - в точку х! (па рис. 3-3 по:казана штриховой линией) с приращением dJ = 101,5, входящая в :кружок с цифрой 31,2. Суммы f 7;6 + + 101,5 и 101,5 + 31,2, дающие результирующее приращени-е J при переходе ив точ:ки хА в :конечную точку x, показаны в фиrур- 74
Таблuца з-1 - а= Ь= х 2 Ахл, Ax'fi, с= d= е= AJ= N X'fi, = O,6x'fi, 02 2 'fi, =м =а+Ь = 1,562502 =Х п +d =О,2е ) 1 10 100 О О 6 6 36 56,25 156,25 31,2 2 7,5 56,25 О О 4,5 4,5 20,25 31,6 87,85 17,6 3 7,5 56,25 2,5 12,5 4,5 17 289 451 507,25 101,5 4 5 25 О О 3 3 9 14,06 39,06 7,8 5 5 25 2,5 12,5 3 15,5 240,25 376 401 80,2 6 5 25 5,0 25 3 28 784 1225 1250 250 7 2,5 6,25 О О 1,5 1,5 2,25 3,52 9,78 2 8 2,5 6,25 2,5 12,5 1,5 14 196 306 312,25 62,4 9 2,5 6,25 5,0 25 1,5 26,5 702,3 1097 1103,3 220,7 10 2,5 6,25 7,5 37,5 1,5 39 1521 2378 2384,5 476,9 11 О О О О О О О О О О 12 О О 2,5 12,5 О 12,5 156,25 244 244 18,8 13 О О 5 25 О 25 285 975 975 195 14 О О 7,5 37,5 О 37,5 1410 2200 2200 440 15 О О 10 50 О 50 2500 3910 3910 782 ных скобках. Из них выбрана меньшая 119,1, и соответствующая ей траектория на рис. 3-3 показана тонкой сплошной линией. Так же подсчитаны и остальные приращения, но для остальных точен не условно-оптимальные траектории уже не нанесены на рисунке. Цифры, соответсвующие оптимальным траекториям, в фиrурных скобках выделены. Приведем вычисления для последующих marOB. Третий этап: 11/ (x) == 31,2 + 62,4 == 93,6; " . {17,6 + 119,1' !1J (Хэ) = mш 101,5 + 62,4 J = 136,7; 1 7,8 + 181,7 j 11/ (x)=min 80,2+ 119,1 == 189,5; 250+ 62,4 2,0 + 312,4 62,4+ 181,7 !1J (ХП = min 220,7+ 119,1 = 244,1; 476,9 + 62,4 (0+445 ) \48,8 + 312,41 t1] (xg) = min 195 + 181,7 } = 361,2. 1440 + 119, 1 1, 1782 + 62,4 ) 75
Второй этап: 11/ (xl) = 31,2. 4 = 124,8; { 17,6 + 136,7} /1J (хН = min 101,5 + 93,6 = 154,3; ( 7,8 + 189,51 J (х4) := min 80,2 + 136,7 == 197,3; 250 + 93,6 2,0+244,1 62,4 + 189,5 /1J (x) = min 220,7+ 136,7 = 246,1; 476,9 + 93,6 (0+361 3 ) 148,8+ 44,11 /1! (x) = min 195 + 189,5 1= 292, 9 29:1 1440 + 136, 7 j t782 + 93,6 Остается начальный этап. Так как на этом этапе оптимальная траектория должна исходить из начальной точки х8, мы и здесь сужаем область вычислений, оrраничиваясь расчетами только для этой точки: f 0+292,9 ) (48,8) + (246,2)1 д] (x) == min 195 + 197,3 } == 292, 9 293 I 440 + 154,3 \ t 782 + 124,8 ) Заметим, что суммы цифр, стоящие в первой (292,2) и второй (295) строках, отличаются ЛИIПЬ на 0,7 %, что соизмеримо с поrреmностью расчета, поэтому оба варианта практически равно- вероятны и оба нанесены на rрафик (второй - двойной линией). Теперь, идя от начальной точки по отрезкам условно-оптималь- ных траекторий, т. е. по линиям, отмеченным стрелками, нахо- дим приближенную оптимальную траекторию в виде ломаной ли- нии, показанной на рис. 3-3 жирной линией. Оптимальное управ- ление находится с помощью уравнения (3-13): дХi U i + 1 =O,6X i + дt . 76
Плавной прерывистой линией на рис. 3-3 нанесена точная оптимальная траектория * (t) == 811 тt = 10 811 t Х Х N 8h тТ вЬ 1 · в рассмотренном примере мы шли «обратным ходом»: от последнеrо этапа :к первому, как это чаще всето и делается. Заметим, что этот путь не обяза- телен, и вся процедура динамическоrо проrраммирования может идти и «прямым ходом»: от начальноrо этапа R конечному, тан как в силу прин- ципа оптимальности начальной отреЗОR оптимальной траеRТОрИJl также ЯВ- ляется условно-оптимальной траеRторией. х 10 7.5 О 51)0 О О 2.5 О О t О 0,2 0,4 0,6 O8 1)0 сек Рис. 3-4. Проиллюстрируем решение Toro же примера прямым ходом. Проведем rраницу nepBoro этапа дt == 2,5 и выберем на этой rранице те же ДИСRретные точки хА, х}, x, хА, xl. Переберем на этом этапе пути, веду- щие в эти ТОЧRИ, И определим на них приращения дJ (хр. По той же причине, что и раньше, верТИRальные отреЗRИ из рассмотрения ИСRлючаются, поэтому условно-оптимальными приближенными траеRТОрИЯМИ на этом этапе будут прямо линейные лучи, проведенные из ТОЧRИ х (О) в намеченные ДИСRретные точки. Из табл. 3-1 находим /).J (x) == О; дJ (xl) == 48)8; /).J (x) === 195; ЛJ (хо == 440; /).J (х1) == 782. Эти цифры проставлены в кружках 1 этапа на рис. 3-4. 77
Перебирая пути, ведущие из диснретных точен 11 этапа в дискретные тоtIКИ 1 этапа, TaR же как это делалось и при обратном ходе, получим: () . {2,0 + 48,8} /),J(xi) == mln 48,8 + О == 48,8; J 7,8 + 195 } ] (x) == min) 62,4 + 48,8 = 111,2; l 195 + О ! 17,6 + 440 ) 2 . 80,2 + 195 r: . L\J (Ха) -:=: ffiln 220,7 + 48,8 = 269,, 440+0 31,2 + 782 101,5 + 440 L\J (xl) == min 250 + 195 == 445. 476,9 + 48,8 782 + О На третьем этапе: { 2,0 + 48,8} J (х'::) == min == 48 8. 1 48,8+0 ' , { 7,8 + 111,2 } J (x) = min 62,4 + 48,8 == 111,2; 195 + О ! 17,6 + 269,5 ) . 80,2 + 111,2 J (хп == mln 220,8 + 48,8 == 191,4; 440+0 31,2 + 445 101,5 + 269,5 !J.J (хП == min 250 + 11 t,2 == 361,2. 476,9 + 48,8 782 + О Так как для всех /).J (x i ) == 48,8 данные повторяются, на четвертом этапе 1 по втором, третьем и четвертом снизу кружках сразу проставляем цифры 48,8, 111,3 и 191,5. Остается вычислить лишь j 31,2 + 361,2 101,5 + 191,4 AJ (xt) == min t 250 + 111,2 476,9 + 48,8 782 + О == 292,9. Дальнейшие построения очевидны. Решение пришло к тому же резуль- тату, как и при обратном ходе. Заметим, что при построении «прямым» ходом, даже если оптимальное решение на самом деле единственно, мы получали по нескольку оптимальных условно траеиторий, выходящих из одной точки (точно таиже, каи при решении «обратным ходом» несколько траекторий вхо- дило в одну точку). Это лишь Rажущеесл противоречие с теоремой об един- 78
Сl'венности решений, которое объясняется тем, что при квантовании Х мы объединяем как бы множество точек в одну. На самом деле «прямой ход» определяет пучок оптимальных траекторий, llСХОДЯЩИХ из начала ХО (рис. 3-5, б), а «обратный» - исходящих из конца XN (рис. 3-5, а). Отсюда видно, что задача о нахождении траекторий с за- J{репленным концом и свободным началом удобнее решать обратным ходом, а с закрепленным началом и свободным концом - прямым. Заметим также, что в данном примере мы вычисляли приращения A.J ври переходе от точки к точне по приближенному разностному уравнению. J-Io значения А.! MoryT быть заданы экспериментально и надписаны над соот- ветстВУЮЩИМИ отрезками. После этоrо методика определения оптимальной траектории ничем не будет отличаться от рассмотренной. а) XN 6) Ха Рис. 3-5. Теперь получим точное решение. Рассмотрим уравнение dx dt =и - ах (3-32) и фУНRционал т J* == min (х 2 +- k 2 u 2 ) dt. и о (3-33) Тан нак явной зависимости J * от времени нет, уравнение Беллмапа записываем в виде Шln {х 2 + k 2 u 2 + (и -- ах) д*} = х* 2 + k 2 u* 2 + (и* - ах*) а:С* = о. Это функциональное уравнение равносильно следующим двум: aJ.f: ) х 2 + k 2 u 2 + (и -- ах) дх = О; aJ* 2k 2 u + дх == о. (3-34) Второе из уравнений получено путем дифференцирования пер- Boro по и и приравнивания производной нулю. Переменные х и и должны отмечаться здесь и далее звездочками, но для упро- щения записи зрездочку опускаем, 79
dJ* Исключая dx из уравнений (3-34), получаем х 2 - k 2 u 2 + 2ak 2 ux = о. Продифференцируем (3-35) по времени 2х dx _ 2k2u du + 2ak2u dx + 2ak2x du == О dt dt dt dt (3-35) и выразим и' через х', учитывая (3-32): du _ak 2 u+xdx _ k 2 + -- --а и х. dt и - ах dt (3-36) Уравнение (3-36) и исходное уравнение (3-32) обраЗУIОТ си- стему, из которой находятся оптимальные решения и * (t) и х * (t). Нетрудно убедиться, что эта система совпадает с систе- мой уравнений Эйлера - Лаrранжа, полученных обычным мето- дом вариационноrо исчисления. Решая эту систему при rранич- т ном условии х dt == XN, получим о * ) _ sh тt Х (t -XN вЬтТ ' * (t) _ т ch тt + а sh mt и -XN shтT -, rде т==i- V1 +k 2 a 2 . k в нашем случае а === 0,6; k === 1,25; т = 1; Т == 1; XN == 10 и мы имееrvl х* (t) == 8,509 sh t; } и * (t) = 8,509 (сЫ + 0,6 sh t). (3-37) По формулам (3-37) и построена точная Rривая на рис. 3-3 прерывистой линией. 3-4. О численном решении уравнении динамичееиоrо проrраммирования Если задано уравнение dx dt == f (х, u) и функционал т J==F(x, u)dt, о 80
rде х, u - векторы; то функциональное уравнение для поэтап- Horo решения принимает вид: Jf = mn [F (х, u) + f (х, u) аа:* ]. Для yBepeHHoro использования приближенноrо метода, ос- HoBaHHoro на замене дифференциальных уравнений разностными, нужно установить, что поставленная вариационная задача экви- валентна решению нелинейноrо уравнения, построенноrо на ос- нове уравнения Беллмана, и затем показать, что метод конечных разностей даст приближенное решение рассматриваемоrо диффе- ренциальноrо уравнения. Оба эти доказательства оказываются несколько затруднительными, особенно при наличии оrраничений. Веллман предлаrает следующий численный метод, позволяющий обойти эти доказательства. Заменим первоначальную задачу за- Jачей об определении минимума (максимума) функции: N F ({U k }) == i1 F (X k , U k ), R=O I'де N - число интервалов, на которые разбивается промежутоК (О, Т); i1 == T/N. Минимум отыскивается по всем значениям U k ' удовлетворяю- щим условиям Полаrая X k + 1 == X k + ! (X k , u k ), Х О == Х (О), X k == Х (k), U k == U (k). Jiv (Х о ) == min J ({U k }), rде заменяем задачу минимизации рекурентными соотношениями: Jd (Х о ) == О; JN+l(X O )==min{i1F(x, u)+JN[xo+f(x, и)]}. (3-31) u По существу, в рассмотренном примере численная процедура реализовала вычисление по этим соотношениям для простейшеrо случая. При высоком порядке уравнений приходится запоминать столь большое число значений координат на каждом этапе, что еамые крупные современные вычислительные машины перестают справляться с задачей. Был предпринят ряд попыток упрощения процедуры. Одна из них, предложенная Мерриэмом, была рассмотрена в 3-2. В тех случаях, коrда критерий оптимальности выражается квадратич- Ными функционалами, а сами уравнения линейны, задача сво- дилась к обычным нелинейным уравнениям типа Риккатти, ко- торые рекомендовалось решать с помощью аналоrовых моделей.
rЛАВА ЧЕТВЕРТАЯ ПРИМЕНЕНИЕ МЕТОДОВ ФУНКЦИОНАльноrо АНАЛИЗА В ЗАДАЧАХ ОПТИМАльноrо УПРАВЛЕНИЯ 4-1. Общие сведения о множествах и функциональных пространствах Начиная с 1957-1960 rr., для решения задач оптимальноrо управления начинают применяться методыI функциональноrо анализа [94, 80, 242J. ЭТО было связано с попытками создания общих методов исследования систем упра- вления, применяемых для решения разнообразных задач. Аппарат Функцио- нальноrо анализа оказался в этом смысле наиболее подходящим. Хотя опыт использования HOBoro подхода к решению оптимальных задач еще недостаточен для окончательноrо суждения об области рациональноrо применения методов функциональноrо анализа в технике управления, все же полученные результаты представляются интересными и перспективными. В данную rлаву для облеrчения чтения введен справочный материал без доказательств и развернутых пояснений, не исключающий необходимости проработки ero по одному из специальных курсов [35, 109J. Необходимый ми- нимум сведений изложен в [242]. Функциональный анализ изучает свойства операторов и функционалов в абстрактных мноrомерных или бесконечномерных пространствах, элемен- тами «<точками») которых являются функции, числовые последовательности или же объекты более общей природы, а также операции над этими элемен- тами. Идеи и методы функциональноrо анализа дают возможность широких обобщений и установления связей между различными разделами математики, ранее казавшимися разобщенными. М н о ж е с т в о состоит из э л е м е н т о в, обладающих некоторым заданным свойством. Может случиться, что множество не содержит ни одноrо элемента, обладающеrо заданным свойством, тоrда оно называется н у с - т ы м по отношению к этому свойству. Понятие «пустое множество» можно рассматривать как обобщение понятия «нуль» на совокупности элементов лю- бой (не обязательно числовой) природы. Принадлежность элемента х к мно- жеству Х обозначается знаком внлючения Е. Если каждый элемент множе- ства А входит также и в множество В, то множество А или является частью множества В (что обозначается символом А с В или В А) и называется ero n о Д м н о ж е с т в о м, или же совпадает с ним, что обозначается зна- ком равенства А == В. Если А с В и В с с, то, очевидно, А с с. Элемен- тами множества MoryT быть не только числа, но самые разнообразные объекты: функции, операторы, матрицы и просто предметы, поэтому математические действия над КОНRретными множествами требуют определения [5]. С у м м о й м н о ж е с т в А 1 , А 2 , ..., А n называется множество В, каждый элемент KOToporo содержится хотя бы в одном из множеств А i и кот 0- 82
рое содержит все элементы этих МНожеств. Сумма обозначается СИМnОлоМ n U Ai==B. i=1 Сумма подчиняется переместительному и сочетательному законам: А U В == В U А; } А U (В U С) == (А U В) U С. (4-1) (4-2 ) Аналоrичными свойствами обладает и арифметическая сумма. Но если В есть подмножество множества А, то А U В == А, если В С А . (4-3) Свойство суммы (4-3) не имеет аналоrии в арифметической сумме. Пер е с е ч е н и е м (и л и про и з в е Д е н и е М) множеств А 1 , 42' ..., А n называется множество В, элементами KOToporo являются все эле- менты, общие для всех множеств A i . IIa рис. 4-1, а пересечение множеств .А 1 , А 2 , Аз заштриховано. На рис. 4-1, б пересечение множеств А 1 и А 2 есть пустое множество. Произведение множеств обозначается символом n n А 2 =В. 1=1 (4-4) ФQ Q Рис. 4-1. а)ОО С=Ф С==Ф Рис. 4-2. Раз н о с т ь ю м н о ж е с т в А и В называется множество С, состав- ленное из всех тех элементов множества А, которые не содержатся в мно- жестве В. Разность обозначается символом : С == А "",,- В. (4-5) MorYT быть следующие четыре случая разности (рис. 4-2): 1) множества А и В не содержат общих элементов (рис. 4-2, а). В этом случае С есть пустое множество, обозначаемое Ф С == А B == ф; (4.6) 2) А и В содержат общую часть (рис. 4-2, б). Разность на рисунке заштри- Хована. 3) А есть подномножество множества В (А с В). А в этом случае не со- держит элементов, которых нет в В, и разность А В есть также пустое МНОiиество (рис. 4-2, в). 4) В есть подмножество множества А (В с А) (рис. 4-2, 2). В этом случае разность А "'" В называется Д о п о л н е н и е м множества В и обозна- чается символом В-1 В l==A""",B, если ВсА. (4-7) Чтобы сделать возможным сравнение элементов множества и распростра- 83
пение на них друrих математических действий, в множествах может быть в ряде случаев установлено п р а в и л о с л е Д о в а н и я для всех, или для некоторых пар ero элементов. Если в соответствии с таким правилом, например, установлено, что элемент а предшествует элементу Ь, то этот поря- док следования обозначается неравенством а < Ь. Если, кроме Toro, для некоторой rрynпы элементов множества установлено, что для каrКДОЙ этой rруппы а, Ь, с соблюдаются условия: 1) из а < Ь и Ь < с следует а < с; 2) а <t а (элемент не предшествует сам себе); 3) из а < Ь и Ь < а следует а == Ь, то множество называется ч а с т и ч н о у II О Р Я Д О Ч е н н ы м, а элементы, для которых MoryT быть установлены соотношения следования, называются с р а в н и м ы м и. Если для любых двух элементов множества а и Ь либо а < Ь, либо Ь < а, то множество называется у пор я Д о ч е н н ы м. Пусть, например, рассматривая числовые множества, устанавливаем такой порядок следования: меньшее по величине число предшествует боль- шему. Тоrда множество всех вещественных чисел будет упорядоченным. Множество же комплексных чисел, если считать, что а + ib < с + id тоrда, коrда а < с и Ь < d, будет частично упорядоченным, так как порядок следо- вания, например, для 1 + 2i и 2 + i не установлен. Подмножество У частично упорядоченноrо множества о r р а н и ч е н о с в е р х у, если существует элемент Ь такой, что У < Ь для всех У Е У. Эле- мент Ь называется в е р х н е й r р а н и Ц е й м н о ж е с т в а У. Наи- меньшая из всех верхних rраниц Ув, принадлежащая подмножеству, назы- вается ero т о ч н о й в е р х н е й r р а н и Ц е й и л и п о с л е Д н и м (м а к с и м а л ь н ы м) э л е м е н т о м м н о ж е с т в а: Ув == sup У, Ув == min Ь, У, Ув Е У; } Ув Е У. (4-8) Так, подмножество вещественных чисел - 00 < У < 1 оrраничено, но не имеет последнеrо элемента, так как 1 не принадлежит множеству. Подмно- жество - 00 < У 1 имеет точную верхнюю rраницу, равную 1. Анало- rично определяются н и ж н я я с и т о ч н а я н и ж н я я r р а н и Ц а Ун, или пер вый э л е м е н т м н о ж е с т в а: ун == inf У, Ун == тах с, У, Ун Е У; } Ун Е У. (4-9) Про с т р а н с т в а. Множества, в которых каким-либо способом определены понятия последовательности и предела последовательности, называются а б с т р а к т н ы м и про с т р а н с т в а м и, или просто про с т р а н с т в а м и. Про с т р а н с т в а, э л е м е н т а м и к о т 0- р ы х я в л я ю т с я Ф у н к Ц и и, н азы в а ю т с я Ф у н к Ц и о- н а л ь н ы м и про с т р а н с т n а м и. Множество Х называется м е т р и ч е с к и м про с т р а н с т в о м, если для Hero установлена м е т р и к а, т. е. каждой паре ero ЭJlементов хl' Х 2 поставлено в соответствие неотрицательное число р (хl, х 2 ), называемое р а с с т о я н и е м м е ж Д у э л е м е н т а м и, которое удовлетворяет следующим соотношениям, называемым а к с и о м а м и м е т р и к и: 1) р (Хl' х 2 ) == о тоrда и только тоrда, коrда хl == .1'2 (а к с и о м а т о ж- Д е с т в а); 2) р (Хl' х 2 ) =- р (х 2 , хl) (а к с и о м а с и м м е т р и и); 3) Р(Хl,Х 2 )+Р (х 2 ,хз)?р (х 1 ,хз) (аксиома треуrольника). Эти аксиомы имеют ясный rеометрический смысл, если Х есть множе- ство всех точек плоскости или TpexMepHoro евклидова пространства. Для метрическоrо пространства понятие п р е Д е л а п о с л е Д о в а - т е л ь н о с т и установлено так: последовательность элементов {Хl' Жg, ..., х n ,. .} ИЗ Х имеет предел, равный х, если р (Х п , Х) - О при п -- 00. T8I{ же 84
l\aK и в анализе, предел послеДО1Jателъности обозначается С:ИМ1Jолами Х n -- :t или lim х n = х. В функциональном анализе доказывается, что в метрическом n-+СО пространстве: 1) любая подпоследовательность сходящейся последователь- ности сходится к одному и тому же пределу; 2) последовательность может сходиться не более чем к одному пределу; 3) для всех элементов сходящейся последовательности {х n } расстояния Р (х n , а) до любой фиксированной точки а пространства Х оrраничены. Шар о м S (а, r) в метрическом пространстве Х с центром в точке а (Х и радиусом r называют совокупность точек х Е х, для которых удовлет- воряется неравенство р (х, а) < r. Если удовлетворяется соотношение р (х, а) r, шар называется з а м к н у т ы м. О К Р е с т н о с т ь ю точки а Е х называют любой шар с центром в этой точке. Точка х будет пределом последовательности лишь тоrда, коrда любая окрестность этой точки содержит все элементы последовательности, начиная с HeKoToporo Х n . Если дано множество МеХ, то точка а называется п р е- Д е л ь н о й т о ч к о й м н о ж е с т в а М, если ее любая окрестность содержит хотя бы одну точку множества М "'" а, Т. е. если для любоrо r спра- ведливо соотношение S (а, r) П (М "'" а) = ф. Множество, не содержащее своих предельных точек, называется о т к рыт ы м, содержащее все свои предельные точки - з а м к н у т ы м. Так, отрезки -1 < х < 1 и -1 х 1 на прямой Х имеют предельные точки -1 и +1; первый из этих отрезков открыт, второй замкнут. Множество, полученное путем при- соединения к М всех ero предельных точек, называется з а м ы к а н и е м м н о ж е с т в а М и обозначается М . Множество замкнуто, если М = М, и открыто, если ero дополнение Х "" М замкнуто. rоворят, что множество М плотllО в Jrtllожестве G, если G с М и М всюду плотllО в пространстве Х, если Х == М. Мllожество ниаде llе плотllО в простраllстве Х, если каждый шар этоао пространства содержит в себе некоторый шар, свободный от точек Мllожества М. Ф у н к Ц и о н а л ь н а я з а в и с и м о с т ь. О пер а т о р. Если дано правило (закон), устанавливающее однозначное соотношение между каждым элементом Х Е Х множества Х и вполне определенным элементом у Е У друrоrо множества У, то rоворят, что з а Д а н о пер а т о р /, у = tx, о п р е Д е л е н н ы й н а м н о ж е с т в е (т. е. для всех элеJИ,ептов множе- ства) Х с областью вначений, расположенной в множестве (т. е. для некото- рых элементов множества) У. Элемент у при этом называют образом эле- мента х, а элемент х - прообразом элемента у. Весьма важны два частных случая операторов: 1. Rоrда значения оператора являются вещественными числами, опе- ратор называется Ф у н к Ц и о н а л о м. 2. Rоrда х и у являются вещественными числами, оператор называется Ф у н к Ц и е й у = f (х). Функция у = / (х), определенная на некотором множестве М простран- ства Х с областью значений в множестве У называется непрерывной в точке х о Е М, если для любоrо вещественноrо числа в > О можно найти веществен- ное число б > О такое, что б у [/ (х), / (хо)] < в для всякой точки х Е М, удовлетворяющей неравенству Рх (х, хо) < 6 (индекс у р означает простран- ство, в котором определяется расстояние). Отсюда, если х n -- хо, то и f (х n ) -- f (хо). Если существует взаимно однозначное отображение HeKoToporo метрическоrо пространства Х на метрическое пространство У, эти про- странства называют rомеоморфными. Мера множества. Измеримые функции. Для пояснения понятия меры множеств рассмотрим сначала одно из простеЙIПИХ множеств - точечное множество на прямой линии. Пусть отрезок [а, Ь,l на прямой не содержит rраничных точек и является поэтому открытым. Длина интервала lab' кото- рая может служить простейшим примером r е о м е т р и ч е с R О Й М еры о т рез к а, обладает следующими свойствами: 1) как бы H располаrались 85
точки а, Ь на прямой, длина lab или ПОЛОЖИтельна, или равна нулю при а == Ь, т. е. lab - н е о т р и Ц а т е л ь н а я Ф у н :к Ц и я и н т е р в а л а; 2) как бы мы ни делили отрезок [а, Ь] на т частей, соблюдая при этом, чтобы он был суммой конечноrо числа т полуоткрытых промежутков (полуоткры- тых для Toro, чтобы в сумму вошли все rраничные точки промежутков, при- m чем каждая лишь по одному разу), lab == lk ' т. е. Ф у н к Ц и я lab а д- R=1 Д И Т И В Н а; 3) функция lab стремится к нулю на исчезающей последова- тельности промежутков, т. е. она н о р м а л ь н а. При любом друrом покрытии интервала (а, Ь] (частичное наложение от- резков, включение rраниц более чем по одному разу и т. п.), lab }: l Н, ' поэтому из всех возможных значений сумм ЕlЛk длина отрезка lab будет равна точной наименьшей rранице этих сумм. На плоскости полуоткрытый промежуток определяется неравенствами а > х ;::: Ь, с > у d, а в качестве простейшей меры выступает площадь, также обладающая тремя отмеченными свойствами - неотрицательностью, аддитивностью и нормальностью. Если множество наделяется, помимо rеометрических, друrими свойст- вами, понятие меры будет усложняться. Так, если точка прямой (или пло- скости) обладает массой, то в качестве меры может быть принята общая масса данноrо отрезка (фиrуры). Если масса равномерно распределена по линии или площади, то меры, определенные на основе длины (или площади) и массы, будут связаны пропорциональной зависимостью, при неравномерном же распределении массы они будут существенно отличаться. Понятие меры может быть обобщено на любую функцию, обладающую тремя отмеченными свойствами. Пусть на .множестве А определена uеотрицатеJtЬНая, аддипивная и нор- ,м,а.лъная ФУН1i,ция G () полуот1'i,рытых nромежут'l'i-ов множества. Внешней .мерой /А 'а .множества А называется точная нижняя 2рань значений сумм C (L\n) при всех воа.можных nО1i,рытиях множества А nромежут1i,а,м,и L\n. fI, Если множество А MOjJ{HO покрыть открытым множеством В так, что разность А "", В будет сколь уrодно малой, то множество А называется и з м е р и- м ы м. Внешняя мера измеримоrо множества называется простой мерой. Так как в дальнейшем практически встречаются только измеримые множе- ства, будем rоворить просто о мере, опуская слово простая. Пусть на измеримом множестве Х задана функция f (х) точки множества, принимающая вещественные значения. Введем обозначения Х [! > а], Х (! а], Х [! = aJ, Х [! < aJ, Х [!:::;; а) для множеств точек, в которых f (х) принимает значения, определяемые соотношениями в квадратных скоб- ках. Функция f (х) измеримоrо множества называется и з м е р и м о й Ф у н к Ц и е Й, если для любоrо вещественноrо а все пять выписанных выше множеств измеримы. (Достаточно измеримости для любоrо а одноrо из них, так как из этоrо будет следовать и измеримость остальных.) Непре- рывные функции, функции с конечным числом разрывов непрерывности, кусочно-постоянные функции, принимающие на Х конечное или счетное число постоянных значений измеримы. Иптеrрал Лебеrа. Обобщение понятия меры приводит R обобщению понятия интеrрала. Пусть lIа измеримом множестве Х Rояечной меры \XI G , определенной на основе функции G (L\) определена измеримая оrраниченная функция f (х) L (L - некоторое положительное число). Разобьем Х на конечное число подмножеств Х k, не имеющих общих ::r очек . Пусть mk и М k - соответственно нижняя и верхняя rраницы значений f (х) на Xk. Составим суммы n 8 0 ::I::: тkG (Xh), k=l n 85 = MkG (Xk), h=l (4-1 О) 86
rде б - символ способа подразделения Х на подмножества Xk. Суммы 88 и 80 оrраничены для любых 6 (Т. е. для любых способов подразделения): ISaIISalLG(X) (4-11) II поэтому имеют верхнюю (1) и нижнюю (i) точные rраницы. i=inflsal, I=supISal. (4-12) Если i = 1, то функция f (х) называется интеrрируемой по G (Х) в смысле Лебеrа на множестве Х. Интеrрал i = 1 = f (х) G (dX) (4 13) х называется интеrралом Лебеrа - Стильтьеса. Если функция G () есть простейшая rеометрическая мера, то интеrрал (4-13) называется просто интеrралом Лебеrа. Пусть т и М - точные нижняя и верхняя rраницы функции У = f (х). Разобьем промежуток т, М на части точками Yk: т = Уо < Уl < У2 < . .. < Yn-l < Уn = 1'1. Подмножества Xk, на которые разбивается Х, определяются при этом так: Xl=X[Yof(x)YlJ, ..', Xk=X[Yk-lf(х)Уk], ... (4-14) k = 2, 3, ..., п. Подразделение вида (4-14) называется подразделением Лебрrа, а суммы "), YhG (х) - суммами Лебеrа. Очевидны неравенства (см. рис. 4-3, а и б): ll,=l n n Yh_lG(Xh)SoSo YhG(Xh); h=l h=l n n Yh_lG(Xk)iI YhG(Xk). h=l k=l Величина интеrрала Лебеrа равна пределу сумм Лебеrа при бесконечном измельчении подразделения промежутка [т, Af] на части. Интересно сопоставить обычный интеrрал Римана с интеrралом Лебеrа. На рис. (4-3, в и е) показано подразделение площади функции f (х) на эле- ментарные площадки по Риману. Основой для деления служит деление оси независимой переменной. Очевидно, что численные значения интеrралов Римана и Лебеrа получаются в этом примере одинаковыми. Если функция интеrрируема в смысле Римана, то она интеrрируема и по Лебеrу, причем интеrралы Римана и Лебеrа совпадают. Различие появляется ТОfда, коrда мы lIMeeM дело с множествами и функциями более общеrо вида. Есть функции, интеrрируемые по Лебеrу, но не интеrрируемые по Риману. Так, функция, равная единице во всех рациональных точках отрезка [0,1] и равная нулю в остальных ero точках, не интеrрируема в смысле Римана, и интеrрал Ри- мана для нее не существует. Но интеrрал Лебеrа для этой функции сущест- вует. Так как множество рациональных чисел счетно и efO мера равна нулю, то интеrрал Лебеrа этой функции также равен нулю. Ивтеrрал Стильтьеса. Интеrрал Лебеrа можно рассматривать как обоб- щение интеrрала Римана. Друrое важное обобщение интеrрала Римана- интеrрал Стильтьеса. Пусть на отрезке [а, Ь] задана непрерывная интеrрируе. мая функция q> (t) и некоторая функция оrрапиченной вариации t (t). РаЗQ- брем интервал la, Ь] на интервалы tk так, чтобы а = t o < t) <. . < t n = Ь, (4-15) 87
и построим последовательность сумм вида n-l S = ер (tk) [! (tk+l) - f (еп)]. k=O Будем увеличивать число делений так, чтобы наибольший отрезок tk+l - tk стремился R нулю. Если ер непрерывна, а f - функция оrраниченной вариации, то каждая последовательность S имеет предел, не зависящий от способа разбиения интер- а) у 6), у М':;. УЗ Y J - - ,... У2 У2 f / W/- ,, y. f У1 1- - '/ "/ \ V'/: VV т=уо Scf======- Уа V' Su" . /: .// 'l Х V// "/ Х V// ,/,:/ - - 8) У 2) У х а Ха XI Х2 ХЗ Х4 Ъ а X Х2 Х.] Х4 Ь Рис. 4-3. вала [а, Ь], называемый интеrралом Стильтьеса: ь ер (е) df (е); а при f (t) == t этот интеrрал совпадает с интеrралом Римана. Наибольшее изменение функции f (t) на отрезке называется ее н а и- б о л ь m е й в а р и а Ц и е й и обозначается ь V == тах f (t) - min f (t); а atb; atb. При м еры м е т р и 11 е с к и х про с т р а н с т в. С е пар а- б е л ь н о с т ь. R о м п а к т н о с т ь. R о н е 11 н о м е р н о е е в R л и- Д о в о про с т р а н с т в о Е n . 88
Элементами n-мерноrо евклидова пространства являются упорядоченные системы из rрупп по n вещественных чисел (координат). Расстояние между двумя элементами х = {Sl S2' ..., n} И У = {111' 112' ..., 'tln} равно р (:1:, у) = v il (Si - ТJд 2 · (4-16) П ростейшими видами евклидовых пространств являются rеометрическое (трехмерное) пространство, представляющее собою множество троек вещест- венных чисел, плоскость - совокупность пар чисел, и линия. Аксиомы мет- рики в rеометрическом пространстве и плоскости выражают известные соот- ношения для сторон треуrольников и отрезков, давших имя аксиомам мет- рики и для пространств более общеrо вида. Пространство l(). Пусть Х - арифметическое n-мерное пространство, Т. е. множество всех упорядоченных систем из n вещественных чисел. Введя метрику с помощью соотношения р (х, у) = (.t I Si - ТJi 'P) , t=l (4-17) получаем обобщение евклидова пространства, называемое пространством l <;). При р = 2 получаем n-мерное евклидово пространство. Пространство ЧИСЛОВЫХ последовательностей lp. Rоrда число вещест- венных чисел в rруппе, образующей элемент бесконечно велико, х == = {Sl' 2' ... n, ...}, у = {'tll' 'tl2' ..., 'tln' ...}, то, введя метрику с помощью соотношения / 00 \ 1 Р (х, у) = ( I Si - l1i I P ) Р , \i= 1 / получаем пространство числовых последовательностей lp. Выполнение аксиом метрики проверяется с помощью неравенства Минковскоrо для сумм. При р = 2 получаем 'Коордиnатnое еилъбертово nростраnство l2. Пространство функций с интеrрируемой по Лебеrу р- степенью L [0,1]. Пусть Х множество всех функций х (t), принадлежащих L p [0,1], т. е. заданных на OTpeKe 0,1. Если отрезок изменения переменной аЬ, то подста- t-a новкой 't' = -ь мы всеrда можем преобразовать отрезок аЬ в отрезок -а ( 4-18) [0,1] . Полаrая ( 1 \ ljp Р (х, у) = I х (t) - у (t) , Р dt ) , ( 4-19) с помощью неравенства Минковскоrо для интеrралов проверяем выполнение аксиом метрики. При р == 2 получаем еильбертово фуu'Кциоuалъuое nростраи- ство I2. Пространство непрерывных функций С [0,1] с метрикой Чебышева. Мет- рика вводится с помощью соотношения р (х, у) = шах I х (t) - у (t) 1. t Пространство оrраниченных вещественных фунКЦИЙ М [0,1]. Метрика вводится следующим образом: р (х, у) = sup I х (t) - у (t) 1. t Очевидно, С [0,1] с М [O,i). (4-20) (4-21) 89
ПОШlота пространства. Последовательность {Х n } элементов метрическоrо пространства называется сходящейся в себе или фундаментальной посд,едова- тельностью, если для JIюбоrо 8 > О существует номер по (8) такой, что р (х n , Х т ) < 8 при п, т по (8). М етрическое пространство нааывается полным, если в не.м. каждая сходящаяся в себе последовательность сходится r; пределу Хо, являюще.м.уся эд,е.м.енто.Jt тоео :нее пространства. Евклидово пространство Е n полно, что следует из критерия Коши суще- ствования предела последовательности точек зтоrо пространства. В курсах теории функции вещественной переменной доказывается полнота пространств L 2 [0,1] и l2' аналоrичными методами доказывается полнота L p [0,1] и lp. На основе условия Коши равномерной сходимости доказана полнота С [0,1J. Примером неполноrо пространства может служить множество рациональных чисел т, в котором определено расстояние р (rl' r2) = Irl - Т21, так как можно указать последовательность рациональных чисел в этом пространстве: r n =(1+ )n, которая сходится в себе, но имеет пределом иррациональное число е, не при- надлежащее к данному пространству. Пространство Х, в котором существует счетное всюду плотное множество, называется сепарабельным. Друrими словами, в сепарабельном простран- стве существует последовательность {Х n }, такая, что для любоrо Х Е х най- дется подпоследовательность {x nk } этой последовательности, сходящаяся к Х. ДЛЯ метрическоrо пространства это означает, что в последовательности {Х n1 ) можно найти такой элемент '.C nl , что Р (х, x nl ) < 8. Евклидово простран- ство, пространства I2' L p , l2' lp С сепарабельны. Линейные нормированные пространства. Линейным, или векторным, пространством называется множество А, для элементов KOToporo определены операции сложения и умножения, удовлетворяющие основной rруппе алrеб- раических законов, а именно: 1. ДЛЯ Х, у, zEA, Х + у = у + Х (коммутативность сложения). 2. Х + (у + z) = (Х + у) + z (ассоциативность сложения). 3. Существование однозначно определенноrо нулевоrо элемента е TaKoro, что х + е = х. 4. Существование для каждоrо элемента Х Е А противоположноrо эле- мента (- Х) Е А TaKoro, что х+(-х)=е. 5. л, (flx) = (л,fl) Х (ассоциативность умножения). 6. л, (Х + у) === л'х + л,у } (дистрибутивность умножения (А + fl) Х = АХ + flX относительно сложения). 7. 1. Х = Х (свойство неизменности при умножении на единицу). Кроме Toro, отметим свойство, вытекающее из приведенных выше ак- сиом: Х. е = е (свойство умножения на нулевой элемент). Первые четыре свойства характерны для абелевых rрупп. В зависимости от Toro, вещественны или комплексны числа А, t,..., про- странство называется соответственно вещественным, или комплексным. Совокупность элементов вещественных векторов Е n , вещественных (ком- плексных) пространств lp, L p , С образуют вещественные (комплексные) линей'" ные пространства. Непустое множество L элементов линейноrо пространства А называется линейным мноеообрааие.м., если вместе с элементами Хl, Х 2 , ..., Х N множество L содержит любую линейную комбинацию (Х 1 Хl + (Х 2 Х 2 + ... + (ХnХ n этих элементов. Линейное метрическое пространство называется НО рмированным, если каждому ero элементу х поставлено в соответствие вещественное число, 90
вазываемое нор.мой элемента х, обозначаемое "Х 11 , которое удовлетворяет следующим аксиомам нормы: 1. 11 х 11 О, причем 11 х 11 = О, только если х = 6. 2. 1I:c + у 11 11 х" + 11 у " . 3. 11 л:с 11 = I л /. 11 х" . Линейное нормированное пространство метризуемо, так как в нем можно ввести метрику, определив расстояние как: р (х, у) = 11 х - у 11. (4-22) Если для последовательности элементов {х n } нормированноrо ПРQCтран- ства определена сходимость из условия, что х = liш Х n , если" х n - х 11 - о при n ---+ 00, то сходимость в этом смысле называется сходи.мостью по нор.ме. Линейное пространство, полное в смысле сходимости по норме (т. е. такое, что сходимость по норме в себе имеет место для всех ero последователь- ностей), называется nространство.м, Ванаха (nространство.м, типа В). n-мерное векторное пространство с элементами х = {61 62' ..., 6n} может быть сделано банаховым пространством путем введения пормы II x 11 =(t 1 i=1 ) (4-23) с метрикой, определяемой равенством (4-22). L p [0,1] может быть сделано банаховым пространством при выполнении условий: ( 1 )1/ Р Р (х, у) = I х (t) - у (t) I P dt ; ( 1 \ 1/р 11 х 11 = 1 х (е) , Р dt ) · (4-24) (4-25) lp есть банахово пространство, так как можно положить ( 00 \l/р Р (Х, у) = . I 6i -l1i /Р) ; 1.=1 11 х 11 = Cl l i IP )ЦР; (4-26) (4-27) с [0,1] - банахово пространство, для KOToporo р (Х, у) = шах I х (е) - у (t) 1; t 11 Х " = шах 1 х (t) 1. t А бстраптны.м, еильбертовы.м, nространство.м Н навывается лuнейное пространство, в поторо.м оnреде.д,ено Сl'ад,Ярное nРОИ8ведение э.д,е.ментов (х, у); Х, у Е Н, удовлетворяющее условиям: 1. (Х, у) = ( у, х ) (черта сверху означает сопряженное комплексное число. В частности, (х, х) - вещественное число). 2. (хl + Х2' у) = (Xt, у) + (Х2' у). 3. (АХ, у) = А (х, у). 4. (х, х) О, причем (х, х) = О только если z = 8. Нормой элемента х Е н в абстрактном rибертовом пространстве назы- вается число (4-28) (4-29) 11 х 11 = Y(z, х). (4-80) 91
Оно удовлетворяет всем требованиям нормы линейноrо нормированноrо пространства. Пространство Н полно в смысле метрики р (х, у) = 11 х - у 11. (4-31) Скалярные произведения, определенные выше, обладают следующими свойствами: 1. (ах, ах) = I а 2 I (х, х) (а - комплексное число). 2. I (х, у) 1::::; 11 х 11.11 у 11 (обобщение неравенства Шварца). Пространство L 2 [0,1], в котором скалярное произведение определено как 1 (х, у) = х (t) у (t) dt, о (4-32) является rильбертовым пространством. Два элемента rильбертова пространства х, у Е н называются ортО80н,а.д,ь- пыми, если (х, у) = о. Элемент х называется ортоеопальпым nодnрострапству LcH, если он ортоrонален любому элементу у Е L этоrо подпространства. Обозначение орто- rональности: x..LL. Доказано, что если х Е н и LcH, то существует един- ственное раЗЛО1Кение элемента х вида: Х.= у + Z, (4-33) rде У Е L, z l-L, т. е. раЗЛО1Кение на ортоrональную подпространству L соста- вляющую z и друrую составляющую у, принадлежащую к L, которая назы- вается nроекцией элемепта х па nодnрострапство L. Совокупность М всех элементов, ортоrональных подпространству L, есть также подпространство, называемое ортоеоnалъпым доnолпепием к под- пространству L. Элемент z при этом есть проекция х на М. Таким образом, (4-33) представляет собой разложепие алемеnта х па nроекции па два взаимпо ортоеопальnых nрострапства. Пространство Н является ортоеопальпой СУМ- МОЙ подпространств L и М, что обозначается Н = L + М. Ортоrональная сумма есть частный случай суммы Н = L U М. Система элементов еl, е2' ..., е n , ... Е н rильбертова пространства назы- вается ортоuорма.д,ьuой, если для нее справедливо следующее соотношение для скалярноrо произведения любой пары элементов этой системы: (ei, ej) = бij, (4-34) rде {)ij - символ Кронекера ({)н = 1 при i = j; ()н = О при 1 = j). Если в rильбертовом пространстве дана любая система линейно незави- симых элементов h 1 , h 2 , ..., h n , ... Е Н, то всеrда МО1Кно построить ортонор- мальную систему еl, е2' ..., е n , ... ЕН, выражаемую через элементы h соотно- шениями: h 1 g2 еl = 1Ih;li; е2 = "g211 . е 6n . .., n = 11 в"n " . , ... , (4-35) rде 62 = h 2 - С21 е l, С21 = (h 2 , el); .................. k-1 gk = hk - Ckiei, Cki = (hk, ei); i-1 ................... Приведенный процесс определения ek называется nроцеССОМ ортО80па- лиаации Шм,идта. 92
Пусть в пространстве Н задана ортонормальная система {e}. Система называется полной, если не существует элемента х Е Н, отличноrо от нуле- Boro, который был бы ортоrонален всем элементам {ei}. Ортонормальная си- стема {ei} называется зажпuутой, если п()рождаемое ею подпространство L совпадает с Н. Замкнутая ортонормальная система называется также орто- нор.маJtьuыж базuсом еuльбертова nростраиства. Компактность. Множество М метрическоrо пространства Х Е м назы- вается пожпаптuы.м, если любое бесконечное подмножество этоrо множе- ства содержит сходящуюся последовательность. Если при этом пределы всех с\.одящихся последовательностей принадлежат М, то М 11,о.мnаптио в себе; еслИ они принадлежат Х, но не принадлежат М, то М OMnaтиo в прост- ранстве х. Каждое оrраниченное множество числовой оси компактно. В самом деле, в силу оrраниченности существует интервал J o , в котором лежат все эле- менты данной последовательности {%n}. Выделим половину интервала, содер- жащеrо конечное число точек последовательности; оставшуюся половину, содержащую бесконечное число точек последовательности, обозначим J 1 . В части J D выделяем половину с конечным числом точек и оставшуюся поло- вину обозначаем J 2 и т. д. Интервалы J 1 , J 2 , ... образуют убывающую после- довательность интервалов {J n}, содержащих каждый бесконечное множество точек, в то время как вне каждоrо интервала может лежать лишь конечное число точек. Следовательно, для любоrо 8 > О можно найти интервал J р длиною меньше 8, в котором содержится бесчисленное множество элементов {%n}, лежащих в окрестности 8 предельной точки. Любую предельную точку последовательности {х n } можно считать пределом частичной подпоследова- тельности этой последовательности. Множество компактно в себе. Rонечномерное эвклидово пространство, пространства lр, L p не ком- пактны, и в них существуют как некомпактные оrраниченные множества, так и компактные. Примером первоrо служит последовательность Х1 = == (1, О, О, ...), Х2 == (0,1, О, ...), %3 = (О, 0,1, ...), для которой в простран- стве l2 справедливо равенство 11 х n - Х т 11 = 11 и любая подпоследова- тельность последовательности {х} расходится. Примером второй является rильбертов параллелепипед, т. е. множество Р точек % = (%1' %2' ..., х n ' ...), для которых IX11 1, 1%21 1/2' ..., 'хnl 1/ 2 n, ... Для установления компактности множеств предложен ряд критериев. Достаточно общий, но мало удобный критерий дается теоремой Хаусдорфа, излаrаемой в курсах функциональноrо анализа. Из менее общих, но более удобных критериев отметим: Критерий компактности в пространстве lp Множество Mcl p компактно тоrда и только тоrда, коrда: а) оно оrрани- чено; б) для любоrо 8 > О можно выбрать N (8) такие, что для всех т > N и произвольноrо % = {%1, %2' ..., Х т , ...} Е м выполняется неравенство ro I X i/ P <8 P . i==m+ 1 (4-36) R р и т е р и й к о м п а к т н о с т и в про с т р а н с т в е L p (т е о р е м а К о л м о r о р о в а) Множество М cL p компактно тоrда и только тоrда, коrда: а) существует число К такое, что для любой функции % Е м имеем 1 I х (t) IP dt КР; (4-37) 93
б) для любоrо 8 > О можно выбрать число () > о такое, что для любой % (t) Е М выполняется неравенство х _ 2 '! h х (Т) ат < в, (4-38) t-h если h < б. R р и т е р и й к о м п а к т н о с т и в про с т р а н с т в е С (0,1) (т е о р е м а А р ч е л а) Множество МсС компактно тоrда и только тоrда, коrда: а) существует число К такое, что для любой х (t) Е М справедливо I х (t) I К; (4-39) б) для любоrо 8 > О можно выбрать б > О такое, что для любой х (t) Е М справедливо неравенство I х (tl) - Х (е 2 ) I < 8, } (4-40) если I t 1 - t 2 1 < б, t 1 , е 2 Е [О, {]. Линейные операторы и Функциоиалы. Оператор А , определенный на линейном метрическом пространстве Е х r областью значений в линейном мет- рическом пространстве Е у , называется аддитивным, если для любых %1' %2 Е Х имеет место соотношение А (хl + Х2) = АХ1 + АЖ2. (4-41) Оператор называется одиородиы.м" если выполняется условие А (ах) = аАх (4-42) для любоrо элемента % Е х и для любоrо числа <Х. Если в множествал. Х и У существуют нулевые элементы б, то для адди- тивноrо оператора спрведлвы равенства: Ав = б; } А ( - х) = _ Ах. (4-43) Если оператор А аддитивеI и однороден, то он также и дистрибутивен: n n А ahxk == ak (AXk). k= 1 Я= 1 Аддитивиый и одиородиый оператор uааывается Аинейиы.м,. Оператор в метрическом пространстве н,епрерывен" если для любоrо 8 > О найдется > О такое, что совокупность образов элемента шара S (х, ) лежит в шаре S (Ах, 8). Линейный непрерывный оператор обладает тем свойством, что если х n --+ х, то и Ах n --+ Ах. Непрерывный и аддитивный оператор, опреде- ленный в вещественном линейном пространстве Е х , однороден. Оператор называется оараnичен,uыJИ" если существует такая постоянная lr! , что 11 Ах 11 м 11 х 11. (4-45) (4-44) Для Toro чтобы аддитивный оператор был линейным, необходимо и доста- точно, чтобы он был оrраниченным. Для линейноrо оператора А наимень- шая постоянная М, при которой для 11сех х Е х выполняется неравенство (4-45) называется н,ор.м,ой оператора А и обозначается "А I1 Можно покаа8ТЬ, что 11 А 11 = зир j I Ах ! I IIжll1 (4-46) 94
ИЛИ, что то же самое, 11 А 11 = Ви р I r Ах Ir . I/xll*O IIxll (4-47) Можно также показатъ, что для всех х Е х rI Ах 11 11 А 11.11 х 11. Множество всех линейных операторов, определенных на Х со значениями в У, образует линейное пространство, которое относится к типу банаховых пространств. Функционал есть частный вид оператора, и по отношению к линейным функцuоналам справедливы те же правила относительно аддитивности, orpa- ниченности, однородности, непрерывности, которые были приведены для линейных операторов. Множество всех линейных функционалов на некотором нормированном пространстве Х образует линейное нормированное пространство, называе- мое nростраnством, соnряжеnnы,M с Х, и обозначаемое х. Сопряженное про- странство всеrда полное, независимо от полноты исходноrо пространства. Для мноrих функциональных пространств можно указать общий вид всех линейных Функционалов, определенных на этих пространствах. Так, общий вид линейноrо функционала fx в n-мерном эвклидовом пространстве будет: rt jx = 6ifi, i=1 (4-48) rде fi - произвольные числа, а i определяются из равенства n Х = iei Е Е п , i=1 (4-49) rде {еl, е 2 , ..., е n } - базис в Е n . Общий вид линейных функционалов в С [0,1] определяется теоремой Рисса: всякий линейный функционал, заданный в пространстве С [0,1], вы- ражается с помощью интеrрала Стильтьеса: 1 jx = , х (t) dg (t), о (4-50) rде g (t) - функция с оrраниченным изменением. Общий вид линейноrо Функционала в lp будет сх: jx = Ckk, п=1 (4-51) rде Sk определяются из равенства (4-49), но для х Е lp. Общий вид линейноrо функционала в L p [0,1]: 1 jx = х (t) а. (t) dt, rде а (t) - любая фиксированная функция а (t) EL q [0,1]. Числа р и q связаны соотношением i+==1. р q (4-52) (4-53) 95
Нормы линейных функционалов общеrо вида равны: « ( lp n 11 f 11 = I fi 1; i=t 1 11 j 11 = V {g}; о I ro \l/q 11 j 11 = ( I Ck jq , ; \k= 1 / ( 1 \ 1!q 11/11 = \ I а (t) jq dt I ' \б I J (4-54) в пространстве Е n « < С [О, 1] < < L p 1 rде V - символ, означающий полное изменение функции в интервале [0,1]. о При исследовании линейных функционалов часто оказывается практи- чески целесообразным следующий прием: функционал сначала определяется не на всем пространстве Х, а на некотором ero подпространстве, представляю- щем собою линейное мноrообразие. Далее делается попытка расширить об- ласть, в которой первоначально был определен функционал так, чтобы сохранить ero наиболее существенные свойства, в частности норму. Пусть линейный функционал Фх определен только для элементов х Е G, причем 11 ф II G == вир 11 Фх 11, х Е с. Ilxll1 Расширением функционала Ф с сохранением нормы называется такой линейный функционал Рх, который определен в пространстве Х и имеет норму li F Il x == зир ;lFx 1\, х Е Х, Ilxll1 причем для каждоrо элемента х Е G справедливы равенства: Fx == Фх, ж Е С; 11 F " х = 11 ф lI а . Расширение функционалов базируется на теореме Банаха - Хана: каждый линейный функционал, определенный на мноrообразии G, можно расширить на все линейное нормированное пространство Х, с сохранением нормы. Соnряжеииые nростраиства и операторы. Совокупность всех линейных функционалов fx, определенных на линейном нормированном пространстве Е, образует баиахово nростраnство Е*, соnряжеunое с nрострапство.м Е. Рассмотрим пространства L p [0,1] и L q [0,1], rде q == р 1 . (4-55) р- Каждому функционалу fx Е L [0,1] однозначно соответствует функция а (t) EL q [0,1] и обратно, поэтому между пространствами L и L a устанавли- вается взаимно однозначное соответствие. Пространства L; и Lq,"таким обра- зом, можно считать сопряженными. При р = 2 получаем q = 2 и L [0,1] = = L 2 [0,1]. Поэтому пространство L 2 [0,1] называется са.мосоnряжеuпы,м, nростраnство,м,. Линейный функционал в rильбертовом пространстве порож- дается элементом этоrо же пространства и rильбертово пространство также является сам:осопряженным. По этой причине будет самосопряженным: и эвк- лидово пространство. 96
Пусть линейный оrраниченный оператор у = Ах отображает линейное нормированное пространство Е х в линейное нормированное пространство Е у . Пусть на Е у определен линейный функционаJI <ру. Тоrда <РУ определен для у = Ах, rде z - любой элемент из Е х , :и мы имеем <ру = <р (Ах) = fx, rде /х - линейный функционаJI, определенный на Е х . RаiНДОМУ функционалу <р Е Et ставится в соответствие Функционал f Е E. Таким образом пост- роен некоторый оператор, определяемый на Et, с облаСТЫQ значений в E. Этот оператор обозначают А * и называют оператором, сопряженным с А. Раврнство <ру = fx записывают в виде f = А *(j). Рассмотрим линейный опе- ратор в пространстве L 2 [0,1 J: 1 Ах = у (t) = \ к (t, 8) Х (8) d8, (4-56) О rде К (t, В) - непрерывное ядро. Произвольный В L 2 [0,1] имеет вид линейный функционал 1 Iy = (у, 1) = \ у (t) f (t) dt, О 1 (t) Е L 2 [О, 1]. (4-57) Поэтому f (Ах) = f (t) {K (t, 8)Х (8) d8} dt = 1 {1 } 1 = :r; (8) К (t, 8) f (t) dt d8 = Х (8) g (8) d8, rде 1 g (8) = к (t, 8) f (t) dt. (4-58) Таким образом, переход к сопряженному оператору в пространстве L 2 [0,1] означает перестановку переменных в ядре. Оператор А *, сопряженный с линейным оrраниченным оператором А и отображающий линейное нормированное пространство Е х в линейное нор- мированное пространство Е у есть также линейный оrраниченный оператор с той же нормой: 11 А* 11 = 11 А 11. (4-59) Понятие сопряженноrо оператора можно ввести и в случае неоrрани- ченноrо оператора А, определенноrо на линейном мноrообразии, всюду плотном в линейном нормированном пространстве Е х со значениями в Е у . 4-2. Примеры решения задач оптимальноrо управления в терминах Функциональноrо анализа решение задач оптимальноrо управления формулируется следующим образом. Прежде Bcero предпола- rается, что управляющий сиrнал и (t) принадлежит к определенному функ- циональному пространству. Чаще Bcero в качестве пространства выбирают либо пространство функций с интеrрируемым квадратом L 2 в случае непре- рывных систем (для большей общности часто рассматривается пространство L p ), либо пространство l2 (или lp) в случае дискретных систем. Это связано с тем, что показатели качества, которые выражаются в виде ФУНRционалов, действующих в том же пространстве, часто записываются в виде интеrралоп (или СУММ) от квадратов функций. Как мы видели выше, в функциональных UpocTpaHcTBax L p (или lp) нормы элементов пространства выражаJfИСЬ с по- МОЩI.Ю TaKoro рода интеrралов (или сумм). Тоrда задача оптимальпоrо 97
управления формулируется нан задача определения фуннций (или комбинациi'I функций, входящих в по:казатель качества), обладающих наименьшей нор- мой в рассматриваемом пространстве. Приведем нес:колько примеров подобной формулировки задач. Для следящей системы, предназначенной для воспроизведения заданноrо сиrнала Хо (t), в :качестве показателя :качества удобно выбрать динамическую ошибку Е, выражаемую как расстояние между Х и Хо в метрическом про- странстве: Е = 11 х - ХО 11. (4-60) Норма (4-60) в пространствах L 2 и l2 характеризует энерrию, затрачи- ваемую на управление. В пространстве С эта норма равна шах Ix - Хо 1, т е. ма:ксимальному t)тклонению или перереrулированию. Рассмотрим задачу о минимизации в пространстве С 2п фун:кционала т J (х) = {x + Ti2 + ... + [т2n х <n)]2} dt, (4-61) О rде под Х понимается отклонение координаты от заданноrо значения. Функ- ционал (4-61) характеризует обобщенную интеrральную ошибку в следящей системе. Необходимым условием минимума Функционала является равенство нулю ero rрадиента: grad J (х) = Нт J (х + yh) - Jx = j (х, h), (4-62) 'У-О У тде h - произвольная фун:кция; у - вещественное число; Vh - вариация функции Х, дЛЯ :которой выполняются условия h<i) (О) = h<i) (Т) = о. (4-63) Чтобы найти выражение rрадиента, найдем так называемый слабый диф- ференциал выражения (4-61). В функциональном анализе вводится два понятия )Jифференциала и, соответственно, производной - слабый и сильный дифференциалы. Выра- жение (4-62) называют слабым дифференциалом (дифференциалом raTO) , предполаrая, что предел, стоящий в правой части и понимаемый в смысле сходимости по норме, существует. Сильный дифференциал определяется сле- дующим образом. Пусть существует линейный оператор l та:кой, что I (х + h) - f (х) = lh + U) (х, h), 11 ro (х, h) 11 _ о при 11 h 11 _ о I/hll . ( 4-64) rде Тотда lh называют сильным дифференциалом функции (дифференциа- лом Фреше). Для отыскания rрадиеНТf;l фУНRционала используется понятие слабоrо дифференциала. Обозначая в (4-61) подынтеrральную функцию через (j)x и d <Р <i) = d i CP[t, х, ..., х<n)], х Х получим для слабоrо дифференциала т dJ (х, h) = :'1' ер [t, х + Vh, х' + Vh', .00, х(n! + Vh1n!] dt = о т = [<Р h + <р ,h' + ... + <р <n)h<n)] dt. 6 х х х (4-65) 98
Применим формулу интеrрирования по частям т т С С d !f>x,h' dt = [!f>x.h]r - dt !f>x. h dt , о о .......................................... т сп h 0 1,) (lt ::::::: [т l(n-l)]T - [!!- m h(n-2)]T + ... 'Ух(n> 'Ух(n) О dt 'Ух(n) о О т r d n ... + (-1)n dt n <fJx(n)hdt. О Учитывая (4-65), получаем т dJ (ж, h) = [!f>x - ;i !f>x' + о Приравнивая rрадиент нулю, получаем, учитывая, что h - произволь- пая функция d n ] . .. + (- 1) n dx n q> х (n) h d t. (4-66) d d n ер - d - q> +... + (-1)n d n ()' (n) == о. х t х' х х (4-67) Таким образом, мы получили уравнение Эйлера [см. (1-10)]. Перейдем к друrому примеру. Пусть оператор объента А - линейный и оrраниченный оператор, действующий в rильбертовом пространстве Н; уравнение объекта х = Аu, и - управление. Показатель оптимальности выражается функционалом J (и) = Лlllu 112 + л,211 ХО - Ах 112, ХО, и, Е Н. (4-68 ) Так как норма элемента в rильбертовом пространстве 11 х " = у (х, х), rде (х, х) - скалярное произведение, то J (и) = л,1 (и, и) + Л2 (х о - Ах, хо - Ах). Для определения оптимальноrо управления и, минимизирующеrо функ- ционал, найдем сначала слабый дифференциал функционала. Введем произ- вольную фуннцию h (t) и вариацию yh, удовлетворяющую условиям (4-63). Получим, используя свойства СRалярноrо произведения: J (и + vh) = "'1 (и + yh, и + yh) + "'2 (хо - Аи - vAh, хо - Аи - yAh) = = "'1 (и, и) + 2Лl (и, vh) + "'1 (yh, yh) + Л2 (хо - Аи, хо - Аи) - - 2Л2 (хо - Аи, )'Ah) + Л 2 ()'Ah, yAh) = == J (и) + 2)'Лl (и, h) - 2)' (Ah, хо - Аи) + )'2Лl (h, h) + )'2Л 2 (Ah, Ah); J (и + yh) - J (и) = 2у [Лl (и, h) - Л2 (Ah, ХО - Аи)] + + у 2 [Лl (h, h) + Л2 (Ah, Ah)]. dJ (и, h) == 2 [Лl (и, h) - Л2 (Ah, ХО - Аu)]; d 2 J (и, h) == 2 [Лl (h, h) + Л2 (Ah, Ah)]. Отсюда Представим, используя свойства скалярноrо произведения, выражение для слабоrо дифференциала в виде: dJ (и, h) = (2ЛIU, h) - [h, 2Л2А* (хо - Аu)], (4-69) rде А * - сопряженный оператор. 89
При получении (4-69) использовано основное свойство сопряженноrо оператора (Аа, Ь) = (а, А *Ь). Оптимальное управление получаем, положив rрадиент функциовала, равным нулевому элементу, т. е. grad J (и) = 2"'lU - 2л 2 А * (хо - Аи) = б. Отсюда получаем "'2 А и = Лt А* (хо - и). (4-70) В общем случае уравнения вида (4-70) дают возможность составить проrрамму дЛЯ ЦВМ, входящей в состав реrулятора, которая вычисляла бы и для каждой заданной функции хо. ПринципиаJIЬНО возможно получить и схему с аналоrовой машиной (рис. а 4-4). Однако практически наиболее важ- но получить приближенную реализацию СОIlряженноrо оператора А * . Пусть импульсная переходная функция объекта k и (t) и для операто- ра х = Аu имеем t х (t) = Аu = k и (t - Т) и (Т) d-r. о хо-Аи A ll. Лf Аи А Рис. 4-4. Для сопряженноrо оператора .4 * в линейном функционале нужно поменять местами переменные в ядре: о t У (t) = А *20 = k и (Т - t) 20 (Т) d1' = 20 (t + Т) k и (Т) d1'. rде z (t) - функция, действующая на вход звена с сопряженным оператором. Разлаrая подынтеrральную функцию в ряд, получаем 00 A*z= z<i) (t)q>i(t), i=O rде t . k и (Т) q>i (t) = ., ат:, 1.. О Приближенная реализация оператора А * с помощью reHepaTopoB функ- ций <Pi, дифференциаторов и сумматора поназаны на рис. 4-5. Шумы не дают возможности получать достоверные значения производных сиrнала, поэтому обычно оrраничиваются 1-2 производными. Теперь рассмотрим пример условно-оптимаJlьноrо процесса, коrда мини- мум функционала должен быть обеспечен при некоторых дополнительных оrраничениях. Пуеть имеется линейная динамическая система, характеризуемая п координатами, связанными с управляющим воздействием и (t) зависимостями: t Yi (t) = k i (t. Т) и (Т) d1'. t = О. 1. .... п. (4-72) i = О, 1, 2, ... (4-71) k i (t) - импульсвые переходпые ФУНКЦИИ ДJIЯ различных выходов системы. 100
Требуется найти TaKyIo функцию и (t) Е L 2 [О, Т], которая доставила бы минимум функциопалу т J (и) = \ I и (t) 12 dt О (4-73) при дополнительных условиях т F i (и) = k i (1\ '() и (-r) d-r = ai, О (4-74) т. е. управление должно привести систему в CTporo фиксированную точку с координатами Yi (Т) == Cti. Эту задачу можно трактовать как задачу на- хождения в пространстве L 2 [О, Т] липейноrо функционала F (k), который имеет минимальную норму 11 F 11 == " и 11 и принимает на заданных элемен- тах ki Е L 2 [О, Т] заданные значения Cti. В болеf' общей постановке (определение F (k) в пространстве L q ), имеющеrо мини- мальную норму "F" q == "и 11 р и прини- мающеrо заданные значения ai на элементах k i Е h q , задача рассматривалась Н. Н. Кра- совским [80J, Р. Куликовским [242] и для бесконечноrо числа п (для систем с распределенными параметрами) А. r. Бут- ковским [23, 24]. Для решения подобных задач во мно- rих случаях удобным оказывается метод, базирующийся на L проблеме моментов Крейна (12]. Пусть задача оптим:альноrо ynравле- Рис. 4-5. ния сформулирована следующим образом: требуется найти такую функцию и (t) (т. е. оптимальное управление), которая принадлежит либо пространству L p [О, Т], либо пространству М оrраниченных измеримых функций и которая оrрани- чена по норме числом l, l > О: 1 I I __________-1 11 и 11 l, (4-75 ) чтобы выполнялась система равенств т (1,i = k i (t) и (t) dt, О rде C'ti - заданные числа, а ki (t) - заданные линейно-независимые функции, принадлежащие пространству L p (если к этому же прострапству принадлежит и (t) или М (если и (t) Е М), и чтобы при этом Т было минимально. Числа Cti называются моментами функции и (t) относительно последова- тельности функций ki (t). L - проблема моментов может быть конечномерной (если i оrраничено) или бесконечномерной (при неоrраниченном i). Проиллюстрируем, что мноrие задачи об оптимальном по быстродейст- вию управлении системами, описываемыми линейными дифференциальными уравнениями, MoryT быть сформулированы именно так. . Пусть, например, дана система обыкновенных линейных уравнениц i = 1, 2, ... , n, (4-76) n r dYi dt = '- аiЗ (t) Yj + b 1 h (t) uk, ;=1 k=1 или В матричной форме i = 1, 2, ..., n (4-77) у = Ау+ Ви. (4-78) 101
Заданы начальные условия Уо == у (О). При этом оrраничивается либо функционал ( Т r )1/ Р \ I uk (t) \Р dt l, \d k=1 ( 4-79) либо выражение шах (1 ull, I и21, ..., I и , I )l. (4-80) Оrраничение (4-79) относится к случаю и (t) Е L p , причем левая часть неравенства представляет собою норму функционала 11 и" в пространстве L p , а выражение (4-80) - к случаю и (t) Е М, причем и (t) считается ку- сочно-непрерывной функцией. Для первоrо случая при р = 2 неравенство (4-79) обычно выражает оrраничение энерrии, затрачиваемой на управление. Для BToporo случая (4-80) пример соответствует оrраничению, налаrаемому на модули управляющих воздействий. Решение дифференциальноrо уравнения (4-78) при заданных Ui (t) имеет вид У (t) = ф (t) [Уо + r 'у ('t') В ('t') U ('t') d't'J тде Ф (t) есть матрица фундаментальных решений однородной системы урав- нений (4-81) . у = .Ау, а 'I' (t) есть матрица, обратная Ф (t), т. е. '1' (t) == ф-l (t). Рассмотрим момент прихода системы в точку равновесия у (t) = У (Т). (4-84) Подставив (4-84) в (4-81) и умножив слева на 'р' (Т) = ф-l (Т) (что можно сделать, так как в интервале [О, Т] функция 'I' (t) не обращается в нуль), получим (4-82) (4-83) т 'I' (11) У (Т) = Уо + 'р' (t) В (t) U (t) dt. О Обозначив и 'I' (Т) У (Т) - Уо = а 'р' (t) В (t) = К (t), (4-85) имеем т а = к (t) u (t) dt, (4-86) Т. е. в данном случае задача свелась к проблеме моментов. В качестве иллюстрации приведем пример, рассмотренный в [24]. Дана линейная система третьеrо порядка с двумя управляющими воздействиями, уравнения которой имеют вид: dY1 dt = У2, dY2 dt = Уз + иl' (4-87) dys dt = и,. 102
llачальное состояние системы у (О) = ] конечное заданное состояние - начало координат, т. е. у (Т) = о. Решая однородную систему: . Уl = У2; . У2 = Уз; Уз = о, найдем Уз == const == Сl; t У2 == Сl dt + С 2 == Cl t + С 2 ; О t Уl = ) (Cl t + С2) dt + Са = Сl t; _ + c 2 t + Сз- Для получения фундаментальной матрицы составим следующую систему частных решений: У 1 - (1 lt + 1 1 + 1[ + 1) - С р С 1 С 2 , С 1 2 С 2 СВ, У 2 _ (2 2t + 2 2 t 2 + 2t + 2) - С 1 ' С 1 С 2 , С 1 2' С 2 С З t уз = (c, Ф + C, C t; + ct +c g ). Выберем в матрице этих решений произвольные постоянные таким обра- зом, чтобы c = {1 при i = j о пр и i -::j:. i, получим [ 1 t ] Ф (t) = ! _ ( 4--88) Обратную матрицу в общем случае можно найти как матрицу, состав- ленную из элементов ф.. (-1> _ ) CPij - тфт' rде Фij - алrебраические дополнения элементов CPij матрицы Ф, I Ф I - 011- ределитель последней. Но из теории линейных дифференциальных уравне- НИй известно, что ф-l (t) == \f (t) == Ф (- t), поэтому обратную матрицу в данном случае мы найдем сразу из фундамен- тальной ч' (t) = Ф (- t) = [ -t t; ] 1 -t . О 1 (4-89) 103
Матрица в = } :;:; му w (t) В = [ t tt2] I о о 1 _ 1_0 1 =[1.0-t.1+ t ; .0, 1.0-t.0+ t ; .1]=i--t О . О + 1 . 1 - t . О, О . О + 1 . О - t . 1 l 1 О . О + О . 1 + 1 . О, О . О + О . О + 1 . 1 О (4-90) ] -t . 1 (4-91) Учитывая, что требуется привести систему в начало координат и что, следовательно, у (Т) == О, из (4-85) получаем а=-уо. Уравнения моментов получим, выписывая равенства соответственных строк матрицы: т а = - Уо = \ к (t) и (t) dt, О т. е. т а1 = - УО1 = - 1 = [- tl11 (е) + ; [2и2 (t)] dt; о т а2 = - у 02 == О == [и 1 (l) --- t и 2 (t) J d [; О Т аз = - Уоз = О = и2 (t) dt. I } , (4-92) } в теории моментов важную роль иrрает теорема: Для Toro чтобы в про- странстве L p (1 р со) или М существовала функция u (t), О t Т с нормой, не превосходящей числа l, и последовательность п моментов кото- рой относительно функций k 1 (t), k 2 (t),..., k n (t) была (1,1, ap.'., (1,n, необхо- ДИМО и достаточно, чтобы существовало п чисел t, 2"'..' ;i, дающих реПlе- ние одной :из следующих задач: 1) найти т min Sl' ..., Sn О при условии n iki (t) i=l q т dt= n sfk i (t) i=l q dt z-q (4-93) n iai == 1; ,=1 2) найти 11- rllax ha't l S1' ..., Sn k = 1 (4-94) 104
IIРИ условии т о n S/fi (t) i=l q dt = 1. (Dункцил и (t), дающая решение проблемы, имеет вид n и (t) = f k i (t) i=l q-l n sign fgi (t) . i=l (4-95) в приведенных выше соотношениях i' i = 1, 2, ..., n, представляет собоп произвольный набор чисел, t - те значения этих чисел, при кото- рых достиrаются экстремумы функционалов в (4-93) и (4-94), а л, - множи- тель Ланrранжа, определяемый как т n q л= iki(t) dt. U i=l (4-96) Так как в доказательстве этой важной теоремы содержится по существу основной процесс решения проблемы моментов, то приведем это дока- аательство. Сначала по.кажем, что для выполнения условия теоремы необходимо, чтобы длл всех конечных наборов чисел l' ..., Sn для случая и (t) Е L p выпол- пялось неравенство: n (Т n q )1/ q il aii l i l iki (t) dt · rll:e l/ р + l/q -== 1, а для случая и (t) Е м - то же неравенство при q = 1: n Т n aii l iki (t) dt. (4-98) i=l о i=l (4-97) Пусть и (t) Е L p является решением бесконечномерной L - проблемы иоментов. Умножая обе части n первых равенств Т а i = k i ([) и (t) d t , i = 1, 2, ... (4-99) о на l' ..., n, складыпая их почленно, используя неравенство rельдера - Рпсса и учитывая 11 и 11 l, получим неравенство (4-97). Аналоrичным образом доказывается и (4-98). Теперь покажем достаточность Ilеравенств (4-97) и (4-98). Предположим, что (4-97) выполнено для всех :конечных наборов чисел l' ..., Sn. Зафикси- руем n и потребуем, воспользовавшись тем, что Si произвольны, чтобы вы- lIОЛНЯЛОСЬ дополнительное условие n aii = 1. i= 1 (4-100) Т Тоrда интеrрал 'у п = о n iki (t) i=l l/q dt имеет конечный минимум по всем i, удовлетворяющим ...условиям (4-100), так как в силу (4-97) и условия (4-100) он не меньше l-q. Наидем этот минимум помощью правила множителей 105
Ланrранжа, для чеrо положим равными нулю все частные производные от функции т n q (' n \q Sп (1' ... , п) = i l iki (t) dt - л i l aii) · Дифференцируя, получаем т n q-l : = iki (t) :J О j = 1 n ( n )q-l k i (t)sign i ! l iki (t) dt - лаi ; 1 ai; = о. (4-101) Умножив каждое из этих равенств на j и суммируя по i от 1 до п, полу- чим, учитывая (4-100), что в точке экстремума т n q Уn = \ iki (t) dt = л; (4-102) о i=1 т n ah = k i (t) -- ! ki (t) О i=1 q-1 n sign fk; (t) dt. i=1 ( 4-103) Сравнивая (4-103) и (4-99), получаем n Iq-l n I и (t) = ! fgi(t) I Sign! tki (t) , (4-104) i=l I i=l rде л определяется из (4-96) или (4-102). Таким образом, доказано существование функции U (t) и определен ее вид. Теперь воспользуемся полученным результатом для окончательноrо ретпения начатоrо выше примера для случая, коrда оrраничивается функцио- HaJl т [1 Ul (t) 12 + I и2 (t) 12] dt)I/ J [. о Так как при этом q = р == 2, то из (4-104) и (4-102) имеем U (t) == [-q I GK (t)Q-1sigПGК (t), (4-105) (4-106) так как в нашем случае [ t21 -t 2 - ;lt + 2 K (t) = [1' 2' Ы -:. = r lt2 - 2t + al. Отсюда: иl (t) == [2 (- lt + ;2); } и2(t)=12( lt2_2t+bl. Числа 1' 2 И 3 определяются из уравнения т in [(-61t+bl2+( Ьt2_2t+68УJdt=-, 113 О - ( 4-107) 108
n овие t,ja,j = 1 принимает вид причем усл \:,,, " i=l Gl = 1. Тоrда необходимо минимизировать интеrрал т J = l (- t + Ы 2 + (1- t 2 - 2t + з У] dt. u Для этоrо нужно найти G2' удовлетворяющее системе уравнений т ;: = 2 [( - t + 2) - (1- t 2 - 2t + з ) tJ dt = О; о т aJ \ (1 ) дGз == 2 "2 t 2 - G2 t + Gз dt == О . u Интеrрируя, получаем - Т2. + G2 T - Т4 + -.!.. 2ТЗ - Gз Т2 - о. 2 8 3 2 -, 1 1 - ТЗ - - У=2Т2 + tзТ == О 6 2 \:, · Решая эти алrебраичеСRие уравнения, найдем т Т2 t - t- \:,2.--2' \:,3-12' Подстановка найденных значений в (4-107) и интеrрирование дает Тб + -.!.. тз - 1. 720 2 - l2. Наименьший положительный корень То этоrо менем оптимальноrо переходноrо процесса. Вычислив То и подставив в (4-106), получаем, иl (t) == [2 ( Tg _ ТО t +) · 12 2 2' и2 (t) = [2 ( O - t) . Теперь рассмотрим случай оrраничения по модулю управляющих воз- действий уравнения и будет вре- искомое решение: ( 4-108) I иl (t) I 11, I и2 (t) I [2. Введем новые переменные для выражения управляющих воздеifСТВИЙ: 1 1 Vl (t) == [1 иl (t), V 2 (t) == l:z и 2 (t). Они, очевидно, оrраничены по модулю одной и той же величиной l: I Vl (t) I 1, I V2 (t) I [. Положим р == (х) и примем за норму величину 11 u 11 = шах (1 Vl (t) 1, I V2 (t) I ) 1. tE[O, Т] 107
При р = 00 из (4-106) получаем Vl (t) = 1 sign (- lt + Ы; t V2 (t) = 1 sign ( lt2 - 2t + з). f rде 1 = 1, а 2 и 6з определяются из уравнения т min \ (I-Slt+S21+\ t2_S2t+зl)dt=+. lla Минимум этоrо интеrрала достиrается при t _ Т t _ 3 Т2 2 - 2 и 3 - 32 · Т найдется из уравнения 111 32 ТЗ + 4 т == -r · (4-109) Подставляя наименьший положительный корень То этоrо уравнения в (4-109), получаем: Vl (t) = 1 sign ( O - t); 1 V2 (t) = 1 sign ( ;2 T- O t + ). J (4-110) Конечно, аналоrичное решение можно было бы найти и с помощью прин- ципа максимума, но получаемое при этом уравнение Ui (t) == 1 sign {Ч' (t) B}i, rде определяется из уравнений d'l' -=-'Р'А dt ' дает семейство экстремалей, из которых надо выделить одну, удовлетворяю- щую заданным краевым условиям. Это достаточно трудоемкая задача, и в данном случае применение L-проблемы моментов приводит к цели более быстро. В более сложных задачах для отыскания коэффициентов 1 используется метод аппроксимации в пространстве L g , которая давала бы наилучшим образом (В смысле метрики пространства Lq)приближение функций линейными комбинациями. Поскольку в теории аппроксимации получен ряд rотовых полезных результатов, которые непосредственно MoryT быть использованы при решении задач оптимации, этот метод обладает определенными достоин- ствами [242, 13, 152]. В частности, мноrие важные в практичеСКIIХ применениях переходные функции образуют системы Чебышева и позволяют поэтому использовать аппроксимацию функционалов мноrочленами Чебышева, для которых в тео- рии аппроксимации составлены детальные таблицы. Решение ряда задач оптимальноrо управления, базирующееся на l-проб- леме моментов, приведено в [36-40] и [80, 81].
rЛАВА ПЯТАН СТАТИСТИЧЕСКИЕ МЕТОДЫ В ТЕОРИИ ОПТИМАЛЬНЫХ СИСТЕМ 5-1. Развитие статистических методов в теории оптимальных систем Статистические методы в теории оптимальноrо управления применяются в тех случаях, коrда информация о системе и среде оказывается неполной: либо не известны воздействия на систему, либо часть ее параметров изменяется не известным заранее, слу- чайным образом и т. д. В этих случаях возникает естественная мысль - восполнить недостающие сведения путем задания на основе эксперимента или же некоторой rипотезы каких-либо характеристик случай- ных факторов (кривой распределения, плотности распределения, моментов случайных функций и т. п.). Статистическое направление в теории оптимальных систем перво- начально возникло на основе теории оптимальной фильтрации А. Н. Rолмоrорова - Н. Винера. Первой по времени была ма- тематическая работа А. Н. Rолмоrорова [67], в которой излаrа- лись вопросы интерполяции и экстраполяции случайных после- довательностей и по существу был дан математический аппарат для исследования нахождения уравнений стационарных дискрет- ных систем, оптимальных в смысле средней квадратичной ошибки. Непосредственное использование результатов А. Н. Rолмоrорова в автоматике началось после появления работы Н. Винера [269], который распространил теорию на непрерывные системы. С этоrо момента началось интенсивное развитие теории статистически оптимальных систем. Простейшая линейная задача нахождения оптимальноrо филь- тра в системе, на которую действуют стационарные случайные полезный сиrнал и помеха, была рассмотрена в части 11 (rл. 3). В [162] было показано, что при воздействии на вход системы суммы математическоrо ожидания полезноrо сиrнала, выражен- Horo полиномом и центрированной стационарной случайной Функ- l:ИИ, методы определения, развитые Л. Зада и Дж. Раrаццини 109
[270-272] ПОЛНОСТЬЮ применимы и к более общему случаю, коrда входной сиrнал содержит, :кроме Toro, полином со случайными :коэффициентами. В работах В. с. Пуrачева [137, 139, 145] дается важное обоб- щение проблемы оптимизации по минимуму средне:квадратичной ошиб:ки. Для нахождения линейноrо оператора А, преобразую- щеrо входной сиrнал Z, содержащий некоторый полезный сиrнал и помехи, w * == Az так, что выходной сиrнал системы w * в лю- бой момент времени приближается к требуемому сиrналу w с наи- меньшей среднеквадратической ошибкой, получено интеrраль- ное уравнение для матрицы весовых функций g (t, "(), которая и определяет оператор А: t g(t, 't)rz('t, a)d't==rwz(t, а), t-Tat, (5-1) t-T rде r z (t, t') и r wz (t, t') - соответственно матрица моментов йто- poro порядка составляющих вектора входных сиrналов z и матрица смешанных моментов BToporo порядка составляющих век- тора требуемых выходных сиrналов w и вектора входных сиrна- лов Z, а [t - т, t] - интервал времени, в течение KOToporo вход- ной сиrнал действует на систему. Т равно полному времени работы системы или ее памяти. В [145] дано решение уравнения (5-1) методом канонических разложений. В [8-10] показано, что при любом критерии, представляющем заданную функцию моментов ошибки системы первоrо и BToporo порядков (критерий экстремума заданной функции математи- ческоrо ожидания и дисперсии ошибки) f (М {Е}, D {Е}) == extremum, (5-2) задача также сводится к уравнению (5-1). В [47] исследован вопрос о реализации оптимальных систем с помощью аналоrовых вычислительных устройств. К сожалению, общие методы дают лишь общую характеристику оптимальной системы в целом. Для получения оптимальных ха- рактеристик корректирующих цепей в замкнутой системе прихо... дится делать пересчеты, оказывающиеся сравнительно неслож... ными лишь в простейших линейных стационарных системах. Не.. смотря на большое число работ в этом направлении, задача не.. посредственноrо определения характеристик реализуемых цепей еще далека от завершения в основном из-за отсутствия достаточ- Horo числа исходных статистических характеристик. Параллельно с исследованием линейных велись работы и по нелинейным системам. Основополаrающей работой в этом направ- лении является работа В. А. Котельникова [72], в которой впер- вые решалась задача об обнаружении сиrнала на фоне белоrо Jпума по критерию минимума вероятности ошибки. 110
Разработка теории нелинейных оптимальных систем шла по двум основным направлениям. Одно из них основывается на кано- нических разложениях случайных функций [145]. Разработанные методы позволяют, решая систему линейных интеrральных урав- нений, определять весовые функции для нелинейных оптималь- ных систем, приводимых к линейным по тем же критериям, для которых развиты методы оптимизации линейных систем. Второе направление основывается на теории статистических решений. Интересен результат, полученный с помощью общей теории статистических решений: в случае нормально распределенных сиrналов и помех при любой функции потерь, представляющей собою неубывающую функцию модуля ошибки, получается одна и та же оптимальная система, причем эта система линейна [141, 145, 143]. Эта система может быть получена, следовательно, и по критерию минимума средней квадратической ошибки, для кото- poro разработано наибольшее количество практических при:меров решения [141-144]. Для решения нелинейных задач, относящихся к замкнутым системам со случайными помехами, неоБХОДИ1vIО учитывать и не- полноту информации об объекте и ero характеристиках и случай- ные шумы. Это потребовало привлечения новых математических средств (динамическое проrраммирование, теория статистических решений). Одним из направлений в этой области была теория дуальноrо управления [185, 188, 189], рассматривающая за:мкну- тые системы, в которых управляющее устройство имеет непол- ную информацию об объекте, а случайные помехи и изменения характеристик объекта не дают возможности MrHoBeHHo получить требуемую информацию. В таких системах оптимальное управ- ление имеет двойственный (дуальный) характер - изучение об- становки и направление системы к желаемому состоянию. Ниже будут рассмотрены основные положения этой теории, которую можно рассматривать как мост, связывающий оптимальные и са- монастраивающиеся системы автоматическоrо управления. 5-2. Системы без накопления информации Реализации процессов в системах с неполной информацией не MoryT быть cTporo оптимальными, и можно rоворить лишь отно- сительно оптимизации тех или иных вероятностных характери- стик процессов в таких системах. Рассматриваемые в настоящем параrрафе системы MoryT быть сведены к общей структурной схеме, показанной на рис. 5-1. Замкнутая линейная система состоит из управляемоrо объекта О и корректирующеrо звена КЗ. На систему действуют задающее воздействие х о (t) и помеха z (t). Обе эти величины рассматрива- ются в случае мноrомерных систем как векторы. Задача состоит 111
н том, чтобы выработать управляющее воздействие и (t) (т. е. в :ко- нечном счете синтезировать корректирующее устройство КЗ) так, чтобы обеспечить минимизацию HeKoToporo критерия оптималь- ности. В этом смысле задача аналоrична задачам, рассматривав- шимся в предыдущих rлавах. Однако в ней имеется и ряд суще- ственных отличий, обусловленных тем, что переl\tlенная z (t) является случайной функцией времени. Даже если бы мы знали те- кущее значение z и все ero преДПlествовавшие значения, то такое полное знание текущеrо состояния и предыстории помехи не дает возмоя-\ности точно и определенно предсказать будущее поведение системы в любой момент времени. Текущее состояние и вся пред- ыстория не содерiнат полной информации, необходимой для стро- roro решения задачи об оптимизации, если только хотя бы одно из воздействий на систеl\tlУ оказызвается случайной функцией вре- мени. Поэтому системы со случайными переменными относятся к классу систем с неполной ин- формацией. Среди систем снеполной ии- Х]"ь формацией наиболее близки !{ си- стемам с полной информацией такие системы, в которых нет на- добности накапливать информа- цию о предыстории системы. Ра- зумеется, такое отсутствие изуче- ния предыстории должно оправдываться тем, что мы заранее знаем: ряд свойств и характеристик случайной функции z (t), т. е. располаrаем априорной информацией о случайной функции. Один ИЗ основных подходов к решеНИIО подобноrо рода задач 11 со- стоит В том, что мы заменяем точную и полную информацию о состоянии и поведении системы информацией о вероятностных характеристиках, которая считается полной. При этом решение становится ВОЗМОiННЫМ, но, конечно, в статистическом смысле: определяются вероятностные характеристики оптимальноrо про- цесса, минимизируется вероятностная характеристика (обычно математическое ожидание) ПОI{азателя оптимальности и т. д. Наиболее развитой в это:м: смысле является теория оптималь- ных чисто случайных и марковских процессов. Накопление ин- формации в таких системах бесполезно. В TOl\1 случае, Rоrда знаем, что z (t) представляет собою чисто случайный процесс (или марковский процесс), знаем ero распре- деление вероятности, измеряем текущие значения z (t) и всех осталь- ных необходимых переменных, полностью знаем воздействие х о (t) и оператор объента, то мы имеем дело (в соответствии с тер- минолоrией А. А. Фельдбаума) с системой с максимальной (но неполной) информацией [188]. С подходом и методикой решения задач об оптимальном управ- лении в системах с максимальной информацией познакомимся на '] КЗ u о х Рис. 5-1. 112
lIесложном примере непрерывной системы. Более сложные виды систем и помех рассматриваются в работах [119, 187, 206, 220, 222, 227, 228] и др. Начнем с рассмотрения довольно общей постановки задачи оптимальноrо управления для случая, н.оrда помеха представляет собою чисто случайный процесс, представляющий собою ди- снретную последовательность независимых случайных величин с нор}IалыIмM распределением. Интервал между Дискретами ра- вен I1t. Помеха является аддитивной (т. е. арифметически суммируемой с неслучаЙНЫl\fИ воздействиями). Пусть уравнение системы - обыкновенное нелинейное диффе- ренциальное уравнение первоrо порядка: dx di = f (х, и, t) + s (t), (5-3) rде х - :координата; и - управление; - характеризуется м:ате- а 2 (х t) матическим ожиданием т (х, t) и дисперсией 11 't . Наличие t в apryMeHTax вероятностных характеристик указывает на то, что процесс в общем случае нестационарный. Процесс х (t) представ- ляет собой реальный марковский процесс. Малое приращение dT, как выте:кает из (5-3), может быть записано в виде I1х == f I1t -t- I1t, (5-4) rде I1t также распределена нормально, имеет среднее значение .0'2 т t и дисперсию t (l1t)2 == 0'2 t. Плотность распределения вероятности 1 {( i1t - т I1t)2} р ( I1t) == r -- ехр - 2 2 i1 . V 2na 2 i1t а t (5-5) Условная плотность вероятности для приращения I1х при фиксированных х и t получится, если мы в (5-5) заменим t ero выражением, определенным из (5-4): р (x\ x,t) == 1 ехр {_ (i1 - f I1t - т I1t)2 }. (5-6) У 2na211t 20'2 i1t IIYCTb критерий оптимальности, сформулированный по тех- нико-экономическим соображениям для систеIЫ в предположении отсутствии помех, т. е. первичный :критерий, выражается Функ- ционалом т J 1 = F (х, и, t) dt. t o (5-7) При наличии помех /1 становится случайной величиной и, сле- довательно, задача о минимизации ero становится бессмысленной. 113
Чтобы можно было решить задачу об оптимальном управлении, необходимо вместо случайной величины J 1 выбрать в качестве критерия детерминированную величину - статистический кри- терий оптимальности. Наиболее естественно для формирования статистическоrо критерия оптимальности использовать первичный критерий, например, принять в качестве статистическоrо крите- рия оптимальности математическое ожидание величины J 1 : J = м {J 1 } = М {[ F(x, и, t) dt}. (5-8) Для нахождения оптимальноrо управления u * (t) можно воспользоваться методом, применяемым в динамическом проrрам- мировании. Разобьем интеrрал в (5-8) на два интеrрала: т to+dt Т F(x, и, t)dt== F(x, и, t)dt+ F(x, и, t)dt t o t o to+dt т F (х о , и о , t o ) dt + F (х, и, t) dt. (5-9) to+dt Первое слаrаемое получено в результате разложения в ряд Тейлора по степеням малоrо t первоrо из интеrралов и отбрасы- вания малых выте первоrо порядка. Предположим пока, что за время t перемещение определено при некотором фиксированном на интервале t значении и о , и считаем, что в дальнейшем при t > t o + t управление опти- мально. Тоrда в соответствии с принципом оптимальности М' {f F (х, и, t) dt'J == F (х о , и о , t o ) t 1- min М { f F (х, и, t) dt} == t o иЕU to+dt == F (х о , и о , t o ) dt + J* (х о + dx, t o + L\t), (5-10) rде звездочкой отмечено минимальное значение критерия при за- данных оrраничениях u Е и и t o + t t Т. Через М' мы в этих формулах обозначили математическое ожи- дание Rритерия при некотором определенном перемещении x. Но так нак dx величина случайная, то действительное зна- чение статистическоrо критерия должно быть получено путем усреднения величины М' по всем dx, т. е. путем выполнения опе- рации нахождения математическоrо ожидания. Обозначим эту операцию М dX. Тоrда J (х о , t o ) == М dx {F (х о , и о , t o ) + J* (х о + x, t o + Дt)} == = F (х о , И о , t o ) + М dx {J* (х о + x, t o + dt)}. 114
Первое слаrаемое как величина определенная из-под знака математическоrо ожидания вынесена. Раскрывая операцию мате- матическоrо ожидания (СМ. часть 11, стр. 87), получаем J* (х о , t o ) = mln {F (х о , по, t o )!1t + + J* (х о + L\x, t o + L\t) Р (L\x I хо, t o ) dQ (L\x)}. g (l\x) Так как за начальную точку Х о , t o можно принять любую точку начальной траектории, будем опускать индексы «О»: J* (х, t) = mn {F (х, п, t) f..t + + J* (х + L\x, t + L\t) Р (x I х, t) dQ (L\x)}. Q (Ах) Так как Р - плотность вероятности, то P(xlx, t)dQ(Дх)==1. Q (l\x) (5-11) (5-12) Разложим функцию J * (х + L\x, t + L\t) в степенной ряд, сохранив в разложении члены до BToporo порядка малости. Част- ные производные J * по х и по t, не содержащие переменной ин- теrрирования L\x вынесем из-под знака интеrрала. Получим J* (х, t) == min {F (х, п, t) f..t + J* (х, t) Р (f..x I t, х) dQ (f..x) + и g (l\x) aJ* С aJ* \ + ах д.хР (L\x I х, t) dQ (д.х) +ш L\t Р (дХ I х, t) dQ (дХ) + Q (l\x) g (Ах) 1 a 2 J* \ +2 дх 2 (Дх)2Р(хlt, х)dQ(Дх)+ g (l\x) (At)2 a 2 J* \ +дt2 Р(дхlх, t)dQ(Дх)+ Q (l\x) a 2 J* \ } +L\t axat j дхр(дх\х, t)dQ (L\x)+... · g (l\x) Учтем равенство (5-12), вынесем J * (х, t) из-под знака мини- мума и сократим ero с тождественным выражением в левой части; разделим почленно полученное равенство на t и устремим I1t R нулю. Учтем также, что в соответствии с определением матема- тическоrо ожидания дхР (L\x I х, t) dQ (x) == f L\t + т L\t. Q 115
Из теории вероятности также известно, что (x)2 Р (x I х, t) dQ (x) = 02t + (т t)2 02t, J так как т 2 (t) 2 имеет второй порядок малости. Приняв во внимание все сказанное выше, получим следующее уравнение в частных производных: aJ* . { aJ* 02 8 2 J*} -дt=mn Р(х, и, t)+(f+т) дх +2 дх2 · Уравнение (5-13) представляет собою распространение урав- нения Беллмана на случайные процессы. Из этоrо уравнения на- ходятся оптимальное управление и * и J *. Для объекта высо:коrо порядка, описываемоrо уравнениями (5-13) dx. d/ =!i(X 1 , ..., Х n ' U)-+-8ij' (5-14) rде i = 1, 2, ... , j, ... , n, i j ::::.; n; б ij - символ Кронекера, если чисто случайный процесс со средним значением т и диспер- сией (12/ t, то уравнение Беллмана принимает вид: { n l ]) aJ* . aJ* а 2 a 2 J* - дt = :n F (х, п, t) + fl (тбiJ + fi) BXi + 2 Bxi · (5-15) Рассмотрим пример, коrда объект описывается линейным диф- ференциальным уравнением первоrо порядка: dXl dt = и. (5-16) На величину и никаких оrраничений не накладываем. Задаю- щее воздействие Х 2 представляет собой марковекий случайный процесс. Для математическоrо описания часто оказывается удоб- ным представить марковский случайный процесс как результат воздействия белоrо шума (чисто случайноrо процесса) со сред- ним значением т = О на инерционное звено dX 2 t dt =-X2+. ( 5-17) Уравнения (5-16) и (5-17) можно рассматривать как уравне- ния HeKoToporo эквивалентноrо объекта, находящеrося под воз- действием белоrо шума. Пусть далее первичный критерий опти- мальности задан в виде функционала т J 1 = [(Х 1 -х 2 )2 + и 2 ] dt. t o (5-18) 116
Уравнение (5-15) при зтом примет вид: aJ* _ . { 2 2 aJ* aJ* 0'2 a 2 J*} - де- mn (Х 1 - Х 2 ) + и + и дХ1 -Х 2 дх! +2 дx · (5-19) Дифференцируя правую часть (5-19) по и и приравнивая про'" изводную нулю, находим условие ее миниму:ма: aJ* 2и*+-д =0. Хl Отсюда находим оптимальное управление 1 aJ* u*---- - 2 дх! · (5-20) Подставим (5-20) в (5-19): aJ* _ 2 1 (aJ*)2 aJ* 02 a 2 J* - at- XI-X2) -"4 дХ1 -Х 2 дх'}, +2 дx · (5-21 ) Для решения задачи удобно перейти к «попятному движению)>, введя переменную l' = Т - t. Тоrда (5-21) принимает вид: aJ* 1 (aJ*)2 aJ* 02 a 2 J* д,; == (X 1 - х 2 )2 - 4" aXl - Х 2 дХ2 +"2 дx · rраничные условия: J* (Х 1 , Х 2 , l' == О) == О для всех Х 1 , Х 2 ; (5-22) J* (Х 1 , Х 2 , Т) (х) при Х 1 -+ (х) X2OO в самом деле, при Т = О имеем t o = t = Т, и интеrрал (5-18) обращается в нуль. Ищем решение уравнения (5-21) J * (х, Т) В виде ряда J * (х, Т) = k o (Т) + k i (Т) x i + kij ('t) XiXj +. . . , (5-23) который подставляем в (5-21) и, приравнивая коэффициенты при одинаRОВЫХ степенях X i , находим k i . Сразу убеждаемся, что лишь k o (Т) И k ij (Т) отличны от нуля, причем можно выбрать k i . = k ji . Получаем дифференциальные уравнения относительно k o , k 11t k 12 , k 22 , которые решаем при начальных условиях k o (О) = = k ij (О) = о. в конечном итоrе получаем J* (х 1 , Х 2 , Т) = k o (Т) + k 11 (1") xl + 2k 12 (1") Х 1 Х 2 + k 22 (Т) X (5-24) и из (5-20) и (5-24) и * == - k 11 (t) Х 1 - k 12 (1") Х 2 . (5-25) На рис. 5-2 ПОRазаны rрафики, изображающие решение этих уравнений. 117
Управляющее устройство может быть выполнено по структур- ной схеме, показанной на рис. 5-3. Блок D на самом деле не ну- k жен: он лишь показывает, как 1,0 в соответствии с уравнениями (5-17) чисто случайный процесс S преобразуется в марковский 0,5 Х 2 (t). Блок В представляет со- бой объект, блок А - управляю- щее устройство. Оно состоит из двух блоков умножения Лf3 1 и М3 2 . Сомножители -k 11 (,;) -0,5 и -k 12 (,;) вырабатываются в вы- числительном устройстве В У, ко- торое приближенно можно вы- -(О полнить В виде проrраммноrо Рис. 5-2. устройства, реализующеrо заранее построенные rрафики (на рис. 5-2) для решений уравнений относительно коэффициентов k o , k 11 , k 12 И k 22 . Е. r - ------ --- -----1 r--------------- --, D I А I I I f I I Х? I I МЗ 2 r--------., I В I I r IU f I I I I I I I I I I I I I I I L..________J х., -1 МЗ I L_______________J -k -k 11 I I ВУ I I J I I I I ________________J Рис. 5-3. 5-3. СистеМbI с неа8ВИСИМblМ накоплением информации В предыдущем параrрафе были рассмотрены системы, в ко- торых накопление информации о предшествующем поведении бес- полезно и поэтому не производится. Но rораздо чаще накопление информации и последующее ее использование для управления процессом позволяет существенно улучшить управление. Очевид- но, что накопление информации может оказаться полезным в тех случаях, коrда воздействия на систему представляют собою слу- чайные процессы, более сложные, чем маРКОВСRие, но даже и в слу- 118
чае марКОВСRИХ процессов накоплене информации будет полез- ным, если измерение полезноrо сиrнала происходит с поrрешностью или если результат измерения проходит через канал с шумами. При наличии накопления и последующей обработки накоп- ленной информации схема системы естественно усложняется. Рассмотрим простейшую разомкнутую систему с накоплением информации (рис. 5-4). В этой схеме безынерционный объект В на выходе Х должен воспроизводить задающее воздействие Х о . Имеются два безынерционных канала связи с помехами: канал Но, связывающий управляющее устройство А с задающим воз- действием Х о , и канал G, связывающий объект В с управляющим устройством. В канале Но действует шум h o , в канале G - шум g. Вследствие наличия шумов входы управляющеrо устройства у и объеита v отличаются соответственно от задающеrо воздей- ствия Х О и выработанноrо управляющим устройством управля- ющеrо воздействия и. :Кроме Toro, непосредст- венно на объект действует помеха z. Требуется выработать такое управляющее воз- действие, чтобы показа- тель оптимальности, или, как ero принято называть в задачах подобноrо рода, функция потерь W (Х о , х), был :м:инимальным. Поскольку, однако, величи- ны Х О и х случайные, то и W оказывается случайной функцией, поэтому при построении оптимальноrо управления надо rоворить о минимизации не самой функции W, а некоторых ее вероятно- стных характеристик. Будем в качестве вторичноrо критерия оптимальности использовать математическое ожидание функции (5-26) по 9 1 :ХО "но у А u G v в х Рис. 5-4. r==M {W(X o , х)} и называть это математическое ожидание у Д е л ь н ы м р и - с к о м. Задающее воздействие хо в рассматриваемых задачах также является случайным процессом. Если бы х о был полностью де- терминирован, то задача ero измерения теряла бы смысл. Но если х о случайный процесс, то и риск r будет случайной функцией, поэтому для получения реrулярноrо критерия оптимальности r нужно усреднить по всей области Q (Х О ) возможных сиrналов. В результате TaKoro усреднения находится n о л н ы й или с р е Д н и й р и с к R: R=M {r}== r(Xo, X)P(Xo)dQ. (5-27) Q Так же как и в предыдущем разделе, для Toro чтобы можно было реlПИТЬ задачу об оптимальном управлении, нужно задаться априори рядом зависимостей и характеристик, а именно: 119
1. Априорные вероятностные характеристики случайноrо про- цесса Х О (например, плотность вероятности Р (х о )). Отметим, что в практических задачах эти априорные характеристики MoryT быть заданы не всеrда. 2. Вероятностные характеристики шума h o в канале 110. 3. Способ комбинации сиrнала х о и шума }o в канале НО. 4. Оператор объекта х == F (z, v). 5. Априорные вероятностные характеристики случайноrо про- цесса z. 6. Вероятностные характерИСТИRИ шума g. 7. Способ комбинации шума g и сиrнала u в канале G. 8. Выражение функции риска w. Требуется выработать оптимальное управление и *, т. е. та- кое управление, которое минимизировало бы средний риск R. В изложенной постановке задача пока принципиально не от- личается от задачи без накопления информации, рассмотренной в предыдущем параrрафе, различие пока состоит лишь в количестве данных (три помехи вместо одной). Существенное раз- личие, однако, возникает тоrда, коrда на основании ряда измерений величины у в преДlпествующие моменты времени мы можем уточнить вероятностную характе- ристику процесса Х о , т. е. найти ero а п о с т е р и о р н у ю в е р о я т н о с т н у ю х а р а к т е- р и с т и к у. В том случае, коrда характер процесса измерения и обработки измеренной информации не зависит от процесса управления и, мы имеем дело с н е з а в и с и м ы м н а к о п л е н и е м и п- Ф о р м а Ц и и. Для Toro чтобы ознакомиться с меТОДИRОЙ решения задач дан- Horo типа, начнем с раССl\fIотрения одной из Составных частей си- стемы, а именно той ее части, rде происходит измерение и уточне- ние вероятностных характеристик задающеrо воздействия Х о . Блок-схема этой части показана на рис. 5-5. На ней показаны: канал связи Но и часть управляющеrо устройства ПР, выраба- тывающая некоторый сиrнал d, содержащий в себе указание, ос- новыающеесяя на результатах наблюдения предыстории у (t) о том, нак надлежит действовать далыпе. Этот сиrнал d назовем решением о том, к какому классу следует отнести ПОСТУПИВIIIИЙ на вход устройства принятия решения ПР сиrнал. В зависимости от типа требуемоrо решения d можно указать слеДУlощие основ- ные типы теории статистических решений. 1. Теория двуальтерuативuыlx решепuи. Случайный процесс зависит от одноrо неизвестноrо параметра л: h o ха Но и ПР d Рис. 5-5. Х О = Ха (t, л). 120
Например: Х О = л sin ((оо! + <1'0)' rде 000 и сро заданы. Параметр л при этом :может принимать лишь одно из дву х зна- чений: либо л 1 , либо л 2 . В частном случае, коrда Л 2 == О, Л 1 *- О, получаем з а Д а ч у о б н а р у ж е н и я с и r н а л а. В более общем случае л может быть мноrомерным вектором, 1,аждая компонента ROToporo мо}кет принимать одно из двух зна- чений Лl или Л2: { Л11' Л 12 ' ').. - ИЛИ ')..21. ')..22' , Л 1m , л 2m . в этом случае MoryT быть два решения, каждое из них должно выражаться определенным сиrналом. 2. Теория жпоеоадътерпативпЬLХ решепий. В этом случае па... раметр л может иметь r различных значений, и решения d должны выражаться посредством r различных сиrналов, соответствующих r значениям параметра л. 3. Теория оцеп1itи параметров. fIapaMeTp л может принять лю- бое из бесконечноrо множества значений в некоторой области Q (л) с априорной плотностью вероятности Р (л). Теория оценки параметров дает В03l\10ЖНОСТЬ выработать бесчисленное мно- жество сиrналов d, обычно в форме функции d (л). 4. Теория оцеппи процессов. Параметр л является функцией времени л (t), и требуется оптимальным в каком-либо смысле об- разом оценить форму и параметры этой фУНЕЦИИ. Мы можем представить себе три конечно- или бесконечномер- ных, в зависимости от характера задачи, пространства; простран- ство сиrналов Х О == (х о1 , Х 02 , ... , ХОт), пространство наблюдений у == (Уl, У2' ... , У т) и пространство решений D == (d 1 , d 2 , ... , d 1 ). Так как каждому наблюдению Yi должно соответствовать свое решение d, то пространство решений представляет собою ото- бражение пространства наблюдений, а правило отображения, ноторое является одновременно и алrоритмом управляющеrо (или приемноrо) устройства, в теории статистических решений на- зывается с т р а т е r и е й у с т рой с т в а. Возможны два типа стратеrий - реrулярные, rде каждой точке пространства У соответствует определенная точка простран- ства D, и случайные, rде каждому фиксированному У соответст- вует некоторая плотность распределения вероятности (D /У) то- чек пространства D. Реrулярную стратеrию можно рассматривать как предел слу- чайной стратеrии, коrда дисперсия точек пространства D, со- ответствующих наблюдаемому вектору У О , стремится к нулю и ТОЧЕИ D пространства Rонцентрируются в беСRонечпо малой 121
окрестности точки D o , соответствующей Х О по реrУJIЯРНОЙ стра- теrии. В пределе для реrулярной стратеrии d (D I УО) = <5 [D -- D o (У О )], (5-28) rде о - дельта-функция. Функция d (D 'У О ) называется реш а ю щей Ф у н к Ц и- е й. Теория статистических решений указывает методы опреде- ления оптимальных решающих функций на основе критериев оп- тимальности, связанных с ошибками решения. Если решение D оказалось неправильным в оценке сиrнала Х о, то ошибка реше- ния оценивается функцией потерь W == W (Х О , D), которая должна иметь наименьшее значение при правильном решении. Часто в качестве функций потерь принимаются функции вида с Е (Xi - d i ) 2, С I Xi - d i I и т. д. Про с т о й и л и э л е- м е н т а р н о й Ф у н к Ц и е й п о т ерь называют функцию вида: { -00, Xo=D W (Х О , D) = 1 - 6 (Х О - D) = 1, Х О "* D. (5-29) у с л о в н ы м р и с к о м называют математическое ожида- ние функции потерь при фиксированном сиrнале Х о: r (Х О , D) == М {W (Х О , D)} == W (Х О , D) Р (D IX o ) dQ. (5-30) Q(D) При этом, если известен закон действия решающеrо устрой- ства, то Р (D I Хо) = d (D I У) Р (У I Хо) dQ. (5-31) g (У) Плотность вероятности Р (У I Хо) может быть найдена, если заданы вероятностные характеристики шу:ма и способ комбина- ции сиrнала с шумом. Полный (средний) риск выражается зависимостью: R==M{r}= r(X o , d)P(Xo)dQ. g (ХО) Задачи теории статистических решений - это задачи о на- хождении решающих функций, минимизирующих средний риск. Очевидно, что вид оптимальной решающей функции зависит от вида выбранной функции потерь. Теория статистических решений дает возможность на основе данных наблюдений оценивать вероятностные хараRтеристики Р (Х О I У) (или Р (л I У), если л параметр, характеризующий Хо. При этом MoryT быть два основных типа задач. В первом типе (бейесовы задачи) до наблюдения известны некоторые априор- ные характеристики, например Р (Х о )' в результате решения за- дачи происходит уточнение априорной плотности вероятности (5-32) 122
р (х о ) и находится апостериорная плотность вероятностиР (Х О I У). Во втором типе задач априорные плотности вероятности неиз- вестны совершенно. Рассмотрим на простейшем примере двуальтернативноrо ре- шения бейесову задачу. Пусть задан вид функции измеряемоrо воздействия xo(t, л), rде л - параметр, принимающий одно из двух значений Л 1 или л 2 . Заданы априорные вероятности этих значений Рl и Р2. Решение d может принимать также два значения: { d1 (решение л == л 1 ) d== d 2 (решение л == л 2 ). Выберем функцию потерь в виде { О, w= 1, d=л} d-:/::-л ' (5-33) т. е. при правильном решении потери равны нулю, при непра- вильном - единице. Пусть условные вероятности решений d 1 и d 2 при фиксированном л равны р (d 1 I л) и р (d 2 1 л). .Удельный риск (5-30) определится суммой r (л, ) == w (л, d 1 ) р (d 1 1 л) + w (л, d 2 ) р (d 2 1 л). Выпишем значения удельноrо риска для значений Л 1 и Л 2 И учтем, что в соответствии с (5-33) w (л 1 , d 1 ) == w (л 2 , d 2 ) == о, w (л 1 , d 2 ) == w (л 2 , d 1 ) == 1. Тоrда: r (л 1 , ) == w (л 1 , d 1 ) Р (d 1 1 "'1) + w (л 1 , d 2 ) Р (d 2 1 "'1) == Р (d 2 1 А 1 ); } r (л 2 , L\) == W (л 2 , d 1 ) Р (d 1 1 "'2) + w (Л 2 ' d 2 ) Р (d 2 1 Л 2 ) == р (d 1 1 Л 2 ). (5-34) Интеrрал в формуле (5-32) среднеrо риска также заменяется суммой R == r (л 1 , ) Рl + r (л 2 , L\) Р2. Подставив (5-34), получим R = РIР (d 2 1 "'1) + Р2Р (d 1 I Л 2 ). (5-35) Величина р (d 2 1 л 1 ) = а есть вероятность получить решение л = л 2 , В то время как л = л 1 , т. е. вероятность ошибки при л = л 2 ; величина Р (d 1 I л 2 ) = есть вероятность ошибки при л = л 1 . В задачах об обнаружении сиrнала на фоне шума, rде "'1 = О, сх называется ошибкой «ложной тревоrи» (решаем, что 123
сиrнал есть, хотя на caIoM деле ero нет), а - ошибкой «ложноrо отбоя» (решаем, что сиrнала нет, хотя оп есть). Тоrда средний риск равен безусловной вероятности ОIПибки R=Q=Pl a +P2B. (5-36) в теории связи критерий оптимальности, равный безусловной вероятности ошибки, называется к р и т е р и е м R о т е л ь- н и к о в а. Таким образом, Фуннция потерь, выраженная в виде (5-29), приводит н критерию Котельникова. Название «бейесовы задачи» дано потому, что их реIПение может быть выполнено с помощью формул Бейеса, позволяющих определить апостериорные плотности вероятности по заданным априорным. Пусть л может принимать r значений л 1 , л 2 , ..., л r С априорными вероятностями р (л 1 ), Р (л 2 ), ..., р (л r ). Введем понятие о простран- стве наблюдений вентора У == (Уl, У2' ..., Ут). Если известна плот- ность вероятности в точке пространства Р (Уl, У2, ..., ут),то вероят- ность попадания нонца вектора внутрь элементарноrо объема dQ (У) пространства наблюдений Q (У) равна Р (У) dQ (У), ве- роятность же попадания в одну из точек Bcero пространства Q равна единице: р (У) dQ (У) = 1. g (У) (5-37) Вероятность Toro, что вектор параметров имеет значение л и одновременно Toro, что конец вектора У находится в объеме dQ (У) есть вероятность сложноrо события, ноторая, соrласно теории вероятностей, может быть определена через произведение вероятностей двояким образом: либо через вероятности Р (л) и р (У I л), либо через р (л I У) и Р (У) посредством выражения р (л) [Р (У I л) dQ (У)] = р (л 11Т) [Р (У) dQ (У). (5-38) Сократив на dQ (У), получим' формулу Бейеса для апостериор- ной вероятности ( I У) - Р (л) р (У I л) р I'v - Р (У) . (5-39) Функция Р (У I л), выражающая вероятность получить наб- людение У при фиксированном значении параметра л, называется Ф у н к Ц и е й п р а в Д о п о Д о б и я. Эта функция обычно может быть заранее установлена на основе рассмотрения конкрет- ной задачи, поэтому представляет интерес в правой части формулы Бейеса выразить Р (У) через Р (У I л). Сделать это можно, просум- мировав для разных j == 1, 2, ..., r левые и правые части выраже- ний р (Лj) р (У I Лj) = Р (У) р (Л j I У). 124
В результате суммирования получим r r Р(Лj)Р(Уlлj)=Р(У) Р(лjIУ)=Р(У), ;=1 ;=1 (5:.40) r так как сумма р (Лj 1 У) = 1. Тоrда формула Бейеса принимает ;=1 ВИД р (Лj I У) = ; (лj) р (У p.j) р (лj) р (У I Лj) ;=1 (5-41) Точно так же можно получить формулу Бейеса и для случая непрерывноrо распределения вектора л с априорной плотностью вероятности Р (л): р (л I У) - р (л) р (У I л) (5 42) - р (л) р (У I л) dQ (л) · - gp,,) Можно показать [189], что если в качестве критерия оптиаль- ности принять критерий В. с. Котельникова (5-36) или в качестве функции потерь - функцию вида (5-29), то решение бейесовой задачи выбора или оценки параметра сводится к нахождению TaKoro значения л, при котором апостериорная вероятность р (л I У) принимает максимальное значение. В зависимости от конкретных условий иноrда при решении задач типа бейесовых применяют видоизмененные критерии. Так, в теории связи часто применяются критерии, учитывающие, какая из ошибок «(ложной тревоrи» или «пропуска») наиболее опасна, которые содержат эти ошибки с различными весами. В частности, применяется критерий Неймана - Пирсона [252] - наименьшая вероятность пропуска сиrнала при заданной вероят- ности ложной тревоrи. Если, что часто встречается в практических задачах, мы имеем дело с совершенно новой системой, о поведении которой еще не накоплено никаких статистических данных и априорные вероят- ности в которых неизвестны, то такие задачи не относятся к типу бейесовых. Для их решения приходится прибеrать к различноrо рода rипотезам, основываясь на здравом смысле и интуиции. Еще на ранней стадии развития математической статистики со времен Лапласа, в случаях, коrда априорное распределение веро- ятности Р (л) неизвестно, часто прибеrали к rипотезе о том, что все значения л равновероятны, т. е. принимали априорную плот- пость вероятности постоянной. Если мы считаем Р (л) = const и Р (У) == const, то в формуле (5-39) апостериорная вероятность оказывается пропорциональной ФУНКIИИ правдоподобия. Это дает основание в качестве одноrо ив 126
методов в теории статистических решений принять, в случае, если априорные плотности распределения неизвестны, в качестве эври- стическоrо критерия оптимальности L к Р И Т е р и й м а к с и- м у м а п р а в Д о n о Д о б и я. Если задан вектор У, то функция правдоподобия Р (У I л) за- висит только от л: р (У I л) == L (л). (5-43) в соответствии справилом Р. Фишера, наиболее правдоподоб- ным считается то значение параl\tIетра Л, при котором функция прав- доподобия L (л) максимальна. Друrим распространенным в теории статистических решений методом решения является наиболее пессимистический м е т о Д м и н и м а к с а. В соответствии с этим методом сначала отыски- вается «наихудший>} сиrнал Х**, при котором условный риск r при данном будет максимальным: r (Х**, ) == тах r (Х*, ) )(* (5-44) далее находится такая решающая функция *, для которой наи- худший риск будет минимальным: r(X**, *)=minr(X**, )=minmaxr(X*, ). (5-45) А А х. Решение * называется м и н и м а к с н ы м, а соответствующая ему стратеrия - м и н и м а к с н о-о п т и м а л ь н о й. Минимаксная стратеrия дает наилучшие результаты в наихуд- ших условиях. Она появилась в теории иrр, rде иrрок ожидает наибольшеrо ущерба от противника. В случае же, коrда наихуд- шие условия маловероятны, минимаксная стратеrия может ока- заться не наилучшей. Основные понятия теории статистических решений, изложен- ные выше, весьма наrлядно интерпретируются в «пространстве рuск,а». Рассмотрим двуальтернативные решения, для которых пространство вырождается в плоскость и имеет наrлядную reo- метрическую трактовку. Реrулярные стратеrии изображаются на плоскости риска точками, координаты которых равны условным рискам для каждой из двух альтернатив. Значения риска r ("'1, D) откладываются по оси абсцисс, значения r (л 2 , D) - по оси орди- нат. Стратеrию можно считать тем лучшей, чем меньшие значения риска ей соответствуют. С этой точки зрения можем утверждать, что страстеrия D 1 лучше стратеrии D з (рис. 5-6), так как оба услов- ных риска ДЛЯ нее меньше, но сравнить стратеrии D 1 и D 2 ПО этому признаку уже нельзя. Случайные стратеrии на плоскости риска MoryT быть изобра- жены следующим образом. Пусть мы выбираем одну из двух стра- 126
теrий: либо D 1 с вероятностью Ql, либо D 2 с вероятностью q2. r-rаная случайная стратеrия D 4 (рис. 5-6) имеет условный риск r (л 1 , D 4 ,') = ql r (л 1 , D 1 ) + q2r (л 1 , D 2 ); } (5-46) r(л 2 , D 4 )== ql r (л 2 , D 1 ) +q2 r (л 2 , D 2 ). Если одна из стратеrий D 1 или D 2 выбирается обязательно, то ql + q2 = 1 и все стратеrии Di, соответствующие различным значениям Ql, будут изобра- жаться точками, лежащими на прямолинейном отрезке r{А 2 .D з ) D 1 D 2 . Стратеrии, при кото- рых MHoroKpaTHo случайным образом применяются раз- личные реrулярные страте- rии, называются с м е ш а Н- н ы М и с т р а т е r и я м и. Соединим прямой точки D з и D 4 (прерывистая линия на рис. 5-6). Любая точка D 5 на этой прямой соответст- вует новой сметанной стра- теrии, для которой применяется стратеrия D з с вероятностью qз и стратеrия D 4 с вероятностью q4' причем qз + q4 == 1. Нетрудно r(A{',D) r().?D) а) 6) п 4 r(A 2, 1J) --------------------- ="N З ./ ./ ././ /" " п, ./,,'/ r(A 2 JJ f } ------' /,,'/ I n 4 r(A 2 .D 2 } ------------- ])2 I I I I r(A,.lJ) r(ЛI,D) r(A 1 .D 2 ) r(A,. о Рис. 5-6. r( А,,])) D з н '..........f ...........DO h ......'(.5'1 " r(At,D) G Рис. видеть, что эта же точка соответствует применению стратеrии D 1 с вероятностью Qlq4, стратеrии D 2 с вероятностью Q2Q4 и стратеrии D з с вероятностью qз. Выполняя все аналоrичные построения для нескольких реrулярных стратеrий D 1 , D 2 , D з , D 4 , D 5 (рис. 5-7, а), убедимся, что любая из внутренних точек выпукло- ro заштрихованноrо мноrоуrольника, вершины KOToporo соот- ветствуют первичным реrулярным стратеrиям, соответствует не- которой сметанной етратеrии. 127
в бейесовых задачах средний риск равен R == P1r (Л 1t D) + P2 r (л 2 , D). (5-47) Линия R == const на плоскости рис:ка представляет собой пря- мую линию с уrловым коэффициентом - Р2/Рl. Величина риска R для этой прямой пропорциональна длине перпендикуляра, опу- щенноrо на прямую из начала координат, поэтому у:м:еньшению среднеrо риска R соответствует движение прямой влево, по направ- лению к началу координат. Для мноrоуrольника D 1 , D 2 , D з , D 4 , D 5 на рис. 5-7, а наименьшему значению риска соответствует вершина D 1 . В общем случае прямая с наименьшим R проходит через одну из вершин мноrоуrольника стратеrий и поэтому в общем СJIучае бейесова стратеrия есть стратеrия реrулярная. Лишь в частном случае, коrда прямая для наименьшеrо R совпадет с одной из сторон, бейесова стратеrия может оказаться смешанной. При минимаксном подходе оптимальная стратеrия D* обеспе- чивает наименьшее значение максимума условноrо риска, Т. е. для рассматриваемоrо изображения на плоскости - максимальноrо из двух возможных значений r (1..,1, D*) И r (1..,2, D*). ДЛЯ определе- ния минимаксно-оптимальной стратеrии проведем биссектрису OF в первом квадранте. Будем двиrаться из начала координат по биссектрисе. Если биссектриса пересекается с мноrоуrольником стратеrий, то точка первой встречи D* и определит минимаксно- оптимальную стратеrию. Действительно, для этой точки оба зна- чения риска равны между собою и меньше максимальноrо риска для любой друrой точки мноrоуrольника. В общем случае мини- максно-оптимальная стратеrия будет смешанной, поскольку встре- ча биссектрисы с контуром мноrоуrольника в общем случае про- исходит не в вершине. Если биссектриса OF не пересекает мноrоуrольника (рис. 5-7, б), то для определения минимаксно-оптимальной стратеrии с движу- щейся по биссектрисе точкой L надо связать вертикальную линию LG и rоризонтальную LH. Оптимальная стратеrия соответствует точке мноrоуrольника, впервые встретившейся с одной из этих линий (на рис. 5-7, б - точка D 1 ). В общем случае это вершина, и тоrда м:инимаксно-оптимальная стратеrия реrулярна. Рассмотрим систему, в которой задающее воздействие имеет вид: хо (t) = лj (t), (5-48) rде / (t) - заданная функция времени; л - параметр, который может при- нимать два значения л'l и Л2 С вероятностями Pl и Р2 соответственно. Так как одно из этих двух значений параметра возникает обязательно, то Рl + Р2 = 1. (5-49) Пусть шум h (t) складывается в канале связи с полезным сиrналом х о (t) аддитивно: у (t) == х о (t) + h (t). (5-50) 128
В системе делается r наблюдений в момеlIТЫ t 1 , t 2 , ..., t r велИlIИП Уl' !/2'...' Yr. Очевидно, Yi = xoi + hi = лf (ti) + hi. (5-51) Шум hi представляет собою последовательность независимых случайных величин с нормальной плотностью распределения и дисперсией а 2 : 1 {h } Р (h i ) = (J .,r21i ехр - 2;2 · Требуется оценить значение параметра Л, Т. е. установить, будет ли л === "'1 или", == "'2 по данным наблюдений Yl' У2"..' Yr. При решении задачи как с помощью формулы Бейеса, так и по методу м:аксимальноrо правдоподобия, нам нужно будет определить функцию правдо- подобия р (У I л). Из (5-51) имеем (5-52) h i = Yi - лf (ti)' (5-53) Подставляя (5-53) в (5-52), найдем р (у. I л) = 1 ехр {_ [Yi - лf (ti) ]2 } (5-54) а .,r 2n 202. Так как отдельные значения hi при разных i статистически независимы, то независимы и Yi - лf (tй, а плотность вероятности для множества вели- чин Уl' У2"..' Yr равна произведению r р (У I Л):.=: П Р (Yi I л) = i=l = (Jr (::rt)r I 2 ехр {- 22 . [Yi - Лf(t д ]2}. t= 1 (5-55) Апостериорные вероятности найдем по формуле Бейеса: р.р (У I л') Р(ЛjIУ)= РIР(УI1)+Р2(УI) ' j==1, 2. (5-55) Нам надо выбрать то из значений л, ROTopoe дает максимум либо апост риорной вероятности, либо функции правдоподобия. Поэтому удобно найти Отношение правдоподобия, равное д. (У) = L (Лl) = Р (У I Лl) L (Л2) р (У I л 2 ) . (5-57) Отношение апостериорных вероятностей равно р (Лl I У) = Рl Л (У) р (Л21 У) Р2 · (5-58) При решении задачи по методу максимума апостериорной вероятности, Получим I л'1, л= л 2 , если Рl Л (У) > 1 ) Р2 . Рl Л (У) < 1 Р2 (5-59) если 129
При ретении по методу маJ{симума nравдоподобия получим ;1;pyroe зна.. чение пороrа: л = { л'1, если Л (У) > 1 } . Л2' если Л (У) < 1 В случае нормальноrо распределения лоrарифмируем (5-55) и обозна- чаем (5-60) r r [Yi - лJ (t 1 )]2 - [Yi - л'2f (tдJ2 = F (У). i=l i=l (5-61) Неравенства (5-59) и (5-60) при этом сводятся к виду: для максимума апостериорной вероятности ( "'1, F (У) < 20'2 1 n Рl J " _ Р2 . fI.- t л'2, F (У) > 202 lп Рl Р2 (5-62) для максимума правдоподобия { л'1, F (У) < О; } Л= л'2, F (У) > о. Рассмотрим числовой пример. Определить присутствует ли сиrнал вида :1:0 (t) = О,25е- б! (5-64) (5-63) в наблюдаемой последовательности: Yl = У (О ,2) = 0,20; У2 = У (0,4) = 0,30; Уз = У (0,6) = 0,15; У4 = У (0,8) = 0,10; Уа = У (1,0) = 0,05. Характер шума тот iRe, что и выше, дисперсия шума 02 = 1. Находим Лl = 0,25; л'2 = О; 5 -бt. 5 F (У) = [Yi - 0,25е ,] - Yi = i=l i=1 = (0,2 - 0,25е- 1 )2 + (0,3 - 0,25е- 2 )2 + (0,15 - 0,25е- З )2 + (0,10 - 0,25е- 4 )2 + + (0,05 - 0,25е- 6 )2 - 0,22 - 0,32 - 0,152 - 0,102 - 0,052 = - 0,0521. (5-65) В соответствии с принципом максимума правдоподобия искомый сиrнаJI присутствует, так как F (У) < о. в соответствии с принципом максимума апостериорной вероятности при Рl = Р2 имеем тот же результат, но при Pl ::f:. Р2 ответ будет зависеть от величины дисперсии 0'2 и отношения РI I Р2. Чтобы получить алrоритм для обнаружения сиrнала при непрерывном измерении, разделим время наблюдения Т на k равных интервалов 6.t и устремим k -- 00, /).t о. Получим т т F (У) = [у - f..J (t)]2 dt - [у - ЛJ (t)]2 dt. (5-66) 130
При использовании правила максимума правдоподобия и обнаружении сиrнала (Л 2 = О) получим условие существования сиrнала в виде т л. у (t) f(t) dt > o . О (5-67) т rде Е о = "л 2 [/ (t)]2 dt - энерrия сиrнала. о На основании (5-67) можно построить схему оптимальноrо обнаруже- ния (рис. 5-8). В момент t = Т происходит сравнение выхода интеrрирую- щеrо звена с величиной 0,5Е о . Эту схему на- зывают синхронным детектором. Рассмотрим разомкнутую систему управления (рис. 5-4). Задача оптими- зации для нее отличается от рассмо- тренной выше задачи непринципиально. Отличия сводятся к тому, что в звеньях А, G, В, которые можно рассматривать как обобщенное приемное устройство, действуют внутренние шумы, и к тому, что ищется алrоритм не всей этой части, а лишь части А. Пусть задающее воздействие хо (t) дискретно и действует в мо- менты времени 8: (мзНJff f тЕа Рис. 5-8. %Ов = %Оз (8, л), (5-68) л - вектор со случайными координатами = (л'l' л'2' . . . , л, q). (5-69) Задана априорная плотность вероятности вектора л, т. е. сов- местная априорная плотность вероятности величин р (л) = р (л 1 , Л 2 , . . . л q). (5-70) Шум h представляет собой чисто случайную последовательность величин h i с заданной плотностью вероятности Р (h i ). Заданы также способ комбинации сиrнала XOs и шума h, оператор безынерцион- Horo объекта ХОз = F (Zs' v s )' rде F - заданная функция; вид функции Zs = Z8 (., ,..,), rде ,.., - случайный вектор: ,.,., = (J.Ll' J.t2' · · · , f.-tт). (5-71) (5-72) (5-73) Априорная плотность вероятности Р ("ii) задана. Плотность шума Р (gs) считается постоянной. 131
Функция потерь, соответствующая дискретному времени s, задана в виде n W == W s (8, ХОз, Х З ). 8=0 (5-74) Требуется определить оптимальную стратеrию управляющеrо устройства А. В числе величин, подлежащих определению, харак- теризующих оптимальную стратеrию, наиболее существенна оп- тимальная плотность вероятности r (и з ). Эта величина зависит от всей информации, накопленной управляющим устройством в виде последовательности значений Уо, Уl' ..., У s -1- Введем в рассмотрение временные векторы: у 8 == (У о' У l' ... , У з) ; } (5-75 ) Хоз == (Х оо , х о1 , ... , ж ов ). Очевидно, r s (и з ) = r s (и з I УЗ-l). Надо выбрать r s так, чтобы обеспечивался минимум среднеrо риска R. (Y:XOi) YOt/S(:'YJs-tJ us(иSS)1 Vtf(XSVS1 Xs ... Рис. 5-9. Чтобы найти выражение для среднеrо риска, нам надо знать ряд условных вероятностей: Р (Х з I v s )' Р (Р З I из), r 8 (и 8 I УЗ-l) , Р (У з I хоз) (см. рис. 5-9). Из этих вероятностей Р (v s I из) находится по заданным Р (gs) и закону смешивания шума g с сиrналом и; Р (Х з I v s ) выражается через заданную Р (р,) и найденную Р (Р 8 I из) по формулам (5-71) и (5-72); r s (u s I Y8-1) является искомой; Р (Ys -1 ! ХОз-l) при безынерционном канале связи и случайном характере помехи может быть выражено в виде р (У8-11 Хо, 8-1) = Р (Уо, Уl' ... , У8-11 Хо, 8-1) = 8-1 8-1 = П Р (Yi I Хо. 8-1) = П Р (Yi I XOi); i=O i=O (5-76) (так как в безынерционном канале Р (Yi) зависит только от X Oi ' а не от предыдущих значений ж) плотности же Р (Yi \ жо i ) MoryT быть найдены по исходным данным. Напишем сначала выражение для условноrо удельноrо рИСRа при фиксированном векторе XO s : r 8 =M {W8Ix08}= W(8, ж ов , x 8 )P(xslxos)dQ. (5-77) g (Ха) 132
Так как X s зависит от Рв' то, зная вероятностную хараRтери- етику помехи, можно найти Р (x s I v s ), но сама величина р в также случайна и закон ее распределения зависит от XOs' т. е. представ- ляет собой функцию распределения Р (v s I XO s ) Р (хвl хо, 8) == р (х 8 1 v 8 ) Р (vsl xos) dQ, g (v s ) которая выражается в виде суммы вероятностей для X s попасть в диапазон Х в ' Х З + dx. при различных v s ' но фиксированном xO s . Подставив (5-78) в (5-77), получим (5-78) r s == w s (8, XOs, Х s) р (Х $ I v s) р (v s I XOs) dQ , g (x s ' v s ) rде интеrрирование уже ведется по двумерной области (т. е. имеем упрощенную запись двукратноrо интеrрала). Средний удельный риск R s равен (f>-79) R s = S r 8 P('A)dQ. g (,;;) Подставляя (5-79) в (5-80) и производя дальнейшее разворачи- вание выражений Р (x s I v s ) и Р (р з I XO s ), получим окончательно (5-80) R s == W s (8, XOs, Хв) Р (x s I v s ) Р (v s 1 из) х g (x s ' и в , v s ' y s _ 1 .1) Х r s (u s 1 Уо, 8-1) Р (Уо, з-1 1 х о , з-1) Р ('А) dQ. (5-81) Полный риск равен n R= R s . в=О (5-82) Выделим под интеrралом функцию Ss (и в , YO's-l), зависящую от искомоrо управления u s и компонент вектора наблюдения: B (u s , Уо, s-l) = р (x s 1 v s ) Р (v s I us) х g (х в , V s ) Х { w [8, Х О8 (8,1) Х 8 ] Р (Уо .8-11 Х о . 8-1) Р (l) dQ (l)} dQ (Х 8 , v J. (5-83) g () Из (5-81) и (5-83) можно видеть, что R s = 1 (Уо, З-1) dQ (Уз -1), g (Y s - 1 ) (5-84) rде 1 ()Т О , 8-1) = r s (и з I Уо, S-1) з (Ха, Уо, s-1) dQ (ив). g (ив) (5-85) 133
На основании теоремы о среднем, учитывая ПОЛОжительность подынтеrральных функций, можно записать: 1 (Уа,. 1) == (Ss)cp S r s (и з I Уо. з-1) dQ, (5-86) g но, так как r s есть плотность вероятности, то r(U s \Yo.s-l)dQ=1, ) Q (и з ) (5-87) 1 (Уо. S-1) == (ss)cp (S.)min. Отсюда видно, что минимально возможное значение функции 1 равно (Ss)min для каждоrо Уо. в-1. Однако, коrда 1 минимально при каждом Уо. в-1' минимален и средний удельный риск R s , а следова- тельно, и полный риск R" Пусть и: - значение Us, при котором достиrается минимум функции з (и з ) в области Q (и з ) возможных значений ив. (и:) = min 6з (u s ). (5-88) (и,) Рассмотрим фуннцию r в (ив) == б (u s - и:). (5-89) Очевидно r s удовлетворяет условию r,dQ = 1. Далее, учи- g тывая, что тан нан со <s (х - х*) <р (х) dx = <р (х*) (5-90) -со и подставляя (5-90) в левую часть (5-87), получаем [1 (Уо, s-l)]r =(и _и. Хо ) = д (из - и:) з (ив, Y. 8-1) dQ = s в. g (и з ) == s (и:) = (.)mln == (I)mln. (5-91) Следовательно 1 достиrает cBoero минимума при использовании стратеrии (5-89). Но как мы видели, стратеrия типа дельта-функ- ции есть реrулярная стратеrия; таким образом, в данном примере подтвердилось утверждение о реrулярности бейесовой стратеrии, ранее полученное путем rеометрической интерпретации. Оптимальный алrоритм управляющеrо устройства сводится к выбору и: , минимизирующеrо 68 с учетом всех наблюдаемых зна- чений Уз-l - 6s (и:, y. 8-1) = min (и 8 , Уо, .-1). (и з ) Таким образом, з является в данной задаче критерием опти- мальности для выработки оптимальноrо управления реrулярными методами, рассмотренными нами в предыдущих rлавах. Если (5-92) 134
функцию в можно рассчитать заранее, то структурная схема уп- равляющеrо устройства будет состоять из блока памяти ЕЛ, блока формирования функции 6 и автоматическоrо оптимизатора одноrо из типов, например paccMoTpeHHoro в [183, 184] или в [186]. Если же получение функции 6 в явном виде затруднительно, то блок 6 может быть построен в виде вычислительноrо устройства, выпол- пяющеrо интеrрирование в соответствии с (5-83). Численный пример на вычисление оптимальной стратеrии рас- смотрен в [189]. Не останавливаясь на детальных вы:кладках, мы приведем лишь общую схему решения. Уравнения системы имеют вид: Y s _ XOs +h:; ) vs-us+g s , xs=vs+f.t. (5-93) Плотности вероятности шумов и параметра f.t нормальны: Р (h s ) -= 1 _ ехр {- (h s )2 }; I 0h У2п 20 Р (gs) == 1 - ехр {- (gs)2} ; t Og У2п 2a P(fL)= _ exp{_L}. Ор. 2п 2a) Далее ХОв = л, rде л - нормальная случайная величина. (5-95) р (л) == 1 _ ехр {_ (л - Л о )2 }. (5-96) Ол У2п 201 (5-94) Функция потерь задается в виде n n W = W s == (x os -х в )2. 8=0 в=о (5-97) Найдем сначала интеrрал, заRлюченный в фиrурные СRобки в формуле (5-83), в= Ws[s, xos(s, л), X s ]P(Yo,s-lI Х О,S-I)Р(л)dQ(л)= g (л) 8-1 == [X Os (л) -х в ]2 П Р (YOi I X Oi ) Р (л) dQ (л) = g (Л) i =- О со 8-1 == (л-х s )2П Р(УОilл)Р(л)dл. -со i=O (5-98) Так как h i == YOi - X Oi == YOi - Л, то вероятность Toro, что Yi окажется в интервале от YOi до YOi + dYOi равна вероятности Toro, 135
что помеха в канале Н окажется в интервале от YOi - А до YOi - А + dYOi' поэтому Р (YOi I л) == 1 _ ехр {_ (YOi - Л) 2} . (5-99) (Jh У2п 2a Дальнейшее сводится к подстановке в интеrралы полученных функций и нахождению определенных интеrралов. Даже в таком элементарно простом случае (все каналы и объект безынерционны, помехи аддитивны, чисто случайны и имеют нормальные априор- ные распределения) выкладки получаются довольно rромоздкими, хотя и несложными. Читатель может проследить их в [189]. в ко- нечном итоrе получается с==пз [1 +8 2 (ttu 8 -1)2], (5-100) rде D 8' 8 И - постоянные на каждом mare s (в том смысле, что они не зависят от из). Поэтому минимум 68 находится из условия 1}и 8 -1 == О или з-1 1.0+ ( : y ! Yio ох. 1 i=O из == {} = (Ол)2 1+8 - °h При S = О оптимальное значение и должно быть просто равным значению Х ОО = А О на входе А; при достаточно больших s, коrда накопится значительная величина суммы Y, и: приближенно равна (5-101) 8-1 * 1 ,., и 8 s YiO. i=O (5-102) Таким образом, в данном случае управляющее устройство просто должно усреднять входную наблюдаемую величину. Этот резуль- тат вполне соответствует интуитивным представлениям. 5-4. Системы с активным накоплением информации. Синтез систем дуальноrо управления В замкнутой системе (рис. 5-10) процесс изучения помехи Z, действующей на объект, может быть сделан активным. Задавая на объект «пробные» воздействия, можно получить изменения вы- хода объекта Х, изучая которые и сопоставляя их с воздействиями на объект, мы сможем получать более полную информацию о по- мехе z (В которую MoryT входить также и случайные изменения характеристик объекта). Управляющие воздействия в системе вообще нужны для приведения объекта в желаемое состояние, но 136
ОНИ MoryT использоваться и для изучения помехи. В этом случае они носят двойственный «дуальный» характер. Управление, при котором используются управляющие воздействия TaKoro двойст- BeHHoro характера, называется Д у а л ь н ы м у п р а в л е - н и е М. Рассмотрим изображенную на рис. 5-10 систему при следую- щих данных относительно ее элементов, координат и воздействий. Все величины в системе рассматриваются в дискретные моменты времени t = О, 1, ..., s, ..., п, rде п фиксировано. Значения пере- менных, соответствующие текущему моменту t == s, обозначаются индексом s. Задающее воздействие XOs подводится к управляющему устройству А через безынерционный канал связи НО, в котором hos gs Zs fs (usIUs-1' Y,Yos) :1'0 Но А Us G Vs 8 Xs P(YosIXos) P(vs/ Иs) Y s Р{ YsJxs) н h s Рис. 5-10. оно смешивается с шумом h o . В результате этоrо смешения на вход управляющеrо устройства подается не величина ХОз' а УО з ' которая является заданной функцией Уо,; = УО з (ХОз' hos). Управляющее устройство вырабатывает управление из, кото- рое, пройдя через безынерционный канал G, смешивается с шумом gs В этом канале и превращается в величину и в , определяемую за- данным заRОНОМ и з = и з (и з , gs)' Rоторая подводится но входу объекта В. На объект действует помеха Zs' в состав которой MoryT входить случайные изменения наrрузки и характеристик объекта. Считаем, что объект не обладает памятью и ero выходная коорди- ната х з определяется ФУНRцией х з == F (v s ' zs), RОТОРУЮ мы счи- таем конечной, однозначной и дифференцируемой. R объектам без памяти можно относить не ТОЛЬRО безынерционные объекты с одно- значными статичеСRИМИ хараRтеристиками, но и динамичеСRие объекты, для которых рассматриваются ТОЛЬRО установившиеся значения X s при входной величине и 6 . Выходная величина объекта X s ' смеmиваясь с шумом h s , в безынерционном канале обратной связи образует величину 137
Ys = Ys (X s ' h s )' которая с обратным знаком подается на вход управляющеrо устройства А. Рассмотрим бейесову задачу, считая заданными априорные вероятностные распределения Р (hos), Р (h s ) , Р (gs) случайных последовательностей hos, h s и gs, которые мы считаем чисто слу- чайными. Воздействие XO s и помеху Zs мы будем считать случай- ными функциями, зависящими от случайных векторов 'i: и 11 со- ответственно: XOs = XOs (8, л); } А, = (}.,1' }.,2' ... , }., q) ; Z8 = Z8 (8, ,..,); } = (111' 112' ... ,11т). Плотности вероятности векторов Р (л) и Р () также считаются задаННЫJvIИ. Все внешние воздействия Zs' X s ' Х Ов ' hos, h s и gs счи- таются статистически независимыми. Так как функции V s = V s (U s ' gs)' Ys = Ys (x s ' h s ), YOs === = YOs (xos' hos) известны, то мы можем определить условные плот- ности вероятности Р (v s I Us)' Р (Yo s I Х о ,.) и Р (Y s I X s )' которые по- этому также считаются заданными. Для определения оптимальной стратеrии введем функцию потерь W, равную сумме удельных функций потерь: (5-103) (5-104) n W = W s (8, X s , Х ОВ ) 8=0 (5-105) и средний риск R, равный сумме удельных рисков R s : n n R= R s = М {W s }. 8=0 8=0 (5-106) Введем также временные векторы: U s = (и о , и 1 , ... ,u s ), XOs = (х оо , х о1 , ... , ХОз); ) V s == (v o , v 1 , ... , v s ), YOs = (Уоо, УО1, ... , YOs); (5-107) xs==(x o , Х 1 , ..., x s ), Ys=(Yo, Yt, ...Уз). Каждый из этих векторов представляет собою совокупность всех дискретных значений соответствующих координат в мо- мент t == s и все предшествующие моменты и таким образом во- площает в себе первичную информацию о соответствующей вели- чине, накопленной к моменту t = В. Найдем оптимальные плотности вероятностей P s (и з ) == r s (и" I и 8 - 1 , Y8-1, YOs), (5-108) при которых полцый риск R будет минимальным. 138
Индексами s у плотностей вероятности будем отмечать услов- ные апостериорные вероятности, вычисленные с учетом накоплен- ной к моменту t == s информации. В расшифровке, при каких пере- менных вычисляется условная вероятность Р В (и в ), фиrурируют не только текущее значение УО в ' но и вся ero предыстория УОв' а также предыстория связанных с управляющим устройством величин У s -1 И и в 1, имевших место до прихода очередноrо сиr- пала УОв. Так как r s плотность вероятности, то для нее справедливы сле- дующие дополнительные соотношения: r s О; } r s (и в ) dQ == 1. g (U.) Величины r i (i == О, 1, ..., п) назовем удельными стратеrиями, а их совокупность - полной стратеrией. Решение задачи о нахождении оптимальной стратеrии начнем с установления выражения для условноrо удельноrо риска. У с- ловный удельный риск выражается кратным интеrралом от произ- ведения удельной функции потерь W s на апостериорные вероят- ности всех случайных величин, от которых она зависит: (5-109) r s = Ws[s, хоs(л, s), хs]Рs(л)Рs(хs)Рs(р,)..Рs(us)dQ. (5-110) g (л, ji, Х в ' и в ) При определении апостериорной плотности вероятности уч- тем, что канал Н О не входит в замкнутую цепь и поэтому оценка л будет зависеть только от фиксированных значений Уо. Поэтому мы можем для совместной плотности вероятности Р (л, YOs) напи- сать р (л, УОв) = Р (А,) Р (УОв I А,) = р (л I УОв) Р (УОв). (5-111) Откуда р в (1) = Р (11 УОВ) = р (1y)s I 1) . (5-112) в этой формуле типа Бейеса Р (л) - априорная плотность вероятности для л; р (YOs) - априорная (безусловная) плотность вероятности для УОв; Р (УОв I л) - функция правдоподобия, опре- деляемая из свойств канала НО. Так как по предположению зна- чения h Oi независимы для различных i, а канал НО безынерцион- ный, то 8 Р (УОв I л) = П Р (YOi I л). i=O (5-113) Напомним, что безусловная вероятность Р (YOs) может быть вы- ражена через суммы (при конечно-альтернативных задачах) или 139
через интеrралы от произведений Р (1) на Р (УОв 11), как это было сделано в (5-41) И (5-42). Вычисление апостериорной плотности вероятности Р в (), та- КИМ образом, в данной задаче выполняется так же, как это дела- лось и в предыдущем параrрафе при рассмотрении обычных разомкнутых систем с пассивным накоплением информации, что связано с обособленностью контура Но. rораздо сложнее обстоит дело с вычислением апостериорной вероятности Р в (,..,), так как для этоrо вычисления уже используется вся информация об объек- те, :1'1 в каждом такте априорная плотность вероятности Р (,..,) заменяется апостериорными плотностями Р в (р,), все более точно характеризующими вектор J1. Выразим через произведения вероятностей совместную плот- ность вероятности Р (l-t, U B - 1 , Ув-ll УОв) = Р (О З -l' УЗ-l1 J1, УОз) Р (l-t) = = Р (р.1 U s - 1 ' Ув-l, УОз) р (о з - 1 , УЗ-l1 УОз), (5-114) rде Р (р.) = Р О (J.L) - априорная (безусловная) плотность вероят- НОСТИ "". ПРИ этом вместо Р (J.L, УО з ) мы пишем Р (lL) потому, что J1 не зависит от 1 или УОз. Отсюда р () Р ( I ) р (р,) р (О З -1, УВ-1 I 11, Уоз) 8 l-t = J1 u s - 1 , Ys-l, YOs == Р (и 1) - в-1, УВ-1 Уоз Р (р,) Р (О З -l' УВ-l I р" УОВ - р (и З -l' УЗ-l I р" УОВ) Р (р,) dQ · Q (11) Для вычисления функции правдоподобия Р (и з l' Ys 1 I J1, УОз) в замкнутой системе рассуждаем следующим образом. Плотность вероятности появления сначала пары значений и о , Уо, затем после- довательно пар иl, Уl; и 2 , У2 и Т. д. при фиксированном р, равна произведению следующих сомножителей: 1) плотности вероятности первоrо из этих событий Р (и о , Уо II-t, Уоо); 2) плотности вероятности BToporo события и 1 , Уl при усло- вии, что произошло первое - Р (и 1 , Уll J.L, и о , Уо, YOl); 3) плотно- сти вероятности TpeTbero события и 2 , У2' при условии, что произоm- ли первые два Р (и 2 , У21 р" Оl, Уl' УО2) и Т. д. (5-115) Р (u s - 1 , УЗ-l1 J1, УОз) = Р (и о , Уо I J1, Уоо) Х х Р (U 1 , Уll р" и о , Уо, УОl) Р (и 2 , Y2'' иl, Уl' УО2) ... х Х... Р(и з - 1 , YB-IIJ1, и з - 2 , Ув-2, YO,s 1). (5-116) Рассмотрим i-й множитель О i s - 1 Р (u i , Yi I J1, ui-l, Yi-l' YOi) = = Р (Yi I J1, U i ' U i - 1 ' Yi-l' YOi) Р (и11, ui-l, Yi-l' YOi). (5-117) 140
В первом сомножителе правой части (5-117) Yi' если фиксиро- вать l.t и U i ' не изменится, если фиксировать также Yi-l' 0i 1 И YOi; поэтому этот сомножитель можно обозначить Р (Yi I l-t, U i ); второй же сомножитеJIЬ на основании аналоrичных рассуждений можно обозначить r i (U i I YOi' U i 1, Yi 1), поскольку он представ- ляет собой выражение случайной стратеrии управляющеrо устрой- ства. Сокращенно будем обозначать ее просто r i . Итак, [ 8-1 J 8-1 Р (U s1 , Ys-lll-', Yos) = fIo Р (Yi 11-', иJ fIo r i , (5-118) rде r o обозначает Р О (и О ) (величина, не зависящая от наблюдений, I\ОТОРОЙ при t == О еще не было). Подставив (5-118) и (5-112) в (5-115) и учтя, что Ps (u s ) = r s ' получим \' W [ ( Iv р (А) Р (УО8 I л) r s == j s S, Х 8' ХОВ 8, ) ] Р (Уоз ) -- Х Q (л, J..t, Х в ' из) 8-1 р (11) П Р (Y'i 111, Ui) 8 х Р(х 11-' s и) p(i=O I-JridQ. (5-119) 8 , , 8 У 8 -1, U 8 _ 1 I у 08) i=O Для получения выражения для среднеrо риска учтем, что век- торы УО8' 08-1 И Ys-l' вообще rоворя, заранее неизвестные, MoryT принимать различные значения. Пусть Р (Уо.'3' 08-1, У8-1) совмест- ная плотность вероятности этих векторов. Тоrда средний удель- ный риск получим, усредняя r s по этим значениям R s = r S P(Yo8' П 8 - 1 , YS-l)dQ. Q (У О8 ' U S _ 1 ' Y s - 1 ) (5-120) Учитывая, что Р (Уоз, U s - 1 , У з-1) == Р (П з - 1 , У 8--1 I УОз) Р (Уоз), получим R 8 == W S [8, Х О8 , (8, л) х з ] х [ (л, J.t, Х 8 ' УО8' и в , Y s - 1 ) Х Р ().,) [ Ро Р (YOi I ).,)] Р (x s i 1-', s, U S ) х Х p(I-')[ r: р(Уill-', Ui)J [po riJdQo (5-121) Риск оказался, как и следовало ожидать, зависящим от полной стратеrии, что обусловлено именно дуальностью управления. Для определения оптимальной стратеrии рассмотрим, в соот- ветствии с методом динамическоrо проrраммирования, риск R-п 141
па последвем этапе, для последнеrо момента времеllЙ s === п. Пред- ставим ero в виде R 71 == 1I -1%п (и п - 1 , Yn-l' УОn) dQ, Q (u п _ 1 ' Уn-l' УОn) (5-122) rде %п (и п - 1 , Y11-1, YOrJ == СХ N (и n , и n - 1 , Уn-l' УОп) х Q (и n ) х r n (и п I и п -], Уn-1, УОп) dQ; (5-123) СХ П (и n , 1.I п 1, УП-l' УОn) == W N [ХОП (п, 1), х п ] Р (л) х Q (л, I-t, х n ) х l A Р (Уо! I л)] Р (х n 111, ин) Р (11) [ r( Р (У! 111, и д ] dQ, (5-124) (5-125) n-l n-l == П r i , i=O rде сх" И )(, - вспомоrательные функции. При рассмотрении последнеrо этапа считаем, что предшествую- щие стратеrии r О, ..., r n-l каким-либо образом фиксированы, сле- довательно, п-l при интеrрировании на этом этапе может рассмат- риваться как некоторая фиксированная величина. Тоrда из (5-122) видно, что минимальный риск R n будет иметь место при минимальном значении функции Х. ИЗ (5-123), на осно- вании теоремы о среднем, имеем %п == (сх,n)ср r ncx,Q == (сх,n)ср ;?: «(%n)min. Q (и n ) Оптимальная стратеrия r n выражается формулой r == б (и n - и), (5-127) rде и - значение управления на интервале t = п, минимизирую- щее функцию а, (5-126) a =(%п (и, Оп-l' Уп-l) Y) == min сх,п (и п , и п -1' Уn-l' Уп). (5-128) иЕ Q (и n ) В самом деле, подставив (5-127) в (5-123), получим %п:::= (a,n)иn=и == (cx,n)min. (5-129) Следовательно, при стратеrии (5-127) %n минимальна, и стра- теrия r оптимальна. Этот вывод сделан точно так же, как это было сделано и в предыдущем параrрафе. Мы пришли, таким образом, к тому выводу, что оптимальная стратеrия r реrулярна. Далее, рассматривая С1'ратеrию на этапах t == п - 1 и t = п, затем t = п - 2, п - 1, пит. Д., аналоrичными рассуждениями мы можем показать, что на всех этих этапах оптимальная страте- 142
rия реrулярна и оптимальное управление определяется, так же I{aK и в реrулярных методах в соответствии с (5-128), из условий минимизации функции (Х, определенной по формуле (5-129). Используя эти выводы, проследим теперь решение задач о нахождении оптимальной стратеrии на следующем примере, заимствованном из [189]. Рассмотрим диснретно-непрерывную систему t == О, 1, 2, ..., 5, .." п. Пусть помехи в каналах Но и G аддитивны: у s _ ХОв -+- h o ; } vs-us+g s . Уравнение объекта имеет вид: Х З === V s + J..t == ив + g8 + Jl. (5-130, а) (5-130, б) Задающее воздействие и помеха Z = Il равны случайным постоянным величинам: Х О8 = л == const; Z g == f.t == const. Обратная связь - единичная, и шум в ней отсутствует: Уз =Х в ' Распределения величин л, f.t, gs И hos нормальные, причем: 1 {(л -Л о )2} р (л) = у- ехр - 2 2 ; ал 2n ол 1 g }. Р (gs) = у- ех р {- 22 ' cr g 2п Og ) 1 {hs } Р (}Z08 == "l! - ехр - " 2022 ; Oh o r 2n ho 1 {2 } Р () = у- ехр - 202 · 0(.1 2n J,t Удельная функция потерь задается в виде W g == (Х з - хов)2 == (Х В - л)2. Вычисляем в соответствии с (5-129) функцию r.1w k == (Xk-Л)2р(л)[fтР(УiIЛ)]Р()Х n (л, J.t, Хп) t=O Х[ПР(Хil, Ui)]dQ. (5-131) f=aO 143
Из (5-130, б) можно заключить, что вероятность нахождения Х между фиксированными значениями X i и X i + dX i равна вероят- ности Toro, что g окажется между двумя фиксированными значе- ниями X i - (U i + f.1) И X i - (U i + f..L) + dx i , следовательно, Р (X i I J.L, Ui) == Р (X i - U i - J.L) == = 1 ехр {_ (Xi - Ui - ,..,)2 } (5-132) О'е У 2л 20 е . Из (5-130, а) следует: hos == у s - ХОэ == у s - л. (5-133) Поэтому вероятность попадания величины у между фиксиро- ванными значениями Yi и Yi + dYi равна вероятности нахождения значения шума h O в интервале между Yi - Л и Yi - Л + dYi' поэтому Р ( I ) - Р ( ) - 1 { (Yi - А,)2 } У i 1\, - у у i - 1\, - .. ,- ехр -- 2 2 · Ghf 2n O'h Подставляя (5-132) и (5-134) в (5-131) после ряда промежуточ- ных преобразований и вычислений интеrрал принимает вид: a. k = р (Л)[Л Ру (Yi - Л)] {a k + b k + 2: kk (WkB k + ;1 У} Х -00 =O { бk_l Ek-l} d'l xexp--+ 44 1\" (5-135) O'g GgB k (5-134) rде введены обозначения: 1 k 8 k = 20'2 + 20'2 , J,t g k -1 I;k-l == 2: (Xi - U i ); i=O k -1 6 k - 1 = 2: (X i - U i )2; i=O } (5-136) W k == U k -- X Ok ' 0'2 1 a k = У 2 -а:ар. (л:)kl:УВk ' b k = 2а:ар. (2л:)k I 2(2в/ 11 · J Произведем в формуле (5-135), выписанной для (Х,n' минимиза- дию по величине и n . Прежде Bcero заметим, что и п содержится только в Ш n ' поэтому достаточно рассмотреть лишь ту часть интеr- рала, которая содержит в качестве множителя выражение (WkE k + + k_l)/2<J g )2. Хотя и n И min а п зависят от и о , U 1 , ..., и п 1, при- чем Uп-l содержится в членах п 1 И Э п 1, можно показать, что любое и: может быть найдено минимизацией (х в по ив. Так как 2b k /B k и экспонента не содержат и n , то их при минимизации можно не принимать во внимание. Итак, остается минимизировать по и в величину J s = (ивв в + -;1 - ВsЛУ Р (л)r iI Р 11 (Yi - л) 1 dл. (5-137) -00 g i=-O J 144
Полаrая J т.в = f ce л тр (л) [ \ p у (У; - л)] dл, (5-138) найдем: J B = (ивв в + 1 ) J o , в - 2В 8 (и 8 в в + 1 ) J 1 , в + B:J 2, В. И aJs О 3 условия -а =, находим и в в-1 (x - и 1 ) и; == J 1 ,s _ B-1 = J 1 ,s 2=0 J О,В 2E s O'g2 J О,В ( og)2 . S + 0'", РаздеJIИМ числитель и знаменатель первоrо слаrаемоrо в (5-139) на р (Ys). Тоrда можно видеть, что это слаrаемое равно математи. ческому ожиданию величины л в момент t == s (5-139) 00 ::f) лРs СА) dл J 1 ,s _-00 J o : s - 1 Р В (л.) dл. - -О) лРs(л)dл==kl {л\ Ув}. (5-140) - 'х) Выполняя интеrрирование, получим s YT м {л I у } = J 1 ,B = + r 2 =0 В J О,В 1 + ( :) (s + 1) ( : ) + s + 1 Подставляя (5-141) в (5-139), окончательно найдем 8 8-1 Ут (X2-и1,) -1: ЛО + т=О i=O (5-142) U s = 1 + ( Y(S + 1) ( :: У + s + 1 s + ( :: У , IIри возрастании s величина u приближается к среднему ариф- метическому от значений Уl, минус среднее арифметическое от зна- чений Х 1 - U. Некоторые более сложные примеры, в частности при неадди- тивных помехах, но еще допускающие решения с помощью цифро- вых вычислительных машин, рассмотрены в [189, 222]. (5-141)
rЛАВА ШЕСТАЯ СИСТЕМЫ ЭКСТРЕМАльноrо РЕrУЛИРОВАНИЯ 6-1. Основные особенности систем зкетремальноrо реrулирования Системами экстремальноrо реrулирования называют системы, управляемый объект в которых имеет статическую характери- стику с экстремумом, ПОЛОiнение и величина KOToporo точно неиз- вестны, а реrулятор осуществляет поиск таких значений входныIx координат объекта X, i = 1, ..., п, при которых выход ero J == f (Х 1 , ..., х n ) (6-1) достиrает экстремума. Например, если оптимальным экстремаль- ным значением является минимум, то J* == f (хт, xr, ... , x) == min f (х 1 , Х 2 ' ..., Х п ). (6-2) Системы экстремальноrо реrулирования стремятся удержать систему вблизи экстремальноrо значения функции f в каждый те- кущий момент времени. Применять экстремальное реrулирование целесообразно тоrда, коrда: 1) существует физически ясный показатель качества, с уменьшением (или возрастанием) ROToporo происходит достаточно ощутимое увеличение технико-экономической эффективности про- цесса, выrоды от KOToporo в достаточной степени перекрывают затраты на усложнение системы управления; 2) коrда существует единственная функция наблюдаемых координат системы, выражаю- щая ПОRазатель качества, которую можно изменять в любом на- правлении, воздействуя на реrулирующие орrаны системы и ко- торая имеет экстремум в данной области. П римером экстремальноrо реrулирования может служить наст- ройка приемной радиостанции на частоту передающей. Очевидно, что существует ФУНI\ЦИЯ, обладающая резко выраженным экстре- мумом в области оптимальноrо режима - одна из резонансных характеристик контура приемника. Соверlпенно ясно, что удер- ,наиие станции в точке резонанса или в достаточно малой ее окре- 146
етноети не только целесообразно, 110 и необходимо. Отметим одну из характерных особенностей настройки на экстремум. При настройке приеМНИRа наблюдаемой Rоординатой является либо rpoMKocTb звука, либо ЯрRОСТЬ свечения ИНДИRаторной лам- почки. Однако только по одной величине ЯрI{ОСТИ мы еще не можем судить о том, оптимален режим или нет, и пробными движениями рукоятки настройки мы определяем, в каком направлении следует повернуть рукоятку, чтобы яркость возрастала. Таким образом, для суждения о том, находимся ли мы в точке экстремума, нужно изучить не только текущее состояние системы, но и обследовать Сl\1ежные состояния. Друrая особенность экстремальноrо управления состоит в том, что экстремальная характерИСТИRа объекта нестабильна и точка экстремума в процессе работы с:м:ещается под действием различных неучитываемых факторов. Если бы частота передатчиков не «пла- вала», а собственная частота приемника не изменялась бы под влиянием различных случайных факторов, то мы моrли бы раз и навсеrда отметить на шкале приемника волны принимаемых стан- ций и без настройки устанавливать приемник на желаемое деле- ние. Такие деления и наносятся на шкалах, но опыт показывает нам, что эти деления, существенно ускоряя процесс настройки, вместе с тем не устраняют необходимости в настройке путем эк- стремальноrо реrулирования. В качестве BToporo примера рассмотрим некоторый транспорт- ный экипаж, движение KOToporo описывается уравнением d 2 x .) (dX)2 т dt 2 == q - k o - k'i dt ' (6-3) rде х - величина перемещения экипажа; q - реrулирующее воз- действие - расход носителя энерrии (например, расход rорючеrо в единицу времени, пропорциональный открытию реrулирующеrо opraHa); k o - сопротивление ДВИj-Rению, не зависящее от скорости '> (dX)2 движения. экипажа; ki dt - сопротивление движению, пропор- циональное квадрату ero скорости. 1 Требуется осуществить такое управление движением, при котором расход rорючеrо на любом отрезке пути был бы минимальным (или же при заданном расходе rорючеrо пройденный транспортом путь был бы максимальны:м). Рассмотрим решение, основывающееся на предположении о том, что полный расход rорючеrо на любом заданном пути будет 1 Обычно Rвадратичное сопротивление выражается в виде \ dx I dx · (dX ) 2 k 1 dt dt ==k 1 (sign х) dt ' НО мы предполаI'аем, что в процессс уравления экипаж не может изме- нить направления движения. Тоrда х не изменяет знака и мы можем воспользоваться фОРМУJIОЙ (6-3). 147
минимальным, если в каждый момент времени будет минимальным удельный расход rорючеrо на километр пути. Нужно проверить несколько положений, заключающихся в этом предположении. Прежде Bcero проверим, существует ли функция координат си- стемы, выражающая сформулированный критерий оптимально- сти, имеющая в рабочей области наименьшее значение. Выразим удельный расход J rорючеrо на Rилометр пути следующим обра- зом: J == dQ == dQ : dx == _ , dx dt dt х rде Q - абсолютный расход rорючеrо; q === dQ/dt - удельный расход rорючеrо в единицу времени. Приняв rипотезу о том, что за критерий оптимальности можно принять величину J, мы получаем возможность решить задачу, не прибеrая к сложным математическим операциям, на основе . лишь измерения текущих значений q (расходомером) и х (спидо- метром) и деления первоrо на второе. Пусть в данной задаче имеется только один реrулирующий ор- rап, управляющий поступлением rорючеrо в двиrатель, и переме- щение этоrо opraHa пропорционально q, будем поэтому рассматри- вать в качестве управляющеrо воздействия величину q. Выразим J через q. Из (6-3) следует что · dx 1 V .. х == dt == k 1 q - k o - тх, (6-4) отнуда J == !!. == k 1 q . х vq= ko-тx (6-5) Мы видим, что J не определяется однозначно управлением q, а зависит таRже от изменений наrрузки k o и от УСRорения э:кипа- . та х. При этом ускорение х не является независимой координатой. Ero изменение зависит не только от текущеrо значения q, но и от Toro, как q изменяется во времени. CTporo rоворя, точно решить задачу о минимизации расхода rорючеrо в динамике мы моrли бы методами оптимальноrо управления, рассмотренными в прошлых rлавах, а именно: найти управление q (t), минимизирующее Фун:к- ционал X N Q = q (t) dt хо (6-6) при rраничных условиях х (О) == х о , х (Т) == XN, заданном воз- мущении k o и при оrрапичении типа неrолопомной связи, выражае- мом уравнением (6-3). Однако даже в рассматриваемом случае, который относится к простейшим, решение оптимальной задачи 148
сталкивается с серьезными аналитическими ТРУДНОСТЯМИ, свя- занными с необходимостью решать систему нелинейных уравне- ний, и с практическими трудностя:ми реаJIизации довольно слож- ной схемы оптимизатора. Для упрощения подобных задач часто принимают, что наруше- ниями оптимальности в динамическом режиме можно пренебречь и достаточно осуществлять оптимальное управление лишь в ста- тике. Это можно сделать, если мы знаем заранее, что динамические режимы, вызванные, например, изменениями наrРУЗRИ, редки и на большей части траектории движения происходит установив- Iпееся движение. Эта же rипотеза может Быlьь принята, если мы а) 6) 2;4 ] 2,4 J 2,2 2,2 2,0 2,0 1,8 1,8 1,6 q 1,6 15 0,6 3,0 1,5 0,5 1,0 2,0 0,3 Рис. 6-1. i I I I , I 1,0 "5 априори знаем, что в динамике на траектории движения ускоре- . ние х будет пренебрежимо мало. Полаrая х == О, из (6-3) получим J - klq _+k2. -- --. l Х . yq-k o х I Нетрудно видеть, что J, определяемое уравнением (6-7), имеет минимум в точке q* == 2k o , причем J* = J min == 2k 1 V k o . (6-7) (6-8) При изменении наrрузки k o точка экстремума смещается. На рис. 6-1, а показаны кривые J == f (q) при значениях k 1 == 1 . и k o == 0,6; 0,8; 1,0 и 1,2. На рис. 6-1, б даны кривые J == <р (х). Кривые удельноrо расхода rорючеrо, сходные с приведенными кривыми, характерны для ряда управляемых подвижных объектов. На рис. 6-2 показаны кривые зависимости расхода q rорючеrо на километр пути в функции скорости полета v для различных по- летных весов G для одноrо из типов самолетов [57]. Полет на даль- ние расстояния с наивыrоднейшей (крейсерской) СRОрОСТЬЮ, при которой удельный расход rорючеrо на единицу пути минимален, 149
имеет очевидный технико-экопомич:ес:кий эффект. Та}{ как с умень- шением веса самолета наивыrоднейmая скорость уменьшается, то при дальних полетах, коrда вес rорючеrо может достиrать поло- вины полетноrо веса, поддержание экстремума удельноrо расхода топлива становится неоБХОДИ?vIЫМ. Первые упоминания в технической литературе об экстремаль- ных реrуляторах содержатся в статье Леблана 1922 r., rде описан реrулятор для колебательноrо контура для электропоезда (на повышенной частоте), по суще- ству, действующий как экстре- мальный реrулятор [245], и в 1926 r. в книrе Штейна [261] высказывал ась идея реrулиро- вания топки паровоrо котла с обеспечением минимума потерь аз во 100 120 140 160 180 кмч В ДЫМОВОЙ трубе за счет И3- менения избытка воздуха. В 1940 r. Ю. с. Хлебцевичем была предложена схема элект- рическоrо реrулятора экономичности для поддержания макси- мума к. п. д. [192]. В 1943 r. В. В. Казакевич предложил ряд схем ЭRстремальных реrуляторов; в последующие rоды сделал теоре- тический анализ переходных процессов, вывел критерий устойчи- вости процессов оптимизации и провел соответствующие экспери- ментальные исследования [56, 57]. Несколько позднее появилась работа А. п. Юркевича об оптимизации скорости вращения авиа- ционноrо двиrателя [201]. Широкую известность принцип экстремальноrо реrулирования приобретает в 50-х rодах, после опубликования rлавы об экстре- мальном реrулировании в книrе Цян Сюэ-сеня в 1954 r. [263], книrи и серии статей Дрейпера и Ли [219] и друrих американских авторов. Первые обзоры и разработки вопроса в отечественной литературе публикуются с 1957 r. [121, 116]. ке/км q 0,6 0,4 Рис. 6-2. 6-2. Основные схемы систем зкстремальноrо реrупирования одной величины Пусть х - координата объекта; у == f (х) - покаватель экст- ремума; z - координата реrулирующеrо opraHa. Рассмотрим сначала управление безынерционным линейным объектом, для KOToporo можно принять z == х. Необходимыми и достаточными условиями нахождения в точке экстремума (минимума) будут ду дх = о, д 2 у дх 2 > о. 150 (6-9) (6-10)
Допустим сначала, что в рабочей области изменения х сущест- вует три (рис. 6-3) ЭRстремума типа минимума Ум!, УМ2 И Умз. Ка- ждый из этих ЭRстремумов называется ЛОRальным ЭRстремумом. Наименьший из минимумов (на рис. 6-3 это УМ2) или наибольший из маRСИМУМОВ называется rлобальным ЭRстремумом. Все существую- щие системы ЭRстремальноrо реrулирования строятся TaR, что они ОRазываются в состоянии привести систему лишь в т-от ЛОRаль- ный ЭRстремум, в ОRрестности ROToporo они начинают действовать. Окрестностью локальноrо ЭRстремума при этом называют ту об- ласть изменения координаты, в которой знаR производной по одну сторону ЭRстремума остается неизменным. Так, ОRрестностью ло- у у УМ3 о х .. :У МИН I I I Х З :f Х4 Хз х Ж Рис. 6-3. Рис. 6-4. кальноrо минимума называют ту область изменения х, остаются справедливыми неравенства: ду <о < дх ,Х Xi, ду >о >:t дх ,Х Xi, в которой (6-11 ) rде через хl обозначена та величина х, которая соответствует ло- кальному минимуму Ум i. TaR, окрестность минимума УМ2 на рис. 6-3 оrраничена интервалом [Х З , Х 4 ] (на РИСУНRе заштрихован). Если в системе существует неСRОЛЬКО ЛОRальных ЭRстремумов, то единственный известный на сеrодня путь приведения системы к rлобальному ЭRстремуму состоит в предварительном прощупыва- нии всей рабочей области, нахождении ОRрестности rлобальноrо ЭRстремума, приведении системы ЭRстремальноrо реrулирования в одну из точек этой окрестности и затем: включении в действие устройства ПОИСRа ЭRстремума. При всех дальнейших рассмотре- ниях мы будем считать, что в рассматриваемой области сущест- вует единственный экстремум, или что если экстремумов несколь- ко, то мы уже находимся в окрестности rлобальноrо ЭRстремума, и не выходим из нее в процессе работы системы. Рассмотрим рис. 6-4. При принятых условиях, нетрудно ви- деть, что зная f x = af/ax, мы имеем возможность принять решение 151
о том, в какую сторону следует изменять х, чтобы приблизиться к экстремуму. Так, в случае реrулирования на минимум, если f x отрицательна, то х надо увеличивать, если положительна - уменьшать. Эти условия можно записать следующим образом: dx >0 если dt dx <О если dt fx<O; 1 fx>O. J (6-12) Очевидно, что в случае поиска максимума, будем иметь <О если fx<O;! (6-13) dx >0 f >0 dt если х · Эти неравенства показывают, что если мы априори знаем, что находимся в окрестности искомоrо экстремума, то знание знака а) С а б) с dx dt х у х а дх р Рис. 6-5. о у из частной производной f х достаточно, чтобы определить направ- ление требуемоrо изменения координаты объекта, обеспечиваю- щеrо приближение к требуемому экстремуму. Используя знак f x , можем построить релейную систему ЭRстремальноrо реrулирова- ния, используя знаR и величину fx' можно построить непрерывную систему ЭRстремальноrо реrулирования. Системы с прямым использованием сиrнаJlа по частной произ- водной. Если бы мы имели хорошо действующий измерительный элемент для мrповенноrо ИЗТvlерения f х' то структурная схема системы экстремальноrо реrулирования выrлядела бы TaR, как показано на рис. 6-5. На рис. 6-5, а изображена схема непрерывной системы. Произ- водная f х выходной величины у объекта О определяется измери- тельным элементом иэ. Значение f x подается на усилитель с коэффициентом усиления k, управляющий сервомотором пере- менной скорости (интеrрирующим звеНОТvI). На рис. 6-5, б сер- БОМОТОрОМ постоянной скорости С управляет реле Р, реаrи- рующее на знаR f х. 152
:К сожалению, измерение f x оказывается трудной задачей, и та- f{oro рода схемы пока еще не удается реализовать. Измерить f х в статике невозможно, так как по самому определению произ- водной для ее измерения необходимо менять apryMeHT и функцию. На рис. 6-6 показана схема, осуществляющая из:мерение dy/dt и dx/dt и деление их друr на друrа. В результате деления полу- чаем f x = dy/dx. Если в качестве исполнительноrо opraHa исполь- зуется интеrрирующий элемент, то dx/dt - ero входная величина, поэтому специальноrо opraHa для измерения dx/dt в схеме не нужно. Трудности в реализации схемы состоят в следующем. Во-пер- вых, сиrнал на входе управляющеrо устройства получается путеI дифференцирования, при этом же возрастает влияние высокоча- стотных помех, и если схема подвержена действию таких помех, то реализация схемы сильно затрудняется. Далее, дифференци- рующие элементы, как показано в части 1, имеют неизбежную динамическую поrрешность, и измерение f x становится неточным. Серьезные затруднения воз- никают при измерении ма- лых значений f х. Поэтому, чтобы исключить такую об- ласть, приходится искусст- венно вводить зону нечувст- вительности. Системы с синхронным детектором. В практике для непосредственноrо измерения f х в ряде случаев исполь- зуется :модуляция системы посредством вспомоrательноrо rapMo- пическоrо сиrнала [1, 75]. На рис. 6-7 показан результат воздействия на объект синусои- дальноrо сиrнала малой амплитуды в разных точках экстремаль- ной характеристики. В точках А 1 и А 2 , раСПОJlоженных слева от экстремума, выходной сиrнал будет иметь ту же частоту, что и входной, фаза же ero будет противоположной фазе входноrо сиr- нала. Если считать, что амплитуда а входноrо сиrнала настолько мала, что кривая у == f (х) в интервале х -t- а близка R прямой, то аlплитуда основной rармоники выходноrо сиrнала будет пропор- циональна крутизне характеристики, т. е. пропорциональна f x . В точке А 4 справа от экстремума частоты и фазы кривых у и х совпадают. В точке Аз экстремума выходное колебание имеет двой- ную частоту и малую амплитуду, основная же rарМОНИRа отсут- ствует. Итак, величина f x может быть измерена путем измерения амплитуды основной rарМОНИRИ выходноrо сиrнала У, знак же f x определен с помощью измерения фазы выходных колебаний. Вы- деление первой rармоники колебаний осуществляется с помощью синхроиноrо детектора, на входы KOToporo подаются у = f (х) у dx dt с о J у d dt dy dt Рис. 6-6. 153
11 Ах == а sin rot. Определим среднее за период па выходе синхроп- Horo детектора: 2n 2п f (х) X drot = [/ (Х п + X) x drot == u о 2л; = [f(x k )+fx(X k )Llx+{txx(x k )Ll2 X +...]Llxdrot= о 2п 2п == а! (Х п ) sin rot drot + а 2 Ix (Х п ) sin 2 rot drot + . . . = о о па' = :ла 2 fх (Х п ) + 12 /ххх (Х п ) + · · · (6-14) у t н (""'to ("'to No Рис. 6-7. Таким образом, средняя, если отбросить малые высших поряд- ков, пропорциональна fx (Х п ) в точке Х п . Поставив за блоком умно- жения фильтр Ф, получаем постоянное воздействие, пропорцио- нальное f х' прикладываемое через усилитель У к сервомотору С, но, конечно, вместе с тем вносим и элемент запаздывания (рис. 6-8). В инерционных объектах выходное колебание оказывается сдвину- тым относительно входноrо по фазе, что создает дополнительные затруднения, связанные с необходимостью компенсации фазовоrо сдвиrа с помощью дополнительных схем. Частоты модуляции следует выбирать так, чтобы они были достаточно высоки в срав- нении с частотами основных процессов и вместе с тем далеки от частот помех. Наиболее удобным применение синхронных детекторов оказы- вается в случае, коrда показатель экстремума является функцией 154
нескольких переменных. Тоrда, задавая воздействия различных частот одновременно на разные реrулирующие opraHbl, получаем возможность одновременно управлять всеми этими орrанами с целью наибыстрейmеrо приближения к экстремуму. Периодиче- сRИЙ пробный сиrнал в схемах с использованием синхронных де- текторов может быть произ- вольной формы и удовлетво- рять лишь условиям центри- рованности и ортоrонально- сти. В [77], в частности, описана схема с пробными сиrналами прямоуrольной формы. Пусть в i-M канале X i = = Xip + бх i , rде Xip - рабочая составляющая координаты X i ; БХ i - наложенное периодическое поисковое воздействие, которое является центрированной ( БХ i == О) и ортоrональной функцией по отношению к периодическим воз- действиям в друrих каналах: усредняя переменные за достаточно большой промежуток времени, имеем у с о у ф сд у Рис. 6-8. _ {БХl при j = i, fJхiбх j - О · --J- · при I -r- t, бхifJхjfJХ h = О и бхiбхjбхhбх v = О при неравных индексах. ) (6-15) Разлаrая функцию f (х 1 , Х 2 , ..., Х n ) в ряд Тейлора в окрестности рабочеrо значения fp = f (X 1P ' Х 2р ' ..., Х пр ) и считая медленно И8- меняющиеся функции f p постоянными за период изменения бх i , получим следующее выражение для выходной координаты син- xpOHHoro детектора: n afp и. = jpW Фv (р) бх. + ! д:lЧ W фi (р) (<5х 1 бх.) + · · . = i=l со (. n afp ) = k. (Т) f p fJx . + ! D:IJi бхiбх. + · " dT, О i=l (6-16) rде W Фv (р) - передаточная функция v-ro фильтра; k v (,;) - им- пульсная переходная функция этоrо фильтра. Функции в круrлых скобках под интеrралом берутся при зна- чении apryMeHTa t - т. При ортоrональности функций БХ i члены, содержащие бхiбхjбх v и большее число сомножителей, будут или равны нулю, или {при малых отклонениях) иметь высший порядок малости. 155
Для центрированных колебаний Тоrда W Фv (р) fJx v = О, ) Wфv(р)(дцх.)={ О, * i tW Фv (О) бх, 'v = i. afp U v 8x v W фv(О) -а- - J X v (6-17) т. е. выходные сиrналы синхронных детекторов с точностью до малых высших порядков пропорциональны частным производным показателя экстремума по соответствующим переменным. В случае инерционных объектов выходы синхронных детекто- ров будут уже не просто пропорциональными соответствующим !Xi' а будут представлять собой линейные преобразования этих производных, что сильно усложняет процесс определения f x .- в [77] показано, что если линейные MHoroMepHble части объекта описываются системами уравнений с автономными правыми ча- стями вида X i == a i1 x 1 + a i2 x 2 + . . . + aiпx n + iYi' то при достаточно высоких частотах поиска можно считать, что выход каждоrо синхронноrо детектора практически зависит лишь от производной по одной координате, так как входной сиrнал мноrосвязной линейной части объекта передается в основном только на один выход этой части. Практически для реализации такой «высокочастотной автономности» необходимо, чтобы низшая частота поиска превосходила собственные частоты объекта. Но, удовлетворив условиям автономности по низшей частоте, затруд- няем выявление производной по друrи:м координатам на более вы- соких частотах, кроме Toro, наивысшая частота должна быть меньше частоты высокочастотных помех. Все это существенно затрудняет использование синхронноrо детектирования в MHoro- связных системах с большим числом каналов. Релейный реrулятор. Перейдем к релейному принципу по- строения системы экстремальноrо реrулирования. Две особен- ности экстремальной системы дают возможность упростить схему: 1) требуется выявлять только знак производной f x ; 2) знак х определяется направлением движения сервомотора. Пусть мы имеем измерительный opraH, определяющий знак fx. Если f x отрицательна, то у убывает, т. е. приближается к требуемому экстремуму, направление движения сервомотора правильное и реrулятор не должен вмешиваться в работу сервомотора. Rоrда f x становится положительной, у удаляется от экстремума, серво- мотор движется в неправильную сторону и реrулятор должен осу- ществить переключение с целью изменить направление движения_ 156
Таким образом алrоритм работы идеальноrо реrулятора должен обеспечить выполнение условий (6-12) и может быть записан сле- дующим образом: R=O при fx<O, R == д (t k ) при fx (t) О, rде через R обозначена реакция реrулятора. Она или равна нулю, или представляет собою единичный импульс, приводящий в действие механизм переключения сервомотора. Реальный измерительный opraH всеrда будет обладать опреде- ленной зоной нечувствительности. По этой причине, а также для ослабления действия помех целесообразно будет выбрать в каче- стве пороrа переключения не величину fx == О, а некоторую вели- чину +8 (для реrулирования на минимум) или -8 (для реrулиро- вания на максимум): Реrулирование fx < 8, R == о, 1 на минимум Ix 8, R == 1' J Реrулирование f х > - 8, R == О, на максимум fx-8, R=l' rде А 1 - символ, обозначающий выработку единичноrо импульса при прохождении через пороr + 8 в направлении, определяемом неравенствами fx 8 (или f x - 8). При таком выборе пороrа переключение будет происходить после прохождения экстремума (реrулирование безынерционноrо объекта на минимум ПОRазано на рис. 6-9). Пусть в начальный момент включения реrулятора в работу у, у и х соответственно имели значения Уо, Уо < О, Х О > о (рассматриваем реrулирование . на минимум). Отрицательность Уо указывает на то, что у прибли- жается R ЭRстремуму, следовательно, сервомотор движется в пра- вильном направлении. Поэтому реrулятор дает возможность дви- . rаться в этом направлении. Rоrда экстремум будет пройден, у станет положительной и превзойдет пороr 8 (в момент t == t 1 ), произойдет переключение сервомотора и последний начнет дви- rаться в обратном направлении. Так RaK объеRТ безынерционный, . то у сразу же начнет возрастать и у, как показано на рис. 6-9, СRачком изменит знак на обратный. "Уменьшение х будет происхо- дить до момента t 2 , rде у снова достиrнет величины 8. Далее про- цесс становится периодическим. Отметим, что если бы в начальный момент х было отрицатель- НЫМ, а у - также отрицательным, то реrулятор разрешил бы дальнейшее уменьшение х и изменения х происходили бы так, как это показано на рис. 6-9 прерывистой линией. Поэтому в схемах подобноrо рода измерение х для выявления необходимости пе- реключения не нужно, и утверждения в [51, 52] относительно (6-18) 157
невозможности обойтись без лоrических элементов, реаrирующих на знак Х, слишком жестки. Мы видим, что в схеме рассматриваемоrо типа, rде харак- теристика релейноrо элемента не имеет rистерезисной петли, обязательно возникает автоколе- бательный режим вблизи экстре- t мума, носящий название р ы с- к а н ь я. В процессе рысканья система и осуществляет поиск эк- стремума. Но наличие рысканья приводит к тому, что средняя величина будет теперь отличать- ся от оптимальной. Отклонение средней величины от оптимума называется п о т е рей р ы с- к а н ь я. Ero величина возрастает с увеличением амплитуды коле- баний, а последняя возрастает с увеличением абсолютной вели- чины nopora в, поэтому 8 С точки зрения потерь рысканья выrодно уменьшать. Но предел уменьшению ставят помехи: надо, чтобы частота рысканья и ero амплитуда достаточно отличались от частоты и амп- литуды помех, чтобы предотвратить ложные срабатывания системы. Нетрудно понять, почему пороr 8 выбирается так, чтобы переключение проис- ходило n о с л е прохожде- ния экстремума. Если бы мы переключали систему до про- Ай хождения экстремума, то среднее значение у во время рысканья на величину в уда- лилось бы от экстремальноrо значения и потери рысканья возросли бы на эту величину. В рассмотренной схеме от- сутствовал rистерезис, что приводило обязательно к автоколебаниям. При определенных дина- мических характеристиках объекта и реrулятора можно, вводя rистерезис, получить устойчивое состояние равновесия вблизи экстремума. Для этоrо надо, чтобы при подходе R экстремуиу, HeMHoro не доходя до пеrо (на величину 8), сервомотор был оста- новлен. Рассмотрим реrулирование на максимум (рис. 6-10). Пусть в начальный момент (точка А о ) У > о, у растет, сервомотор рабо- Уа о о Рис. 6-9. 158 t t I ------- ------i-------- У ,А. I I I t I I I I I I I I I , I , ' I I I , I -------r--------- t Рис. 6-10.
тает правильно и реrулятор не дол}кен вмешиваться в ero работу. По мере приближения к максимуму f x ' оставаясь ПОЛОil\ительной, убывает по величине, и коrда /" становится равным 81 (точка А 1 ), реrулятор должен подействовать так, чтобы серво:мотор ОТКЛIО- чился. Тоrда, если l\IOMeHT отключения подобран правильно, у будет по инерции еще неноторое время возрастать и остановится вблизи экстремума. Rолебательноrо движения, таким образом, не будет. х у . . q + - ф Рис. 6-11. На рис. 6-11 показана схема Эhстремальноrо реrулятора, реа- лизующеrо подобный алrоритм [57]. Стрелка прибора, измеряю- щеrо у, и связанный с ней рычаr 1 поворачиваются от rоризон- тальноrо положения по часовой стрелке при iJ > о и против часо- вой стрелки при у < о. Момент ОТRлючения реrулирующеrо opraHa определяется парой контактов 1 з и 14, замыкаемых рычаrом 1 при небольшом положительном значении у == 818 Обратим внима- ние на следующее обстоятельство. Если в начальный мом:ент, Rоrда система ВRлючается в работу, у > 81, то стрелка из нулевоrо по- ложения быстро переместится вниз и рычаr Rоснется нонтактов. 110 оп не должен их замкнуть, так как серво:мотор работает 159
правильно. Замыкание должно произойти лишь при убывании у до величины 81. Чтобы это условие выполнялось, конструкция контактов выполняется так, что они замыкаются лишь в том слу- чае, если рычаr движется против часовой стрелки; при движении по часовой стрелке он коснется контактной пр ужины нижнеrо контакта, но не замкнет контактов. Сервомотор 2 в схеме не реверсируется. Реверсирование ре- rулирующеrо opraHa происходит с помощью электромаrнитных муфт 3 и 4, включаемых переключателем 5. Тяrа переключателя 5 связана с храповым колесом 14, приводимым в движение электро- маrнитами 12 и 13. При повороте храповоrо колеса на один зуб происходит переключение муфты с одноrо направления на дру- roe; при повороте на 1/2 зуба муфта либо переходит с включенноrо положения на отключенное, либо наоборот. Замыкание контактов 1з и 14 приводит к срабатыванию электромаrнита 13, который пово- рачивает храповое колесо на 1/2 зуба и тем самым переводит муфту из включенноrо положения 3 в отключенное. С целью изменения величины 8 при настройке реrулятора поло- жение контактов 1з и 1, может в некоторых пределах изменяться. Если контакты 1з и 14 оказались установленными слишком близко к нулевому положению (или же если в системе вблизи экстремума подействовала помеха, приведmая к запозданию от- ключения муфты), то после отключения может оказаться, что система по инерции перейдет за экстремум слишком далеко и у . начнет уменьшаться. При этом, если у станет меньше величины -82, произойдет замыкание контактов 11 и 12, что приведет к сра- батыванию электромаrнита 12, повороту храповика на один зуб и включению муфты 4, т. е. к реверсированию реrулирующеrо opraHa. Рассмотренная схема обладает существенным неприятным свой- ством. Пусть, например, iJ < о и рычаr 1 произвел выключение контактов 11 и 12, вследствие чеrо реrулирующий opraH начал идти в правильном направлении. Пусть в этот момент на прибор дей- ствует кратковременная помеха, приводящая к тому, что еще до перемены знака у стрелка прибора совершает ложное качание по часовой стрелке и затем, после исчезновения помехи, снова воз- вращается в первоначальное положение, вторично замыкая нон- такты 11 и 12. Это вторичное замыкание приводит к срабатыванию электромаrнита 12, повороту храповика и реверсированию pery- лирующеrо opraHa, который начинает двиrаться в неверном на- правлении, уменьшая у. Но так как 11 при этом была отрицатель- ной и рычаr 1 был повернут против часовой стрелки, то он теперь в этом положении и залипает, не производя необходимоrо реверса. Работа системы полностью расстраивается. Для предотвращения подобных неприятностей в схеме предусмотрены периодические принудительные реверсирования реrулирующеrо opraHa. На 160
рис. 6-11 такое принудительное реверсирование осуществляется вращаемым с постоянной сноростью кулачком 15, который один раз за оборот при водит к повороту храповоrо нолеса и переключе- нию направления вращения. Таким образом :исправляется ложное действие схемы, вызванное сбоем. Если же принудительное ревер- сирование произойдет во время нормальной работы, то начав- Iпееся после этоrо отклонение от экстремума приведет к замыка- нию нонтактов 11 и 12 И повторному реверсированию привода в нужном направлении. Время одноrо оборота кулачка 21 выби- рRетсл таким, чтобы за это время изменение у под воздействием сервомотора не превысило бы некоторой допустимой величины Лу ero отклонения от энстремума. На рис. 6-11 показаны две муфты 6 и 7, включаемые поперемен- но рычаrом 9, связанных с кулачком 8, вращающимся с постоян- ной скоростью. При включении муфты 6 приходит во вращение пал 10, связанный с одним из двух реrулирующих opraHOB; муфта 7 приводит во вращение вал 11 друrоrо реrулирующеrо opraHa. С добавкой муфт 6 и 7 валков 10 и 11 получае1 экстремальный pery- лятор, обеспечивающий экстремум функции двух переменных (так называемый двухканальный оптимизатор). Такой вариант opra- низации поиска экстремума функции двух переменных (по методу raycca - 3айделя) не является единственным. Друrие виды мно- rоканальноrо поиска будут рассмотрены НИiне, в 6-3. Рассмотрен- ная схема была одной из первых по времени, но в настоящее время используются менее rромоздкие решения. Релейный реrулятор с лоrИ1J€СRИМИ злемеНТ8}11I. Релейное управление можно осуществить также с помощью устройств лоrи- ческоrо действия [215; 53]. Введем следующие обозначения лоrических ЭJIементов ДJIЯ ехемы реrулирования на максимум: . . И 1 - если х > О, У > О, то х должен продолжать двиrаться в сторону открытия реrулирующеrо opraHa РО (опера- ция а 1 ); И 2 - если х > О, 11 < О, то х должен изменить направление и двиrаться в сторону закрытия РО (операция а 2 ); ИЗ - если х < О, У > О, то х должен продолжать двиrаться в сторону закрытия РО (операция а 2 ); И 4 - если х. < О, У < О, то х должен изменить направление вращения и двиrаться в сторону открытия РО (опера- ция а 1 ); ИЛИ 1 - если имеет место условие И 1 или И 4 , то Х увеличивается (операция а 1 ); ИЛИ 2 - если имеют место условия И 2 или ИЗ, то х уменьшается (операция а 2 ). Схема ВRлючения лоrических элементов, обеспечивающая описанный алrоритм, приведена на рис. 6-12. 161
На этом рисунке сиrналы +х и +У на входах лоrических эле- ментов появляются соответственно при положительных значениях производных х и у, а сиrналы -у и -х при отрицательных. Реа- лизация схемы с помощью поляризованных реле [52; 53] показана на рис. 6-13. Обратим внимание на то, что сиrналам:и а 1 и а 2 в данной схеме являются не сиrналы переключения (реверсирования), как это БЫJIО в предыдущей схеме, а еиrналы непосредственно управляю- lцие движением реrулирующеrо opraHa вперед (еиrнал а 1 ) и назД (а 2 ). Это потребоваJlО ВЫЯВ.1lения знака производных не TUJJ ько У, но и х. Схе:ма в лоrичес:ко:м ОТНОНlении стала неСКОЛhКО сложнее, +у -(J +х +х И/ И 2 +у -[) ИЛ Н, О/ -х И J -х И 4 ИЛИ;? а2 Рис. ()-12. l У ! Рис. 6-13. f- но зато отпала необходимость в устройстве периодическоrо прину- дительноrо реверсирования (устройство 21 на рис. 6-11). Однако в реальных условиях схему приходится усложнять, так как наличие инерционности в объекте приводит к тому, что изменения у начинаются не сразу после изменения х, а спустя . некоторое время и потому MrHoBeHHoe соотношение знаков х и у не всеrда точно определяет целесообразность немедленноrо выполнения соответствующей операции. Необходимо фиксировать лишь длительно существующие соотношения. Анализ показывает, что при этом надо добавить следующие условия: 1) операции И 1 и И 4 должны выполняться С некоторой задерж- кой после выполнения операции И 2 ; 2) сиrнал а 2 должен оставаться неизменным в течение некото- poro времени после выполнения операции И 2 ; 3) операции И 2 и ИЗ должны выполняться с некоторой задерж- кой после выполнения операции И 4 ; 4) сиrнал а 1 должен оставаться неизменным в течение некото- poro времени после выполнения операции И 4 . 162
Реализация этих операций осуще.ствляется путем введения до- полнительных лоrических элементов НЕ и элементов задержки 3 (рис. 6-14). Однако, рас- сматривая схему, мы ВИДИМ, что величина а 1 имеет место, коrда а 2 -+ х И f отсутствует, и наобо- рот, таRИМ образом а 2 :м:ожет быть получена путем использования лоrическоrо элемента НЕ при подаче на ero вход величины а 1 . Это позволяет ИСRЛЮЧИТЬ элемент ИЛИ 2 и свя- занные с ним элементы из схемы рис. 6-14. По- -х лучается более простая И J CXe1\Ia, lIоназанная на рис. (-)-15. Ifa рис. 6-16 пона- зана схема оптимизато- ра, предложенная в [ 1 91]. Требуется поддер- живать :минимальное значение у на выходе объеRта о. Дифферен- цирующий блон Д, выполняющий также роль лоrичеСI\оrо блока, '+у -у +х И-f +х +!) -у 32 +х И 2 НЕ 1 a f ИЛИ f -у 34 -х И 4 +у НЕ 2 ИЛИ 2 02 Рис. 6-14. И 2 32 HE f ИЛИ О, -(; 31 HE J -х ар И 4 HE z Рис. 6-15. выдает сиrнал 1', пропорциональный производной l' == kopy, если у изменяется в правильном направлении, т. е. еСJIИ ру < О, и не :выдает сиrнала (1' = О), если ру О, что условно отмечено 163
включением вентиля на выходе D. Сиrнал "? подводится ко входаl\tf усилителей Уа и Y 13 в каналах а и , обладающих характе- ристикой с насыщением: а, = f kyG, а < а т . Р < Рт; G < G т \ а т , т==const, т,' сх и В MoryT приниl\tlатъ только положительные значения а > о, > о, если > о. Если O, то СХ, _ 01. k y Уа а 'f ер kzp п а lL :r Ш у р k.: р Djd О 13 k y у р r Оп kup у Рис. 6-16. Выходные сиrналы с усилителей подводятся 1\ сумматору на входе реrУЛИРУlощеrо opraHa: а - непосредственно, - со зна- I\ОМ минус. "Уравнение реrулирующеrо opraHa: px==kl(a-). (6-19) В схеме предус:мотрены отрицательные обратные связи по производным В каналах а и . Блоки D a и D 13 аналоrичпы блоку D с той разницей, что их сиrналы пропорциональны производным при положительных значениях производных и равны нулю при отрицательных значениях _{к 2 р а 1 <р- О , Ф _ JK2P, -t о, 1 В [191] а и Mory r ПрRнимать только отрицательные зна ченил, так как используются операционные УСИJ!ители. ра>О ) paO; g. J (6-20) 164
Пусть мы находимся на возрастающей ветви характеристики у :::=:: f (х). Тоrда правильным движением будет то, при котором рх < о. Из (6-19) имеем > а, тоrда ру == f x (х) · рх, fx > о. Линеаризуя уравнение в окрестности HeKoToporo х = х о , полу- чаем ру == f x (Х о ) рх == kзрх. (6-21) Коэффициент k з зависит от х и изменит знак при переходе на надающую ветвь характеристики. Уравнения для координат а и будут: a==-Ky(py+K2P); } (6-22) == - К у (ру + К 2 ра); a>O, >O, ра>О, p>O, ру<о. Подставляя (6-21) в (6-22), после несложных преобразовавий получаем Tp==-(K+1)a+K; } т ра == - к а + (К - 1) ; рх < О, ра> О, p > О, а> О, > О, (6-23) rде т == K y k 2 , К == К у k 1 k з . Построим фазовый портрет системы в плоскости а, . Для этоrо раздеЛИl\1 первое из уравнений (6-23) на второе: d _ - (К -1- 1) а + КВ da--Ka+(/(-l)B. Сделав замену переменных d dz -==Z, -d =z+a- d ' а а а ПОЛУЧИЬ-l уравнение с разделяющимися переменным:и: [(K-1)z-КJdz da - (К -1) Z2 + 2Kz - (К + 1) - а. Учитывая, что корни знаменателя левой части вещественны, интеrрируя и возвращаясь к переменным а и , после некоторых преобразований получим (- a)( - 'Ха) - СВ = 2 - a (1 + 'Х) + 'Ха 2 С2 = О; \ (6-24) а>О, >a, ра>О, p>O, f К+1 rде Х == К _ l ' С - произвольная постоянная (неравенство В > а эквивалентно неравенству рх < О). Решая уравнение относительно , получаем уравнение фазо- Вых траекторий в виде = 0,5 [(х + 1) ах V(x -1)2 а 2 + 4C 2 J. (6-25) 165
Фазовые траектории при х > О показаныl на рис. 6-17 . На рисунке показаны только физически существующие части траек- торий, удовлетворяющие всем неравенствам (6-24). Они лежат внутри треуrольника ОАВ, rипотенуза == а KOToporo является биссеитри:сой координатноrо уrла, и отсутствуют внутри клина, К К+1 образованноrо пря:м:ыми == к _ 1 а и == к . При К < 1 и % < О направление движения по траеИТОРИЯ1\1 не соот- ветствует неравенствам, следовательно, траектории физичесни не существуют и схема нера- ботоспособна. При малейшей случайной помехе, приводя- щей изображающую точку в область, не заполненную траекториями, мы получаем перемещение реrулирующеrо ()praHa лишь в момент дей- ствия помехи (если она вы- шла за пределы зоны нечув- ствитсльности), и нан ТОЛЬRО помеха исчезает, движение пренращается. При «пра- вильном» же направлении помехи IIзобраiнающая точка а придет по фазовой траекто- рии на линию == т' после чеrо изменение В прекра- тится, p станет равным ну- лю, и в соответствии с первым из уравнений (6-23) N м Рис. 6-17. в (Х,т к a== K+1 1YL' что соответствует ТОЧRе М на рис. 6-17. Тоrда из (6-19) рх = К 2 ( к 1 -1) т = - к 1 т. (6-26) (6-27) Если бы у линейно зависела от х, и f x была постоянной, то зна- чения а и в дальнейшем сохранялись бы постоянными, а реrули- рующий opraH двиrался бы равномерно в соответствии с уравне- ниями (6-26) и (6-27). Но так RaR обычно по 1\lере приближения к экстре:муму fx уменьшается, то это приводит К уменьшению RОЭф- фициента К 2 , а следовательно, и К, и изображающая точка в нонце концов начинает двиrаться R началу координат по траектории, зависящей от вида функции f (х). Заметим, что если начальное воз- мущение таково, что изображающая точка попадает на траекто- рию, близко подходящую к линии ОН, то движение в силу уравне- ния (6-19) может прекратитъса вблизи этой линии... Если остановка 16&
Ilроизойдет вдали от эн:стремума, то она не будет длительной. Под р1[пяниеl\f любой помехи, действующей в правильном направлении 11 вышедшей за пределы зоны нечувствительности, система по- падает на одну из фазовых траекторий и описанный выше цикл повторяется. Если же помеха действует в неправильную сторону, она :l\lожет вызвать лишь кратн:овременное смещение реrулирую- lцрrо opraHa, которое прен:ращается, н:ак тольн:о исчезает помеха. С\.ема им:еет нен:оторое сходство с системами с лоrичесн:ими эле- \Iентами, рассмотренны:м:и выше, но отличается от них в основном leI, что она реаrирует на дрейф характеристин:и вдоль оси у. Т(Н-{, если х соответствует наименьшему значению у, но это наи- меньшее значение достаточно быстро увеличивается, то происходит срабатывание схемы. Неправильное движение не приводит к ревер- сироваНИIО реrулируюп,еrо opraHa, а просто прекращается, дви- жение же в правильном направлении из состояния покоя возникает под действием помех и затем поддерживается системой. Случайные помехи иrрают здесь роль поисковых движений, но орrанизация движения н: эн:стремуму в данной схеме более проста и эффективна, чем в системе с синхронным детектированием, рассмотренной ниже (C1. рис. 6-22). Для Toro случая, коrда мы находимся на падающей ветви харак- теристики, k з , а следовательно, и К изменяют знаJ{ фазовые траек- 10РИИ, и:м:еют анаJIоrичную форму, но располаrаются теперь в треуrольнике под биссектрисой ОВ. Не будем рассматривать этоrо случая, предоставив сделать это читателю. Наличие инер- ционности в объекте приводит к таким же затруднениям, какие lI\lеJIИ место и в лоrических схемах, описанных ранее. Схемы с запоминанием ЭRстремума. Экстремапьное управление целесообразно использовать тоrда, коrда экстремальные значения Поназателя у MoryT в процессе работы изменяться заранее не из- вестным образом. Но мы видели, что в эн:стремальных системах в процессе поисн:а эн:стрему:ма обычно совершается рысканье, при- чеlVl реrулятор настраивается тан:, чтобы в каждом периоде Рысн:анья величина у обязательно проходила через свое экстремаль- Ное значение. Таким образом, используя соответствующие запо- минающие устройства, мы можем запоминать каждый из экстре- Мумов и сохранять ero значение на последующий период. Наиболее Употребительными элементами запоминания экстремума являются: механический датчин: знан:а - рычаr, насаживаемый с трением lIa ось прибора, измеряющеrо ПОI(азатель ЭRтремума (рис. 6-18, а), 1I нонденсатор (рис. 6-18, б). Ход рычаrа с трением оrраничен контактами-упорами К 1 и К 2 . При возрастании у замыкается н:онтант Н 1 , при убывании - Н.онтакт К 2 . Положение рычаrа между упорами соответствует ЭRстремуму. Конденсатор подключен R датчику, напряжение выхода н.ото- Poro пропорционально у. При возрастании питающеrо напряжения 167
возрастает и напряжение на обкладках конденсатора. При убыва- нии напряжения диод не дает возможности конденсатору разря- жаться и на ero обкладках сохраняется напряжение, соответствую- щее экстремуму. В конце цикла рысканья необходимо предусмот- a) J /(1 К 2 б) у с r Рис. 6-18. реть кратковременное подключение к конденсатору разрядпоrо сопротивления r. На рис. 6-19 показана схема релейноrо реrулятора с запомина- нием экстремума. На ось 1 стрелки ивмерительноrо прибора, уrол поворота которой пропорционален показателю экстремума у :J s 9 Ш 1 у РО о + Рис. 6-19. насажен механический датчик знака 2. При повороте стрелки от положения экстремума у* на уrол, соответствующий убыванию величины у* на y*, замыкается контакт 3, включающий обмотку 4 marOBoro искателя. Шаrовый искатель срабатывает и поворачи"'l вает щетку распределителя 5 на один шаr. Заметим, что включение происходит лишь при убывании У, т. е. после прохождения ЭК'" стремума. Поворот щеТRИ приводит к реверсированию исполпи- тельноrо двиrателя 6. 168
В схеме не происходит выявление знаRа Х, поэтому для предот- вращения ложных срабатываний под влиянием помех необходимо устройство, аналоrичное принудительному коммутатору в схеме рис. 6-11. Если в результате помех произойдет ложное срабатывание иска- телЯ при движении системы в направлении максимума, то произой- JIeT неправильное реверсирование двиrателя, которое приведет n убыванию у. Контакт, соответствующий убыванию у, будет продолжать оставаться включенным, и реверсирование двиrателя в нужном направлении не произойдет. Чтобы восстановить пра- вильную работу, используется дополнительный контакт 7 реле времени 8, который размыкает- у ел через некоторое время после срабатывания искателя. Обмот- ка реле 8 включается блок-кон- тактом 9 искателя. Рис. 6-20 JSY поясняет работу отдельных эле- ментов схемы. Эта временная )l;иаrрамма отличается от диа- rраlМЫ рис. 6-9 Te1vI, что момент переключения в данной схе:ме соответствует изменению у* на величину y*, а не изменению Ji. Друrие схемы описаны в t121, 58, 221, 46]. Так как при дифференциро- вании происходит усиление вы- СОI{очастотных помех, то релей- ная схема с запоминанием эк- стремума оказывается наиболее предпочтительной при реrулиро- вании малоинерционных объектов, подверженных заметным высо- кочастотным флуктуациям, релейная схема, действующая по производным - при реrулировании малоинерционных объектов, слабо подвеРiненных действию помех; шаrовая релейная схема - при реrулировании сильно инерционных объектов. Импульсные (шаrовые) экстремальные реrуляторы отличаются тем, что у них производится принудительная дискретизация (кван- тование по времени) воздействий на систему для осуществления принудительноrо поиска. Воздействия производятся в дискретные равноотстоящие интервалы времени в виде импульсов, параметры КОТОРЫХ зависят от результатов действия управляющих импульсов на предыдущем mare. Для этой цвли в системе имеются устройство Для измерения результатов действия управляющеrо импульса, устройство их запоминания и вычислительное устройство для обработки хранящихся в запоминающем устройстве величин. После получения результатов обработки, подается очередной уп- равляющий импульс, старые результаты в памяти стираются и о t Рис. 6-20. 169
вза1ен записываются и обрабатываются результаты следующеrо и[пульса. Шаrовые систе1'vIЫ разделяются на ряд типов. Введение импульсноrо устройства в пропорциональную си- стему, реаrирующую на знак и величину производной f:л-, превра- щает ее в пропорционально импульсную систему. В принципе возможно измерять x[п], y[п] в момент времени t == пТ, rде т - период чередования импульсов, и следующий импульс на управляющий opraH в момент t === (п + 1) Т сделать [ y [п] x п+1]==К Лх[п] . Однако в практике большее распространение получили более простые в осуществлении релейно-импульсные схемы, реаrирую- щие не на величину y/ x, а на ее знак. На реrулирующий орrаи в моменты времени t, 2t, ..., пt, ... подаются импульсы по- стоянной амплитуды, сообщающие реrулирующему opraHy оди- наковые перемещения x. Направление пере:мещения определяется знаком y/ x. При этом, так же }{а}{ и в обычном релейном ва- рианте, MoryT быть два исполнения системы. В первом исполнении определяется зна}{ только y и при перемене знака осуществляется реверсирование реrулирующеrо opraHa. В этом случае для устра- нения возможных ложных действий систеЬtIЫ под влиянием помех необходиl\tIО предусмотреть коммутатор, периодически осущеСl'В- ляющий принудительное реверсирование двиrателя. Во втором исполнении изменяются знаки обоих перемещений на предыдущем этапе sign y и sign x и решение о направлении следующеrо перемещения принимается лоrичес}{ой схемой. На рис. 6-21 показана схема шаrовой релейно-импульсной си- стемы, реаrирующей на оба знака sign у и sign , разработанной в Институте электротехники АН усср [53]. Командный reHepa- тор 4, непрерывно вращаясь, замыкает по очереди }{онтакты: 1 - подающий питание в об:мот}{у реле, ВRлючающеrо цепь 5 измерения показателя экстремума у (t 1 ); контакт 11 включает дви- rатель 9 на промеЖУТОR времени tl' в течение ROToporo совер- шается один mar перемещения реrулирующеrо opraHa; контакт 111 включает цепь 6 измерения значения ПОRазателя ЭRстремума у (t 2 ) в I{онце mara; ROHTaKT IV ВRлючает элемент сравнения, ко- торый при У2 > Уl не производит переключений и дает возможность двиrателю совершить следующий mar в том же направлении, а при У2 < Уl реверсирует ero. TaxoreHepaTop 8 измеряет х и подает ero на лоrическую схему 7, действие которой было описано ВЫlпе (см. рис. 6-13). Замедления, необходимые для правильноrо сужде- пия о знаках производных в инерционных объектах, можно полу- чить, подбирая соответствующим образом скорость вращения reHe- ратора 4. На рис. 6-21 показаны измерительные элементы 1 и 2 170
11 вычислитеJIьное устройство 3 для выработки показателн экстре- мума у. Системы со случайными сиrналами поиска. Кроме де1ермини- g f х О} ,8 , I I 2 РО 6 Рис. 6-21. рuнанных сиrналов поиска, в системах экстремальноrо реrулиро- ванин l\1orYT при:меннться и случайные сиrналы [76, 77, 170, 195, OXt OXt cдi О f СД}) oXV Рис. 6-22. Фl Ul Фv и}) 196], если эти сиrналы MoryT быть каким-либо образом измерены. Для энстремальноrо реrулирования в этом случае MoryT быть ис- пользованы схемы с синхронными детекторами СД (рис. 6-22), н которых поисновые сиrналы б х подаются на синхронные 171
Детенторы либо от t3нешиеrо relIepaTopa шумов, либо от даТtIЙ1\ОВ, из:меряющих естественные mУl\IЫ в объекте. В последнем: случае сиrнал помехи пропускается через фильтры, выделяющие высоко- частотные составляющие помехи, которые и подводятся к синхрон- ным детенторам в :качестве опорных сиrналов. Пусть X i == X iP + 6x i , rде x ZP - то IIОЛОiнение i-ro реrулирующеrо opraHa, которое было бы при отсутствии флунтуации, назовем ero рабочим положением; б х - шум в i-M нанале. I Предположим, что 6X i в разных :каналах представляют собою независимые центрированные случайные функции времени, для которых справедливы соотношения: lVl {OX i } == О; М {ох.ох.} == {М {oxl}} == 0i ПРи.i ==.i J О при I * l; М {OXiOX j .. . OX V } == О, по нрайней мере, при i *- j *- k, ... Выходные величины синхронных детенторов будут (6-28) U v == w Фv (р) [f t3xv + :!i t3x i t3x v +. · .1 == 1.=1 = k v (Т) (f t3x v + 1 :!i t3x i t3x v +. · .) dT, (6-29) rде W Фv (р) - линейные операторы фильтров синхронных детек- торов; k v (t) - весовые (импульсные переходные) фуннции. Значения фуннций в круrлой скоб:ке под интеrралом берутся при apryMeHTe t - "(. Находя матеl\Iатичесное ожидание и учиты- вая свойства центрированных функций (6-28), получаем со - _ (-'3 aF ) _ \ (-2 д! \ uv-Wфv(Р) t3x v axv +... - .) kv(T) t3x v axv +...)dT. о Обычно члены, имеющие высший порядон малости, MoryT быть отброшены. Если случайные нолебания поисна стационарны, а ра- бочие составляющие координат постоянны, то - а! ох 2 == const, ах == const и со - - д! - а! uvoxW Фv (О) a OX--a k v (Т) dT. X v X v О (6-30) 172
Таким образом, математические ожидания выходных сиrналов синхронных детекторов с точностью до малых высших порядков пропорциональны соответствующим частным: производным. Но так как центрированные случайныIe составляющие выходных сиrналов множительных звеньев не подавляются фильтрами полностью, то выходные сиrналы также содержат в своем составе случайные помехи. В [77] для нвадратичных характеристик объеRта, стацио- нарных БХ i 1J постоянных X iP определена дисперсия 00 (u v - U v )2 == f2 БХ LV k\, (Т) dT О (6-31 ) и отношение сиrнала к IПУМУ бх , --==-9 д! ax v V бх:V ax v А - - -- (6-32) - f-{ бх V 'rvJ v - 'rvJ v f ' rде через J v обозначена интеrральная квадратичная оценка ИМ- пульсной переходной фуннции: сп J v == k (Т) d 1. О Из (6-32) видно, что для увеличения А целесообразно у:мень- шать время корреляции поисковых сиrналов. Однан.о возможность уменьшения оrраничивается инерционностью объеI\та. В инерционных объен.тах определение частных производпых, так же как :и в СJIучае реrулярных поисковых воздействий, значи- тельно усложняется в связи с TeI, что выходные величины син- хронных детенторов будут в общем случае содерiнать состаВЛЯIощие, пропорциональные всем частным ПРОИЗВОДНЫI. В частном случае, как показано в [77], н.оrда степень числитеJIЯ передаточной фунн.- ции объекта (т. е. части систеl\'IЫ, входо:м I\ОТОРОЙ является пере- мещение реrулирующеrо opraHa Z, а выходом - результаты из- менения координат объента х) на единицу меньше знаменателя, а в начестве поисковых сиrна.лов используются независимый белый шум или шум с равномерной спектральной плотностью в диапазоне частот, HaMHoro превосходящем полосу собственных частот объек- та, синхронное детентирование можно использовать в таком же виде, нак и в безынерционных системах. (6-33) 6-3. основные методы поиска зкстремума функциR мноrих переменных Различные виды поисна можно разделить [186] на две ос- новные rруппы: 1) слепой поиск; 2) поиск с анализом про:межуточ- ных результатов. При слепом поиске необходимо знать область рабочих (или до- пустимых) значений apryMeHToB X i функции У === f (X i ). Друrой 173
информации о функции f почти не требуется (если не считать, что подразумевается оrраниченность этой фуннции и наличие конеч- Horo числа экстремумов в рабочей области, расстояние между ко- торыми больше, че:м расстояние между шаrам:и поиска). Одна из форм поиска - снанирование, т. е. последовательный просмотр всей допустиl\t10Й области значений арrУl\'lеитов. Сканирование мо- ,нет быть орrанизовано различными реrулярными способами: построчное - как в телевизорах, спиральное - кан в радиоло- каторах и Т. д. В процессе просмотра запоминается наибольшие (или наименьшие) из всех предыдущих значений ФУНI\I\ИИ и в нонце цикла сканирования выIираютсяя те значения Х, которые соответ- ствуют наибольшему из мансимумов (или наименыпему из мини- мумов). Этот вид поиска решает задачу rлобальноrо поиска эк- стремума. Однако трудно представить себе промышленную или транспортную установку, для которой осуществление TaKoro спо- соба поиска было бы позволительным. Этот способ используется в математических приборах, в вычислительных устройствах для нахождения экстремумов и друrих особенностей функций. В про- l\Iышленной установке rлобальный поиск Mor бы осуществляться на модели установки, соответствие которой ориrиналу проверяется и норректируется в процессе работы. Интересной формой слепоrо поиска является случайный поиск. Предложен ряд вариантов случайноrо поисна. Один из вариантов состоит в 1'01\1, что устройство поиска задает по случайному закону ряд номбинаций {Хl, Х 2 , ..., Х n }. При каждой комбинации проис- ходит измерение у и отбрасывание ero, если оно (при поиске ми- нимума) оназалось больше предыдущеrо, или же при запоминании ero и стирании из памяти предыдущеrо значения, если оно оказа- лось ближе к искомому значению. После достаточно большоrо числа поисковых попытон поиск прекращается и последние значе- ния У* (ХТ, х:, ..., x) считаются оптимальными. Чрезмерно большая длительность этой процедуры привела R разработне друrих вариантов, в которых время поисна сокра- щается. Тан, например, в друrом варианте случайный поисн раз- деляется на этапы. По окончании каждоrо этапа происходит пере- распределение вероятностей выбора различных значений X i тан, чтобы те значения, для которых вероятнее !vlеньшее значение у, выбирались чаще. Возможны также комбинации реrулярных и статистичесних процедур [186]. Среди видов поиска второй rруппы (поисков с анализом промежуточных результатов) происходит постепенное накопление информации, позволяющее уснорить процесс приближения к энстремуму. Наибольшее распростра- нение получили следующие виды реrулярных поисков этой rруппы. 1. Метод rаусса-3айделя. "Устанавливается очеред- ность изменения координат Х 1 , Х 2 , ..., Х n . Пусть она совпадает с очередностью индексов 1, 2, ..., п. Сначала шаrами изменяем первую 174
J\оординату Хl- fIусть ОТЫСl\ивается минимум и сделан первый нроб- НЫЙ шаr Xl- В конце каждоrо 1llara опредеJIяем знак приращения y. Если y положительно, первый шаr сделан в ложном направ- лении, изменяем направление и движемся до тех пор, пока y в конце :каждоrо шаrа остается ОТрИIатеJIЬНО. .коrда l1у станет равным нулю (или переменит зна:к), прекращаем изменение Х 1 и начинаем изменять Х 2 , сохраняя все остальные координаты постоянными. Изображение идеальной (с бесконечно малыми шаrами) траекто- рии поиска по методу raycca - 3айделя экстремума функции двух переменных по:казано на рис. 6-23, rде тонкими линиями нане- сены линии у == const. Вид траектории существенно зависит от рас- положения поверхности у и на- чальной точки Ай. Линия 1 со- ответствует наиболее блаrо- приятному расположению, при- ход R экстремуму происходит за один цикл изменения только координаты Х 1 . При том же расположении осей, но ином расположении начальной точки Во приближение к экстремуму происходит за несколько этапов (кривая 2). Процесс поиска су- щественно удлиняется. На бы- строту и даже на сходимость поиска может оказать влияние и величина шаrа. При этом возможны :колебания вдали от э:кстремума. На рис_ 6-24, а движение начинается из точ:ки А о . Первый mar сделан, допустим, в точку А 1 , rде y о:казалось поло- жительным. После этоrо следуют три шаrа снова в точку Ай, за- те:м в точки А 2 И Аз- В точке Аз произошла смена знака, и процесс изменения Х2 пре:кращается, начинается изменение координаты Х 1 . Делается шаr в точку А 4 . Так как в ней y > О, делается обрат- ный шаr в точку Аз и еще mar в точку А 5 . В точке А 5 y снова стало положительным, поэтому изменение Х 2 прекращается и начинается изменение X 1 . Рис. 6-24, а показывает, что процесс оказался рас- ходящимся. Во избежание этоrо в [190] предложено чередовать направление первоrо шаrа в повторных циклах: если в первом цикле первый шаr по переменной был положительным, то во вто- ром цикле оп делается отрицательным и т. д. На рис. 6-24, б ноказан поиск в той же системе при тех же начальных условиях при соблюдении чередования направлений. Отличаясь сравни- тельной простотой в конструктивном воплощении, метод raycca - 3айделя отличается наибольшим временем поиска по сравнению с друrими методами, поэтому он используется обычно в маЛОRа- нальных оптимизаторах. Рис. 6-23. 175
2. М е т о Д r р а Д и е н т а. Предположим, что на предыду- щем mare были определены все частные производные f хl, f х2, ..., t Тоrда следующий mar делается одновременно по всем RООрДИ- Х п ' Х2 Ав А 7 Xz Х I Ав X А 9 А Б Рис. 6-24. натам: так, чтобы перемещение по каждой координате было про- порционально соответствующей частной производной при maroBoM поиске или же чтобы скорость изменения координаты была про- порциональна соответствующей fx. при непрерывном ПОИСRе. Шаrовый поиск L\x i == + а/ х " } непрерыввыи поиск PX i = -1= afx:. (6-34) rде а > О; верхние знаип соответствуют попс:ку максимума, ниж- ние - поиску минимума. Каждый рабочий mar при этом методе поиска является одно- временно пробным maroM для последующеrо рабочеrо mara. Сов- мещение пробных и рабочих движений и одновременное выполнение переме- щений по всем координатам во мноrих случаях обеспечивает существенное со- кращение времени поиска. ОднаRО ор- rанизация движения к ЭRстремуму по методу rрадиента не всеrда является самой совершенной. При непрерывном движении по rpa- диенту траектория движения будет нор- мальной к линиям у === const (:кривая 1 па рис. 6-25). При неблаrоприятном Рис. 6-25. расположении поверхности и исходной точки движение будет происходить по сильно искривленной траектории (особенно заметно это при на. личии rребней и oBparoB на поверхности у (кривая 2 на рис. 6-25). В природе путь по линии rрадиента представляется естественным: 176
таИ именно стекает :капля воды на рельефной местности. Но при неблаrоприятном рельефе реки получаются сильно извилистыми. Рационализируя движение, можно сократить путь движения к :н<стремуму. Один из путей рационализации состоит в том, чтобы R зависимости от характера поверхности и от динамических Свойств ()бъекта выбирать различные коэффициенты воздействия по произ- водным a i , осуществляя поисн по закону: при maroBoM поиске при непрерывном поиске Xi == a i ! xi' ) dx' d/ == ai!Xi. (6-35) Некоторые примеры выбора коэффициентов a i будут рассмот- рены ниже. 3. М е т о Д н а и с R О рей m е r о с п у с R а. Метод был предложен л. В. Канторовичем [59] для mирокоrо класса функ- ционалов. В соответствии с этим методом сначала определяется направление rрадиента в начальной точке и затем производится прямолинейное движение по это:м:у направлению до тех пор, пока не обратится в нуль (или не станет положительной в случае поиска минимума) производная df/dl вдоль этоrо направления. Далее снова производится измерение rрадиента (которое в случае д! остановки точно в точке al == О будет, очевидно, перпендикулярно предыдущему направлению) и снова выполняется движение до обращения производной вдоль ROBoro направления в нуль и т. д. (рис. 6-23, прерывистая линия 3). Нетрудно видеть, что метод наИСRорейmеrо СПУСRа предетав- Jlяет собой усовершенствование метода raycca - 3айделя в том смысле, что путь к ЭRстремуму хотя и зависит от расположения начальной точ:ки, но теперь оп инвариантен по отношению R поло- жению координатных осей: движение можно представить себе в новой системе Rоординат, повернутой таким образом, чтобы одна из них (та, по которой будет совершено первое движение) совпала с направлением rрадиента в начальной точке. В остальном методы сходны. Во мноrих случаях метод наискорейmеrо спуска по срав- нению с методом faycca - 3айделя дает заметное сокращение времени выхода в ОI<рестность экстремума. Метод обычно рацио- нально применять в начале, вдалеке от экстремума. На первых этапах шаrи получаются крупными. При приближении к экстре- l\'lYMY продолжение поиска может осуществляться уже друrим методом, например rрадиентным. 4. С т а т и с т и ч е с к и й п о и с К. Возможно построить таRие алrоритмы, которые позволяют для осуществления поиска использовать элемент случайности. Один из подобных алrоритмов описан в [149]. Пусть каким-либо образом (по некоторому алrоритму А выбора реrулирующеrо воздействия) к реrулирующим орrаП8И приложены 177
воздейсrвия {и 1 , Uz., ..., и,J. Реrулирующие орrаны при Э10М начнут двиrа1ЬСЯ со скоростям:и, пропорциональным:и и1,: (/ l 1 -; t == ) ,и1,. в результа1е Toro начинает изменяться и величина у = -= f (х 1 , ..., х п ). Определение правильности изменения у прово- дится по следующему алrоритму сравнения (алrорит:м В). Чтобы избежать необходимости дифференцирования у и уси- ления при этом влияния высокочастотных помех, сравнивается величина у с величиной HeKoToporo сиrнала сравнения 11, который вырабатывается reHepaTopoM сиrнала сравнения (rCC) и подвер- rается принудительно медленным изменениям. При этом устанав- ливаются два режима работы системы: режим подrотовки и режим поиска. В реЖИlVlе подrотовки (в случае поиска минимума) вели- чина 11 медленно возрастает со скоростью == с > О, при этом реrулирующие орrаны неподвижны и при отсутствии помех в объекте, приводящих к блужданию экстремума, у остается постоянным. Предполаrается, что перед этим, в предшествующем режиме, величина 11 была меньше у. Rоrда по мере роста 11 станет равным у (или 11 + Вl == У при наличии зоны нечувствительности 21)' происходит пере:ключение на режим поиска: реrулирующим opraHaM по алrоритму А сообщаются новые скорости и у начинает из:меняться. Величина сиrнала сравнения 11 в режиме поиска медленно убывает со скоростью 11 == q < о. Режим поиска про- должается до тех пор, пока снова у не станет равным 11 (или 11 - 22 == У при наличии зоны нечувствительности 22). Хара:кте- ристики режимов сведены в табл. 6-1. При этом MoryT быть два случая: 1) из:менение у совершается в правильном направлении; Таблица 6-1 Rритерий . Режимы у 'r\ Подrотовка У>Т] const с > О (у > Т] - 81) IIоиск У<11 var q < о (у < 11 -t- 82) 2) направление изменения у неправильно. В первом случае (поиск на интервале времени Т 1 , рис. 6-26) величина у уменьшается, т. е. изменение происходит в том же направлении, как и изменение сиrнала сравнения у, время поиска Т 1 получается длительным и величина у успевает приблизиться к экстремуму. После Toro :как величины "l - 82 И У сравняются, происходит переход на режим 178
подrотов:ки. Во втором случае (поиск на интервале времени Т 2 ) величина у возрастает, удаляясь от экстреМуl'tlа. '-Так как измене- ния У и 11 совершаются в противоположных направлениях, у быстро доrоняет 11, неудачный поиск у заканчивается быстрее и снова на- ступает режим подrотовки. Описанный алrоритм, таким об- разо:м, состоит из двух частей: алrоритм А ныработ:ки решения и etЛI'ОРИТlVI В uценки реЗУJ1ьтатов. Ха- рактерным для преДJIаrаемоrо мето- )a является вторая часть - aJlro- ритм В. ДЛЯ алrоритма А при этом l\10ЖНО предложить любую процеду- ру - детерминированную или слу- чайную. Автор метода в [149] описал систему, rде в :качестве алrоритма А использовал ась случайная процедура, сходная с той, :которая использовалась в «усилителе отбора» Р. Эшби [203]. Из источника возможных случайных состояний ис (рис. 6-27), например таб- лицы случайных чисел в памяти цифровой машины, с помощью rсиераторов случайных сиrиалов rc, число которых равно числу реrулирующих opraHoB объ- екта, производится каждый раз случайная выборка зна- чений, преобразуемых в воз- действия на реrулирующие орrаны {иl, и 2 , ..., и п }. Друrие методы исполь- зования случайноrо поиска, и их исследование даны в [ 151, 150, 48]. Исследования по:казали, что потери на поиск для метода случайноrо по- иска с возвратом в исходное положение после HeBepHoro шаrа и пересчетом оказались меньше потерь на поиск по соответст- вующим модифи:каЦИЯl\I метода rрадиента, если число каналов системы больше трех. На этом основании автор рекомендует СJlучайный поиск как основной метод для мноrо:канальных систем. не БУ о Рис. 6-27. " " ,," <::1 <:::> с) Е':: с:> t 72 -- т, Рис. 6-26. 6-4. Примеры выполнения мноrоканальных оптимизаторов с различными методами поиска Приводимые ниже краткие описания основных узлов MHoro- н:анальных оптимизаторов в большинстве своем :касаются лабора- торных опытных образцов и приводятся С целью ИЛJIюстрации оаидаемых возможностей оптимизаторов. 179
Мы уже виделИ выше, tITO обычные экстремальные реrуляторы экстремума функции одной переменной MoryT снабжаться устрой- ствами для поочередноrо в:ключения одноrо и Toro же реrулятора в разные каналы управления (рис. 6-11). Одна:ко независимые фиксированные заранее величины тактов работы каналов обра- зуют далеко не лучший способ поис:ка. При этом движение данноrо реrулирующеrо орrапа может пре:кратиться принудительно за- долrо до достижения частноrо экстремума по данной кооРдинате либо, наоборот, данный канал будет долrое вре:мя, пока не сра- ботает кулачок 16, оставаться включенны:м после достижения экстремума только по данной координате. Все это создает ИЗЛИIпние 51" w 4 t sinw2t siпш"t Uf XI Ир о Х2 Из а/р а/р Рис. 6-28. потери и затяrивает цикл поиска. Сделав работу переключателя каналов зависимой от знака y, мы м:ожем получить мноrоканаль- вый оптимизатор, работающий более орrанизованно и осуществ- ляющий поиск, например по методу raycca - 3айделя. Для экстремальноrо управления безынерционными MHoroKOop- динатными объектами возможно применение мноrоканальных систем, осуществляющих движение к экстремуму по методу rpa- диента, использующих измерение частных производных df/dXi (например, с помощью синхронноrо детектирования) или же производных dy/dt по методу, рассмотренному выше. Блок-схемы этих устройств показаны на рис. 6-28 и 6-29. Рассмотренные выше одноканальные оптимизаторы (рис. 6-8 и 6-16) здесь просто повто- ряются в различных наналах. В качестве примера системы, работающей по методу rрадиента, рассмотрим двухканальный автоматический оптимизатор ДАО-2 [7]. Блок-схема оптимизатора по:казана на рис. 6-30. Относительно объектов, для которых предназначается оптимизатор, предпола- 180
lается, tITO они MoryT быть предетавлепы в виде соедиnеН:RЯ ЛlIней" ных динамичеСI\ИХ звеньев L 1 и L 2 И нелинейноrо безынерционноrо звена с характеристикой у == f (х 1 , х 2 ), И:l\Iеlощей в рабочей области Х 1 , х 2 Е Х экстремум (рис. 6-30). На входы L 1 и L 2 подаются соот- ветственно упраВЛЯlощие воздействия и 1 и и2. Каналы управле- ния считаются ненави- симыми. Оптимизатор рассчи- тан на два варианта: 1) вариант, при котором скорость блуждания эк- стремума достаточно ма- ла в сравнении со ско- ростью переходных про- цессов в L 1 и L 2 , 2) вариант, при котором эти две скорости СОИ3- меРИIЫ. В первом варианте схема работает следую- щим образом. Про- rpaMMHoe устройство ПJl дает номанду на изме- рение показателя каче- ства у в исходной точке и на направление ре- зультата измерения в операционный блок ОБl первоrо канала. Дискретный фильтр Ф преобразует отфильтрованный от помех пока- затель качества у в число пl1, пропорциональное У, которое посту- пает в реверсивный счетчик блока ОБ1. После этоrо в первом о у .... Рис. 6-29. о и, Xf у L i у X [п??- п2J ИД2 062 [-п22] ПУ ф п ИД 1 061 [-пн) {п21- ПнJ Рис. 6-30. 181
канале производится первый пробный шаr, а в реверсивном счетчи- ке блока ОБl записывается :код числа [- п 11 ]Обр (путем замены еди- ниц числа п 1 l нулями :и наоборот). По окончании пробноrо mara производится новое измерение у и результат измерения поступает в реверсивные счетчи:ки операционных блонов ОБl И ОБ2 обоих каналов. В результате в счетчике ОБl образуется обратный код разности [п 12 - пl110бр, а в ОБ2 прямым }{ОДОIvI записано число п12. После этоrо делаются пробный шаr по второму каналу и из:ме- иение прямоrо кода п 2 1 в блоке ОБ2 на обратный [- п 12 ]Обр' Н конце BToporo шаrа снова измеряется у и превращается в число п 22 , !{оторое поступает в ОБ2 и образует код [п 22 - Jl 1 2]Обр. Счетчики в обоих каналах имеют разряды знака разности. Если разность п 2i - п 1i положительна, то в знаковом разряде появляется единица, если отри- цательна - нуль. СлеДУIОЩИЙ про- rраммный импульс дает команду на считывание знака разности. По этому знаку дается команда на включение исполнительноrо двиrателя И Д в том или ином направлении (двиrатель ревер- сируется, коrда у начинает уда- ляться от эсткремума). После этоrо дается команда одновремен- но на пуск двиrателя и на счи- Р С 6 31 тывание числа в счетчике. Счи- и. - . тывание этоrо числа - величины разности - производится импульсами, поступающими в счетчик с постоянной частотой. Так как в счетчике записан обратный код разности, то после поступления числа импульсов, равных раз- ности, счетчик оказывается заполненным: во всех ero разрядах появляются единицы. Следующий импульс переполняет счетчик, и импульс переполнения (смена единицы на нуль в старшем раз- ряде) отключает двиrатель. Таким: образом, перемещение двиrа- теля будет пропорциональным времени, в течение KOToporo шло считывание, а оно, в свою очередь, будет при заданном числе импульсов обратно пропорционально частоте. Изменяя частоту считываIОЩИХ импульсов, можно изменять коэффициент пропор- циональности между величиной рабочеrо шаrа и производной. Система осуществляет поиск по методу rрадиента, но рабочему циклу предшествуют два поочередных пробных mara. Схема дви- жения в фазовой плоскости показана на рис. 6-31. Во втором варианте, рассчитанном на блуждание экстремума со скоростью, соизмеримой со скоростью процессов в объекте, при- няты меры для ускорения процессов во время пробных шаrов. Для этой цели в операционных блоках добавлены еще два счетчика, осущеСТВЛЯlощие форсировку исполнительных двиrателей по упро- 182
щенно:му закону (с постоянными lоментами переl\JIючений), близкому к оптимальному по быстродействию. Амплитуда форсирующеrо импульса U rп выбирается пропор- циональной разности п 2i - п 1i , а ero длительность постоянна и рассчитана заранее (рис. 6-32). Описанная система предназначена для работы в химических установках (в частности, для оптими- зации процесса KOHTaKTHoro разложения спиртовой шихты до дивинила). В качестве примера ОПТИl\tIизатора, работающеrо по методу наискорейшеrо спуска, рассмотрим двухканальный оптимизатор, предложенный А. А. Фельдбаумом иР. и. Стаховским [183]. Ответственной задачей при построении оптимизаторов является выбор величины mara. При I{РУПНОМ mare ускоряется поиск, но снижается точность поддержа- и,Х ния экстремума, при мелком- повышается точность, но замед- ляется поиск. При практических решениях часто идут на двой- ную систему с «rрубым поиском» (обычно вдали от экстремума) и «точным поиском>) (вблизи от Hero). Переход к точному поиску осу- ществляется после Toro, как rpy- быми шаrами оптимизатор перей- дет через экстремум. Возможно вообще использование систеI с переменным шаrом, например, пропорциональным rрадиенту или первой разности функции y на предыдущем шаrе. Были предложены также способы, основы- вающиеся на экстраполяции по параболе по результатам изме- рения на трех смежных шаrах. При этом вычисляется экстремум на параболе, аппроксимирующей функцию у, и система приводится в точку рассчитанноrо экстремума, после чеrо поиск продолжается. Возможна и интерполяция по результатам измерения на двух marax по разные стороны экстремума. В рассматриваемой схеме был принят вариант, при котором в качестве меры принята вели- чина е :::J " " " " " " " " ,," , t о "r Рис. 6-32. п s=! l ai I i=l и заданы два ее пороrовых значения 1 и 2 > 1. При > 2 осуществляется rрубый, при 1 < < 2 точный поиск, при < 1 поиск прекращается, система останавливается на некоторое время 1:', по истечении KOToporo производится контрольное измерение rрадиента. Объект, выходная величина у KOToporo подлежит мини- мизации, имеет п входов Хl, ..., Х n . 183
Схема OCHoBHoro блока оптимизатора показана на рис. 6-33. Первый цикл работы схемы начинается с определения rрадиента. Контакты Ко на выходе объекта и К 1 в схеме усилителя по- стояпноrо TOI{a Уl отпираются управляющим блоном на время '{, а затем вновь запираются. НаПрЯiнение и 1 на выходе Уl при замы- нании К 1 возрастает по занону, определяемому передаточной функцией усилителя У1, и в теченпе времени 17 успевает стать равным у с обратным знаком, т. е. -Уо == - f (Х 1 , ..., X r /). Таким образом, осуществляется запоминание величины у. На следующем шаrе цикла замы:кается I{ЛЮЧ К 6 !, задающий малое приращение dX 1 :координате Х 1 , после чеrо сиrнаЛОl\i «старт» включается реrулирующий орrап объекта и соверmае1СЯ рабочий Ко ":" R o и2 -:- ":" -:- На упраВляющий блок Рис. 6-33. такт, в результате KOToporo реrулирующий opraH отрабатывает перемещение I1Х 1 и через неноторое время на выходе объекта уста- навливается значение У1 = f (Х 1 + x, Х 2 , ..., Х п ). Ключ К 1 запи- рается, но на неноторое время 't отпираютс ключи Ко, К 21 И К З1 , В результате чеrо на выходе У 2 появляется напряжение и 2 == = Уо - Уl == ! (Хl, Х 2 , ..., xrJ - f (Х 1 + x, Х 2 , ..., Х п ) === - Yl. К нонцу времени 't на выходе усилителя У 31 устанавливается, а в дальнейшем после запирания К 21 и К З1 запоминается напря- жение и 31 == I1Уl. Приращение X мало :и примерно постоянно, поэтому I1Уl примерно пропорционально производной dy/dx 1 . Таким образом, к концу BToporo шаrа запо:минается значение производной !Хl' Далее, на третьем, четвертом и т. д. - до n + 1-ro mara включительно совершенно аналоrичным образом происходит запоминание производных ! XQ f Хз' ..., f х в остальных "', n каналах. На этом заканчивается операция определения rрадиента. В завершающей части больmоrо цикла происходит выработка 184
n величины = ! 1 :!i 1, сравнение ее с пороrовыми значениями и i=l подача команды на следующий цикл поиска. Величина , равная сумме модулей частных производных, вырабатывается с помощью схемы, поназанной на рис. 6-34. Напряжения И З l, ..., U Зп ' про- порциональные частным производным, через соответственные пары диодов дl' Дi, ..., д n ' Д проходят либо на левую (если U Зi < О), либо на правую (при U Зi > О) сетну двойноrо триода Лl. IIапряжения с левой сетки, пройдя через катодный повторитель, попадают с обратным знаком на правую сетну, и в }{онеЧНОrf итоrе приращение потенциала на пра- вом аноде лампы Лl оказывается пропорциональным . С помощью не показанных на CXel\1e несим- Д 1 метричных триrrеров выявляются знаки разностей - 1 И - 2 И В соответствии с приведенными выше неравенствами пр:инимается решение о характере дальнейmеrо цикла. Если 2 > > 1' то вклю- чаются на известное время ключи К 51 , ..., Коп и начинается точный поиск, если > 2' то включаются одновременно ключи K 4i и K 5i , зарядный ток в цепях ем}{остей интеrрирующих звеньев У41 увеличивается, mаrи становятся круп- нее и происходит rрубый ПОИСh. Операция rрубоrо поиска происходит слеДУЮЩИf образом. На не:которое время отпираются ключи K 4i и К 51 . Тоrда значения dy/dx1, (наПРЯiнения u зi ), У:МlIоженные на некоторый :коэффициент, поступают на вход интеrрирующих усилителей Y4i II величины X i получают приращения, пропорциональные fL. Далее, после уста- новления t1x i на выходе этих блоков управляющее устройство дает сиrнал на отработку этих перемещений реrулирующими орrанами и после изменения y анализирует знак разности Yj+l == Yj+l - Yj, образующейся на выходе усилителя У 2 при отпертом I{люче КО. При Yj+l > О такт повторяется, при Yj+l <О происходит переход на цикл измерения rрадиента. Точный поиск осуществляется точно 'rакже, но при этом вклю- чаются только ключи K 5i . По описанному принципу были построены образцы двух- и двенадцатиканальных оптимизаторов [166 -169]. из, из,'] L-____ Рис. 6-34.
rЛАВА СЕДЬМАЯ МЕТОДЫ ИССЛЕДОВАНИЯ ДИНАМИКИ ЭКСТРЕМАЛЬНЫХ СИСТЕМ 7-1. Общие сведения Экстреl\fальное реrулирование обладает рядом особенностей, сильно усложняющих исследование динамики. Процесс экстре- мальноrо реrулирования можно расчленить на ряд составляющих процессов, для описания каждоrо из которых зачастую нужен специфический :м:атематический аппарат. Отметим эти процессы. а) Процесс измерения показателя качества у. Специфика состоит в том, что непосредственное измерение у, как это имеет :м:есто в обычных системах реrулирования, возможно далеко не всеrда. Часто у представляет собою сводный показатель, измерение H.oToporo состоит из измерения ряда координат системы Х", и затеl\1 вычисления сводноrо поназателя с помощью вычислительноrо устройства. Обычно значения координат X i поступают на входы динамических звеньев, изображающих простейшие измерительные устройства, а операция вычисления у должна быть произведена над выходами этих звеньев ;i' Во мноrих случаях процесс экстре- мальноrо реrулирования происходит весьма медленно в сравнении с процессами в измерителях, и тоrда последние можно представить в виде безынерционных преобразователей. Но иноrда с инерцион- ностью измерителей нельзя не считаться. б) Процесс измерения параметров, характеризующих положе- ние текущеrо значения У относительно экстремума. Этот процесс является первой стадией поиска. Для cBoero осуществления он требует вмешательства в работу объекта и приложения к нему дополнительных поисковых воздействий либо в виде детермини- рованных заданных воздействий, либо в виде случайных флуктуа- ций. В результате этоrо процесса система, в зависимости от ее принципа действия, вырабатывает величины, характеризующие либо производные !x l ' либо их знаки sign !Xi' либо знаки первых разностей Yi+l - Yi И X i -11 - X i , либо знаки и величины произ- . . водных У и X i , либо осуществляет запоминание или предсказание экстремума у* и определение разностей У - у*, х - х* и т. д. 186
в) Процесс выраБОТfiИ управляющих воздействий состоит в лоrи- ческой или математической обработке информации, полученной па предыдущих этапах и формировании на их основании сиrнала, прилаrаемоrо к реrулирующему opraHy системы. r) Производство рабочеrо шаrа, реализующеrо управляющие воздействия. Динамика рабочеrо mara обычно не отличается от динамики обычных систем реrулирования. Рабочий шаr в некото- рых системах совмещается с поисковым, и ero результаты служат для выработки решения о следующем шаrе, но в некоторых систе- м:ах рабочие и поисковые шаrи производятся и обрабатываются раздельно. На каждом из перечисленных этапов может исполь- зоваться свой алrоритм, отличный от алrоритмов на друrих этапах. Все эти процессы объединяются в единый процесс экстремальноrо реrулирования. Математическим аппаратом для исследования экстремальных систем: должен быть такой, который позволил бы рассматривать обrцую совокупность алrоритмов на отдельных тапах, подобно том:у, как теория импульсноrо реrулирования в ряде с.пучаев )\ает возможность исследовать общую совокупность процессов, происходящих в системе во время Иl\ПIУЛЬСОВ и во вреl\fЯ пауз. rraKoro рода теория экстремальноrо управления пока еще не t'ОRдана, JI исследование обычно ведется раздельно на на,НДО1\l ;)тапе. 7-2. Уравнения орrаниаации движения какстремуму в непрерывных идеальных (ква8истационарных) экстремальных системах IIдеальной непрерывной систеl\iОЙ назовем: таI{УЮ систему, н которой все значения частных производных f xi В любой момент времени считаются измеренными :и которые непрерывно преобра- зуются в сиrналы, используемые в качестве входных сиrналов для системы управления, также непрерывной. Несмотря на то, что в идеальной системе исключаются из рассм:отрения процессы измерения и поиска, исследование представляет в ряде случаев определенный интерес для практики. В частности,- это имеет 1\1есто тоrда, коrда рабочие составляющие координат изменяются мед- ленно в сравнении с ПОИСI{ОВЫМИ составляющими и ширина полос частот поисковых сиrналов значительно шире частот OCHOBHoro процесса экстремальноrо реrулирования. Режимы, удовлетворяю- щие этим условиям, называются квазистационарными режимами. R квазистационарным близки, в частности, режи:мы в системах с rармонической модуляцией и синхронным детеRтированиеl\1. Для систем:, режимы которых близки R Rвазистационарным, дина- мическая модель идеальной непрерывной системы представляет непосредственный интерес. Далее, в системах maroBoro типа для наилучшей орrанизации следующеrо mara также в ряде случаев 187
MoryT быть использованы результаты теоретическоrо анализа идеальной дискретной системы, а при достаточно малой длитель- ности maroB - и идеальной непрерывной системы. Нроме TOI'O, анализ идеальных систеhI позволяет более наrлядно выяснить ряд существенных особенностей процессов экстремальноrо реrулиро- вания, которые при исследовании только частных составляющих процесса остаются часто в тени. Во мноrих практических случаях структурную схему объекта экстре:м:альноrо управления можно представить так, как показано на рис. 7-1. Управляющие воздей- ствия u = {и 1 , и 2 , ..., и п } прикладываются к исполнительным устройствам НУ, на выходе которых вырабатываются перемеще- ния реrулирующих opraHoB z == f Zl, Z2, ..., Zп}. Реrулирующие орrаны, воздействуя на входы объекта О, вызывают изменение основных координат объе:кта х == {Х 1 , Х 2 , ..., Х п }. Показатель ка- чества у представляет собою функцию координат UI НУ, XI у == f (х 1, Х 2 , ..., Х п) , 04 02 f(tc) у (7-1) и2 ИУz х И1\IРЮЩУЮ экстремум HYi-ННО- ro вида в рабочей области. Здесь, как уже от:м:ечалось в Э 6-1, нужно различать два основных случая: в пер- вом - показатель у имеет физический смысл только в статике. Тоrда динамические процессы в объекте не представляют интереса непосредственно для процесса ЭRстремальноrо управления, так как во вреl\iIЯ их протекания экстремальное реrулирование не дает никакоrо определенноrо эффекта; эти ПРf)цессы сдедует при существую- щих оrраничениях завершить ВОЗ1\!ОЖНО быстрее для Уl\1еньше- ния потерь качества; в этом случае можно исследовать дина.. мику изменения установившихся значений X iy (или, если X iy являются монотонными функциями Z, динамику изменения поло- i-кений реrулирующих орrапов z), т. е. динамику действия только управляющеrо устройства. Относительно текущих значений х добиваем:ся лишь Toro, чтобы они возможно быстрее и устойчиво приближались к установивтИ1СЯ значениям. Во втором случае, коrда показатель качества существует и в динамике, задача иссле- дования может состоять в TO! , чтобы минимизировать потери качества и в процессе реrУJIирования, для чеrо уже должны рас- сматриваться совместно уравнения объекта и управляющих устройств. При рассмотрении схеIЫ рис" 7-1 можем выделить следующие случаи: ип ИУп z х Рис. 7-1. 188
1. Объект управляем и наБJIюдаем непосредственно по коорди- натам х и показателю у. Это наиболее простой для исследования, но не столь часто встречающийся случай. К нему сводят обычно исследование безынерционных объектов, у которых координаты Х 1 ' ..., Х п зависят однозначно (обычно пропорционально) от пере- мещений соотвеТСТВУIОЩИХ реrулирующих opraHoB z. Для таких систем z можно вообще не рассматривать и считать, что коорди- наты х представляют собою входные воздействия на объект (рис. 7-2, а). Поисковые воздействия MoryT также прилаrаться, а) 6) и, О у ZL 0., 02 У ип f(x) 8) с) о Z, 04 Xi 02 ((х) ? Рис. 7-2. нак показано на рис. 7-2, а, к реrулирующим opraHaM непосредст- венно. 2. Объект наблюдаем непосредственно по координатам х и у, но оказать воздействие на координаты х непосредственно управ- ляющим устройством невозможно, оно может быть приложено только ко входам объекта, Т. е. к реrулирующим oprt:\HaM. Поисно- вые воздействия здесь YrI\e будут !1z, а не x (рис. 7-2, б). Приме- POlVl таной системы является рассмотренный в Э 6-2 двиrатель транс- lIupTHoro экипаiна. Мы можем измерять ero путь х и скорость , но непосредственно изменять можем: не скорость, а ОТRрЫ1'ие pery- лируrощеrо клапана или расход rорючеrо q. 3. ()бъект непосредственно наблюдаем лишь по Rоординатам , являющимся выходами устройств для измерения х, и координате 11 на выходе устройства, измеРllющеrо у, и управляем непосредст- венно по координатам х (рис. 7-2, в). TaKoro рода схему получаем тоrда, коrда инерционностью объекта Iv10ЖНО пренебречь, но нельзя пренебречь инерционвостью ивмерительных элементов. 189
4. Объект непосредственно наблюдаем по координатам и и непосредственно управляем по координатам z (рис. 7-2, е). Эта схема получается тоrда, Rоrда нельзя пренебречь инерционно- стями ни объекта, ни измерительных элементов. Начнем с рассмотрения первоrо типа систем, rде доступно непосредственное воздействие на хинепосредственное измерение х и у (рис. 7-2, а). Пусть критерий качества выражается фУНI\цией (7-1). Пред- полаrается что функция t дифференцируема по всем apryMeHTaM и и:м:еет экстремум нужноrо типа в рабочей области значений Х1,ЕХ. П родифференцируеl\'l (7-1) по времени: n n dy == !!L dx == " f х dt дх], dt 2], ==1 1l Если критерий качества сохраняет свой смысл только в статике, то мы будем интересоваться в первую очередь орrанизацией дви- жения R энстремуму в соответствии с уравнениями !tl = q., (! l' 12' . .., 1 п)' i = 1, 2, ..., 11. (7 -3) (7-2) ()ДИН ИЗ способов синтеза управляющих ВО3ДРЙС1ВИЙ состоит в том, что функции ер! в уравнениях (7-3) выбираIОТСЯ таи, чтобы в силу этих уравнений функция dц dt == W (f), 12, ..., f 11 ) ( 7 - 4 ) была опредеJIеННО-ПОЛОiRительной в случае реI'улирования на максимум, и определенно-отрицательной в случае реrулирования на минимум [75, 77, 34,55]. При этом, как нетрудно видеть, точка экстремума будет устойчивой по Ляпунову, а движение R KCTpe- муму из любой точки в ero окрестности будет таким, что функция у будет приближаться к своему экстремум:у монотонно. В самом деле, если движение определяется полностью урав- нениями (7-2), то функция у -у* == v (х 1 , Х 2 , ..., Х n ) (7-5) в окрестности минимума у* == min определенно-положительна, а производная dTl == dy == W (7-6) dt dt в СИJlУ уравнений (7-3) по условию выбора ер1,' определенно отри- цательна. Функция V есть функция Ляпунова, и состояние равно- весия у == у* устойчиво асимптотически. Аналоrично ДОRазы- вается и асимптотическая устойчивость максимума, при которой V будет определенно-отрицательной, а W - определенно-положи- тельной. Если же движение определяется не только уравнениями (7-3), но и друrими дифференциальными уравнеНИЯМИ t например 180
объекта и измерительных устройств, то ФУНRЦИИ V И И 7 , так нан 1 еперь они будут зависеть не от всех координат системы (ВRлючая z и ), а лишь от их части, не будут относиться к Rлассу знаRО- определенных функций, поэтому для определения устойчивости II вообще харантера движения к экстремуму потребуется расс:м:от- рение всей совокупности уравнений. ЗамеТИl\1, что даже в первой rруппе систем (с безынерционными объеRтами и измерительными элементами) обеспечение УСJI0ВИЙ :наRООIIределенности функции (7-4) не I'арантирует хорошеrо t\ачества реIу.пирования по всем: Jоордината:м х. Система в дaHHOI С,lIучае существенно нелинейна и при :монотонном И3Iенении у 'fожет И1\1еть :место сильно колебательное изменение координат х. Для Toro чтобы наrлядно уяснить это положение, предстаВИl\I себе ropy, на которую ведет дороrа, все вре:мя подни:мающаяся вверх, но извивающаяся в виде серпантина или MHoroRpaTHO оборачи- вающаяся BOKpyr вершины спиралью. Поэтому достаточное условие м:онотонности приближения у к экстремуму не всеrда будет доста- точным условием приемлемоrо Rачества реrулирования. I-Iаиболее просто реализуемой в технических условиях формой ФУНRЦИЙ CPi' очевидно, является линейная форма, рассмотрением !,-оторой и оrраничимся. Наиболее общей линейной формой будет '1:1., :которая ВRлючает все переменные задачи: d: t = ai1fl + ai2fx2 +... + aiпfx n . i == 1, 2, ..., 11. (7-7) 'Уравнения (7-7) содержат п 2 коэффициентов a1,j, выбор ноторых оrраничивается условиями знаRоопредеJlенности формы w. Необ- \одимые и достаточные условия знаRоопределенности (условия Спльвестера, [197]): а 11 > О, а 11 а 12 а 21 а 22 >0 z , ..., а 11 а 12 . . . а 1п а 21 а 22 . . · а 2п О <::: , (7-8) ан! а п2 .. .а пп rде верхние знаки неравенства соответствуют определенной поло- жительности, а нижние - определенной отрицательности формы. Обычно п 2 произвольных постоянных - слишком большое число и для праRтичеСRоrо решения задачи бывает достаточно оrраничиться меньшим числом параметров наСТрОЙRИ. В этом случае можно ввести более простые способы выбора произвольных коэффициентов, основывающиеся на достаточных условиях знаRО- определенности, выражаемых равенствами. Так, подставляя (7-7) в (7-2), получим n п dy 2 dt == W = (ан + aji) /1,/j + akk/h. i, ;= 1 k = 1 i *] (7-9) 191
Рассмотрим следующие виды частных достаточных условий знакоопределенности: 1) ан>О, аij+аj= -1- 2а1.'iа:JJ. (7-10) При этом w == -t- (. -v аи )2 /i 1=1 (7 -11) и число произвольно выбираемых коэффициентов с'.!. _ {п+1)п n L 1 - 2 ' (7 -12) что составляет 1, 3, 6, 10 для п == 1, 2, 3, 4 соответственно. 2) аи> О, а.. == - а.. } )1,. i :i:: j (7-13) Этот способ выбора коэффициентов был предложен в [33, 34, 55]. Здесь число произвольно выбираемых коэффициентов также определяется формулой (7-12). "Уравнения (7-7) принимают вид (если ац выбраны положительными): dx! - -r f t + f f . dt - - а 11 Хl + а 12 Х 2 а 1з х з + · . · + а 1п Х п ' dX 2 - - f -1- f f f . dt - а 12 Х! - а 22 Х 2 + а 2з X J + · · · + а 211 Х п ' dхз - - f - f -{- f f . dt - а 1з Хl а 2з х з -- а зз Х З + · . · +- а З ,1 '1l' I I ,' 'lп'/, 2/' 'аз/,з '. · ' - т:/ n; ] (7 -14) Функция W при этом имеет вид n W -+ f - - L.J ан X i . 1=1 (7 -15) Верхние знаки в выражениях (7-14) и (7-15) соответствуют поиску максимума, нижние - поиску МИНИl\fУlа. 3) ан О, aij == о. 1. F j (7-16) Число произвольно выбираемых коэффициентов при этом равно n 4) ан == а, а. . == о. i;; j При данном выборе коэффициентов движение к экстремуму осуществляется вдоль направления rрадиента. (7 -17) 182
7-3. Динамика непрерывных идеальных экстремальных систем, работающих по методу rрадиента Динамика rрадиентных квазистационарных систем детально рассмотрена А. А. Rрасовским [77]. Структурная схема управле- ния безынерционным объектом показана на рис. 7-3. Звенья с передаточными функциями W i MoryT представлять инерцион- ность фильтров и исполнительных устройств. Относительно функции у == f (х 1 , Х 2 , ..., Х n ) делаем предполо- жение, что она является (или может быть в рассматриваемой области аппроксимирована) rиперповерхностью i n 1- Xi () о у у-у*= = b ij (X i - xt) (Х ; - хз), i, ;=1 д (х) дХl (7 -18) имеющей в точке у* == f (Х{ , * * ) Х2, ..., х n экстремум типа минимума или максимума. В [197] показано, что при сечении этой rиперповерхности плоскостью у == const мы получаем rипер- поверхность BToporo порядка, называемую квадркой, которая в данном случае представляет собою мноrомерный эллипсоид, центр ROToporo совпадает с центром координат dXi = Xi - xt. Уравнение вида Рис. 7-3. b 11 - л Ь 12 ... Ь 1n Ь 21 Ь 22 -л · .. Ь 2n =0 (7-19) Ь n1 Ь n2 . .. Ь nn - л называется вековым уравнением. Все корни BeKoBoro уравнен;ия, составленноrо для коэффициентов эллипсоида, вещественны, поло- жительны для экстремума-минимума и отрицательны для экст- ремума-максимума, а их модули обратно пропорциональны квад- ратам полуосей определяющеrо эллипсоида n Ь..Ах.Ах.=1. L.J ) 1. :J i, ;=1 (7-20) в случае фУПRЦИИ двух переменных поверхность у = f (х 1 , х 2 ) будет представлять собою эллиптичеСRИЙ параболоид в простран- стве (x 1 , х 2 , у), сечение KOToporo плоскостью, перпендикулярпой оси У, дает эллипс, а ПЛОСRОСТЬЮ параллельной оси у - пара- болу. 193
Уравнения движеНИJl :к экстремуму (7-7) при использовании метода rрадиента в случае безынерционных объекта и каналов управления в соответствии с условиями (7-17) имеют вид dXi _ -t- (1 ) dt - - а xi + bi , (7-21) rде воздействие Si (см. рис. 7-3) может включать в себя поисковые воздействия и шумы. В случае линейных инерционных каналов dXi _ -1- W (1 t.) dt - - \ xi + , (7-22) rде W - передаточная фуннция напала. (Мы будем считать, что передаточные функции во всех каналах одинаковы.) Из (7-18) следует, что n а (у- у*) ау ! / Х. = а =а- = Ь..Ах. Х. Х . ЗЗ ' З= 1 (7-23) при наличии переменных во времени воздействий точка экстре- мума таRже будет изменяться «(дрейфовать»), поэтому после подстановки (7-23) в уравнения (7-21) и (7-22) получим для безы- нерционноrо канала n 1 dAx ! 1 dxf -+---- b..Ax.=. -+- -- - а dt 1,ЗЗ Ь1, а dt · 1 = 1 (7-24) Запишем уравнение в виде отношения определителей: n А. 1 '\1 ( pxj \ AXi = Аl, = А '- A ij + а - 6з; , ;= 1 (7-25) rде 8 - определитель системы, равный Ь - Е- Ь 12 11 -+- а Ь - р Ь -+- - 21 22 а Ь 1n Ь 2n А= (7 -26) Ь n1 Ь n2 ... Ь -Р nn-l- а J).i - определитель присоединенной матрицы, получаемый из J). путем замены i-ro столбца столбцом из правых частей уравнения (7-24); J).ij - алrебраическое дополнение элемента i-ro столбца и j-й строки определителя 8. Корни характеристическоrо уравнения системы (7-24), как э'rо видно из (7-26), с точностью до множителя l/ а совпадают с корнями BeKoBoro уравнения (7-19). В случае экстремума-макси- 194
!\1ума корни BeKoBoro уравнения отрицательны, в (7-25) берется верхний знак, такой же, как в вековом уравнении, следовательно, корни /l также отрицательны. В случае экстремума-минимума корни (7-19) положительны, но в (7-25) берется нижний знак, противоположный знаку при "л в вековом уравнении. Отсюда сле- дует, что все корни характеристическоrо уравнения замкнутой безынерционной идеальной системы непрерывноrо экстремальноrо реrулирования, работающей по методу rрадиента, вещественны и отрицательны. Степень устойчивости I а I I л Imin = 02 , тах (7 -27) rде С таХ - длина наибольшей полуоси определяющеrо эллип- соида. Это дает возможность либо оценить время реrулирования т (3 + 4) C:nax р I а I ' либо выбрать а по заданному времени реrулирования (оно должно быть примерно на порядок больше периода шумов). В случае инерционных каналов с одинаковыми передаточными функциями W ив (7-25) и (7-26), заменяя а на W, получим n (* ) 1 РХ;" AX i = А ! Ан w (р) - 6i , ;=1 (7 -28) (7-29) rде ы 1 - P) ... Ь 1n А= (7-30) Ь n1 bnn- wР(р) Так как (7-30) получается из (7-19) заменой л на plW (р), то все корни характеристическоrо уравнения ;). = о получаются из соотношения р. 1 --- w (рй - -1- 01' (7-31) rде C i - полуоси определяющеrо эллипсоида. Так как коэффи- циент их усиления W (О) отрицателен в случае реrулирования на минимум и положителен в случае реrулирования на максимум, то соотношение (7 -31) можно привести к виду W (р) + 1 - О (7 -32) С 2 -. Р i Отсюда следует, что для устойчивости rрадиептной идеальной непрерывной системы с безынерциовным объектом и одинаковыми 191
каналами необходимо и достаточно, чтобы были устойчивы n изолированных каналов, представляющих замкнутую цепочку, состоящие каждая из данноrо канала, интеrрирующеrо звена и i безынерционноrо звена с коэффициентом усиления C (рис. 7-4). При инерционном объекте задача усложняется. В результате синхронноrо детектирования на выходе каждоrо из детекторов появляется величина, линейно зависящая не только от f x . данноrо детектора, но и от остальных частных производных. Это равно- сильно появлению перекрестных связей в системе. Получается система мноrосвязноrо реrулирования. Для таRИХ систем метод rрадиента становится уже обычно недо- статочно эффективным. eTOД rрадиента представляется впол- не естественным, коrда определяющий эллипсоид представляет собою шар. Если же полуоси эллипсоида имеют разные длины, то постоянные времени движения по разным осям получаются также раз- Рис. 7-4. личными, пропорциональными квадратами полуосей. Получается несоответствие: чем больше полуось, тем медленнее происходит изменение коорди- наты по этой оси. Рассмотрим некоторые друrие способы выбора коэффициентов. Пусть w 1 f -- с{ - р ....- - у - у* = bl1Ax + b22Ax. Будем считать, что положение экстремума неизменно. Тоrда д/ д/ дАХl = 2b 11 Ax 1 , дАХ2 2Ь 22 Ах 2 . Выбираем коэффициенты а в соответствии с (7-14). Тоrда, так как функция имеет минимум у* = О, то а:е 1 = - a 1 Jx 1 = - 2а 11 ы l Ах 1 ; a:e s = - а!2!Х! = - 2а22Ь!2АХ20 Выбирая получим 196 а 11 Ь 11 = а 22 Ь 22 = а, (7-33) ан = Ь;l ' j azs=-ь · 22 (7-34)
В тех случаях, коrда воздействия по частным производным выбираются прямо пропорциональными нвадрата:м: соответствую- щих полуосей определяющеrо эллипсоида, при функции f вида для RОТОРОЙ полуоси эллипсоида совпадаIОТ с координатными осями, получается автономное экстремальное реrулирование, при котором процессы во всех каналах протекают в соответствии снезависимыми друr от друrа урав- нениями nepBoro порядка вида 1 dXi а dt +xi=O. n у == biiAxf, i=l (7-36) (7-35) r Нетрудно видеть, что в данном случае движение осуществляется по линии пересечения поверхности у = = f (х 1 , ..., х n ) С плоскостью, прохо- дящей через ось у и начальную точку Уо = f (Х 10 , ..., Х nО ) (рис. 7-5). В более общем случае, коrда опре- деляющий эллипсоид повернут отно- сительно осей, задача об автономном Рис. 7-5. реrулировании с равными постоян- ными времени также может быть решена путем введения воздей- ствий по всем частным производным в каждом из каналов. Пусть 1 Ь 2 2 Ь 1 Ь 2 2 (7 37) У=2 tXt+ 12 X I X 2+2 2 Х 2, - причем Ь 1 Ь 2 - bi2> О и, следовательно, при у = const получаем эллипс. Функция у имеет минимум в начале координат. Выбираем для движения реrулирующих opraHoB уравнения: dl = a l1 !x. + а 12 !х,; ) (7-38) 2 = a 21 fx. + a 22 fx.' Находим ду ) /Х! = дх! = Ь 1 Х 1 + Ь 12 Х 2 ; ду fX 2 =-д = Ь 12 Х 1 + Ь 2 Х 2 . Х2 Подставляя (7-39) в (7-38), получим l = (a l1 Ь 1 + а 12 Ь 12 ) Х 1 + (ан Ь 12 + а 12 Ь 2 ) Х 2 ; ) :2 = (а 21 Ь 1 + а 22 Ь 12 ) Х 1 + (а 21 Ь 12 + а 22 Ь 2 )х 2 . (7-39) (7 -40) 197
Условия автономности получаем в виде: а 11 Ь 12 + a 12 b 2 = И; а 21 Ь 1 + а 22 Ь 12 == О; а 11 Ь 1 + а 12 Ь 12 =--= - а; а 21 Ь 12 + а 22 Ь 2 == - а, rде а - векоторая произвольно выбираемая стоянная. Решая четыре уравнения (7-41) с выми a ij , находим (7 -41) положитеJIьная по- четырьмя неизвест- а 11 == - сЬ 2 ; а 12 == а 21 == сЬ 12 ; а 22 == - сЬ 1 , (7 -42) а rде с == Ь 1 Ь 2 _ bi2 . Уравнения (7-40) принимают вид: dx. d/ + aXi == о. (7-43) Движение по-прежнему будет совершаться в плоскости, про- ходящей через ось у. При учете инерционностей задача соответст- венно усложняется. В ряде случаев при этом на систему MoryT быть наложены более общие условия динамической автономности, которые будут рассмотрены ниже, в rл. 8. 7-4. Определение периодических режимов методом rармоническоrо баланса в конечном результате действия релейных и шаrовых систем экстремальноrо реrулирования в системе устанавливается при неизменных возмущающих силах периодическое движение вблизи экстремума, получившее название «рысканье». В процессе ры- сканья точка экстремума периодически проходится системой, среднее же значение показателя оптимальности будет при поиске минимума больше, а при поиске максимума - меньше экстремаль- Horo значения. Среднее (а иноrда средне-квадратическое) устано- вившееся отклонение величины показателя качества от экстре- мума называется потерей на рысканье. Очевидно, так как нижняя (при поиске минимума) rраница у = Ymin фиксирована, то потеря па рысканье будет тем больше, чем больше будет верхняя rраница у в процессе рысканья, т. е. тем больше, чем больше амплитуда колебаний. Частотные характеристики линейной части системы дают возможность установить связь между амплитудой и частотой. В большинстве случаев в рабочей зоне с возрастанием частоты колебаний их амплитуда уменьшается. Поэтому на первый взrляд представляется, что с точки зрения уменьшения потери рысканья выrоднее увеличивать частоту и уменьшать амплитуду рысканья. До известных пределов это действительно так. Но в процессе 198
рЫСRанья система все время осуществляет поиск ЭRстремума. Это означает, что параметры периодическоrо режима ДОЛЖНЫ быть таRИIИ, чтобы система моrла надежно и чеТRО отличать полезный сиrнал от помехи, т. е. чтобы амплитуда и частота полезноrо сиrнала (рысканья) отличались от амплитуды и частоты помехи примерно на порядок. Определение параметров рысканья представляет собою важ- ную задачу исследования, RОТОРОЙ в литературе было уделено достаточно MHoro внимания. Трудность исследования обусловлена тем, что уравнения системы экстремальноrо реrулирования, из которых MoryT быть найдены параметры рысканья, существенно нелинейны. Точное решение этих уравнений удается выполнить лишь в простейmих случаях. Естественно обратиться к приближенным методам опре- деления параl\tIетров рыс- канья, в первую очередь - к методу rармоническоrо ба- ланса. При применении метода rармоническоrо баланса ис- следователь сталкивается с характерной особенностью, отличающей экстремальные системы от обычных нелиней- ных систем реrулирования, а именно: характер нелинейно- сти в этих системах таков, что при периодическом движении реrулирующеrо opraHa с частотой Q показате.л:ь Rачества в идеальном случае будет совеРlпать движе- ния с двойной частотой и определенной фазой, в более общеl\1 слу- чае кривая у будет иметь постоянную составляющую, составляю- щие с частотой Q и 2Q и фазу, зависящую от Q. Rонечно, движение будет содержать и высшие rармоничесние, но в первом прибли- жении они MoryT быть отброшены, упоl\tIянутые же выте состав- ляющие существенны: двойная частота в RрИВОЙ У наиболее характерна и существенна, постоянная составляющая определяет потери рысканья. Необходимость одновременно учитывать две частоты услож- няет применение метода rармоническоrо баланса и он оказывается достаточно эффективным лишь для простейших идеализированных систем. Начнем с рассмотрения упрощенной схемы, довольно тироно используемой в литературе [116, 219] и др. Объект в этой схеме расчленяется на две части: нелинейную безынерционную с хараRтеристикой у = t (х), имеющей экстре- мум (звено 1 на рис. 7-6), и линейную инерционную с переда- точной фУНRцией W 1 (р) (звено //). В схеме учитывается также x и х 1 ш п нз z Рис. 7-6. 199
u u u инерционпость линеиноrо измерителъноrо устроиства передаточнои функции W 2 (р) (звено ///). Характеристика f аппроксимируется параболой у == ах 2 (при поиске минимума), т. е. считается симмет- ричной. Для некоторых систем такая модель дает удовлетво- рительное приближение. Исследование этой модели методом rармоническоrо баланса было выполнено и. с. Моросановым [116]. Хотя наличие колебаний двойной частоты и существенно для схемы, но симметричность функции f и безынерционность цент- ральной части объекта 1 дают возможность считать, что для входной переменной х существенна только первая rармоника, а для выходной переменной у - только вторая (для нее можно отбросить не только высшие, но и первую rармонические). Эти обстоятельства существенно упрощают исследование. Положим в соответствии с методом rармоническоrо баланса х А sin юt. (7 -44) Тоrда 1 У = ах 2 2 А 2 (1 - cos 2юt) . (7 -45) Так же как и в методе rармоническоrо баланса, удобно перейти к комплексной форме записи переменных: х = Ае jюt ; аА2 _j 1t У 2 -- e j2 00t e 2 00- 2 ' (7 -46) rде через У2ОО обозначена переменная составляющая У. Постоянная 1 составляющая Уср == 2 аА 2 и переменная составляющая У2ОО' пройдя через линейное звено /11, приводят К появлению на выходе этоrо блока величины 6 = 6ср + 6200: 6ср = YcpW (О); I 1 .1t -3- 6200 = 2 аА 2W (2jю) e 2j oot e 2 . (7-47) Обе эти составляющие поступают на нелинейный блок НЭ, осуществляющий переключение реrулирующеrо opraHa. Уравне- ние блока НЭ зависит от способа экстремальноrо реrулирования. В качестве примера рассмотрим способ с запоминанием экстре- мума, при котором реверс реrулирующеrо opraHa происходит тоrда, коrда величина 6, пройдя минимальное значение, начинает возрастать и достиrает пороrа 8, т. е. при = 6mln + 8 и?' > о. Пусть НЭ rенерирует прямоуrольные импульсы постоянной высоты \11 1= в = const, частота которых вдвое меньше частоты 6 (рис. 7-7). Сдвиr по фазе этих импульсов, измеренныц относительно , но выраженный по отношению R основной частоте (о, равен 'ФНЭ. 200
Переменная составляющая вектора S равна - w 21 (2jw) I аА 2 Х Х cos 2rot; срабатывание элемента НЗ происходит при выполнении равенства 1 2\ W 2 (2jro) \ аА 2 (1 - cos 2rot) == 8 , (7 -48) поэтому сдвиr по фазе, выраженный относительно частоты ro, равен 1 (8) 'Фнэ =: rot == 2 arccos 1 - м ' rде через М обозначена амплитуда переменной составляющей (7 -49) м = ; I W 2 (2jw) I аА2. Будем отсчитывать все фазовые уrлы Уrол сдвиrа У200 относитель- но у, выраженный по отно- шению к частоте 2ro, равен -л/2, по отношению же к частоте ro он будет в 2 раза меньше: п '1'0 == - 4. (7-51) Уrол сдвиrа фазы S200 по отношению к у равен: 'Ф2 = ; arg W 2 (2jro) . (7 -52) (7-50) относительно кривой х. Е ср шt шt о Рис. 7-7. Основная rармоника , пройдя через звено 11, получает дополнительный сдвиr '1'1== argW 1 (jro). (7-53) Амплитуда на выходе звена 11 в разомкнутой системе будет равна произведеНИIО амплитуды основной rармоники В 1 импульсов на модуль W 1 (jro). С друrой стороны, в замкнутой системе она должна равняться амплитуде х, т. е. величине А. Фаза же выход- Horo колебания в разомкнутой системе должна быть равна, в соот- ветствии с методом rармоническоrо баланса, -2л. Итак, уравне- ния rармоническоrо баланса в рассматриваемом случае будут A==B 1 I W l(jro)\; } (7 -54) '1'0 + '1'1 + '1'2 + 'Фнэ == - 2п, rде уrлы 'Ф определяются из уравнений (7-49) - (7-53), а В 1 связана с высотой В прямоуrольной волны зависимостью В - 4В (7-55) 1- л . 201
Из уравнений (7-54) с помощью любой из разновидностей метода rармоническоrо баланса можно найти ю и А, а следова- тельно, и амплитуду аА2/2 основной (частоты 2ю) rармоники рысканья. Необходимые, но недостаточные условия устойчивости [186] найденных автоколебаний определяются условием [ В 1 I w 1 (ro) I J /" О д А А <....... (7 -56) Для случая, коrда звенья 11 и 111 являются звеньями первоrо порядка, т. е. 1 1 W 1 {P)= p(T 1 p+1} ' W 2 (P)= sT 1 P+1 ' в [116] построены rрафики, позволяющие определить ЮТ 1 и потери на рысканье, а также дано сравнение результатов, полученных по методу rарl\tIоническоrо баланса и точным методом. 7-5. Определение периодических режимов точными методами Первые работы в этом направлении были выполнены В. В. Ка- закевичем [57]. В наиболее простых случаях удается получить точное решение на фазовой плоскости. Пусть структурная схема системы может быть сведена к схеме, изображенной на рис. 7-6. Передаточная функция звена 111 1 W 1 (р) == ТоР + 1 · Передаточная функция звена 11: 1 W 2 (р) ==р. Уравнение звена 111: dz T O dt +z==y==!(x). (7 -57) Уравнение звена 11: dx --t- dt -_и. (7-58) Пусть нелинейный управляющий элемент представляет собой релейный элемент, осуществляющий реверс сервомотора при отклонении величины z от ее экстремума на величину в: и == + k, (7-59) rде k == const > о. Подставив (7-59) в (7-58), перенеся z в правую часть и разделив (7-57) на (7-58), получим уравнение фазовой траектории в виде dz 1 '1 dx = + kT o (f(x) -z]. (7-60) 202
Построим фазовую плоскость, приняв за ось абсцисс ось х, а за ось ординат ось z. Нанесем в фазовой плоскости статическую характеристику, которая, учитывая (7-57), имеет вид: ZYCT == У == f (х). Характеристика показана на рис. 7-8. Пусть в начальный момент мы находились в точке М о. Так как точка М о лел{ит ниже статической характеристики, то f (х) > z. Знак правой части в (7-60) при этом может быть любым. Допустим, что он положителен, т .е. :: > О. Тоrда движение будет проиехо- дить в сторону увеличения z и х (кривая МОМ!). При пересечении кривой МОМ! со статической характеристикой dz/dx обращается в нуль и в дальнеЙlпем меняет знак (кривая М 1 М 2 ). Последова- тельное построение приводит в конце концов R предельному циклу (обведен на рисунке z жирной линией). Фактически мы имеем дело с двулистной плоскостью, поэтому при из- М О ображении на одном листе появились взаимные пересе- чения фазовых траекторий. Перенесем начало коорди- нат в точку экстремума. Если кривая у = f (х) симметрич- на, то достаточно для опреде- ления предельноrо цикла рассмотреть лишь одну половину цикла. Рассмотрим пример аналитическоrо определения параметров пре- дельноrо цикла для случая, коrда у = х 2 . "Уравнение фазовой траектории (7-60), выбрав произвольный знак, например верхний, перепишем в виде kT dz 2 0 dx +z=x · (7 -61) z'Ж Zo о Рис. 7-8. х )..... (7-62) Это линейное относительно переменной z дифференциальное уравнение с правой частью. Ero общее решение: z == Ae- х / kТо + х 2 - 2kT o x + 2k2T. (7 -63) Пусть Х о , Zo - неизвестные пока нам координаты крайней точки r,икла (рис. 7-8). Подставляя эти значения в (7-63), находим х-хо Z == (Zo - x + 2kT o x o - 2k 2 T3) е kT o +x 2 -2kТ о х + 2k2T, поскольку наша система работает по принципу запоминания экст- ремума, то условие реверса, соответствующее крайней правой точке предельноrо цикла (так как в ней z, пройдя минимум воз- растает), будет Zo == z* + 8, rде через z* обозначено минимальное значение z. 203
Величину z41 найдем, приравняв производную dz/dx нулю: :; = - ko (zo - X + 2kT o x o - 2k2T)X х. -хо Хе пТ. +2x*-2kТ о ==О. (7-64) Подставив в уравнении (7-63) z* + 8 вместо zo и х о вместо х, а в уравнении (7-64) z* + 8 вместо zo, получаем два трансцен- дентных уравнения, содержащих два неизвестных z* и х о . Решая их численно или rрафически, найдем эти величины. 7-6. Приближенное определение периодических режимов методом rалеркина Задача, аналоrичная рассмотренной в предыдущем параrрафе, была решена в [58] с помощью метода rалеркина. Первая публи- кация метода rалеркина для расчета экстремальных систем была дана В. В. Казакевичем в Трудах ЦИАМ .м 1869, 1948. По про- стоте решения в данной конкретной задаче (система с сервомотором с постоянной скоростью) этот метод не уступает методу rармони- ческоrо баланса, но он, не нуждаясь в rипотезах фильтра или авторезонанса, дает более точные результаты. Рассмотрим систему экстремальноrо управления, описываемую следующими уравнениями: T +Y=6; == сх 2 ; (7 -65) х == Хн -t- kt. В системе используется сервомотор с постоянной скоростью, переключение KOToporo осуществляется с помощью реле, либо в те моменты, коrда у, пройдя экстремум, возрастает на величину /1 (в системах с запоминанием экстремума): У n == Ymin + /1, (7 -66) либо, коrда после прохождения экстремума производная у примет значение d (в системах с измерением производной): уn=/1. (7-67) Примем интервал времени между двумя переключениями за полупериод искомоrо периодическоrо движения и обозначим ero через Т 0/2. Введем переменную То и == t - 2: ' (7-68) тоrда в интервале вреIени, соответствующем возрастанию х, будем иметь: х =хи+kt=х и +k O + kи =х в + kи, (7 -69) 204
kT o rде Хв=Хн+т, То О -2и · (7-70) в интервале же времени, соответствующем убыванию х, при отсчете времени от Toro же момента - начала периода: Х ==Х н + kT o - kt ==Х в - ku, О и:::;;; Т 0/2. Учитывая (7-70) и (7-71), уравнения (7-65) приведем к виду: Ll(y)=T +y-с(х в +kи)2=0; ! - Т о /2 u О; L 2 (у) = т + у - с (Х в - kи)2 = О; О :::;;; и :::;;; Т 0/2. ) Периодическое решение уравнений (7-72) будем искать в виде (7 -71) (7-72) со 00 11 == Ci<Pi == ВО + (A i sin irou + B i cos irou), i=O i=1 (7 -73) rде 2п ro==T' Со==В о ; С 1 ==А 1 ; С 2 =В 1 ; С з =А 2 ; С з =В 2 ,... о в соответствии с методом rалеркина составляем равенство: О To L 1 (Y)Yidu + L 2 (у) Yidu == О, i == 1, 2, . · . -Т о /2 О Это равенство дает нам бесконечную систему уравнений для определения параметров периодическоrо движения: О To L 1 (у) Bodu + L 2 (У) Bodu == О; - Т о /2 О о Т о /2 L 1 (y)A 1 sinroudи+ L 2 (y)A 1 sinroudu=O; -То/2 о о To L1(y)B 1 coso)udu+ L 2 (y)B 1 cosroudu==O; (7-74) - Т о /2 о О To L 1 (у) А 2 sin 2rou du + L 2 (у) А 2 sin 2rou du == О; - Т о /2 О О To L 1 (у) В 2 cos 2rou du + L 2 (у) В 2 cos 2rou du == о. - Т о /2 О 205
Коэффициенты Во, А 1 , В 1 , А 2 , В 2 , ... как постоянные множи- тели MoryT быть сокращены, и мы получаем уравнения вида: о Т о /2 ) L 1 (у) dи + L 2 (у) du = О; - Т о /2 О О _ Т о /2 _ , L1(y)siniroudu+ L 2 (y)siniroudи=0; (\ (7-75) -Т о /2 о О Т о /2 J -1./2 L 1 (у) cos iюи dи + L 2 (у) cos iюи dи = о. Выражения L 1 (у) и L 2 (у) имеют вид: 00 L 1 Су) == 2:: [(-юТ iBi + A i ) sin irou + (roiT A i + B i ) cos irou] + i= 1 + Во - еж: - ek 2 u 2 - 2cx B ku; 00 L 2 Су) = [(- roTiB i + A i ) sin irou + (roiT A i + B i ) cos irou] + i=l + Во - ех; - ck 2 u 2 + 2сж в kи. - Члены, общие дЛЯ L 1 (у) И L 2 (у), очевидно, MoryT интеrриро- ваться за весь период, поэтому мы получаем Т о /2 {ОО [(- ЮТiВ i + Ад sin iюи + (юТiА i + Вд cos iюи] + - Т о /2 t=l + Bo-cx - Ck 2 и 2 } ydu + { - Tf} {- 2cx B kuy du} == о. (7-76) -Т о /2 о Интеrрируя, получаем для средних значений следующее урав- нение: (В - 2) Т _ ck2T + cxBkTg - О о СХ в О 12 2 - · (7-77) Второе из уравнений (7-75) дает (A i -- roiT B i ) 1'0 = о. Для третьеrо из уравнений (7-75) получаем: 2 (юiТ A i + Вд То - 2; (-1)i - C:;8 [1- (-1)i). (7 -78) (7-79) Рассмотрим условия переключения. По условию переключения, так как характеристики симметричны и кривые у не должны иметь разрыва, y(_ O )=Y(O). 206
Подставляя эти равенства в (7-73), получаем В о - В} +В 2 -В з +... ==Bo-t--B1 +В 2 +В з +... Откуда следует, что коэффициенты B i для всех нечетных rap- моник равны нулю. Тоrда из (7-78) следует, что и все A i для нечет- ных rармоник обращаются в нуль. Отсюда следует, что при сим- м:етричных характеристиках У не содержит нечетных rармоник. Но тоrда из (7-79) получаем Ck2T _ 2CXBkT 2л 2 i 2 - п 2 i 2 или kT o Хв=т. (7 -80) Подставляя (7-80) в (7-77) - (7-79), окончательно получаем Ck2T5 сk 2 л 2 Во == 48 == 120)2 ; А. == 2ck 2 TT о 4ck 2 T . п (1 + 0)2iT2) о) (1 + ro 2 i 2 T2) , ck 2T 3 4ck 2 В i == л2i (1 + m 2 i 2 T2) - 'ro 2 (1 + (0 2 i 2 T2) . i == 2, 4, 6, . . . I I I (7 -81) ) Таким образом, все коэффициенты Во, A i , B i выражены через параметры системы с, k, Т и неизвестный период основной rapMo- ники движения сервомотора То (или частоту ю). Чтобы опреде- лить Т о, составим условия переключения. Оrраничимся рассмот- рением лишь низшей (второ й) rармоник и. Тоrда А 2 = ro (1 k2T2); ] 2ck 2 (7 -82) В 2 == (02 (1 + 40)2Т2) . Экстремальные значения Уэистр определяются из условия = 20 (А 2 cos 20и* - В 2 SiIl 20и*) = О, отнуда 1 А 1 u* == 2ю arctg в: == 20) arctg 2roТ; Уэкстр == ВО + А 2 sin arctg 2roТ + В 2 cos arctg 2roТ == == в -t- 2ck 2 0- ф2 У1 + 4ю2Т2 . Минимуму соответствует знак минус. 207
в моменты переключения и == -Т о /2, О, Т о /2, ..., sin cos 200 и == 1 . А - В В - В _ 2ck 2 . Уmш + - о + 2 - О 0)2 У 1 + 4со 2 Т2 + · Подставляя в (7-83) выражения для Во и В 2 , определенные из (7-81) и (7-82), получи м уравне ние, из KOToporo найдется 00: 2ck 2 (1 + V'1 + 40)2Т2) == 0)2 (1 + 4ю 2 Т2) . 2ооu ==0, (7 -83) Решение наиболее удобно выполнить rрафо-аналитически. Для системы с измерением производной момент переключения определяется из условия ; = 2ю (А 2 COS 2юu * - В 2 sin 2юu*) = д. При этом u* == - Т о /2, О, Т о /2, ... Что дает для определения 00 следующее уравнение: 8ck 2 T - А ..,.2_ UI - 4Т2А · (7-84) 7-7. Приближенное приведение нелинемных систем к простемwем модели с линемном динамическом и безынерционном v v нелинеинои частями в более сложных задачах (более высокий порядок уравнения, несимметричность кривой показателя оптимальности, неприводи- мость объекта к последовательно включаемым линейному звену и безынерционноrо нелинейноrо элемента) метод rармоническоrо баланса также становится практически неприемлемым из-за ero rромоздкости. Например, при несимметричных характеристиках надо вводить в рассмотрение постоянные составляющие, первые и вторые rармоники одновременно, что приводит к настолько сложным нелинейным уравнениям, связывающим параметры иско- мых автоколебаний, что метод rармоническоrо баланса, сохраняя свою rрубость, теряет простоту и лишается всех своих преиму- ществ. В [58] показано, что применение к схеме «линейное звено - симметричная безынерционная нелинейность» метода rалеркина позволяет получить линейные уравнения, из которых можно найти параметры нескольких rармонических составляющих автоколеба- ний, что представляет преимущества. Но если система не приво- дится к этой схеме, то метод rалеркина также приводит к нели- нейным уравнениям и ero удобство утрачивается. Поэтому пред- ставляет интерес задача приближенноrо сведения неприводимой нелинейной системы к простейmей. Можно предложить следующий эвристический прием для TaKoro построения упрощенной модели системы: нелинейная 208
система n-ro порядка так заменяется последовательно включеННЫl\i линейным звеном п-ro порядка с передаточной функцией W (р) и безынерционным нелинейным элементом, характеристика кото- poro совпадает со статической характеристикой исходной нелиней- ной системы, чтобы линеаризованные в рассматриваемой точке уравнения исходной и преобразованной системы совпадали. В качестве примера рассмотрим систе}IУ, рассмотренную в 9 6-1 [уравнения (6-3)]. . Обозначим х = v и перепишем уравнение (6-3) в виде тpv + kv2 + k o - q == о. (7-85) Введем переменную У = q/v. Имеем v == q/y, pv = ypq qpy . у Подставляя (7-86) в (7-85), линеаризуя в окрестности Уо = = const, qo = const и исключая уравнение статики, после некото- рых преобразований получаем А туор + 2kiqo - yg А оУ== ilq тqop + 2уо (qo - k o ) · Уравнение статики при этом леrко приводится к виду (7-86) (7-87) q 2 kl qo 8 Y == ki о , У ==. (7 - 8) qo-k o Vqo-k o Обратимся теперь к схеме замещения. Рассматривая (7-87) видим, что передаточную функцию линейной части в схеме заме- щения следует искать в виде Тр + 1 W(p)=K Tp + 1 ' (7-89) rде К, 't И Т - пока не известные параметры. Характеристику нелинейноrо звена ИIЦем в виде 2 ki2 (7 90) У == - k o ' - а коэффициент передачи линейной части принимаем равным еди- нице. Тоrда в установивше:мся режиме У = Уо, o = qo и уравне- ния (7-90) и (7-88) совпадут. Найдем линеаризованное уравнение схемы замещения. Уравнение (7-90) перепишем в виде y2 _ k oy 2 == k2. Линеаризуя, получаем 26oy o dy + y6 - 2k o yo8.y = 2ko8.. 209
Учитывая, что () == qo, ПОЛУЧИ.М l1у -:=: 2k 1 Qo - YJ . 2уо (qo - k o ) (7-91) Далее, -rp + 1 == Тр + 1 q. (7 -92) Подставляя из (7-92) в (7-91) и сопоставляя результат с (7-87), найдем 't и Т: '{= mуо - тvo == тУ qo - k o ] 2k2q _ у 2 k 2 v 2 - k k 1 (qo - 2k o ) - 1 о О 1 О О т УО У У5 - 4kok I } (7-93) тqo т 11'1, Т== - k 1 Yqo-k o I 2уо (qo - k o ) 2ki v o т - Уо + V Уб - 4k o k i ) Мы видим, что в данном ПРИl\iере пара:м:етры замещающеrо линейноrо контура не остаются постоянными и зависят от рассмат- риваемой точки qo, Уо, параметры же нелинейноrо элемента остаются неизменными. Непостоянство Т и 1:' указывает на невоз- можность точноrо приведения схемы к простейшей. Для нахождения периодическоrо режима рысканья в системе уравнение статической характеристики удобно привести R осям, помещенным в точку экстремума. Введем переменные q и y, равные q== q - q*; l dy=y - у*. J (7-94) Значения переменных q*, У* и v* в точке экстремума равны q* == 2k o ; у* == 2k 1 J,/- k o ; * _ Y k o v --т;-. (7-95) Уравнение статической характеристики представим в виде V - k y*+y=2kl k o +y==+klV; V _ V q-k o _ Yk -. /1+ V - k 1 - k 1 J! 2 f.! , (7-96) (7-97) 210
rде через обозначено относительное ОТRлонение от экстремума Aq Aq J.t == 2k o = q* · Разл ожим вы ражения v и 1/ и в степенные ряды по J..L: o V 1 + - = 1 Y k o (1 1 1 2 1 3 5 4 + ). I = k 1 + 4 J.t - 32 f.t + 128 11 -- 2048 f.t · .. , k 1 1 (7-98) Y' -11 1 - J! 1+- f f.t k 1 ( -1 1 3 2 5 3 35 4 '\ == Y k o - 4 II + 32 11 + 128 II + 2048 II - ... ) . Подставив (7-98) в (7-96) и вводя обозначение _Ау _ Ау 1')--- - , у* 2 k 1 Yk o _ 1 2 1 3+ 15 4 11 - 32 f.t - 64 II 2048 l-1 - ... получим (7-99) Оrраничивmись первыми двумя членами, получим 11 ! и 2 (1 -- ) "' 32 · 2 . · Несколько более точное приближение будет: 1 ,...,2 11 32 ( ) · 1 +'{- \ ... (7-100) (7-101)
rAABA ВОСЬМАЯ ТЕОРИЯ мноrосвязноrо РЕrУЛИРОВАНИЯ 8-1. Общие понятия. Передаточные и весовые матрицы MHoroMepHbIX объектов Системы, в которых реrулируются несколько величин, назы- вают мноrомерными [61] или мноrосвязными [112]. Примерами мноrосвязных систем MoryT служить: паровой котел, в котором одновременно реrулируются давление пара, ero температура, разрежение в топке, процент СО 2 ; самолет, У KOToporo pery- лируются RYpC, уrол танrажа, уrол крена, скорость, высота; про- катный стан, rде реrулируются скорость и толщина прокатывае- мой полосы и т. д. В терминах «мноrомерные» и «мноrосвязные» системы понятия «мерности» и «связности» не совпадают с понятием порядка или размерности системы. Так, в двухмерной системе, в которой реrулируются две величины, порядок уравнения, определяющий размерность системы, может быть любым. Для мноrосвязных систем характерно наличие связей между реrулируемыми величинами. Связи эти MoryT быть двух родов. Первый род связей обусловлен физическими свойствами реrули. pyeMoro объекта. Так, если мы увеличиваем подачу топлива в котел, то при этом повышаются и те:мпература и давление пара. Увеличение скорости вращения синхронной машины одновременно приводит к увеличению частоты и напряжения nepeMeHHoro тока. Связи первоrо рода будем называть внутренними связями. Второй род связей накладывается на систему по условиям, определяемым технолоrическим процессом. Например, летчику MoryT задаваться отдельно курс и высота полета, а скорость должна реrулироваться таким образом, чтобы обеспечивался минимальный расход топ- лива. В этом случае требуется, чтобы часть реrулируемых коорди- нат была независимой друr от друrа (курс и высота), а координаты друrой части (высота и скорость) были связаны между собою, причем эта связь определяется выбранным для системы критерием оптимальности. В системах ROHTypHoro nporpaMMHoro управления 212
нопировал.ыIмM cra,HKOM подачи по осям связываются через контур обрабатываемоrо изделия. Связи, обусловливающие требуемую зависимость (или независимость) реrулируемых координат друr от друrа, как правило, не существуют в объекте. Более Toro, существующие в нем внутренние связи обычно обеспечивают не ту зависимость, которая требуется. Устранение противоречия между существующей и требуемой зависимостями реrулируемых координат друr от друrа достиrается введением дополнительных реrулирующих opraHoB и связей BToporo рода, которые мы будем называть внешними связями. В качестве примера рассмотрим линеаризованные уравнения паровой турбины с отбором пара [61] (рис. 8-1). На входе намеры высокоrо давления первый реrулирующий opraH (заслонка РОl) изменяет поступление пара в турбину. Изменение ноличества поступающеrо пара и 1 в линеаризованном уравнении принимается пропорциональным перемеще- нию заслонки. Изменения рас- хода "'2 отбираемоrо для про- мышленных целей пара на выходе камеры высокоrо дав- ления и момента наrрузки "'1 на турбину рассматриваются как внешние возмущения. ОТ- носительное перемещение и 2 BToporo реrулирующеrо opraHa (заслонки РО2) приводит н пере- распределению пара между камерами низкоrо давления и отбора. Выходными реrулируемыми координатами турбины являются относительное изменение Х 1 уrловой скорости ее ротора и отно- сительное изменение Х 2 давления пара в камере отбора. Линеари- зованные уравнения турбины [164, 199] имеют вид: т 1 а:е 1 + Pl1 X 1 - Р12 Х 2 = k ll иl + k 12 U 2 - ).,1; ) т 2 а:е 2 + Р22 Х 2 = k 21 U 1 + k 22 U 2 '-).,2. Изображения по Лапласу Х 1 и Х 2 реrУJlируемых координат выражаются через изображения управляющих U 1 и U 2 И возму- щающих Л 1 и А 2 воздействий так: 1 Х 1 = [(k 11 T 2Р + k 11 P22 + k 21 P12) u 1 -t- + (k 12 T 2Р + k 12 P22 + k 22 P12) u 2 - (Т 2Р + Р22) А 1 - РI2 Л 2]; 1 Х 2 == А [k 21 U 1 + k 22 U 2 - А 2 ] (Т lР + Р11), rде определитель системы равен А = (Т lР + Рll) (Т 2Р + Р22). f РО2 JlU'li е- и, РО' Рис. 8-1. (8-1) (8-2) 213
Необходимость и достаточность наличия двух реrулирующих воздействий в данном случае поясняется следующим образом. Пусть мы имеем лишь один реrулирующий орrап и 1 . Тоrда и 2 = о. Если нам :каким-то образом задан закон изменения координаты Х 1 при заданных возмущениях "'1 и "'2, то это означает, что мы знаем желаемое значение изображения Х 1 . Тоrда из пер- Boro из уравнений (8-2) мы можем найти требуемое управление и 1 == (T1P + Рll) (Т 2 Р + Р22) X 1 + (Т 2 Р + Р22) А 1 + Р12 А 2 (8-3) kll T 2P + k 11 P22 + P12 k 21 · Подставив найденное и 1 во второе из уравнений (8-2), найдем: Х - Т 2 Р+Р22 2- Х k 11 T 2Р + k 11 P22 + P12 k 21 Х [k 21 (Т 1 Р + Рl1) (Т 2 Р+ Р22) Х 1 + (Т 2 Р + Р22) (k21 A l -- kl1 A 2)]. (8-4) Из (8-4) можно видеть, что при наличии только одноrо pery- лирующеrо opraHa Х2 оказывается связанным через объект с коор- динатой Х 1 и уже не может изменяться произвольно, если зафИI{- сировано изменение Х 1 . Добавление BToporo реrулирующеrо opraHa, если оно произведено правильно, дает возможность управлять одновременно изменениями Х 1 и Х 2 В желаемом направлении. Необходимым и достаточным условием осуществимости pery- лирования нескольких координат в системе является условие равенства числа реrулирующих opraHoB числу реrулируемых координат, но число реrулирующих opraHoB может быть и больше числа реrулируемых координат. Тоrда помимо изменения реrули- руемых величин по желаемому закону мы получаем возможность осуществить дополнительные функции, обеспечивающие качество реrулирования. Так, наличие двух реrулирующих орrапов в по- воротно-лопастной турбине (направляющеrо аппарата и механизма поворота лопастей рабочеrо колеса) позволяет помимо реrулиро- вания скорости оптимизировать процесс реrулирования, обеспе- чивая наивысший к. п. д. Дополнительные реrулирующие орrаны часто применяются для форсировок переходных процессов при больших отклонениях от заданноrо состояния. Таковы, например, релейные управляющие орrаны в цепях возбуждения, осуществ- ляющие форсировку возбуждения при больших отклонениях и ОТКЛIочаемые при приближении системы к заданному состоянию; таковы системы rрубоrо отсчета в следящих системах, устройства форсирующеrо впрыска в паровых котлах и т. д. Математическое описание объекта упра- в л е н и я. Состояние объекта в любой момент времени выражается либо через существующие физически, наблюдаемые и измеряемые координаты, либо с целью упрощения или унификации урав- нений - через абстрактные координаты - величины, не всеrда 214
ИМСlощие 'финический СМЫСЛ, но являющиеся функциями физи- ческих координат. Обозначим реальные координаты объекта через Yi' абстрактные координаты - через X i . На основании изучения физических процессов, протекающих в :м:ноrосвязных объектах, получают математическое описание объектов посредством уравнений, связывающих реальные коорди- наты Yi объекта с управлениями U j и возмущениями Л k . Будем считать, что число координат равно числу управлений. Это не снижает общности, так как если число управлений меньше числа координат, то мы просто полаrаем в уравнениях часть управлений тождественно равными нулю. Если же число управ- лений оказывается большим числа координат, то задача становится неопределенной и для определенности необходимо либо объеди- нить управления в rруппы, либо ввести в уравнения дополнитель- ные координаты. Ниже рассматриваются линейные мноrосвязные объекты, опи- сываемые обыкновенными линейными дифференциальными урав- нениями с постоянными коэффициентами. В общем случае уравне- ния таких объектов MoryT быть приведены к виду: n n т aij (D) Yj == b ij (D) из + Cij (D) Л j , i == 1, 2, ..., п, (8-5) j=1 j=l j=1 rде D == d/dt, a iJ (D), Ьи (D), Сц (D) - полиномы от D. СОВОI{УПНОСТИ координат у == {Уl' У2' ..., Уп}' управлений u == {и 1 , и 2 , ..., и п } И возмущений Л== {л 1 , Л 2 , ..., лпJ можно рассматривать как векторы, соответственно, состояния системы, управления и возмущения, и уравнения (8-1) записать в более компактной матричной форме А (D) у (t) == в (D) u (t) + с (D) л (t), (8-6) rде А, В и С - операторные матрицы: [ а11 (D) а12 (D) а 1n (D)- 1nJэ = al ). 2 (! .an ) l а п1 (D) а п2 (D) ... а пп (D)J [ Ь 1 1 (D) ... Ь 1п (D)] В (D) == ......... ; [nхn] Ь п1 (D) ... Ь пn (D) С (п) == [Cl ). . . Cl ( ] , [тх n] С т l (D) ... С тn (D) (8-7) 215
у, u и л - матрицы-столбцы Уl (t) l и 1 (t) У (t) == У2 (t) u (t) == и 2 (t) , [n Х 1] . . . [nх 1] . . . Уn (t) J и n (t) rЛl (t) -, л (t) == lЛ 2 (t) (8-8) [тх 1] ... Л т (t) Расширим понятие передаточных функций, введя понятие u передаточнои матрицы системы. Уравнение для изображений по Лапласу при нулевых началь- ных условиях, полученное из (8-6), будет А (р) У (р) == в (р) и (р) + с (р) А (р), rде У, и и л - лапласовы изображения функций у, u и л соот- ветственно. Умножая слева на обратную матрицу А -1 (р), получим у (р) == А-I (р) В (р) и (р) + A-l (р) С (р) А (р). Матрицу G (р), равную G (р) = А-l (р) В (р) = I A) I А (р) в (р), (8-9) в которой А (р) == [A ij (р)]Т - присоединенная l\tlатрица для мат- рицы А и A ij - алrебраические дополнения элементов a ij , назо- вем передаточной матрицей объекта по отношению к упраВJIЯЮЩИМ воздействиям. Условием существования передаточной матрицы является линейная независимость исходных уравнений А (р) *0. в результате выполнения операций умножения над матрицами, получим G (р) в виде матрицы 'W 11 W 12 ... w 1n G (р) = W 21 W 22 ... W 2n (8-10) ........ W п1 w n2 ... W nn -> Элементы этой матрицы W ij == Y i / и j представляют собою передаточные функции для различных координат по соответствую- щим управлениям. Апалоrично, заменяя В и С, можно получить передаточную матрицу для координат по соответствующим возмущениям. В тео- рии мноrосвязных систем вводится также понятие весовой или им- пульсной переходной матрицы G и (t, '{), элементами которой ЯВ.1Iя- ются весовые или импульсные переходные функции gИij (t, Т), равные реакциям координаты Yi на управляющее воздействие типа дельта-функции Uj == б (t - Т) в момент t = Т при пулевых пред- начальных условиях: [ g11 g12..' gln] СИ (t, Т) = ......... gnl gnl... gnn 218
В этой матрице l-й столбец есть частное решение неоднородной системы (8-6) при U z === б (t - 't) И при всех остальных U i , равных нулю. Частное решение системы (8-6) можно найти следующим образом: t У (t)чаетн == G и (t - 't) и (Т) dT. to Для любой реальной системы весовая матрица удовлетворяет условию Gи(t-'t) - О, при 1:>t. (8-11) Физический смысл условия (8-11) состоит в том, что движение в системе не может предшествовать вызвавшей ero причине. Условие (8-11) называют часто условием физической реализуе- мости. Весовая и передаточная матрицы связаны соотношениями (8-10') сх) G (р) = L {СИ (t)} = G и (t) e-ptdt; о 0'+300 Gи(t)=L-l{G(Р)}= 2i G(p)ePtdp. о-зоо (8-12) в этих выражениях L есть символ прямоrо, а L-l_ обратноrо преобразования Лапласа. Пример. Рассмотрим систему реrулирования двух величин Yl и У2' исходные уравнения которой имеют вид: all (D) Уl + а12 (п) У2 = Ь 11 (D) Ul + Ь 12 (D) и2 + C11 (D) л'1 + C12 (п) л'2; а21 (D) Уl + а22 (п) У2 = Ь 21 (п) иl + Ь 22 (п) и2 + С21 (п) л'1 + С22 (п) л,2. Имеем А (р) = [а 11 (р) а12 (P}J; В (р) = [Ь 11 (Р) Ь 12 (P)J, u = [Uu 1 2 J; а21(Р) а22(Р) Ь 21 (Р) Ь 22 (Р} а11 а12 I А I = = аl1 а 12 - а12 а 21. а21 а22 Алrебраические дополнения А ij равны A 11 = а22; А 12 = - а21; А 21 = - а12; А 22 = аll. 3десь и в дальнейшем для сокращения записи опускаем в операторах обозначение apryмeHTa р. Присоединенная матрица равна транспонирован- ной матрице алrебраических дополнений А=[А 11 A 12 JT = [А 11 А 21 ] = [ а22 - а 1 2 ] . А 21 А 22 А 12 А 22 - а21 аl1 Произведение матриц А- и В равно - [а 2 2 Ь 11 - а12 ы 11 a22 b 12 - а 12 Ь 22 ] АВ= - а21 ы 11 + аll Ь 21 - а21 Ь 12 + аl1 Ь 22 . 217
Выражение GU равно произведеItию АВ на матрицу-столбец и, делен- ному на IAI: Ави = l<a 22 b 11 - а12 Ь 21) U 1 + (а 22 Ь 12 - а12 Ь 22) [] 2] I А! (all b 21 - а 2 1 ы 1)) U 1 + (аl1 а 22 - а21 Ь 12) U 2 . Множители при и 1 И и 2 называются передаточными функциями ДJIЯ соот- ветствующих координат по соответствующим управлениям. W - у 1 _ а22 ы 11 - а12 Ь 21 W _ у 1 _ а22 Ь 12 - а12 Ь 22 11 - - - , 12 - - - и Т. д. и 1 аl1 а 22 - а12 а 21 U 2 аl1 а22 - а12 а 21 П ростейmим видом системы мноrосвязноrо реrулирования можно считать систему с сепаратным подключением реrуляторов. При этом нужно, для каждой реrулируемой величины выделить соответствующий ей реrулирующий opraH, который оказывает на нее наибольшее влияние. Так, если в закрытой камере одновре- менно реrулируются температура, давление и влажность воздуха, то реrулирование температуры следует осуществлять, изменяя поступление тепла от наrревателя, давление - изменяя подачу воздуха от компрессора, влажность - посредством увлажнителя, хотя изменение каждой из этих величин приводит к некоторому изменению всех остальных. Это означает, что в уравнении (8-6) для координаты Yi отношение :коэффициентов Ьн/а и при U i долж- но быть заметно больше остальных отношений коэффициентов b U /a 1R , i "* j, i =1:- k. . На рис. 8-2 изображены некоторые структурные схе:мы систем двухсвязноrо реrулирования. На этих схемах О - объекты pery- лирования; Уl и У2 - реrулируемые координаты; Рl и Р2 - pery- ляторы величин Уl и У2 соответственно; РОl и РО2 - реrУЛИРУIО- щие орrаны в каналах Уl и У2. Общая структурная схема раздельноrо ПОДКЛIочения двух реrуляторов изображена на рис. 8-2, а. Связи между реrулируе- мыми величинами в данном случае осуществляются только через объект. Раздельное подключение реrуляторов эффективно, например, коrда постоянные времени процессов достаточно сильно отличаются друr от друrа, и реrулятор в одном из контуров успевает осуще- ствить процесс реrулирования практически еще дО ТОI'О, как начал действовать реrулятор BToporo контура. Так, долrое время раздельно осуществлял ось реrулирование частоты :и напряжения синхронных reHepaTopoB, так как контур реrулирования частоты, включающий медленно действующие сервомотор и реrулятор скорости, обладал постоянными времени, на порядок большими, чем контур реrулирования возбуждения. В настоящее время, Rоrда постоянные времени этих двух контуров сближаются, начинают прибеrать к введению связей между реrуляторами частоты и напряжения [62, 161, 198]. Уже давно было замечено, что такая схема с сепараТПЫl\I ВI{ЛЮ- чением реrуляторов не наилучшая и что наиболее простой путь 218
улучшения качества реrулирования состоит в наложении допол- нительных связей между каналами для отдельных координат. Связи можно накладывать в различных местах; так, например, в зависимости от конструктивных или схемных особенностей можно связывать между собою либо входы реrуляторов (рис. 8-2, б), или же их выходы (рис. 8-2, в), или непосредственно реrулирую- щие орrаны (рис. 8-2, е); MoryT применяться также и смешанные связи; например, на рис. (8-2, д) показана схема, rде дополни- Y f РО1 !ft РО2 О У2 yz Р2 Рис. 8-2. а) 6) Р' РО1 РО2 Y f РО1 РО2 У2 о Р2 е) д) РI РО, Y l О РО2 У2 Р2 8) Р1 о У2 Р2 Р! тельная связь от У2 К Уl выполнена на входе реrулятора Р 1, а от Уl к У2 - на выходе реrулятора Р2. Связь может в одном из кана- лов отсутствовать. Так, на рис. 8-2, е изображена каскадная схема включения реrуляторов, rде выход реrулятора У2 воздействует на вход реrулятора Уl' но связи от Уl К У2 нет. Каскадная схема обычно оказывается удобной при связывании реrуляторов с раз- личающимися постоянными времени: медленно действующий pery- лятор одновременно с выполнением своей основной функции дей- ствует на вход быстродействующеrо реrулятора, изменяя ero уставку. На рис. 8-2 показана лишь часть возможных типов связей, на самом деле их HaMHoro больше даже для двусвязной системы, так как к изображенным на рисунне связям между и и у MoryT добавляться связи между возмущениями и управлениями 219
или возмущениями и координатами входов или выходов реrуля- торов (в так называемых комбинированных системах). На рис. 8-3 и 8-4 ПОRазаны примеры некоторых реализаций различных типов связывания реrуляторов. Рис. 8-3 изображает схему реrулирования частоты (РЧ) и напряжения (Р Н) однофаз- Horo синхронноrо reHepaTopa Т, приводимоrо во вращение дви- rателем постоянноrо тока Д [198]. Измерительным элементом реrулятора напряжения служит управляющая обмотка 1 маrнит- Horo усилителя, подключенная к напряжению reHepaTopa через РН I I I I I I I L_ Рис. 8-3. rvf27B РЧ + 278 выпрямитель 5. R рабочим обмоткам 2 и 3 маrнитноrо усилителя подключена через выпрямитель 6 катушка 7 уrольноrо реrулятора напряжения, уrольпый столбик 8 KOToporo включен последова- тельно в цепь обмотки возбуждения reHepaTopa ОВТ. Посредством выпрямителя 10 и стабилизатора 9, питающеrо обмотку подмаrни- чивания 4 маrнитноrо усиления задается опорное напряжеие, на отклонение от KOToporo реаrирует схема. Измерительным элементом реrулятора частоты служит резо- нансный контур 11, через выпрямитель 12 питающий управляющую обмотку 13 маrнитноrо усилителя. R рабочим обмоткам 14 и 15 последнеrо через выпрямитель 18 включена оБМОТRа возбуждения ОВД двиrателя д. Обмотка 16 маrпитноrо усилителя, mунтирую- щая последовательную обмотку 19 двиrателя, служит корректи- рующим звеном, демпфирующим Rачания ротора. Связи между реrулируемыми :координатам:и, осуществляющиеся, если нужно, 220
на входах реrуляторов, ПОRазаны преРЫВИСТЫl\IИ линиями. Связь, осуществляющая воздействие по частоте на вход реrулятора на- пряжения, действует через конденсатор связи 20; связь напря- жения со входом реrулятора частоты осуществляется посредством оБМОТRИ подмаrничивания 17 маrнитноrо усилителя в канале частоты, подключенной к напряжению обмотки возбуждения reHe- ратора OBF, снимаемоrо с делителя напряжения 21. 5 8 7 20 Рис. 8-4. На рис. 8-4 изображена схема реrулирования ректификацион- ной колонны для разделения бинарных нефтяных смесей [60, 175]. На рис. 8-4 показаны следующие основные части установки: колонна 1, конденсатор - холодильник //, флеrмовая емкость /// и кипятильник (ребойлер) /V. Сырье (двухкомпонентная нефтя- ная смесь) поступает в колонну / по трубе 1. В кипятильник /V по трубе 2 поступает пар, который смешивается с жидкостью и в виде парожидкостной смеси по трубе 3 подается в колонну. Основными элементами колонны являются тарелки, на которых происходит контакт между разделяемой смесью и восходящим паровым ПОТОКОМ. Отдельные фракции смеси - тяжелая (мазут) 221
и леrкая (бензин) - имеют различные температуры кипения. В результате контакта восходящие пары обоrащаются на тарелках низкокипящей компонентой, а находящаяся в колонне жидкость - ВЫСОКОRипящей. Для создания восходящеrо паровоrо потока и нисходящеrо потока жидкости производится отбор тепла из верхней части колонны: пар по трубе 4 поступает в конденсатор /f, в котором охлаждается потоком жидкости, подводимой по трубе 5. Из кон- денсатора конденсат направляется в бак - флеrмовую емкость ///, откуда часть ero в виде флеrмы возвращается по трубе 6 в колонну для орошения, а оставшаяся часть по трубе 7 выводится как rотовый продукт - дестиллат. По трубе 8 осуществляется сброс излишнеrо rаза. На схеме показаны следующие реrуляторы: реrулятор 9 соотношения количеств флеrмы и сырья, на вход KOToporo подаются воздействия от расхолом:еров 10 потока сырья и 11 - потока флеrмы, а выход воздействует на вен- тиль подачи флеrмы 12; реrулятор тем- пературы дестиллата 13, получающий воздействие от датчика температуры 14 и управляющий вентилем 15 подачи охлаждающеrо areHTa в конденсатор; реrулятор 16 давления в колонне, вход KOToporo связан с датчиком давления 17, а выход воздействует на вентиль 18 трубы 8 сброса rаза; реrулятор уровня i-RИДКОСТИ 19 в кипятильнике измеряет уровень и управляет вен- тилем подачи 20 тяжелой фракции из колонны в кипятильник. Эти четыре реrулятора включены сепаратно. Реrулятор 21 расхода дестиллата, реаrирующий на показания расходомера 22 и воздействующий на выходной вентиль 23 получает корректирую- щее воздействие от реrулятора уровня флеrмы 24, т. е. реrуля- торы 24 и 21 включены каскадно. Каскадно включены также pery- лятор давления пара 25, реаrирующий на показания датчика давления 26 и воздействующий на вентиль 27, и корректирующий ero уставку реrулятор температуры пара 28, реаrирующий на показания датчика температуры 29. Несмотря на весьма большое мноrообразие возможных вариантов включения связей, их иссле- дование можно выполнить на основе единообразноrо по струк- туре математическоrо описания. Это обстоятельство связано с тем, что, применяя правило переноса воздействий и связей, описанное в ч. 1 (стр. 83-84), при котором соответствующим образом видо- изменяются передаточные функции звеньев, связанные с перено- симыми связями, можем преобразовать структурную схему любой мноrосвязной системы к одному из типов. В качестве TaKoro общеrо типа выберем схему, в которой внешние связи между каналами u выполнены на входах реrуляторов, а внутренние СВЯЗИ деиствуют Rk Edi,k YL*h о Yk Рис. 8-5. 222
на вход объеRта (рис. 8-5). На рисунке изображен один из каналой реrулирования по Rоординате Yk' Связи показаны как от различ- ных реrулируемых координат, так и от возмущений, т. е. система комбинированная. В дополнение к введенным ранее обозначениям введем в рас- смотрение передаточные функции реrуляторов по отклонеНИIО R ij (р) для управления U i по координате У j и реrуляторов по на- rрузке Qik для управления U i по наrРУЗRе Л k . Тоrда, видоизменив соответственным образом уравнения объекта, прибавив к ним уравнения реrуляторов, получим уравнения системы в виде: у (р) == G (р) и (р) + Р (р) л (р) ; } и (р) == -R (р) У (р) + Q (р) л (р), (8-13) rде Р (р) - передаточная матрица объекта по возмущениям. Знак минус во втором уравнении учитывает отрицательный характер основной обратной связи, осуществляемой реrулятором по отклонению. Подставляя и (р) из BToporo уравнения в первое, получаем после некоторых преобразований [G (р) R (р) + Е] У (р) == [Р (р) - G (р) Q (р)] л (р), (8-14) rде Е - единичная матрица. 8-2. Управляемость и наблюдаемость Рассмотрим систему, структурная схема которой показана на рис. 8-6, а. В этой системе включены последовательно два линейных звена, одно из которых имеет передаточную функцию р+а W 1 W 1 (P)== (p+b)(p+c) ' а друrое 2(Р)== р+а . Передаточная функция последовательноrо соединения таких звеньев вследствие сокращения множителей р + а в числителе и знаменателе имеет второй, а не третий порядок, в то время как сумма порядков передаточных функций звеньев равна трем. Однако физически множители р + а присутствуют, и можно ожидать, что в результате сокращения их мы теряем информа- цию о каких-то динамических свойствах системы. Это действи- тельно так. Передаточная функция представляет собою отношение преобразований Лапласа выходной и входной величин при нуле- вых предначальных условиях. Если же предначальные условия отличаются от нулевых, то отношение изображений выхода и входа уже не определяется классической теоремой о последова- тельном соединении звеньев. С помощью обычной передаточной функции можно исследовать лишь такие движения, которые об- условлены входным сиrналом при нулевых предначальных усло- виях во всех звеньях. Этот фак1.' леrко обнаруживается в не- сложных системах, коrда устанавливаем связь между реальными 223
координатами. Но в сложных системах для упрощения уравнений (например, для приведения их к канонической форме или нормаль- ной форме Коши и т. п.) часто сразу же при описании системы вво- дят новые координаты и исследуют, не прибеrая к составлению пе- редаточных функций. Совокупность величин, которые мы называли координатами объекта, характеризует состояние объекта в каж- дый данный момент времени. Определение понятия «состояния» динамической системы, данное Р. I\алмавом [61, 232, 233], фор- мулируется так: состояние динамической системы - это наимень- ший набор чисел, ноторый необходимо точно определить в момент времени t = t o , чтобы была воаможность, пользуясь математиче- ским описанием системы, предсказать ее поведение в любой момент времени t > t o . Этот наименьший набор чисел, упомянутый выше, и представ- ляет собою совокупность координат системы. Заметим, что факти- чески это совокупность координат модели, а не реальноrо объекта. Координаты не обязательно совпадают с выходами системы, т. е. с физическими величинами, интересующими нас в процессе управ- ления, которые наблюдаем и которыми управляем. Так, при работе синхронноrо reHepaTopa мы обычно интересуемся частотой, напря- жением, активной и реактивной мощностью, но состояние и пове- дение reHepaTopa не может быть полностью описано лишь этими четырьмя величинами, так нак уравнение модели одноrо лишь reHepaTopa с двумя демпферными обмотками имеет седьмой поря- док, если же составлять уравнения для комплекса нотел - тур- бина - наrрузка, он будет еще выше, а число координат должно равняться порядку уравнения системы. С друrой стороны, можно указать на ряд случаев, коrда с целью упрощения математической записи вместо реальных координат вводят в рассмотрение абстрактные координаты, являющиеся функциями реальных, но Пl)зволяющие привести уравнения системы к более компактной форме (нормализованной, канони- ческой, форме Выmнеrрадскоrо и т. д.). Будем рассматривать линейный стационарный объект. Ero уравнения в векторной форме в общем случае можно записать в виде dx } dt =Ах+Ви; , у=Сх, (8-15) rде х = {х 1 , Х2, ..., Х n } - n-мерный вектор состояния системы, компоненты этоrо вектора x i ' i = 1, 2, ..., п - абстрактные координаты системы; у = {Yt, У2 ..., У т } - вектор выхода системы; компоненты KOToporo суть реальные координаты; u = {иl, и 2 , ..., и z } - вектор управления, А, В и С - числовые матрицы. Для рассмотрения управляемых систем удобно ввести понятие пространства состояний или фазовоrо пространства Х, которое 224
представляет собою совокупность всех возможных значений векторов хЕХ. Выберем в пространстве Х такой набор векторов е == {е 1 , е 2 , ..., е n }, чтобы любой вектор х можно было выразить через ero компоненты следующим образом: х == е 1 Х 1 + е 2 Х 2 +. . . + еnх n . (8-16) Совокупность векторов е == {е 1 ..., е n } образует базис про- странства х. Так, например, если е есть совокупность векторов единичной длины, направленных по взаимно перпендикулярпым ()сям п-мерноrо пространства Х, т. е. совокупность ортов, то мы имеем дело с обычным эвклидовым п-мерным простраliСтвом. Выбрав друrой базис е == {е 1 , ..., е п } тан, чтобы имело место ра- венство х == е;: Х 1 + ... + епх n , получим новое пространство Х . Зададим в пространстве состояний Х два MHoiKeCTBa r 1 с х и r 2 с Х . Система будет управляемой относительно множеств r 1 и r 2, если существует такое управление u (t), определенное на конечном интервале О t Т, которое переводит изображающую точку в фазовом пространстве Х из подобласти r 1 , в подобласть r 2 за конечное время t == Т. В дальнейшем оrраничимся рассмотрением случая, коrда исходной точкой может быть любая точка про- странства Х, т. е. область r 1 совпадает со всем пространством Х, а конечной точкой является начало координат, т. е. r 2 вырож- дается в точку, лежащую в начале координат. Для этоrо случая состояние х объекта считается управляемым, если имеется управ- ление u (t), определенное на конечном интерва.ле О t Т, такое, что из интеrрала движения следовало бы х(t)==Ф[t, х(О)] х (Т) == Ф [Т, х (О)] == о. (8-17) (8-18) Если каждое состояние управляемо, то система называется полностью управляемей. Но для установления факта, будет дан- ная система управляемой или нет, удобнее сформулировать несколько иное определение управляемости [61, 171]. Пусть дана система (8-15) с базисом е. Введя неноторое неособое линейное преобразование x ==Rx, IRI*O, (8-19) rде R - числовая матрица, мы преобразуем систему (8-15) в дру- rую систему = Ах + B u, } (8-20) У== С Х с друrим бависом е. Матрицы А , В и С связаны с матрицами А, В и С соотношениями --L- А =RAR 1. 225
Перейдем R изображениям переlенных L {х} и L {п} по Лапласу при пулевых началыlIхx условиях. Мы получим J { х} == (Ер - А) 1 В, ii (8- 21 ) rде Е - единичная матрица. Для некоторой компоненты вентора L {X i } получим 1 L {x i } == д {11и1 + i2и2 + . . . + ilиz}, (8-22) rде = I(Ep - A)I- определитель системы; L\il' i2' ..., b. il - миноры определителя пр:исоединенной матрицы. Может оказаться, что все ь.н, j == 1, 2, ..., l обращаются в нуль, тоrда X i совершенно не будет зависет от управлений и 1 , ..., u z . В этом случае rоворят, что Rоордината X i полностью инвариантна по отношению к воз- деЙСТВИЯI U i или неуправляема по этим воздействиям. Если все Rоординаты X i при всех возможных базисах е управ- ляемы по всем воздействиям, то система будет полностью управ- ляемой. Может ОRазаться, что при ненотором базисе е RаRая- либо из Rоординат X i будет неуправляемой по одному из воздей- ствий Uj, но управляема по друrим воздействиям, остальные же координаты управляемы по всем воздействиям. В этом случае система также будет полностыо управляема, ПОСRОЛЬRУ можно выбрать вентор и, переводящий систем:у в заданное состояние, но она будет частично инвариантной по координате X i и управле- нию Uj. _ _ Если же при ненотором базисе е некоторая координата X i ОRазывается совершенно неуправляемой, то система будет непол- ностью управляемой. В неполностью управляемой системе уравнения (8-20) можно разбить на следующие rруппы ах 1 _ А 1 4 2 в. dt - l1 Х +.L 12 Х + и, dx 2 - А х 2 . dt - 22 , у=СХ. ДJIЯ упрощения черточки над буквами, указывающие на про- извольный выбор базиса, опущены. х 2 - это СОВОRУПНОСТЬ тех X i , которые оказываются полностью не зависящими от управлений u ни непосредственно, ни через компоненты венторов х 1 . Проиллюстрировать полную независимость х 2 от U можно на следующем простейmем примере. Пусть система - двухмерная, и х 1 = Х 1 И х 2 == Х 2 е одним управляющим воздействием и. Из уравнений (8-23) Х2 = а 22 Х 2 Х 1 = а ll Х 1 + а 12 Х 2 + Ьи, } (8-24) 226
находим L{Xl}= Ibo p=:1 = Ь(р- а 22)и .1 I р - a 11 - a121 р2 - (аl1 + а12) Р + all а 2 2' I о р - а22 I t I р о all Ь о I L {х 2 } = == О, р2 - (a 1 l + а22) Р + all a 22 J т. е. Rоордината Х2 не выражается через управление и. Чтобы установить, будет ли система полностью управляемой при всех возможных базисах, Rаллманом был выведен Rритерий управляемости, RОТОРЫЙ мы приводим без доказательства. Размерность " управляемой части системы [т. е. порядок первой rруппы уравнений (8-23)] l = A ll x 1 + А 12 х 2 + Вп сов- (8-25) падает с paHroM матрицы U === [ В, А В, (А)2 В, ..., ( А ) n-l В] 1I . ln . (8-26) Если 'V == n, система полностью управляема; если О < 'V < п система неполностью управляема; если 'V = О, то система пол- ностью неуправляема. Если система неполностью управляема, то в ней можно выде- лить управляемую часть с координатами х 1 инеуправляемую часть с Rоординатами х 2 . В обыкновенных линейных системах неуправляемая часть возникает тоrда, коrда часть полюсов пере- даточной функции системы компенсируется нулями, т. е. коrда в числителе и знаменателе передаточной функции появляются одинаковые множители. Обычно эти множители СОRращают, понижая тем самым порядок уравнения. Однано при этом часть информации о возможных поведениях системы теряется и опи- сание системы становится неполным, справедливым лишь в опре- деленных режимах. Проиллюстрируем это на некоторых примерах. Пусть система с одной координатой х и одним управляющим воздействием u описывается дифференциальным уравнением (р + а) N (р) х == (р + а) М (р) и, (8-27) т. е. числитель и знаменатель передаточной функции содержат одинаковый операторный множитель (р + а). Обычно этот мно- житель сокращают, передаточную функцию записывают в виде W (р) == м (р) (8-28) N(p) и заменяют уравнение (8-27) уравнением N (р) х == М (р) и. (8-29) Проиллюстрируем, что подобная замена справедлива не всеrда. Применим R (8-27) преобразование Лапласа (р +а) N (р) L {х} = (р + а) М (p)L {и} + N o (р, x(), u<t»), 227
rде N o - полином от р, зависящий от начальных условий. Если предначальные значения х и и в момент приложения u нулевые, то N о равно нулю и уравнение (8-29) ОRазывается справедливым ДЛЯ нахождения переменной х. Однано если ищутся промежуточные координаты системы, исключенные при составлении уравнения i '. (8-27), или же если имеются : ..12 друrие воздействия на систе. I му В промежуточных звеньях, то в переходном процессе м:ожет появиться составляю- щая, пропорциональная e- at , Rоторая не обнаруживается, если переходный процесс отыскивается с помощью только передаточной функ- ции (8-28). Рассмотрим пример [61]. Одномерная система состоит из последовательно включен- ных звеньев с передаточными Ф w р+а 1 ункциями 1 (р) = (р + Ь) (р + с) (звено на входе) и W 2 (р) = Р + а (звено на выходе). Схема показана на рис. 8-6, а. Полная система уравнений имеет вид: а) р+а и р-ю (р+Ь)(р+с) 1 б) и 1 у - р-ю -- р+а - (р+Ь) (р-+с) Рис. 8-6. х (р+а)х==у+и 2 ; } (р + Ь) (р + с) у == (р + а) и 1 . (8-30) При отсутствии воздействия и 2 в промежуточном звене множи- тель (р + а) (если нас интересует только х) можно сократить и найти х из решения неполноrо уравнения (р + Ь) (р + с) Х = Ut. Пусть оба воздействия (на входе системы и 1 == e-(3t и в проме- жуточном звене и 2 == const) прикладываются R системе в один и тот же момент времени t == О при нулевых предначальных усло- виях. Тоrда изображение Лапласа для решения уравнений (8-30) L { } L { иl} L {и2} 1 + и2 Х == (р + Ь) (р + с) + р -+ а = (р + ) (р + Ь) (р + с) р (р + а) · Решение уравнения по ормуле Хевисайда e-t e- bt e-ct и2 -at Х (t) == (Ь _) (с- ) + (_ Ь) (с _ Ь) + (_ с) (Ь _ с) +а- (1- е ). Решение сокращенноrо уравнения совпадает при и 2 === О С полу- ченным решением. 228
Величина у, равная решению BToporo из уравнений (5-18) _ (а -) e-t (а - Ь) e- bt (а - с) e- ct у - (Ь - ) (с - Р) + ( - Ь) (с - Ь) + ( - с) (Ь - с) ' не может быть найдена из сокращенноrо уравнения. Последнее обстоятельство оказывается связанным с неполной управляе- мостью системы. Для проверки управляемости по воздействию и 1 с помощью критерия (8-26) положим и 2 == О И приведем уравнения (8-30) к нормальной форме. Можно попытаться привести их к форме (8-23). В данном случае это нетрудно, но в системах BblcoKoro порядка это связано с довольно rромоздкими выкладками. Совер- шенно произвольно положим х = Хl' У = У2 И иl = и. Первое из уравнений (8-30) принимает при этом сразу нормальную форму: dXl dt =-аХ 1 +Х 2 . (8-31) Второе уравнение приведем к виду d Ь ) dt == а 22 Х 2 + а 2з х s + 2 и ; dxs Ь dt + а З2 Х 2 = азsх з + з u . (8-32) Приведение (см. ч. 1, стр. 58-60) выполним, приравнивая определители и u системы (8-32) и операторы BToporo урав- нения (8-30): L\== р-а -а 2з 22 = (р - а 22 ) (р - азз) - а 2з а З2 == -а З2 р-а sз = (р + Ь) (р + с) . А __ Ь 2 и - а 2з [ ( ] ( ) Ll == Ь 2 Р - азз) + Ь з а 2з и == Р + а и. n ЬЗU р - а зз (8-33) (8-34) Уравнения (8-33) и (8-34) содержат пять неизвестных, из которых, так как уравнений два, можно произвольно выбрать три. В простейmем варианте полаrаем а З2 == О, тоrда из (8-33) можно видеть а 22 == - Ь, тоrда азз == - с; из уравнения (8-34) следует Ь 2 == 1; - Ь 2 а зз + Ь з а 2з == с + Ь з а 2з == а. Выбрав третью величину Ь з == 1, получим а 2з = а-с. При таком выборе уравнения (8-32) принимают вид: 2 =-ЬХ2+(а-с)хз+u; ) dx! dt =-СХ 3 +и. (8-35) 229
Находим выражения матриц, входящих в (8-26): A=[- - а О l, в=Пl; itb===[a-t-с], A2=[g2 -(аtЬ)_(:=)(ь_С)]; с О О с 2 [ -(Ь+с) ] А2В = Ь 2 - (а -2C)(b + С) ; [ О 1 -(Ь+с) 1 и= 1 а-Ь-с b 2 -(а-с)(Ь+с) . 1 - с с 2 (8-36) Нетрудно убедиться, что определитель матрицы U равен нулю, что свидетельствует о неполной управляемости системы. Нетрудно также видеть, что существуют миноры BToporo порядка этой матрицы, отличные от нуля (в частности, U зз = 1), следова- тельно, paHr матрицы равен двум и порядок управляемой части равен двум. Физические величины, характеризующие полностью или ча- стично состояние системы, которые мы можем непосредственно измерять, называются наблюдаемыми (выходными) величина:ми. Координаты системы, полностью описывающие ее состояние, MoryT не совпадать с наблюдаемыми величинами и число их может быть больше, чем число наблюдаемых величин. Но если любая из координат системы может быть выражена через значения на- блюдаемых выходов, то система будет наблюдаемой. Если же некоторые из координат не MoryT быть выражены через наблюдае- мые выходы, то система будет неполностью наблюдаеIОЙ. В неполностью наблюдаемой системе уравнения (8-20) можно разбить на следующие rруппы: dx 1 _ А 1 В · dt - l1 Х + l П ' аХ2 А 1 А 2+В dt = 21 Х + 22 Х 2 П ; У= С 1 х 1 . J (8-37) Для этих уравнений характерно, что координаты х 2 не входят ни в выражения для у, ни в первое из уравнений, содеРЛiащее только :координаты х 1 первой rруппы. Поэтому координаты х 2 ненаблюдаемы. Проиллюстрировать независимость х 2 от У :можно TaK}(e на следующем простейmем ПРИl\lере. Пусть система двухмерная, 230
х 1 = Х 1 , х 2 == Х 2 , а У и u одномерные. Рассматривая и нан пеиз- вестную, а у как известную величину, составим систему: (р - а ll ) Хl - Ь 1 и _ О: 1 - а 21 Х 1 + (р - а 22 ) Х 2 - Ь 2 и - О, , С 1 Х 1 =у. , (8-38) Находим р - аl1 О - Ь 1 - a Z l О - Ь 2 Сl L{y } О р - аl1 О - Ь 1 - а21 Р - а22 - b z Сl О О Таким образом, Х 2 выражается через у посредством дифферен- циальноrо уравнения и зависит не только от у, но :и от t. Rалманом [232] установлено, что размерность 'V наблюдаемой части системы (т. е. порядок первой rруппы уравнений) dx 1 а е == А l1X1 -f- В 1 U совпадает с paHro:M: матрицы V == [/ с Т , А Т с Т , (А Т )2 с'Т, ..., (A T )n- 1 С Т 11. (8-39) L {х 2 } == == _ Ь 2 р + Ь 1 а 21 - b z a l1 L {у}. сl ы 1 (р - а22) Если v == п, система полностью наблюдаема; при v < п и v == О она, соответственно, неполностью наблюдаема или полностью ненаблюдаема. В неполностью наблюдаемой систеlVIе можно выде- лить полностью наблюдаемую часть с координатами х 1 и ненаблю- даемую часть с координатами х 2 . Появление ненаблюдаемой части также связано с компенсацией части полюсов передаточной матрицы ее нулями. Такая компенсация приводит к появлению либо неуправляемой, либо ненаблюдаемой части, Jlибо их обеих вместе. В рассмотренном выте примере [уравнения (8-31), (8-32)], если наблюдаемой величиной является rолько координата Х == X 1 , то, так как х = {х 1 , О, О}, С = 11, О, О ,. Имеем А Т = [-i g с -J, С Т = J, АТС Т = [-il; (А Т)2 == [- (а Ь) g2 8 J, а - с - (а - с) (Ь + с) с 2 [ - О (А Т)2 С Т == Ь 2 J; -(а-с)(Ь+с) l 1 - а О -, V = о 1 Ь 2 . О О -(а-с)(Ь+с) 231
Определитель матрицы V отличен от нуля, поэтому система полностью наблюдаема. Из уравнений (8-31) и (8-32), выражая Х 2 и хз через наблюдаемую координату Х 1 , получаем Х 2 == (р + а) Х 1 ; Х З == (р + Ь) Х 1 , Т. е. в любой момент времени эти :координаты выражаются через наблюдаемую величину Х 1 и ее первую производную. Рассмотрим теперь систему, в :которой звенья имеют те же передаточные фУНКЦИИ, но поменялись местами в структураой схеме (рис. 8-6, б). Уравнения принимают вид (р + Ь) (р + с) Х == (р + а) у;} (р + а) у == и. (8-40) Способом, аllалоrичным рассмотренному выше, припедем урав- нение к следующей нормальной форме: dXl () , (ft == - ЬХ 1 + а - с Х З + и; dX2 (ft==-ax 2 +u; dхз ---a:t == - СХ З + и. I (8-41 ) Если наблюдаемая координата х == Х 1 И У == Х 2 , то [ - Ь о а-с] [1] А== О-а О ,В== 1, С==[100]; О О-с 1 [ - Ь о О] [1] [а-ь-с] А т == О - а О, С Т == О , АВ == - а ; а-с О-с О -с [ Ь 2 О - (а - с) (Ь -\- с)] А2 == О а 2 О , О О с 2 [ 1 а-Ь-с Ь 2 -(а-с)(ь+с)] U == 11 - а а 2 . -с с 2 [ Ь 2 -(а-с) (Ь+С)] А2В== а 2 . , с 2 232
Определитель матрицы и отличен от нуля и система управ- ляема. АТС Т =[ b], а-- с Ь 2 (А Т )2== О _-(а-с)(Ь+с) ], о Ь 2 [ 1 - Ь v== 1 О 1 а-с (А Т )2 с Т == [ 2 ]. -(а-с)(Ь+с) , Ь 2 ] О . - (а - с) (Ь + с) Определитель матрицы V равен нулю, и система неполностью наблюдаема. Размерность наблюдаемой части равна paHry мат- рицы, Т. е. двум. Рассмотренные структуры, в которых имелась либо ТОЛЬRО неуправляемая, либо ТОЛЬRО ненаблюдаемая части, относятся R частному случаю. В общем случае система может быть разделена на четыре части: Часть 1 - управляемая, но ненаблюдаемая часть; часть 11 - полностью управляемая и наблюдаемая; часть 111 -- неуправляемая и ненаблюдаемая часть; часть IV - неуправляемая, но наблюдаемая часть. Это означает, что в пространстве состояний системы существует базис, в котором можно выразить х так: 1X1l х == l:: l' x 4J а матрицы А, В и С принимают вид А 11 А 12 А 1з А 14: , В1 о А 22 О А 24 В 2 ,А == О О Аза А З4 , В== О О О О А 44 o С == [О с 2 О С 4]. (8-42) 2ЗЗ
Дифференциальные уравнения такой системы можно привести к виду: хl==Аllхl+А12х2+Аlзх3+А14х4+В1U; х 2 == А 22 х 3 + А 24 х 4 + В 2 и; .3 А 3 + А 4 Х == 3::J X З4Х ; Х . 4 - А х 4 . - 44 , У == С 2х2 + С 14х4 . Характеристический определитель этой системы разлаrается на четыре сомножителя: Il!:p-AI== Ер-А 11 -А 12 -А 1з -А 14 О Ер - А 22 О - А 24 О О Ер - А зз - А 34 О О О Ер-А 44 == I Ер -- А 11 ! х I Ер - А 22 1 х I Ер --- А зз l х IEp - А 4 1. (8-43) 11 ри ЭТОl\I каждый из сомножителей соответствует одной из частей системы. Система устойчива, еСJIИ устойчива наждая из упомянутых частей. Но :каждая передаточная функция неполностью управляе- мыIx или неполностью наблюдаемых частей содержит полюсы, :компенсированные ее нулями. Отсюда следует, что при корре:кции системы нельзя компенсировать НУЛЯl\IИ правые полюсы, если мы хотим:, чтобы полная система была устойчивой. Если такая ком- бинация все же выполнена, то малейшая ошибка в компенсации, или же появление помехи в любом из звеньев, приведет к нару- шению устойчивости, Т. е. система будет неrрубой и неработо- епособной. Рассмотренные выше понятил управляемости и наблюдаемости, в том СМЫС.ле как их ввел Р. Rалман, представляют большой интерес и расширяют наши представления о проблеме оптималь- Horo управления. Но следует отметить, что они все же не всеrда полностью соответствуют практичесним представлениям и не охватываIОТ всех практичеСRИХ аспектов наблюдаемости и управ- ляемости. С практической точки зрения наблюдаеМЫ1vlИ координатами являются те координаты, которые можно непосредственно изме- рить. Если какая-либо величина является функцией физически наблюдаемых координат и времени, но настолько сложной, что для ее вычисления требуются сложные вычислительные устрой- ства или проrраммы, то мы не считаем ее наблюдаемой, хотя она и наблюдаема по I\.алману. Наблюдаемыми координатами мы считае1vI в прантине только те, которые можно измерять непосредственно, не используя связи, выраженные в уравнениях объекта. 234
8-3. Автономное реrупировани Первые серьезные работы в области теории мноrосвязных систем были посвящены проблеIе автономности реrулирования [29-30]. Термин «автономное реrулирование» введен и. Н. Воз- несенским. Автономным и. Н. Вознесенский назвал TaRoe реrули- рование, при ROTOPOl\l изм:енение :какой-либо одной реrулируемой величины не приводит к ИЗIенению друrих. Так н:ак реrулируемые величины связаны между собою через объект, то для Toro чтобы нейтрализовать действие этих связей, накладываются друrие связи (меiНДУ входами или выходами реrуляторов). При опреде- ленном подборе параметров этих связей достиrается независи- мость реrулирования в различных каналах друr от друrа, т. е. система как бы распадается на ряд незаВИСИlVIЫХ систем реrулиро- вания одной величины. При этом можн() ИСl10льзовать 1vIетоды синтеза односвязных величин для обеспеченля требуемоrо :каче- ства реrулирования. и. Н. Вознесенский реШИJI задачу об авто- номном реrулировании для объектов, которые по наждuй реI'УЛИ- руемой величине описываются линейны:ми дифференциаЛЬНЫ1vIИ уравнеНИЯl\IИ nepBoro порядка, а реrуляторы - безынерционнът. В работах учеников и. Н. Вознесенскоrо [14, 15, 68, 128, 133, 134] рассмотрены условия автономности для более сложных случаев. Представление мноrосвязной системы }(ак совокупности не- скольких независимых односвязных представлял ось настuлько мноrообещающим, что долrие rоды проблема автономности была центральной в теории мноrосвязных систем, но при этом до на- чала 50-х rодов раССIатривались в основном вопросы реализации условий автономности в различных нон:кретных структурах систем управления. Существенным вкладом в развитие теории aBToHoMHoro реrулирования явил ась работа Бонсенбома и Худа [209], в ноторой авторы, используя матричный аппарат, устано- вили, что для автономности необходимо и достаточно, чтобы пере- даточная матрица системы была диаrональной, получили общие выражения условий автоно:мности, не связанные с порядком уравнений, и рассмотрели также задачу об автономности в си- стеме, rде число реrУЛИРУЮЩIIХ opraHoB больше числа реrулируе- м:ых величин. На основе этих результатов в [223, 224, 234 и др.] были раССIотрены различные стрУRТУры систем aBTOHOMHoro реrулирования. Рассмотрим систему с п реrулируеМЫl\IИ величинами Уl' ..., У1l И реrулирующими воздействиями и 1 , ..., U rL . Приведем уравне- ние объекта к виду n n Y i == ШцИ ; + 2: cijF J , ;=1 ;=1 rде Ш, с - дробно-рационалw ые функции apryMeHTa р; У, и и F - лапласовы изображения реrулируемой величины, (8-44) 235
управления и возмущения соответственно. Уравнение реrулятора (включая измерительные и исполнительные устройства) будем искать в виде n U j =- rjdjkYk' j==1, 2, ..., п, k=l rде r j - передаточная функция неизменной части реrулятора; d jk - искомые передаточные фун:кции связей, посредством кото- рых мы хотим обеспечить автономность реrулирования. Условия автономности требуют независимости ноординат друr от друrа: (8-45) aYi- ==о .--/-. дУ. , l,-j-J. J (8-46) Продифференцировав (8-44) с учетом (8-45), получим n дИ. Wij дY == О, . 1 3= i, k==1, 2, ..., п; k*-i, (8-47) НО из (8-45) дИ. дY ==-rjdjk. Поэтому уравнения (8-47) можно записать в виде n wijrjdjk == О, i, k== 1,2, ..., п, i *- j. j= 1 Число неизвестных связей dij равно числу элементов этой мат- рицы, т. е. n 2 ; число d ii , У которых i == j, равно n; число dij снеравными i и j равно п 2 - п. Система (8-48), таким образом, содержит п 2 - п однородных уравнений с п 2 неизвестными. С помощью этих уравнений можем выразить вспомоrательные связи d ij , i:j:. j через основные d ii . Запишем левую часть уравнения (8-48) в виде (8-48) n 7L wijrjdjk == бikWijrjdjk' k == 1, 2, ..., п, j=1 ;=1 (8-49) rде б ik = О при i :j:. k и б ik == 1 при i = k (символ Кронекера). Обозначим через W ij алrебраическое дополнение элемента Шц определителя I W I и воспользуемся известными соотношениями: WijW ik = О при j::F k; 1 i n l I WijW ik == I W I при j == k. i=1 J (8..50) 236
Умножим обе части уравнения (8-49) на W 1l и выполним сум- мирование по индексу i от единицы до п: ППп n WilWijrjdjk == WilбikWijrjdjk. (8-51) j=1 i=1 i=l j=1 rjd jk можно вынести из-под знака суммы по i и левую часть равенства (8-51) привести к виду n n rjd jk WilWij == rZdlk I W 1, з=1 i=1 так как внутренняя сумма в левой части последнеrо выражения в соответствии с (8-50) отлична от нуля и равна I W I лишь при j == l. В правой части (8-51) вынесем за знак суммы по j множи- тель W iZ ' приведя ее к виду ппп W il бikWijrjdjk == W kl wkjrjd jk , i=1 ,=1 j=1 так как внутренняя сумма в левой части последнеrо выражения отлична от нуля лишь при i == k. Тоrда n I W I rZdZk == W kl wkjrjdjk. ,=1 В частности, полаrая l == k, находим (8-52) n I W I rkd hk === W kk wkjrjdjk. j=1 Разделив (8-52) на (8-53), получим соотношение, из KoToporo педиаrопальные элементы d Zk выраiнаются через диаrональпые d kk следующим образом: d Wkl d r z lk==W r k НН. kk (8-53) (8-54) Подставляя в (8-44) уравнения (8-45), затем (8-54) и учитывая (8-51), после несложпых преобразований получаем n [ 1 + ridii \WI]Y.== c..F. w" I 1, i.J 1) ) 11 _ з=1 i==1, 2, ..., п. Или n у. = WiiCijFj (8-55) 1, i.JWii+IW/ridii. ;=1 Коэффициенты связи d ii MoryT при этом выбираться произ- вольно и быть как вещественными числами, так и операторами. 237
Для удобства выполнения эти связи можно, lIапример, считать вещественными числами и выбирать их из условий статики pery- лирования, например, еСJIИ у и f -- относительные отклонения реrулируемой величины и возмущения, то ( a y i ) -6. afi t -Нх. - 2' rде б i - коэффициент статизма реrулирования. Тоrда, устрем- ляя в передаточных функциях р -+ о и обозначая k Oi == liln I W ii \, k o == lim I W \; pO р--о kf. == lim c j , k R . == lim R i , 1. р-о 1 1. р-+О можно положить koik fi == О'. k Oi + kok R .d ii 'L 'l. Откуда kOi (k fi - б i ) d ii == б.k k . о R. 1. (8-56) в этом случае неосновные (перекрестные) связи в реrуляторах, соrласно (8-54), будут операторами. Полученные условия являются динам:ичеСIИМИ условиями автономности, однако они обеспечивают взаимную независимость координат лишь в отношении вынужденной составляющей движе- ния при нулевых начальных условиях. При ненулевых началь- ных условиях (хотя бы по одной из координат) выражения (8-44) и (8-45), в которых фиrурируют лапласовы изображения при нулевых начальных условиях, теряют силу. При этом свободные движения MoryT возникнуть по всем координатам. В ряде случаев автономность в системе оказывается целесооб- разной. В практике используются системы aBToHOMHoro реrули- рования паровых котлов. Имеются системы, rде автономность принципиально недопустима и, наоборот, необходимо обеспечи- вать определенную зависимость между координатами, обеспечи- вающую оптимальность управления в том или ином смысле. В [61] показано, что оптимальная в смысле минимума квадратич- ной ошибки система будет автономной лишь при некоррелиро- ванности входных сиrналов различных каналов, коrда данные, поступающие по каждому из ВХОДОВ, не несут информацию отно- сительно друrих сиrналов. 8-4. Инвариантность Одновременно с возникновением проблемы автономности в 1938 r. r. в. Щипановым [200] была выдвинута идея инвариант- ности. Он предложил выбирать связи в систе:ме таким образом, 238
чтобы обеспечить независимость реrулируемых координат от возмущений. Однако в работе [200] содержалась существенная неточность, что вызвало длительную острую дискуссию [31, 41, 42]. Неточность Щипанова состояла в том, что он пытался реализо- вать идею инвариантности в системах реrулирования по откло- нению, rде это невозможно. Некоторые из выступавших в дискус- сии, показав неосуществимость инвариантности в системах pery- лирования по отклонению, впали, однако, в друrую I{райность, объявив принцип инвариантности нереализуемы:м: вообще, а опуб- ликованные к тому времени работы по инвариантности (или по «идеальному реrулятору») - абсурдными лженаучными, что за- держало пра:ктическое использование инвариантных систем и развитие их теории. Позднее было показано, что принцип инвариантности возможно реализовать в комбинированных систе1'УIах. В 1967 r. установ- ление принципа инвариантности r. В. Щипановым было приз- нано открытием. В 8-2 мы видели, что понятие инвариантности тесно связано с понятием неуправляемости. Инвариантная в смысле Щипанова система «неуправляема» по отношению к возмущающим воздей- ствиям и для проверки выполнения условий инвариантности MoryT быть использованы критерии Р. Калмана (8-26), в которых :l\1аТРИlЫ С и и составляются не д.ЛЯ управляющих, а соответ- ствующих возмущающих воздействий. В системе, ПО.лностью инвариантной к возмущениям, будет отсутствовать установивmаяся Оlпибка и в ряде случаев будет малой динамическая ошибка. При приближенном выполнении условий инвариантности «<инвариантность с точностью до е») устаНОВИВПIаяся ошибка будет существовать, но при выполнении условий устойчивости и качества она, так же как и динамичес:кая ошибка, может быть сделана малой. ТаI\ИМ образом, обеспечение инвариантности является одним из способов повышения точности работы систем управления [106, 107]. Рассмотрим систему, описываемую уравнениями (8-44) и (8-45). Определитель этой системы имеет вид I n n 1 + Ш 1 jr j d j1 wljrjdj2 з=1 з=1 n n == I V I = Ш 2 jr j d j1 1 + w2jrjdj2 ;=1 з=1 n wljrjdjn ;=1 n w2jrjdjn j=1 . (8-57) ....................... n n w n jr j d j1 W11jrjdj2 з=1 з=1 n 1 + wпjrjd jп ;=1 239
Обозначим элементы этоrо определителя через V ij . Выразив У через F, получим выражение вида у ==AF. Полная инвариантность по всем возмущениям (или как ее называют - поливариантность) будет иметь место, :коrда все элементы матрицы А будут тождественно равными нулю. Это при- водит к системе уравнений n 2: Cij I V ik I == О, k, j == 1, 2, ..., п · i=1 (8-58) в общем случае при произвольных Сц эта система может удо- влетворяться лишь при тождествеННО!f равенстве нулю всех алrебра:ичеСRИХ дополнений V ik = О для любых i, k, т. е. при равенстве нулю всех элементов определителя V ik = о. Условия автономности систем реrулирования по отклонению требовали, как это было показано в предыдущем параrрафе, ра- венства нулю лишь недиаrональных элементов V ik , i * k; усло- вия полиинвариантности таких систем, кроме Toro, требуют равен- ства нулю и всех диаrональных элементов V ii о. Таким обра- зом, условия автономности являются необходимыми, но недоста- точными условиями полиинвариантности. Условия автономности давали выражения недиаrональных элементов через диаrональные, определяемые формулами (8-54). Присоединяя к ним п уравнений n 1 + 2: W kj r jd j k == О, k == 1, 2, ..., п, j=1 можно найти выражения для всех коэффициентов связи в виде d - Wji (8 60) ij - r j I 111 I . - (8-59) Однако при этих значениях d ij не только сам определитель систеIЫ, но и все ero элементы обращаются тождественно в нуль и система по существу перестает быть системой реrулирования, теряя всякую управляемость не только по возмущениям, но и по величинам U i ,;. Примером такой системы является, как отмечено ./ в [91], уравновешенный мост Уитстона: ток в ero диаrонали не зависит от напряжения источника питания, но зато мы не можем влиять на величину этоrо тока, не нарушая равновесия моста, Т. е. не отходя от условий инвариантности. Осуществление принципа инвариантности в системах реrули- рования по отклонению с сохранением управляемости теорети- чески возможно при помощи введения дополнительных связей в еамой системе. Так, в [70-71, 95, 96] были рассмотрены си- 240
стемы, rде для получения инвариантности используются внутрен- ние обратные связи, по крайней мере одна из }\оторых является положительной. В [112] по}\азано, что упомянутые системы часто получаются Физичес}\и нереализуемыми, так }\а}\ требуют для cBoero осуществления введения чистых производных, но даже если допустить, что это препятствие преодолено, системы оказы- ваются зачастую либо неустойчивыми, либо неrрубыми в том смысле, что при сколь уrодно малых нарушениях условий инва- риантности они становятся неустойчивыми. Поэтому вопрос о реализуемости условий инвариантности исключительно важен. Но прежде чем перейти к ero расс:м:отрению, мы сначала рассмо- трим в общем виде условия инвариантности в комбинированных системах реrулирования. Осуществление инвариантности становится возможным при наличии реrуляторов, реаrирующих на отклонения как реrули- руемой величины у, так и возмущений f. Пусть к объекту, описываемому уравнениями у == WU +CF, (8-61) подключен реrулятор, уравнение KOToporo и == - RDY + RGF, (8-62) rде R - l\1атрица неизменяемой части реrулятора; D - матрица связей по отклонениям; G - матрица связей по возмущениям. После подстановки (8-62) в (8-61) получим систему уравнений (Е -t- WRD) У == (С + WRG)F. (8-63) у словия инвариантности выразятся системой из п 2 уравнений (Е + WRD)-l (С + WRG) == О, (8-64) u u 2 ИЗ которои наидутся п неизвестных gll, g12, ..., glп' g22, ..., g2n' gпl, ..., gпп' Заметим, что в общем случае величины gij будут зависеть от выбранных связей d kl в реrуляторе по отклонению. Отметим отдельно случай, коrда связи d k1 выбраны так, чтобы обеспечивалась автономность системы в смысле независимости координат друr от друrа. Как было показано выше, определитель системы (8-63) при этом становится диаrональным: n (n \ 1 Е + WRD 1= [11 \ 1 + j1 wijrjd ji ). а уравнение (8-64) при этом превращается в систему уравнений n epl + wpirigip i;1 ==0, Р== 1, 2, ..., п, l== 1, 2, ..., п. (8-65) 1 + Wpiridip i=1 241
Так как множители вида 1 + wrd отличны от нуля (в про- тивном случае мы получили бы тождественное обращение в нуль определителя системы и всех ero адъюнктов), то должно быть n L wpirigiP + c pl = О, i=l (8-66) р, 1 = 1, 2, ..., п. Для каждоrо фи:ксированноrо l получаем систему из n уравне- ний, решая которую, наХОДИl\1 n CkZWki k=l gil== ril W I (8-67) rrа:ким образом, в одновременно аВТОНОIНОЙ и инвариантноii системе коэффициенты связи по возмущениям g выбираются, независимо от коэффициентов d и зависят от передаточных функций объекта неизменной части реrулятора и от коэффи- циентов C hZ , укаЗl>Iвающих в уравнении объекта на степень влияния возмущения f z на координату Yk в объекте (без pery- лятора). Теперь перейдем к вопросу о реализуеl\10СТИ условий инва- риантности. Сложность мноrосвязных систем приnодит к тому, что вопрос о реализуемости операторных тождеств, выражающих условия инвариантности, зачастую о:казывается далеко не ясным «с пер- Boro взrляда» и требует дополнительных исследований. Длитель- ная дискуссия по работам r. В. Щипанова, непрекращающиеся попытки предложения нереализуемых систем - наrлядная иллю- страция этоrо ПОJlожения. Пока еще трудно указать необходи:мый и достаточный ком- пле:кс условий, точно выра)нающих условия физической и тех- нической реализуемости сложных систем через параметры описы- вающих их уравнений или операторов, и мы перечислим здесь те основные условия, которые обычно проверяются при пра:кти- ческом синтезе. Обычно условия физической реализуемости, т. е. непротиво- речивости основным физическим законам, характеризующие прин- ципиальную возможность построить систему, имеющую данные математические описания, выражаются через параметры переда- точных функций двумя основными условиями: 1. Степень числи- теля передаточной фун:кции должна быть не выше степени ее зна- менателя. 2. Коэффициент передачи должен быть конечным. Пер- вое условие, вообще rоворя, фактически недостаточно жестко: 242
оно сформулировано с учетом некоторых условностей, допускае- мых при синтезе систем, а им:енно - ДОПУIIения в некоторых элементах безынерционности (допущение существования абсо- лютно жестких механических деталей, не обладающих инерцией чисто активных сопротивлений и т. д.). Хотя на самом деле таких элементов не существует, cTporoe выражение условий реализуе- мости в этом смысле должно быть дополнено условиями, выра- жающими невозможность мrновенных скачков всех физических координат системы. К этим двум условиям необходимо добавить условия работо- способности системы, т. е. условия устойчивости и rрубости. Условие rрубости требует, чтобы при некоторых конечных ва- риациях параметров система оставалась бы устойчивой. (Очевидно, что физически реализовать неустойчивую и неrрубую систему во мноrих случаях возможно, поэтому не совсем верно относить эти условия к условиям: физической реализуемости.) Кроме условий физической реализуемости, приходится учи- тывать условия технической реализуемости, выражающие воз- можность реализовать систему с помощью существующих в на- стоящее время технических средств. Но по мере развития тех- ники эти условия изменяются, и их изучение выходит за рамки общей теории управления. Для праRтических целей представляют интерес структурные УСJIОВИЯ реализуемости инвариантности, сформулированные Б. I-I. Петровым [124-126]. Если в системе с конечными коэффициентами усиления во всех звеньях реализованы условия инвариантности для координаты X i по воздействию fi и координата X i совершенно не изменяется при изменениях возмущения, то очевидно, что размыкание связей, по которым эта координата воздействует на друrие координаты, не должно изменить состояния системы 1. Решения уравнений системы при этом (разумеется, при нулевых начальных условиях и отсут- ствии друrих воздействий, кроме расс:матриваемоrо), не должны измениться при размыкании всех связей, по которым координата X i воздействует на систему. Разомкнем эти связи. Тоrда, поскольку решение уравнений для системы не должно иамениться, инва- риантность для данной координаты X i по отношению к воздей- ствию 1:,. должна сохраниться и для разомкнутой системы. Но это означает, что в разомкнутой системе должно существовать не менее двух параллельных каналов для прохождения воздействия в той части системы, которая расположена между точками прило- женил воздействия и измерения координаты. 1 и. Н. Вознесенский использовал это утверждение в качестве опровер- жения ВОЗ?,,.,IО,l{НОСТИ построить инвариантную спстему реrулирования по от- клонению: если Xi -- О, то реrулятор по ОТRлонению бездействует и не ну- жен, так нан ero можно пзъять, не изменив состоянин системы. 243
13 самом деле, в одном канале, преДставляюЩем собою после- довательную цепочку звеньев, при приложении воздействия на входе движение всех элементов цепочки неизбежно, и устранить r:--------., ero можно с помощью BToporo I параллельноrо канала, переда- точная функция RoToporo равна передаточной функции nepBoro канала, взятой с обратным знаком. Этот необходимый (но не всеrда достаточный) струк- турный признак реализуемости условий инвариантности полу- чил название принципа двух- Rанальности. В системах с пря- мым измерением возмущения цепь измерения и образует вто- рой Rанал, блаrодаря ROTOpOMY инвариантность становится до- стижимой. С помощью различноrо рода внутренних связей в системе можно образовать второй канал для прохождения воздействия f j и реализовать условия инва- риантности, хотя при этом явноrо измерения f j и нет; этот второй канал можно трактовать RaR Rанал KocBeHHoro измере- ния воздействия и отнести си- стему также к классу Rомби- нированных систем. В качестве примера рассмотрим систему, описываемую урав- нениями в терминах преобразования Лапласа: r-- I I I I I I I I ш" WЗ1 Ш21 Х2 I ШJ2 I I ШJf W2J I шk I I I I I L_____________________ Рис. 8-7. XJ Х 1 - Ш 12 Х 2 - W 1З Х З == w 1j F]; j - Ш 21 Х 1 + Х 2 - W 2З Х З w 2j F 2 ; - W З1 Х 1 - W З2 Х 2 + Х З - wзjF з . (8-68) Структурную схему этой системы можно изобразить так, кан показано на рис. 8-7 [113]. Пусть Х 1 - изображение реrулируемой Rоординаты, а пер- вое из уравнений есть уравнение объекта. Х 2 и Х З рассматриваем как два реrулирующих воздействия. Инвариантность системы для координаты Х 1 по возмущению F 1 недостижима, так как существует лишь один канал для передачи воздействия от F 1 к Х 1 , что леrко видеть непосредственно на схеме рис. 8-7 (этот капал 244
показан пунктиром). В этом же можно убедиться и рассмотрев решения уравнений для замкнутой и разомкнутой систем. В замкнутой системе при выполнении условия инвариантности W 11 == О (8-69) и при F 2 == F з == О име ем Х - W 11 F О ) 1- L\ 1==; Х W12 F Х W 1З F 2 = т- 1, З - 1, (8-70) rде определитель и ero алrебраичесиие дополнения соответ- ственно равны == W 11 - W 21 W 21 - W З 1 W З1; W 11 == 1 - W 2з W з2 , W 21 == Ш 12 + W 1З W З2 ' W 31 == W 1З + W 12 W 2З ; W 12 == Ш 21 + W 2з W з1 , W 22 == 1 - W 1з W з1 , W 32 == W 2З + W 1З W 21 ; W 1З == W З1 + Ш 21 W З2 , W 23 == W З2 + W 12 W з1 , W зз == 1 -- Ш 12 Ш 21 . Разомкнем связи, по которым координата Х 1 воздействует на остальные элементы системы, т. е. положим Ш 21 == W З1 == о. При этом W 12 == W 1З == о, == W 11 . Определитель при выпол- нении условий инвариантности тождественно обращается в нуль и система (8-68) становится особой. Ее формальные решения Х 1 = :: F 1 = F 1 , Х 2 = F 1 . Х З = F 1 (8-72) (8-71 ) неопределенны и отличаются от (8-70), что также указывает на нереализуе:мость условий инвариантности. Если бы мы все же попытались, не выполняя проверки, расшифровать условие (8-69), то получили бы w 11 = 1 -_W 2 :W З2 = О; } W 2З ---. WЗ2 (8-73) Таиоrо рода равенства реализуемы или в безынерционных системах или в системах с передаточными функциями, у которых степень числителя равна степени знаменателя; они получались при пренебрежении малыми параметрами звеньев. Для таких передаточных функций, казалось бы, условие (8-73) можно реа- лизовать. Но при этом получается для замкнутой цепочки, со- стоящей из звеньев Ш2ЗWЗ2 WЗ2 Ш З == 1 _ WЗ2 W 23 = ею. Здесь малыми параметрами уже пренебреrать нельзя, посиольку при таком пренебрежении мы получаем физически не реализуемое 245
звено с бесконечным коэффициентом передачи в структуре, не Допуснающей беспредельноrо увеличения ноэффициента. Нетрудно убедиться, что систем:а при выполнении условий инвариантности оназывается неrрубой. Обозначим К.. _ lJ Ш.._- 1,1 п..' 11 rде K1,j и D1,j - полиномы. Тоrда выражение (8-71) для приво- дится К виду: == D12D21DlзDЗl (D 2з D З2 - К 2З К З2 ) - К21DЗID2З (К12DlзDЗ2 + КlзD12КЗ2) _ 1J12 D 21 D lз D 2з D З2 _ КЗ I D21D32 (К12К2зDIЗ + КlзD12D2З) (8-74) 1)121)21})lз D 2з D З2 D Зl · Полином, стоящий в числителе (8-74), является характеристи- ческим полиномом. Первое слаrаемое в нем имеет наивысшую степень (так кан в Hero входят множителями все полино:мы D iJ ), но при выполнении условий инвариантности D 2з D З2 - К 2З [(З2 == О это слаrаемое обращается в нуль и характеристический полином вырождается в полином низшей степени. При этом произвольные малые изменения коэффициентов при старших членах, ноторые MoryT иметь место при нарушении условий инвариантности, можно всеrда выбрать так, что знани отбрасываемых старших членов будут противоположны знакам остальных, т. е. система станет неустойчивой. Это и указывает на то, что система неrрубая. Проверим выполнимость условий инвариантности для коор- динаты Х 1 по ВО3Iущению F 2 . Это возмущение действует на Х 1 по двум наналам: W 2i ' W З2 , W 1З и W 2f ' Ш 12 (на рисунке эти навалы ноказаны прерывистой линией) и в соответствии с принципом двухианальности инвариантность реализуема. Проверим это утвер- ждение, рассмотрев решения уравнений замкнутой и раЗО1\1RНУТОЙ систем при выполнении условия инвариантности W 21 == Ш 12 Т W 1З W J2 == О (8-75) и при F 1 == F з === О имеем L\ == W 11 - Ш 31 W 31 == 1 - W 2З W З2 - W З1 (w l2 w 2з + W 1З ) == ==-1 -- Ш 2З Ш 3 1 - W З1 WIЗ (1- W 2з W з2 ) == (1- W 2З W 32 ) (1- W 1З W З1 ), Х == w 21 W З2 W 2.fF 2 == О . ) 1 (1 - WlЗ W Зl) (1 - WззWз з )' I х == W 22 W2fF 2 == w 2 fF 2 · t 2 (1 - WlЗWЗl) (1 - W2ЗWЗ2) 1- Ш 2 ВШЗ2' Х - ТV 2з F 2 _ WЗ2 W 2/ F 2 3 - (1 -WlЗWЗl) (1 - W2ЗWЗ2) - 1 - W2З W З2. ) При раЗ1vlыкании связей от координаты Х 1 имеем Ш 21 == W З1 == О, но :эти значения не входят в выражения для Х 2 И Хз, следо- (8-76) 246
вательно, размыкание связей от Х 1 не изменяет состояния системы и инвариантность возможна. Реализация равенства (8-77), требующая равенства по вели- чине и противоположности по знаку передаточных функций в двух параллельных каналах, Также достижима. В [126] доказывается следующее общее положение: если l-я координата воздействует только на первый элемент (объект), а возмущение приложено к l-MY элементу, то инвариантность нереализуема. Если же при этом l-я координата действует более чем на один элемент, то условие инвариантности реализуемо. Разумеется, реализуемость условий инвариантности еще не означает работоспособности инвариантной системы: необходимо также выполнить проверку выполнения условий устойчивости. В тех случаях, Rоrда невозможно точное выполнение условий инвариантности, можно при определенных условиях добиться, чтобы эти условия выполнялись приближенно, например, чтобы разность D 2з D З2 - К 2З К З2 В примере на с'Тр. 246 была бы не равна нулю, а представляла бы собою полином, все коэффициенты кото- poro не превышают некоторой малой величины В. В этом случае rоворят о том, что система инвариантна с точностью дО В. Теория таких систеI была дана в [95,107,178]. В системах, инвариантных с точностью дО В, происходит вырождение уравнения при отбра- сывании малых параметров, поэтому в таних системах нужно соблюдать условия, при :которых систе:ма остается устойчивой при сноль уrодно малом В. Структуры реализуемых инвариантных с точностью до в систем, нан показано в [112], - это структуры, допускающие сколь уrодно большое увеличение коэффициента усиления, детально рассматриваемые в [111]. Определение условий инвариантности можно выполнить та:кже на основе вариационноrо подхода [159]. Пусть для системы уравнений dx. ) d/ == /i (х 1 , · · · , Х п , t, и); х L (О) == xi, i == 1, 2, .. . , п (8-77) задан функционал от ее решения J (t) == ф {х (Т), t}. (8-78) в частности, во мноrих прантичеСI\ИХ задачах теории опти- мальноrо управления Фуннционал выражается интеrралом 't' J == f" (х, и) dt. о Введением дополнитеJIЬНОЙ переменной Х о , удо:злетворяющей уравнению / =F(x, и), 247
минимизация этоrо фуннционала сводится к минимизации одной дополнительной ноординаты Х О . Поставим более общую задачу, из которой задача минимизации одной координаты вытекает как частный случай, а именно: рассмотрим функционал вида N J (t) = CiX i (t), (8-79) i=O !'де C i - постоянные, а в число X i входят И дополнительные коор- динаты, производные от которых равны подынтеrральным функ- циям исходных функционалов. Систему назовем инвариантной, если значения функционала J (t) не зависят от внешнеrо воздействия и (t). В «слабо инвариант- ной» системе независимость от и (t) имеет место в определенный момент времени t == Т, в «сильно инвариантной» - при любых t, принадлежащих некоторому отрезку [О, Т]. Это более общее понятие инвариантности, чем данное выше. В частности, если J (t) == X k (t), то мы получаем обычную проблему инвариант- ности. Запишем уравнения (8-78) в rамильтоновой форме dXi ан j 1ft = д "Ч ; (8-80) dWi _ ан ([t -- дх" 1- rде rамильтониан Н выражен через специально введенные функ- ции 'Фi следующим образом: n Н == 'Фili (Х 1 , ... , Х n , t, и). i=1 (8-81 ) Функции же 'Ф'i удовлетворяют уравнениям (8-80) при rранич- ных условиях: 'Фi (Т) == - C i . (8-82) Зададим воздействию и (t) приращение и (t). В общем случае при этом получит приращение и функционал (8-79). Это прира- щение будет n т А! - ciAx i (Т) == - [Н (Х, 1J', и + Аи, t) - /1 (х, 1J', и, [)] dt -11, i=l о ( 8-83) rде оценка остаточноrо члена дается выражением 11) I с (r I А и ("') I d "') 2 \0 С - постоянная, не зависящая от Ilи. (8-84) 248
Если система линейна и стационарна и описывается уравнением ах dt == Ах + bu, (8-85) rде х - п-мерный вектор; А - квадратная; Ь - столбцовая мат- рицы, то необходимым и достаточным условием инвариантности (как сильной, так и слабой), при которой J = О, как показано в [159], будет выполнение соотношений (с, Akb)=O, (8-86) rде С=== (с 1 , ..., сп), k===O, 1, 2, ... , п-1. КруrJIЫМИ СН.обками здесь обозначено скалярное произведение. Например, для системы ах! Ь dt == а 11 Х 1 + а 12 Х 2 + l и , аХ2 Ь dt == а 21 Х 1 + а 22 Х 2 + 2 и функционал J = С 1 Х 1 + С 2 Х 2 инвариантен по отношению R и, если выполняются соотношения (с, Ь)==О, (с, АЬ)=О, которые расшифровываются так: С 1 Ь 1 + С 2 Ь 2 = О; l С 1 (а 11 Ь 1 + а 12 Ь 2 ) + С 2 (а 21 Ь 1 + а 22 Ь 2 ) == о. J (8-87) Условия инвариантности, полученные обычным способом, в дан- ном случае будут: С 1 Ь 1 + С 2 Ь 2 == О; } (8-88) С 1 (а 12 Ь 2 - а 22 Ь 1 ) + С 2 (а 21 Ь 1 - а 11 Ь 2 ) = о. Эти условия эквивалентны (8-87), в чем нетрудно убедиться, выполнив замену с 1 а 11 Ь 1 == -- с 2 Ь 2 а 11 ; с 2 а 22 Ь 2 == - С 1 Ь 1 а 22 . Вариационный подход позволяет получить условия инвариант- ности для более широкоrо класса систем, чем обыкновенные ли- нейные. Так, для нестационарной линейной системы, описываемой уравнениями dx dt = А (t) х + Ь (t) u (8-89) (элементы матриц А и Ь в этой системе являются функциями времени), необходимым и достаточным условием сильной 249
инвариантности па отрезке О t Т является тождественное равенство нулю скалярных произведений ( с (t), QR Ь (t)) == О, k == О, ... , п - 1, (8 - 90) rде Q - оператор, равный Q=D-A (t), D - оператор дифференцирования. Так, в предыдущем примере, если а, Ь и с - функции вре:м:ени, то эти условия примут вид (с, Ь)=О, (с, : -AB)=(c, b)-( , Ь) -(с, АВ)=О. Или С 1 Ь 1 + С 2 Ь 2 == О; db 1 + Ь dc! + + Ь dC2 _ Ь dCl _ Ь dC 2_ c 1 dt 1 dt С 2 dt 2 dt 1 dt 2 dt - С 1 (a 11 Ь 1 + a 12 b 2 ) - С 2 (а 21 Ь 1 -1- а 22 Ь 2 ) == = С 1 ( 1 _ а Н Ь 1 - а 12 Ь 2 ) + С 2 ( 2 - а 22 Ь 2 - a 21 b 1 ) = О. ДЛЯ нелинейной систеl\lЫ, описываемой уравнениями dx. d/ == / (Х 1 , ... , Хп, и 1 , ... , U r ); i == 1, 2, ... , п, (8-91) необходимым и достаточным условием совершенной инвариант- ности от U (для всех начальных условий и t Е Т) функционала J (Т) ==F [Х 1 (t), ... , Хн (t)] (8-92) будет независимость от u функций F O == F; F 1 == D (/) F o , ... F п - 1 == D (/) F п - 2 , rде оператор D и) определен из условия: (8-93) n дР D (/) F == aXi fi8 i=l (8-94) 8-5. Структуры мноrосвяаных систем, допускающие неоrраниченное увеличение коэффициентов усиления Так же как и в односвявных системах, увеличение коэффициен- тов усиления в отдельных контурах реrулирования приводит к уменьшению статических ошибок по :координатам, к уменьшению коэффициентов ошибок и к ослаблению влияния координат друr на друrа. В связи с этим представляет интерес использование в l\tIноrосвязных системах структур, допускающих неоrраниченное 250
увеличение коэффициента усиления без нарушения устойчи- вости системы. Этот вопрос детально исследован в [111]. Для одноконтурных систем он был рассмотрен в ч. 1, стр. 228-233. Рассмотрим один из типов таких структур, допускающих во мноrих случаях наиболее простую реализацию (рис. 8-8), в част- ности, не требующих введения идеальных производных. На рис. 8-8 изображена схема реrулирования i-й координаты. Основная цепь в этой схеме состоит из трех последовательно включенных частей. Средняя часть охватывается корректирую- щей обратной связью с дробно-рациональной передаточной функ- цией F пi (p)/F Tni (р), rде F пi и F rni - полиномы от оператора р. Без коррекции передаточная функция этой части обозначена K iOXB / М i ОХВ (инденс «охв» означает - «охватываемая» часть), rде K i ОХВ - коэффициент уси.. ления охватываемой части по i-й Rоординате, кото.. рый считается не завися- щим от р. Передаточные функции остальных двух частей показаны на схеме; М, D и F - полиномы, К - вещественные числа. Воздействия от связей по друrим координатам по- даются на вход третьей части. Rоэффициенты свя- зей (Xik (р) MoryT быть операторами, содержащими р. Уравнение системы при такой структуре имеет вид /(L8b1P Ml 8bIP I(LOX8 M LOXB /(;, Dl Yi EClik Yk#L ( п, FтL Рис. 8-8. {D i (р) м iвыр (р) [M i ОХВ (р) F rпi (р) + K i OXB F пi (р)] + + КiоБF тi (р)} У (р) = КiоБF тi (р) Y iO (р) - - K i [M iOXB (Р) F тi (Р) + KioxBFni (р)] Х XMiBblp(p)r kl a ik (p)Y h (р) +fk (р)], i=1, 2, 0'0, n, (8-95) k*i rдс К iОб = KiBblpKiOXB K i - общий коэффициент усиления рас- сматриваемой (некорректированной) цепочки; t h (р) - ВО8мущаю- щее внешнее воздействие; Y iO (р) - задающее воздействие. Введем обозначения: П i (р) === D i (р) M iBbJp (Р) M iOXB (р) F rпi (Р); J B i (р) = D i (р) M iBblp (p)F ni + KiKiBblpF тi (р); C i (р) = KiM i ОХВ (р) F тi (Р). (8-96) 261
Тоrда {П i (р) + KiOXBBi (р)} Y i (р) + [C i (р) + KioxBKiFni (р)] Х Х M iBbIp (р) r kl (J.ik (р) У k (р) + fk (Р)] == КiоБF тi (р) Y iO (р). (8-97) k:j=i Полаrаем, что степень F ni (Р) не выше степени F тi (р) И что степень (X,ih (Р) не выше степени D i (р) для любых i, k. Характе- ристический определитель системы А 11 А 12 , ... , А 1n Л = А 21 А 22 , ... , А 2n ........ A n1 А n2 , ... , А nn Ан = П i (р) + KiOXBBi (р). A ik = (C i (р) + KioxBKiFni (р)] M iBbIp (р) o,ik (р) ij;k можно раскрыть по степеням K i ОХВ: Л == F No (р) + KiOXBFNl (р) + KfoXBFN2 (р) + ... + KfoXBFNn (р) = о. (8-98) При припятых дuпущенных относительно (1" F no (р) имеет р в наивысшей степени. Устремляя K i ОХВ К бесконечности, получим (как это имело место в Э 7-9 ч. 1) вырожденное уравнение и ряд вспомоrательных 1112]. Для TOfO чтобы В системе с n связанными между собою через объект реrулируемыми величинами можно было в каждом контуре реrулирования неоrраниченно увеличи- вать коэффициент усиления без нарушения устойчивости в каж- дом контуре и во всей системе в целом, необходимо и достаточно чтобы: а) каждая отдельная система без учета взаимовлияния друrих реrулируемых величин имела структуру, устойчивую при сколь уrодно большом коэффициенте усиления; б) вырождепное и вспомоrательное уравнения для всей MHoro- связной системы, каждое в отдельности, удовлетворяли усло- виям устойчивости. Вспомоrательные уравнения при этом имеют следующий вид: aooqn+al0qn-l+... taп=O при N 1 ==N o -1, N 2 ==N o -2 т. д.; (8-99) 1 1 1 aooq2n+l + т 2 аО1 q2 n + al0q2n-l + т 2" а 11 q2 n -2 + а2оq2n-З + т 2- a21 q2 n -4 + t +... +т 2 а n _ 1 =0 при N 1 =N o -2, N 2 ==N o -4 и Т. Д.; (8-100) aooqn+2 + a1oqn-l + a11qn + a20qn-l + a21qn-2 + ... ...+а n q+a n =0, (8-101) N o - 2 -1 N o -2-2 fде 252
если разность степеней стоящих рядом полиномов уравнения (8-98) пеодинакова. Б этих уравнениях 1 rп== ; q=тp. KiXOB 8-6. Двухканапьные системы с антисимметричными связями Среди мноrосвязных систем важное практическое значение имеет один их частный вид - двухканальные системы с идентич- ными каналами. Примеры таких систем - следящие системы в станках с проrраммным управлением по двум координатам, а) Х#I W K X f 2 6) х u W K X4 W пc -W ac -w f1.C W X2f WI( Х22 Х21 W}( Х22 Рис. 8-9. системы пространственноrо уrловоrо сопровождения, rировер- тикали и т. п. Одинаковые и одинаково расположенные на пути распростра- нения сиrналов звенья в двух идентичных каналах называются идентичными звеньями. Для повышения устойчивости и качества в двухканальных системах получили широкое распространение два вида перекрестных связей между каналами: прямые и обратные антисимметричные связи, т. е. связи, и:меющие равные, но обрат- ные по знаку, передаточные функции. Прямая связь передает воз- действие со входа HeKOToporo звена в одном канале на выход иден- тичноrо звена в друrом канале (связи W п . с И - W п . с на рис. 8-9, а). Обратная связь передает воздействие с выхода HeKOToporo звена в одном канале на вход идентичноrо звена в друrом канале (связи W o . с И - W o . с на рис. 8-9, б) [74, 115]. Выпишем уравнения звеньев с антисимметричными перекрест- выми связями. Уравнения прямых связей Х12=WКХI1-WП.СХ21; } Х 22 == W К Х 21 + W п. е Ж 11. (8-102) 253
Уравнения обратных связей Х 12 = W И Х 11 - WО.СWИХ22; lJ Х 22 = W И Х 21 + WО.СWИХ12. (8-103) в этих уравнениях Хц лапласовы изображения соответствую- щих координат. r- Умножив вторые уравнения в каждой паре на j == V -1 и сложив с первыми, получим после несложвых очевидных пре- образований. й) Для прямых связей 6) Х 2 == (W и + jW и . с ) Х 1 . (8-104) Для обратных связей - - Х 2 = W и Х 1 - jW И W О . С %2 или W и Х 2 == 1 + .w w Х 1 , 1 и о.с (8-105) rде Х ! == Х 11 + jX 21 , - Х 2 == X 12 + jx 22 . Х 1 И Х 2 MoryT рассматри- Рис. 8-10. ваться как векторы входной и выходной величин некото- poro сложноrо звена с двумя входами и выходами, имеющеrо комплексную передаточную функ- цию, равную W k + j W п . с в случае прямых и W k /1 + jWkW O . C в случае обратных связей. Нетрудно показать, что комплексная передаточная функция замкнутых двухканальных идентичных систем с произвольным числом q не накладывающихся прямых антисимметричных свя- зей (Т. е. таких, что точки присоединения любой связи не нахо- дятся между точками присоединения друrих), изображенных на рис. 8-10, а, будет равна w - (W 1 + iW п.с!) (W 2 + 'W п . сt ) ... (W q + iW п.сq) (8-106) -1 + (W 1 +'W П . С1 ) (W 2 + 'W п . с2 ) ... (W1+iWп.сq) . Аналоrично передаточная функция замкнутой двухканалъной системы с q антисимметричныии ненакладывающимися обратвыии 254
связями будет (как ВИДНО из рис. 8-10, б). q П TV i i= 1 q w= II (1 + jWo.Ci W i ) i=l 1+ q 1 + П (1 + WO.CiVV i ) i=l q п Wi i= 1 (8-107) Рассмотрим пример [74], иллюстрирующий влияние ан1'ИСИМ- IVlетричных связей на динамику системы. 1 Р X r 2 ар SlПер ар cos<p W, --l- Тр+1 f Р Х82 Рис. 8-11. На рис. 8-11 показана структурная схема следящей системы уrловоrо сопровождения радиолокационной станции. Сдвиr фа- зы ер опорноrо напряжения обусловливает прямые антисиммет- ричные связи с коэффициентами передачи + sin ер, а rиро- скопический момент, создаваемый вращаЮЩИIИСЯ частями следящей платформы, - обратные антисимметричные связи с пе- редаточными коэффициентами -+ ар. Передаточные функции серво- мотора W 2 и усилителя W 1 , равны W - К у W _ 1 1 - Тур + l' 2 - Р (Тр + 1). Уравнения систем имеют вид: W 2 {W 1 [(X r1 -X r2 ) cos q> - (Х В1 - Х В2 ) sin <р] -арх в2 } == X r2 ; } (8-108) W 2 {W 1 [(Х В1 -х н2 ) cos q> + (X r1 -x r2 ) sin <р] + apx r2 } ==х в2 . 255
Вводя комплексные переменные - - Х 1 == X 1 '1 r- jx B1 , Х 2 == X r2 + jX B2 , умножая второе из уравнений (8-108) на j и СRладывая с первым, получим после преобразований w K Х 2 =(1_ ;а \e- j (j)+W Х1 = К +Р(1 + ТуР) (1 + Тр)-;ар (1 + Тур)' \ 1 + Тр/ (8-109) rде W == W 1 W 2 ; к =:;; к e 3 fP - у комплексный коэффициент передачи. Подстав- ляя р == jro в (8-109) и выполняя D-разбиение по параметру К, получим а==О 10 к == - jю (1 + jT yro) (1 + +jTro)-аю(1 + jТуЮ) или т уК = - jЮ 1 (1 + j( 1 ) (1 + + jdffi 1 ) - аЮ 1 (1 + jю)), rде т 001 = ТуЮ, d == т . у Кривые D-разбиения Рис. 8-12. для d == 1 и трех значений а, равных О, 10 и 100, показаны (в полулоrарифмическом l\tIасштабе) на рис. 8-12. Мы видим, что по сравнению со случаем а = О (отсутствие анти- симметричной обратной связи) два друrие случая дают резкое расширение области устойчивости. Эффективное повышение JСТОЙЧИВОСТИ достиrается именно при комплексных значениях К (коrда изображающая точка имеет достаточно большую мнимую ординату). Таким образом, правиль- ная комбинация прямых и обратных связей дает весьма сильный положительный эффект. Заметим, что в данном случае комплекс- ный коэффициент усиления уже не является чисто абстрактным понятием, а представляет собою вполне ясную реализуемую фиви- ческую величину.
rЛАВА ДЕВЯТАЯ АДАПТИВНЫЕ СИСТЕМЫ АВТОМАТИЧЕскоrо УПРАВЛЕНИЯ 9-1. Возникновение адаптивных систем и их виды Возникновение теории адаптивных систем относят ко второй половине 50-х rодов, хотя отдеJIьные адаптивные системы (системы ЭI\стреlальноrо реrулирования) и посвнщенные им теоретические разработки появились значительно раньше. rrерм:ин «адаптация» заимствован теорией управления из био- JIоrии. Adaptio в латинском: языке означает приспособление. В БИОJlоrии Э'1им тер.мином обозначают приспособлсние орrаниама :к УСЛО:ВИЯl\1 суп,ествования, т. е. к изменения:м внеluней среды, влияющей на iкизнедеятельность орrанизма. I-Iепосредстпенное применение столь широн:оrо термина к си- стемам управления неудобно, TaI{ нак любая система с обратной связью или с воздействием по наrрузке по существу автомати- чески прпспосаБJIипается к ИЗlенеНИЯlVI внешних возмущений, поэтому 1\ адаПТИВНЪJМ: относят лишь такие системыI, ноторые авто- матичеСI\И IJ}JИСПОС абливаIОТСЯ R непредвидеННЪJМ изменениям параметров объекта и внешней среды. В оБычныIx системах управления параметры объекта либо считались неизмеННЫ1И (стационарные объекты), либо из:менялись во времени по известным заранее законам (нестационарные объекты). В данной rлаве речь идет о системах, в ноторых пара- метры объеI{та ИЗNlеняются неизвестным образом. JIЗIенения пара- fOTPOB MoryT приводить к существенным изменениям: J{ачеств процесса управления и даже к потере устойчивости. Восстановление нормальноrо режима в некоторых адаптивных систеlах осуществляется изменением параметров систе1I)I путем поиска, либо путем анализа ситуации и принятия реПIения на основе этоrо анализа. TaHoro рода системы управления, получив- IJJие название самонастраивающихся, появились первоначально, ПО-ВИДИМОIУ, для управления летательными аппаратами, совер- ПIающими полет на Болыlихx nlJrcOTax, за продеJJами атмосферы 257
{217, 247, 266]. Цепь адаtIтании у самонасrранваюu\ихся систем ОUЫЧIIО сама по себе п рецставляет зам:кнутую систему. На рис. 9-1 ПОRС1запа одна из ВОЗl\10ЖНЫХ схем самопастрапваlО- щейся системы с моделью [176, 217]. I схеме имеется (В ЯВНОl\l или неявном виде) модель М, параметры которой устаИОВJlены так, чтобы обеспечивались некоторые желаемые свойства системы. Входное воздействие g (t) подается одновременно на входы управ- ляющеrо устройства УУ системы и модели, выходные коорди- наты х объекта О и модели Хм сравниваются и, как в обычной системе с обратной связью, определяется ошибка ё.. Далее сиrнал ошиБRИ поступает в анализирующее устройство .А У, .которое анализирует сиrнал ошибки, определяет ПРОИСIIlеДI1Iие из:менения параметров систеl\lЫ (т. е. выполняет автоматическую идентифи- нацию объеRта) и вътрабатывает номанды на изменение некоторых настраиваемых параметров системы, обычно управ- ляющеrо устройства УУ. R преимуществам само- настраивающихся систем с :м:оделью относятся: неза- висимость контура самона- стройки от основной цепи управления, что обеспечи- вает возмол\ность работы системы некоторое время при выходе из строя контура самонастройки; это же обстоятельство дает возможность сравнительно леrно JI;обавлять контур само- настройки к существующим системам без их раДИКС:1льноrо изме- нения; одновременность действия помех на систему и на модель приводит к тому, что их действие на сиrнал оптибки значительно ослабляется и влияние помех слабо сказывается на процессе оптимизации системы. В подобных системах не возникает необ- ходимости вводить запаздывания в вычислительное устройство, что приходится делать в схемах, rде модель заменена вычисли- тельным устройством. Непрерывная аналоrовая модель системы сравнительно проста по RОНСТРУНЦИИ. Этим И объясняется достаточно широкое исполь- зование самонастраивающихся систем с моделыо при управле- нии, например, самолетами. Однако для выработки по результа- там наблюдений ошибки упраВЛЯJ()шсrо сиrнала требуется уже выполнять довольно сложные операции, что в :конечном итоrе, по мере повышения требований R точности и сложности вычисления требуе:моrо управления, вынуждает прибеrать к использованию IИфРОВЫХ вычислительных машин. Но при введении в цепь управ- ления вычислительной машины возникает естественное стремление возлол\ить на нее и функции, выполняе:мые моделью, устранив тем самым из системы специальный моделирующий блок. Одна уу у х о g(t) м АУ Рис. 9-1. 258
ИЗ ВОЗМОiI\ПЫХ с:х.ем СИСl'еIЫ, управляемой IHl\;l, показана на рис. 9-2. Процесс определения параметров или характеристик объекта rораздо сложнее, чем простеЙIпее пропорциональное или фУНRЦИО нальное преобразование. Он состоит из ряда вычислительных операций и выполняется универсальными или специализирован- ными вычислительными устройствами. В литературе этот процесс определения параметров или характеристик объекта на основе наблюдения за процессом получил название идентифИRации. Классические методы опредрления параметроп динамичесних систем на основе тех или иных снятых экспериментально харак- теристик (времеННЪJХ, частотных и т. п.), как правило, оказы1- ваются неприrодными для идентификации в системах с самона- стройкой, тан как они тре- буют длитеЛЬНОIО време- ни. В реальных условиях идентификацию нужно выI- полнять быстро, «на ходу», при ЭТОl\1( зачастую наибо- лее эффективные формы искусственных воздейст- вий на объект (ступенча- тые, импульсные, перио- дичеСRие) оказываются ча- сто не,цопустимыми по условиям эксплуатации. В настоящее время наибо- лее употребительные де- терминированные методы идентификации основываются на опре- делении импульсной характеристики объекта или матрицы им- пульсных характеристик [217] в минимальное время. 11з стоха- стических методов определения динамических параметров весьма плодотворными оказались дисперсионные методы. Подробнее за- дача идентификации рассматривается в 9-4. Экстремальные и самонастраивающиеся систеl'vlыl упомяну- тых выше типов вознинли в результате решения технических задач. По времени эти разраБОТRИ совпали с периодом повышенноrо интереса к нибернетическим аспектам управления и, естественно, внимание ряда теоретиков обрат:илось R проблеме адаптации в живых орrанизмах. Адаптация, наблюдаемая в живой природе, иноrда оказывается настолько быстрой и совершенной, что она кажется в наШII дни недосяrаемой для самых совершенных техни- чеСRИХ устройств (например, поведение искусноrо лыжника-сла- ЛОМИС1а при сложном спуске). При попытках найти в природе некоторые принципы постровния схем адаптации, с одной стороны, и использовать технические модели поведения живых opra- ииамов, с друrой, возникло научное направление, получившее l1(t) х о уу ЦВМ Задание Рис. 9-2. 258
название бионики. IIзучая модели (точнее, устройства имита- ции) процессов адаптации в живых орrанизмах, исследователи предложили ряд чрезвычайно интересных схем. Эти схемы можно разбить на три основные rруппы: а) самообучающиеся; б) само- орrанизующиеся; В) обучаемые системы. Наиболее известными самообучающи:мися моделями являются «МЫIlIЬ в лабиринте» IllcHHOHa, «черепаха» Уолтера 11 др. Эти устройства, в основном, предназначаются для имитации выработки условных рефлексов. Систе:мы совершают пробные движения. Результаты пробных движений запоминаются в памяти вычисли- теJIьноrо устройства и анализируются. Приводящие :к цели движе- ния «поощряются», уводящие от нее - (,на:казываются», в резуль- тате чеrо система в RoHle :концов вырабатывает алrорит:м: cBoero по- ведения, наиболее быстро приводяп(ий Н цели. Самообучающуюся систему JОЖНО построить в тех случаях, коrда :конструктор машины четко представляет себе, :как надо действовать, чтобы придти I{ цели, что следует поощрять и что запрепать, и может дать фор- мализованное описание последовательности действий автомата. Примерами более сложноrо типа адаптивных систеl\{ - само- орrанизующихся - является rOMeocTaT Эшби. СамоорrаНИ3УIОЩИМИСЯ системами называют тание системы, ноторые способны сохранять работоспособность при достаточно болыпих возмущениях, изменяя характер cBoero функциониро- вания. Эти системы строятся как модели систем реrуляции в жи- вых орrанизмах (система реrулирования температуры тела, хими- чес:коrо состава :крови и т. д.). rруппа обучаемых машин представляет пона наиболыпий интерес для технических приложений. Ряд сложных процессов высококвалифицированный оператор успеПIНО выполняет, но при этом он не может точно объяснить, :ка:к он это делает, что не дает возможности полностью фОРlVlализовать ero действия в виде про- rраммы для вычислительной машины. Процесс обучения, например классификации наблюдаемых зрительных или ЗВУ:КОВJIХ образов, состоит в том, что информация о классифицируемом образе посту- пает и в обучаемую маlПИНУ и н обучающеl\1У ЧСJIовеRУ. 1IеловеR определяет :класс образа и сообщает ero машине. После MHoro- RpaTHoro повторения процессов обучения машина начинает с той ИЛИ иной степенью достоверности выполнять :классифИI{аЦИIО самостоятельно, и в ряде случаев вероятность ОТ1Jиб:ки машиныI становилась меньшей, чем вероятность ОIlIибни обучавшеrо машину челове:ка, т. е. учени:к - маIпина в неноторых отношениях пре- восходила учителя - челове:ка. 9-2. Самонастраиа8ющаяся система с моделью Одним из возможных спссобов построения самонастраиваю- щи:лся систем с :моделью является :использование структур, допу- с:кающих весьма большие :коэффициенты усиления. На рис. 9-3 260
изображена схема, в :которой в цепь обратной связи . с основ- Horo :контура, состоящук) из упраВЛЯlощеrо устройства W y и объекта W o , НКJ1ючено звено с бо.ньшим :коэффициентом усиления К [78, 217]. Jля этой системы имоем Х(р) VoWy (1 + KWO.CW M ) с (р) == 1 + KWoWyW o . c В той области частот, lде KWoWyW o t >- имеет l\leCTO приближенное равенств6 ..У (р) G (р) JVl\I (р), т. е. передаточная функция систе1\fЫ, нес:мотря на изменения пара- метров объекта, приблизительно равна передаточной функции модели, и, следователь- но, реакция системы на sадаlощее воздействие приблизительно совпа- дает с реакцией моде.:ТИ. Друrой пример ис- пользования систе:мы с большим :коэффициен- то:м усиления ПОfiазан на рис. 9-4. В пра:КТИI{е реrули- рования было известно" что автоколебательные системы способны в до- вольно mиро:ких преде- лах противостоять влиянии) изменения коэффициента усиления объе:кта. Это свойство танже можно трактовать как свойство адаптации. В 1950 r. вышла в свет работа Р. Коченбурrера [237], I{оторая способствовала широкому обсул{дению упо:мяну- тых свойств релейных систем. Схема, рассмотренная Р. Кочен- бурrером, по:казана на рис. 9-4, а. В систе:ме имеется объект с изменяющимися непредвиденны:м образом в широких пределах :коэффициентом усиления К. ДЛЯ :компенсации этих измерений в схему вводится послецовательно элемент с искусственно изменяемым :коэффициентом усиления та:к, чтобы произведение f.1K оставалось постоянным. Схема пред- ставляет интерес Tel\l, что в ней не используются сложные вычис- лительные устройства и используется метод поиска. Поисковыми воздействиями являются ис:кусственно создаваемые во ВСПОl\'10rа- теЛЬНОl\'I контуре обратной связи автоколебания. В контур входят: оrраничивающий усилитель N с большим коэффициентом усиле- ния и линейная цепь с обратной связью, имеlощая передаТОЧНУIО ФУНI\.ЦИЮ W o . с (р). Характеристика усилителя N выбрана так, (9-1) 1 и KfVo.CW M > 1, (9-2) 9 W o х W y Wo.c к -1 W M Рпс. 9-3. 261
чтобы при отсутствии сиrнала у среднее значение z равнялось нулю. При появлении постоянноrо у нарушится симметрия выход- ных колебаний усилителя и появится среднее значение Z, которое при надлежащем выборе а, L и W o . с (р) будет приблизительно пропорциональной у: z l1Y. Вычислив значение f1 по методу rармоническоrо баланса, можем убедиться, что f1 можно сделать примерно обратно пропорциональным К и тем самым решить поставленную задачу. Иное решение этой задачи предложено в [112] (рис. 9-4, б). ПОСJ[едовательно с объенто:м, передаточная фуннция ROToporo а) g(t) R(p) p ]f z 2;' -L п(р) к х WQC(p) 6) g К 1 /{2 /(J W o х W f W 2 Рис. 9-4. W o (р) равнялась K/D (р), были внлючены три линейных усили- теля с достаточно большими Rоэффициента:м:и усиления К 1 , К 2 и К З . Два из этих усилителей охватывались обратными связями с передаточными фуннциями 1 1 W 1 (P)== T 1 P+1 и W 2 (P)= T 2 P-1- 1 . Передаточная Фуннция системы х (р) _ к (Т 1 Р + 1) (Т 2 Р + 1) G (р) - Р 1 (9-3) rде р 1 == {т 3 (1 + Т lР) (1 + Т 2Р) + т 2 [( т 1 + Т 2) р + 2] + т} D (р) + + к (1 + Т 1 р) (1 + Т 2 р), (9-4) 262
rде 1 lп== K б' Кб == К 1 =-= К 2 == Ка - большой коэффициент усиления. При т -+ О имее1 1 " y (р) -1 1т G ( ) - , тO Р (9-5) Т. е. влияние переIенноrо коэффициента К практически исклю- чается. Исследование вспомоrательноrо уравнения вида (8-99) (так как убывание степеней стоящих рядом полиномов уравнения равно единице) позволит нам найти условия устойчивости системы. Так, еслиD (р) ==(1 + 0,2р)2 (1 + 0,05 р), то характеристическое уравнение имеет вид: т 3 (1 -t- Т 1Р) (1 + Т 2Р) (1 + 0,2 р )2 (1 + 0,005 р) + т 2 [( т 1 + Т 2) р + 2] х х (1 + 0,2р)2 (1 + 0,005р) + т (1 + 0,2р)2 (1 + 0,005p).t + к (1 + Т lP) (1 + Т 2Р) == о. Раскрывая скобки, после вычислений получим вспомоrатель- ное уравнение в виде 0,0002Т 1Т 2q3 + 0,0002 (Т 1 + Т 2) q2 + O,0002q + КТ 1 Т 2 == о. Условие устойчивости к< 0.ООО2 (Т 1 + Т 2 ) (9-6) Т 2 Т2 " 1. 2 Естественно, что в данной схеме проявляются недостатки, связанные с повышенным уровнем широкополосных шумов. В рассматриваемой схеме модели в явном виде нет, так как в ней требовалось просто с наименьшими искажениями воспроиз- вести задающее воздей- ствие (проrраммное уп- равление). В том слу- чае, коrда хотим, чтобы выход объекта совпадал с выходом модели, мы просто можем включить модель на входе систе- мы, приложив g (t) на ее вход. Рассмотрим самона- страивающуюся систему с моделью, показанную на рис. 9-5, в которой модель иrрает роль эталона для OCHoBHoro контура [85]. в этой схеме модель М используется для получения ошибок, управляющих перестройкой реrулятора Р непосредственно в течение переходноrо процесса. В такой схеме возможно сделать время настройки меньше вре- мени переходноrо процесса. о {u- " у Ко х - - '- п о g .р Хм К - М - R - - Рис. 9-5. 263
Модель на схеме рис. 9-5 ВНJJючена параллеJJЬНО оеновной схеме упраВJlения, ВНЛIочающей реI'УЛЯТОР Р и объент о. Модель воз- действует на ноэффициент усиления К коптура самонастройни. Уравнения системы можно записаТJ" следующим образом: объект: D o (р) х === Ко (р) y J реrулятор: R (р) у ==!{ (р) х - K g Д (t); J\fодель: М (р) хм == g (t). Н этих уравнениях D o (р) и Ко (р) - полиномы, коэффициенты I\ОТОрЫХ в общем случае MoryT быть фун:кциями ка:к времени, так и :координат системы; R (р) и М (р) - полиномы с постоянными коэффициентами; g (t) - управляющее воздействие. В правой части уравнения реrулятора К (р) представляет собою полином с переменными, перестраиваемыми :коэффициен- тами k: К (р) == kopP +- k 1 p P -l + ... + kp-1P+ k p . Коэффициенты k i представляют собою функции координат объекта и модели, производных и интеrралов, которые в общем случае MoryT иметь вид: k р == ерl [J V 11 (хм, х) d t, V 1. 2 (х 1\1' х, х); ) ( . .... ) ((р). V 13 хм' х, х, х , ... , Vl, р -t-:2 ХМ , х, х ... , х(Р))l; k p _ 1 = СР2 [J V 21 (хм, х) dt, V 22 (хм, х, х); (9-8) ( ... . ... '.', ( (р) . ... I V 3 . Х. М ,. ' . Х : ' .": '. 2. . P2. м . '. Х : , . · '.' : (p: н. ; I k o == (J'p+l fJV p -t-l, 1 (x(), х(р») dt, V p -t-l, 2 (x(), х(р») 1, . k g == fP g (Jv gl (xl\P х) dt, V g2 (хм, хм, х), ... ... , Vg,p+2(X M , Хм, ... , x), х(р)]. (9-9) (9-7) Одним из наиболее простых вариантов выполнения :контура самонастройки является вариант, в котором контур описывается уравнением первоrо поряд:ка и изменение коэффициента нонтура происходит в соответствии с зависимостями: k 1 = k 10 - k 1u f 8 1l dt - k 1E 8 12 ; I k o -== k oo - k oB 8 22 ; J k g == k go + k gu J E g1 dt + k ge 8 g2 , rде k oo , k ou ' k OB ' k 10 , k 1u , k 1B , k go , k gu ' k ge - постоянные величины; 8 - Оlпибки. Введение высших производных в законы формирования k усложняет схему, но позволяет приблизить процесс к желаемому при ПРОИЗВОJIЬНЫХ изменениях коэффициентов полинома D (р). ПоеТОЯННЪJе коэффициенты k 10 , k oo , k go вводятся в закон Форми- (9-10) 264
рования как начальные уставки коэффициентов. Введение инте- rрала необходимо, коrда параметры системы непостоянны во вре- мени или имеют значительную область разброса, а также при наличии в основном контуре нелинейных связей, которые не MoryT быть точно учтены. Интеrрал придает системе свойство астатизма по раrсоrласованиям". Алrоритмы для перестройки коэффициентов k целесообразно делать по возможности простыми, например, для перестройки k g , k 1 можно рекомендовать зависимости вида: е == I хм \ - \ х \ в == (хм - х) sign х; в == (хм -- х) sign хм; (9-11) в == (хм - х) sign M' дЛЯ выбора k o : 1 . I 1. I 82 == ХМ 1- х 1 ; В 2 == (M - х) sigll; (9-12) 82 == (;;;м - ) sign M. slgn slgn X ge K tE в [85] рассмотрены различные виды простейших алrоритмов, по- gft) строены rрафики изменения g и х ДJIЯ некоторых харантерных слу- чаев и сделаны рекомендации от- носительно выбора алrоритмов в тех или иных случаях. В [85-87] рассмотрены и со- поставлены дина:мические про- цессы в нескольких вариантах исполнения самонастраивающихся систем первоrо порядка с моделью. Оrраничимся здесь рассмотрением одноrо из вариантов. Урав- нения системы имеют вид: объект: (Тр+В)х==у; 1 реrулятор: у == kgg- k 1 x; контур само- k g == 1 + k gB (g - ах) sign g; J} настройки: k 1 == а - kfB (g - ах) sign х, rде k g , k:, т и В - постоянные; а - заданное соотношение между g и х в статике, которое должно поддерживаться при лю- бых В. Ошибки е в данном случае определяются по алrоритмам 81 = (g - ах) si.gn х; } (9-14) Е с = (g - ах) slgn g, а х х о х Рис. 9-6. (9-13) 265
т. е. выход х сравнивается не с выходом некоторой явной обособ- ленной модели, а непосредственно с g. Структурная схема имеет вид, показанный на рис. 9-6. fI ри g =-=- о имеем т рх == - ах - Вх - k 1e ax 2 sign х. Введем фазовые координаты ер == ах, 'Ф == т рх и построим фазовую плоскость. .7равнение фазовых траекторий '1' == - (Ь + 1) ер - k 18 ep2 sign ер, rде Ь == В/а, k 18 == kfв/ а. На рис. 9-7 показаны фазовые траектории, для которых: 1) Ь == О; 2) Ь > О; 3) - 1 < Ь < О; 4) Ь < - 1. Для траекторий ер " ",04 got " " " " -Ьп " O " 4,,;'-...... ... ------, Рис. 9-7. Рис. 9-8. 1--3 начало координат является устойчивым узлом, для траек- тории 4 оно представляет собою неустойчивый узел. Точки устой- чивоrо равновесия для этой траектории 01 и 02, В которых Х еТ = == -+- (1 -- b)/k 1 a. При введении самонастройки неустойчивая система (так как Ь < -- 1) становится устойчивой, но появляется статическая ошибка, знак которой зависит от знака начальноrо отклонения. Величина ошибки убывает с ростом k 18 . При постоянном воздействии g == const == go > О введем пере- MeHHyIO Е == go -- ах. Уравнения примут вид: - (Т/а) РЕ == Е - Ь (go - Е) + k g8 g o B + k 18 (go - в) Е sign х. Движение системы изобразим на фазовой плоскости с координа- тами Е, 11', rде 11' == (Т/а) РЕ. Уравнения фазовых траекторий: { - [Ь (go- Е) + 1 + kgeg o ] Е - k 1B (go - Е), при Е <go; } ф - (9-15) - -[b(go- В)+ 1+k g8 g 0 ] 8+k 18 (go-8), при B>go. Фазовые траектории показаны на рис. 9-8. Они имеют точки равновесия 01, 02, Оз, 04. Система устойчива при любом Ь, но имеется установившаяся ошибка. 266
Введение самонастройки в данном случае позволило сделать систему устойчивой при отрицательных коэффициентах самовы- равнивания объекта и уменьшить статические ошибки надлежа- щим выбором k 1e И k ge , но для полноrо устранения этих ошибок необходимо в законы изменения коэффициентов ввести интеrралы. Исследование динамики системы первоrо порядка с введением интеrралов выполнено в [85-87]. Интеrрал оказалось целесооб- разным вводить только в закон формирования коэффициента k 1 . Введение ero в k g ухудшало качество процесса. 9-3. Об исполыовании ЦВМ в адаптивных системах В качестве примера использования ЦВМ дЛЯ выработки управ- ляющеrо сиrнала рассмотрим схему, показанную на рис. 9-9. В этой схем:е желаемая реакция вырабатывается :м:оделью. Так как уравнение модели известно, то эту задачу можно выполнить и не вводя специальноrо блока модели: тоrда задача све- дется к проrраммированию на ЦВl\l решения задан- Horo уравнения. Мы не будем рассматривать эту задачу, рассмотрим лишь метод определения с по- мощью ЦВМ воздействий на перестраиваемые параметры системы. Пусть в некоторый момент времени реакция системы С на внешнее воздействие r (t) равна С 1 (t), желаемая реакция (выход модели f) C d (t); фан:тическое воздействие управляющеrо устрой- ства на систем:у, вызвавшее реакцию Сl (t), равнялось т 1 (t); требуемое воздействие, которое привело бы к правильной реак- ции, равной C d (t), равно m d (t); импульсная переходная функция системы g (t). Делаем следующие допущения: а) считаем малыми изменения r (t), С (t), ошибки е (t) == C d (t) - С 1 (t) и воздействия 11т === m d (t) - тl (t), происходящие за интервалы времени I1T, по истечении которых ЦВМ выдает корректирующие импульсы. Это дает возможность считать, что за время I1T систему можно рассматривать как линейную, стационарную. Тоrда для нахожде- ния требуемой реакции C d (t) можно написать следующее выраже- ние интеrрала свертки: t C d (t)==C 1 (t)+t!{t)== m d (1:)g(t-'t)d't= r м Cd ЦВМ т с с Рис. 9-9. -00 t t == т 1 {т)g(t-1)dт+ т(-t)g{t-т)dт. - со -о::. Вычислительное устройство строится так, чтобы вычислять и выдавать корректирующие импульсы т (t) в дискретные 267
моменты вреlени через наждые T секунд. Пусть t - изменение времени в каждом интервале управления (т. е. время, отсчитывае- мое всякий раз от начала данноrо интервала). rrоrда, так KaI{ т (t) == О при t < О, то мы може:м в нижнем пределе BToporo интеrрала заменить - 00 на О и написать t е (l) == Llт (Т) g (t - Т) dT. (9-16) О Для вычисления требуеl\lоrо значения lп (t) воспользуеIСЯ раЭ.ТJожение:м в ряды l\lаклорена функций е (t) и g (t): t 2 ) е (l) == Е о + Е 1 t + Е 2 2! + ...; I t 2 } (9-17) g(I)=G O +G 1 1+G 2 2 ! + '" j Соответственно преобразования Л апласа для е (t) и g (t) будут Eo(P)=Eop-l1+El-22+E23+ ...,} (9-18) G (р) == СоР + С 1 Р + С 2 Р + ... Изображение по Jfапласу уравнения (9-16) имеет вид: Е (р) == LlM (р) G (р), (9-19 ; п (t). rде M (р) - изображение ИСКОl\10rо приращения Отсюда 11М ( ) == Е (р) == Еор 1 + E 1 P-2 + Е 2 р-З + ... == р с (р) Сор-l + С 1 р-2 + С 2 р-З + ... == LlM -1 + Nlop-l + M lр-2 + ..., (9-20) rде величины Mi' получаеl\1ые в результате разложения дроби Е (p)/G (р), равны ДМ_l = : ; JJf == Е 1 - дМ_ 1 С 1 . О Со' (9-21) дА! == Е 2 - (M -l С 2 + дМоС 1 ) 1 со ' ................ Ориrинал выражения (9-20) имеет вид: дт (t) == дМ -16 (t) + дМ о 1 (t) + дМ 1 t + ... (9-22) Первое слаrаемое в (9-22) представляет собою и:мпульсную функцию с площадью M_l' второе - ступенчатую функцию высотой Mo, третье - линейную функцию с уrловым RОЭффи- циеНТОI Ml и т. д. ПраRтичеСRИ обычно оrраничиваются этими тремя слаrаеМЫIИ. Ита:к, на выходе Iашины ДОJlj-I\НЫ стоять па- 288
раллельно включаемые rенераторы функций б (t), 1 (t) и t, коэф- фициенты при которых M_l' Mo, Ml вырабатывает вычисли- тельное устройство (рис. 9-10). Вычисление величин ДМ i l\fожет осуществляться по форму- лаl\f (9-21). В этих формулах необходимо знать коэффициенты ошиБRИ Е о , E 1 , Е 2 , а таRже величины G o , G 1 , G 2 . Коэффициенты O(t> .;. - M-1 - r - - м - ЦВМ f(tL м l1 О - с о. Х>" c(t) t :;. t1 М. - t Рис. 9-10. ошибки E i вычисляются по из:мереННЫl\I значениям величин с и их производных В начале каждоrо интерваJIа управления: I ............. J Знак минус перед нулеl\1 указывает на то, что измерение произво- дится перед приложением импульса т (t) (т. е. что определяются предначальные значения). Несколько сложнее обстоит дело с определением коэффициен- тов G. Если бы параметры системы не менялись, то их можно было бы вычислить заранее, но так как мы имеем дело с изменяю- щимися неизвестным обраЗОf параметрами, то G i таиже необхо- ДИl'dО определять на основании результатов измерений. Такие изменения MoryT быть сделаны в результате измерения резуль- тата приложения т, но само т должно вычисляться с учетом G i . Это противоречие можно устранить, если для вычисления 8т на данном интервале мы воспользуемся результатами измерений, полученными на предшествующем интервале. При этом, так как будем пользоваться «устаревшей» информацией, мы введем неко- торую ошибку. Для уменьшения этой ошибки интервал T дол- жен быть выбран достаточно малым. Е о == C d (-О) --- С 1 (- О); ) E 1 = ( : - / )t =-0; ( d 2 C d d2Cl) Е 2 == dt 2 - dt 2 1 =- _ о; (9-23) 289
Пусть на предыдущем интервале приращение управляющеrо воздействия равнялось т* (t), тоrда можно показать [217], что коэффициенты G i на данном интервале 10rYT быть вычислены по выражениям: G E 1 о == дАl* ; -1 Е*- АМ*С* G 1 L1 О О 1 == - ДМ*; t G = Щ - (пCl + мпс о ) . 2 дkf1 ' · · · · · J (9-24) rде Gt - значения соответствующих коэффициентов на преды- дущем интервале, а величины Е! определяются по результатам наблюдений реrулируемой величины с (t) и ее производных непо- средственно перед импульсом и сразу же после Hero следующим образом: Et == с (+0) - с (-О); ) Et=( )t=+O- ( \=-O; E = ( ; ) I = + О - ( ; ) I = - О; I ............... ) (9-25) 9-4. Статистические методы идентификации статических характеристик объектов В практических задачах часто приходится сталкиваться с необ- ходимостью находить математическое описание или, как часто rоворят, строить математическую модель сложноrо, уже работаю- щеrо дороrостоящеrо объекта, процессы в котором изучены не полностью или же не изучены совсем, а условия эксплуатации совершенно не допускают подачи на входы системы возмущений специальной формы, при которых обычно определяются детер:ми- нированные характеристики объекта. Возникает задача - опре- делить динамические и статические характеристики объекта (или построить ero математическую модель) на основании результатов наблюдения за изменением входных и выходных величин в про- цессе нормальной эксплуатации. Естественно, что получение точной математической модели практически невозможно. Модель получается приближенной. В последние rоды был разработан ряд методов определения динамических характеристик объекта с по- мощью различных статистических характеристик, снимаемых в процессе нормальной эксплуатации. Применение статистиче- ских методов, естественно, требует больmеrо объема вычисли.. тельной работы, но они дают возможность решить задачу иденти- 270
фикации там, rде обычные «детерминированные» методы оказы- ваются неприrодными. Начнем с рассмотрения определения статических характери- СТИR одномерных безынерционных объектов. Мы одновременно наблюдаем и реrистрируем ряд значений входной величины объекта: х (t 1 ), х (t 2 ), ..., Х (t n ) и ero выходной величины У (t 1 ), У (t 2 ), ..., У (t n ). Если бы в объекте не действовали случайные шумы и каждому значению X k соответствовало бы определенное и единственное значение Yk' то проблема решалась бы детермини- стическими методами. Мы МО1'ли бы построить 1'рафик У === j (х) и найти функцию j, пользуясь любым известным методом аппро- ксимации функций. Но при наличии случайных шумов иско:м:ая кривая может оказаться сильно размытой (рис. 9-11), и задача аппрон:симации сильно усложняется. В процессе нормальной эксплуата- ции значения х (t) сами по себе носят случайный харан:тер; поэтому M1'Ho- венные значения х (t i ) можно рас- сматривать как реализации случай- ной величины х. Значения У (tJ, очевидно, также будут реализаЦИЯ?vIИ случайной величины У, а связь ме- жду реализациями У и х также будет носить случайный характер. В этом о случае из опыта оказывается удобнее определять не трудно обнаруживае- мую функцию у === j (х), а оператор, преобразующий какую-либо характеристику случайной величиныХ в анало1'ИЧНУЮ характеристику случайной величины У. ТО1'да най- денный оператор позволит нам все1'да по заданной характеристике входной величины определить характеристику выходной величины. Одной из достаточно полных вероятностных статических харак- теристик объектов является кривая условной плотности вероят- ности ер (Ylx). Рассмотрим методику определения этой кривой из опыта на примере одномерно1'О объекта [148]. Для это1'О мы про- изводим запись результатов большо1'О числа одновременно1'О измерения х и у. Пусть проведена запись 100 измерений и эти результаты изображены 1'рафически на рис. 9-12. Каждая из точек на 1'рафике изображает пару одновременно наблюдаемых значе- ний х и У. Обработку результатов начнем с построения прямо- У1'ольн:ика, оrраничивающе1'О область наблюдаемых точек, и разбивки ЭТО1'о ПРЯМОУ1'ольника на т 2 ПРЯМОУ1'ольных подобла- стей, 1'де число интервалов разбиения т приближенно опреде- ляется по формуле 1 у Х Х Х Х XX х х х х х х х х х х х х х х х Рис. 9-11. т1+3,321gп, (9-26) 1 СМ. Миллс Ф. «Статистические методы». rосстатиздат, 1958, стр. 49. 271
{'де п число измерений. Для п == 100 получаем т ::::::: 7,64. При- нимаем т == 8 и подсчитыIаемM число точек, попавших в каждый из интервалов. Разделив это число на общее число наблюдений п == 100, получае:м значения частот COBMecTHoro появления х и у в данном интервале. Так, например, в интервале 54,1 < х < 54,3 и 42,15 < у < 42,25 мы наБЛlодаем две точки, поэтому частuта для этоrо интервала 42,3 42,2 42.1 ,..--- I I r- у х х х х f-------. Л Х хХ Хх><х Х - Х Х Хх х 'х Х_ - Х )<. Х Х ХХ.ХХ Х ХхХ х х х ХХХ х х х х х х Хх Хх х хх хХх х х хХх ' Х Х Хх х ХхХ х х Хх Хх х х х х Хх ..)( х х - -- х х х х х Хх х х х х х х х х х х -- х I . . . .Х , I . I . . 42,8 42,7 42,6 42,5 4..!,4 54,2 54,4 54,6 54,8 55. О Рис. 9-12. 55,2 55,4 55,6 равна 0,02. Значения частот по:м:ещены в табл. 9-1. IIри:мем эти частоты за оценки вероятностей р (у, х) одновременноrо появле- ния х и у. Просуммировав р (у, х) по rОРИЗ0нтали, получаем ве- Таблица 9-1 Оценки вероятностей CORИecTHoro появления х и у Середина интервала х Середина интервала у I 42,1 I 42,2 I 42;3 I 42,4 I 42,5 I 42,6 I 42,7 I 42,8 I р (х) --- 54 2 0,01 0,02 0,03 , 51 4 0,04 0,03 0,03 0,05 0,01 0,16 , 54 6 0,02 004 0,04 0,06 0,02 0,18 , , 54,8 I 0,03 0,06 0,06 0,04 0,19 55,0 0,07 0,09 0,03 0,19 55,2 0,02 0,06 0,05 0,13 55,4 I 0,06 0,01 0,07 55,6 0,02 0,03 0,05 р (у) 0,01 0,08 0,10 ! 0,13 I 0,26 0,22 0,16 0,04 1,00 роятности р (х) появления х ДJIЯ данноrо интервала величины у, а просуммировав их по вертикали - вероятности р (у) появле- ния у, если х находится в данном интервале. Теперь l\fОЖНО найти оценки условных вероятностей р (у I х) появления у при данном х и р (х I у) появления х при данном у. 272
Для этоrо воспользуеlСЯ извеСТНЫIИ ФОРМУJI3М:Й теории вероят- ностей: р(х\у)==Р(У,Х). J Р (у) , р(у!х)== Р(Х, у) . р (Х) (9-27) Значения этих оценок вероятностей приведены в табл. 9-2 и 9-3. Так :как плотность вероятности р (х 1 ) есть вероятность Toro, что данная величина х на"\ одится R интервале lе/НДУ X] и Х 1 --1- dx, т аБЛllца 9-2 ОЦIIl\а УСЛОВНЫХ перонтностеН у относительно х 42,1 I 42,2 I I 0'3331 i Середина интервала у 42,3 I 42,4 I 4 2,5 I 42,6 I 42,7 1 42,8 1: р (у/х) Середина интервала х 54,2 54 4 , 54,6 54,8 55,0 55,2 55,4 55,6 0,667 0,25 0,1861 0,186 0,312 0,111 0,222, 0,2221 0,333 0,158 0,316,1 0,316 0,368 0,154 0,062 0,111 0,2101 0,474 0,158 0,462 0,384 0,857 0,400 0,143 0,6001 1,0 1,0 0,999 1,0 1,0 1,0 1,0 1,0 Таб/l,uца 9-3 Оценки УСЛОВНЫХ вероятностей х относительнu у Середина интервала х 42,1 I 42,2 Середина интервала у 42,3 42,4 42,С; I 42,6 I 42,7 I 42,8 54,2 1 0,25 10 23 42,4 0,5 0,3 0,19 0,05 I , 54,6 0,25 0,4 0,31 0,23 0,09 54,8 0,3 0,46 0,23 0,18 55,0 0,27 0,41 0,19 55,2 I 0,08 0,27 0,31 55,4 0,37 0,25 55,6 0,13 0,75 'Lp (х/у) 1,0 1,0 /1,0 1,0 1,0 1,0 1,0 1,0 то мы принимаем: найденные р (х \ у) и р (у I х) за оценки плотно- стей вероятностей Р (х I у) и Р (у I х) соотве1ственно для значений х и У, соответствующих середине рассматриваемоrо интервала. За полные статистические характеристи:ки объента часто при- нимают условные плотности верояrrности Р (у I х). Эти хараl{те- ристики изобраiнаются поверхностями. мансимумыI нривых 273
р (у \ х), постронных В функции х, определяют наиболее вероят- ные значения у, которые можно получить при заданном х. rpa- фическое изображение полученной статической вероятностной характеристики одномерноrо объекта можно изобразить в виде семейства кривых Р (у I х) для разных значений х или в виде по- верхности в пространстве координат {х, у, Р (у \ х)} (рис. 9-13). В более сложных случаях мноrомерных объектов 1'рафическая интерпретация опыта, изображенная на рис. 9-12, и характери- стик (рис. 9-13) становится затруднительной в связи с повыше- нием размерности пространства. При повышении размерности требуется уже значительно больший экспериментальный :материал и более трудоемкая статистическая e1'o обработна, для выполнения ноторой прибеrают R цифровым вычислительным машинам. Прак- тически описанный метод ис- пользуется для одно- И двумер- ных законов. В случае более сложных объектов обычно ис- пользуются более наrлядные и удобные, но и более бедные I моментные хараRтеристики слу- чайных величин. Довольно часто можно О1'раничиться пер- выми двумя моментными харак- терИСТИRами: условным матема- тичесним ожиданием, ноторое является аналоrом статиче- ской характеристики, связы- вающей между собою ожидаемые средние значения случайных координат объеRта, и дисперсией, характеризующей рассеяние, разброс опытных данных от усредненной хараI{теристики. Условное математическое ожидание случайной переменной У (для одномерноrо объекта) относительно случайной входной переменной Х может быть выражено через величину Х с помощью уравнения реrрессии: ept у,1х) Рис. 9-13. м {У I Х} = а (х), (9-28) 1'де а (х) есть некоторая функция х, которая связывает среднее значение величины У относительно Х при каждом данном зна- чении х случайной величины Х . Условная дисперсия выходной переменной У относительно входной также может быть выражена через каждое заданное значение х посредством скедастическо1'О уравнения D {У I Х} = (х). (9-29) Наиболее простым является случай линейной реrрессии: м {У I Х} = а + Ьх. 274 (9..30)
В этом случае [148] оказывается, что постоянная а и коэффи- циент реrрессии Ь выражаются через матеl\lатические ожидания М {У}, М {Х}, коэффициент корреляции рух величин у и х и среднеквадратические отклонения Оу и ох следующим образом: а=М {У}-Рух ОУ М {Х}; J ах Ь- ау - Рух Ох ' (9-31) поэтому М {У I Х} ==-М {У} + Рух Оу (Х -М {Х}). ах (9-32) Условная дисперсия D {У I Х}, по определению дисперсии равная со D{YIX}== [y-М{УIХ}]2Р(уlх)dу, -00 (9-33) в ряде практических случаев может быть принята постоянной. В этих случаях корреляция между величинами У и Х называется rомоскедастической корреляцией. Та:к, разброс в размерах обрабатываемой партии деталей может считаться одинановым, не зависящим от порядковоrо номера детали, если на протяжении Bcero процесса обработ:ки техноло- rические условия остаются неизмеННЫ1\1И. Если же с возрастанием Х происходит ощутимый износ режущеrо инструмента, то D{Y\ Х} будет возрастать при возрастании Х. в случаях, коrда D {У I Х} непостоянна, Т. е. зависит от Х, :корреляция между величинами У и Х называется rетероснедасти- чесной. Общая ТJ;исперсия на выходе систеМ!>I складывается из двух составляющих: дисперсии, хара:ктеризующей рассеивание выход- ной переменной У относительно линии реrрессии ! {У I Х} (т. е. относительно математическоrо ожидания условной диспер- сии), и средней дисперсии самой линии реrрессии относительно математическоrо ожидания выходной переменной: D {У} == М {D [У I Х]} + D {М [У I Х]} == со со == [у -М {YIX}]2P yx (Y, x)dydx+ -со -со 00 + [М {У I Х} -М {У}]2 Р Х (х) dx. -со (9-34) При rомоскедаетической корреляции, Т. е. при постоян- ВОЙ D {У I Х}, дисперсия условной средней D {М [У I Х]} 275
характеризует ту часть общеrо рассеивания на вы1оде,, которая обусловлена влиянием вхоной переменной Х. Она равна D {М [У I Х]} == м {(а + Ьх-М {У})2} == == 1! {[а + Ьх - (а + ЬМ {Х})]2} == М {[Ь (х-М {Х} )]2} == = b 2 fttf {х-М {Х})2} == Ь 2 п {Х}. (9-35) Тоrда из (9-34) D {У} == b 2 D {Х} + м {D [У I Х]}. (9-36) Если случайные величины не коррелированы, то Рух = О, Ь == о и общая дисперсия D {У} === М {D [У I Х]} полностью определяется поrрешностями, вносимыми сами:м объеRТОf, и не зависит от поrрешностой входной переменной х. н противопо- ложном случае, Rоrда :корреляция полная и Рух ==- 1, л,! {D[Y I Х} == == о и D {у} == b 2 D {Х}, т. е. дисперсия выхода полностью опре- деляется дисперсией входа. Для практических расчетов ОRазываются удобными выраже- нин дисперсии среднеrо и средней дисперсии через дисперсии нереl\Iенных Х и У и коэффициент I\ОРРСЛЯЦИИ. ВОСПОJIьзовавшись ПОНЯТlIем дисперсиоиноrо отношения D{M[YlxJ} (9-37) 'У)ух == D {У} 110JlУЧИМ D {1'J;! [У I Х]} == D {У} 'tlx (9-38) и. учитывая (9-34), М {D [У I Х]} == D {У} (1-- 'Y)x). (9-39) Для СJlучая линейной реrрессии дисперсионное отношение JrerKO выражается через модуль Rоэффициента корреляции. Учи- тывая (9-37) и (9-35), имееl\f 2 М {М [У I Х] -- м [У]}2 М {[(а + Ьх) - (а + М [Х])2} l1ух == D {У} == D {У} == _ Ь 2 М {(х - М [Х])2} _ Ь 2 D {Х} _ Ь 2 _ 2 - D{Y} - D{Y}- О'у-Рух, (9-40) Т. е. 'rJyx == I р ух 1. Тоrда ДЛЯ линейной реrрессии D {М [У I Х]} == D {У} px; t м {D [У I Х]} == D {У} (1-- Px). f (9-41) (9-42) Рассмотрим теперь процесс, представляющий собою такую последовательность операций, что выходная переменная каждой предыдущей является входной для одной последующей, т. е. операции представляют собой разомкнутую цепочку последова- тельно ВRлюченпых звеньев, для каждоrо из которых заданы 278
условные дисперсии D {X i I X i 1} [146] (рис. 9-14). В случае JIИ- нейной реrрессии lИ {Х n I X n - 1 , х n - 2 , ... , Хо} == Ь n + Ь n - 1 Х n - 1 + ... + ЬоХ о , (9-43) rде Ь n == М {х n } - b n _ 1 J1,f {Х n - 1 } - ... - ЬоМ {Х О }. (9-44) Коэффициенты Ь MoryT быть определены по значениям коэф- фициентов рассеяния D {X i } и ноэффициентов парной l<орреля- М{Х О } IП{х 4 /х о } MiX#J D{X 2 /X f } М(Х 2 - - - - п{Х О ) D{ X f } п{Х 2 J ...... .'(Xп-f} {XпlX.пJ M{п} } D(Х п - f } п{Хп} Рис. 9-14. ции о х.х. .. меjl\ДУ входом и выходом по Bce1vI операциям из си- ... - L стемы уравнений: ЬJl 11) {Х n 1} + Ь п 2 cov (X п - 1 , Х п - 2 ) -! ... ... t- Ь О cov (ХН 1, ..:уо) == cov (ХН l' Х п ); Ь 1l 1 cOV (ХН ' Ха 1) t b H _ 2 D {Х п 2} + ... ... + Ь о соу (Х п 2' хо) == cov (Х п 2' ХН); ь n 1 со V (Х о' Х n 1) + ь 11 2 со V {Х о' Х н 2} -t- ... l' ... - bOD {ХО} == cov (Х О , Х п ), (9-45) rде cov (Х i' Х j) -== м {[x i -- М {X i }] [Xj - М {Х j}]} == PXi' x/Ja j. (9-46) Общая дисперсия выходной величины цепочни операций аналоrично (9-34) Iожет быть предстаnлена HaJ{ сумма сред- Hero условной дисперсии относительно поверхности perpec- сии М {D [Х n I Х n - 1 '...' хо]} и средней дисперсии поверхно- сти и дисперсии условной средней поверхности реrрессии D {Аl[Х n l X n - 1 ..., Xol}: D{X r J==M{DfX n I X n l' ..., Xo]}-t-D{М[ХnIХn_1+...+Хо]}. (9-47) . Первое CJIaraeMOe представляет собою собствеННУIО СУl\Iмарпую поrреmность, возникающую на всех операIИЯХ цепочки, а вто- рое - часть поrреПIНОСТИ на выходе, вызванную суммарными поrреmНОСТЯIИ входов каждой из операций. Эти слаrаемые, аналоrичпо предыдущему, можно выразить через коэффициенты множественной корреляции следующим обра- зом: D {М [Х n I X n - 1 ' ... , Хо]} = D {Х n } Pn I Х n -1, ... ,хо; M{D[XnIX n _ 1 , ..., Xo]}=D{Xn}(1-Рn)lхn_l,...,х.. (9-48) (9-49) 277
:Коэффициент множественной корреляции рх n I Х 11, -1,... Х, выра- жается через коэффициенты парной корреляции по фор- муле [148] ( п-1 Р.'Х'11, I Х n --l, ... . ХО = 2: л'iРХi I Х n ' i=O (9-50) rде Л i опредеJIЯЮТСН из систеlVIЫ уравнений: РХ n ' Х 11, _1л'n-1 + л'n-2РХ 11, _1, Х n -2 + ... + л'lР Х 1' Х 11, -l + ЛоРхо, х n -l; ) РХ11" Х 11, -2 = л'n-1РХ11,-l, 11,-2 + Л n - 2 + ... + Л 1 Р Х t. Х 11, -2 + ЛоРхо,. Х 11, -2; ................................. РХ11,' Хl = л'11,-1РХ11,-l, Хl + л'п-2РХn__2, Хl + ... + л'1 + л'оРхо. Хl; РХn, хо = л'n-lРХ 11, _l, хо + л'п-2РХ n _2, хо + ... + л'lР Х t, хо + л о . J :Коэффициенты b i опредеЛЯIОТСЯ из равенств Ь.==Л.!!:- i==O, 1, ..., п-1. 0" , (9-51) (9-52) Парные же коэффициенты корреляции должны быть опреде- лены из опыта. Для этой цели в форм:уле _М {[Xi- M {Xi}][xj-M{Xj}]} (9-53) PXi, Xj - а'а. J математические ожидания и среднеквадратичные отклонения заменяются их оценками. Так, если мы наблюдаем значения Х 1 == {5; 4; 3; 4,5; 5,5} и Х 2 === { 1; 0,8; 1,2; 1, 1; О, 9}, то М {Х 1 } :='::: 5 + 4 + 3 i- 4,5 + 5,5 = 4,4; М {Х 2 } 1 + 0,8 + 1,; + 1,1 + 0,9 = 1; Х 1 - М {Х 1} {О, 6; --0,4; -1,4; о, 1; 1 , 1 } ; X2-M{X2}{0; -0,2; 0,2; 0,1; -0,1}; [X1-M{X1}][X2-M{X2}]{0; 0,08; -0,28; 0,01; -О,11}; М {[х 1 -.М {Х 1 }] [Х 2 -М {Х 2 }]} о + 0,08 - 0,28 + 0,01 - 0,11 == _ о 06 . 5 ' , -. ;0,62 + 0,42 + 1,42 + 0.12 + 1,12 _ О 86. 0'1 r-v JI 5 -, , -.;0 + 0,22 + 0,22 + 0,12 + 0,12 _ О 14 0'2 rc- JI 5 -, , 0,06 О 5 Р Х 1, X! - 0,86.0,14 = - , · 278
Рассмотрим пример определения характеристик автоматичеСRОЙ линии цеха массовых подшипников первоrо rпз [146]. Из 200 ОПЫТОВ были определены средние размеры, среднеRвадратиqные ОТRлонения разме.. ров и значения парных Rоэффициентов Rорреллции для пяти операций, и результаты вычислений сведены в табл. 9-4. Таблица 9-4 Основные экспериментальные характеристики автоматической .линии по обработке наружноrо диаметра подшипника CD I Значения парных ноэффициентов норреляции =: CD tI: Средний ro = рх.х. Ф= CDtI: IIаименовапие ::r'= размер ::S::OCD J ro:::r CDtI::д операции tI:rn оценна tI:trO C'j М {xi} Оф CD ::S:: ХО Хl Х 2 х з Х" \0= rn E-t ."", 00 uoo 3aroToBKa хо 139,478 0,6552 1 10,328 0,322 0,188 -0,140 (поковка) Токарная Хl 135,390 0,0720 0,328 1 0,907 0,272 -0,220 Термическая Х2 135,570 0,1028 0,322 0,907 1 0,380 -0,221 П редва ритель- Хз 135,084 0,0083 0,188 0,272 0,380 1 -0,394 ное шлифова- ние Окончательное Х4 134,98у,0018 -0,140 -0,220 -0,221 -0,394 1 шлифование Составляем систему уравнений: Р Х4 , Хз == Л З + Л 2 Р х2 , Хз + Л 1 Р х1 , Ха + ЛОРХ о , х 3 ; Р х4 , Х2 == ЛзР хз , Х2 + Л 2 + Л 1 Р ХН Х2 + АоРхо, х 2 ; Р х х == ЛзР х х + Л 2 Р х Х + Л 1 + ЛоР х х; ", 1 3, 1 2, 1 О, 1 Р Х " хо == ЛЗР Хз , хо + Л 2 Р х2 , Х О + Л 1 Р х1 , Х О + л о или: Аз + 0,380Л2 + 0, 272Л l + 0,188л о == - 0,394; 0,380Аз + Л2 + 0,9О7Аl + 0,322ло == -0,221; 0,272лз + 0,907Л 2 + Лl + 0,328ло == - 0,220; 0,188лз + 0,322Л 2 + 0,328Л 1 + ЛО == - 0,140. Решая эти уравнения, найдем Аз == - 0,4927; Л2 == 0,6161; Лl == 0,7740; ЛО == 0,4019. Тоrда из (9-50) коэффициент множественной корреляции будет равен Р х ", Хз, Х2, х 1 , Ха == == -v - 0,4019.0,140 + 0,7740 .0,220 - 0,6161 .0,221 + 0,4927 .0,394 == 0,5334. Далее по (9-52) находим: 0'4 0,0018 . Ь о == ло <J; == 0,4019 0,6552 == 0,0011, Ь 2 == 0,0108; 0'4 О 0,0018 . О 9 Ь 1 == Лl 0'1 == - 0,774 0,0720 == - 0,01935, Ь з == - ,106. 279
Из (9-44) находим Ь 4 == М {Х 4 } - ЬзМ {Ха} - Ь 2 М {Х 2 } - blM {Х 1 } - ьом {.LY o } == == 134,985 + 0,1069.135,084 - 0,0108 .135,570 + 0,01935 .135,390- - 0,0011 . 139,478 == 150,4277. Теперь по (9-49) найдем среднюю дисперсию относительно поверхности реrрессии: М{D[Х4!ХЗ'Х2'Хl,Хо]}==D{Х4}(1-рх'J х Х х х)== 4, J, 2, 1, О == 0,00182 (1 - 0,53342) == 23'1,7896 .10 8 AtAt, а по (9-48) - дисперсию средней поверлности реrрессии: D {М [Х 4 I х 3, Х 2, Х 1, Х о]} == л {Х 4} р 4, :\3' '2' Х 1, Х о := == 0,00182 .0,53342 == 92,1780.10 8. M "'t. После расчетов полезно выполнить проверку. Подставив в формулу (9-43) вместо Х i их средние значения ]1,;/ {Х ,J из таблицы, получим М {Х i} == == 134,985 мм, что совпадает с данным в таблице. По формуле (9-47) получаем D {Х 4 } == (231,'7896 + 92,1780) 10 в ==- 323,9676.10 в ttM, что практически совпадает со значением D {Х 4 } == a == 0,00182 ::= 324 . 10-8 «M. В случае нелинейной реrрессии и rетероскедастической кор- реляции можно примеllИТh КУСОЧНО-JIинеЙНУlО аппроксимаЦИIО нелинейной реrрессии на участках с постоянными значениями D {У I Х}. Проверку близости к линейности производят путем сопоставлеНIIЯ определенноrо из опыта дисперсионноrо соотно- 02 шения 'YlY и расчитапноrо по формуле t]2 yx == Ь 2 -. При значитеJIЬ- ау HOI\1 расхождении производится кусочпо-липейная аппроксимация. Если кривая реl'рессии разбита на р прям:олинейных участков и на наждом участке отреЗ0К ломаной линии, аппрокси:мирующей липию реrрессии, определяется уравнение:м М {Yll X l } == a l + bYlXlXl, l == 1, 2, ..., Р, (9-54) а вероятность попадания Х на l-й участок равна И'(Х z ), 1'0 р р D {У} == blXzD {X z } W {X l } + м {D [Yll X l ]} W (X l ) +- l=1 l=1 р + D {iV[ [Y l ]} W (X l ). (9-55) 1=1 При точном задании уравнений липии реrрессии М {У I Х} == (х (х) снедастичеСRОЙ линии D {У I Х} == (х) 280
и плотности вероятности Р (х) входной переменной Х, величины М {У} :и D {У} MoryT быть вычислены по уравнениям: 00 ) м {У} = а (х) Р (х) dx; I 00 -- OJ l 00 J2 } (9-56) D {У} = }}а 2 (х) + (х)] Р (х) dx - J ro а (х)Р (х) dx · J 9-5. Статистические методы идентификации динамических характеристик объектов Для определения динамических характерИСТИR статистическими iетодами используются методы теории случайных ФУНRЦИЙ. llри этом полные вероятностные хараI{теристики, мноrомерные плотности вероятности практически не используются из-за чрез- вычайно большоrо объема вычислений. Для идентификации ли- нейных объеRТОВ (т. е. объентов с линейной реI'рессией выходной переменной относительно входной и rомоскедастической Rорреля- цией) наибольшее распространение получили корреляционные, а для нелинейных объектов - дисперсионные методы. Корреляционные методы оеновыIаIотеяя на использовании кор- реляционных фУНRЦИЙ, которые в случае линейных объеRТОВ, дос- таточно хорошо характеРИЗУIОТ тесноту связи меiНДУ значениями переменных в различные моменты времени. Рассмотрим одномерный объект, на вход KOToporo действует случайная фУНRЦИЯ Х (t), а выход характеризуется случайной функцией У (t). Авто- и взаИIно-норреЛЯIионные функции вы- ражаются слеДУЮЩИl\1 образом: (О о: Л Х (! l' t 2) == [х ([1) -- т х (' 1)] r х ([2) - пt x (t 2 )] Х - О) -:::о XP2;x[X(t1), x(t 2 ), t 1 , t 2 ]dx(t 1 )dx(t]); (9-57) ro 00 R xy (t 1 , t 2 )== [y(tl)-ту(tl)][Х(t2)-тх(t2)]Х -00-0) х Р 2 ху [х (t 2) , у (t 1) , t l' [2] d х (! 2) d у (t 1) . Если из опыта определены корреляционные функции входноrо и выходноrо процессов, то мы прежде Bcero можем с их помощью приближенно определить детерминированные динамические ха- раRтеристини объекта [99, 216]. Тан, если на вход объекта подать rармоиичеСRИЙ сиrнал х (t) == D sin UJt, а на выходе ero обра- зуется rармонический сиrнал, на который налол\ен стационарный ШУl\f п (t), математичеСRое ожидание ROToporo М {п (t)} ==:: О, у (t) == в sin (UJt -t 6) + п (t), 281
то нетрудно убедиться в справедливости равенств: Т R lIx (O) = 1im x(t)y(t)dt= BDcosB; Т-ОС о- ) rде z (t) == D cos wt, а R yx (О) и R zx (О) представляют собой зна- чения взаимно корреляционных функций для одноrо и Toro же :м:омента времени (t 1 === t 2 ). Отсюда определяются амплитуда А 11 фаsа 6 частной характеристики объекта Т R zx (О) =Нm i \x(t)z(t)dt= BDsin(), Т-ОО o (9-58) А = 2 VRx (О) + Rx (О); ) а _ t В 1IХ (О) u - arc g R zx (О) . Здесь ДЛЯ вычисления корреляционных функций использовано их определение через среднее по времени, а не среднее по мно- жеству, фиrур:uрующее в (9-57). Как известно, среднее по вре- мени и множеству совпадают для эрrодических процессов, n част- ности ДJIЯ стационарных. Поэтому если объект и шум п (t) ста- Iионарны, то при воздействии типа rармонических функций, мы получаем стационарные эрrодические процессы. Однако так как предельный переход для случайных процессов при Т -+ 00 в формулах (9-58) неосуществим, то величины R yx и R zx заме- няются их оценками: (9-59) T-I'o ) 1 \ I R yx (О) = т j у (t) х (t) dt; t o } [о+т 1 \ R zx (О) = т j z (t) х (t) dt, [о ) которые будут тем точнее, че1УI больше время интеrрирования. Важно при этом производить вычисления для значений t > t o rде t o - время, по истечении KOToporo собственные движения системы практически IIрекращаются. Схема для определения характеристик R показана на рис. 9-15. На схеме 1 - reHepaTop синусоидальных и косинусоидальных сиrналов, 2 - объект, 3 - аналоrовое вычислительное устрой- ство, вычисляющее оценки R yx и R zx по формулам (9-60). Вычис- лительное устройство включает в себя умножители М, операцион- ные усилители У и потенциометры, с помощью которых устанав- ливаются их постоянные вреl\1ени. Значения R (О) равны устано- вивтимся значениям выходных напряжений. (9-60) 282
Описанный способ может быть уточнен, если применить так называемый метод нулевой фазы [98]. Однако при этом для изме- рения требуются значительное время и специальные rармони- ческие сиrналы. Если дан линейный объект, на который действует шум п (t), причем записать этот Шуl\tI невозможно и статистические характе- ( х 2 з r-----------------------------, I t I R 2 I I I I I I I f м R f 2 I М J f t I I I I I I I : I R f I L____________________________ Рис. 9-15. ристики шу:ма неизвестны, то по записям процессов при НОРIаль- ной эксплуатации объекта оказывается возможным определить функцию веса (реакцию на импульсную функцию) объекта k и (t). Если х (t) и п (t) коррелированы между собой, то для опре- деления k и (t) необходимо иметь запись трех функций: входных х (t) (коррелированной с п (t)), z (t) (кор- релированной с х (t)) и выходной у (t) (рис. 9-16) [225]. Тоrда XftJ п(t) т R у z (t) == k и (т) R х z (t' -- т) d т . (9 - 61 ) о уН) Рис. 9-16. Имеем интеrральное уравнение, в мо- тором функции R предполаrаются известными. Решая это урав- нение, найдем k и (Т). Если заранее известно, что х (t) и п (t) некоррелированы, то достаточно записать лишь функции х и у и решить уравнение т R yx (t) = k и (Т) R y (t - Т) dT. О (9-62) 283
Решить уравнения (9-61) и (9-62) мо:;кно, наПРИl\'Iер, методом последовательных приБЛИrнений [98, 99]. Нулевое приближение k ио (t) выбирается произвольно, 8 последующие приближения определяются по формуле k Иn + 1 (t) = k иn (t) - а [f R y (l - _) k иn ('t) d't - R xy (l)]. (9-63) коэффициент а выбирается из условия а:::;;; 1/ лmах , rде Лmах- наибольшее собственное число ядра (корреляционной функции R y ). В большинстве случаев можно положить а == 1/2. Корреляционный метод может быть также применен для на- хождения условноrо математичеСI{оrо ожидания случайной функ- ции М {У (t)} и ero дисперсии D {ltl [У (t)]} [148]. В каiНДЫЙ момент времени t п -+ 1 выходная случайная функция у (t) определяется значениями Х (tJ в предшествующие моменты t i , i === 1, 2,..., п. Уславное математическое ожидание выражается уравнением реrрессии Jt;[ {}Т (tn 1) I х 1, Х 2' ..., Х п} == п == а (! l' t 2, ..., t п + 1 ) +- L J-1 i (t 1 , t 2, '.', t n+ 1) Х (t i) , ( 9 - 64 ) 1.=1 rде A'l. - коэффициенты МНОrRеетвенной реI'рессии. Составляюпие общей дисперсии вь[ходной величины l\rIОЖНО найти из соотношений: D {М [У (t n 11) I х (t 1 ), ..., Х (tп)J} == == D {У (l n+ 1) } R tx (t l' ..., t n \ 1) ; Лl {D [У (t n t-1) \ Х (t 1 ), ..., Х (t n )]} == ==D{У(t п + 1 )}[1- R tх(t 1 , ..., t п + 1 )]. Во всех этих выражениях учитывается связь У (t n + 1 ) В 1\-IОмент е n + 1 со всеми значениями Х (t i ) в предшествующие моменты вре- мени t 1 , t 2 , ..., t n . В весьма важном частном случае, коrда плот- ность вероятности функций Х и У и их совместная плотность вероятности нормальны, их l\'Iатематические ожидания т х (t) и ту (t) и дисперсии D x (t) и D y (t) будут постоянными, а корреля- ционные функции будут функциями разности t п + 1 - t i =:; "С. При этом условное математическое ожидание У (t п + 1 ) по-прежнему определяется уравнением (9-64), а безусловное математическое ожидание М {У (t n + 1 )} == а (t n + 1 -- t 1 , ..., t/t1 - t n ) + (9-65) n + A i (t n + 1 - [ 1 , i=l . . . , t n + 1 - t n ) М {Х (t i )} == n = а (Т) + т х (t) А ! (). (9-66) {=1 284
Дисперсию l\fОЖНО выразить следующим образом: D {М [У (t n + 1 ) I Х (ll)' ..., Х (t п )]} == n n-2 n-l ==Dx(t)AI(T)+2Dx(t) Ai()Aj()pxx('tij), (9-67) i=l i = 1 j=i+1 rде р хх ('tij) - Rоэффициент Rорреляции Х (t) в моменты 't"i и 't"j. :Коэффициенты реrрессии определяются из спетемы уравнений: А i (1:) Р.\'Х (1:11) аХ (1: J = Р ух (1:1) а у (t); 1 i=l I . . . . . . . . . . . . . . . . . . . . } (9-68) n А i (Т) р хх ('t" n i) ах ('t" i) == Ру х (Т 11) а у (t), i==l J а параметр n-l а (Т) == ту (t) - lп х (t) A i (1). i= 1 (9-69) При малых 't" и больших п полученные уравнения IorYT быть использованы для идентификации при непрерывных функциях Х (t) и У (t). В общем случае, коrда рассматриваемый объект не является линейным, Rоэффициент корреJIЯЦИИ уже не :может служить в ка- честве общей характеристики случайных величин Х и У. Б этих случаях в качестве характеристики связи м:ожно принять диспер- сионное отношение. Если внутренняя структура функций Х и У неизвестна заранее, то корреляционные методы также MoryT при- вести к существенным поrрешностям. 1eTOДЫ идентификации, основанные на использовании дисперсионных ОТНОlпений и дис- персионных функций, называются диспеРС:ИОННЫl:И. Автодисперсионная (или просто дисперсионная) функция опре- деляется слеДУIОЩИМ: образом: В х (t 2 , t 1 ) == М {[М {Х (t 2 ) I Х (t 1 )} -lJJ {Х (t 2 )]}2} == - Jco [1 х (t 2 ) Р [х (t 2 ) I'x (t 1 )] dx (t 2 ) - - J(X) х (t 2 ) Р [х (t 2 )] dx (t 2 )T р [х (t 1 )] dx (t 1 ), (9-70) иными словами, дисперсионная функция есть дисперсия условных математических ожиданий значений Х (t 2 ) относительно Х (t 1 ) 8 х (t 2 , [ 1 ) == D {М [Х (t 2 ) I Х (t 1 )]}. (9-71) 285
Часто удобнее воспользоваться нормированной дисперсионной функцией 'tlx (t 2 , t 1 ), представляющей собой дисперсионное от- ношение случайной величины при различн ых apryMeHTax: ( ) ... f 6 х (t 2 , t 1 ) l1х t 2 , t 1 == J! п х (t 2 ) . (9-72) [Iри линейной реrрессии дисперсионная функция ах (t 2 , t 1 ) следующим образом выражается через коэффициент реrрессии Ь х (t 2 , t 1 ) ЭХ (t 2 , t 1 ) == bi (t 2 , t 1 ) D {Х (t 1 )} == P (t 2 , t 1 ) D x (t 2 ). (9-73) Для этоrо же случая нормированная дисперсионная функция 'tlx(t 2 , t 1 )==\Px(t 2 , t 1 )!. (9-74) При равных значениях арrумеитов t 1 == t 2 == t дисперсионная функция, так же как и корреляционная функция, становится равной дисперсии случайной функции: Эх (t) == D x (t), (9-75) а нормированная дисперсионная функция становится равной еди- нице: 'tlx (t) == I Рх (t) \ == 1. (9-76) Если для двух заданных значений apryMeHToB t 1 и t 2 Х (t 1 ) И Х (t 2 ) независимы, то дисперсионная функция равна нулю. В дис- персионном анализе используется также понятие взаимной дис- персионной функции е ху (t 2, t 1) == м {[ м {У (t 2) I Х (t 1 )} - м {У (t 2) } ] 2} == - JooUooY2P(Y2!Xl)dY2- _lY2 P (У2) d y 2 Tp (x1)dx 1 . (9-77) Аналоrично предыдущему определяется нормированная взаим- ная дисперсионная функция ( ) _ ...(6YX(t2, t 1 ) 'tlyx t 2 , t 1 - J! п у (t 2 ) , (9-78) которая может принимать значения только в пределах от нуля (коrда Х и У некоррелированы) до единицы (коrда между Х и У существует функциональная зависимость). Рассмотри:м одномерный объект, на который условия нормаль- ностей плотностей вероятности, линейности реrрессии и rOMO- скедастичности корреляции не накладываются. Пусть уравнения реrрессии и скедастической поверхности заданы в виде М {У (t n + 1 ) I Х (t 1 ), '.., Х (t п )} ==а (t 1 , ..., t n + 1 ); l J (9-79) М {D [У (t n + 1 ) I Х (t 1 ), ..., Х (t n )} == (t 1 , ..., t n + 1 ). 286
Математическое ожидание и дисперсия выходной величины для любоrо заданноrо значения apryMeHTa t п + 1 MoryT быть най- дены по заданным уравнениям реrрессионной и скедаС1ической поверхности и плотности вероятности входной величины следую- щим образом: со 00 M{Y(t n + 1 )}== ... a(t 1 , ..., tn+1)X -со -00 ХРn (х 1 , ..., Х l17 t 1 , ..., t n ) dx 1 , ..., dx n ; (9-80) (х) 00 D{)/"(t n + 1 )}== ... {[а (t 1 , ..., t n + 1 )]2+ -00 -ЛJ +(tl' ..., t n + 1 )}Pn(X 1 , ..., х n , t 1 , ..., t n )dx 1 , '.., dx п - - [Sco. · · Joo а (tl' ... t n + 1 ) р n (х 1 . .... х n . t 1 . .... t n ) Х Х dx 1 . ..., dx n J. (9-81) в настоящее время возможности приведенноrо решения orpa- ничены, так как п-мерная плотность вероятности и уравнения реrрессионной и скедастической поверхностей для сложных объектов заранее неизвестны, а их экспериментальное определе- ние дороrо и трудоемко. Поэтому :MHoroMepHble законы распреде- ления случайных функций устанавливаются только для массо- вых производственных процессов, в которых ПРОДУI\ЦИЯ остается длительное время однородной. Решение уравнений (9-80) и (9-81) также можно выполнять приближенно, использовав кусочную линеаризацию уравнения реrрессии путем разбивки ее на участки с постоянными значе- ниями математическоrо ожидания условной дисперсии случайных функций. Совершенно очевидно, что математические модели, построен- ные статистическими методами, из-за неучтенных связей, различ- ных упрощающих предположений и т. д., будут не полностью от- ражать свойства объекта. В качестве оценки степени соответствия (изоморфности) мате:матической модели реальному объекту пред- ложена мера определенности [148]. Процесс называется неопреде- ленным (нереrулярным), если выходные переменные не опреде- ляются заданием входных переменных и свойствами объекта. В определенном (детерминированном, реrулярном) процессе вы- ходные переменные полностью определяются входными перемен- ными и свойствами объекта. Фактически процесс лишь частично определяется входными данными. Общую дисперсию случайной функции Y k (t n + 1 ) на выходе объекта можно представить как сумму дисперсий условноrо 287
математическоrо ожидания и математическоrо ожидания условной дисперсии: D {У k (t п+ 1)} == D { М [У lf (t п + 1) I Х (! 1 ) , .. · , Х (t n ), Z (t 1) , ..., Z (t n )]} + t-М{D{Уk(t n -11)IХ(/1)' ..., X(t n ), Z(t 1 ), ..., Z(t n )]}, (9-82) rде Z - функция, характеризующая внутреннее состояние объекта Дисперсию D {М [Y k (t n + 1 ) I Х (t), Z (t)]} называют множест- венной дисперсионной функцией Y k относительно Х и Z. В ка- честве количественной оценки степени определонности процесса по данному выходу Y k принимается отношение дисперсии услов- Horo математическоrо ожидания к общей дисперсии выходной функции Q {У (t ) I Х (t) Z (t)} == D {М [Yh (tn) I Х (t), Z (t)]} (9-83) h n' л {Yk(t)} · Это оrношение названо мерой определенносrи (детерминиро- ванности) процесса. Величина этой меры равна нулю при пол- ностью неопределенном, и единице при полностью детерминиро- ванном процессе, для не полностью же определенноrо процесса она положительна и заключена между нуле:м и единицей. Чем выше степень определенности, тем БОЛЬПlе соответствие мел\ду математической моделью и реальным объектом. Расчеты меры определенности для некоторых типов объектов приводятся в [148]. 9-6. Распознавание образов Сама проблема распознавания образов относится 1\ сфере высшей деятельности мозrа и, несмотря на довольно БОЛЫlIое число работ в этом направлении, разработана еще слабо. До сих пор не сфор:м:улированы четко понятия большинства различных встречающихся в жизни образов и отличающих их признаков. I-IеЯСЕО, наПРИlер, по каким признакам распознаIОТСЯ сложные образы (например, по каким признакам человек сразу отличает женское лицо от мужскоrо и т. д.). Естественно, что при отсут- ствии четкой и строrой постановки задачи нельзя ожидать эффек- тивных и надежных методов ее решения. Тем не менее, практи- ческое значение проблемы исключительно велико [2]. Для адаптивных систем, нак мы видели, характерен процесс обучения, состоящий в накоплении (запоминании) необходимой информации и в ее анализе для последующеrо принятия РОПIения. В простейmих случаях, J\оrда конструктору авто:мата или обуча- ющему автомат оператору ясно, какие решения следует принимать при различных исходных данных, процесс обучения :может про- изводиться по алrоритмам, зало}кеННЫ1 в автомат RОПСТРУКТОРОI. Но существуют важные для практики задачи, в которых среди l\fIIожества сло}кных ситуаций требуется отличать ситуации, ОТНО- 288
сящиеся !{ определенным классам, причеl\Jl четко охарактеризовать вти классы заранее очень трудно. Несмотря на это, квалифици- рованный человек выполняет эту илассифИRацию довольно леrко, хотя и не может четко объяснить, как он это делает. В таких случаях основной метод обучения одним чрловеком друrоrо состоит в показе el\fY ряда ситуаций и пояснению, к иа- кому классу эту ситуацию следует отнести. Ребенка, да и взрослоrо человека, rораздо леrче обучить рас- познавать БУI{ВЫ алфавита, показывая и называя эти буквы, чем пытаясь точно описать, как эти БУКRЫ строятся. Практически невозможно научить узнават!> обыденное человеческое лицо, опи- сывая ero словами, но это мол<но леrко сделать, ноказав фотоrра- фию человека. Показом целесообразно обучать распознавать силуэты кораблей и самолетов, почерк определенных лиц, звуко- вые образы (слова, фразы, тембр !'олоса и т. д.). Наблюдаемую в данный момент ситуацию будеI называть объектом. rруппа различных объектов, характеризуемая опре- деленной совокупностью признаков, свойственных объектам только данной rруппы, называется образом. Таи, если :мы к признакам, по которым устанавливается образ, относим черты человеческоrо лица, то образом для rруппы лиц м:ожет быть женское или мул,- ское лицо; лицо ребенка, подростка, юноши, взрослоrо человека; лицо pyccKoro, rрузина, еврея, но невозможно установить, на- пример, образ множества лиц, проживающих в данном доме. Признаки, по которым устанавливается образ, называются информативными признаJ{ами. Любой объект помимо информатив- ных имеет множество друrих признаков , не существенных для опознавания образа. Так, для выделения мужскоrо лица совер- шенно не имеет значения цвет волос, rлаз, кожи и т. п., зато для выделения образов «брюнетов», «шатенов» и т. д. эти признаки будут информативными, а признаки, по которым женское лицо различалось с мужским, не информативными. Одна из основных трудностей при распознавании образов состоит в том, что очень часто информативные признаки не MoryT быть полно и точно описаны на математическом, лоrическом или каком-либо друrом языке, но известно, что они существуют и что оператор достаточно уверенно с малой вероятностью ОIпиБRИ их обнаруживает. При автоматизации процесса опознавания помимо ::>той труд- ности часто сталкиваемся и с друrой. Чтобы можно было «пока- зать» автомату объект, мы встраиваем в автомат систему датчииов, «рецепторов», как их принято называть по аналоrии с соответ- ствующим фиэиолоrическим термином, которые воспринимают некоторые количественные характеристики не Bcero объекта, но ero отдельных элементов. Задача существенно облеrчилась БЫ t если бы мы всеrда умели строить рецепторы, воспринимающие непосредственно информативные признаки образа. Но по разным 289
причинам (конструктивным, физическим и Т. п.) построить рецеп- тор, выдающий на своем выходе число, характеризующее одно- значно тот или иной информативный признак, почти никоrда не удается. (Коrда это удается, вся специфика проблемы распознава- ния образа теряется и l\lыI получаем обычный при бор автомати- ческоrо контроля. К таким автоматам относятся, например, устрой- ства для чтения печатноrо текста определенноrо шрифта и раз- мера.) Информативный признаR должен быть выработан на основании выходных координат рецепторов. Эта задача оказывается за- частую весы\аa нелеrl\.ОЙ дая<е в тех случаях, коrда мы можем точно описать информативный признак. Пример - выделение из множества rеометрических фиrур KpyroB, треуrольников, квад- ратов, ПОЛуRруrов и т. П., раЗIIоrо размера и расположенных произвольны:м: образом. Человеческий rлаз это делает MrHOBeHHO. Алrоритм же, основанный на точном описании фиrур уравнениями или же счетом уrлов, криволинейных или прямолинейных участ- ков, и т. П., оказывается весьма трудно реализовать технически. Практически в таких случаях часто приходится отказаться от попыток использования наших исчерпывающих знаний описаний информативных признаков из-за их сложности и переходить к методу обучения показом. Распознавание образов на основе обучения показом основы- вается на преобразовании данных наблюдения объектов в сово- купности чисел и на обработке этих чисел по специальным ал- rоритмам. Для преобразования данных о наблюдаемом объекте в сово- нупность чисел и последующей обработки этих данных весьма полезным оказывается понятие метрическоrо пространства. Каж- дому признаку (не только информативному) объекта можно при- писать некоторое число, такое, чтобы оно не совпадало с числами, приписанными друrим признакам. Тоrда всей совокупности N признаков объекта будет соответствовать совокупность чисел, которые можно рассматривать как координаты некоторой точки в N-мерпом пространстве признаков. Таким образом, каждый объект в данном пространстве отображается точкой, а образ - совокупностью точек, обладающих общими информативными при- знаками. Если удалось выполнить отображение признаков в про- странстве или, как rоворят, построить пространство признаков так, что образам будут соответствовать пепересекающиеся об- ласти, внутри которых точки расположены достаточно близко друr к друrу, и между этими областями MoryT быть проведены разделяющие их rиперповерхности, то решение задачи распозна- вания образа облеrчается. rипотеза о том, что пространство признаков обладает упомя- нутыми свойствами (близостью точек и разделимостью областей) была выдвинута в [21] под названием «rипотезы компактности». 290
Однако так как понятие компактности множества не совпадает с данным понятием (математическое понятие ко:м:пактности оказы- вается весьма суровым и встречающиеся в практике ситуации обычно не удовлетворяют математичрским ус ловиям компакт- ности), то мы будем избеrать в дальнейшем этоrо термина и rOBo- рить о «rипотезе разделимости образов поверхностями». R сожалению, проблема построения пространств признаков , в котором rипотеза разделимости оказывается справедливой, не Uf - )ч х , Д ВУ Х,_ )... . rt-"' . . . - ------ - XL_ . ВУ А, ... G UL ..... РБ ---.. Д - -..... - . . . . L-. Хн - ВУ - ЛН Д ин - - - - - ЛN+1 - - уу Рис. 9-17. имеет общеrо решения. Пока удалось решить на основе этой rипотезы лишь ряд частных задач. Во мноrих же задачах области, соответствующие образам, взаимно проникают друr в друrа, напоминая, по образному выражению М. Бонrарда [19], rубку с водой, что делает практически невоз:можным построение авто- мато:м поверхности, отделяющей rубку от воды. Но, тем не менее, на основе rипотезы разделимости, удалось построить алrоритмы для опознавания цифр, некоторых ТОIlоrрафических .знаков на карте и некоторых друrих простейших образов. Ниже мы рассмотрим некоторые из алrоритмов распознавания. П а н Д е м о н и у м. Одной из первых машин для распознавания образов был «пандемониум», построенный О. Селфриджем в 1958 r. [260]. Название «пандемониум» навеяно известными рассужде- ниями Д. К. Максвелла о «демоне», который противодействует росту энтропии, открывая дверцу в разделяющей два закрытых 291
сосуда переrородке перед быстролетящими молекулаIИ rаза, и закрывая ее перед медленнолетящими молекулами [248], в ре- аульта'Iе чеrо происходит повышение температуры rаза R одном сосуде и понижение ее в друrом. Упрощенная схема панде1\10ниума ДJIЯ выработки двух взаимно дополнительных понятий показана на рис. 9-17. Образ характеризуется совокупностью величин u == {и 1 , и 2 , ..., UN} в пространстве признаков и, ВОСПРИНИIаемых датчикаIИ Д. Области, соответствующие ДBYI образам:, :MoryT оказаться раз- деленными сложной поверхносты() (рис. 9-18, а), что затрудняет построение алrоритма распознавания, ПОЭТОIУ предварительно а) и2 б) Х2 и{ X t Рис. 9-18. с помощью вычислительноrо устройства В У производится по- строение «спрямляющеrо пространства» Х, на которое отобра- жается пространство признаков и. с этой цеJIЬЮ вычислительные устройства вырабатывают некоторые функции состояния дат- чиков X i ==f i (и 1 , и 2 , ..., UN). (9-84) Функции f i выбираются так, чтобы множество точек Х",ЕХ в пространстве Х, соответствующих одному образу, попало в об- ласть Е} (рис. 9-18, 6), друrому образу - в область Е 2 , и между областями Е 1 и Е 2 можно было бы провести :множество разделяющих rиперплоскостей N а == ЛiХ i + ЛN + 1 == о. i=l (9-85) Если такая rиперплоскость (в дальнейшем для краткости будем rоворить о разделяющих поверхностях и плоскостях, опуская приставку «rипер») существует и построена, то для любой точки области Е 1 линейная форма а будет иметь один знак (например, +), а для области Е 2 - противоположный (-). Поэтому по знаку а 292
можно судить, к какому из двух нлассов (обраЗ0В) принадлежит показанный объект. На схеме рис. 9-17 значения X i поступаJОТ на усилители с пере- менными коэффициентами УСИJIения Л i . Функция а образуется путем суммирования выходов усилителей и величины ЛN+1 :и поступает в реlпающий блок Р Б, RJ>lЯ влнющий знак (J и выдаю- щий в соответствии с этим: знаком. J\ОД образа. Этапу распозна- вания предшествует этап обучения, который заключается в том, что оператор ноказывает пандемониуму серию объектов и нонтро- лирует правильность ero ответов. Если пандемониум Оlпибся, то оператор подает сиrнал на управляющее устройство УУ. Число s А . ..... .......- .. .... ...... .... .. . ... ..... 1 t R о Рис. 9-19. ошибок за некоторый промежуток вре1ени Т представляет собой некоторую фУНI{ЦИIО F (}\I1, л 2 , ..., ЛN). ПреJ\полаrается, что эта фУНI{ЦИЯ имеет :минимум в пространстве л. У II равляющее YCTpoii- ство изменяет Л 1 , Л 2 , ..., }"N так, чтоБыI МИНИ!\lияпровать F. Так KaI{ ФУНI{ЦИЯ F заранее неизвестна, уу осуществляет ПОИСI{ по методу наискорейшеrо СПУСI{а, т. е. действует нак l\1ноrОI(анальный опти- мизатор. Пандеl\10НИУМ действует, исходя из 1'01'0, что самая трудная задача - построение пространства признаков и, в котором спра- ведлива rИIlотеза о разделимост:и плоскостыо для данных образов, уже выполнена. На праl{тике, однано, воснринимаемые рецепто- POI входные величины, не соответствуют информативным при- знакам образа, :и не rарантируют выIолненияя rипотезы разде- лимости плоскостью. Примером ПОПЫТОI-\ преодоления этой труд- ности является построение в 1958 r. (]). Розенблатом классифи- цирующей машиныI, названной им «перцеПТрОll» [153, 257-258]. 11 с р цеп т р он. Перцептрон (от percept.ion - восприятие) был задум:ан laI\ модель восприятип ивобрал-\ений систеl\'IОЙ зрения 1кивоrо орrапизма. Подобно тому, как зрительный образ вос- принимается по элеентам рецепторами сетчатки rлаза, в 293
перцептроне восприятие объеI{та осуществляотся I'РУППОЙ эло.мен- тов, называемых рецепторами (элементы rРУПIIЫ S на рис. 9-19). Каждый из рецепторов может находиться либо в возбужденном, либо в невозбужденном состоянии, но пространство рецепторов не удобно для построения разделяющих поверхностей и для ero преобразования в перцептрон введена вторая rруппа - ассоциа- тивные элементы (элементы rруппы А). Тан кан требуемый закон преобразования неизвестен, то связи между рецепторами и ассо- циативными элементами таRже неизвестны. Розенблат предлаrает перед началом работы перцептрона установить некоторую слу- чайную структуру связей, которая в дальнеЙlпем уже не изм:е- няется (если только в надежде улучшить работу перцептрона испытатель не пожелает сделать попытку перейти к друrой, taKi-Rе случайной структуре). Каждый И3 рецепторов может быть под- нлючен к данному А-элементу или со знаКОl\i плюс (возбуждаIО- щая связь) или со знаком минус (ТОРМО3Яlцая связь), или вообще не ПОДI{лючен. А -элемент работает как сум:м:атор с пороrом: он возбуждается, если сумма сиrналов, поступающих к нему от рецептора, превысит некоторый пороr. Выходы А-элементов через усилител:и с переменными Rоэффициентами Л i передаются n сумматор R. Значения л'i устанаВJJиваются в процессе обучения. Разобьем все рецепторы на две rруппы - возбуждаЮЩУIО и тормозную, в зависимости от знака связи с А-элементом. Если в первой rруппе l, а во второй т элементов, то внекоторый дис- кретнъrй момент п имеем l т (J t п ] == 2: Л 1i [п]X 1i [п] - 2: Л 2j t п ] X 2 j [пJ, i=l j=1 (9-8б) rде индексами 1 i от:мечены рецепторы первой, инден:сами 2j - второй rрупп. I-Ia выходе элемента R вырабатываются два сиr- нала: [ ] _,1, а[п]?О; Рl п -) О, а < О; ])2 [ п ] == 1 -- Рl [п ]. Сиrна.п Рl IIОJастся на рсцсIIторыI Л 1L , Р2 - на Л 2 ) и и3l\tIСНЯСТ их коэффициенты по закону: Лli [п] == Л 1i [п + 1] -- Л 1i [п] == (X 1i [п] -- k 1L Л 1i [п] Pl [п]); \ (9 -87) Л2j [п] == Л 2 j [п + 1] -- Л 2j [п] == (x 2 j [п] - k 2J Л 2j [п] Р2 [п]). J Обучение сводится к тому, что МЫ производим В моменты вр(\- мени t = 1, 2, ..., п показы перцептрону серии объектов данноrо образа. Перцептрон сам вырабатывает при этом сиrналы изм:е- нения л и, в KOHIe концов, если классификация удалась, после достаточно больwоrо чnсла пои азов начнет въrдавать при ПQсле- 294
дующем появлении одноrо 1\пасса объеI{ТОВ 1, друrоrо - О, ДЛ}L некоторых же объектов будет наблюдаться чередование единиц и нулей. Перцептрон далеко не всеrда в состоянии вырабатывать понятия или системы, которые совпадают с понятиями оператора. Это вполне понятно: при построении ero конструктор не знал точно, какой должна быть внутренняя структура машины, пы- тался воспроизвести в какой-то степени схему зрительноrо аппа- рата, хотя и она также не была ему известна во всех деталях, понадеялся на удачный случай (первоначальный выбор связей) и на то, что процесс обучения в какой-то мере выправит ошибки. Значительное место в процессе построения :машины (что довольно часто происходит, I{оrда используется подход «черноrо ящика») за- нимала «надежда на чудо». Перцептроны различных типов де- тально рассмотрены в [122, 258, 267, 268], их анализ дан в [21, 18, 44, 45]. В [21], в частности, рассмотрены способы определения возможности :классификации перцептроном при заданных струк- туре (значениях л i ), характере образа (вида функций х) и стати- стике показа (видом функции плотности вероятности появления объектов разных классов). Оказалось, возможности перцептрона довольно оrраничены. В [123] приведены примеры задач, оказав- шихся для перцептрона «трудными». При различении прямо- уrольников, вытянутых в rоризонтальном и вертикальном направ- лениях, после показа 15 фиrур в дальнейшем перцептрон при 30 испытаниях сделал 6 ошибок; при различении произвольно расположенных ОRружностей и треуrольников разных размеров число ошибок достиrло 33 %, при различении прямоуrольнuкоn и эллипсов число праnильных ответов было 50 %. Иными словами, первая задача решалась более или менее удовлетворительно, вторая - очень плохо, а в третьей перцептрон фактически не работал. По-видимому, успех в первой задаче в значительной мере объяснялся тем, что малые размеры растра дали возмож ность перцептрону запомнить почти все В03l\Iожные фраrменть фиrур, т. е. работа перцептрона приближалась к работе автомата «С полной памятью». В рассмотренных выше примерах для решения задачи распозна- вания использовались специально построенные для этой цели машины - «пандемониум» и перцептроны различных типов «<Марк 1» и др.). Были сделаны попытки построить и друrие типы машин ((Адалина», «Мадалина») [267, 268]. В настоящее вреl\tIЯ интерес к построению специализированных машин (в конечном итоrе мало эффективных) ослаб и значительно болыпе внимания уделяется построению различных проrрамм: распознавания для универсальных вычислительных машин. Рассмотрим некоторые из алrоритмов, на основе которых строятся таRие проrраммы. Метод случайных плоскостей [11,22]. Пред- олаrается, что построение пространства признаков выполнено 296
и что rипотеза разделимости образов в этом пространстве соблю- дается. При показе п.одряд двух точеI{, которые обучающий относит к разным образам, :машина, получив от иеrо эти указания, про- водит в пространстве признаков случайным образом произвольную разделяющую плоскость. При поназе каждой следующей точки машина не реаrирует на показ, если точка принадлежит 1\ тому же образу, что и предыдущая, и каждый раз проводит случайную раздеЛЯIОЩУЮ плоскость, }{оrда точка будет отнесена к друrому образу. -----..... ", ......... , , \ " ......, х 1 \ , \ '-'о \ , I \ , I { \. ,...-...: ' , ..... '\ , а) 6) ,----.... " ... I " . , '....... х 1 \ ......, " , \ \ '1 I . 1 , / х3, " , " '......' , " 02 ,,' \ , \ I " ) '.....-, , , , , I 1 , ' '\ ,. ,_.... ....--..-... ", ......, [J[ 2) '... \J(''''' " ,,' \ " ,," \ "..., "" \ " \ ,," . . !- '__- I _- : " '..._J.----- '............ , /- -,' ...'" п - ----; , : ......',' \ ,," I ...... I ,"\ / '" \ , 11 \ , , \ '....' \ш , Рис. 9-20. в конце процесса обучения в памяти :м:аПJИНЫ накапливается большое число раздеЛЯIОЩИХ плоскостей. Затем по определенному алrоритму из памяти машины стираIОТСЯ те части плоскостей, по обе стороны которых оказались одноименные точки. На рис. 9-20, а показана разделяющая плоскость /, проведенная между точками 1 и 2; на рис. 9-20, б добавлена ПЛОСI\ОСТЬ //, разделяю- щая точки 2 и 3; на рис. 9-20, в добавлена еще плоскость ///, ОТ- делившая точки 4 и 5 и плоскость /У, проведенная между точ- ками 5 и 6. На рис. 9-20, е ПОI{азаны прерывистыми линиями стертые части этих прямых. Оставшаясн ломаная линия принята за разделяющую поверхность. HaI{ видно, эта поверхность не сов- сем точно разделяет области, хотя вероятность правильной клас- сификации довольно высока. Удлинняя процесс обучения, точ- ность разделения можно повысить. М е т о Д п о т е н п; и а л ь н ы х Ф у н к Ц и й. При показе векоторой точки х, принадлеjч<аlЦСЙ образу Х (х Е Х), маПlина 296
строит поверхность, соответствующую некоторой функции, всюду положительной, Достиrающей максимума в данной точке и умень- mающейся при удалении от нее в любом направлении. Для всех показанных точек, принадлежащих одному образу, такие функ- ции строятся для каждой из точек и затем суммируются. В ре- зультате для каждоrо из двух образов получаются две потен- циальные поверхности, одна из которых имеет «rорб» над областью, принадлежащей первому образу, друrая - над областью вто- poro образа (рис. 9-21). При IIоказе новой точки сравниваются значения потенциальных функций, определяемых поверхностями 1 и 11, и точка относится к тому образу, для KOToporo значение потенциальной функции оказалось большим. Пусть cp (х) есть некоторая функция и пусть существует раз- деляющая поверхность, которая может быть выражена через функции CPi следующим образом: N 'i' (х) == 22 Ci<Pi (х), i=l (9-88) (т. е. 'Ф (х) разлаrается в конечный ряд по функциям ср). ВведеlVI в рассмотрение потенциальную функцию К (х, х*) == сх) = 22 Ji<Pi (х) <Pi (х*) , i=l (9-89) F(X 4 ,X2) --(- - 1" 1\ / I , \ , I ' I "- '....- Х2 -'" ............. -- -- Рис. 9-21. l"де х * - показываемая в процессе обучения точка. Функция К зависит от этой точки, как от параметра. Припишем этой функции знак +, если показанная ТОЧRа принадлежит об- разу А, и знак - , если она из образа В. Так, для точки х 1: если х 1 Е А} если х 1 ЕВ. -f К(х,х 1 ), К 1 (х) - t- к (х, V), (9-90) Если после r показов построен потенциал КТ (х), то для сле- дующей ТОЧRИ r + 1 имеем Кт (х), если Кт (X tT + 1 ») > О, и х(т+l) Е А; или если Кт (X(T+l») <О, и х(т+l) Е В; K T + 1 = КТ (х) + К (х, x(T+l», если КТ (х(т+l») < О и х(т+l) Е А; КТ (х) - К (х, X tT + 1 )), если Кт (X( Tr l») > О И х(1 Ll) Е В. (9-91) 297
Последние две строки соответствуют нарушению правила знаков, напри:м:ер r + 1-я точка оказалась из образа А, но потен- циальная функция для нее отрицательна. Это означает, что клас- сификация r + 1-й точки оказалась ошибочной. Ка}кдое изме- нение функции КТ (х) путем добавления или отнятия К (х, x(r + 1)) называется «исправлением ошибки». В конце обучения после по- каза N-й точки получаем функцию K N (х), которая и принимается за разделяющую поверхность. В [3, 4] доказана сходимость алrо- ритма за конечное число шаrов с любой наперед заданной точ- ностыо. Там же показано, что перцептрон «Марк !», построенный Розенблатом, реализует алrоритм потенциальных функций для 1'01'0 частноrо случая, коrда в качестве функций <Pi (х) прини- маются пороrовые функции и доказано, что перцептрон будет обучаться и в том случае, если вместо noporoBblx элементов будут установлены любые функциональные преобразователи, реализую- щие некоторую систему функций, по которой разлаrаются разде- ляющие функции. М е т о Д о б о б щ е н н о r о пор т р е т а. Метод обобщен- Horo портрета для обучения распознаванию образов подробно изложен в [25-28]. Пусть имеется множество объектов Н, распадающееся на n непересекающихся подмножеств Н 1 , Н 2 , ..., Н n . Объекты имеют однозначные отображения в пространстве рецепторов Х. П ро- странство Х представляет собой некоторое абстрактное про- странство, свойства KOToporo определяются видом: преобразова- пия характеристик объекта в векторы X, т. е. физичесними свой- ствами воспринимающеrо образ устройства (рецептора). Если существуют образы, соответствующие подмножестваltI Н 1 , ..., н n' то В общем случае разделяющая поверхность в пространстве Х (если она вообще существует) обычно слишком сложна. Поэтому подобно тому, как в предшествующих методах прибеrали к пост- роению «спрямляющеrо пространства», в котором разделяющими поверхностями являются rиперплоскости, в методе обобщенноrо портрета также прибеrают к построению вспомоrательноrо метри- ческоrо пространства Т так, чтобы каждому образу H i (или ero изображению x i в пространстве Х) можно было бы поставить в соответствие точку <Pi В пространстве Т так, чтобы выполнялись соотношения Р (!i<fJi) < Р (!j<fJi)' (9-92) rде fi - точка пространства Т, соответствующая ЭЛt:'менту образа H i ; !; - точка 1'01'0 же пространства, соответствующая образу H j ; Р (fi' <J>i) - расстояние точки f i от точки <Pi. Неравенство (9-92) можно трактовать так: расстояние между точ- кой <J>i И любой точной «постороннеrо» для точки CPi образа f j всеrда больше расстояния между точкой <Pi и Лlобой точкой «cBoero» обра- за f i . Если удалось построить пространство Т, обладающее отмечен- 298
ными свойствами, то точка (J)i называется обобщенным портретом образа H i . Неравенство (9-92) можно также записать: р (t i , <J>i) R i ; } Р (/i' ffJj) R j , (9-93) rде Rk=suPP(!h' СРп). Таким образом, если обобщенные портреты образов существуют, то для Toro чтобы точка fi в пространстве Т принадлежала к обра- зу H i , необходимо, чтобы она находилась внутри сферы с центром в точке (J)'i имеющей радиус R i . R k называется пороrом узнавания образа Н k. Попадание точки внутрь сферы является необходимым, но не достаточным условием для опознавания образа, так как из непере- секаемости образов еще не следует непересеRаемость сфер и в про- странстве Т MoryT быть области, принадлежащие неСКОЛЬRИМ сферам одновременно. Точки, находящиеся внутри этих областей, не MoryT быть опознаны неравенствами (9-93) и, в соответствии с определением, не будут принадлежать образу. В [25] процесс распознавания предложено подразделять на две разновидности: различение и узнавание образов. Различение соответствует случаю, коrда мы заведомо знаем, что изображение X i принадлежит одному из образов (например, если мы опознаем женское лицо, то в случае ПОRаза человеческоrо лица нам необ- ходимо лишь определить, к какому из двух образов оно отно- сится). Если же мы заранее не знаем, что объект принадлежит к одному из образов, процесс распознавания называется узнава- нием образа. В случае различения выполнения неравенств (9-93) (т. е. попа- дания 1'ОЧКИ внутрь одной И8 сфер) достаточно, чтобы установить образ. В случае узнавания, кроме этоrо, надо установить, при- надлежит ли данная точка вообще какой-либо из сфер и только ли ей. Вид пространства Т зависит от способа преобразования векто- ров Х в вектора f. В частности, если выбрать это преобразование так, что пространство Т будет представлять собою единичную сферу в rильбертовом ПРОС1'ранстве, то перавенства (9-93) перейдут в неравенства для скалярных произведений: (!it QJi) K i ; (/j, <J>i) < K i , (9-94) rде пороr узнавания K i определяется так: K i = inf (!i <J>i). Если все K i отличны ОТ нуля, то, обозвачив 1 si = K i <J'it 288
HepaBeHC1Ba (9-94) перепишем в следующим виде: (/i Si) 1 > (/j' Si) для всех i *- j, (9-95) (/i' si) > (/j, Si). (9-96) Последнее неравенство можно принять за условие различения образов. Ero удобно несколько преобразовать. Введем в рассмот- рение пороrовую функцию е[ (/, Si)] = y, откуда которая равна единице, если произведение (/, <Pi) превышает пороr K i , а (/, Si) > 1, т. е. если / принадлежит к образу H i , и равна нулю, если (/, <Pi) меньше этоrо nopora: ( ) { Опри z < 1 } е z - - 1 при Z 1. Верхний индекс при у указывает на индекс системы однород- ных образов, содержащих образ H i . Условие узнавания образа H i можно записать так: (9-98) N П У:= 1. i=l (9..99) Отсюда видно, что операция узнавания не заканчивается преодолением пороrа узнавания, а требует еще проверки выпол- нения условия (9-99). Таким образом, для распознавания образа нужно сличить описание показанноrо объекта со всеми обобщенными портретами однородных систем, хранящимися в памяти; выдать сиrнал о пре- одолении пороrа; в случае узнавания - проверить выполнение требования (9-99). Уравнение (/, (J)i) = к i' rде вектор <Pi фиксирован, есть уравнение rиперплоскости, пер- пендикулярной вектору (J)i. Это означает, что в евклидовом про- странстве метод обобщенноrо портрета сводит задачу к разделе- нию образов в пространстве rиперплоскостями. Заметим, что при практическом построении обобщенноrо порт- рета можно обойтись без точноrо отыскания преобразования про- странства Х на единичную сферу. Чтобы соблюдались условия (9-94), нужно стремиться к тому, чтобы скалярные произведения (/, ер) были тем больше, чем ближе число /, выражаемое кодом объекта к числу <р, выражаемому кодом обобщенноrо портрета ср. Такому свойству удовлеТВОрЯЮ1, например, бинарные коды объек- тов. Скалярное произведение двух бинарных кодов равно сумме попарных (поразрядных) произведений чисел этих кодов. Произве- дение двух одинаковых нодов равно сумме единиц, входящих 300
в этот код. Если объект будет незначительно отличаться от порт- рета, что отразится на изменении одной из цифр нода, то сналяр- ное произведение или сохранится (если один из нулей заменится единицей) или уменьшится (если единица за:м:енится нулем). Таким образом, при удалении объента от образа сналярное произведе- ние их кодов убывает. Чтобы метод обобщенноrо портрета дал эффентивные резуль- таты, надо стремиться нодировать объенты TaR, чтобы при не- больших их отличиях коды этих объентов также мало различались. Процедуру классификации по методу обобщенноrо портрета можно разделить на три основные этапа: 1) кодирование признаков показываемых объектов; 2) построение обобщенноrо портрета по данным показа; 3) классификация объектов путем сличения их кодов с кодом обобщенноrо портрета. Второй этап (построение обобщенноrо портрета), как правило, требует использования для обработки полученных при показе объектов данных на вычислительной машине. Первый и третий этап MoryT выполняться вручную. Это делает метод практически удобным для исполнителей, которые не имеют возможности при выполнении непосредственной классификации новых объектов 'пользоваться вычислительной техникой, например для врачей, стаВЯIIИХ диаrноз вдали от крупных центров, для rеОЛОl"о-развед- чинов, определяющих характер разведуемых пластов, для крими- налистов и т. д. Отправляясь на места, rде надлежит выполнять распознавание классов объектов, они берут с собой обобщенный портрет, вычисленный в центре, который имеет вид таблицы. Рассмотрим все упомянутые этапы распознавания. 1. К одироваnие об'Ъептов в процессе попааа. Для кодирования объектов в процессе их показа необходимо заранее установить признаки, существенные для классификации объектов. Если каI\ая-то часть информативных признаков известна, то эта часть кодируется. Но обычно информативные признаки неизвестны. Тоrда на основании знания свойств объектов или же интуиции устанавливаются леrко наблюдаемые, но не информативные при- знаки, о которых известно лишь то, что они с высокой степенью вероятности связаны со скрытыми от Hamero наблюдения инфор- мативными признаками. При этом мы, конечно, привносим элемент неопределенности, который в конечном итоrе будет приводить к ошибкам в результате классификации. Далее, коrда выбраны признаI\И для суждения об объекте, им приписываются тем или иным способом числа. Простейший способ кодирования, который обычно и используется, состоит в том, что мы приписываем единицу наличию признак а и нуль ero отсутствию, т. е. применяе:м: двоичную систему кодирования. Так, например, мы поступаем, кодируя объекты типа рукописных БУRН, 301
На рис. 9-22 показан способ кодирования рукописной буквы б. Область, в которой MoryT появиться элементы этой буквы, де- лится на квадраты (для простоты на рисунке не пронумерованы те части поля, в которые заведомо никакая часть буквы не попадет). Каждому квадрату приписывается номер, соответствующий раз- ряду дво:ичноrо числа, изображающему код объекта. Порядок разрядов (т. е. порядок нумерации при этом) выбирается произ- вольно. Число разрядов обычно выбирается интуитивно. 10ЖНО считать очевидным, что если число признаков (разрядов) выбрано слишком малым, то вероятность правильных ответов после окон- чания обучения будет весьма малой. Увеличение числа признаков сначала будет улучшать качество работы обу- чае:м:ой системы, но, по-видимому, уве- личение их числа свыше kakoro-то пороrа становится практически бес- полезным. По-видимому, это связано с тем, что при превышении HeKoToporo предела мы уже начинаем вводить в рассмотрение больше ложных, несу- щественных признаков, чем существен- ных, т. е. «засорять» информацию. Кро- ме Toro, увеличение числа признаков, т. е. увеличение размерности задачи, приводит к усложнению процедуры вычислений. В случае кодирования буквы далее Код:ОООООООООООIНООО1Н.... _ мы можем поступать следующим обра- зом: если в квадрат с номером К не Рис. 9-22. попала часть изобраiнения буквы (или же попавшая часть изображения зани- мает менее половины квадрата), то в п-м разряде числа записы- вается нуль, в противном случае - единица. В тех случаях, коrда признаки характеризуются непрерыв- ными функциями, например кодируется тоновое изображение или, скажем, в rеолоrоразведке используется такой признак, как электрическое сопротивление зонда, введенноrо в породу, при- беrают к квантованию характеристики признак а по уровню. Так, если сопротивление превышает некоторый nopor, то в k-M разряде записывается нуль, в противном случае - единица. Иноrда приходится разбивать диапазон изменения сопротивле- ния на несколько уровней и вводить соответственно несколько признаков для описания. В табл. 9-5 показаны примеры TaKoro кодирования. Если фи- зический параметр удовлетворяет неравенству (или друrому усло- вию), записанному в заrоловке столбца, то в соответствующей строке ставится единица; если не удовлетворяет - ставится нуль. 302
1 Класс - нефтеносные пласты Таблица 9-б t а <l) ф 'IS:tb CiS Ш t:= <l) :Q g ):S:: С C'iS <l) <l)t:r: :S: :»0 о = t::== C'jE-t E-tt:r: С О =e:t = = t:fc lS1 :S:t:r: Q E-t t:= t::t t::t <l) :с: <l) = <l) E-t<l) :s III == :а tc J1 Ct::( 0<:) ОФ С :aE-t .. р. = о , 04:= t::t t::( =Q 04 Ш(,) CiS \с :S: CIS == == == \с E-t E-t =0 фФ = OQ) (,) <l) ОС':) оС 00 CiS (,) C,) C,) ==S CiS m С,) .. ,... m (1)C\S CiS , , = 04 ==== .. = =t::( =- =E-t E-t <l)CiS :с: C== 1:1 (1) с ::с; C'iS t>(I) (,)= c,) CE-t tQ t:r r::: .. С,) =0 tx: E-t Q):S:C (1)(1) :S:C =\0 С,) (l)CiSCiS E-t "" =E-t == (1)::;;: с (1) =(1) = Q (1) 1::(,,- S" .. (l)t::( == C'iS = E-t=ro Q == Е-о CiS:a m g",, E-t:2!r::: == =-= о E-t o C'iS = (1) , О 1={ 1:1 t>= = С= :а CiSCiS ;e1!') 1!') ;e1!') O tx: O(l) g P-E-t CiS =b:: == =E-t =с.:> CIS :с: са m С'! C'iSC'iSt- са r::: о == о ::t:; C\S .. 00= E-too Ош Ош ::t:;=...i ::eto t:i::<::> u== j:Q Ot=t:: U - - - 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 - - - - - - - - - - - - - - - - - - - v') о о о У/ = = v У/ ф ф Q. v') Q. а- о S .. .. v') v') .. .. :а lS1 .. .. IVi v Л\ У/ V Л = о о о о о III с\1 са CIS У/ I Л л У/ Л Л У/ Л Л с\1 Q. Q. с':) с':) I 1 О 1 О О О О О О 1 О 1 О О О О 1 О О 2 О О О О 1 О О О 1 О О О О 1 О О О 1 3 О О 1 О О О 1 О О 1 О О О О 1 О О О 4 О 1 О О О О О 1 О О 1 О О О О 1 О О 5 О О О 1 О О О О 1 О О О О 1 О О О 1 6 О О О 1 О О О О О О О О О 1 О О О 1 7 О 1 О О О 1 О О О 1 О О О О 1 О О О 8 О О О О 1 О О О 1 О О О О 1 О О 1 О 9 1 О О О О О О 1 О О О О О 1 О О О 1 10 О 1 О О О О О 1 О О 1 О О О 1 О О О Таблица 9-5,6 11 класс - водоносные IIласты Ноды ом пласта 112'3\415\ I 7 ) 8 \ 9 \10 , 11 , 12 \ 13 \14 , 15 , 16 117 \ 18 6 1 О О 1 О О О О 1 О О О 1 О О О О 1 О 2 О 1 О О О О О О 1 О 1 О О О О .1 О О 3 1 О О О О О 1 О О О О 1 О О О О 1 О 4 1 О О О О 1 О О О 1 О О О О 1 О О О 5 1 О О О О 1 О О О 1 О О О О О 1 О О 6 О О О О 1 О О 1 О О О 1 О О О 1 О О 7 О 1 О О О 1 О О О 1 О О О О О О О О 8 1 О О О О О 1 О О О 1 О О О О О О О 9 О 1 О О О О 1 О О О 1 О О О О 1 О О 10 О О О 1 О О О 1 О 1 О О О О 1 О О О в результате описанной процедуры каждому из показанных объектов приписывается N-разрядное двоичное число, rде N - число признаков, т. е. сопоставляется точка в N-мериом про- странстве признаков. 303
Как отмечалось выше, при кодировании мы должны стремиться к тому, чтобы возможно лучше выполнялись условия (9-94), т. е. чтобы при малых деформациях объекта возможно меныпе из- менялось расположение единиц и нулей в коде. Это обстоятель- ство дает основание стремиться, например, располаrать буквы возможно наиболее одинаковым образом по отношению к коди- руемому полю, чтобы ослабить влияние ракурса, размера и т. п. И оставить признаки, характеризующие почерк. 2. Вьчuсленuе обобщенноео портрета. Вычисление обобщенноrо портрета - наиболее трудоемкая часть вычислительной процеду- ры, которая,!; как правило, требует использования вычислитель- ных машин. Лишь в очень редких случаях, коrда число призна- ков не более 3-4, эту процедуру в приемлемое время можно вы- полнить вручную. В [25] показано, что в случае существования образов их обоб- щенные портреты <Pi MoryT быть найдены следующим образом. Пусть при обучении было показано п объектов, из которых l оказались принадлежаЩИl\IИ к образу H i , а остальные п - l не принадлежащими к нему. Перенумеруем объекты так, что номера l == 1, 2, ..., l соответствуют объектам, относящимся к образу H i , а j = l + 1, l + 2, ..., п, не относящимся к этому образу. Тоrда существует вектор <Рн для KOToporo удовлетворяются условия (9-94): l n <Ро! = aiti + jfj' i=1 з=l+1 (9-10И) rде (Xi О, j о - постоянные весовые коэффициенты; f i - векторы объектов образа H i ; f j - векторы объектов, не принадле- жащие образу. Коэффициенты cx,i и j можно выбрать так, чтобы вектор CPi имел наименьшую длину. При этом nopor узнавания R i = min (!i' <Pi) fi будет иметь наибольшее значение. Знания cx,i и j, при которых выполняется это условие, MoryT быть найдены как координаты устойчивой особой точки следую- щей системы уравнений (при 8 О): [ l n J i =-ВUi+Fl K i - '2.(/11., fi)U k '2. (/11.' fi)k' k=1 h=l+l i = 1, 2, ..., l; d. [l n ] d/ = - 8j +F 2 K i - '2. (!k' !j) a k '2. (!k' !j) k , k=l h=l+l j = l + 1, l + 2, ..., п, (9-101) 304
функции же F 1 и F 2 определяются из условий: F 1 (z)=={ z, Z>O, о, z О, F ( ) - {Z, Z о, 2 Z - о, z > о. Решить эти уравнения можно на моделирующей установке, схема которой показана на рис. 9-23. На этой схеме скалярные а/ r--------., I > I ..1 L I I I I _______.J а 2 ----- .., 13 L + 1 r--------, , > L I ,--, L..______: L____ ------------------------ ___________________________J Рис. 9-23. произведения обозначены: k ij = (!i!j). Величина е определяет точность решения и выбирается настолько малой, чтобы ошибка, возникающая при е -:f: О, была соизмерима с прочими поrрешно- стями. Вычисление обобщенноrо портрета можно выполнять и на цифровой вычислительной машине. При этом после показа не- скольких объектов, принадлежащих данному образу, коорди- наты этих объектов записываются в блоке памяти. Затем вычи- сляется матрица 11 (!k' !i) 11 скалярных произведений векторов, с помощью которой находятся коэффициенты (l,i и З' так как они 305
cooTBeTcTByIOT точке равновесия, то их можно найти из системы da. d. уравнений (9-101) при d/ == d/ == о. После этоrо вычисляется обобщенный портрет по формуле (9-100). Портрет запоминается блоком памяти. Из числа векторов, предъявленных при обучении, исключаются из памяти те, которые вошли в обобщенный портрет с нулевыми коэффициентами. В по- следующей итерации проверяется, правильно ли опознается объект при «экзамене», т. е. предъявлении следующей обучающей последовательности. Векторы неправильно опознанных объектов вводятся в блок памяти с указанием:, принадлежит или не принад- лежит этот вектор R данному образу. Далее вычисляется расши- ренная м:атрица скалярных произведений с ВКЛIочением HOBoro вектора. Если же в памяти места нет, то один из ранее ВХОДИВIllИХ в обобщенный портрет векторов (лучше - входящий в Hero с наи- меньшим весом) ИСКЛIочается чтобы освободить место новом:у вектору, и вычисляется новый обобщенный портрет. Процедура др одолжается до тех пор, пока вероятность ошибки не снизится до заданной величины. Кроме обобщенпоrо портрета, для после- дующеrо узнавания образов надо знать пороr узнавания. Пороr вычисляется по формуле 1 К.= , V l n ai+ ; i=l ;=l+1 . Если требуется разделение объектов только на два образа, то удобно вычислить обобщенный портрет ер!: сначала для одпоrо образа, потом обобщенный портрет ер2 для друrоrо, и в результате принять за единый обобщенный портрет вектор ер!2 == ер! - ер2. Этот обобщенный портрет выдается в виде таблицы, состоящей из двух строк. В первую выписываются коэффициенты при коорди- нате X i образа ер!, а во второй - коэффициенты при X i образа ер2. Пороr узнавания для TaKoro обобщенноrо портрета равен нулю. 3. Опозпавапuе обрааов после обучепuя. В режиме узнавания получается код объекта, который прикладывается к таблице обоб- щенноrо портрета так, чтобы номера соответствующих столбцов (координат) портрета и таблицы совпадали. После этоrо вычис- ляется скалярное произведение: оно равно сумме попарных произ- ведений одинаковых координат объекта и портрета. Если эта сумма превыmает пороr, объект принадлежит к образу. Если имеется несколько образов, то скалярные произведения составляются для данноrо объекта с каждым из обобщенных порт- ретов. Объект считается принадлежащим R образу, если одно и только одно скалярное произведение превысит пороr. В против- ном случае объект считается не принадлежащим ни к одному из образов. 306
В том случае, коrда имеется только два образа и составлен обобщенный портрет <Р12 = <Р1 - ер2' поступают так. Если i-я координата объекта равна единице, то берется число из первой СТРОl{И i-ro столбца обобщенноrо портрета. Если i-я координата объекта равна нулю, то выписывается число И8 второй строки i-ro столбца портрета. Все выписанные числа складываются, и если их сумма оказывается больше нуля, то объект относят R об- разу epl, если меньше нуля - к образу <Р2. При м е р. Рассмотрим различение нефте- и водоносных пластов в reo- лоrоразведке. Пласт может быть или нефтеносным (образ <Рl)' или водоносным (образ <Р2). В табл. 9-6 в первой строке помещены номера ноординат, во вто- рой и третьей даны коэффициенты обобщенноrо портрета ОП <Р12' В четвер- той - код опознаваемоrо пласта. Таблица 9-6 м I I I\ООРДИ- 1 2 3 4 5 6 7 8 9 10 наты I +2 1-15 I <1'1 -6 +8 +4 -10 +3 +3 +5 -2 <1'2 -4 -2 -2 +1 +3 +2 -1 I -2 I -3 +1 1 1 О О 1 О 1 О О 1 Код пласта в первом столбце координата пласта равна единице. Верем цифру из строки <1'1' т. е. -6. Для BToporo столбца берем +8. Б третьем столбце коор- дината пласта нуль, берем цифру -2 из нижней строки ОП и т. д. Конеч- ный результат: -6 +8-2 + 1-15+2+3-2-3-2 =-16<0. Так как результат отрицателен, пласт принадлежит к образу «Р2' т. е. является водоносным. В [103] описана доступная для ручноrо счета процедура распознавания образов, несколько напоминающая процедуру метода обобщенноrо портрета и в ряде случаев показавшая вполне удовлетворительные результаты. В табл. 9-5, а показано, как формируются совокупности координат, обра- зующие коды нефтеносных пластов. При обучении показано десять пластов (этоrо для практических задач мало, так же как мало и число признаков. Уменьшенные цифры приведены лишь для наrлядности иллюстрации). В табл. 9-5, б помещены полученные аналоrичным способом коды водо- носных пластов. Для получения аналоrа обобщенноrо портрета (это не будет обобщенный портрет, так как при этом не обеспечивается минимизация длины вектора <Pi) сначала найдем вероятности появления единиц и нулей для каiкдоrо столбца таблицы с обучающей последовательностью. Так, в первом столбце табл. 9-5, а девять нулей и одна единица, поэтому, принимая частоту появления нуля за вероятность, получаем РОl = 0,9. Вероятность появления единицы Pll = 0,1. Для nepBoro столбца табл. 9-6, б соответ- ственно РО2 = 0,6, Р12 = 0,4. Строим новую табл. 9-7, в RОТОРОЙ в верхнюю строку записываем раз- ности R 01 == 19 РОl - 19 РО2 для каждоrо ив столбцов, а в нижнюю - раз- ности R 02 = 19 Рll - 19 Р1В. Так как 19 РОl = 19O,9 = 1,954, 19 РО2 = 19O,6 = == I778, то R 01 == 1,954-1,778 == 0,176; R 11 == - 0.602 и Т. д. При 307
Таблица 9-7 Коэффициенты для вычисления принадлежности пласта к 1 или 11 классу о 1 2 з 4 5 6 7 8 9 R R о +0,176 -0,064 О -0,051 -0,051 +0,109 +0,109 -0,067 -0,176 1 -0,602 +0,125 О +3,301 +0,301 -0,477 -0,477 +0,125 +0,602 :!i I I 10 11 12 13 14 15 1G 17 18 о R o +0,125 R 1 -0,301 о о +0,155 -10 о о -0,301 -0,301 о о I I +0,125 +0,051 -0,222 -0,301 -0,301 +10 расчетах принято 19 О = - 10 (не бесконечное, но достаточно большое отри- цательное число). Код опознаваемоrо пласта прикладывается к таблице так, чтобы СОВ- пали номера столбцов. Далее, из ряда R o табл. 9-7 выписываются числа, против которых в коде стоят нули, а из ряда R 1 - числа, против которых стоят единицы. Все выписанные числа складываются. Если их сумма оказа- лась больше нуля, то объект относится к классу Х}, если меньше - то к клас- су Х 2 . Таблица 9-8 J'Jt пласта Ноды 1 I 2 I 3 I 4 I 5 I 6 I 7 { 8 I 9 110 \11 112 113 114 115 116 \17 118 1 1 О О О О 1 О О О 1 О О О О О 1 О О 2 1 О О О О О О О 1 О О О О 1 О О О 1 3 О О О О 1 О О О 1 О 1 О О О О О 1 О 4 О 1 О О О О 1 О О О О О 1 О О О 1 О 5 О О О 1 О О О О О О О О О 1 О О О 1 6 О О 1 О О 1 О О О 1 О О О О О 1 О О в табл. 9-8 приведены пласты, показываемые при экзамене. Читателю предлаrается проверить, что коды 2, 3 и 5 относятся R нефтеносным пластам, а остальные - к водоносным. Если бы мы проверили предложенную процедуру на уже поRазанных объектах табл. 9-6, а и 9-6, б, то убедились бы, что алrоритм ошибается в пяти случаях из 20, т. е. дает 80% правильных ответов. Более совершенные про- цедуры позволяют повысить число правильных ответов. 9-7. Методы последовательных приближении в адаптации В [194] сделана весь:м:а интересная попытка дать обобщающую концепцию, позволяющую с единой точки зрения рассмотреть результаты и задачи теории адаптации, обучения и самообучения. Процессы обучения и адаптации можно трантовать, нан про- цессы последовательных приближений. 308
Мноrие экстремальные задачи СВОДЯТСЯ R отысканию экстрему... мов ФУНRЦИЙ или фУНRционалов мноrих переменных 1 :=: Q (С 1 , ..., CN):=: Q (с). (9-102) Оптимальное значение вектора с, при котором фУНКЦИЯ Q (с) достиrает экстремума, обозначим через с*. Если фУНКЦИЯ Q задана и дифференцируема, для отыскания с* можно приравнять нулю rрадиент функции Q: ПQ( )_{ aQ(C) aQ(C) }=O v с - д ' ..., д · Сl c N (9-103) При трудностях аналитическоrо решения уравнения (9-103) можно воспользоваться различными итерационными методами, в частности rрадиентным, в котором координаты текущей точки с [п] связываются с координатами предшествующей точки с [n -1] и rрадиентом V Q (с) посредством разностноrо уравнения вида с[п]=с[п-1]+'\'VQ(с[п-1]). (9-104) Вид функции определяет различные формы итерационных методов. Если l\Iетод сходится, то с течениеl\1 времени с [п] прибли- жается к оптимальному значению lim С [ п ] = с * . n--оо (9-105) Алrоритм (9-104), который можно назвать реrулярным алrо- ритмом, применим, если функция Q задана и является аналити- ческой. В случаях, коrда она не задана или недифференцируема, MOjHHO применить при