Автор: Алексеев А.А. Кораблев Ю.А. Шестопалов М.Ю.
Теги: общее машиностроение технология машиностроения машиноведение программирование программное обеспечение языки программирования издательство академия
ISBN: 978-5-7695-5708-8
Год: 2009
ВЫСШЕЕ ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАНИЕ
А.А.АЛЕКСЕЕВ, Ю.А. КОРАБЛЕВ, М. Ю. ШЕСТОПАЛОВ
ИДЕНТИФИКАЦИЯ
И ДИАГНОСТИКА СИСТЕМ
УЧЕБНИК
Рекомендовано
Учебно-методическим объединением по образованию
в области радиотехники, электроники, биомедицинской техники
и автоматизации в качестве учебника для студентов высших учебных заведений,
обучающихся по специальности «Управление и информатика
в технических системах»
Москва
Издательский центр
2009
ACADEMA
«Академия»
УДК 621(075.8)
ББК 34.4я73
А471
Рецензенты:
профессор Санкт-Петербургского государственного политехнического
университета, д-р техн, наук Ю. И. Гагарину
зав. кафедрой систем управления и информатики Санкт-Петербургского
государственного университета информационных технологий, механики
и оптики, профессор, д-р техн, наук В. В. Григорьев;
профессор кафедры управления и информатики Московского энергетического
института (технического университета), д-р техн, наук С. В. Егоров
Алексеев А. А.
А471 Идентификация и диагностика систем : учеб, для студ.
высш. учеб, заведений / А.А.Алексеев, Ю. А. Кораблев,
М. Ю. Шестопалов. — М.: Издательский центр «Академия»,
2009 - 352 с.
ISBN 978-5-7695-5708-8
Изложены способы нахождения статических характеристик объек-
тов управления по экспериментальным данным, в том числе с исполь-
зованием методов факторного эксперимента. Описаны эксперименталь-
ные методы исследования объектов управления при периодических и
апериодических тестовых воздействиях. Рассмотрен метод статистической
идентификации объектов на базе уравнения Винера—Хопфа. Приведе-
ны некоторые методы идентификации нелинейных объектов управле-
ния. Особое внимание уделено структуре типовой системы диагностики
и требованиям, предъявляемым к первичной диагностической инфор-
мации. Представлены методы выделения информативных диагностиче-
ских признаков, способы сжатия диагностической информации, подхо-
ды к построению систем диагностики, основанные на использовании
нечетких множеств.
Для студентов высших учебных заведений, обучающихся по специ-
альности «Управление и информатика в технических системах».
УДК 621(075.8)
ББК 34.4я73
Оригинал-макет данного издания является собственностью
Издательского центра «Академия», и его воспроизведение любым способом
без согласия правообладателя запрещается
© Алексеев А. А., Кораблев Ю. А., Шестопалов М.Ю., 2009
© Образовательно-издательский центр «Академия», 2009
ISBN 978-5-7695-5708-8 © Оформление. Издательский центр «Академия», 2009
ПРЕДИСЛОВИЕ
В настоящее время имеются отечественные и зарубежные изда-
ния по различным вопросам идентификации и диагностики сис-
тем, в том числе по теоретическим аспектам математического
описания технических объектов управления и оценки текущего
состояния диагностируемых систем управления. В большинстве сво-
ем эти издания посвящены безусловно важным, но частным воп-
росам. Кроме того, уровень и форма изложения материала в них
ориентированы, как правило, на инженеров и научных работни-
ков, решающих теоретические и практические проблемы иденти-
фикации и диагностики на этапе исследования и разработки со-
ответствующих систем управления. Учебные издания (в основном
внутривузовские) не охватывают многих вопросов курса дисцип-
лины «Идентификация и диагностика систем», входящей в соот-
ветствии с Государственным образовательным стандартом выс-
шего профессионального образования в состав федерального ком-
понента цикла специальных дисциплин для специальности «Уп-
равление и информатика в технических системах». Особенно это
касается вопросов, связанных с диагностикой систем. Предлагае-
мый вниманию читателей учебник позволит, надеемся, воспол-
нить этот пробел. Для понимания материала, изложенного в учеб-
нике, вполне достаточно знакомства с соответствующими разде-
лами высшей математики в объеме традиционной программы выс-
шего технического учебного заведения и знания основ теории ав-
томатического управления.
В основу учебника положены курсы лекций, разработанные
сотрудниками кафедры автоматики и процессов управления Санкт-
Петербургского государственного электротехнического универси-
тета «ЛЭТИ» им. В. И. Ульянова (Ленина), а также результаты на-
учных исследований, проведенных сотрудниками кафедры. Осо-
бый вклад в становление данной дисциплины на кафедре внесли
профессор А.И.Солодовников и профессор А. Ю. Дорогое, доцент
В. Г. Григорян и доцент А. М. Спиваковский, работы которых были
использованы при подготовке данного издания. Авторы призна-
тельны им, а также заведующему кафедрой профессору Н. Н. Кузь-
3
мину и профессору С. Е.Душину за большую помощь при обсуж-
дении содержании учебника и подготовке его к изданию.
Авторы считают приятным долгом выразить благодарность
М.Л. Колесниковой за нелегкий труд по оформлению рукописи.
Авторы признательны сотрудникам кафедры систем управле-
ния и информатики Санкт-Петербургского государственного уни-
верситета информационных технологий, механики и оптики (осо-
бенно заведующему кафедрой профессору В. В. Григорьеву), про-
фессору Санкт-Петербургского государственного политехнического
университета Ю. И. Гагарину, а также профессору Московского
энергетического института (технического университета) С. В. Его-
рову за рецензирование рукописи и весьма ценные замечания,
которые способствовали улучшению содержания учебника.
Надеемся, что данный учебник окажется полезным не только
студентам при изучении основ теории идентификации и диагнос-
тики технических систем, но и специалистам при обоснованном
выборе путей и методов решения проблем, возникающих при
формулировке математических моделей систем на этапе разработ-
ки и определения текущего и прогнозируемого состояния послед-
них.
Авторы будут благодарны всем за критические замечания и
предложения, которые будут учтены при переиздании книги.
ВВЕДЕНИЕ
К основным понятиям, используемым в естественных науках и
технике, относятся наблюдение и измерение. Опираясь именно на
наблюдение, исследователь строит физическую модель исследуе-
мого явления, которая затем используется при разработке теоре-
тических положений, описывающих данное явление. Результаты
дальнейших экспериментов могут либо подтвердить разработан-
ную теорию (и тем самым адекватность полученной модели изу-
чаемому явлению), либо потребовать провести коррекцию вида и
(или) параметров модели и, соответственно, разработанной на
ее основе теории.
Если рассматривать теорию как некоторое представление об
исследуемом явлении природы, то ее разработку можно назвать
построением модели в словесной или математической форме. В этом
смысле модель можно определить как изображение существенных
сторон исследуемой реальной системы, в удобной форме отража-
ющее информацию об этой системе. В этом определении под си-
стемой понимают совокупность упорядоченных объектов, для ко-
торой определены задачи (цели) ее функционирования. При этом
все, что не Входит в данную систему, рассматривается как вне-
шняя среда. Система в таком понимании характеризуется связями
между ее входами и выходами, причем их количество и вид зави-
сят от выбора границы между системой и средой. В технических
приложениях системой может быть, например, и электронное ус-
тройство, и химический процесс, для управления которым ис-
пользуется электронный блок. Системой является и летательный
аппарат, при функционировании которого, в частности, проте-
кают определенные физико-химические процессы, модельные
представления о которых используются для построения алгорит-
мов управления этим аппаратом.
Учитывая, что к процессам управления в современных техни-
ческих Системах предъявляют все более высокие требования, ис-
ключительно важной становится задача получения математиче-
ского описания этих систем, т. е. их идентификации. Задачу иден-
тификации можно рассматривать как дуальную по отношению к
5
задаче управления системой. Действительно, исследование и раз-
работка систем управления состоят из многократно повторяющихся
этапов анализа, математического описания объекта управления и
синтеза. Нельзя управлять системой, если она не идентифициро-
вана либо заранее, либо в процессе управления. Современная те-
ория управления располагает хорошо разработанными методами
анализа и синтеза. Предметом теории идентификации являются
методы определения математических моделей объектов (здесь и
далее под термином «объект» будем понимать как непосредствен-
но объект управления, так и систему управления в целом) по
результатам теоретических и экспериментальных исследований. Эти
методы являются достаточно универсальными, так как, несмотря
на то что идентификация объектов, в которых процессы имеют
электрический, механический или химический характер, имеет
свою специфику, связанную с аппаратурной реализацией, прак-
тические задачи идентификации в основном одинаковы для всех
этих процессов.
В зависимости от объема априорной информации об иденти-
фицируемой системе управления различают задачи идентифика-
ции в широком и узком смысле. При решении задач идентифика-
ции в широком смысле априорная информация о системе прак-
тически отсутствует и поэтому в процессе ее идентификации при-
ходится решать такие задачи, как выбор вида и структуры матема-
тической модели, определение класса модели (линейность, ста-
ционарность, распределенность параметров и т.п.). Очевидно, что
методы идентификации в широком смысле являются достаточно
сложными и поэтому вопросы теории и практики такой иденти-
фикации являются предметом специальной литературы.
При решении задачи идентификации в узком смысле априор-
ная информация достаточно обширна, по крайней мере, класс,
вид и структура модели, которые адекватны идентифицируемой
системе, считаются известными. Следует отметить, что именно
такая постановка задачи идентификации нашла наиболее широ-
кое применение на практике, при этом используются методы,
основанные на разных подходах к форме задания идентификаци-
онных моделей (дифференциальные или разностные уравнения,
передаточные функции, переходные функции и т.п.). Повышение
эксплуатационной надежности функционирования современных
сложных технических систем и необходимость предупреждения
возникновения в них аварийных ситуаций предполагают решение
задачи оценки текущего состояния таких систем и прогнозирова-
ния его изменения во времени.
Наиболее эффективными методами оценки неизвестного со-
стояния технических систем различной физической природы яв-
ляются методы технической диагностики. Основными задачами
технической диагностики являются распознавание состояния си-
6
стемы, определение причин нарушения ее работоспособности,
установление вида и места дефекта, а также прогнозирование его
изменения.
Основой для решения этих задач являются теоретические раз-
работки, направленные на выявление закономерностей и харак-
тера связей между фактическим состоянием диагностируемого
объекта и некоторыми измеряемыми параметрами. Сложность этой
проблемы заключается в том, что оценку текущего состояния си-
стемы обычно производят по результатам косвенных измерений,
которые, как правило, имеют не детерминированную, а стоха-
стическую связь с неизвестным состоянием.
Общей рекомендацией многообразных методов технической
диагностики, позволяющей в какой-либо мере упростить эту за-
дачу, является, во-первых, ориентация на использование более
рационального размещения источников первичной информации
в целях повышения коррелированности ее изменения с появле-
нием в контролируемом объекте дефектов; во-вторых, успешное
решение диагностических задач в значительной мере обусловлено
правильным построением диагностических моделей, удачным
выбором информативных диагностических признаков. И в этой
связи можно отметить следующее обстоятельство. При диагности-
ровании состояния технических систем находят достаточно ши-
рокое применение традиционные типы математических моделей,
которые являются предметом изучения теории идентификации и
используются при анализе и синтезе технических систем управле-
ния. Основное свойство этих моделей, как известно, — отражение
динамики поведения таких систем. В то же время главной целью
исследования при решении диагностических задач является опре-
деление текущих значений параметров модели системы, сравне-
ние их с «эталонными» значениями, отнесение текущего состоя-
ния контролируемой системы к одному из заранее определенных
классов, прогнозирование будущих состояний объекта диагно-
стирования. Именно поэтому при диагностике систем более эф-
фективным может оказаться использование специфических мате-
матических моделей, которые характеризуют текущее состояние
системы более информативными параметрами, что и позволяет
решать задачу классификации состояния с большей степенью до-
стоверности. При этом вполне естественно, что наибольшую цен-
ность имеют высокочувствительные модели, позволяющие выяв-
лять неисправности и повреждения на самой ранней стадии их
зарождения, что в свою очередь дает возможность заблаговремен-
но предсказать появление предаварийной ситуации.
Особое место в диагностической практике занимают способы
контроля состояния технических систем, использующие в каче-
стве первичной информации колебательные процессы, возника-
ющие в диагностируемой системе под воздействием тестовых сиг-
7
налов или сопровождающие режим нормального функциониро-
вания многих машин и механизмов. Это объясняется двумя факто-
рами: большой информативностью таких процессов и достаточ-
ной развитостью математического аппарата обработки сигналов,
позволяющего получать эффективные и чувствительные диагно-
стические признаки. Колебательные процессы, распространяющи-
еся по конструкции машин и механизмов, традиционно называ-
ются вибрационными или вибропроцессами. Именно поэтому мето-
ды, в основе которых лежит использование параметров вибро-
процессов при формировании диагностических признаков, обра-
зуют отдельное научное направление технической диагностики —
вибродиагностику, которая находит в последнее время широкое
распространение на практике.
Прогресс вычислительной техники позволил применять для
построения математических моделей и вычисления информатив-
ных признаков не только во многом традиционные спектрально-
корреляционные, но и специально разработанные методы, ис-
пользующие современные достижения в области математическо-
го описания процессов и позволяющие более эффективно решать
задачи идентификации и диагностики. Кроме того, развитие средств
микропроцессорной техники предопределило возможность полу-
чения первичной информации и ее обработки в реальном време-
ни, что существенно расширило сферу практического примене-
ния теории идентификации и диагностики.
Анализ методов идентификации объектов управления и спосо-
бов оценки их текущего состояния обусловлен тесной взаимосвя-
зью задач идентификации и диагностики, поскольку идентифи-
кация является составной частью диагностики. При этом нужно
отметить, что методы решения этих задач в значительной степени
зависят от класса, к которому можно отнести идентифицируемый
(диагностируемый) объект.
Во-первых, различают объекты линейные и нелинейные, причем
линейные объекты, естественно, легче идентифицировать, по-
скольку они обладают свойствами суперпозиции. Во-вторых, раз-
личают объекты стационарные и нестационарные, при этом объек-
ты можно считать стационарными, если их параметры меняются
медленно по сравнению со временем, которое требуется для точ-
ной идентификации. В третьих, объекты часто подразделяют на
дискретные и непрерывные, хотя преобразование непрерывной фор-
мулировки задачи в дискретную форму обычно не вызывает прин-
ципиальных затруднений. В-четвертых, различают методы иден-
тификации для объектов с одним или несколькими входными воз-
действиями. Это деление целесообразно, поскольку методы иден-
тификации значительно упрощаются, если на объект подается лишь
одно входное воздействие, по сравнению со случаем, когда на
объект действует одновременно комбинация нескольких возму-
8
щений или входных воздействий. В-пятых, предусмотрена возмож-
ность идентификации детерминированных или стохастических про-
цессов, протекающих в объекте. При идентификации последних
ориентируются в основном на вероятностные представления о со-
стоянии объекта. Заметим, что на практике результаты измерений
обычно «засорены» шумом и процесс идентификации включает в
себя фильтрацию (сглаживание) сигналов.
В основе перечисленных способов классификации объектов —
степень сложности их идентификации. Некоторые методы иден-
тификации применимы только к одному виду, другие — к боль-
шему числу видов объектов. Конечно, методы идентификации,
основанные на использовании очень небольшой априорной ин-
формации, являются наиболее общими. Но эти методы, как пра-
вило, обладают меньшей точностью и скоростью сходимости при
большей математической сложности по сравнению с методами,
использующими больший объем априорной информации.
Глава 1
ОБЩИЕ ПРИНЦИПЫ ПОСТРОЕНИЯ МАТЕМАТИЧЕСКИХ
МОДЕЛЕЙ ОБЪЕКТОВ И СИСТЕМ УПРАВЛЕНИЯ
1.1. Основные понятия
При изучении любых объектов (технических систем, процес-
сов, явлений) одной из основных задач является построение их
моделей. Как результат познания модель представляет собой ото-
бражение в той или иной форме свойств, закономерностей, фи-
зических и других характеристик, присущих исследуемому объек-
ту. Характер модели определяется поставленными целями и может
быть различным в зависимости от ее назначения. Емкость понятия
модели можно пояснить несколькими замечаниями.
1. Модель не является описанием фактического устройства си-
стемы, а всего лишь ее имитацией, отражая существенные свой-
ства, «подражая» поведению моделируемой системы. Например,
можно сконструировать манипулятор, имитирующий работу че-
ловеческой руки, построив для этого соответствующую модель,
которая будет отражать только внешние функции работы челове-
ческой конечности (движение «вперед—назад», «вверх—вниз»,
захват предмета, его удержание с регулируемым усилием и т.п.).
2. Используемые в науке модели подразделяют на концептуаль-
ные (феноменологические), физические (эмпирические) и мате-
матические (аналитические). Использование модели того или иного
вида определяется тем, какая сторона явления в данном случае
наиболее существенна, методами, которые можно использовать
при построении модели, количеством и качеством имеющейся
информации. Это можно пояснить на примере использования раз-
личных моделей в небесной механике. Птолемеевская модель не-
бесной механики представляла собой достаточно адекватную кон-
цептуальную модель для наблюдений за движением планет. Мо-
дель Коперника, в которой наблюдаемые процессы предстают как
результат сложения движения Земли (наблюдателя) и наблюдае-
мой планеты, можно считать физической моделью. Законы Кеп-
лера образуют математическую модель, которая обеспечивает ко-
личественное предсказание.
3. Модель представляет упрощенное отражение действительно-
сти. Относительная простота является одной из существенных черт
модели; если модель слишком сложна, ее полезность становится
10
сомнительной. Во многих случаях для того чтобы модель была по-
лезной, ее сложность должна находиться в определенном соотно-
шении со сложностью описываемого объекта.
- Основной задачей системного анализа является определение
выходного сигнала системы по известному входному сигналу и
характеристикам системы. Задача, когда по заданным входным и
выходным сигналам требуется определить вид и параметры мате-
матической модели, описывающей поведение системы, является
обратной задачей системного анализа. Таким образом, идентифи-
кация объектов управления по своей сути относится именно к
такому типу задач.
Следуя Л. Заде, при идентификации происходит «определение
по входу и выходу системы из определенного класса систем, ко-
торой испытываемая система эквивалентна», т.е. при идентифи-
кации необходимо определить класс систем S = {5}, класс вход-
ных сигналов U= {U} и понятие «эквивалентности». В этой форму-
лировке «испытываемая система» есть объект, а элементы S явля-
ются моделями. Эквивалентность Е обычно понимают в смысле
какого-либо критерия ошибки или функции потерь, являющейся
функционалом от выхода объекта у и выхода модели уы:
Е=Е(у,уи).
Две модели Mt и М2 будут эквивалентны, если значения функ-
ций потерь для этих моделей будут одинаковы.
При исследованиях и разработках технических систем исполь-
зуют модельные представления и описания, которые можно раз-
делить на две группы: символические (словесные описания, схе-
мы, чертежи, математические уравнения и т.д.) и вещественные
(макеты, разного рода физические аналоги и электронные моде-
лирующие устройства, имитирующие процессы в объектах).
К математическим моделям, широко применяемым в теории
автоматического управления и входящим в класс символических
моделей, относится такое математическое описание, которое аде-
кватно отражает как статические, так и динамические связи меж-
ду входными и выходными величинами объекта. Математическая
модель может быть получена либо аналитическим путем (когда
закономерности протекающих в объекте процессов полностью
известны), либо по результатам экспериментального исследова-
ния входных и выходных переменных объекта, при этом весьма
часто без изучения его физической сущности. Последний подход
особенно широко используется на практике, так как позволяет
обойтись минимумом априорных сведений об объекте при по-
строении его модели.
Для управления объектом необходимо иметь модель в виде ма-
тематического описания, устанавливающего связь между входны-
ми и выходными переменными в форме, на основе которой мо-
11
жет быть выбран закон управления, обеспечивающий задан-
ное функционирование объекта. Получаемое описание должно
давать правило преобразования воздействия на объект и в реак-
цию объекта у. Переменные и и у могут представлять собой функции
одинаковых или разных аргументов. Преобразование одной функ-
ции в другую производится оператором, который определяет со-
вокупность математических или логических операций, устанавли-
вающих соответствие между ними:
y(z) = Л{и(/)}.
В качестве примера можно назвать операторы дифференциро-
вания, интегрирования и т.д. Для стационарных линейных одно-
мерных объектов оператор может быть задан при помощи диффе-
ренциального уравнения или системы дифференциальных урав-
нений первого порядка, интегральной свертки, частотной харак-
теристики (передаточной функции) объекта.
Модели, описываемые с помощью операторов, классифици-
руют согласно схеме, приведенной на рис. 1.1. На практике объек-
ты стремятся описывать линейными стационарными моделями,
хотя в действительности все объекты в той или иной мере облада-
ют свойствами нелинейности, нестационарности, распределен-
ности и стохастичности. Использование более простых операто-
ров следует рассматривать как попытку аппроксимации характе-
ристик сложного объекта упрощенным приближенным описани-
ем, удобным для дальнейших расчетов. Перечисленные описания
могут быть заданы различным образом: аналитически, таблично,
в виде разложения по какой-либо системе функций и т.д.
Рис. 1.1. Классификация моделей объектов управления по операторам их
описания
12
Рис. 1.2. Структурная схема решения
задачи управления объектом
Проиллюстрируем использование моделей при решении задач
управления объектами (рис. 1.2). После формулировки целей уп-
равления необходимо выделить объект управления из среды, т.е.
определить границы объекта и установить его взаимодействие со
средой. Последнее характеризуют моделью возмущений. Далее орга-
низуется структура и проводится идентификация параметров мо-
дели объекта. В процедуре синтеза управления, являющейся опти-
мизационной задачей, модель объекта выступает как ограничение.
С помощью же модели возмущений можно оценить некоторые ка-
чественные показатели управления.
При решении задачи управления сложным объектом часто не
удается получить описание, имеющее приемлемую точность. В этом
случае используют ансамбль моделей, каждая из которых описыва-
ет отдельные стороны процесса. С упрощением моделей ослабляют-
ся и цели управления (например, в неопределенной ситуации ста-
вится задача нахождения разумной стратегии управления без жест-
ких качественных показателей). Часто такие модели реализуют как
совокупность программ, имитирующих работу объекта и ориенти-
рованных на использование электронно-вычислительной техники.
1.2. Общая характеристика методов идентификации
Наиболее достоверную математическую модель объекта можно
найти аналитическим путем. Для этого необходимо располагать
всесторонними сведениями об объекте (конструкции, законах,
описывающих протекающие в нем процессы, условиях функцио-
нирования и взаимодействии со средой). Однако часто из-за от-
13
сугствия достаточных данных получить решение задачи таким пу-
тем не удается. Трудности применения аналитических методов
возникают и при описании реальных объектов, процессы в кото-
рых имеют сложный характер. Поэтому в подобных случаях эти
методы дополняют экспериментальными исследованиями. Преиму-
ществом моделей, полученных теоретическим путем, как прави-
ло, является их достаточно общий вид, позволяющий рассматри-
вать поведение объектов в различных возможных режимах.
С практической точки зрения более привлекательны экспери-
ментальные методы, позволяющие находить модели объектов по
результатам измерения их входных и выходных величин. Хотя эти
методы также предполагают наличие априорных сведений об изу-
чаемом объекте, характер последних может быть не столь обстоя-
тельным. Как правило, уровень априорных сведений должен быть
достаточным лишь для выбора структуры модели и условий про-
ведения эксперимента. Построение моделей объектов на основе
такого подхода обычно и называют идентификацией.
В общем случае под идентификацией понимают определение
структуры и параметров математической модели, которые обес-
печивают наилучшую близость выходных величин модели и объекта
в смысле заданного критерия при совпадающих входных воздей-
ствиях.
К выбору метода идентификации нельзя подойти однозначно,
поскольку в самой постановке задачи заранее предполагается нео-
пределенность (неполнота знаний об объекте, ограничения в на-
блюдениях объекта во времени, неточность измерения сигналов
на входе и выходе объекта и т.п.).
Комплекс задач идентификации модели объекта обычно вклю-
чает три этапа. На первом этапе выбирают структуру модели по
результатам изучения объекта или имеющимся априорным сведе-
ниям (структурная идентификация), на втором — критерий подо-
бия (близости) модели и объекта, на третьем — по эксперимен-
тальным данным определяют параметры модели исходя из вы-
бранного критерия (параметрическая идентификация). Следует за-
метить, что вследствие большой сложности этап структурной иден-
тификации часто сводят в значительной мере к эвристическому
заданию структуры модели, опираясь на априорные данные об
объекте. Очевидно, что в таких случаях эффективность последу-
ющей параметрической идентификации во многом определяется
тем, насколько удачно была выбрана структура модели.
Для решения задач параметрической идентификации разрабо-
тано большое число методов, учитывающих особенности объек-
тов, условия их функционирования, способ тестирования и мате-
матическую основу анализа экспериментальных данных, вид по-
лучаемых моделей и т. п. Эти методы можно характеризовать раз-
личными признаками, основные из которых рассмотрим ниже.
14
1. По способу тестирования исследуемого объекта методы иден-
тификации делятся на активные и пассивные. Применение ак-
тивных методов предполагает подачу на вход объекта специально
сформированных воздействий — детерминированных или случай-
ного характера. Среди активных методов идентификации широкое
распространение получили частотные методы, основанные на из-
мерении установившихся выходных сигналов исследуемого объек-
та, вызванных гармоническим входным воздействием. Для иден-
тификации линейных объектов используют и другие периодиче-
ские воздействия (прямоугольные, треугольные), а также апери-
одические воздействия в виде ступенчатых, импульсных и других
сигналов. В качестве случайных тестовых сигналов особенно широ-
ко применяют псевдослучайные двоичные последовательности,
что объясняется простотой их получения и удобством обработки с
помощью средств вычислительной техники. Достоинство актив-
ной идентификации заключается в «нежесткости» требований к
априорным данным об объекте. Основываясь на методах планиро-
вания эксперимента, такую идентификацию можно осуществлять
целенаправленно, что позволяет ускорять выявление закономер-
ностей в зависимостях между переменными объекта и сокращать
тем самым временные и материальные затраты на его испытания.
При использовании пассивных методов идентификации объект
находится в условиях нормального функционирования. При этом
параметры модели находят по результатам статистической обра-
ботки наблюдений естественных изменений величин на входе и
выходе объекта. При пассивной идентификации применяют такие
статистические методы обработки данных измерений, как корре-
ляционный и регрессионный анализ, стохастическую аппрокси-
мацию и др. Преимущество пассивных методов состоит в том, что
для их применения достаточно регистрировать переменные толь-
ко в режимах рабочего функционирования объекта. Это особенно
важно при идентификации реальных промышленных процессов с
непрерывным производством дорогостоящего продукта. С другой
стороны, пассивные методы идентификации сопряжены со зна-
чительными затратами времени на накопление и обработку ин-
формации. Кроме того, их применение возможно лишь в том слу-
чае, если воздействие на входе объекта обладает достаточно ши-
роким частотным спектром (по крайней мере не меньшим, чем
полоса частот, в пределах которой необходимо оценить динами-
ческую характеристику объекта). Снижение точности идентифи-
кации, обусловленное последней причиной, можно существенно
уменьшить добавлением к естественному входному воздействию
объекта специально сформированного случайного сигнала неболь-
шого уровня с заданными статистическими характеристиками. В этом
случае ослабляется также и влияние обычно действующих на объект
неконтролируемых помех.
15
2. При идентификации объектов применяют как детерминиро-
ванные, так и статистические методы обработки данных наблю-
дений, что определяется характером анализируемых сигналов. Де-
терминированные методы могут быть использованы только при
активной идентификации в случае, когда сигналы на входе и вы-
ходе объекта имеют детерминированную форму. Однако в реаль-
ных условиях из-за сильного влияния помех такие сигналы зачас-
тую сильно зашумлены. Требуемая точность анализа здесь может
быть достигнута дополнением детерминированных алгоритмов об-
работки статистическим усреднением (сглаживанием) получае-
мых результатов. Очевидно, что для этого необходимы более дли-
тельные испытания объекта в целях накопления данных.
3. По временным затратам методы идентификации подразделя-
ют на оперативные и ретроспективные. При оперативной иденти-
фикации обеспечивается отслеживание меняющихся параметров
объекта. В этих целях применяют рекуррентные алгоритмы обра-
ботки данных, которые удается реализовать аппаратными сред-
ствами в темпе, близком к скорости протекания процессов в изу-
чаемом объекте. Методы ретроспективной идентификации значи-
тельно упрощают условия решения задачи идентификации. В этом
случае можно многократно обращаться к накопленным экспери-
ментальным данным и подбирать наиболее эффективные алго-
ритмы их анализа.
4. Методы идентификации часто различают также по их при-
способленности к исследованию динамических объектов того или
иного класса. Важной особенностью при идентификации являет-
ся наличие или отсутствие процедур сравнения получаемой мо-
дели с объектом. Это определяет соответственно две возможные
структуры построения систем идентификации, а именно прове-
дение идентификации либо по разомкнутой, либо по замкнутой
схемам.
Результатом решения задачи идентификации является матема-
тическая модель, представленная во временной или частотной об-
ласти. При этом полученная модель адекватна объекту по поведе-
нию, т. е. по динамическим свойствам, в соответствии с выбранным
при идентификации критерием подобия.
1. 3. Особенности идентификации как оптимизационной
задачи
Широкий спектр задач идентификации обусловливает соответ-
ственно большое разнообразие приемов и алгоритмов, применяе-
мых для их решения. Однако практически все эти алгоритмы и их
использование в процедурах идентификации имеют некоторую
общую специфику, на которую важно обратить внимание.
16
Во-первых, при исследованиях объектов управления в целях
поиска их математического описания, как правило, применяют
стандартные алгоритмы. Их необходимо хорошо понимать, чтобы
правильно поставить задачу, подготовить исходные данные, вы-
брать параметры. Необходимость такого понимания существа ал-
горитма связана с тем, что целесообразно хотя бы на качествен-
ном уровне прогнозировать результат, а после проведения экспе-
риментов и соответствующих вычислений либо принять получен-
ный результат, либо повторить эксперимент и (или) обработку
полученных данных, проведя необходимую коррекцию.
При использовании алгоритмов идентификации объектов уп-
равления следует иметь в виду, что в большинстве случаев их по-
строение основано на учете начальных представлений об исследу-
емом объекте, т.е. априорной информации. Однако априорная ин-
формация может быть частично или даже полностью ошибочной,
что может при очередном шаге реализации используемого алго-
ритма идентификации не только не улучшить, а даже ухудшить
результат.
Получаемая вследствии проведения эксперимента «послеопыт-
ная» — апостериорная информация обычно представляет некоторую
выборку (массивы, составленные из значений сигналов, измерен-
ных на входе и выходе объекта), характер и вид которой достаточ-
но разнообразны. Это может быть представление о структуре опера-
тора изучаемого объекта, частотной характеристике сигналов и
объекта, функции распределения случайных величин и т. п.
В качестве примера можно привести алгоритмы сглаживания,
регуляризации и подобные им, основанные на представлении о
том, что обрабатываемый сигнал (например, экспериментальная
переходная функция) состоит из низкочастотной полезной со-
ставляющей и высокочастотного шума. На рис. 1.3, а приведены
Рис. 1.3. Сглаживание экспериментальных характеристик:
а — спектральные плотности полезного сигнала (7) и шума (2) (пунктирной
линией показана частотная характеристика фильтра); б — погрешность результата
фильтрации
17
спектральные плотности полезного сигнала и шума. В соответствии
с этим представлением улучшить соотношение «сигнал: шум» мож-
но, применив алгоритм, действие которого аналогично действию
фильтра нижних частот. Частотная характеристика фильтра на гра-
фике показана пунктирной линией. Из рис. 1.3, б видно, что по-
грешность результата Д зависит от частоты среза фильтра <вф (уве-
личение погрешности на частотах соф < ©J связано с тем, что
отфильтровывается полезная часть сигнала). В каждом фильтрую-
щем алгоритме имеется параметр, аналогичный а>ф: при усредне-
нии скользящим интервалом таким параметром является величи-
на интервала Т (или количество отсчетов на интервале усредне-
ния N), при регуляризации — параметр регуляризации. Очень ва-
жен вид зависимости, показанной на рис. 1.3, б. Ее характер явля-
ется универсальным для фильтрующих алгоритмов. В расчете вели-
чину Д непосредственно оценить не удается, однако имеются кос-
венные признаки (степень сглаживания), по которым можно скор-
ректировать значение параметра.
Часто вместо термина «априорная информация» используется
более точный для данного случая термин «гипотеза». Действитель-
но, при решении задачи идентификации исследование состоит в
том, что выдвигается гипотеза, подбирается соответствующая ей
процедура и затем проверяется результат (рис. 1.4). Например, из
приведенных выше рассуждений кроме высказанного предполо-
жения о спектрах сигнала и помехи неявно предполагается, что
помеха является аддитивной, причем случайный процесс при-
числяется к определенному классу (стационарному, нормально-
му и т.д.).
Безусловно, априорная информация играет важную роль, но
при этом заметим, что соотношение априорной и апостериорной
информаций в алгоритмах различно. Целесообразно уяснить это
соотношение для того, чтобы представлять возможности и риск
использования сомнительных представлений.
Важным моментом в исследованиях является формализация
постановки задачи. В теории управления и особенно в области, свя-
занной с поиском математической модели объекта управления,
наиболее часто используют прием, состоящий в том, что задача
Рис. 1.4. Алгоритм процесса познания при идентификации объектов уп-
равления
18
Рис. 1.5. Формирование процесса иден-
тификации
формулируется как оптимизационная в рамках триады, в которой
получение удовлетворительного решения может потребовать не-
скольких итераций с корректировкой структуры и (или) измене-
нием критерия (рис. 1.5). Первые две составляющие триады —
выбор структуры и критерия — являются неформальными, но,
естественно, реализуются с учетом априорной информации. Пос-
ле выбора структуры оператора, описывающего объект, и крите-
рия, определяющего смысл оптимального выбора параметров этой
структуры по экспериментальным данным, осуществляется пере-
ход к третьей составляющей — поиску параметров математиче-
ской модели. Этот этап является формализованной процедурой,
которая состоит в применении того или иного метода численного
определения параметров, что можно трактовать как задачу на-
хождения экстремума функции многих переменных, возможно, с
ограничениями (рис. 1.6):
/(P)->extr. (1.1)
р
В рамках такого подхода задачу идентификации можно рассмат-
ривать как задачу аппроксимации экспериментальных данных ди-
намическим оператором выбранной структуры по выбранному кри-
терию. При решении задачи (1.1) возможно использование гео-
метрической интерпретации, полагая, что критерий J(P) пред-
ставляет некоторую гиперповерхность в пространстве параметров р,
для нахождения экстремума на которой могут быть использованы
различные методы поиска, такие как покоординатный, градиен-
Рис. 1.6. Вид оптимизируемого критерия
идентификации
19
тный, случайный и др. При таком представлении различные труд-
ности, возникающие в процессе идентификации, можно пред-
ставить в виде геометрической интерпретации. Например, сопо-
ставить сложность функции J(P) со сложностью топологии ги-
перповерхности, оценить трудность реализации численного алго-
ритма с учетом особенностей поверхности (наличие локальных
экстремумов, седел, оврагов, желобов и т.д.). Описанный прием
может оказаться полезным для многих задач, так как открывает
путь к типизации их постановки.
Особо следует обратить внимание на проблему, связанную с
точностью решения задачи идентификации. Дело в том, что по-
следняя относится к классу так называемых обратных задач и ча-
сто оказывается «некорректной» (подробнее см. подразд. 4.4), что
приводит при ее решении к многократному увеличению погреш-
ности получаемых результатов по сравнению с ошибками в ис-
ходных данных. Уровень ошибок в исходной информации зависит
от многих факторов (характера сигналов, наличия помех в изме-
ряемых сигналах, ограниченности выборок и т.д.) и трудно под-
дается оценке. Однако, если задача сведена к решению системы
линейных уравнений (или, что эквивалентно, к поиску экстрему-
ма на поверхности второго порядка), то степень вычислительной
устойчивости можно оценить количественно, используя меру обу-
словленности соответствующей системы линейных уравнений. Су-
ществует несколько способов определения меры обусловленно-
сти. Одной из достаточно широко применяемых характеристик яв-
ляется приведенная ниже мера обусловленности Адамара.
Представим систему линейных уравнений в виде
Ах = Ь,
где х, Ь — векторы размера (их 1); А — матрица (и хи).
Если обозначить векторы-столбцы матрицы А соответственно
аь а2, ..., а„, то можно записать
а^! + а2х2 +... + а„х„ = Ь,
откуда следует, что вектор b представляет собой линейную ком-
бинацию векторов а, с весами х,. Набор векторов а, является бази-
сом, в котором находят проекции вектора Ь. Если вектор Ь извес-
тен неточно, то он может быть представлен в виде Ь + ДЬ. В этом
случае его проекции будут определены с ошибкой х,- + Дх,-. Если
вектор b является ортогональным базисом, он является наилуч-
шим в том смысле, что его применение не приводит к существен-
ному увеличению погрешности, т. е. величины Дх, будут того же
порядка, что и ДЬ.
Эта особенность и характеризуется мерой обусловленности Ада-
мара (Л/д):
20
0<МА =—<1.
п / п
П
1=1 V/=i
По существу мера обусловленности Адамара представляет со-
бой отношение объемов многомерного параллелограмма, постро-
енного на векторах-столбцах матрицы А, к объему многомерного
параллелепипеда, построенного на тех же векторах, и является
мерой ортогональности векторов-столбцов матрицы А. При Мк = 1
все векторы-столбцы ортогональны; при Л/А = 0 — принадлежат
подпространству, размерность которого меньше, чем п (при ДА =
= 0, rank А < п, матрица будет вырожденной). Заметим, что обыч-
но при расчете на ЭВМ значения 0,001 < Л/А < 1 считаются вполне
приемлемыми.
Приведенные представления распространяются и на функцио-
нальные пространства и являются предметом обобщенной спект-
ральной теории. Описание характеристик с помощью ортогональ-
ных базисов имеет ряд преимуществ, так как позволяет получить
процедуры, которые обладают хорошей сходимостью и дают ре-
шения с достаточной точностью.
1. 4. Структурная идентификация объекта управления
Структурной идентификацией называют процесс определения
структуры оператора модели F. Напомним, что оператором преоб-
разователя (объекта или модели) принято называть алгоритм транс-
формации функции в функцию. В простейшем вырожденном слу-
чае оператор превращается в обычную функцию. С точки зрения
объектов идентификации оператор, как правило, характеризует
динамические свойства, а функция — статические. Далее под струк-
турой модели будем понимать вид оператора с точностью до его
коэффициентов. При этом, вообще говоря, структура объекта
может и не совпадать со структурой модели. Например, во многих
случаях стохастические свойства объекта обычно не отражаются в
модели (модель выбирается детерминированной), а лишь опреде-
ляют выбор метода идентификации ее параметров. Кроме того,
модель может заведомо иметь меньше входов и выходов, чем иден-
тифицируемый объект. К этому часто прибегают в случае малого
объема наблюдений.
Рассмотрим в качестве примера некоторые виды структур мо-
делей объектов. Так, любой одномерный статический непрерыв-
ный объект определяется функцией у = Fq(x). Модель этого объек-
та можно представить в виде разложения
21
к
F(x) = ±С^(х)
1=1
по определенной системе функций
Ф(х) = [<Р1 (х),. ф*(х)].
Здесь структура модели задана системой функций Ф(х) и чис-
лом к, а ее параметрами являются коэффициенты разложения
сь ..., ск. Структурная идентификация такого объекта заключается
в отыскании удовлетворительной системы функций Ф(х), а пара-
метрическая — сводится к определению этих параметров при вы-
бранной системе функций.
Другим примером является динамический одномерный линей-
ный объект, который удобно описывать оператором
др* + с2рк-1 +... + скр + ск+1
Р + ск+2р‘ + ... + Ck+iP + ск+м
где р = — оператор дифференцирования; к<1 — структурные
параметры объекта.
В этом случае структура оператора объекта определяется ли-
нейностью уравнения и числами км I.
В то же время модель этого объекта может иметь другой поря-
док:
F С\рт +... + Ст+{
рп +... + ст+п+\'
где структурные параметры т и п могут значительно отличаться
от соответствующих параметров к и I объекта, не говоря уже о
коэффициентах д.
В данном случае выбор структуры модели, т. е. ее структурных
параметров т и п, определяется целями, в которых строится эта
модель, т.е. целями управления. А для удовлетворения последних
часто вполне достаточно иметь простую модель, выбирая т < к,
п < /.
В более общей форме модель динамического детерминирован-
ного нелинейного непрерывного одномерного объекта может быть
представлена в виде разложения по системе операторов
к
F(x) = £C^(x),
1=1
где Fj(x) — система нелинейных операторов, определение кото-
рой является основной целью структурной идентификации.
22
Описание чисел С,- составляет задачу параметрической иденти-
фикации.
При решении задачи структурной идентификации необходимо
выполнить следующие операции:
• выделение объекта из среды;
• ранжирование входов и выходов объекта по степени их влия-
ния на выполнение целей управления в объекте;
• определение рационального числа входов и выходов объекта,
учитываемых в модели;
• определение характера связи между входом и выходом моде-
ли объекта, т.е. определение вида оператора F, иначе говоря, оп-
ределение структуры модели.
Остановимся вначале на операции выделения объекта из среды,
которая, как обычно утверждается, полностью определяется це-
лями и алгоритмом управления этим объектом. При этом необхо-
димо отметить, что цель по отношению к управлению имеет внеш-
ний характер, она формулируется на более высоком иерархиче-
ском уровне и выражает требования этого уровня, предъявляемые
к объекту управления. Однако формулировка цели управления не
может быть не связана с представлениями об объекте, в котором
предстоит реализовать эту цель, что в свою очередь предполагает
наличие какой-то априорной информации об объекте, включая
приближенную модель объекта, обычно используемую на этапе
выделения объекта из среды [21].
Пусть цель управления Т формулируется в виде множества со-
стояний Т = {У*}, которые должны быть достигнуты в процессе
управления. Какую именно цель Y* е {У*} необходимо будет реа-
лизовать в определенный момент времени, определит верхний уро-
вень управления. Это означает, что управляющее воздействие U в
этот момент должно быть таким, чтобы состояние объекта У со-
впало с заданным целевым, т.е. у___>у*.
Однако всякое управляющее воздействие U ограничено опре-
деленным ресурсом R. Пусть {U}R — ресурсное множество воздей-
ствий, которым располагает управление, т.е. Ug {U}R.
Таким образом, для определения объекта необходимо знать
множество целей {У*} и имеющихся управляющих воздействий
{U}R.
Рассмотрим далее операцию выделения объекта из среды как
последовательный переход от простейших форм объекта к более
сложным. При этом простейшей формой объекта будет такая ми-
нимальная часть среды, которая несет информацию, необходи-
мую для проверки выполнимости поставленной цели. Эта мини-
мальная часть F показана на рис. 1.7, причем У= F(X, U).
Если этот объект и среда Xтаковы, что для любой цели У* е {У*}
и любого состояния среды X е {А"} (множество {АГ} возможных
23
Объект
F
---1---
__J Устройство L
I управления [—
Рис. 1.7. Блок-схема процедуры оцен-
ки выполнимости целей управления
состояний среды Xдолжно быть определено) всегда найдется уп-
равление U* е {U}«такое, что
Y* = F(X, (Г), (1.2)
то этот объект удовлетворяет целям управления и процесс его
определения можно считать законченным.
В случае если ресурса R не хватает для обслуживания всех целей
ввиду того, что среда X при этом слишком сильно изменяется,
приходится расширять рамки объекта, включая в него ту часть
среды, которой можно управлять. Так как воздействие среды X в
значительной степени формируется каким-то определенным эле-
ментом среды, то естественно попытаться присоединить этот эле-
мент к объекту и управлять им, с тем чтобы изменить в нужную
сторону X. Это расширение объекта показано на рис. 1.8, где F—
«старый» объект (см. рис. 1.7); F' — присоединенный к объекту
элемент среды; Х= X' + X", где X' — воздействие на Feo стороны
F'; X" и X" — воздействия среды на F и F'; U' — канал управле-
ния новым элементом F', т.е. X = F'(X'", U').
В данном случае объектом является комплекс из двух элемен-
тов (F + F').
Как легко заметить, возможности достижения цели здесь рас-
ширены за счет частичного управления входом X. Действительно,
условие (1.2) теперь принимает вид
У = F(X’, X", U) = F(F'(X"', U'), X", U),
где появилось дополнительное управление U', с помощью кото-
рого вроде бы можно теперь достигнуть любой цели Y* из {У*}. На
I 1—Ч-———-4—-J
h и,1—>—J и
11 -----1-----
I L _^1 Устройство
1--Ч управления г
Рис. 1.8. Структурная схема присо-
единения части среды к объекту
24
самом деле, это достижение может и не быть реализовано. Все
дело в том, насколько эффективно управление элементом F'. При
этом также не следует забывать, что ресурс R управления расхо-
дуется теперь на два управляющих воздействия, а поэтому воз-
можности каждого из них уменьшаются.
В качестве примера рассмотрим систему терморегулирования
термостата. Вполне очевидно, что термостат может не справиться
с поддержанием температуры на строго заданном уровне, если
резко изменится температура среды. Такой объект управления ес-
тественно расширить, включив в управление стабилизацию тем-
пературы среды, в которой находится термостат, как обычно и
поступают.
Если проведенное расширение объекта не удовлетворяет це-
лям управления, следует воздействовать на X" или X'", т.е. далее
расширять объект.
При этом вполне очевидно, что для любого множества задан-
ных целей {К*} описанный процесс расширения объекта может
либо закончиться на каком-то шаге, либо никогда не завершить-
ся. В первом случае получаем объект управления, во втором —
констатируем, что поставленная цель T={Y*} недостижима вооб-
ще, т. е. сформулирована ошибочно без учета возможностей объек-
та и среды. Такую цель нужно либо менять, либо увеличить ре-
сурс R.
Таким образом, процесс расширения объекта при его выделе-
нии из среды должен подчиняться следующему принципу: следу-
ет присоединять к объекту лишь те элементы среды, которые воз-
действуют на реализацию цели и которыми можно эффективно
управлять для достижения этой цели.
Необходимо обратить также внимание на следующее. Формаль-
ная реализация описанной процедуры выделения объекта возможна
лишь в том случае, если для каждого варианта выделения объекта
идентификация проводится до конца, т. е. до составления полной
модели объекта. Но для этого необходимо провести все необходи-
мые измерения входных и выходных сигналов д ля выбранной струк-
туры модели, что влечет за собой значительные временные и ма-
териальные затраты. Поэтому на стадии структурной идентифика-
ции широко пользуются имеющейся априорной информацией и
экспертным опросом, по результатам которого и принимают ре-
шение о структуре объекта, его взаимоотношениях со средой,
возможным состоянием среды и т.д.
Следующим этапом структурной идентификации является ран-
жирование входов и выходов объекта. Структуру модели представ-
ляют в виде многополюсника и при ее создании необходимо оп-
ределить, какие именно входы и выходы объекта будут включены
в модель. Для этого прежде всего определяют все возможные вхо-
ды и выходы, а затем из них выделяют наиболее существенные,
25
которые и образуют многополюсник модели л х т. К существен-
ным входам и выходам относят те воздействия, которые оказыва-
ют наибольшее влияние на осуществление целей управления в
объекте, а значит и в его модели. Выбор таких входов и выходов с
учетом того факта, что модели объекта еще не существует, обыч-
но проводится путем их соответствующего ранжирования мето-
дом экспертных оценок.
При проведении процедуры ранжирования различают два вида
входных переменных — воздействие среды X и управления U и
выход Y.
Формирование вектора X = (хь ..., хл) происходит путем отбо-
ра только тех входов хь ..., х„, состояние которых влияет на реа-
лизацию цели в объекте, а также с учетом того, что состояние
каждого входа х, должно надежно и с необходимой точностью
контролироваться, т. е. измеряться.
Для того чтобы определить входы, которые войдут в модель,
необходимо провести ранжирование отобранных входов по степе-
ни их влияния на реализацию цели управления в объекте. Для
этого каждому входу х, (/ - 1, ..., л) следует поставить в соответ-
ствие некоторое целое число £, — его ранг: х, -> кь где единичный
ранг (kj =1) имеет вход(ы), влияющий(е) наибольшим образом
на реализацию цели в объекте. Второй ранг (kj = 2) и следующие
имеют вход(ы), влияющий(е) не столь существенно. Таким обра-
зом, индексы при рангах определяют номер ранжированного вхо-
да от первого до л-го.
Расположив входы в порядке возрастания их рангов х(|, х,2,... х,п,
где индекс /, равен номеру входа с рангом j, получаем ранжиро-
ванный ряд. На основании экспертных оценок, учитывающих осо-
бенности среды объекта Fo, цели управления и возможных спосо-
бов ее достижения, в состав модели включают q входов, имеющих
первые q рангов, т. е. входы с номерами от i\ до iq.
Аналогичной процедуре ранжирования подвергают и входы
управления U = (мь ..., ир). Ранжирование этих входов проводится
с учетом степени их влияния на достижение целей управления и
простоту организации изменения этих входов. Этот последний
фактор управляемости является весьма важным, так как при от-
боре входов управления необходимо согласовать желание управ-
лять каким-то определенным входом с имеющимися возможно-
стями.
В процессе ранжирования каждому входу управления Uj(J= 1,...,
р) экспертно ставят в соответствие ранг kj (целое число в интерва-
ле [1, />]): Uj -ь kj, причем единичный ранг соответствует самому
существенному и легко изменяемому входу управления, а самому
несущественному и трудноизменяемому приписывают ранг р.
Выходы объекта также должны быть проранжированы, и здесь
критерием может служить количество информации о реализации
26
целей управления в объекте, которое несет данный выход. Также
на основании экспертных оценок получают соотношения
yz -► kz (z = 1, tri),
где kz — ранг выхода уг.
Что касается самой процедуры получения экспертных оценок,
то она может быть реализована с использованием, например,
широко практикуемых методов непосредственного ранжирования
или парных сравнений.
Таким образом, описанным выше способом получают ранжи-
рованные последовательности всех «претендентов» на входы и вы-
ходы модели:
X], х2,..., х„,
щ, и2,..., ир,
У1> У2, Ут-
(1.3)
В системе (1.3) факторы {х}, {и}, {у} в последовательностях рас-
положены в порядке предпочтения и для удобства проведена ну-
мерация ранжированных ранее факторов таким образом, чтобы
их номер стал равен рангу, т.е. i = к,.
Следующим этапом получения структурной модели является
выбор рациональных чисел п*, р*, т*, характеризующих модель, т.е.
размерность ее входов и выходов.
Целесообразно начинать этот выбор с минимального числа
входов и выходов ль pi, т\, например с простейшей модели,
приняв Л] = 0, pi = mi = 1. В результате получим модель Ft, опреде-
ляющую связь Y= Ft(X, U) и характеризующуюся тройкой чисел:
7=1 =(льА,л11).
Вторая модель F2 - (л2, р2, может быть выбрана из трех воз-
можных вариантов усложненной модели, получаемых введением
имеющего очередной ранг фактора из ранжированных последова-
тельностей (1.3):
F2' = (fli +1, Р1,Л!1),
f2=(ri, Pi +l,"»i),
f2= (tii, Pi, +1).
(1.4)
Используя экспертные оценки по заранее установленным кри-
териям вариантов, представленных в (1.4), проводят выбор моде-
ли, получившей наиболее высокий ранг, в качестве возможной
модели F2.
Аналогично (/ + 1)-ю модель Fi+i определяют ранжированием
полученных из Ft троек:
27
Fm = («, +1 Pi, т^,
Fm = (»,, Pi +1. «,)»
Fm = («,, Pt, mt +1).
Таким образом, получают последовательность моделей объек-
та Fx, F2, Fi, расположенных в порядке их уточнения и услож-
нения. Из этого ряда (также экспертным путем) выбирают пред-
почтительную модель Fz = (nz, pz, mz), которая и будет идентифи-
цироваться, т.е. числами, характеризующими выбранную модель,
будут:
п* = nz, р* = pz, т* = mz.
Определив входы и выходы модели, далее необходимо опреде-
лить вид оператора выбранной модели. В процессе нахождения
оператора модели исходят из того, что динамический объект труд-
нее идентифицировать, чем статический, стохастический — труд-
нее детерминированного, нелинейный — сложнее линейного и
т.д. Учитывая эти трудности, при выборе оператора можно пред-
намеренно, по возможности, упростить оператор модели. Так, по-
ведение заведомо динамического объекта можно описывать ста-
тической моделью, если динамика объекта не слишком ярко вы-
ражена; нелинейный объект можно аппроксимировать линейным.
Разумеется, при этом нужно иметь в виду, что эффективность
управления, построенного на основе такой модели, может быть
ниже по сравнению с системой управления, в основу которой
была положена более сложная модель. Если это снижение невели-
ко, а выигрыш в идентификации значителен, такой выбор следу-
ет считать оптимальным.
Пусть, например, простой динамический объект описывается
дифференциальным уравнением вида
^Д + с*у(/) = х(/).
си
Если параметр с* > 0 велик или x(f) изменяется достаточно
медленно, этот объект вполне удовлетворительно можно опреде-
лить статической моделью вида
y(t) = exit).
Поведение моделируемого объекта в общем случае, как уже
отмечалось выше, описывается многомерной функцией многих
переменных Y = F0(X). Априорные сведения о характере поведе-
ния объекта или о виде функции Fo могут быть различными по
28
объему и содержанию. Трансформация этих сведений в определен-
ную функцию F(X, С) с неизвестными параметрами С = (с,, ск)
и составляет предмет структурной идентификации. При этом в за-
висимости от объема априорных сведений могут быть предложены
различные процедуры конкретизации вида функции F.
1.5. Аналитическое составление математических моделей
Если известно конструктивное устройство объекта управления,
зная физические законы протекающих в нем процессов, матема-
тическую модель объекта можно найти аналитическим путем. При
аналитическом составлении математической модели в зависимо-
сти от вида объекта обычно используют уравнения материального
и энергетического баланса, принципы подобия, законы Кирхго-
фа и т.д. Приступая к составлению модели, необходимо вначале
ознакомиться с объектом, изучить документацию, процессы, про-
текающие в объекте, определить рабочую точку и область, в кото-
рой могут меняться переменные. Кроме того, целесообразно оп-
ределить характеристики исполнительных устройств, через кото-
рые на объект подаются управляющие воздействия, и параметры
контрольно-измерительных приборов, служащих для наблюдения
за процессом.
Методику аналитического составления математических моде-
лей проиллюстрируем на примере.
Рассмотрим резервуар (рис. 1.9, а); переменные qu q2 обозна-
чают расход жидкости, f\,f2 — проходные сечения вентилей.
Для составления модели необходимо определить, какие пере-
менные будут характеризовать управление объектом, внешнее воз-
мущение и состояние объекта. В данном простом примере объект
содержит только один накопитель (накапливается вещество), по-
этому в качестве переменной состояния можно выбрать коорди-
Рис. 1.9. Резервуар с жидкостью как объект управления (а) и семейство
статических характеристик (б) этого объекта
29
нату h. Управляющие и возмущающие координаты определяют из
практических соображений, связанных с конкретным включени-
ем объекта в систему, а также связью системы с внешней средой.
Допустим, что/; является управляющей координатой, a q2 харак-
теризует возмущение.
После выбора координат необходимо определить статические
характеристики исследуемого объекта, т. е. зависимости, связыва-
ющие координаты в установившемся режиме, когда производные
всех переменных в системе равны нулю. Для этого в рассматрива-
емом случае целесообразно воспользоваться законом гидравлики
Бернулли:
q = Hfj2gh,
где ц — коэффициент, характеризующий гидравлическое сопро-
тивление и зависящий от вязкости жидкости, геометрии трубо-
провода, шероховатости поверхности труб и т.д.
Для выходного патрубка можно записать
Qi = Pfifigh,
однако в статике qx = q2, поэтому
Q\ =<12 =Ц/1л/2«Л- (1.5)
Уравнение (1.5) связывает все четыре координаты и позволяет
получить три однопараметрических семейства характеристик: по уп-
равлению, возмущению и регулировочную функцию (рис. 1.9, б),
определяемых формулами:
h = С1//12, h = c2q2, fi = c3q2,
ci = d/(2p2g), c2 = (2gp2/,2) ', c3 = (m/2gA) '.
Как видно из рис. 1.9, б, полученные статические характерис-
тики являются нелинейными. Они могут быть использованы, на-
пример, для выбора рабочей точки или оценки соотношения между
переменными в различных режимах.
На следующем этапе определяют уравнение динамического ре-
жима. Здесь может быть использован метод «замороженных коор-
динат», где при составлении дифференциального уравнения ко-
ординаты, зависящие от времени, а именно A(f), счи-
тают постоянными (замороженными) на время di. Используя та-
кой подход, уравнение динамического режима можно записать в
виде
q2(t)dt = Fdh + qi(t)dt, (1.7)
где F — площадь сечения резервуара.
30
Из уравнения (1.7) следует, что количество жидкости, посту-
пившей в резервуар за время dr, уравновешивается изменением
количества жидкости в резервуаре и количеством жидкости, вы-
текающей из резервуара, т.е. выражение (1.7) является уравнени-
ем материального баланса. Разделив выражение (1.7) на dt и под-
ставив qx(t) из (1.5) (последнее справедливо для мгновенных зна-
чений), получим дифференциальное уравнение, описывающее
поведение исследуемого объекта:
F^ + filiyl2gh=q2-
dt
Это уравнение нелинейно, однако если объект работает при
малых отклонениях от положения равновесия (обычно так рабо-
тают системы стабилизации), его можно линеаризовать. Перепи-
шем для удобства уравнение в виде
+ q2 = ф(Л, fi, q2).
После линеаризации способом малых приращений перемен-
ных имеем
F — + kxh = k2fi+k3q2,
а/
(1.8)
где
*,=£
ЭЛ
о ч/1
= -Hy[2gh^, к3 = ^-
о ^2
о
Полученное уравнение описывает объект в окрестности рабо-
чей точки (/10, ^2о> h0), которая становится началом координат
отсчета переменных.
Необходимо обратить внимание на ряд обстоятельств. Обычно
описание объекта не удается завершить аналитически, так как зна-
чения некоторых параметров приходится определять эксперимен-
тально. В рассматриваемом примере к таким параметрам относит-
ся коэффициент ц. Вообще говоря, зная динамические характери-
стики, можно получить статические характеристики. Однако не-
зависимое определение статических характеристик связано с тем,
что не всегда удается построить полное динамическое описание.
В большинстве случаев приходится иметь дело с нелинейными ста-
тическими и линеаризованными динамическими уравнениями.
Вид математического описания объекта в значительной степе-
ни зависит от принятой системы координат. Так, если можно было
31
бы вместо fi(t) принять в качестве управляющей координату ^(/),
то уравнение (1.7), описывающее динамику объекта, было бы ли-
нейным.
Заметим также, что полученная математическая модель нужда-
ется в проверке на адекватность. В данном случае для проверки
можно использовать экспериментально полученную переходную
функцию, параметры которой легко сопоставить с параметрами
уравнения (1.8). Однако на практике подобная задача может ока-
заться достаточно сложной и потребовать специального техниче-
ского обеспечения и подготовительной работы.
Даже в простом рассмотренном примере получено несколько
моделей (статическая, нелинейная, динамическая, линеаризован-
ная). Для сложных объектов число возможных и необходимых мо-
делей увеличивается, в первую очередь за счет все более подроб-
ного учета нелинейных, распределенных, стохастических свойств
реального объекта. В общем случае приходится искать компромисс
между, с одной стороны, сложным и точным и, с другой сторо-
ны, простым и грубым описаниями. Выбор определяется конк-
ретной целью идентификации.
Темы для повторения
1. Место и роль идентификации объектов управления в теории авто-
матического управления.
2. Основные требования, предъявляемые к модели, являющейся це-
лью идентификации объектов управления.
3. Этапы, которые включает комплекс задач идентификации объек-
тов управления.
4. Достоинства и недостатки методов активной и пассивной иденти-
фикации объектов управления.
5. Значение априорной и апостериорной информации при решении
задач идентификации объектов управления.
6. Основные операции, выполняемые при решении задачи структур-
ной идентификации объектов управления.
7. Особенности использования аналитических методов при решении
задач идентификации объектов управления.
Глава 2
МЕТОДЫ ИДЕНТИФИКАЦИИ СТАТИЧЕСКИХ
ХАРАКТЕРИСТИК ОБЪЕКТОВ УПРАВЛЕНИЯ
2.1. Метод наименьших квадратов
Статические характеристики определяют связь между входом
и выходом объекта управления в равновесном режиме, т.е. в та-
ком состоянии, при котором все производные от координат объекта
равны нулю. Как правило, статические характеристики объектов
описываются нелинейными функциями и поэтому кроме спосо-
бов получения этих характеристик во многих случаях актуальна их
линеаризация.
. В случае активной идентификации входная координата х(/) при-
равнивается постоянной величине и ей соотносится математиче-
ское ожидание выходной координаты у(0, которую необходимо
измерять только после окончания свободного движения в иденти-
фицируемом объекте. В этом простом случае точность определения
статической характеристики ограничена временем наблюдения,
т.е. точностью определения математического ожидания М{у(1)},
при этом обычно предполагают, что математическое ожидание
M{n(t)} = 0 («(/) — помеха, приведенная к выходу объекта).
При определении статических характеристик на объекте, на-
ходящемся в режиме нормальной эксплуатации, т.е. когда на вхо-
де и выходе объекта координаты представляют в общем случае
случайные величины, а введение тестовых воздействий недопус-
тимо, зависимость между координатами объекта задается набо-
ром величин х и у путем их измерения в определенные моменты
времени, при этом на плоскости у - f(x) каждой паре (х, у)
будет соответствовать точка. На рис. 2.1 показано поле корреля-
Рис. 2.1. Поле корреляции между экспери-
ментальными значениями координат на вхо-
де и выходе объекта
33
ции, полученное в результате такой операции. Достаточно боль-
шой разброс точек обусловлен наличием помех, неучтенной ди-
намикой объекта, ошибками измерения и т.д. Полученное поле
корреляции можно использовать для построения регрессионной
модели объекта. При этом если принять, что полными вероятно-
стными характеристиками сигналов х и у являются плотности
вероятности ф(х) и <р(у), то для решения поставленной задачи
необходимо найти оператор, устанавливающий соответствие между
этими функциями:
ф(у) = Л{ф(х)}.
В общем случае плотность вероятности <р(у) может быть опре-
делена из соотношения
<р(х/у)
где <р(у, х) — совместный закон распределения случайных вели-
чин хи у, а <р(х/у) — условная плотность вероятности х относи-
тельно у.
Если принять, что объект и входной процесс стационарны, то
справедливо соотношение
ф(у/х) =
ф(У,х)
ф(х)
В этом случае оператор объекта задается интегральным уравне-
нием
ф(у) = J ф(У, = J Ф(у/х)ф(х)(1х. (2.1)
По известной условной плотности вероятности и фактической
плотности вероятности входной переменной ф(х) может быть оп-
ределена характеристика ф(у). Таким образом, для определения
общей вероятностной характеристики объекта необходимо решить
интегральное уравнение (2.1) относительно ф(у/х).
Один из путей решения (2.1) заключается в построении по
результатам измерения х и у корреляционной таблицы, из кото-
рой получают эмпирические законы распределения величин х и у.
По этим данным можно получить эмпирическую условную плот-
ность вероятности.
Для построения эмпирических зависимостей области задания
координат хи у разбивают на интервалы (рис. 2.2). В каждой клетке
записывают частоту совместного появления событий v(yp х,). Если
34
Рис. 2.2. Разбиение поля корреляции на ин-
тервалы
пронормировать частоты v к общему числу экспериментов п, то
получим таблицу оценок совместной плотности вероятности
ф(у, х).
Согласно уравнению (2.1) выполняется соотношение
900 = ЕфСУу/х/Мх,); i,j = 1, 2,...»п,
/=|
из которого может быть определена функция ч^у^/х,).
Далее, учитывая соотношение
f{x) = М {у/х} = j у<р(у, x)dy = —Ц J y<$(y/x)dy,
-со W-OO
на основе проделанных построений и вычислений может быть
получена линия регрессии:
п
f(Xi)=
п
tyj'ij-
J=1
Относя значения /(х,) к серединам интервалов х( и соединяя
эти точки отрезками прямых, получим эмпирическую линию рег-
рессии, которая с ростом числа наблюдений будет все более при-
ближаться к предельной линии регрессии, т.е. к статической ха-
рактеристике объекта.
Расчет параметров статических характеристик объектов по экс-
периментальным данным можно провести, используя их оценки,
получаемые методом наименьших квадратов. Рассмотрим опреде-
ление параметров линейной статической характеристики, задан-
ной регрессионной моделью вида
У = + а\Х.
(2.2)
Введя фиктивную переменную хь = 1 и обозначив х = хь пере-
пишем уравнение (2.2) в виде
у = аохо+а1х1.
35
Оценим параметры статической характеристики Oq и а( по кри-
терию минимума квадрата ошибки. Полученная в результате про-
веденного эксперимента выборка объема п (т.е. п пар значений xh
у,) позволяет составить избыточную систему уравнений
У/=flo-’cbi+о1хп, * = 1, п,
(2.3)
решением которой будут оценки коэффициентов уравнения (2.2),
т.е. ао и а\.
Из-за наличия помех, как уже указывалось ранее, равенство в
выражении (2.3) для каждого /-го эксперимента соблюдаться не
будет, а следовательно будет иметь место ошибка
в/ = У, ~ - aixu, i = 1, п, (2.4)
используя которую, составим вспомогательную функцию
п
F = (2-5)
<=1
Для получения решения системы (2.3) с использованием кри-
терия минимума квадрата ошибки необходимо найти вектор
(ао, ai)r, минимизирующий выражение (2.5), путем решения сле-
дующей системы уравнений:
^ = 0, ^ = 0.
ЭЦ) Э#]
Используя выражения (2.4) и (2.5), получим
3F п
= ^(У, -OqXo, -aix1()(-xo,) = 0,
др п
Т- = £2(у, - Vo, - Л1Х1()(-Х1,) = о,
Эа,
или в матричной форме
36
Выполненные преобразования можно провести и в матричной
форме. Для этого запишем уравнение (2.3) в виде
или, введя соответствующие обозначения, в виде
Xa = Y,
и далее, так как е = Y - Ха, то
F = еге = (Yr - arXr)(Y - Ха).
Частная производная функции F по а позволяет получить урав-
нение
— = 2XrY + 2XrXa = 0,
да
откуда
а = (XrX)-1XrY.
Вид полученной модели статической характеристики приведен
на рис. 2.3. Мерой идентичности полученной модели и экспери-
ментальных данных может служить средний квадрат ошибки, ха-
рактеризующий дисперсию разброса точек от линии регрессии и
определяемый как
Слишком большая величина F' указывает на значительный уро-
вень помехи, влияние неучтенных динамических параметров объек-
та либо на то, что предполагаемая линейная модель статической
Рис. 2.3. Определение статической характери-
стики объекта управления методом наимень-
ших квадратов
37
характеристики неадекватна реальности. В последнем случае воз-
можным выходом может быть аппроксимация статической харак-
теристики набором линейных моделей по участкам.
Заметим, что качество найденной модели в значительной сте-
пени зависит от организации получения экспериментальных дан-
ных. В частности, соседние наблюдения должны быть статистиче-
ски независимы, т.е. разделены интервалом, превышающим вре-
мя корреляции рассматриваемых процессов.
Особое значение имеет учет динамики идентифицируемого
объекта, так как фактически отклик объекта у, в момент /, опреде-
ляется не только значением х(/,), но и предысторией воздействия
х(/) на вход объекта. На практике целесообразно в этом случае
использовать такую модель, которая кроме безынерционной час-
ти содержит звено с чистым запаздыванием т. Величину t необхо-
димо определять так, чтобы уменьшить остаточную дисперсию.
Для примера рассмотрим выбор т для простой модели стати-
ческой зависимости в виде у = кх. Перепишем это равенство, вве-
дя время т и учитывая, что эксперимент проводится на функцио-
нирующем объекте:
y(t + т) = кх(1).
В соответствии с выражением (2.5) будем иметь
л э
/’ = Z[y(/+T)-M0],
/=1
откуда после вычислений, аналогичных приведенным выше, по-
лучим
£ y(ti + т)х(/,) - £ y(t, + т)х(/,) -
л _ £1____________ п 7ч
л 1 л £2 * * ‘ '
£х2(О °*
1=1 п /=1
Оптимальное значение задержки т0ПТ можно найти из условия
минимизации остаточной дисперсии
= F' = + х) - kx(ti)]. (2.8)
Л /=1
Подставив в выражение (2.8) значение к из (2.7) и используя
условие = 0, получим, что оптимальное значение топт со-
ответствует двум условиям:
__ . . w (т)
Х^Дт) = 0 или —— = 0.
Эт
38
Первое условие противоречит физическому смыслу, так как
при его выполнении отсутствует какая-либо зависимость между
выходом объекта и его входом (взаимная корреляционная функ-
ция равна нулю). Поэтому только второе условие позволяет опти-
мизировать остаточную дисперсию, которую в этом случае можно
определить по выражению
2 _ —I ^ух(^опт)
^ост “ э •
«X
Таким образом, этот вариант учета динамики объекта сводится
к определению Кух(х), вычислению топт и далее такому сбору ин-
формации, при котором пары х, у разделены интервалом
Полученные результаты определения статической характерис-
тики объекта управления можно распространить и на случай, когда
идентифицируемый объект имеет п входов и т выходов. При этом
статические характеристики, отражающие связь выходных коор-
динат с входными, в самом общем виде представляют следу-
ющим образок*
У> = х2,..., хп), i = 1, т. (2.9)
Нахождение параметров этих характеристик осуществляют по-
следовательным определением зависимости (2.9) для каждого z-ro
выхода, т.е. т раз рассматривают объект, имеющий п входных
координат и одну выходную.
Если зависимость (2.9) имеет линейный характер, т. е. модель
имеет вид:
у = boxo+bixx+b1x2+:. + Ьпхп, (2.10)
то оценку коэффициентов этой статической характеристики можно
провести, решая матричное уравнение
" N
5>ov
N
51
N
51
N
514
N
51
bo
N
51 ^bvjv
N
N
,(2.11)
N
51 -^wv-^Ov
N
N
У х2
bn
N
51
где N — число nap xv, yv, получаемых в процессе проведения экс-
перимента.
39
В ряде случаев, когда статическая характеристика выражена не-
линейной зависимостью, путем соответствующей замены пере-
менных эту зависимость можно преобразовать к виду (2.10) и да-
лее для расчета параметров характеристик использовать уравне-
ние (2.11).
В качестве примера рассмотрим два случая. При логарифмиро-
вании статической характеристики вида
у = b^X^X^...Xn"
получим
In у = In bo + bl In X! + bi In x2 +... + bn In x„.
Далее, введя замену w = In у, z, = Inx,, bo = 1пД>, получим урав-
нение
W = 1^ + biZ! + b2Z2 + ... + b„Zn,
которое полностью совпадает по форме с уравнением (2.10).
В качестве второго примера рассмотрим случай, когда стати-
ческая характеристика задана аналитическим выражением вида
( b 1
у = ехр bo + Ybjxj
< J=i >
После логарифмирования и аналогичной указанной выше за-
мены переменных получим
w — b0 + b jX] + Ьрс2 + ... + Z>*xt.
Если статическая характеристика имеет нелинейный вид, поз-
воляющий представить ее в виде кусочно-линейной характерис-
тики, поиск соответствующих параметров можно проводить от-
дельно для каждого линейного участка.
2.2. Полный факторный эксперимент
При определении статических характеристик объектов управ-
ления с использованием методов теории планирования экспери-
мента [1] идентифицируемый объект обычно представляют в виде
«черного ящика», имеющего к входов, которые называют факто-
рами, и п выходов, называемых откликами. Целью эксперимента
является определение математической модели статической зави-
симости каждого выхода объекта от всех факторов в виде
У,=fi(xi,x2, ...,xk), i = \,n.
Не теряя общности, в дальнейшем будем рассматривать при-
менение методов планирования эксперимента для случая, когда
40
объект имеет к входов и один выход, предполагая, что для каждо-
го из п выходов может быть найдена статическая характеристика
вида
y = f(xt,x2,..., хк).
Главной отличительной особенностью планирования и прове-
дения рассматриваемых ниже экспериментов является одновре-
менное изменение факторов, влияющих на соответствующий от-
клик у. Такой метод постановки исследований называют методом
многофакторного планирования эксперимента. В процессе проведе-
ния эксперимента каждый фактор может принимать одно из зара-
нее определенных фиксированных значений — уровней. Экспери-
мент, в котором реализуются все возможные сочетания уровней,
называют полным факторным экспериментом. При проведении экс-
периментов по определению статической характеристики иден-
тифицируемого объекта по схеме полного факторного экспери-
мента типа 2* (ПФЭ 2*) каждый из к факторов принимает всего
два значения, т. е. варьирует только на двух уровнях, и, следова-
тельно, общее число опытов будет равно N = 2к.
План проведения эксперимента описывают с помощью специ-
альной таблицы — матрицы планирования, в которой каждая строка
соответствует условиям одного опыта. В общем случае факторы
имеют различную физическую природу и, следовательно, различ-
ную размерность. Поэтому возникает необходимость проведения
специальной процедуры, называемой нормировкой, которая по-
зволяет упростить не только заполнение вышеназванной матрицы
планирования, но и обработку результатов эксперимента.
С этой целью, задавая границы изменения для каждого у-го
фактора в виде xymin и хутах, можно получить значения координат
центра плана (х°, х2,..., х°):
О _ Xymin + Х/тах • _
~ 2 ’ J ~~ А’ *
и интервала варьирования фактора ху:
= X/max -Xymin - = jj
1 2
Далее, проведя линейное преобразование координат по фор-
муле
Xhopm = *L_A, у = 1Д,
&Xj
получим нормированные значения для каждого у-го фактора, при
этом в нормированном виде верхний уровень каждого фактора
41
равен «+1», а нижний уровень равен «-1». (Далее в тексте под Xj
подразумевается нормированное значение j-то фактора.)
Отметим следующее важное обстоятельство, которое необхо-
димо учитывать при проведении факторных экспериментов, а
именно требования, предъявляемые к факторам. Во-первых, фак-
торы должны быть управляемы. Это значит, что при определен-
ном одном из двух нужных значений фактора для каждого опыта
должна существовать возможность задавать соответствующие зна-
чения других факторов и поддерживать их неизменными во время
проведения эксперимента. Во-вторых, должно выполняться тре-
бование отсутствия корреляции между факторами или независи-
мости факторов, иначе говоря, должна существовать возможность
варьирования каждого фактора на выбранных уровнях независи-
мо от уровней других факторов. В-третьих, необходимо выпол-
нить требование совместимости совокупности факторов. Это оз-
начает, что все возможные комбинации факторов, которые могут
иметь место при проведении факторного эксперимента, должны
быть допустимы, т. е. при проведении каждого опыта должен быть
исключен выход исследуемого объекта управления из режима нор-
мального функционирования.
При использовании ПФЭ 2к для определения статической ха-
рактеристики объекта управления математическую модель этой ха-
рактеристики задают в виде уравнения регрессии вида
к к к
У - bo + ^bjXj + b^xuXj + bujlxuXjX! +... (2.12)
у=1 и, у=1 и, у, /=1
u<j u<j<l
При этом необходимо иметь в виду, что поскольку при иден-
тификации реального объекта всегда имеют место различные не-
управляемые и неконтролируемые воздействия, влияющие на ве-
личину выходного сигнала у, и каждый эксперимент содержит
конечное число опытов, естественно, что результатом обработки
экспериментальных данных будут оценки bp buj, buji, ... «истин-
ных» значений коэффициентов уравнения (2.12), которые обо-
значают соответственно Р7, puy, риу/ и т.д.
Выше отмечалось, что условия проведения эксперимента опи-
сывают с помощью специальной матрицы планирования, где стро-
ки соответствуют различным опытам, а столбцы — значениям фак-
торов. При заполнении таких матриц для простоты записи плана
эксперимента единицы, соответствующие нормированным зна-
чениям факторов, опускают и оставляют только знаки (плюсы и
минусы). Такая матрица для эксперимента по схеме ПФЭ 2* в це-
лях определения коэффициентов уравнения вида:
у = ЬоХо + bf X, + />2*2 + b}X3 + buXiXz + ^23Х1Х2Х3 (2-13)
42
Таблица 2.1
Матрица планирования полного факторного эксперимента типа 2*
для статической характеристики вида (2.13)
Номер опыта Хо Xi *2 *3 Х1Х2 *1*2*3 У
1 4- 4- + 4- 4- 4- У1
2 4- - 4- + - - У2
3 + + - 4- - - Уз
4 + — - 4- 4- 4- У4
5 4- + 4- - 4- - У5
6 4- - 4- - — 4- Уб
7 4- + - - - 4- У7
8 4- ’ - - - 4- - У8
приведена в табл. 2.1. Необходимо отметить, что в таблице введен
столбец фиктивной переменной хо = +1 для вычисления свобод-
ного члена Ьо, а также два дополнительных столбца для вычисле-
ния коэффициентов при произведениях факторов Х\Х2 и Х\Х2Х1, как
будет показано ниже.
Отметим некоторые свойства этой матрицы планирования,
которые справедливы для любой матрицы ПФЭ 2к. Два свойства
следуют непосредственно из построения матрицы. Первое из них —
симметричность относительно центра эксперимента — означает, что
алгебраическая сумма элементов вектор-столбца каждого фактора
равна нулю:
Ъхл =0’
1=1
где j — номер фактора; N — число опытов; j = 1, 2, к.
Второе свойство — условие нормировки — формулируется сле-
дующим образом: сумма квадратов элементов каждого столбца
равна числу опытов
N
М = N
/=1
как следствие того, что значения факторов в матрице заданы в
виде «+1» и «-1».
Третье свойство — ортогональность матрицы планирования —
состоит в том, что сумма почленных произведений любых двух
вектор-столбцов матрицы равна нулю:
43
N
^XjiXui =0; j * u; j, и = 0,1, 2,..., к.
i=i
Четвертое свойство матрицы планирования, называемое рота-
табельностью, гарантирует одинаковую точность модели на рав-
ных расстояниях от центра эксперимента в различных направле-
ниях.
Таким образом, в результате эксперимента, проведенного в
соответствии с матрицей планирования, получим значения функ-
ции отклика ух, у2, ..., Вычисление любого коэффициента by
линейной модели статической характеристики проводят по фор-
муле [1]
1 n ____
J = d,k.
•
Если математическая модель статической характеристики не-
линейна и содержит члены, характеризующие эффекты взаимо-
действия, т. е. имеет вид:
у = Ьо + ЬхХх +... + bkxk + bi2XiX2 + />13X1X3 +... + />123X1X2X3 +...,
то коэффициенты
buj (и, j = 1, к; и < у), bujm (и, j, т = 1,к;и <j <т)
вычисляют по алгоритму, аналогичному применяемому при опре-
делении оценок коэффициентов линейной модели:
1 w ___
buj =~йЪхшхлУ>’ u,j = l,k; u<j;
1 N ___
Ьщт=^Ъхшхахт1Уь u,j,m = l,k; u<J<m.
Следует обратить внимание на следующее обстоятельство. Если
функция отклика идентифицируемого объекта зависит в том чис-
ле и от квадратов факторов, т. е. имеет вид
к к
y = bo + ^ bjXj +... + £ bjxj,
М j=i
то эксперимент типа ПФЭ 2к не позволяет определять коэффици-
енты при квадратичных членах bjj. Действительно, вектор-столбцы
для квадратичных членов xj(j = 1, к) не отличаются как друг от
друга, так и от вектор-столбца Оценка коэффициента />0 в этом
44
случае будет включать вклады квадратичных членов, т.е. получит-
ся смешанной. Следовательно, этот эксперимент позволяет найти
только оценки коэффициентов данного уравнения при линейных
членах и членах, характеризующих взаимодействие факторов, для
нелинейной статической характеристики.
2.3. Дробный факторный эксперимент
Число опытов при использовании полного факторного экспе-
римента при определении статических характеристик объектов
управления во многих случаях может оказаться слишком большим.
Поэтому возникает задача сокращения числа опытов, но при ус-
ловии, что матрица планирования сохранит свои оптимальные
свойства. Такая задача может быть решена за счет той информа-
ции, которая не очень существенна при построении линейных
моделей.
Таким образом, в случае линейной модели, в которой все пар-
ные взаимодействия и взаимодействия более высокого порядка
либо отсутствуют, либо незначимы, т.е. имеются соответству-
ющие степени свободы, число опытов можно сократить. Для этого
при составлении матрицы планирования для ряда выбранных фак-
торов используют вектор-столбцы матрицы, принадлежащие взаи-
модействиям, которыми можно пренебречь. Факторный экспери-
мент такого вида называют дробным и обозначают ДФЭ 2к~р, где
к — общее число факторов, р — число факторов, план которых
определяется векгор-столбцами взаимодействий. При этом необхо-
димо соблюдать правило: число опытов должно быть больше или
равно числу неизвестных коэффициентов выбранной линейной мо-
дели статической характеристики исследуемого объекта.
Зависимости, определяющие соотношения между z-м факто-
ром (/ = 1, 2, ..., р) и произведениями факторов, характеризу-
ющих взаимодействия, называются генерирующими соотношениями.
Пусть, например, модель статической характеристики объекта
близка к линейной:
у = Ьо + />]Х] + Ь2х2 + Ь3х3 + Ь4х4 + Ь5х5. (2.14)
Реализация эксперимента в соответствии с планом ПФЭ 2к по-
требует проведения 32 опытов. Если же проводить эксперимент
вида ДФЭ 2к~р и выбрать, например, в качестве генерирующих
соотношений
х4 = xtx3, х5 = Х!Х2х3, (2.15)
т.е. в качестве плана для х4 использовать столбец х,х2, а для х5 —
столбец Х|Х2х3, то полученный сокращенный план (табл. 2.2) по-
45
Таблица 2.2
Матрица планирования дробного факторного эксперимента типа 2*"*
для статической характеристики вида (2.14)
Номер опыта *0 *1 *2 Х4 *5 У
1 + + + + + +
2 + - + + - - У1
3 + + - + + - Уз
4 + - - + - + У4
5 + + + - - - У5
6 + - + - + + Уб
7 + + - - - + У?
8 + - - - + - У*
требует проведения всего лишь восьми опытов. Такой план явля-
ется дробной репликой (в данном случае четверть-репликой от 25).
Дробный факторный эксперимент позволяет минимизировать
число опытов, но при этом уже не будет тех раздельных оценок,
которые получались при использовании полного факторного экс-
перимента, т.е. оценки будут смешанными. Для определения си-
стемы смешивания оценок используют обобщающий определяющий
контраст, который формируется из определяющих контрастов.
Определяющим контрастом является символическое произве-
дение некоторых столбцов матрицы планирования, равное «+1»
или «-1». Система смешивания линейных эффектов с эффектами
взаимодействия первого, второго и более высоких порядков оп-
ределяется умножением обобщающего определяющего контраста
последовательно на хь х2, х3 и т.д.
Например, при оценке эффектов смешивания для модели ста-
тической характеристики вида (2.14) и выбранных генерирующих
соотношений (2.15) определяющими будут следующие контрасты:
1 = Х]ХзХ4, 1 = Х|Х2ХзХ5, 1 = Х2Х4Х5
и, соответственно, обобщающий определяющий контраст будет
равен
1 = Х|ХзХ4 = Х2Х4Х5 = Х1Х2ХзХ5.
Применяя указанное выше правило, получим для этого при-
мера следующую систему смешивания:
Х| = ХзХ4 = Х!Х2Х4Х5 = Х2ХЭХ5,
Х2 - Х|Х2Х3Х4 = Х4Х5 = Х1Х3Х5,
Х3 = Х,Х4 = Х2Х3Х4Х5 = Х1Х2Х5,
Х4 = Х]Х3 = х2х5 = х1х2х3х4Х5,
Х5 = Х1ХэХ4Х5 = Х2Х4 = Х|Х2Х3.
Полученным соотношениям соответствует система смешанных
оценок коэффициентов:
b\ -* Р1 + Р34 + Р1245 + P235, ^2 -> р2 + Р1234 + Р45 + Р135»
*3 Рз + Р14 + Р2345 + Р125» —> Р4 + Р13 + Р25 + Р12345>
^5 Р5 + Р1345 + Р24 + Р123-
Их точность и достоверность зависят от свойств выборки и в
общем случае нуждаются в дополнительной статистической про-
верке. В этих целях после вычисления коэффициентов модели це-
лесообразно осуществить проверку их значимости, что позволяет
в ряде случаев упростить полученную в ходе эксперимента стати-
ческую характеристику объекта управления. Обычно оценку зна-
чимости полученных коэффициентов проводят по /-критерию
Стьюдента, при этом незначимые коэффициенты можно исклю-
чить из априори заданной модели статической характеристики. При
отсутствии корреляции между коэффициентами исключение не-
значимых коэффициентов не повлияет на значения оставшихся.
Проверку адекватности полученной по результатам проведен-
ного факторного эксперимента статической характеристики объек-
та управления осуществляют чаще всего с помощью F-критерия
Фишера.
24. Обработка экспериментальных данных методом
дисперсионного анализа
Под дисперсионным анализом понимают статистический метод
анализа результатов наблюдений, зависящих от различных одно-
временно действующих факторов, выбор наиболее важных факто-
ров и оценку их влияния [19]. Дисперсионный анализ представля-
ет собой систему статистических методов обработки эксперимен-
тальных данных, допускающих представление модели в виде
У/ = Ро + Р1Х1/ + Р2^2/ + — + Pmxmz,
где коэффициенты р — целые числа, равные нулю или единице.
Обратим внимание на одну весьма существенную разницу между
корреляционным и дисперсионным анализами. Если корреляци-
47
онный анализ характеризует связь между неслучайными фактора-
ми, т.е. факторами, признаваемыми как основные параметры входа
и выхода идентифицируемого объекта, то дисперсионный анализ
допускает наличие модели со случайными факторами.
Корреляционный анализ при обработке экспериментальных
данных позволяет принять все меры для исключения воздействия
случайных факторов на результаты анализа. Дисперсионный ана-
лиз, напротив, определяет меру влияния того или иного случай-
ного фактора или суммы этих факторов на протекание исследуе-
мого процесса. Когда проверяют воздействие только одного слу-
чайного фактора на результат эксперимента, говорят об однофак-
торном дисперсионном анализе.
В качестве примера рассмотрим ситуацию, когда требуется про-
анализировать точность измерительных приборов, используемых
в экспериментальном исследовании идентифицируемого объекта.
Решается задача проверки влияния одного фактора (в данном слу-
чае — прибора) на погрешность измерения, для чего необходимо
определить, можно ли считать систематические ошибки исполь-
зуемых приборов одинаковыми.
В этих целях каждым прибором производят измерение одного и
того же образца #раз, т.е. эти Nизмерений представляют собой
случайную выборку из генеральной совокупности показаний каж-
дого прибора.
В рамках дисперсионного анализа задача формулируется следу-
ющим образом: имеется п независимых нормально распределен-
ных величин у2, ..., уп, которые имеют одно и то же средне-
квадратичное отклонение о. Центры распределения этих величин
в общем случае различны. С каждой из указанных переменных
проводят серию из N опытов.
Цель обработки полученных экспериментальных данных — про-
верка нулевой гипотезы, согласно которой центры распределения
этих величин одинаковы.
Поскольку оценкой математического ожидания случайной ве-
личины является среднеквадратичное значение, для каждой се-
рии опытов (выборки N для каждого прибора) необходимо опре-
делить среднеарифметические значения. Если окажется, что рас-
хождения между среднеарифметическими значениями каждой се-
рии несущественны, проверяемая гипотеза верна, в противном
случае нулевую гипотезу придется отбросить.
Рассмотрим решение данной задачи подробнее. Пусть имеются
данные z-й серии опытов: у(1, yi2, ..., yin; i = 1, 2, ..., п. Тогда для
/-го прибора среднеарифметическое значение показаний равно
N
ЪУи
* = j = 1,2,..., N,
48
среднеарифметическое значение всех N измерений составит
Поскольку
N
±Уи = ^
7=1
то
Согласно [19] имеет место следующее равенство:
nN ~ п ~ п N ~
- у) = *Е(й -Я 'XZU -я) • (216)
/=1 j=\ /=1 /=1 ;=1
Введя обозначения
п N э
Q = ZY(yu~y),
/=1 ;=1
л Э
Qi -у) ,
/=1
п N ,
»=1 >1
выражение (2.16) можно записать в виде
Q — Qi + Qi-
Таким образом, параметр Q} представляет собой сумму квад-
ратов разностей между средними значениями у,- отдельных серий
и общим средним по всей совокупности наблюдений, т.е. сумму
квадратов отклонений между сериями. В данном примере пара-
метр Qi характеризует степень расхождения систематических по-
грешностей приборов. Этот параметр называют рассеиванием по
факторам.
Параметр 02 является суммой квадратов разностей между от-
дельными наблюдениями и средним значением соответствующей
серии, т.е. суммой квадратов отклонений внутри серий, и харак-
теризует остаточное рассеивание случайных погрешностей опыта.
Параметр Q характеризует полную сумму квадратов отклоне-
ний отдельных наблюдений от общего среднего у.
49
Допустим, что принятая нулевая гипотеза равенства система-
тических погрешностей приборов верна, т.е. нормальные распре-
деления всех величин уь у2, ..., у„ тождественны: у них одинако-
вые математические ожидания и дисперсии. Тогда все nN наблю-
дений можно рассматривать как выборку из одной и той же гене-
ральной совокупности с несмещенной оценкой дисперсии
Так как каждый из параметров у, нормально распределен и
имеет дисперсию, равную
согласно принятой гипотезе должно выполняться равенство
1 V (у - у)2 =___01__
п-1£г‘ У) ЛГ(л-1)’
которое и является несмещенной выборочной (по п наблюдени-
ям) характеристикой дисперсии DN.
Из математической статистики известно, что параметр, рав-
ный отношению Qk/c2, zocRbencvwjw распределению х2 (распре-
делению Стьюдента с nN- 1 степенями свободы). Поэтому вели-
чина
распределена по закону %2 с и - 1 степенями свободы, а величина
N
1(у9-у)
;=1_____
о2
распределена по закону х2 с N- 1 степенями свободы [19].
Аналогично для параметра Q2 справедливо
л N ,
п ЕЕЬ-й)
V2 _ /=1 у=1___
и, следовательно, полученная величина также распределена по
закону х2 с n(N - 1) степенями свободы.
50
Таким образом, отношение
Q1
n(N -1)
является оценкой параметра о2.
Следует отметить, что если принятая гипотеза верна, то и
Q2 независимы друг от друга, а поэтому критерий, составленный
как
---!---02
n(N -1) 2
будет соответствовать F-распределению (распределение Фишера)
с п - 1 и n(N - 1) степенями свободы [19].
Анализ полученного критерия показывает, что если принятая
гипотеза неверна и математические ожидания отдельных серий не
равны друг другу, то параметр Q2 все равно не меняет своего зна-
чения. Поэтому знаменатель полученного критерия по-прежнему
остается несмещенной оценкой для о2. Этого нельзя сказать о па-
раметре Qb который учитывает систематические расхождения меж-
ду математическими ожиданиями отдельных серий, возрастая при
увеличении указанных расхождений, что в свою очередь приво-
дит к увеличению критерия F.
Это свойство критерия Фишера обычно используют на за-
ключительном этапе анализа принятой гипотезы. Существуют спе-
циальные таблицы, составленные с учетом степеней свободы дис-
персий Qt и 02, а также критических границ для принятых уров-
ней значимости, по которым можно определить, равно ли зна-
чение критерия F табличному значению Fq, которое имеет мес-
то, если при данных условиях задачи нулевая гипотеза верна. Если
F< Fq, то нулевая гипотеза принимается, в противном случае эта
гипотеза отбрасывается.
Таким образом, приведенная методика дисперсионного ана-
лиза позволяет сравнивать дисперсию по факторам с остаточной
дисперсией, а по величине их отношения судить о влиянии того
или иного фактора, что и является основной целью дисперсион-
ного анализа.
Изложенные основные принципы применения дисперсионно-
го анализа не меняются и в тех случаях, когда необходимо иссле-
довать влияние не одного, а многих факторов.
Использование двухфакторного дисперсионн.ого анализа, ког-
да в качестве факторов рассматривают систематическую ошибку
прибора и индивидуальные свойства оператора, проводящего из-
мерение, описано в книге [19].
51
Темы для повторения
1. Определение статической характеристики объекта на основе веро-
ятностных характеристик входного и выходного сигналов объекта управ-
ления.
2. Расчет параметров статической характеристики объекта по экспе-
риментальным данным методом наименьших квадратов.
3. Учет динамики идентифицируемого объекта при определении ста-
тической характеристики этого объекта.
4. Проведение экспериментов и расчет параметров статической ха-
рактеристики объекта с использованием полного факторного экспери-
мента типа ПФЭ 2к.
5. Особенности проведения экспериментов и расчет параметров ста-
тической характеристики объекта с использованием дробного фактор-
ного эксперимента типа ДФЭ 2к~р.
6. Основные результаты применения дисперсионного анализа для об-
работки экспериментальных данных.
Глава 3
ИДЕНТИФИКАЦИЯ ОБЪЕКТОВ УПРАВЛЕНИЯ
ПРИ ДЕТЕРМИНИРОВАННЫХ ВОЗДЕЙСТВИЯХ
3.1. Экспериментальные методы исследования объектов
управления при периодических воздействиях
По мере усложнения объектов исследования на первый план
выходят экспериментальные методы и, в частности, методы иден-
тификации, для которых основной формой получаемых результа-
тов являются частотные характеристики. Это объясняется широ-
ким распространением частотных представлений при анализе и
синтезе систем управления, что обусловлено их наглядностью и
простотой физической интерпретации.
Для линейного стационарного объекта, описываемого в час-
тотной области, связь между его входным и выходным сигналами
определяется известным уравнением
y(yco) = IF(»w(»,
где w(j<o) — частотный спектр (преобразование Фурье) входного
сигнала объекта: и(у’(о) = F{и(/)} = J м(/)е"-'“'<1/; у(усо) = F{y(/)} —
спектр выходного сигнала; = /7{и'(/)} — частотная переда-
точная функция (характеристика) объекта; предполагается, что
преобразуемые по Фурье функции удовлетворяют условию абсо-
лютной интегрируемости.
Поскольку частотную характеристику можно выразить
соотношением
ИЧ» = y(»/i/(»,
то ее можно найти экспериментальным путем по результатам из-
мерения ы(У©) и Такое прямое решение задачи часто сопря-
жено с существенными техническими и аналитическими трудно-
стями. Не обсуждая их подробно, отметим, что для выявления
свойств объекта спектр w(jco) его входного воздействия должен
быть непрерывным, как и искомая функция IF(J(o), во всей поло-
се частот ее протяженности, что сложно обеспечить технически.
Кроме того, могут возникать значительные ошибки измерения
53
сигналов u(t) и y(t), которые практически можно наблюдать только
на ограниченном отрезке времени, а преобразование Фурье опре-
делено на бесконечном интервале.
Значительно упростить и повысить точность определения ха-
рактеристики можно, заменив широкополосное воздей-
ствие на объект последовательным применением моногармони-
ческих воздействий с разными частотами. Формирование и изме-
рение подобных сигналов в сравнении с широкополосными на-
много проще.
Представим частотную характеристику объекта в виде
W (У®) = = /?(®)e?<p(“),
где /?(®) = mod РК(У®), <р(со) = arg H^(j(o) — соответственно амп-
литудная и фазовая частотные характеристики объекта.
Если на входе такого объекта задать гармоническое воздействие
с частотой ® = ®,:
u(t) = Uo sin (Ojt,
то на выходе в установившемся состоянии также будут наблю-
даться гармонические колебания той же частоты
у (t) = Ym (®,,) sin + q> (®,)].
Для возбужденного на частоте со = ®, объекта
Y , ч
Ж (усо,) = m
При заданной частоте модуль функции И^у®,) вычисляют по
формуле
Л(<й>) = Гт(ц.)/170,
а ее аргумент <р(®,) совпадает по величине с фазовым сдвигом
выходных колебаний испытуемого объекта.
Частотный подход может быть использован также для иссле-
дования нелинейных динамических объектов методом гармониче-
ской линеаризации. В основе этого метода лежит предположение о
том, что периодические колебания на входе нелинейной части
системы близки к гармоническим [22]. В этом случае нелинейная
часть системы описывается (в первом приближении) эквивалент-
ным комплексным коэффициентом передачи И^СУ®, t/0), кото-
рый определяет первую гармонику периодических колебаний на
54
выходе в зависимости от частоты со и амплитуды Uo синусоидаль-
ных колебаний на входе.
Метод отклика на синусоидальный сигнал можно распростра-
нить и на линейные нестационарные объекты, хотя при этом он
оказывается значительно сложнее, чем для стационарного слу-
чая.
При идентификации линейных стационарных динамических
объектов в качестве испытательных сигналов, кроме синусоидаль-
ных, могут быть использованы другие периодические воздействия,
в частности воздействия прямоугольной или трапецеидальной
формы, для которых заранее можно рассчитать значение основ-
ной гармоники. Отметим, что для промышленных объектов, ко-
торые, как правило, обладают значительной инерционностью, вы-
ходные колебания в области средних и высоких частот при таких
воздействиях достаточно близки к гармоническим, что не услож-
няет определение частотных характеристик.
В общем случае гармонического анализа входного и выходного
сигналов объекта при использовании в качестве тестового перио-
дического воздействия сложной формы с большим уровнем крат-
ных гармоник можно определить по данным одного эксперимента
сразу несколько значений частотной характеристики объекта.
3.2. Предварительное изучение объекта управления
Идентификация реальных динамических объектов частотным
методом основана на определенных допущениях и наличии апри-
орной информации. Подготовка к проведению эксперимента на-
чинается с предварительного изучения объекта: принципов его
функционирования, конструкции, особенностей работы, что по-
зволяет наметить приближенную структурную схему модели изу-
чаемого объекта и выделить основные входные и выходные коор-
динаты. Иногда невозможно или технически сложно непосред-
ственно измерять наиболее информативные выходные перемен-
ные по отношению к заданным входным. В таких случаях необхо-
димо установить более подробную структуру математического опи-
сания объекта и выбрать такие измеримые косвенные перемен-
ные, которые давали бы возможность с необходимой точностью
определять требуемые переменные.
На основе анализа работы объекта в режиме нормального функ-
ционирования выявляются ограничения, накладываемые на вход-
ные и выходные координаты условиями безаварийного режима,
мощностью и требуемым качеством работы. Выбор рабочего ре-
жима и диапазона изменения входных и выходных координат
объекта при проведении экспериментальных исследований во
многом определяется видом статической зависимости между вход-
55
ной и выходной координатами. Если статические характеристики
можно аппроксимировать кусочно-линейной функцией, то для
определения частотных характеристик объекта необходимо наме-
тить несколько рабочих режимов на разных участках статической
характеристики.
Предварительное исследование динамического объекта в ре-
жиме нормального функционирования, а также при подаче на
вход тестовых сигналов, позволяет сделать выводы о его линейно-
сти, инерционности, стационарности, сосредоточенности пара-
метров.
Линейность объекта может быть установлена проверкой соблю-
дения принципа суперпозиции путем поочередной подачи на его
вход разноуровневых сигналов U[(t) и u2(f) = ku^t) одинаковой
формы (постоянных во времени или, например, синусоидальных).
Объект можно считать линейным, если его установившиеся выход-
ные сигналы можно связать равенством
у2(0 = kyt(l).
Этот прием можно использовать также для установления зоны
линейности нелинейных объектов, когда отыскивают линейную
модель при малых отклонениях параметров в рабочей области
(объект в эту область выводят перед экспериментом смещающим
постоянным воздействием). Как правило, статические зависимос-
ти большинства промышленных объектов могут быть линеаризо-
ваны в окрестности равновесного режима (и0, у0) в интервале
изменений u(t) на ±(0,1—О,2)мо.
Рабочая полоса частот динамического объекта определяется его
инерционными свойствами. Максимальную постоянную времени
объекта Ттах можно грубо оценить как % времени установления
переходной функции. Ориентировочно полосу частот объекта сле-
дует принимать равной (100± 1 000)/7’тах.
Особый класс объектов составляют нестационарные объекты,
которые характеризуются непостоянством параметров, а соответ-
ственно, и динамических свойств. Причинами нестационарности
таких объектов могут быть старение вследствие физико-химичес-
ких процессов, изменение объемов, нагревание и т.п. Экспери-
ментально нестационарность можно обнаружить по различию пе-
реходных процессов, полученных при одинаковых возмущениях
объекта в разные моменты времени. Объекты с переменными па-
раметрами описываются нестационарной импульсной переходной
функцией w(t{, t2), геометрическим представлением которой яв-
ляется трехмерная поверхность (рис. 3.1).
В силу принципа причинности (реакция не возникает раньше
воздействия) функция w(^, t2) = 0 при всех > t2. Сечения w(tx, t2)
являются импульсными переходными функциями, которые отра-
56
Рис. 3.1. Импульсная переходная функция нестационарного объекта уп-
равления
жают динамические свойства объекта в каждый из моментов вре-
мени /2- По аналогии нестационарные объекты можно описывать
и в частотной области с помощью нестационарных частотных ха-
рактеристик ИХ/со, t). Идентификация нестационарных объектов
отличается большой сложностью. Поэтому если нестационарность
является сравнительно медленной и характеризуется изменением
параметров в небольших пределах, целесообразно рассматривать
объект как квазистационарный. Это позволяет описывать его обыч-
ной стационарной моделью, справедливой для определенного
отрезка времени. Из числа известных методов для осуществления
текущей идентификации нестационарных объектов наиболее при-
способлены методы идентификации с использованием настраи-
ваемых моделей-аналогов. При этом для полного математического
описания объекта одновременно с определением текущих значе-
ний параметров модели необходимо находить и зависимости, ха-
рактеризующие изменение этих параметров во времени. Заметим,
что во всех случаях идентификация нестационарного объекта вы-
полняется тем успешнее, чем медленнее изменяются его пара-
метры.
И, наконец, вопрос о сосредоточенности параметров обычно
решают на основании предварительного изучения математиче-
ского описания, используемого при анализе физических процес-
сов, происходящих в объекте, а также путем сравнения с матема-
тическим описанием аналогичных объектов. Динамический объект,
движение которого определяется бесконечным множеством аргу-
ментов, является системой с распределенными параметрами. При-
мером такого объекта может быть теплообменник, объем которо-
го представляет собой бесчисленное множество точек, каждая из
которых обладает тепловым сопротивлением, теплоемкостью, тем-
пературой и т.д. Математические модели объектов с распределен-
ными параметрами представляют, как правило, дифференциаль-
57
ные уравнения в частных производных. На практике такие объек-
ты обычно описывают моделями с сосредоточенными параметра-
ми, которые часто уточняют введением чистого запаздывания.
3.3. Определение частотных характеристик объектов
управления
Определение частотных характеристик в большинстве случаев
осуществляют в режиме активного эксперимента, при котором
на вход объекта подают тестовый сигнал (гармонический или
полигармонический). Прямые методы, позволяющие определять
амплитудную и фазовую частотные характеристики, основаны
на непосредственном измерении амплитуды и фазы отклика ис-
следуемого объекта на синусоидальный сигнал и, следователь-
но, могут быть использованы в тех случаях, когда помехи, иска-
жающие измерения, отсутствуют. Однако в реальных промыш-
ленных условиях идентифицируемый объект подвергается зна-
чительным шумовым воздействиям. Представим последние по-
мехой, приведенной к выходу объекта. Сигнал (рис. 3.2) на вы-
ходе такого объекта при гармоническом воздействии можно за-
писать в виде
у(/) = C7o-K((0)sin[0tf + ф(®)] + я(0’
где n(t) — помеха, приведенная к выходу объекта.
При этом измерение параметров отклика целесообразно про-
водить методами, основанными либо на вычислении статисти-
ческих характеристик, либо на гармоническом анализе сигналов.
Суть одного из статистических методов, а именно корреляцион-
ного, заключается в следующем: вычислим взаимную корреляци-
онную функцию Куи(х) сигналов y(t) и u(t) при т = 0 и т = л/2а»,
когда
u(t - т) = u(t - 0) = I/Osin®/,
u(t - т) = u(t - jc/2®) = f/0cosco/.
Рис. 3.2. Схема испытаний объекта при гармоническом воздействии
58
В этом случае
I /
Куи (0) = Um — f Uо sin (at • U0R (со) sin (at + <p) d/ + K„u (0) =
Jo
= limM
t^T I
1 rfFW^(®) U%R((a\ /I; „ /Лч
f —£ cos ф----------^-2 cos (2<oZ + <p) d/ + Km (0),
- oL 2 J
„(я) r 1 7№(®) . U^R((a) . .
^"1 2® l=r^>f I —2^sm<P ^Sin(2co/ + <p)
до-
выполнив интегрирование в заданных пределах, а также учи-
тывая, что корреляционная связь между «(/) и u(t) отсутствует
или она очень слаба и поэтому можно принять Кпи = 0, получим
куи (°) = у-R (®)cos <Р(®) > куи R (®) sin <р (со).
Тогда амплитудную и фазовую частотные характеристики можно
определить следующими формулами:
к^^кца)+к4й
ф(ш)=агс,8“Щ6Г'
Структурная схема реализации данного метода приведена на
рис. 3.3, из которого видно, что для проведения соответствующе-
го эксперимента необходим генератор, обеспечивающий получе-
ние гармонических сигналов со сдвигом 90°. При малом уровне
помех n(t) минимальное время усреднения Т может составлять
всего несколько или даже один период синусоидального сигнала.
Наиболее совершенным методом определения частотных ха-
рактеристик является метод, основанный на измерении основной
гармоники установившихся колебаний на выходе исследуемого
объекта при гармоническом воздействии на входе. Обработку вы-
ходного периодического сигнала проводят с помощью гармони-
ческого анализатора, позволяющего определять параметры одной
59
Рис. 3.3. Схема определения частотных характеристик объекта корреля-
ционным методом
или нескольких гармоник. Как правило, при обработке таких сиг-
налов используют алгоритмы, основанные на вычислении коэф-
фициентов Фурье:
2 т 2Т
ак = J у (f) costard/, Ьк = — Jy^sintao^d/, (3.1)
^0 о
где
2я
к = 1,2,3,...; T = mTi\ m = 1, 2, 3,...; ®, =^.
7}
Положительным свойством этих алгоритмов является принци-
пиально неограниченный частотный диапазон, что делает их наи-
более приспособленными для использования в области низких и
инфранизких частот, которая характерна для рабочих частот мно-
гих промышленных объектов. Следует также отметить малую чув-
ствительность этих алгоритмов к случайной составляющей обра-
батываемого сигнала, что имеет существенное значение при иден-
тификации промышленных объектов, обычно работающих в ус-
ловиях различных случайных воздействий. Если предположить, что
случайная помеха nCJl(t) на выходе исследуемого объекта стацио-
нарна, имеет математическое ожидание = 0 и не зависит
от внешнего воздействия и периодической помехи, то при доста-
точно большом значении mT,(m >5—10) помеха не будет оказы-
вать существенного влияния на результаты измерения, так как
1 тТ,
— J псл (Z)sinbVdf-^0,
/и/} 0
60
2 т^‘
—г f Пел (t)cosk(Oitdt -> 0.
тТ> о
Выделение «полезной» компоненты из анализируемого сигна-
ла, каковой является соответствующая гармоника, осуществляе-
мое при реализации алгоритмов (3.1), может рассматриваться как
задача фильтрации. В этой связи целесообразно несколько подроб-
нее остановиться на собственно фильтрующих свойствах преобра-
зования (3.1). Будем полагать, что на выходе идентифицируемого
объекта наряду с полезным сигналом-откликом на тестовый си-
нусоидальный сигнал имеется аддитивный шум. В этом случае ре-
зультатом обработки выходного сигнала по алгоритмам (3.1) при
определении параметров первой гармоники (к = 1) будет
- 2 Т - э т
bi =bi +—— jn(/)sinco/d/, ai = a{ +——[«(/)coso/d/, (3.2)
UqT j U0T j
где bi, ai — оценки коэффициентов Фурье; Uo — амплитуда вход-
ного синусоидального тест-сигнала.
Так же как это было сделано выше, примем, что математиче-
ское ожидание случайного сигнала = 0. Применение опе-
рации математического ожидания к выражению (3.2) позволяет
получить
г- 1 э т
щ = М bi} = М {Д } + -±- j М {л(/)}sin ю/d/ =
1 1 '-/0‘ 0
и аналогично
Следовательно, можно сделать вывод, что результаты измере-
ний являются несмещенными. Далее оценим дисперсию измере-
ний
2 т "I2
—— Jn(/)sinn(o/d/
. °^ о
4 тт
= 772^2 J Jл/{«(/Jл(^sinco/! sinto^d/i.
^0^ о о
(3.3)
Подставляя в выражение (3.3):
М {п (А) п (t2)} = Кпп (/2 - /,) = Кпп (т),
где Кпп(т) — автокорреляционная функция аддитивного шума,
получим [22]:
61
х
, т А , 1 . .
1- — cos ш±—sin сот dr.
Т (оТ
(3.4)
Т
UO1 0
Если аддитивный шум является «белым», то К„п(х) = с8(х).
В этом случае, учитывая, что входной сигнал имеет вид и = tfosin tat
и поэтому
AUO) = tfo2/2,
выражение (3.4) принимает вид
2 2 £
a*"Ga~
т.е. среднеквадратичное отклонение обратно пропорционально 4т.
Если аддитивный шум рассматривать как «белый» шум, про-
пущенный через низкочастотный фильтр с передаточной функ-
цией W(s) = a/(s + а), то при Т —> 00 получим
ст2 _ ст2 ~ с а2
* ° КШ(О)Т а?+а2'
Фильтрующие свойства алгоритмов вычисления коэффициен-
тов Фурье (3.1) становятся особенно наглядными при использо-
вании частотных представлений. Чтобы оценить эти свойства
(в том числе и при ограниченном времени интегрирования), рас-
смотрим, например, алгоритм вычисления синфазной составля-
ющей первой гармоники и представим его в виде
J y(/)sin<o,/d/= J y(/)wn(/)d/, (3.5)
mli О О
где wn(0 — весовая функция преобразования.
Тогда частотная характеристика этого преобразования может
быть определена в виде
тТ
wa(j^= J wn(r)e->“*dr. (3.6)
о
Подставляя значение w„(t) в выражение (3.6) и проведя необ-
ходимые преобразования, получим выражение для амплитудно-
частотной характеристики преобразования (3.5):
К (л)| -
тп
Sin /ПЯЕ
1-Е2
где е = а>/а>, — относительная частота.
62
Рис. 3.4. Частотная характеристика преобразования Фурье при т = 1 (/), 5 (2)
Из рис. 3.4 видно, что преобразование обладает узкополосной
частотной характеристикой, причем его избирательные свойства
возрастают с увеличением т, т. е. с увеличением времени интег-
рирования.
34. Экспериментальное определение частотных
характеристик
Эффективность определения частотных характеристик, досто-
верность и качество получаемой информации зависят не только
от характеристик гармонического анализатора, но и от других тех-
нических средств, используемых в процессе проведения экспери-
мента. Остановимся, в частности, на использовании различных
вспомогательных устройств (датчиков, усилителей, преобразова-
телей), служащих для снятия информации с объекта и связи с
генератором и анализатором.
Если эти устройства не являются принадлежностью объекта в
существующей (или создаваемой) системе управления, их дина-
мические свойства необходимо учесть при обработке эксперимен-
тальных данных. Структурная схема проведения эксперимента по
снятию частотных характеристик при наличии вспомогательных
элементов показана на рис. 3.5.
По экспериментальной частотной характеристике ис-
комая частотная характеристика исследуемого объекта W\jei) мо-
жет быть найдена по формуле
= (З-7)
»в (ja>)
где Ив(» = И'в1(У®)И'в2(./®), ЖВ|(/а>)> Ив2(» — частотные
характеристики используемых в эксперименте вспомогательных
63
Рис. 3.5. Структурная схема экспериментального определения частотных
характеристик объекта управления
элементов, расположенных соответственно на входе и выходе
объекта.
Из выражения (3.7) видно, что для определения час-
тотные характеристики вспомогательных элементов должны быть
известны или сняты отдельно.
При анализе сильно зашумленных процессов может возник-
нуть необходимость предварительной фильтрации высокочастот-
ных помех. Для этой цели обычно используют фильтры с переда-
точными функциями типа
—
/=1
Влияние характеристик таких фильтров учитывают аналогич-
ным образом.
Экспериментальное определение частотных характеристик эле-
мента Wx, включенного между линейными элементами объекта
Рис. 3.6. Структурная схема экспериментального определения частотных
характеристик элемента объекта управления
64
n
Рис. 3.7. Структурная схема экспериментального определения частотных
характеристик объекта управления, включенного в замкнутую систему
(И'о.с — частотная характеристика обратной связи)
IF] и Wi, проиллюстрировано на рис. 3.6. Для нелинейных элемен-
тов W} и JVX необходимо определять их частотные характеристики
совместно. Снятие частотных характеристик элемента, включен-
ного в замкнутую систему (рис. 3.7), не имеет принципиального
отличия по сравнению с частотным анализом в разомкнутой си-
стеме. В обоих случаях необходимо измерять параметры двух сигна-
лов — на входе и выходе исследуемого элемента.
Экспериментальное определение частотных характеристик не-
устойчивых объектов затруднено и может быть осуществлено при
включении таких объектов в контур с обратной связью через кор-
ректирующую цепь с подобранными по априорным данным или
экспериментально параметрами так, чтобы образованный замк-
нутый контур был устойчив.
Интерпретация результатов, полученных при эксперименталь-
ном определении частотных характеристик динамического объек-
та, является заключительным этапом получения математического
описания этого объекта. Обычно требуется найти аппроксимиру-
ющее аналитическое выражение W(s) по экспериментальной ам-
плитудно-фазовой характеристике. При этом, как правило, воз-
никают две задачи:
1) выбор порядков полиномов в числителе и знаменателе пе-
редаточной функции системы
bmsm + Vis'”-1 +... + Дд + Д).
FK(s)=-------
a„sn + а„_1$ +... + + Об
(3.8)
2) определение параметров Ьь ..., bm, ац, ah ..., а„ по экс-
периментальным данным.
65
Задача выбора порядков полиномов т и п во многом зависит
от наличия априорной информации и, в частности, от знания
механизмов физико-химических процессов, происходящих в изу-
чаемой системе, целевого назначения математического описания,
и, наконец, количества экспериментальных данных. Процесс вы-
бора т, п в значительной мере носит эвристический характер и
довольно трудно поддается формализации. Используются преиму-
щественно методы [24], основанные на решении в неявной фор-
ме экстремальной задачи по нахождению таких т*, п*, а*, Ь*, что
inf, J (a, b, т, п) = J(a*, b*, т*, л*), (3.9)
п, meV
где т < п; а = {а0, ah ..., а„}; b = {Ьо, Ь\, ..., 6m}; М, V — множества
возможных значений а, b и т, п соответственно.
Множества М, V можно задать наложением ряда условий на а,
Ь, т, п, например условий положительности всех главных мино-
ров определителя Гурвица, условий ограниченности а„ Ь/, i = О,
1, ..., л; j = 0, 1, ..., т и т.д. Функция J(a, b, т, п) является
неотрицательной функцией переменных а, Ь, т, л; например,
имеет вид
J (а, Ь, т, л) = {[Re (ю4) - Re3 (о\ )]2 + [im (со*) - Im» )]2},
где Re(coJ, Re3(<oA), Im(coJ, Im3(cot) — значения вещественных и
мнимых составляющих аппроксимирующей ГИ(усо) и эксперимен-
тальной И^О’со) частотных характеристик соответственно.
Заметим, что эта задача является неустойчивой и имеет не един-
ственное решение.
Если числа пит заданы или определены, то коэффициенты
а* и Ь*, обусловливающие условный минимум функции J(a, b),
находят путем решения задачи (3.9) обычно методом наимень-
ших квадратов.
Рассмотрим один из возможных путей реализации этого ме-
тода.
Примем, что в результате проведенного эксперимента получе-
но N значений передаточной функции исследуемого объекта для
частот со* (к = 1, N^:
Ш (М) = u ) + jv (со*) = “к + jvk • (3.10)
Подставляя в аппроксимирующее выражение искомой переда-
точной функции (3.8) s = у®, получим
66
и7(.х Л>1(®) +
<311>
где Pml(co), Ри1(<о) — полиномы четных степеней co; Pm2(co), Рпг(®) —
полиномы нечетных степеней со.
Приравнивая значения экспериментальной и аппроксимирую-
щей передаточных функций на одних и тех же частотах ык, полу-
чим
Л,! M+JPmlM .
ШНШ) к Jk’
откуда следует
Рт\ (ю* ) = UkP„i (со* ) - VfcP„2 (®* ),
Рщ2 (®* ) = vkPn\ (®t ) + икРп2 )• 0.12)
Не теряя общности, можно принять коэффициент а0 в (3.8)
равным единице, тогда
«/2
Pni (ю*) = £(-!) «г/®2' = 1 + Л* (®Д (3.13)
1=0
Учитывая (3.13), решением системы (3.12) будет
Uk = Pml (®Jt ) - UkPni (®Л ) + VkPn2 (®t ),
vk = Pm2 (<®Jt ) ” vkPnl (®t) ” ukPn2 (®t )•
Введем следующие обозначения:
R = [Ub U2, ..., UN]T , I = [V|, V2, ..., Vjvf ,
T, = diagR, T2 = diagl,
Pml = [®ita (-1)“]. « = 0, m/2,
Pm2 = [®it“+1 (-1)“], a = 0, (m -1)/2,
рл1=[со^(-1)₽], р = Г«72,
67
P„2=[coF+,(-1)₽]> ₽ = 0, (л-1)/2.
В этом случае уравнение (3.14) может быть записано в матрич-
ной форме:
Bi
Pml 0 “71Рл1 ^2Рл2 В2 R
О Рт2 ~^Рл1 “ Т|Рп2. А] I
.Аг.
где At = [1, а2, а4, ап1]Т; А2 = [аь а3, ...,.а„2]т; В, = [/>0, b4,
bml]r; В2 = [Z>b b3, bm2]T, или, вводя соответствующие обозна-
чения, можно записать в более компактной форме
Du = С. (3.15)
Для решения системы (3.15) используем метод наименьших
квадратов, при этом будем искать решение и, обеспечивающее
минимум функционалу Е = еге, где е = С - Du. Решение в этом
случае будет иметь вид
u = (DrD) 1 DrC. (3.16)
Естественно, что использование выражения (3.16) для нахож-
дения оценки коэффициентов передаточной функции и справед-
ливо при существовании обратной матрицы (DrD)-1. Однако в связи
с тем, что элементы матрицы D могут отличаться друг от друга на
несколько порядков, непосредственное использование (3.15) для
нахождения неизвестных коэффициентов, как правило, не дает
удовлетворительных результатов.
В целях снижения ошибки численного решения исходную си-
стему уравнений (3.15) можно подвергнуть масштабированию. Для
выполнения этой процедуры вводится диагональная масштабиру-
ющая матрица А, у которой элементы = 1/1 rf,y| тах, т.е. масшта-
бирование ведется по максимальному по абсолютной величине
элементу столбца матрицы D. После масштабирования система
(3.15) принимает вид
(DA)A-'u = С,
и ее решение дает вполне удовлетворительные результаты.
На практике достаточно широкое применение нашло использо-
вание логарифмических частотных характеристик при проведении
аппроксимации искомой передаточной функции набором анали-
тических выражений, описывающих типовые звенья систем управ-
ления. При этом если априори известно, что передаточная функ-
68
ция устойчивого линейного объекта не содержит полиномов —
передаточных функций неминимально-фазовых звеньев, опреде-
ление параметров такой передаточной функции можно проводить
только по измеренной амплитудно-частотной характеристике.
3.5. Определение динамических характеристик линейных
объектов при апериодических воздействиях
Методы экспериментального определения частотных характе-
ристик объектов управления, базирующиеся на использовании
периодических воздействий, требуют наличия специальной аппа-
ратуры и связаны с проведением сравнительно длительных экс-
периментов. Поэтому в ряде случаев в целях экономии времени и
упрощения эксперимента частотные характеристики линейных
объектов определяют при каком-либо непериодическом входном
воздействии. При этом на вход исследуемого объекта целесообраз-
но подавать одно из типовых воздействий, имеющих известный
спектр (табл. 3.1). Выбор испытательных сигналов определяется
особенностями исследуемого объекта. Так, если объект допускает
длительное изменение режима работы, на его вход можно пода-
вать ступенчатое воздействие. В других случаях могут быть исполь-
зованы воздействия в виде прямоугольного импульса или серии
из двух или нескольких импульсов различного знака. Путем изме-
нения длительности апериодических воздействий можно в широ-
ких пределах регулировать частоты их спектральных компонент.
С помощью методов, основанных на использовании апериоди-
ческих воздействий, обычно оценивают только амплитудно-час-
тотные характеристики объектов, применяя цифровую регистра-
цию входных и выходных процессов. Это позволяет использовать
для спектрального анализа записанных процессов программные
способы реализации дискретного преобразования Фурье с помо-
щью ЭВМ.
Простейшим испытательным сигналом является ступенчатый
сигнал, который может быть легко сформирован путем включения
(или выключения) управляющего входного воздействия (напря-
жения, тока и т.д.). Ступенчатые сигналы используют как в режи-
ме активной, так и пассивной идентификации, что является до-
полнительным преимуществом данного способа идентификации.
Действительно, подобные возмущения часто возникают в реаль-
ных системах в процессе работы. Их можно сформировать и искус-
ственно. Поэтому переходные функции можно записать, не нару-
шая рабочего режима системы.
Естественно, необходимо подчеркнуть, что идентифицируе-
мый объект должен быть стационарным и близким к линейному в
зоне амплитуд ступенчатых сигналов.
69
о
Апериодические воздействия, применяемые при идентификации линейных объектов
Таблица 3.1
Вид воздействия Графическое изображение Математическое выражение Преобразование Фурье Частотный спектр
Ступенчатая функция и п , ч [0, t < 0 и (j<o) = А/ JO) |iZ (»| = Л/ш Л
А
v t U CD
«Реальная» ступенчатая функция и «(')= 0, t < 0 — t, tl A, tl < t < 00 1^0)1 n
/1 /1 / • / । / । А
11
v fl f я 2л со*1
Прямоугольный импульс и 0 «(') = a Л VI О ° \Trt. \i 4A . o)T |tA(jo))| = —sm — л
А t
и 2n 4n oT
Двуполярный прямоугольный импульс и А 0 -А 1 «(')=• СЧ Л VI Л VI О О o' 4 \U (Jco)| = sin2 coT n
Т
7 -A, T/2<t<T
и n 2n erf
Реакция объекта
Рис. 3.8. Реакция объекта управления на импульсное воздействие:
1 — в виде 8-функции; 2 — в виде «реального» импульса
Идентификация линейного объекта с использованием импуль-
сной переходной функции может быть осуществлена только в ре-
жиме активного эксперимента, при котором на вход исследуемо-
го объекта подается импульсный сигнал, представляющий собой
дельта-функцию (5(/)). По определению, дельта-функция — им-
пульс нулевой ширины с площадью, равной единице, и, следо-
вательно, с бесконечной амплитудой. Поэтому очевидно, что прак-
тически реализовать эту функцию невозможно, однако ее можно
аппроксимировать импульсом с шириной т -> 0 и площадью, рав-
ной единице. В процессе проведения эксперимента воздействие на
объект дельта-функцией имитируется кратковременной подачей
сигнала с максимально допустимой амплитудой. Конечно, реак-
ция объекта на идеальный импульс (кривая 1 на рис. 3.8) и ап-
проксимированное воздействие, т.е. реакция на «реальный» им-
пульс (кривая 2), будут отличаться, и эту ошибку необходимо
учитывать при нахождении математического описания по импульс-
ной переходной функции.
3.6. Обработка результатов эксперимента по снятию
переходных функций
Регистрация переходных процессов в реальных промышленных
условиях происходит в условиях воздействия различного рода по-
мех и возмущений. Поэтому для повышения достоверности ре-
зультатов необходимо провести серию опытов. В этом случае реак-
цию объекта в каждом из опытов можно представить в виде z(0 =
=y(z) + «(Z), где y(Z) — реакция объекта на испытательный сиг-
нал при отсутствии помех и случайных флюктуаций; n(t) — ре-
зультирующая помеха, которая изменяется в зависимости от кон-
кретных значений помех и случайных флюктуаций в процессе
опытов.
Конечно, это наиболее простая модель реакции объекта, пред-
полагающая наличие только аддитивной помехи и исключающая
71
мультипликативную помеху. Тем не менее в значительной части
случаев такой подход оказывается оправданным.
Определение параметров математической модели, например
коэффициентов дифференциального уравнения, по переходному
процессу, искаженному помехой (рис. 3.9), оказывается возмож-
ным только лишь после соответствующей обработки, заключаю-
щейся в выделении из сигнала z(t) «истинного» переходного про-
цесса Х0-
Если л(/) представляет собой стационарный случайный про-
цесс с нулевым математическим ожиданием, что часто соблюда-
ется на практике, y(t) можно найти из оценки математического
ожидания M{z(t)} по множеству экспериментально снятых пере-
ходных процессов Zi(t), i = 1, 2, ..., N. При достаточно большом
значении N оценку переходного процесса можно получить по фор-
муле
- 1 N
Однако для получения достоверных результатов число экспе-
риментов в зависимости от мощности помехи и требуемой дис-
персии оценки y(t) может достигать нескольких десятков, а то и
сотен, что делает изложенный подход практически неприемле-
мым как по трудоемкости, так и по условиям проведения экспе-
римента на промышленных объектах. Поэтому особый интерес
представляют методы выделения полезного сигнала с примене-
нием различных способов сглаживания по одной реализации пе-
реходного процесса. Следует заметить, что получаемые при этом
оценки y(t) всегда являются смещенными, так как любую проце-
дуру сглаживания можно интерпретировать как прохождение сиг-
Рис. 3.10. Частотная характеристика
фильтра |Жф (усо)| (7) и частотные
спектры «полезного» сигнала
5^с(со) (2) и помехи 5п(со) (-7)
Рис. 3.9. «Реальный» z(t) (7) и «ис-
тинный» y(t) (2) переходные про-
цессы на выходе объекта управле-
ния
72
нала z(t) через фильтр, отделяющий в основном «полезный» сиг-
нал от более высокочастотной помехи. Из рис. 3.10, на котором
показаны частотная характеристика возможной реализации филь-
тра | Нф(У®) I и частотные спектры «полезного» сигнала 5П с(<п) и
помехи 5П(©), видно, что часть помехи пропускается при подав-
лении части «полезного» сигнала.
Одним из распространенных способов сглаживания переход-
ных процессов является метод сглаживания «скользящим усредне-
нием», заключающийся в последовательном осреднении экспери-
ментальных ординат на некотором интервале около данного зна-
чения I, осуществляемый по формуле:
1 'Ч/2
y(f) = — J z(t)dt.
1 t-T/2
Для дискретного случая осреднение выполняют на некотором
интервале времени /А/ по аналогичной формуле
- 1 1
yj+i/2 = £ Zj+p, (3.17)
' + 1 р=о
где у у = у (/у), Zj = z(tj) — соответственно ординаты оценки пере-
ходного процесса и ординаты экспериментального переходного про-
цесса, полученного его дискретизацией с интервалом At =tj- tj_ ( =
=const(y = 0, 1, ..., N).
Рассмотренный алгоритм осреднения эквивалентен сглажива-
нию процесса линейным фильтром с длиной памяти Т = lAt и
амплитудно-фазовой частотной характеристикой вида
мл / • \ 2 . (olAt
Подобный фильтр не пропускает или существенно ослабляет
гармонические составляющие функций z(t) с частотами выше
сов = 2л/(/А/). Исходя из этого необходимо правильно выбрать ве-
личину I (как видно из (3.17), значение I удобно брать четным).
Занижение памяти lAt ведет к недостаточному выравниванию экс-
периментальных данных, а завышение — к искажению суще-
ственных особенностей уу и потери части ординат уу с номера-
ми j = 0, 1, ..., 1/2 - 1 и j = п - 1/2 + 1, п - 1/2 + 2, ..., п. Обычно
рекомендуют вначале взять / = 2—4, оценить качество сглажива-
ния и, если необходимо, увеличить значение /.
Вследствие того, что начальный участок переходной функции
А(/), получаемой путем нормировки реакции у(/), т.е. деления
у(Г) на амплитуду входного воздействия UB, определяет структуру
73
искомой передаточной функции, а конечный — коэффициент
усиления исследуемого объекта, для сглаживания скользящим
средним необходимо начинать регистрацию процесса z(t) несколь-
ко раньше момента приложения входного воздействия и прекра-
щать при t > Тп, где Тп — длительность переходного процесса.
Другим способом сглаживания является метод сглаживания
четвертыми разностями, который заключается в аппроксимации
с помощью метода наименьших квадратов каждых пяти соседних
значений экспериментальной кривой z(/7) параболой второго по-
рядка. При этом вычисляют лишь разность между параболой и зна-
чением средней из пяти ординат затем осуществляют сдвиг
вправо на один номер J и опять определяют поправку для значе-
ния функции Zj+ j. Величина этой поправки пропорциональна цен-
тральной четвертой разности o4zy функции zj-
d^Zj = Zj-2 - 4zj-i + 6zj - 4zJ+i + Zy+2; j = 2,3,..., N - 2.
Оценку функции вычисляют по формуле
1 4
X =zJ~i2aZj'
Известны формулы вычисления у(), у]гу, позволяю-
щие избежать потери четырех значений оценки у,.
Метод сглаживания переходных функций разложением в ряд Фу-
рье также основан на различии частотных составляющих y(t) и
n(t). Действительно, коэффициенты их разложения в ряд Фурье
будут убывать с различными скоростями: коэффициенты разло-
жения шума обычно уменьшаются медленнее, а их знаки изменя-
ются случайным образом. Поэтому если разложить заданную экс-
периментальную функцию z(tj) в ряд Фурье, то первые (быстро
убывающие) коэффициенты будут в основном относиться к ис-
комой функции Х0- В предположении, что спектральные компо-
ненты шума n(t) в основном относятся к высокочастотной обла-
сти, процедура сглаживания будет состоять в отбрасывании этих
высокочастотных компонент и синтезе у(/) с использованием толь-
ко оставшихся членов разложения.
Конечно, при этом первые коэффициенты разложения экспе-
риментальной передаточной функции будут отличаться от коэф-
фициентов Фурье «истинной» переходной функции, так как ор-
динаты линейчатых спектров ХО и n(t) не могут быть разделены
без дополнительных сведений о статистических характеристи-
ках шума. Ошибка сглаживания пропорциональна отношению
«шум: сигнал», т.е. качество сглаживания ухудшается при увели-
чении среднеквадратического значения мощности n(t).
74
Практические аспекты методики сглаживания эксперименталь-
ной переходной функции с помощью разложения в ряд Фурье
изложены в [22]. На аналогичной идее разделения полезного сиг-
нала и шума по скорости убывания коэффициентов разложения
основано использование для сглаживания экспериментальных пе-
реходных процессов полиномов Чебышева.
Оценку качества сглаживания экспериментальных переходных
функций можно найти по величине дисперсии
D = M
d<o
где М— математическое ожидание по множеству переходных функ-
ций, сглаженных одним и тем же способом; W(j<a) — ам-
плитудно-фазовые частотные характеристики, найденные соот-
ветственно из сглаженной h(t) и «истинной» h(t) переходных
функций; [<О|, ©2] — интервал частот, в котором определяют ча-
стотные характеристики.
Применение такого критерия сглаживания оправдано тем, что
на практике точное знание частотной характеристики требуется
лишь в определенном диапазоне частот.
В книге [22] приведены оценки рассмотренных методов сгла-
живания. Наилучшее качество сглаживания переходных функций
обеспечивает применение полиномов Чебышева и рядов Фурье,
худшие результаты получаются при сглаживании зашумленных
функций методами четвертых разностей и скользящего среднего.
Однако объем выкладок при сглаживании последними двумя спо-
собами в 3—4 раза меньше.
3.7. Определение частотных характеристик объектов
управления по переходным функциям
Для построения математических моделей идентифицируемых
объектов по экспериментальным временным характеристикам
применяют различные методы. Одним из распространенных спо-
собов определения коэффициентов дифференциального уравне-
ния или параметров частотной характеристики объекта является
метод, основанный на аппроксимации полученной h(t) решени-
ем линейного дифференциального уравнения
йл + °я-' + - + W = Ьт + - + h°X (3‘18)
75
с постоянными коэффициентами и нулевыми начальными усло-
виями, где x(t) является испытательным воздействием в виде еди-
ничной ступенчатой функции.
Заметим, что достоверные результаты при такой идентифика-
ции с помощью экспериментальных переходных функций могут
быть получены только для линейных систем при условии, что в
процессе проведения эксперимента при t < 0 координата y(t) =
=Уо = const и все ее производные равны нулю при t = 0. Учитывая,
что при описании системы линейным дифференциальным урав-
нением величины и >’о связаны линейным алгебраическим урав-
нением статики и выбор их не оказывает влияния на динамиче-
ские свойства, удобнее формально принимать = у0 = 0.
Далее следует обратить внимание на то, что рассматриваемые
методы основываются на предположениях о неизменности во вре-
мени динамических свойств и сосредоточенности параметров ис-
следуемого объекта. Необходимость выполнения первого требова-
ния была достаточно подробно рассмотрена ранее, поэтому оста-
новимся лишь на втором.
Ранее отмечалось, что реальные промышленные объекты яв-
ляются системами с распределенными в пространстве параметра-
ми, а следовательно, переходные функции Л(/) таких систем яв-
ляются решениями дифференциальных уравнений в частных про-
изводных. Поэтому точная аппроксимация h(t) решением урав-
нения (3.18) возможна лишь при п -> <», щ -> <». Иначе говоря,
точное значение h(t) определяется бесконечно большим числом
составляющих решения типа с,е_“'', где с,- — число или полином
от Г, at — вещественное или комплексное число. Распределенность
параметров исследуемого объекта проявляется в основном в мед-
ленном изменении функции А(/) в начальные моменты времени t.
Поэтому бесконечно большое число составляющих типа с(е*“'' не-
обходимо для аппроксимации лишь начального участка h(t). С уве-
личением номера составляющей i модуль | а, | и составляю-
щие с этими номерами не оказывают заметного влияния на фор-
му А(/) при больших значениях времени. Следовательно, эти со-
ставляющие влияют преимущественно на аппроксимацию началь-
ного участка экспериментальной переходной функции, что в свою
очередь позволяет аппроксимировать данный участок введением
чистого запаздывания.
Рассмотрим в качестве примера аппроксимацию h(t) решени-
ем дифференциального уравнения с простыми вещественными
корнями. Этот метод аппроксимации применим в тех случаях, когда
переходная функция имеет гладкий неколебательный характер.
Идея метода заключается в последовательном приближении экс-
периментальной h(t) решением дифференциального уравнения
порядка п с правой частью типа «ступенчатая функция»:
76
(3.19)
где c0 = й(~) = h(Ty\, [0, 7}.] — отрезок времени, на котором
задана экспериментальная переходная функция; с„ а, — веще-
ственные числа, причем корни характеристического уравнения а,
должны удовлетворять эмпирическому неравенству
-^-<0,5-0,7; / = 1, 2,..., л -1.
aI+i
Эти условия означают, что у соответствующей дифференци-
альному уравнению (3.18) передаточной функции И/(б) имеются
только вещественные простые полюсы, расположенные на доста-
точно большом расстоянии друг от друга по действительной оси,
а сама передаточная функция имеет вид
где А — амплитуда ступенчатой функции на входе исследуемого
объекта.
На практике нахождение параметров а, и с, осуществляют сле-
дующим образом: вначале h(t) аппроксимируют решением урав-
нения первого порядка, т.е. функцией qe-011'. В этом случае мож-
но написать приближенное равенство
h(t) = co -qe-"1',
(3.20)
откуда
Л1(/) = Св-А(/)ас1е-“1'.
Соотношение (3.20) будет верным при достаточно больших
значениях времени t, когда влиянием других составляющих с,е_а/'
можно пренебречь. Прологарифмировав функцию 11^(1) |, полу-
чим уравнение прямой линии в полулогарифмическом масштабе
по оси ординат:
In |А] (/)| = In С] - И|Л
(3.21)
Из (3.21) нетрудно определить неизвестные величины а, и ct.
Для этого строят график зависимости In | h^t) | (рис. 3.11). К функ-
ции In | hi(t) | проводят асимптоту при t Ту, которая отсекает на
77
Рис. 3.11. Графики переходной функции h(t) (а) и функций логарифмов
вспомогательных функций ht(t) и й2(0 (б)
оси ординат некоторый отрезок, равный Inc,. Корень а, равен
тангенсу угла наклона асимптоты к оси абсцисс:
1ПС1
“1=V
где /] — точка пересечения асимптоты с осью времени.
Если аппроксимация соотношения (3.20) оказывается неудов-
летворительной, то вводят вторую составляющую с2е_“2', и для
нахождения параметров а2 и с2 рассмотренным выше способом
вычисляют функцию
й2(/) = й1(/)-С1е-“1'.
Процесс приближения h(t) выражением (3.19) прекращается
тогда, когда функция й„(/) = 0 с точностью 1 — 2% значения
h(Ty).
Знаки переменных интегрирования с, определяют по знакам
соответствующих функций h^t).
Во многих случаях, когда требуется найти аналитические вы-
ражения для передаточных функций идентифицируемых объектов
по записям переходных процессов, удается использовать доста-
точно простые графические методы.
Для объекта, математическая модель которого представляет зве-
к
но первого порядка W\s) =
Ts + V
переходная функция описыва-
ется выражением
h(t) = к(1-е~‘/т),
78
откуда видно, что при t=T функция
А(/) = Л(1-0,37) = 0,63Л.
(3.22)
Из соотношения (3.22) следует, что постоянная времени ис-
следуемого объекта Т в этом случае равна отрезку времени, за
который переходная функция достигает 63 % своей установившейся
величины, т.е. h(t) = 0,63Л„.
Постоянную времени Т можно определить и другим способом,
используя касательную к переходной функции на начальном уча-
стке (при t = 0). Действительно, наклон кривой h(t) при t = 0
равен
_ к -t/T _
а/ т ,_о г
Изменение касательной во времени можно определить следу-
ющим образом:
ЧЧ')—'.
откуда следует, что при t = Т касательная Ч*(/) достигает значения к,
т.е. пересечение касательной с уровнем установившейся величи-
ны сигнала происходит при t~ Т(рис. 3.12).
Коэффициент к определяют, как это отмечалось ранее, соот-
ношением между установившимся значением выходного сигнала
объекта и амплитудой входа.
Можно воспользоваться и простым графическим методом, по-
зволяющим находить приближенное математическое описание апе-
риодической системы высокого порядка. При этом полагают, что
«истинная» передаточная функция, содержащая звенья с различ-
Рис. 3.12. Определение постоянной
времени Т апериодического звена
по переходной функции
Рис. 3.13. Обобщенная переходная
функция апериодической системы
высокого порядка
79
ними постоянными времени, может быть аппроксимирована пе-
редаточной функцией, имеющей п одинаковых постоянных вре-
мени:
= (7’15 + 1)(Т25 + 1)...(7’л5 + 1) =
где к — коэффициент усиления системы в установившемся состо-
янии.
Используя обобщенную переходную функцию апериодической
системы высокого порядка (рис. 3.13), по точке перегиба Q можно
определить значения Та, ..., Т,.
Далее (табл. 3.2) определяют значение п из соотношения Та/Ть
(и проверки по отношению 7}/Ть).
Значение т можно найти по величине Та/х и проверить по Тут,
Т/т, Т/т (табл. 3.3).
Рассмотрим графический способ определения параметров пе-
редаточной функции колебательного звена второго порядка по
экспериментальной переходной функции. Известно, что переда-
точная функция такого звена может быть представлена в виде
к
(7s)2+2£7s + l’
где 0 < £ < 1; Т= 1/соо-
Величина к определяется отношением выходного и входного
сигналов в установившемся режиме. Коэффициент относительно-
го затухания £ связан с перерегулированием зависимостью, пока-
занной на рис. 3.14.
Таблица 3.2
Данные для определения показателя степени л
п 1 2 3 4 5 6 7 8 9 10
TJTb 0 0,104 0,218 0,319 0,410 0,493 0,570 0,642 0,709 0,773
т,/ть 1 0,736 0,677 0,647 0,629 0,616 0,606 0,599 0,593 0,587
Таблица 3.3
Данные для определения значения т
п 1 2 3 4 5 6 7 8 9 10
TJX 0 0,282 0,805 1,425 2,100 2,811 3,549 4,307 5,081 5,869
Ть/х 1 2,718 3,695 4,463 5,119 5,699 6,229 6,711 7,164 5,590
Td/x 0 1 2 3 4 5 6 7 8 9
Т,/г 1 2 2,5 2,888 3,219 3,510 3,775 4,018 4,245 4,458
80
Рис. 3.14. Зависимость между затухани-
ем и перерегулированием колебатель-
ного звена
Определив графически коэффициент собственную частоту
звена соо можно найти из выражения
<о0 = соД/1 - ,
где о = 2л/0; 0 — период затухающих колебаний, определяемый
из графика экспериментальной переходной функции.
Темы для повторения
1. Теоретические предпосылки использования периодических сигна-
лов при экспериментальном определении частотных характеристик объек-
тов управления.
2. Характеристики динамического объекта, определяемые на этапе его
предварительного исследования.
3. Свойства алгоритмов расчета параметров частотной характеристи-
ки идентифицируемого объекта, основанные на вычислении коэффи-
циентов Фурье.
4. Основные структурные схемы определения частотных характерис-
тик идентифицируемых объектов с помощью гармонических анализато-
ров.
5. Особенности применения метода наименьших квадратов при опре-
делении параметров аппроксимирующей функции по эксперименталь-
ным значениям частотной характеристики.
6. Требования к виду и параметрам тестовых апериодических сигна-
лов, используемых при экспериментальном определении динамических
характеристик объектов управления.
7. Примеры алгоритмов сглаживания экспериментальных динамиче-
ских характеристик объектов управления, их преимущества и недостат-
ки.
8. Особенности методики определения параметров частотной харак-
теристики объекта управления, основанной на аппроксимации экспе-
риментальной переходной функции h(t).
Глава 4
СТАТИСТИЧЕСКИЕ МЕТОДЫ ИДЕНТИФИКАЦИИ
4.1. Уравнение статистической идентификации
Для линейных одномерных стационарных динамических объек-
тов зависимость между реакцией у(0 и воздействием u(t), как
было показано ранее, может быть задана в виде интегральной связи
y(t)~ jw(T)«(/-T)(iT, (4.1)
о
где «(/) = 0 при t < 0, а импульсная переходная функция (ИПФ)
w(t) является непараметрической моделью объекта. Для опреде-
ления ИПФ из уравнения (4.1) можно использовать случайные
сигналы, действующие на входе и на выходе исследуемого объек-
та в режиме нормального функционирования. При этом, строго
говоря, необходимо иметь измеренные значения сигналов на вхо-
де и выходе объекта в моменты времени от t = 0 до t = «>. Однако,
учитывая очевидные свойства ИПФ устойчивых систем, для кото-
рых
limw(x) = О,
интеграл свертки (4.1) можно записать в виде
т
у(0 = Jw(t)«(/-T)dT, (4.2)
о
где Т — момент времени, начиная с которого весовая функция
w(Z) не выходит из заранее заданного коридора.
Уравнение (4.2) находит весьма ограниченное применение для
нахождения ИПФ в силу вычислительных трудностей, связанных
со случайной формой сигналов и сложностью их аппроксимации
и(0
Объект
п(0
у(0
Рис. 4.1. Схема объекта управления при дей-
ствии аддитивной помехи и(0, приведен-
ной к его выходу
82
аналитическими выражениями. Это обстоятельство заставляет ис-
пользовать вместо случайных сигналов их статистические характе-
ристики (корреляционные или спектральные).
Приняв, что все сигналы являются центрированными, для
взаимной корреляционной функции сигналов линейного объек-
та (рис. 4.1) можно записать
^да(/)= Um-L J ф)и(т-Г)<к = Urn-?- J у(т)«(т-/)ат +
:тт ~т (4.з)
+ £тТг I п(у)и^-^ = Kyu(t)+ Knu(t).
т->«> 27 _т
Подставив в выражение (4.3) интеграл свертки (4.1), связыва-
ющий входной и выходной сигналы, и учитывая, что Knu(t) = О,
получим
т
Kyu(t)=lim^- j M(T-/)Jw(X)M(T-X)dXdT =
°°2У _т 0
оо Г ] Т
= — J «(T-/)w(T-X)dT >dX
о t 2Г _г
и, следовательно:
Kyu(t) = Jw(X)^u(/-X)dX. (4.4)
о
Выражение (4.4) представляет собой уравнение статистичес-
кой идентификации линейного динамического объекта, которое
получило название уравнения Винера—Хопфа.
Для линейных нестационарных объектов, находящихся под воз-
действием нестационарного случайного сигнала с корреляцион-
ной функцией Kuu(tx, т), уравнение Винера—Хопфа имеет вид
*2
Куи = J w(z2,t)A;u (A,t)dT, (4.5)
где Kyu(t2, t[) — взаимная корреляционная функция входного и
выходного сигналов.
Уравнение (4.5) аналогично основному уравнению статисти-
ческой теории оптимальных систем. При условии некоррелиро-
ванности внутренних помех и внешних возмущений и точном за-
дании корреляционных функций решение данного уравнения дает
ИПФ наилучшего приближения в смысле минимума среднеквад-
ратичной погрешности. Отметим также, что уравнение (4.5) име-
ет смысл только при t2 > т, так как при t2 < т получим w(t2, т) = 0.
83
Рис. 4.2. Корреляционная функция нестацио-
нарного «белого шума»
В ряде частных случаев уравнение идентификации (4.5) можно
упростить. Если на входе объекта действует «белый шум» с интен-
сивностью S(t), то корреляционная функция Kuu(t\, т) может быть
представлена в виде (рис. 4.2):
^и(Ал) = 5(6)8(6-т).
Используя фильтрующее свойство 3-функции, получим
w{h^-~sW
При воздействии на вход нестационарного объекта стационар-
ным сигналом с корреляционной функцией Kuu(ti, т) = Kuu(tx - т)
уравнение статистической идентификации приобретает вид
*2
Kyu{t2,ti)= J w(t2,i)Kuu{ti -T)dT.
Если входной сигнал нестационарен, но его спектральный со-
став изменяется во времени несущественно, то корреляционная
функция может быть определена двойным (по времени и множе-
ству) усреднением:
Kuu(t\,i) = М {Kuu(t\-т)} = кии^ -т).
В тех случаях, когда идентифицируемый объект имеет конеч-
ную «память» Т, что означает обращение в нуль импульсной пе-
реходной функции w(t2, т) для всех значений аргумента т < t2 - Т,
уравнение (4.5) можно записать в виде
h
Kyu(t2,h)= J м'(/2,т)А'ии(/1,т)с1т.
t2~T
Аналогично записывается уравнение с «памятью» и для стацио-
нарной системы. Можно заметить, что в уравнении идентифика-
ции с «памятью» значение «памяти» Т в общем случае является
неизвестной величиной.
84
Во всех рассмотренных вариантах уравнения статистической
идентификации предполагалось, что момент начала отсчета реа-
лизаций сигналов выбирается произвольно, и он не связан с мо-
ментом включения идентифицируемого объекта. Это вынуждает
учитывать в объекте запас энергии, накопленной за время от
до момента t = 0, непосредственно предшествующего началу ана-
лиза, полагая нижний предел интегрирования в уравнении (4.5)
равным -о». Однако если момент начала идентификации совпадает
с моментом начала функционирования объекта при нулевых на-
чальных условиях, то в силу принципа причинности для всех т < О
импульсная переходная функция равна нулю. Поэтому уравнение
(4.5) будет иметь вид
h
Куи (/2,А) = Jw(t2,x)Kuu (/ьт)дт.
о
Однако уравнение статистической идентификации в виде (4.5)
представляет более общий случай, относящийся к идентифика-
ции непрерывно функционирующей системы, и его решение в
ряде случаев оказывается проще, чем в случае, когда моменты
начала функционирования объекта и начало идентификации со-
впадают.
4.2. Уравнение статистической идентификации
в частотной области
В современной теории управления для описания динамических
свойств систем управления широко используют частотные пред-
ставления. Описание систем в частотной области и определение
частотных характеристик во многих случаях оказываются более
экономичными и удобными.
Пусть на входе непрерывно функционирующей нестационар-
ной системы действует стационарный случайный сигнал, т.е. для
каждого фиксированного t2 можно записать:
Куи (h, А) = J w(h, т)Кии (А - x)dx. (4.6)
Умножив обе части уравнения (4.6) на е-7®'1 и проинтегриро-
вав по ti в пределах от до +~, получим
J = J e->''d/i ] w(t2,x)Kuu(ti - t)dt =
= J w(/2,t)dTj Q-^Km(tx -T)d/p
85
Проведя в правой части этого уравнения замену переменной
х = - т, после некоторых преобразований получим
j Куи (/2,/‘1)е’у<0'1с1^1 = j A'uu(x)e^“xdx j w(t2,x)e~Jmdx. (4.7)
— oo —oo —oo
tl
Если ввести под знак интеграла j w(r2,T)e~ycOTdT множитель
_ j, тогда находим
| w(t2,T)e~J<meJ<a,2e~J,a,2dT = е~^2 j и'(/2,т)е7<о('2’х)0т. (4.8)
Интеграл в правой части выражения (4.8)
] w(/2, т)еуш(/2“т^т = W* (усо, /2) (4.9)
является комплексно-сопряженным выражению
f w(/2, 'с)е“у‘^'2“хМт = W(у со, t2),
которое определяет собой параметрическую частотную характе-
ристику нестационарной системы. Следовательно, из (4.7) с уче-
том (4.9) имеем
J Kyu(t2,t^-iwt^h =е-^ Je-^au(x)dx»r*(j«>,/2),
откуда, введя замену tt - t2 = в, получим
J Куи (h,t2 + 0)е-'“М0 = ] с1акКш (x)dxr*(yco, h)- (4.10)
Учитывая
J Kyu (t2, t2 + 6)e~y<o0d6 = Syu (jdi, t2), f Kuu (x)e~Jwcdx = Suu (co),
из выражения (4.10) следует, что
(4.11)
Suu (ю)
Таким образом, используя взаимную спектральную плотность
входного и выходного сигналов Syu(j(o, t2) и спектральную плот-
86
ность входного сигнала системы 5ИИ(®), можно вычислить пара-
метрическую частотную характеристику И^усо, Л) с помощью ее
комплексно-сопряженной функции FK*(y<», t2).
Для стационарной системы динамические характеристики и вза-
имная спектральная плотность не зависят от времени, а нормаль-
ная и сопряженная импульсные переходные функции совпадают,
поэтому
= (4-12)
(ю)
Если на вход системы подается «белый шум» с интенсивно-
стью Suu((o) = с, то
W (у®) = ±Syu (у®).
Импульсные переходные функции из частотных характерис-
тик, заданных выражениями (4.11) и (4.12), могут быть получены
фурье-преобразованием последних:
(4.13)
2лД 5ии(со)
1 00
27С Д
Syu (У®)
Suu (®)
ey<0'd®
(4.14)
Выражения (4.13) и (4.14) справедливы лишь в интервале ча-
стот [®ь ®2], Для которого Suu(a>) * 0. Если же на некоторых час-
тотах 5ии(ю) = 0, a Syu(Jco) 0, то подынтегральное выражение
обращается в бесконечность, и ИПФ, вычисляемые по формулам
(4.13) и (4.14), могут значительно отличаться от «истинных» им-
пульсных переходных функций.
Если исходные корреляционные функции определены с неко-
торой ошибкой, то и соответствующие спектральные плотности
также будут содержать ошибку. С учетом этого выражение (4.14)
принимает вид
(4.15)
w(0 = — J
V' 2яД Suu (®) + 8ии (®)
где 8yu(j(o), 8„u(®) — погрешности соответствующих спектральных
плотностей, обусловленные погрешностями корреляционных функ-
ций.
Непосредственно из выражения (4.15) видно, что малые ошиб-
ки могут вызвать сколь угодно большое искажение решения, если
87
на каких-либо частотах Syu(j<o) и Suu(m) соизмеримы с 8уи(У®) и
6щХ®)-
Однако получить состоятельные оценки спектральных плотно-
стей довольно сложно. Действительно, с учетом того, что оценки
корреляционных функций Kuu(t) и Kyu(t) получены на конечном
интервале времени, непосредственное применение преобразова-
ния Фурье дает несостоятельную оценку спектральной плотно-
сти, так как дисперсии оценок 5„и(со), 5>u(j(o) будут иметь тот же
порядок, что и сами спектральные плотности.
В книге [24] рассматривается способ повышения эффективно-
сти оценок спектральных плотностей путем их сглаживания с ис-
пользованием специальных весовых функций и, в частности, фор-
мулы Хемминга.
4.3. Методы решения уравнения статистической
идентификации
Наиболее простым способом решения уравнения идентифика-
ции является замена его системой алгебраических уравнений. Для
этого запишем уравнение (4.4), заменив в верхнем пределе °° на Т:
КУ» (0 = J w (т) кии {t - dr. (4.16)
О
Разбив в уравнении (4.16) интервал интегрирования Т на п
частей, введем вместо интеграла конечную сумму
л-1
Куи /Дт) w (/Дт) Дт.
1=0
Придавая t значения /Дт(/ = 0, Дт, ..., (л - 1)Ат), получим си-
стему из п уравнений с п неизвестными, которую в матричном
виде можно записать
МО) Хиа(Дт) •• кии (л-1)Дт W(0)
Кии (Д'1) М«) - КШ (л-2)Дт w(At)
/ии[(л-1)Дт] АГии[(л-2)Дт] .. М°) w[(/i-l)At]
МО)
Хуи (Дт)
1
Дт
Х,и[(л-1)Дт]
88
[Kuu][w] = [K,u],
(4.17)
где [Кии] — квадратная симметричная матрица, составленная из
значе-ний ординат корреляционной функции Kuu(t - /Ат); [w] —
матрица-столбец, элементами которой являются значения орди-
нат искомой импульсной переходной функции в точках t = 0, Т/п,
2Т/п, (п - 1)Т/п; [К>ц] — матрица-столбец свободных членов,
элементами которой являются значения ординат взаимной кор-
реляционной функции.
Здесь элементами матриц [Кии], [Куи] являются не «истинные»
значения корреляционных функций, а их оценки, полученные в
ходе проведения эксперимента по реализациям ограниченной
длины.
Попытка нахождения w(t) из системы (4.17) известными ме-
тодами решения систем алгебраических уравнений, например ме-
тодом квадратных корней или методом Гаусса, наталкивается на
определенные трудности, связанные с плохой обусловленностью
матрицы [Кии], в результате чего малым изменениям элементов
матрицы [Kuu] могут соответствовать большие ошибки в решении.
Это является следствием так называемой некорректности задачи
решения интегрального уравнения (4.16).
Таким образом, учитывая, что авто- и взаимнокорреляцион-
ные функции обычно определяются с некоторой ошибкой, сле-
дует быть готовым к тому, что полученное решение w(t) может
быть настолько искажено, что не будет иметь ничего общего с
точным решением. В общем случае для нахождения приемлемого
решения возникает необходимость использования специальных ме-
тодов так называемой регуляризации уравнения Винера—Хопфа,
о чем подробнее будет сказано далее.
Вычисление и обращение матриц корреляционных функций —
трудоемкие операции, которые заметно упрощаются, если мат-
рица автокорреляционной функции имеет ненулевые элементы
только на главной диагонали. Это наблюдается только в том слу-
чае, если значения сигнала u(t) будут ортогональны друг другу
при любых временах корреляции т > 0:
^„„(т) = 0 при т # 0,
ПРИ т = 0.
Как известно, такому условию удовлетворяет только «белый
шум», автокорреляционная функция которого имеет вид:
КМ = с^),
где 8(т) — функция Дирака; с = — интенсивность шума.
При этом из уравнения Винера—Хопфа непосредственно сле-
дует
= (4.18)
с
При практической реализации указанного подхода на вход ис-
следуемого объекта, кроме обычного входного сигнала «(/), по-
дается сигнал x(t) в виде «белого шума», интенсивность которого
равна Со (рис. 4.3). В этом случае выходной сигнал системы опреде-
ляется выражением
у(/) = J«(Z-T)w(t)dT + jx(/-T)w(t)dT,
о о
откуда можно получить
К ух (Г) = J Кт (t - т) w (т) dt + J (t - т) w (т) dx. (4.19)
о о
При отсутствии коррелированности входного u(t) и дополни-
тельного х(/) сигналов имеем K^t) - 0. В этом случае выражение
(4.19) можно записать в виде
(t) = К** (t — T)w(T)dT,
о
откуда следует (4.18).
Большим достоинством рассмотренного метода является отсут-
ствие влияния входного управляющего сигнала и внутренних по-
мех на точность определения w(t), так как коррелятор, определя-
ющий фильтрует все сигналы, некоррелированные с сиг-
налом генератора «белого шума».
Отметим здесь также и принципиальную возможность исполь-
зования рассмотренного метода для нахождения импульсной пе-
Рис. 4.3. Схема идентификации объекта при тестовом воздействии в виде
«белого шума»
90
реходной функции Ц/,т) нестационарной системы. Для такой си-
стемы можно записать:
Г2 /2
Кух (h, А) = J w(t2, т) (А, т)<1т + J w(t2, т) Кхх (А, x)dx.
о о
При этом, как и в стационарном случае, полагаем, что выпол-
няется соотношение А^Са, А) = 0 и, следовательно:
К ух (t2 ,tx) = j w (t2, т) Kyx (A, t) dt.
0
Так как
^(А,т) = й5(А-t),
TO
t2
Jw(A>,t)c<)8(/i -t)dT = qjw(A!,A)-
о
Следовательно, импульсная переходная функция w(/2,A) оп-
ределится по формуле
/. . \ Кух (^2»А )
w’(A,A) = -J-2----
со
Взаимнокорреляционную функцию Kyx(t2,1Х) для каждых фик-
сированных /| необходимо вычислять за время, в течение которо-
го параметры системы изменятся незначительно. В противном слу-
чае реализация рассмотренного метода применительно к неста-
ционарным системам невозможна.
44. Регуляризация решения уравнения статистической
идентификации
Задача идентификации, заключающаяся в решении уравнения
Винера—Хопфа, относится к классу обратных задач и является
некорректно поставленной задачей по Адамару. Задача считается
корректной, если ее решение существует, единственно и устой-
чиво относительно малых вариаций исходных данных. Ранее упо-
миналось, что даже малые вариации ядра уравнения (4.17) Киц и
свободного члена Куи могут вызвать значительные изменения ре-
шения w(f), если для решения задачи использовать обычные вы-
числительные процедуры.
Обычно вместо истинных значений корреляционных функций
используются их оценки. Неточность определения корреляцион-
ных функций, входящих в уравнение (4.17), обусловлена конеч-
91
ными длительностями реализаций входного и выходного сигна-
лов, их возможной нестационарностью, недостаточной точнос-
тью измерений. Ошибки в задании или вычислении корреляцион-
ных функций в несколько процентов могут приводить к результа-
там, имеющим мало общего с истинным решением, хотя полу-
ченные таким образом импульсные переходные функции, име-
ют, как правило, среднюю квадратичную погрешность, близкую
к минимальной. Но поскольку эти функции не соответствуют фи-
зическому смыслу процессов, протекающих в исследуемом объекте,
ценность полученного результата невелика. Физический смысл,
как правило, могут иметь только «гладкие» решения уравнения
Винера—Хопфа. Эти обстоятельства вызвали необходимость раз-
работки специальных методов регуляризации, целью которых яв-
ляется обеспечение ошибки решения такого же порядка, как и
точность задания исходных данных.
Методы регуляризации можно разбить на два типа. К первому
типу относят методы, позволяющие преобразовать исходное урав-
нение таким образом, что решение нового уравнения представля-
ет регуляризованное решение исходного. При регуляризации вто-
рого типа полученное решение исходного интегрального уравне-
ния подвергают процедуре сглаживания.
Одним из основных методов первого типа, позволяющих най-
ти гладкие регуляризованные решения уравнения Винера—Хоп-
фа, является метод регуляризации, предложенный А. Н. Тихоно-
вым и сотр. Сущность этого метода заключается в том, что для
операторного уравнения Aw = у, каким и является уравнение (4.16),
составляют функционал, содержащий две части:
О D fi 2
J = |(?lw-y)2d/+|^^[w(')] dz,
a a i=^
где q, >0(i = 0, ri) — параметры регуляризации.
Первое слагаемое функционала представляет среднеквадрати-
ческую ошибку, второе — обеспечивает выполнение требования
гладкости искомого решения, которое находят из условия мини-
мума функционала.
В качестве примера рассмотрим процесс нахождения импульс-
ной переходной функции w(f) при минимизации функционала J,
имеющего вид:
J = Ml
~т З2
J w(t)m(Z - x)dx - y(t)
.о J
+ a$[w(0] >
где a — некоторое положительное число; ?[w(0] — регуляризую-
щий (сглаживающий) функционал вида
92
<?MO] = J K(t)
dw(r)
d/
+ p(t)w2(t) dt,
причем K(t) > 0, p(t) > 0.
Условие минимума функционала J принимает вид
причем
Уравнение (4.20) отличается от уравнения Винера—Хопфа до-
полнительным членом в левой части, обеспечивающим существо-
вание, единственность, непрерывность и дифференцируемость
решения w(t). Естественно, что при а = 0 уравнение (4.20) вырож-
дается в уравнение Винера—Хопфа. Таким образом, при слиш-
ком малом значении параметра регуляризации а решение w(t)
становится плохо обусловленным, а при слишком большом зна-
чении а увеличивается среднеквадратичное рассогласование вы-
ходных координат объекта и модели. Практически параметр а обыч-
но выбирают опытным путем.
К группе методов регуляризации второго типа относят метод,
где подвергают сглаживанию полученное решение уравнения Ви-
нера—Хопфа путем использования разложения в ряд по норми-
рованной системе функций и удержания конечного числа членов
разложения. Рассмотрим кратко суть получения устойчивого ре-
шения в рамках этого метода.
Пусть в результате решения матричного уравнения (4.17) по-
лучено значение импульсной переходной функции w[«] в ряде
фиксированных точек п (п = 0, N -1). Как отмечалось выше, по-
лученные ИПФ в общем случае представляют собой сильно ос-
циллирующие функции. Подвергнем сглаживанию функцию w[zi]
путем аппроксимации ее заданной системой линейных ортонор-
мированных функций:
£стфт[л], т = 0,М,
где (рт[п] — система линейных ортонормированных функций, удов-
летворяющих условию полноты; — сглаженная импульсная
переходная функция; ст — коэффициенты аппроксимации, опре-
93
деляемые в соответствии с методом наименьших квадратов по
формуле
Ст = X W M<P»< М-
л=0
Заметим, что если система (4.17) является вырожденной, то
рассмотренный выше метод регуляризации оказывается непри-
годным. Для получения в этом случае регуляризованного решения
необходимо преобразовать исходное уравнение
л=0
(4.21)
используя аппроксимацию как искомого решения м>[«], так и пра-
вой части АЦ/], заданной системой ортонормированных функ-
ций:
м
Куи Р] = ^/ф/ Р] ,
(4.22)
м
wM [и] = X стфт [я],
м=0
(4.23)
где [/], wM [л] — аппроксимированные взаимнокорреляцион-
ная и импульсная переходная функции соответственно; bj — коэф-
фициенты, определяемые методом наименьших квадратов; ст —
неизвестные коэффициенты, подлежащие определению.
Подставляя (4.22), (4.23) в уравнение (4.21) и учитывая усло-
вие ортонормированности функций:
JV-1
Z Фт И Фу ["] =
л=0
1 при
О при
m = j;
m*J,
получим систему линейных алгебраических уравнений относитель-
но неизвестных коэффициентов ст:
м ____
У amjcm = bj, j = 0, М,
т=0
(4.24)
где anj — элементы, матрицы, которые находим из выражения
N-l N-1
amj = ЪЪК<Л1~ «]фт [«]ф/ PL
/=0 п=0
Решив систему (4.24) и подставив значения ст в (4.23), полу-
чим регуляризованное решение уравнения статистической иден-
94
тификации. Заметим, что M«N, поэтому система (4.24) име-
ет существенно меньший порядок, чем исходная система (4.17),
и обычно является хорошо обусловленной.
В качестве заданной системы ортонормированных функций могут
быть использованы функции Лагерра, Лежандра, Якоби, Чебы-
шева и др. Уместно заметить, что использование полиномов Че-
бышева целесообразно, если Kyu(t) и w(t) заданы в равноотстоя-
щих точках интервала (О, Т) и имеется априорная информация о
гладкости импульсной переходной функции [22].
4.5* Метод «типовой* идентификации объектов
управления
При «типовой» идентификации, предложенной в [23], исполь-
зуется определение передаточных функций идентифицируемых ста-
ционарных объектов по корреляционным характеристикам. Мето-
дика «типовой» идентификации применяется для класса линей-
ных моделей с передаточной функцией
_ А>д2 + +^2
v ' <V3 + alS2 + a2s + a3
Такая модель удовлетворительно описывает поведение боль-
шинства промышленных объектов, в том числе и тех, динамиче-
ские свойства которых описываются дифференциальными урав-
нениями более высокого порядка.
Суть «типовой» идентификации заключается в аппроксимации
экспериментальных значений автокорреляционной функции вход-
ного сигнала Kuu(t) и взаимнокорреляционной функции входа и
выхода Kyu(t) соответствующими аналитическими выражениями,
входящими в таблицы «типовой» идентификации, и в оценке по
этим таблицам структуры и параметров модели объекта. В основу
составления «типовых» таблиц положено свойство изменения вза-
имнокорреляционной функции в зависимости от структуры и па-
раметров модели при неизменной корреляционной функции вход-
ного сигнала. Путем варьирования структуры и параметров моде-
ли определяют семейство кривых Kyu(t), которое разбивают на
группы, причем каждой группе соответствует определенный опе-
ратор.
При составлении «типовых» таблиц в [23] используют метод
решения интегрального уравнения
= (4.25)
о
95
путем сведения его к интегральному уравнению Вольтерра перво-
го типа, которое просто решается с помощью преобразования
Лапласа. Для этого автокорреляционную функцию входа объекта
представляют в виде
Kuu{t) =
/>0,
/ < о,
(4.26)
K-uu(t),
с учетом симметричности функции справедливо
К+ии (t) = K-uu(t) •
Аналогично вводят обозначения для взаимнокорреляционной
функции
Куц (0>
[K-yu(t),
/>0,
t<0.
В предположении, что при t < 0 корреляционные функции
Кии (/) и К;,и (/) представляют собой аналитические функции вход-
ной и выходной случайных функций и допускают аналитическое
продолжение на положительную полуось, уравнение (4.25) мож-
но записать раздельно для случая t < 0 и для случая t > 0. При t < 0
уравнение (4.25) будет иметь вид
к~уи (0 = (t-x)dx. (4.27)
о
В силу единственности аналитического продолжения для функ-
ций К^и (/) и К~и (/) уравнение (4.27) будет иметь место для всех t.
Для t > 0 интеграл в уравнении (4.25) с учетом (4.26) можно
разбить на две части:
куи (()= f w (х) (^ - т) dx + ] w (т) К~и (t - х) dx. (4.28)
о t
Представляя второй интеграл в (4.28) в виде суммы двух ин-
тегралов:
куи (0 = J W (х) к^и (t - х) dx - J w (х) К~и (I - х) dx + J w (т) К~и (t - х) dx
ООО
и объединяя первый и второй интегралы, а также учитывая (4.27),
можно получить уравнение Вольтерра первого рода типа свертки:
96
K^t)-KyU(t) = Jw(T)[^;u(/-T)-^(Z-T)]dT, t>0. (4.29)
о
Решение уравнения (4.29) всегда существует, единственно и
получается путем применения преобразования Лапласа к обеим
частям уравнения (в предположении, что для всех рассматривае-
мых функций существует преобразование Лапласа).
В этом случае передаточная функция может быть представлена
в виде
^ии Xs) ^UU Xs)
где Куи ($), Куи ($), Кии ($), Кии ($) — преобразования Лапласа кор-
реляционных функций Куи (/), К~и (/), К£и (/), Кии (/) соответствен-
но.
С помощью обратного преобразования Лапласа для W(s) нахо-
дят функцию w(t) для т > 0 (при т < 0 — w(t) = 0). Функция w(t)
будет весовой для системы, т.е. удовлетворять уравнению (4.25),
если она одновременно удовлетворяет уравнениям (4.27) и (4.29).
С практической точки зрения интерес представляют устойчи-
вые системы. Исходя из критерия Гурвица для системы третьего
порядка (полагая а0 = О условия устойчивости накладывают огра-
ничения на выбор коэффициентов в виде
ах > 0, а2 > 0, а3 > 0, аха2 > а3. (4.31)
С увеличением коэффициентов а, в области, определяемой ус-
ловиями (4.31), корреляционная функция Kyu(t) по форме при-
ближается к Kuu(t), что является следствием уменьшения инерци-
онных свойств динамической модели. Действительно, если корни
X,- характеристического уравнения
р3 + ахр2 + а2р + а3 = 0
являются вещественными отрицательными, то для весовой функ-
ции w(/) можно записать
w(t) = С\е~х'1 + с2е“Х2' + с3е_Хз'.
Коэффициенты а, связаны с корнями X,- выражениями
3 3 3
а, = £Х„ а2 = £ ХДУ, а3 = ПХ<
/=1 ij=\ /=1
97
Чем больше тем быстрее затухает i-я составляющая и, сле-
довательно, с увеличением а, оператор модели вырождается в опе-
ратор безынерционного усилителя.
При существенном уменьшении коэффициентов а, корни X,
также будут уменьшаться, что обусловливает более медленное за-
тухание w(t).
Если при этом Kuu(t) с ростом t быстро затухает, взаимнокор-
реляционная функция Kyu(t) практически определяет функцию
НО-
4.6. Оценка структуры и параметров модели объекта
при «типовой* идентификации
Рассмотрим применение метода «типовой» идентификации.
Положим, что экспериментальная корреляционная функция вход-
ного сигнала может быть аппроксимирована выражением
Кии (*) = Ле-ах, А > 0, а > О,
взаимнокорреляционная функция — выражениями
= т>0,
Куи (т) = 2teat, т < 0.
(4.32)
(4.33)
Представим выражение (4.32) в соответствии с (4.26) в виде
Кии(у) =
Ktu(i) = Ae-°-\ т>0,
АГ-(т) = Леот, т < О,
(4.34)
выражение (4.33) в форме
к м- та0'
|^(т)=Л“, т < 0.
Учитывая, что преобразования Лапласа для корреляционных
функций К*и (т), К~ц (т), Куи (т), Куи (т) имеют вид
K:u(s) = A-^-, K~u(s) = A—^—,
5+а 5-а
K;u(S) = B-^-, K~u(s) = В—^—,
s+P s-а
98
по формуле (4.30) находим передаточную функцию
Ба + р5 + а_^7]5 + 1
А 2а 5 + Р T2s +1
(4.35)
Для более распространенного случая, когда автокорреляцион-
ную функцию представляют в форме (4.34), а взаимнокорреляци-
онную функцию аппроксимируют выражениями
Куи (х) = -йе_₽т cos ал, т > 0,
К~и (т) = Веа\ т < 0,
передаточная функция будет иметь вид
W(s) =
1 bjS2 + 1>|.У + fr)
2аЛ ($ + p)2 +
где
bo =5(a + p),
bi - Б^(а + Р)2 +Ш2],
Z>2 = B(p2 + co2 +ap).
Для оценки структуры и параметров модели объекта предло-
жено [23] использовать таблицы «типовой» идентификации, в ко-
торых приведены результаты исследований характеристик объек-
тов для наиболее часто встречающихся функций Km(t) и Kyu(t).
Фрагменты этих результатов сведены в табл. 4.1, 4.2. Таблица 4.1
содержит значения коэффициентов передаточной функции B^s),
отыскиваемой при входном сигнале в виде случайного процесса
с экспоненциально-косинусной автокорреляционной функцией,
табл. 4.2 — с экспоненциальной автокорреляционной функцией.
Рассмотрим порядок пользования таблицами «типовой» иден-
тификации. В случае если экспериментальные кривые К„и (т) и
Куи (т) совпадают с табличными характеристиками К„и (т) и
А^и(т), то коэффициенты передаточной функции модели, при-
веденные в табл. 4.1, 4.2, равны коэффициентам передаточной
функции модели идентифицируемого объекта. При несовпадении
экспериментальных кривых с табличными необходимо «подогнать»
табличные кривые к экспериментальным путем введения соот-
ветствующих масштабных коэффициентов по амплитуде кЛ и вре-
мени кв.
Пересчет параметров а„ bj передаточной функции
jy /Л _ +Ь[5 + Ьо
' 7 a3s3 + a2s2 + fys + «о
осуществляют по следующим соотношениям:
• для моделей первого порядка (Ь2 = Ь{ = а3 = а2 = 0; = 1)
Oo = ква$, Ьо = каЬ$;
• для моделей второго порядка (Ь2 = а3 = 0; а2 = 1)
at = kBd\, ц, = к2а^, = kabf, b^ = квкаЬ$;
• для моделей третьего порядка (а3 = 0)
«2 = ml «1 = ml = ml
L = kab%, bi = Ma AL ba = k2kab$.
На практике при использовании таблиц «типовой» идентифи-
кации «подгонку» экспериментальных кривых к табличным осу-
ществляют следующим образом: вначале по (т) и К„и (т) уста-
навливают масштабный коэффициент по оси времени так, чтобы
к*и(т) = к;и(М.
Обычно kg определяют как
где Тт — отрезок оси времени от нуля до первого пересечения
кривой Кии (т) с осью времени или с горизонтальной линией,
проходящей на определенном уровне от максимального значения
автокорреляционной функции; отрезок Тэ определяют аналогич-
но по кривой Кии (*)•
Затем находят отношение максимальных значений К^ (т) и
fa _ max
1 “ Гт
max
Далее перестраивают Куи (т) в новом масштабе и получают про-
межуточную функцию
K-u(x) = kBK-u U-
I кв
100
Таблица 4.1
Коэффициенты передаточной функции при входном сигнале в виде
случайного процесса с экспоненциально-косинусной автокорреляционной
функцией
Автокорреляционная
функция Kuu(t)
Взаимнокорреляционная
функция Kyu(t)
Передаточная функция W(s)
Куи\
Кии (0 = Юе-0'5!'! cos®/
и г / \ 51У 4“ 5
W\s) = ------------
S1 + s + 1
W(s) =
s2 — 0, ls + 0,1
s3 + 3,5s2 + 0,25s+ 0,25
W(s) =
s2 + 0, Is + 0,1
s3 + 3,5s2 + 0,4s+ 0,05
101
Таблица 4.2
Коэффициенты передаточной функции при входном сигнале в виде случайного процесса с экспоненциальной
автокорреляционной функцией
о
Определив по таблице корреляционную функцию Куи(х), наи-
более близкую по форме к Куи (т), находят отношение макси-
мальных значений К"и (т) и Куи (т):
jnn
• _ _ дуитах
2 ~
Л унтах
В итоге рассчитывают масштабный коэффициент по амплитуде
Проведенное авторами [20] сравнение эффективности различ-
ных методов определения коэффициентов передаточной функции
объекта по экспериментальным данным позволяет сделать вывод
о приемлемой для практики точности метода «типовой» иденти-
фикации.
4.7. Решение уравнения статистической идентификации
с использованием аппроксимирующих функций
Решение уравнения статистической идентификации в ряде слу-
чаев может быть выполнено с использованием аппроксимирую-
щих функций. В частности, такой подход применяют, если иден-
тифицируют стационарный объект, на вход которого подают ста-
ционарный сигнал, и при этом автокорреляционную функцию
можно аппроксимировать известной функцией. В этом случае
импульсную переходную функцию возможно определить анали-
тически путем решения уравнения Винера—Хопфа (4.4).
Если для аппроксимации автокорреляционной функции исполь-
зовать выражение
Kxx(t) = о?е"“',
где сх — квадрат дисперсии входного сигнала, то решение уравне-
ния (4.4) в этом случае имеет вид [6]:
а -
2а? L '
+2.Г^(0)-
+-Lr^(T)+
О?
а2 d/2
L(/) +
а dr l'=oj
a dr il=T
104
Рис. 4.4. Аппроксимация экспери- Рис- 4.5. Автокорреляционная функ-
ментальной автокорреляционной ция с малым временем корреляции
функции
В этом выражении члены с 8-функциями учитывают особенно-
сти решения уравнения (4.4) в точках t = 0 и t = Т.
Возможно использование других аппроксимирующих выраже-
ний для автокорреляционной функции, определенной экспери-
ментально и заданной на интервале 0 < t < Например, если
K^t) имеет вид, показанный на рис. 4.4, то ее можно аппрокси-
мировать выражением
К„(t) = Ве.~^/С cos Dr,
где
Б = ^(0), C/ST = l, D = 2n/x.
Для процессов с малым временем корреляции (рис. 4.5) более
удобным является аппроксимирующее выражение вида
D
^(O-ysinr,
где
5С = ^(0), С = 2л/т0.
В некоторых случаях, когда исследуемый объект можно с до-
статочной степенью точности аппроксимировать линейным зве-
ном первого порядка с запаздыванием, с помощью моментов кор-
реляционных функций
4 = Y T*X«(t)dT; i = 0,1, 2,
О
Д = J* V^(T)dT; i = 0,1, 2
о
105
можно определить параметры аппроксимирующей модели иден-
тифицируемого объекта [6]:
• коэффициент усиления звена
Д.
к =
• постоянную времени
'Р _ ~ _ Д2.
v А)Д) Д>
• время запаздывания
т = — -Т
изап D л •
Д)
4.8. Идентификация объектов управления в замкнутых
системах
Целью идентификации часто являются объекты, входящие
структурно в системы с обратными связями и внутренними поме-
хами. В этом случае при решении задачи идентификации возника-
ют свои особенности, которые необходимо учитывать.
Рассмотрим достаточно общий случай, когда объект управления
охвачен обратной связью и, кроме того, работает в условиях помех,
воздействующих на часть этого объекта. Структурная схема стацио-
нарной линейной системы, иллюстрирующая такое положение, изоб-
ражена на рис. 4.6. В качестве испытательного сигнала на входе иден-
тифицируемого объекта с передаточной функцией W(s) = B^s)
будем использовать сигнал ошибки u(t) = х(/) - z(0- Предполагаем
также наличие внутренней помехи v(t).
Уравнение, описывающее эту систему, может быть представ-
лено в виде
K(s) = W(s)U(s) + 1F2(s)K(s)
или в интегральной форме во временной области:
у(7) = j w(x)u(t - т) dr + f w2 (t)v(7 - т) dt, (4.36)
о 0
где w(t), w2(t) — импульсные переходные функции прямой цепи
и по отношению к внутреннему шуму соответственно.
106
Рис. 4.6. Структурная схема объек-
та, охваченного обратной связью, х
с внутренней помехой ~
и
V
У
Из уравнения (4.36) легко получить связь между автокорреля-
ционной функцией сигнала на входе идентифицируемого объекта
А'цнС/) и взаимнокорреляционными функциями Kyu(t) и K^t)'
= J - T)dr + j w2(i:)Kvu(t - T)dt. (4.37)
о о
Наличие обратной связи приводит к корреляции помехи v(Z)
и сигнала ошибки управления u(t), т.е. А™(/) * 0, поэтому урав-
нение (4.37) оказывается неразрешимым относительно w(/).
Одним из возможных путей нахождения динамических харак-
теристик идентифицируемого объекта может быть следующий:
вначале определим импульсную переходную функцию замкнутой
системы. Для этого воспользуемся очевидным равенством:
Y(s) = <&(s)X(s) + Ф1(5)И(5),
где Ф(^), Ф|(л) — передаточные функции замкнутой системы по
отношению к входному сигналу и по отношению к внутреннему
шуму соответственно, определяемые выражениями:
ч W(s) Л ч lT2(s)
Ф($) =------—------, Ф.($) =----------------
l + F«M(i)’ 1 + »Г(5Ж.с(5)-
Далее, переходя к оригиналам, будем иметь
y(f) = J Х(т)х(/ - x)di +J Хш(т)у(/ - T)dt, (4.38)
о о
где Х(т) — импульсная переходная функция замкнутой системы
относительно управляющего сигнала; Хш(т) — импульсная пере-
ходная функция замкнутой системы по отношению к внутренне-
му шуму.
Используя выражение (4.38) с учетом того, что - О,
получим
= J Х(т)^(Г - T)dt. (4.39)
о
107
Аналогичное соотношение можно получить и для цепи обрат-
ной связи
K^t) = J w0.c(T)^(r - T)dt. (4.40)
о
Решение уравнений (4.39) и (4.40) относительно Х(т) и woc(f),
совпадающих по форме с уравнением статистической идентифи-
кации, дает импульсные переходные функции замкнутой систе-
мы и цепи обратной связи. Используя преобразование Лапласа,
по найденным Х(т) и woc(r) можно определить Ф($) и Woc(s) и
окончательно найти искомую передаточную функцию объекта
= 7 ? (4 41)
1-ф(5)и;с(5)
При этом необходимо отметить, что вследствие неточности оп-
ределения Х(т) и и'ос(0 при решении уравнений (4.39) и (4.40),
при переходе от параметров замкнутого контура к параметрам ра-
зомкнутого по формуле (4.41) могут возникать дополнительные
ошибки оценки параметров объекта.
Рассмотрим другой способ отыскания динамических характе-
ристик идентифицируемого объекта, который в ряде случаев мо-
жет оказаться более предпочтительным, чем способ, рассмотрен-
ный выше, так как, в частности, не требует знания импульсной
переходной функции всей системы.
Положим, что внутренняя помеха нестационарной линейной
системы путем эквивалентного преобразования структуры приве-
дена к выходу (рис. 4.7).
Из рис. 4.7 видно, что сигнал обратной связи равен
z(t) = jwp(/, ^) «(^)^+Jwo.c(/,^)v(^)d^, (4.42)
о о
где Wp(/, £) — импульсная переходная функция разомкнутой си-
стемы, определяемая как
t
wP (', £) = j w(t, n)woc (/, n) dn- (4.43)
0
Рис. 4.7. Структурная схема объекта,
охваченного обратной связью, с
помехой, приведенной к выходу
системы
108
В свою очередь, так как
u(t) = x(t)-z(t), (4.44)
подставляя выражение для z(t), определяемое соотношением
(4.42), в (4.44), получим
«(О = x(t) - jн-р(Г, -jwo.c(/, £)vG)d£. (4.45)
0 0
Взаимнокорреляционная функция Kxu(t2, А) входного возмуще-
ния x(t) и сигнала u(t), поступающего на вход идентифицируе-
мого объекта, может быть определена как
к хи (*2, А) = М {[х(/2) - тх (t2)] [м(А) - ти (t,)]}, (4.46)
где — математическое ожидание произведения центриро-
ванных сигналов x(t) и u(t).
После ряда преобразований уравнения (4.45) с учетом (4.46)
получим
6) = Xxx(h, О- J Wp(A, VXxuih, - J%.c(A,
о 0
Принимая справедливой гипотезу о независимости внутренних
помех от внешних возмущений, откуда следует, что K^(t2. Л) = О,
получим
Kxuth, /,) = /,) - ) wp(A, ^)^(/2, £)<«;. (4.47)
О
Обозначив разность корреляционных функций как
^2, 6) = А)~ KxAh* А)>
получим интегральное уравнение
K(t2, А) = JWp(6, №и(/2, £)d£, (4.48)
о
решение которого относительно wp(Z, £) дает импульсную пере-
даточную функцию разомкнутой системы.
Решение аналогичного уравнения
Kv(f2, 6) = )%.c(/b^(/2^)d^
о
дает импульсную переходную функцию цепи обратной связи и>ос(/, ^).
109
Подставляя полученные значения wp(z, i;) и woc(/, £) в уравне-
ние (4.43), можно вычислить искомую импульсную переходную
функцию объекта w(t, £).
Для случая стационарной системы, находящейся в режиме не-
прерывного функционирования, на вход которой поступает ста-
ционарное возмущающее воздействие, из (4.48) легко получить
ТО = рР№»('-^
о
где
K(t) = Kxx(t)-Kxu(t), t = tx-t2.
В заключение отметим, что выражение (4.37) дает возможность
проверить гипотезу о наличии неявной («паразитной») обратной
связи между входным x(t) и выходным y(t) сигналами системы в
разомкнутом состоянии.
Действительно, известно, что для разомкнутых линейных си-
стем левые части корреляционных функций K^t) и K^t) со-
впадают по форме. Поэтому если в системе существует «паразит-
ная» отрицательная обратная связь, будет наблюдаться спад ор-
динат левой ветви (при t < 0) взаимнокорреляционной функции
по сравнению с ординатами корреляционной функции входного
сигнала. Этот спад будет тем резче, чем больше величина второ-
го интеграла в (4.37), т.е. чем сильнее «паразитная» обратная
связь.
Таким образом, в процессе исследования динамической систе-
мы неизвестной структуры целесообразно прежде всего опреде-
лить степень влияния обратной связи. Если в результате проверки
окажется, что функция J Kvu(t - т)<1т близка к нулю, то определе-
ние динамических характеристик объекта можно производить
любым методом. Если же результаты проверки указывают на силь-
ное влияние обратной связи, необходимо применять методы иден-
тификации объектов, пригодные для замкнутых систем.
4.9. Идентификация объектов управления методами
оценивания
Ограничение времени эксперимента, особенно в условиях нор-
мального функционирования объектов управления, приводит к
тому, что решение задачи идентификации осуществляется всегда
на конечном интервале наблюдения за входными и выходными
ПО
сигналами. Это обстоятельство не позволяет точно определить зна-
чения таких характеристик процессов, как, например, корреля-
ционные функции или спектральные плотности и, следователь-
но, позволяет найти не точные значения параметров моделей ис-
следуемых объектов, а только их оценки. Кроме того, так как
результаты наблюдений обычно искажены случайными воздей-
ствиями (возмущениями, ошибками измерения), для получения
наилучшей адекватности модели и объекта возникает необходи-
мость использовать статистические методы. Таким образом, в об-
щем случае задача идентификации является одновременно и за-
дачей оценивания.
Рассмотрим некоторые вопросы, связанные с оцениванием па-
раметров модели объекта в предположении, что структура модели
исследуемого объекта известна. При этом можно обратить внима-
ние на то, что результаты оценивания параметров могут привести
к изменению первоначально выбранной структуры. Так, измене-
ние величины оцениваемого параметра от р, # 0 до Р, = 0 может
соответствовать такому упрощению структуры, как исчезновение
ветви модели. Однако в тех случаях, когда требуется дополнение
структуры модели, алгоритмы оценивания параметров не могут
дать подобной дополнительной информации. Это обстоятельство
подтверждает большую важность априорной информации о струк-
туре объекта, а также о возможных значениях параметров модели.
Так, например, наличие информации, позволяющей сделать вы-
бор между линейными или нелинейными моделями, данные о
возможной скорости изменения параметров и другие сведения об
объекте оказываются чрезвычайно важными потому, что предоп-
ределяют выбор метода оценивания, наиболее эффективного для
конкретного случая.
Прежде чем говорить о методах идентификации, базирующихся
на тех или иных процедурах оценивания параметров, приведем не-
которые общие свойства, которыми должна обладать оценка 0 не-
которого параметра Ь. В статистическом плане оценка р должна быть
несмещенной, состоятельной, эффективной и достаточной [24].
Оценка будет несмещенной, если для любого к справедливо со-
отношение
Л/{р} = Ь,
где М— символ математического ожидания; Охарактеризует объем
выборки значений сигналов на входе и выходе исследуемого объекта.
Оценка является состоятельной, если для сколь угодно мало-
го £ > 0 с ростом к плотность вероятности р характеризуется тем,
что
limр{|0 - Ь| > е} = 0.
111
Оценку можно считать эффективной, если для всех несмещен-
ных оценок у выполняется соотношение
cov [р] = М |[р - b] [р - b]r j-< М {[у - Ь] [у - b]r |= cov [у].
Ковариация cov[p] представляет собой матрицу, главная диа-
гональ которой состоит из оценок дисперсий оцениваемых пара-
метров, недиагональные элементы соответствуют оценкам взаим-
ных дисперсий параметров.
Наконец, оценка является достаточной, если для всех оценок у
условная плотность вероятности р(у/Р) не зависит от Ь.
При оценивании параметров модели исследуемого объекта
обычно приходится решать задачу минимизации некоторого функ-
ционала от измеряемой разности выходных сигналов модели и
объекта и — неявно — от параметров модели. Следует подчерк-
нуть, что выбор функционала, как правило, субъективен. В то же
время процедура оценивания параметров модели существенно за-
висит от его выбора.
Таким образом, рассмотрим нормально функционирующий ста-
ционарный линейный объект, динамику которого можно описать
уравнениями
у(/) = Jw(T)«(Z-t)dT, (4.49)
о
z(/) = y(/) + «(/), (4.50)
где u(t), y(t) — соответственно входная и выходная переменные,
в общем случае некоторые случайные или детерминированные функ-
ции скалярного непрерывного аргумента времени /; л(/) — слу-
чайная помеха на выходе системы.
В большинстве случаев с достаточным основанием полагают,
что «(/) — случайный процесс с нулевым средним значением и
конечной дисперсией, являющийся суммой ошибок наблюдения
за y(t) и возмущений, действующих на объект, приведенных к
его выходу.
В общем случае непосредственное наблюдение переменных у (Г)
и n(t) каждой в отдельности невозможно. Обычно наблюдению
доступны только процессы на входе u(t) и выходе z(t). При этом
полагают, что ошибки наблюдения за входным процессом нет,
т. е. входной процесс наблюдают совершенно точно. И еще одно
предположение: процессы u(t) и z(t) доступны наблюдению в
дискретные моменты времени /, е [0, Т], i = 1, 2, ..., к. Таким
образом, задача идентификации в данном случае сводится к на-
хождению оценки недоступной для наблюдения весовой функ-
ции w(Z), t g [0, Г] по реализациям и, = «(?,), z, = zU). Учитывая это
112
обстоятельство, вместо уравнений (4.49) и (4.50) будем иметь их
дискретный эквивалент
У/ = £ WjUt.j,
Zi=yi+ni; i = l,2,...,k,
где Wj = w(tj) = w(j&t); J = 0, 1, 2, ..., /и; Д/ = T/k — интервал
дискретности; z, = z(/Ar); у, = у(/Д/); m = Tx/ \t.
Величину T| определяют исходя из естественного предположе-
ния, что при достаточно больших значениях времени импульсная
переходная функция устойчивого объекта стремится к нулю:
0, /<0,
w(z) = • w(/), 0 < Z < 7],
0, t >7].
При ограниченном числе наблюдений задача оценивания па-
раметров имеет наиболее простое решение при использовании ме-
тода наименьших квадратов. При его применении в случае если
помеха л, (z = 1, 2, ..., к) является случайной последовательно-
стью некоррелированных величин, оценку W можно найти, ми-
нимизируя функционал:
min р (Z, W) = min £ Zi - £ Wj им
где W — вектор неизвестных весовых коэффициентов, определяе-
мый выражением W = (w0, wb ..., wm)T; Z = (zb z2, •••> Zk)T-
Приравнивая нулю частные производные функционала р по
Wj, получим систему из (т + 1) линейных алгебраических уравне-
ний с (т + 1) неизвестными, решение которой является оценкой
наименьших квадратов W, имеющей следующий вид:
W = Ф*Ь,
где Ф — квадратная матрица размерности (т + 1)х(л1 + 1), на-
зываемая информационной, элементы которой определяют как
Фгу= £и(_ги,_у (Л г = 0, •,..., /л); Ь — (ли- 1)-мерный вектор-стол-
к
бец с элементами br = ^z, Щ_г (г = 0,1, ..., т).
/=1
113
Матрица Ф*1 называется матрицей ошибок, и она связана с ко-
вариационной матрицей оценки W соотношением
cov[w] = oj; Ф_| ,
где <j2 — дисперсия помехи п.
Следует обратить внимание на случай, когда помеха n(t) кор-
релирована с входным сигналом u(t). При этом применение мето-
да наименьших квадратов позволяет вычислить только смещен-
ную оценку W. Действительно, в этом случае элементы матрицы
Ф остаются теми же, а элементы вектора b изменяются:
к к
Ьг = ^Zi Ui_r = + и, )u,_r,
i=l i=l
откуда видно, что ввиду коррелированности и, с л, оценка будет
смещенной.
Рассмотренное оценивание параметров методом наименьших
квадратов является наиболее распространенным. Объясняется это
тем, что при этом обеспечивается минимизация суммы квадратов
невязок независимо от статистических предположений. С другой
стороны, обычно существует априорная информация, которую
желательно использовать в схемах оценивания для увеличения
точности.
Одним из методов оценивания, использующих в качестве ап-
риорной информации плотность распределения помехи, является
метод максимального правдоподобия. Рассмотрим кратко суть та-
кого подхода [24].
В основе метода максимального правдоподобия лежит предполо-
жение о том, что наилучшая оценка должна давать наибольшую
вероятность именно той реализации, которая наблюдалась в экс-
перименте. Согласно методу максимального правдоподобия оцен-
ку Р определяют решением следующей экстремальной задачи:
0 :р(х/0)= maxp(x/b),
D
где р(х/Ь) — функция правдоподобия, которую получаем из ус-
ловного распределения, подставляя результаты наблюдения х.
При этом вектор х полностью характеризует процессы, наблю-
даемые на входе и выходе объекта: х = (u, z). В функции правдопо-
добия х — результаты проведенных измерений, 0 является аргу-
ментом. Иногда это обстоятельство подчеркивают, применяя для
функции правдоподобия запись р(х; 0).
Для нахождения точки максимума функции р(х; 0) необходи-
мо приравнять нулю ее частные производные по всем составляю-
114
щим вектора Ь. В практических приложениях чаще используют ло-
гарифмическую функцию правдоподобия £(х; Ь) = 1пр(х; Ь), что
особенно удобно при гауссовском распределении Ь. Оценку мак-
симального правдоподобия находят путем решения уравнения
правдоподобия:
= 0> J = 0,1, ..., /и. (4.51)
dbj
Решая уравнение (4.51) относительно bj, получаем правдопо-
добное значение оценки [} как функцию результатов наблюдений.
Остановимся еще на одном статистическом методе оценива-
ния параметров модели, а именно на байесовском оценивании.
Если в ранее рассмотренных методах предполагалось, что пара-
метры модели динамического объекта являются неизвестными,
но неслучайными величинами, то в подходе Байеса считается,
что оцениваемые параметры являются случайными величинами с
известной заранее (априорной) плотностью распределения р(Ь),
не зависящей от вектора наблюдений х = (u, z). Но поскольку слу-
чайная величина b статистически связана с результатами наблю-
дений х, то информация о векторной случайной величине Ь, по-
лучаемая в результате наблюдения за случайной величиной х, за-
ключена в плотности вероятности р(Ь/х), называемой апостери-
орной плотностью вероятности вектора Ь. Апостериорную плот-
ность вероятности можно определить на основании формулы об-
ращения Байеса:
р(х)
где р(х/Ь) — условная плотность вероятности случайной величи-
ны х, которую после подстановки результатов наблюдений назы-
вали ранее функцией правдоподобия; р(х) — плотность распре-
деления х, которая может быть определена интегрированием:
р(х) = J...Jp(b)p(x/b)db.
Таким образом, в байесовском подходе предполагается нали-
чие обширной априорной информации, заключающейся в зада-
нии р(Ь) и р(х; Ь).
Следует отметить, что при решении задач идентификации ап-
риорная информация о распределении р(Ь) часто отсутствует, при
этом приходится предполагать, что р(Ь) в некоторой области по-
стоянна (равномерное распределение). Наряду с этим также не-
простой задачей является определение р(х/Ь) даже при заданных
115
р(х/Ь),
maxp(b/x)=—-
ь Р{
вероятностных характеристиках помех и заданной структуре опе-
ратора объекта. Обычнор(х/Ь) задается на основании некоторого
опыта или специальных исследований.
Байесовскую оценку вектора Ь, в частности, можно получить,
решая экстремальную задачу: шахр(Ь/х), что приводит к систе-
ме уравнений
Эр(Ь/х) Л п .
' =0; j = 0,1, ..., т.
dbj 7
В случае, когда априорное распределение р(Ь) является равно-
мерным, т.е. р(Ь) = const, получим
rist
— max
X) Ь
что соответствует наиболее вероятной байесовской оценке, со-
впадающей с оценкой максимального правдоподобия.
Таким образом, применение рассмотренных методов нахожде-
ния оценок параметров в значительной мере определяется нали-
чием соответствующей априорной информации. Действительно,
для получения байесовских оценок требуется наибольшее количе-
ство априорной информации, при минимуме априорной инфор-
мации возможно получение оценок методом наименьших квадра?
тов. Естественно, что использование дополнительной априорной
информации приводит к улучшению определяемых оценок. Одна-
ко следует заметить что усилия, которые обычно затрачивают на
нахождение априорной информации, могут оказаться неадекват-
ными полученным результатам, что в значительной мере обусло-
вило наиболее широкое применение при определении оценок
параметров моделей объектов управления метода наименьших
квадратов [9].
Темы для повторения
1. Виды уравнения статистической идентификации линейного дина-
мического объекта (уравнения Винера—Хопфа).
2. Использование уравнения Винера—Хопфа для определения пара-
метров частотных характеристик нестационарных и стационарных объек-
тов.
3. Выбор параметров и особенности реализации алгоритмов решения
уравнения Винера—Хопфа «алгебраическим методом».
4. Регуляризация решения уравнения Винера—Хопфа и основные под-
ходы к ее проведению.
5. Регуляризация решения уравнения Винера—Хопфа путем исполь-
зования разложений в ряды по нормированной системе функций.
116
6. Теоретические основы составления таблиц «типовой» идентифика-
ции объектов управления.
7. Порядок пользования таблицами «типовой» идентификации.
8. Особенности проведения процедуры идентификации с использова-
нием уравнения Винера—Хопфа объекта, включенного в систему с об-
ратной связью.
9. Основные свойства оценки 0 идентифицируемого параметра Ь.
10. Решение задачи оценки идентифицируемых параметров при ис-
пользовании метода наименьших квадратов.
11. Получение параметров идентифицируемой модели методом мак-
симального правдоподобия.
12. Получение параметров идентифицируемой модели, основанное на
байесовском оценивании этих параметров.
Глава 5
МЕТОДЫ ИДЕНТИФИКАЦИИ НЕЛИНЕЙНЫХ ОБЪЕКТОВ
5.1. Особенности идентификации нелинейных
динамических объектов
Из материала, изложенного в предыдущих главах, где рассмат-
ривались некоторые методы решения задачи идентификации ли-
нейных динамических объектов, следует, что даже в линейном
плане идентификация таких объектов представляет нетривиаль-
ную задачу. При идентификации нелинейных динамических объек-
тов трудности несоизмеримо возрастают. При этом во многих слу-
чаях избежать решения задачи идентификации в нелинейном пла-
не не удается, так как рассмотрение ряда объектов в линейном
приближении является недостаточным, а в некоторых случаях и
вообще не имеет смысла.
Одной из основных трудностей является зависимость переход-
ного процесса нелинейного объекта не только от формы, но и от
амплитуды входного сигнала, что выдвигает достаточно сложные
и зачастую противоречивые требования к выбору тестового сиг-
нала при реализации режима активной идентификации.
При активной идентификации нелинейного объекта, для того
чтобы определить его динамические характеристики, необходимо
выбрать диапазон амплитуд тестового сигнала не меньшим, чем
диапазон изменения рабочего входного сигнала объекта. Именно
по этой причине при снятии частотных характеристик объектов
на вход обычно подают гармонические сигналы разных амплитуд,
чтобы выявить их нелинейный характер.
Как показал Н. Винер, если при исследовании линейных (ли-
неаризованных) объектов оптимальным тестовым сигналом яв-
ляется гармонический сигнал, то при идентификации нелиней-
ных объектов таковым является «белый шум». На практике, учи-
тывая физическую нереализуемость «белого шума», используют
различные устройства, генерирующие ту или иную модель «бело-
го шума», имеющую постоянную спектральную плотность в диа-
пазоне рабочих частот объекта и дисперсию, превышающую диа-
пазон изменения мощности рабочего входного сигнала иденти-
фицируемого объекта.
Однако необходимо иметь в виду, что если в ряде методов
идентификации достаточно успешно используют псевдослучай-
118
_Mj v=/«
к
Ts+1
Рис. 5.1. Каскадное соединение безынерционного нелинейного преобра-
зователя и линейной части
ные двоичные последовательности, их применение при иденти-
фикации нелинейных объектов встречает ряд серьезных трудно-
стей. Для идентификации нелинейных объектов более подходя-
щими оказываются псевдослучайные последовательности с мно-
гими уровнями [6]. Это объясняется тем, что при увеличении
числа уровней статистические свойства таких последовательнос-
тей в большей степени приближаются к статистическим свой-
ствам «белого шума».
Вообще говоря, применение тех или иных видов тестовых сиг-
налов и возникающие при этом особенности во многом зависят
от методов, которые используют для идентификации нелинейных
объектов.
Еще более серьезной трудностью, возникающей при разработ-
ке и реализации методов идентификации нелинейных объектов,
является огромное разнообразие типов нелинейных операторов,
описывающих эти объекты. Это разнообразие нелинейного пове-
дения в технологических объектах определяет и разнообразные
подходы к их идентификации, зачастую никак не связанные меж-
ду собой. Применяемые на практике методы идентификации не-
линейных объектов ориентированы на тип нелинейности, имею-
щийся в объекте, и структуру математической модели, описыва-
ющей идентифицируемый объект.
Простейшим типом нелинейности является безынерционное
нелинейное устройство, сигнал на выходе которого представлен
зависимостью от входного сигнала:
У=Лх).
Математические модели нелинейных объектов, содержащих в
своем составе подобное устройство, могут быть представлены в
виде каскадного соединения безынерционного нелинейного пре-
образователя и линейной части, в простейшем случае — инерци-
онным звеном первого порядка, как показано на рис. 5.1.
Это соединение описывается соотношением
y(t) = j w(t)v(7 - x)dx =
° . (5.1)
= J f - x)] dx = J w [х(/ - x), x] dx.
о 0
119
И хотя большинство нелинейных объектов не допускает по-
добного каскадного представления, можно утверждать, что нели-
нейный аналитический оператор первого порядка, представленный
соотношением (5.1), ядром которого является w[x(/- т), т], в об-
щем случае отражает зависимость переходного процесса от амп-
литуды входного сигнала и от состояния системы в прошедшие
моменты времени.
Для нелинейного аналитического оператора п-го порядка спра-
ведливо соотношение
y(t) = х(/-т„),ть..., (5.2)
О о
Выражение (5.2) является обобщением оператора Урысона,
который имеет вид:
у(/) = Jw[z, т, x(x)]dx. (5.3)
о
Важным частным случаем оператора Урысона является опера-
тор Гаммерштейна:
ХО = f НЛ т)/[х(т), т](1т.
о
Этот оператор с успехом может быть использован при описа-
нии нелинейных объектов, структура математической модели ко-
торых представлена на рис. 5.1.
В свою очередь частным случаем оператора Гаммерштейна яв-
ляется оператор Немыцкого:
У<*) =f[x(t),t],
описывающий нелинейное звено с нестационарными характери-
стиками.
Суперпозиция оператора Урысона и оператора Немыцкого обра-
зует более сложный оператор вида
y(t) = f r,x(/)Jw,[z, T1,x(T1)]dT1,...Jw„[/, Tn,x(T„)]dxn ,
о о
который может быть использован в качестве математического опи-
сания структуры, представляющей две линейные системы, соеди-
ненные нелинейным звеном (рис. 5.2) с характеристикой
п
у = /(«) = Ёо/И'-
1=1
120
x(t) -----77“! “(') —rz/ \ v<0
------- wi(t) ----------- Г(и) -----------
W2(Z)
y(t)
Рис. 5.2. Структура нелинейной системы, включающей две линейные си-
стемы, соединенные нелинейным звеном
В этом случае оператор всей системы принимает вид
п 00 °°
y(t) = £a,Jw2(Z,x) Jw1(T,j)x(5)ds dx.
/=1 0 LO
Обобщением оператора данного типа является оператор Лих-
тенштейна —Ляпунова:
п °° °°
/=о о о
/
т,)Пх(т/)ат/’
/=1
при этом ряд, образующий этот оператор, представляет собой
функциональный степенной ряд Вольтерра.
Рассмотренные аналитические операторы позволяют описать
довольно широкий класс нелинейных объектов управления и по-
этому в той или иной степени находят свое применение на прак-
тике.
Остановимся на некоторых аспектах применения различных
методов идентификации нелинейных объектов.
В наиболее благоприятном случае задача идентификации сво-
дится по существу к оценке небольшого числа параметров объек-
та, которая может быть осуществлена лишь в том случае, если
вид оператора объекта известен. При этом выбор метода иденти-
фикации сводится к выбору минимального числа значимых па-
раметров и вычислительного алгоритма восстановления значе-
ний параметров в соответствии с имеющейся априорной инфор-
мацией об этих значениях и выбранным критерием качества иден-
тификации.
Однако учитывая, что в большинстве случаев вид математи-
ческого описания объекта априорно неизвестен, первоочередной
задачей становится выбор структуры модели, описывающей объек-
ты данного класса, а уже затем решают задачу оценки параметров
модели.
Отмеченное обстоятельство вынуждает при решении задачи
идентификации нелинейных объектов прибегать по возможности
к более простым методам, не требующим в частности априорной
информации об идентифицируемых параметрах.
При идентификации нелинейных объектов возникает также
задача выбора критерия качества идентификации. В этой связи мож-
121
но заметить, что в большинстве работ, посвященных идентифи-
кации нелинейных динамических объектов, в качестве такого кри-
терия используют минимум среднеквадратичной ошибки. Однако
следует иметь в виду, что иногда применение подобного крите-
рия приводит к плохо обусловленным относительно определяе-
мых параметров модели системам уравнений.
При идентификации нелинейных объектов частотными мето-
дами в качестве критерия точности идентификации используют
совпадение частотных характеристик объекта и модели в доста-
точном числе точек.
Этот подход распространяется и на представление характерис-
тик объектов во временной области, при этом требуют совпаде-
ния импульсных характеристик высших порядков объекта и мате-
матической модели.
5.2. Идентификация нелинейных объектов
с использованием линеаризованных моделей
При практическом решении задачи идентификации нелиней-
ных объектов используют два основных подхода. При первом под-
ходе математическую модель исследуемого объекта рассматрива-
ют как существенно нелинейную, и идентификация объекта за-
ключается в нахождении характеристик нелинейных и линейных
элементов выбранной структуры, о чем уже шла речь в предыду-
щем параграфе. Второй подход основан на получении математи-
ческого описания линеаризованной модели, эквивалентной (в оп-
ределенном смысле) нелинейному объекту. Такой подход базиру-
ется на применении хорошо разработанных методов линеариза-
ции в малых приращениях, гармонической и статистической ли-
неаризации.
Наличие хорошо разработанного аппарата линейной теории
(линейная алгебра, теория линейных дифференциальных уравне-
ний) делает объяснимым достаточно широкое использование ли-
нейных моделей и в частности методов линеаризации, что оправ-
дано для объектов, имеющих гладкие характеристики и работа-
ющих при небольших отклонениях от рабочей точки.
Обычно при линеаризации используют разложение нелиней-
ной функции в ряд Тейлора. При этом учитывают только члены
первого порядка, что позволяет заменить переменные их прира-
щениями и перенести начало координат в рабочую точку. За счет
последнего из разложения выпадают члены нулевого порядка.
Исключение же из рассмотрения членов второго и более высоких
порядков обосновывается допущением только малых изменений
переменных, когда эти члены становятся малозначимыми в срав-
нении с членами разложения первого порядка.
122
В качестве простого примера рассмотрим линеаризацию при
определении модели печи с электрическим нагревателем. Поло-
жим, что энергия (Р), подводимая к печи, определяется мощно-
стью (GH), рассеиваемой нагревателем
Р= G„U2,
отток энергии — диффузией теплоты через тепловое сопротивле-
ние изоляции Ст. Тогда уравнение, описывающее динамику печи,
будет иметь вид
cm — + GrT = GHU2,
dr н
где с — удельная теплоемкость; т — масса.
После линеаризации квадратичной зависимости в правой час-
ти, опустив обозначения приращений, можно записать
cm — + GTT = kU,
dt
где к = 2U0Gn (Uo — соответствует рабочей точке); Т, U — прира-
щение соответствующих координат относительно рабочей точки
(рис. 5.3).
При описании нелинейных многомерных систем уравнениями
в форме Коши (в пространстве состояний) используют диффе-
ренциальные уравнения вида
х = /(х,н)
у = g(x,u),
(5.4)
где х, и, у — переменные во времени векторы, обозначающие
состояние системьц входную и выходную переменные размерно-
сти л, к, I соответственно; функции /и g также являются вектор-
ными и в обдам случае нелинейными.
Рис. 5.3. Линеаризация статической характе-
ристики печи с электрическим нагревателем
123
Для линеаризации уравнений (5.4) применяют разложение в
ряд Тейлора векторных функций /и g, в результате этого разло-
жения получают описание вида
Jx = Ax + Bu
[у = Сх + Du,
где элементы матриц А, В, С, D определяют как значения первых
производных в рабочей точке:
аи = dfi/dXj\0 , by = dfi/duj\Q, Су = dgi/dxj\0, dv = dgl/duj\0.
Метод гармонической линеаризации, сущность которого состоит
в замене нелинейного элемента линейным с передаточной функ-
цией, равной эквивалентному комплексному коэффициенту уси-
ления по первой гармонике
At
W (А, /со) = ехр (/ф1) = R (А, со) exp (/<р (А, <о)),
А.
широко применяют для анализа систем замкнутого типа (рис. 5.4),
когда линейная часть обладает хорошими фильтрующими свой-
ствами. Если нелинейный элемент является безынерционным, его
передаточная функция зависит только от амплитуды входного
сигнала А, при этом наиболее простой вид она имеет для релей-
ных элементов.
Задача идентификации нелинейных объектов включает и об-
ратную задачу — определение нелинейной зависимости у - f(u)
по экспериментально найденному эквивалентному комплексно-
му коэффициенту усиления И^А, jca).
Для нелинейных устройств с нулевой памятью имеем [6]:
2Ч2
W\A) = — J [/(Лвшф)-У(—Л sin \p)]sinxpd\p,
71 о
где \|/ — фазовый сдвиг.
Если у = f(u) — нечетная функция, то
я/2
f (А) = f (-А) = J [2 Л sin ф W\A sin у) + A2 sin у W\A sin у)] dy.
о
Рис. 5.4. Структурная схема нелинейной системы управления
124
Рис. 5.5. Структурная схема статистической линеаризации нелинейного
объекта
Имеется более простая процедура, применяемая для однознач-
ных нелинейностей с нулевой памятью, для вычисления ДЛ) по
соотношению
00 л ( А А
/И)=2(-1)”^гКеИ' ,
л=0 2 к2 /
причем этот ряд очень быстро сходится.
Применение рассмотренных способов идентификации нелиней-
ных безынерционных объектов ограничено тем, что разным ви-
дам нелинейностей может соответствовать один и тот же эквива-
лентный коэффициент усиления. Однако в отдельных случаях эту
трудность удается обойти.
Метод статистической линеаризации основан на замене нели-
нейной характеристики линеаризованной зависимостью, стати-
стически эквивалентной этой характеристике. При этом специфи-
ка исходной нелинейной зависимости сохраняется, так как пара-
метры линеаризованной связи зависят от характеристик входного
сигнала. Здесь можно указать на аналогию с методом гармониче-
ской линеаризации, где эквивалентный комплексный коэффици-
ент усиления зависит от амплитуды входного гармонического сиг-
нала.
Таким образом, представим случайные сигналы на входе и вы-
ходе объекта x(f) и y(t) соответственно в виде суммы медленно
меняющихся математических ожиданий mx(t) и my(t) и центри-
рованных случайных составляющих хР(1) и как показано на
рис. 5.5: /
/ x(t) = Х°(0 + /Их(0,
У(0 = у°(/) + my(t).
Наиболее общей формой статистической линеаризации явля-
ется замена нелинейного уравнения приближенным линейным
относительно флуктуаций [6]:
ХО = фо(О + J w(t, т)[х(т) -/nx(T)]dT.
А)
125
При этом предполагают, что
<ро(О = k^mx(t),
w(t, т) = kfilf - т),
(5.5)
причем коэффициенты принимают равными, т.е. к0 = к\ = к,
и рекомендуют определять к из условия минимума среднеквадра-
тической ошибки:
Af {[у(0 - Ах(/)]2 = min.
Авторы [6] приводят другой, более совершенный метод, со-
стоящий в определении к0 и к{ из условия сохранения математи-
ческого ожидания и дисперсии выходного сигнала:
М {к^тх +к{(х - /и*)} = ту,
D {к$тх + ki(x - mx)} = Dy
или из условия минимума среднеквадратической ошибки:
М {[у - кц1пх - к\ (х - тх )]21 = min.
(5.6)
(5.7)
Так как условия (5.6), (5.7) дают одно и то же значение к{) и
два разных значения к}, для определения к\ рекомендуют исполь-
зовать среднее арифметическое значений кх, полученных из усло-
вий (5.6), (5.7).
Следует отметить, что статистическая линеаризация с исполь-
зованием (5.5) искажает корреляционную функцию выходного
сигнала, а, следовательно, в стационарном случае и его спектр.
Поэтому на практике большее применение нашел подход с
использованием в качестве критерия приближения нелинейной
системы и аппроксимирующей ее линейной системы минимума
среднеквадратического значения невязки:
е2 = М y(t) — Jtz(x)w(z-T)dT
где u(t) — входной сигнал идентифицируемого объекта; у(1) —
выходной сигнал объекта; w(t) — импульсная переходная функ-
ция линеаризованной модели.
В случае стационарных свойств процессов и системы минимум ё2
достигается при условии, что w(t) удовлетворяет соотношению
Kyu(t)= J Kuu(x)w(t-x)dx,
где Kyu(t), Kuu(t) — соответственно взаимнокорреляционная и ав-
токорреляционная функции сигналов u(t) и y(t).
126
Отсюда очевидно, что по содержанию свойства и(1) (напри-
мер, частотный спектр) должны быть богаче, чем в случае иско-
мой функции w(t). Данное требование можно выполнить, распо-
лагая априорными данными или проведя предварительное экспе-
риментальное исследование объекта. .
Таким образом, определение аппроксимирующей импульсной
переходной функции линеаризованной модели нелинейного объек-
та сводится к решению интегрального уравнения идентификации,
которое дает оптимальное (в смысле минимума среднеквадрати-
ческой погрешности) приближение линейной модели к нелиней-
ному объекту.
5.3. Идентификация нелинейных объектов
с использованием функциональных степенных рядов
Одним из наиболее разработанных в теоретическом плане ме-
тодов описания нелинейных систем является метод, основанный
на использовании ряда Волыперра, относящегося к классу функ-
циональных степенных рядов. Построение ряда Вольтерра удобно
рассматривать для объекта с конечной памятью. Аппроксимируем
входной сигнал u(t) конечным числом прямоугольных импуль-
сов, взятым с интервалом А/: и2, ..., uN (рис. 5.6). Величину N
выбирают так, чтобы при п > N не было влияния ип на выходной
сигнал Х0- В этом случае выходной сигнал ХО можно аппрокси-
мировать функцией N переменных /(wb и2, ..., uN), которую, ис-
пользуя разложение функции многих переменных в ряд Тейлора,
можно представить в виде:
Рис. 5.6. Аппроксимация входного сигнала объекта прямоугольными им-
пульсами
127
При нулевых начальных условиях и малости А/ по сравнению с
постоянными времени объекта функция у(0 является хорошей
аппроксимацией y(t). Можно заметить, что первая сумма дает ап-
проксимацию линейной моделью. Действительно, полагая = w. А/,
получим
N
Улин (0 =
/=1
Эта сумма при AZ -> О, 7V АА/ -» t стремится к интегралу
свертки
Улин (0 = Jwi(T)w(/-T)dT.
о
Квадратичные члены учитывают взаимодействие двух импуль-
сов. В пределе укв принимает вид
Укв (0 = J J *2 (*1, Ъ) и (t - 1!) и (t - т2) dT,dT2.
о о
Проводя аналогичные рассуждения для членов более высоких
порядков, можно показать, что (5.8) преобразуется в ряд Воль-
терра вида
оо 00 °о п
У(0 = Е J -J т2,..., Tn)n«(^-ty)dT7. (5.9)
л=1 0 0^ 7=1
п
На рис. 5.7 приведена структурная схема модели нелинейного
объекта, соответствующая выражению (5.9), которое показывает,
что разложение в ряд Вольтерра является обобщением модели ли-
нейного объекта в форме интеграла свертки, при этом совокуп-
ность ядер ряда (5.9) однозначно определяет динамические свой-
ства нелинейного объекта, а само ядро w,(xb ..., т,) называется
импульсной переходной функцией i-го порядка.
Ядра ряда Вольтерра для физически реализуемых систем обла-
дают следующими свойствами:
• выходной сигнал системы зависит только от предыстории
входного сигнала, при этом
w„(T], ..., т„) = 0 при т, < 0, zel, л;
• все устойчивые объекты имеют конечную память, поэтому
при увеличении т,
..., т„) = 0 при т, -> оо, i е 1, л;
128
Рис. 5.7. Структурная схема модели Рис. 5.8. Структурная схема парал-
нелинейного объекта дельного соединения нелинейных
систем со сложением выходных сиг-
налов
• w„(tb ..., т„) является симметричной функцией или может
быть симметрирована.
Для импульсных переходных функций высших порядков мож-
но ввести прямое преобразование Лапласа
Wf (% ..., = L{wi (ть .... т,)} =
. . (5.Ю)
= J ••• J w, (Tb..., т,)е"5|Т| ...e^'dt! ...dt,-
и обратное
w, (ть ..., т, ) = L-' {Wt (sb ...» s, )} =
Gaj+y® a^.+JG) (5.П)
=-------r f ... [ W\ (sb ..., s,)e5|T| ...e^'ds! ...ds,-.
Ядра Вольтерра, соответствующие анализируемой нелинейной
системе, обычно получают по структурным схемам, применение
которых позволяет наглядно и достаточно просто находить связь
между входным и выходиыкГсигналами. Рассмотрим основные пра-
вила преобразования Структурных схем нелинейных систем с ис-
пользованием временных и частотных характеристик.
Вначале остановимся на особенностях преобразования струк-
турных схем нелинейных систем во временной области. На рис. 5.8
приведено параллельное соединение нелинейных систем. Пусть
и Тт — две функциональные полиномиальные системы с ядрами
й,-(ть Тз, ..., т,), i = 1, ..., п и Ау(ть ..., т7), j = 1, ..., т соответствен-
но. При их параллельном соединении
N i
y(t) = {Rn+ Tm)u(t) = £ J.. J[4 (ть...,т,) + £, (ть...,т,-)] ]ju(Ty)dvT,
/=1 en 7=1
i
где dvt = I]dT1.. .dr,; N < max{n, m}.
7=1
129
Рис. 5.9. Структурная схема параллельного
соединения нелинейных систем с перемно-
жением выходных сигналов
Ядра результирующего полинома Вольтерра задают формулой
g, (ть т,) = Д (ть т,) + Л, (ть ...» т,) для всех i = l,...,N.
Если y(t) определяется произведением выходных сигналов двух
нелинейных систем (рис. 5.9), то
ИО = (М)«(О = JСч," >x»)flM(Tr)dvt гх
7=1 Ei r=i
x|s J ]hJ (T1,...,T7 )n«K)dvt =
j=l Ej r=1
m n i+j
=£Ё J-(xi>-fr+i>•• •>*(+,)llM(xr)dvt =
/=1 j=l E‘+J r=l
N i
= £ {-/&(хь-Л/)Пи('сг)<^« N < n + m.
i=r £/ r=l
При этом ядра ftCt], ...,t() определяются соотношениями
&(Т1,Т2) = ^1(Т1) А,(т2),
g3 (Т1,т2,т3) = k(xl)hi (тьт2) + Л2 (тьт2) А (т3),...
Аналогичный подход применим для преобразования ядер не-
линейных систем в случае их последовательного соединения и со-
единения с обратной связью, хотя громоздкость соотношений зна-
чительно возрастает. В таких случаях удобнее использовать много-
мерные преобразования Лапласа (5.10), (5.11). При этом функцио-
налу Вольтерра г-й степени
И0 = J...jA(T1,...,T,)n«(^-Tr)dvt,
Е'
соответствует интеграл свертки от i переменных
y(z1,...,/,) = |...|й/(т1,...,т,)Пм(4-тг)ду„
£/ Г=1
130
к которому и применяют многомерное преобразование Лапласа
Г(51,...,5/)=Я/(51,...,5/)Пи(5г),
Г=1
где Y, Н — многомерные изображения Лапласа функций у и Л.
При вычислении оригинала используют теорему о переходе к
одной переменной. Передаточная функция Н обычно является
дробно-рациональной функцией i переменных с действительны-
ми коэффициентами:
т т
X ••• S ^<1 •••'m
it • Г/5!1
Л=о /}=о
Для проверки устойчивости однородной системы i-й степени
можно воспользоваться обобщенным критерием Гурвица.
Рассмотрим, как определяются ядра системы при преобразо-
вании структурных схем. Вновь обратимся к рис. 5.8; изображения
ядер будут иметь вид
Sj), z = 1, ...,л; Кjr(sb..., Sj), j =
Вследствие линейности многомерного преобразования Лапла-
са при параллельном соединении получим
Н/ (*^1» • • •» $i) = Hi (^1> • • • > $i) K-i (^1» • • ч $/ ) •
Для изображения ядер произведения тех же систем (см. рис. 5.9)
получим следующий результат:
N f / )
Г (s) = (sb ... ,$,•)£](/(sr)k
i=2 I r=l J
для ядер б-:
&2 (5Ь si) - (s2),
(51, 52, 5з) = ($2, ?з)+ ^2(sb s2)Hl (5з), •••
При последовательном соединении (рис. 5.10) нелинейных
систем изображения первых ядер имеют вид
131
Рис. 5.10. Структурная схема последовательного соединения нелинейных
систем
б?1(51) = ^1(51)Я1(51),
2
(2
^2 (5i> 5г) = ^1 ^2 (51, 5г)+ Кх ($!, $2)П#1 (5Г),
3
3 \
бз(51>52,-Уз) = ^1 IX Hy(sx,s2,Sy) + Kx Sx,Ysr Hx(sx)x
\ r=l r=2 /
3
( 2
ХЯ2 (5Ь 52)+^2 XSr>s3 S2)HX (5з)+ Ку (S], S2, (М'
Рассмотрим в качестве примера нелинейную систему, которая
задана структурной схемой (рис. 5.11, а), где H(s), F(s), P(s) —
линейные звенья с передаточными функциями:
Я(5) =
^1
7]5 + Г
P^=Tsi + Ts + r
7 3S T./4JTI
Согласно формулам для произведения двух линейных систем
часть системы, обведенная на рисунке пунктирной линией, име-
ет ядра второго порядка:
Используя формулы для последовательного соединения линей-
ной и нелинейной систем, получим (рис. 5.11, б):
а
Рис. 5.11. Примеры нелинейных систем со структурами:
а — параллельно-последовательной; б — последовательной
132
G2 (*i, sz) = P(sx + s2)W2 (sx, s2) =
__________________kxk2k3__________________
£Тз($|+$2) + ?4 (S1 + 52)+1 (^1J1 + 1)(^2s2 + 1)
Аналогично решают и другие подобные задачи.
Преимуществами представления нелинейных операторов в виде
отрезка ряда Вольтерра является единообразие описания широ-
кого класса нелинейных объектов различной структуры, возмож-
ность представления зависимости между входом и выходом в яв-
ном виде.
5.4. Использование рядов Вольтеррй для идентификации
нелинейных объектов, содержащих множительные
устройства
В качестве примера использования рядов Вольтерра для иден-
тификации нелинейных объектов рассмотрим структуру модели
нелинейного объекта (рис. 5.12), содержащую множительное зве-
но и линейные звенья с весовыми функциями ^(Г), w2(t), w3(t).
Для сигнала на выходе множительного звена имеем
y(f) = J W] - х) dr J w2 (x)u(/ - x) dx =
t, ° ° (5.12)
= j f w, (?! >2 (x2 )u(t - X, )u(t - x2) dx!dx2.
00
Выход модели определяется выражением
t
z(t) = Jw3(x3)y(/-x3)dx3 =
0
Г-ТЗ
= Jw3(t3) J J w1(X|)w2(x2)i/(/-x3-Х!)м(/-Х3-x2)dx,dx2dx3.
0 0
0
Рис. 5.12. Структура нелинейного
объекта, содержащего множитель-
ное устройство
^l(s)
Ж2(5)
133
Применяя многомерное преобразование Лапласа к выражению
(5.12), получим
Г(5„ 52) = )U(s2),
а группируя переменные по формуле [24]:
1 G+J*»
У(д) = — ( У($-$2,$2)<152,
где 5 = ^! + 52, переходим к выражению
Y(s) = -П" ^(s-s2)]¥2(s2)U(s-s2)U(s2)ds2. (5.13)
2jV Д.
Учитывая, что Z(s) = Из(л)У(л), и подставляя в это выражение
значение У($), определенное по формуле (5.13), получим
Z(s) = ^3(5)^Т^-52)^2)и<5-52)и(52)^2 =
by „'j-
= - s2)W2<s2)W3(s — s2 + s2)U(s - s2)U(s2)ds2.
by
Откуда следует, что
Z(5„52) = Fri(51)Fr2(52)ir3(51+52),
переходя во временную область, имеем
z(t) = JJwGi, T2)w(/-T|)M(/-r2)dx1dT2,
00
где
W(X„ Т2) = L~l {^(^(^(S! + S2)}.
Полученный для частного случая результат можно обобщить.
Положим, что нелинейная система представляет собой соедине-
ние линейных звеньев с передаточными функциями IKi(si),
lK2(s2), ..., FK„(s„), выходы которых перемножаются, и последова-
тельного соединения выхода множительного устройства с линей-
ным звеном, имеющим передаточную функцию H(s).
Тогда преобразование ядра такого объекта приобретает вид функ-
ции п переменных:
W1) ^2(52)... WM + S2 + ... + S„),
134
Рис. 5.13. Пример структуры нелиней-
ного объекта, содержащего линейные
звенья с параллельными соединениями
и множительное устройство
которая соответствует во временной области функционалу п-й сте-
пени.
На рис. 5.13, 5.14 приведены примеры структурных схем нели-
нейных объектов, содержащих множительное устройство, иллюст-
рирующие удобство использования многомерного преобразования
Лапласа для описания подобного рода объектов.
Для структуры, изображенной на рис. 5.13, имеем
111
y(t) = J J J w3 (ti , т2, т3 )u(t - Tl )u(t - t2 )u(t - T3) dTidx2dt3,
000
где
/ ч r-i [ 1 1 1 1 1
w3(Tb t2, t3) = L 1 -------------------------— k
[ 5j 4- Q S2 + Ь 53 4- C + 52 + 5з + и J
Динамика объекта, структура которого приведена на рис. 5.14,
описывается уравнением
t 11
y(t) = J Wi (т)ы(/ - т) dt +J j w2 (Т], x2 )u(t - tl )u(t - t2 ) dTidT2,
0 00
где
-----_____н1(т) = £-' {Л(5)^(5)},
w2(T,, T2) = L~' {A(sl)C(si)A(s2)D(s2)E(sl +s2)}.
D(s)
Рис. 5.14. Пример структуры нелинейного объекта, содержащего линей-
ные звенья с последовательно-параллельными соединениями и множи-
тельное устройство
135
5.5. Использование рядов Вольтерра для построения
моделей при идентификации нелинейных объектов
Как было показано, совокупность импульсных переходных функ-
ций высших порядков полностью описывает динамические свой-
ства нелинейного объекта, поэтому задача идентификации сво-
дится к определению этих импульсных переходных функций. При
этом, естественно, приходится ограничиваться конечным числом
членов ряда Вольтерра, в связи с чем возникает вопрос о скоро-
сти сходимости такого ряда.
В общем случае сходимость ряда Вольтерра гарантируется тео-
ремой Фреше, однако оценок скорости сходимости эта теорема
не дает. При отсутствии в нелинейном динамическом объекте об-
ратных связей точность представления его моделью, построенной
на основе ряда Вольтерра, определяется точностью, с которой
характеристики нелинейных безынерционных элементов объекта
выражаются степенным рядом. Получены оценки сходимости [6]
для некоторых типов нелинейностей и при наличии в объекте
обратных связей.
Довольно часто для адекватного представления идентифици-
руемого объекта моделью рассматриваемого вида вполне доста-
точно нескольких членов ряда Вольтерра. В качестве примера рас-
смотрим построение модели с использованием двучленного от-
резка ряда Вольтерра.
Положим, что импульсные переходные функции и^т) и w2(ti, т2)
абсолютно интегрируемы на интервале времени [О, Т], т.е. w, е
е [О, Т]. Эти функции можно разложить по некоторой системе
аппроксимирующих функций {<р(/)}, также абсолютно интегриру-
емых на том же интервале времени:
wiCO = 2>„<ря(т),
л=0
N N
W2(T1,T2) = (5.14)
и1=0 л2=0
Система функций является ортогональной и полной в
пространстве ЛДО, Г]. При использовании представления (5.14)
«усеченная» модель представляет собой структуру, показанную на
рис. 5.15.
В качестве критерия настройки модели можно выбрать средний
квадрат рассогласования выходных координат объекта у(1) и мо-
дели
J = M {[y(0 - Ум (О]2} min. (5.15)
136
Рис. 5.15. Структура «усеченной» модели нелинейного объекта
Из услови^\минимума (5.15) получается система линейных
алгебраических уравнений для определения коэффициентов ап и
Купк (0) = У ап^ппк (0) + У У 0Л1Л2 Кпхп2пк (0)>
л=0 Л1=0л2=0 z г
N N N (5.16)
Кутать (0)=£ (0)+Z X ^П[П2 ^П\П2т\ГП2 (0),
л=0 Л1=0я2=0
где
КщъЛ®) = М {Zn, (tyzn, (t)zm(t)},
Kym{mi (0) = M {ytflZm, (tyz^ (0},
137
^П1ЩТП2 (0) = M{zn{t)zmi (tyz^if)},
(0) — -Л/ (O^n? (O^m, (O-^mj (0}.
г„ДО = J<pn*(T)i/(/-T)dT.
0
Поскольку при симметричном распределении входного сигна-
ла его нечетные моменты тождественно равны нулю, система урав-
нений (5.16) распадается на два независимых уравнения:
N
Kym(fi)=YanKnm(fi),
N";° <517>
Kvmm (0) = У У ап„ К„ „ т т (0).
ут\т2 V ' *^П\П2 п\П2т\Ш2 \ /
П\ =0 П2 =0
Если входной сигнал является нормально распределенным «бе-
лым шумом», то алгоритм (5.17) упрощается:
Оп = М*^ди(0),
^Л|«2 ~
где ц = const.
При практическом использовании рассмотренного выше под-
хода при идентификации нелинейных объектов сигнал, представ-
ляющий собой аналог «белого шума», подают аддитивно с неко-
торым рабочим сигналом, причем, хотя суперпозиция в нели-
нейном объекте и не соблюдается, ее можно принять, так как ряд
Вольтерра представляет полилинейную форму от входных пере-
менных.
5.6. Идентификация нелинейных объектов класса
Гаммерштейна
К объектам класса Гаммерштейна относят нелинейные дина-
мические объекты, имеющие структуру, приведенную на рис. 5.16.
Подобного рода объект, как указывалось ранее, состоит из
последовательно соединенной безынерционной нелинейности f(u)
и линейного звена с импульсной переходной функцией М7). Связь
между входной u(t) и выходной у(0 переменными описывают
оператором Гаммерштейна'.
У(0 = jw(T)/[w(Z-T)]dT.
о
(5.18)
138
Рис. 5.16. Структура нелинейного объекта клас-
са Гаммерштейна
Для нахождения операторов /и w их можно представить в виде
разложения, использовав соответственно базисы {<р} и {хр}, сводя
при этом задачу к параметрической идентификации:
/(и) = £а,Ф,(«), (5.19)
1=0
w(x)= (5.20)
7=0
С учетом разложений (5.19) и (5.20) модель объекта примет
вид, показанный на рис. 5.17.
Введя обозначение
№ = J Фу(т)<р, [«(/ - T)]dT,
о
уравнение (5.18) можно переписать в компактной форме:
п т
У(0 = Ya'lL = arW)b,
/=0 j-0
где Н(/) — матрица, элементами которой являются значения h^t),
i = 0, л; j = 0, т.
Если функция w(t) представлена дискретными значениями в
моменты времениуДт, т.е. Wj = w(JAt), то
№ = X («*-;) = arH*w,
j=0 i=0
где
н* = , i = o, n, j = 0, m.
Рис. 5.17. Модель нелинейного объекта класса Гаммерштейна
139
В этом случае коэффициенты bj совпадают со значениями им-
пульсной переходной функции Wj, а операторы у, (т) представля-
ют собой элементы задержки на jba.
При нахождении оценок коэффициентов а и b положим, что
наблюдаемое на выходе объекта значение сигнала содержит адди-
тивную помеху п:
Zk =Ук +пк = аН*Ь + п.
Считая, что случайная помеха п обладает следующими свой-
ствами: Af{n} = 0, cov[n] = a,yl (I — единичная матрица), т.е. поме-
ха представляет дискретный «белый шум», оценки а и Ь могут
быть определены методом наименьших квадратов из условия
/(a, b / z, и) = min /(a, b / z, и). (5.21)
a,b
Однако нужно иметь в виду, что задача (5.21) не имеет един-
ственного решения. Функция / достигает минимума на множестве
abr= const, т.е. в плоскости а, b функция принимает минималь-
ное значение на параболах ab = const [24].
Для определения параметров модели класса Гаммерштейна мо-
гут быть использованы и другие методы, например оценивание
параметров подобной модели может быть осуществлено методом
максимума апостериорной вероятности.
Вообще говоря, успех построения модели класса Гаммерштей-
на зависит в первую очередь от того, действительно ли можно
представить объект в виде последовательно включенной безынер-
ционной нелинейности и линейного динамического звена. Слож-
ность модели, иначе говоря, порядок значений п и т, определя-
ется тем, насколько удачно выбраны системы базисных функций
{<р} и {у}.
5.7. Блочно-ориентированные нелинейные модели
Рассмотренные выше методы исследования нелинейных объек-
тов можно дополнить еще одним подходом, который применяют
к моделям нелинейных объектов, относящихся к классу моделей,
характеристики которых могут быть представлены нелинейными
статическими и линейными динамическими звеньями. Наиболь-
шее распространение получили блочно-ориентированные струк-
туры, приводящие к простейшим факторизуемым ядрам (рис. 5.18),
вид которых приведен ниже:
°о п
у»п Сч, •••, %) = рл (о)П5(т/ -0)d0>
О 7=1
140
u(t)
«(f)
>Л
в
Рис. 5.18. Разновидности блочно-ориентированных структур моделей нели-
нейных систем
w„(Tb...,T„) = nw4(Ty),
>1
со п
(т,,..., т„) = J ^л2 (0)П М'л (у/ - о) de.
о У=1
Соответствующие многомерные изображения ядер по Лапласу
имеют вид
и; ($1,5„) = икл ($, +$2
п
j=i
п
sn) = ^(Si +s2 + ... + s„)n^i(^)-
7=1
Одной из наиболее распространенных конструкций является
модель, известная как фильтр Заде (рис. 5.19). Такая модель позво-
ляет выделить составляющие различной степени нелинейности,
учесть нелинейные динамические свойства и т.д. Идентификация
модели по существу заключается в определении параметров ли-
нейных подсистем.
По виду применяемых тестовых сигналов различают методы,
использующие случайные или детерминированные (периодиче-
ские и непериодические) сигналы.
Рис. 5.19. Модель нелинейной системы —
фильтр Заде
141
Первая группа методов основана на определении ординат ядер
Вольтерра методами взаимной корреляции. При этом решают за-
дачу оптимизации уравнения рассогласования вида
Л/[у(/)-ум(/)]2 -> min,
где y(t), yM(t) — выход объекта и выход модели соответственно.
Минимизация этого выражения приводит к системе интеграль-
ных уравнений относительно неизвестных весовых функций, ана-
логичных уравнению Винера—Хопфа:
v
Rp(t,Ti,...,Xp)=Y J Wq(t, G1,...,G(?)X/,+?(O|,...,O?,Tl,...,T/,)dv(J,
9=0 Eg
где Kx (Т],..., хр) = и (Т[) и (т2)... и (тг) — момент высшего порядка
входного сигнала; /?г(/, т1,...,тг) = у(/)м(т1)...«(тг) — смешан-
ные моменты высшего порядка входного и выходного сигналов,
р = 0, п, dv„ = doi ...do9.
Решение приведенного уравнения крайне громоздко и практи-
чески может быть получено лишь для частных случаев. Обычно в
качестве входного сигнала рассматривают нормальный «белый
шум», при этом нечетные моменты входного сигнала равны нулю,
а старшие четные моменты можно выразить через вторые момен-
ты. В практических исследованиях в качестве тестового сигнала часто
используют псевдослучайные последовательности, отличающие-
ся простотой реализации. Однако при вычислении корреляцион-
ных моментов высших порядков таких сигналов возникает про-
блема аномалий, связанная с неидеальностью спектральных ха-
рактеристик псевдослучайных последовательностей в сравнении
с «белым шумом».
Рассмотренные в этом разделе способы описания и идентифи-
кации нелинейных систем далеко не исчерпывают многообразия
существующих методов, однако они раскрывают основные направ-
ления работ в этой области.
Темы для повторения
1. Виды тестовых сигналов, используемых для идентификации нели-
нейных объектов.
2. Виды математических моделей нелинейных объектов.
3. Использование методов линеаризации для получения математичес-
кого описания нелинейных объектов.
142
4. Основные свойства разложения в ряд Вольтерра.
5. Основные правила преобразования структурных схем нелинейных
объектов, модели которых представлены разложениями в ряд Вольтерра,
при использовании временных характеристик. •
6. Основные правила преобразования структурных схем нелинейных
объектов, модели которых представлены разложениями в ряд Вольтерра,
при использовании передаточных функций.
7. Особенности применения рядов Вольтерра для идентификации не-
линейных объектов, в структуру которых входит множительное устрой-
ство.
8. Использование усеченного ряда Вольтерра для построения моделей
идентифицируемого нелинейного объекта.
Глава 6
МЕТОДЫ ИДЕНТИФИКАЦИИ
С НАСТРАИВАЕМЫМИ МОДЕЛЯМИ
6.1. Принципы построения систем идентификации
с настраиваемыми моделями
Рассмотренные ранее методы идентификации имеют один су-
щественный недостаток, а именно: определение характеристик
объекта проводится по разомкнутому принципу. Поэтому при на-
личии помех, коррелированных с сигналом, и нестационарности
объекта в процессе решения задачи идентификации могут возни-
кать значительные погрешности. Методы идентификации с на-
страиваемыми моделями относятся к схемам замкнутого типа. Они
имеют ряд преимуществ, важнейшими из которых являются воз-
можность работы в режиме нормальной эксплуатации и получе-
ние характеристик в реальном времени, что позволяет произво-
дить текущую идентификацию, а, следовательно, оперативно сле-
дить за изменением характеристик в случае нестационарности
объекта, что в свою очередь делает возможным управление объек-
тами с изменяющимися в широких пределах характеристиками.
Структурная схема общего вида, иллюстрирующая идентифи-
кацию объекта с применением настраиваемой модели, приведе-
на на рис. 6.1. Схема включает вычислитель критерия близости р
сигналов с выхода объекта и настраиваемой модели ум(Г),
а
Рис. 6.1. Функциональная схема системы идентификации объекта с при-
менением настраиваемой модели
144
а также автоматический оптимизатор или блок настройки пара-
метров модели, изменяющий вектор параметров а = (аь а2, ...,
а„) в целях оптимизации критерия р.
Как правило, блок настройки параметров в подобного рода
системе идентификации изменяет параметры модели таким обра-
зом, чтобы минимизировать критерий идентификации. Необхо-
димым условием достижения указанного минимума является ра-
венство нулю градиента критерия идентификации по параметрам
модели. В зависимости от принципа работы оптимизатора системы
идентификации подразделяют на поисковые и беспоисковые.
Этот контур в целом не является сигнальным: информация в
нем формируется из выходных сигналов объекта Уоб(?) и модели
ум(/) в виде скалярной функции J, преобразуемой в вектор пара-
метров а настройки модели.
Такая система обладает всеми основными преимуществами
систем с обратной связью. Применение модели, предварительно
подстроенной к характеристикам объекта, придает рассматривае-
мой системе идентификации черты компенсационной схемы (фак-
тически идентифицируются отклонения параметров), что увели-
чивает скорость и точность алгоритма настройки. Эти особенно-
сти также указывают на достоинства рассматриваемого подхода к
решению задачи идентификации.
В современных системах идентификации используют, как пра-
вило, цифровые вычислительные устройства, и в этом смысле
методы идентификации с настраиваемыми моделями не являют-
ся исключением. Это обстоятельство приводит к некоторой раз-
мытости границ между различными способами идентификации.
Основным признаком, позволяющим отнести метод идентифика-
ции к схеме с настраиваемой моделью, является наличие обрат-
ной связи и компенсации.
Значение критерия J, оцениваемое в вычислителе критерия
близости, позволяет определить расстояние (в некоторой метри-
ке) между сигналами на выходах объекта ус>б(0 и модели ум(/).
Иначе говоря, задача настройки модели состоит в приближении
yM(t) к Уоб(0 в смысле выбранного критерия, в результате чего
формируется модель, изоморфная объекту по поведению. При этом
полученные параметры модели (в зависимости от ее построения)
могут непосредственно количественно определять коэффициенты
оператора, выбранного для описания объекта.
Успех настройки систем идентификации с настраиваемыми
моделями зависит от вида функции, выступающей в роли крите-
рия, т.е. от вида р(Уоб, Ум) = Pi(“, а)- Функцию р] можно интер-
претировать при заданном входном сигнале u(t) как гиперповерх-
ность в «-мерном пространстве а. При этом процесс оптимизации
есть движение по этой гиперповерхности в поиске глобального
минимума.
145
При построении такой системы идентификации необходимо
решить следующие основные вопросы: какого вида выбрать кри-
терий р, как построить модель и какой выбрать стратегию при-
ближения модели к объекту.
Наиболее часто используемыми в рассматриваемых системах
идентификации являются квадратичный критерий и критерий
равномерного приближения.
При использовании квадратичного критерия в виде
р = [Уоб(0 - к (ОР
или в виде
р = ^{[Уоб(0-ум(0]2},
где М — математическое ожидание, минимизируется квадрат от-
клонений либо его математическое ожидание, т. е. с физической
точки зрения мгновенная или средняя мощность ошибки.
Предпочтение, которое отдается применению квадратичного
критерия при идентификации объектов с использованием настра-
иваемых моделей, объясняется, в частности, и тем фактом, что
для линейных моделей он обеспечивает линейную форму связи с
параметрами, что приводит к системе линейных уравнений.
Критерий равномерного приближения
Р = max |уоб (/)-ум(0|
позволяет минимизировать максимальное значение ошибки на
заданном интервале.
Автоматический оптимизатор может быть построен с исполь-
зованием стандартных алгоритмов поиска экстремума (например,
градиентных, покоординатного или случайного поиска экстрему-
ма и т.д.). Варианты практической реализации структуры системы
идентификации, приведенной на рис. 6.1, могут отличаться кон-
струкциями моделей, критериями и стратегией настройки. Одна-
ко ясно, что настройку модели можно сделать эффективнее, если
выполнить три основных блока контура настройки не независи-
мыми, а совместить их функции или учитывать вид конкретных
алгоритмов, положенных в основу работы этих блоков. Такой под-
ход дает возможность более оперативно и с меньшими потерями
использовать информацию в системе. В подобной системе иденти-
фикации уже трудно выделить элементы с самостоятельными функ-
циями и более удобным становится ее алгоритмическое описа-
ние.
Таким образом, основная особенность систем идентификации
с настраиваемыми моделями состоит в том, что в них реализуется
146
Рис. 6.2. Функциональные схемы идентификации объекта с примене-
нием прямой (а), обратной (б) и обобщенной (в) модели
принцип подстройки модели к объекту по признакам близости
поведения, и выражается в том, что схема идентификации содер-
жит контур с обратной связью.
В зависимости от включения в схему идентификации различа-
ют прямые и обратные модели (рис. 6.2, а, б). На рис. 6.2, в пока-
зана обобщенная модель, включающая обе эти модели, за счет
чего она приобретает новые свойства.
Применение той или иной модели определяется конкретными
условиями, в которых работает и исследуется объект, требовани-
ями к его математическому описанию. При обнаружении шумов
на выходе объекта предпочтительнее прямая модель, а при дей-
ствии помех на его входе — обратная. Может быть важен и харак-
тер зависимости критерия настройки от параметров модели. Так,
в обобщенной модели эта зависимость линейна и раздельна для
параметров числителя и знаменателя передаточной функции.
6.2. Структурные и изоморфные модели
Модель является основной частью рассматриваемой схемы иден-
тификации. При конструировании модели используют набор опе-
раторов, позволяющий адекватно отражать свойства объектов оп-
ределенного класса. Разнообразие этого набора определяет основ-
ные характеристики модели: размерность, «длину» памяти, свя-
занную с длительностью моделируемых процессов, точность и пр.
Применяемые в системах идентификации модели делят на две
группы: структурные и изоморфные. К структурным относят мо-
147
Рис. 6.3. Пример структурной модели объекта, построенной по диффе-
ренциальному уравнению
дели, воспроизводящие структуру выбранного описания объекта.
Структурное отображение требует хорошего соответствия объекту
в математическом смысле. Оно может иметь, например, форму
передаточной функции. В этом случае модель может быть реализо-
вана из аналогов типовых звеньев. Однако в таких моделях техни-
чески сложно осуществлять перестройку параметров. Часто для по-
строения структурной модели используют описание в виде диф-
ференциального уравнения
а„у^ + ая_1з/л"') +... + + у = ки.
Моделирование такого уравнения можно осуществить на ин-
теграторах по методу понижения порядка производной (рис. 6.3).
Недостаток структурной модели — необходимость обширной
априорной информации, которая не всегда доступна. Например,
для химического реактора практически трудно или даже невозможно
получить промежуточные координаты и составить математическую
модель протекающего в нем процесса. В подобных случаях строят
изоморфную настраиваемую модель (имеется в виду изоморфизм по
поведению относительно координат «вход—выход»). Особенность
изоморфной модели заключается в том, что она дает описание
свойств объекта в виде аппроксимации временной либо частотной
его характеристики посредством базисных функций. По существу
такой принцип предполагает выбор модели объекта с помощью
настраиваемой модели из множества, определяемого функциональ-
ным пространством, в котором заданы базисные функции.
При описании во временной области импульсную переходную
функцию изоморфной модели можно задать аппроксимирующим
рядом конечной длины:
п
wm(0 = ZP,«p<(4 (61)
/=0
148
Рис. 6.4. Изоморфная модель объекта управ-
ления
Это выражение можно переписать в изображениях
п
1=0
или представить в частотной форме заменой s = Joo. Функции <р,(?)
базисной системы должны быть линейно независимыми. Наибо-
лее удобны из этого класса ортогональные функции, применение
которых позволяет улучшать приближение к аппроксимируемой
характеристике простым увеличением длины ряда (6.1), не меняя
при этом значений ранее полученных коэффициентов 0,. В зависи-
мости от интервала определения используемых базисных функ-
ций различают изоморфные модели с бесконечной и конеч-
ной памятью.
Рассмотрим примеры построения изоморфных моделей, от-
вечающих описанию (6.1). Схема модели этого типа показана на
рис. 6.4. Однако для практического применения она невыгодна из-
за сложности ее функциональных элементов <р,(0- Техническая ре-
ализация модели значительно упрощается, если использовать ба-
зисные функции <р,(/), подчиняющиеся при формировании ре-
куррентной процедуре.
К часто применяемым в этом качестве относятся ортогональ-
ные функции Лагерра'.
Ф* (0 =
1 p.2at
а z^e-20/j £ = 0,1,2,
имеющие интервал определения [0, »). Переходя к записи в изоб-
ряжениях
£{ф* (0} = ф* (5) =
>/2а Г s - а V
s + a^s + a J’
легко увидеть, что эти функции обеспечивают экономное по-
строение модели из одинаковых элементов (рис. 6.5). Такая мо-
дель, часто называемая фильтром Лагерра, отличается удобством
перестройки временного масштаба (путем изменения параметра
а) и простотой задания размерности к, определяемой числом эле-
ментов фильтра.
149
Рис. 6.5. Модель объекта управления, выполненная на фильтре Лагерра
При увеличении размерности модели точность аппроксимации
должна увеличиваться, так как
|ро-Ь,Ф,«)| =
Однако элементы модели реализуются с конечной точностью,
поэтому начиная с некоторого п представление wM(Z) в виде от-
резка ряда функций Лагерра начинает ухудшаться. Эти соображе-
ния применимы также и к'другим базисам.
Таким образом, точность идентификации связана с точнос-
тью реализации операторов модели. Наибольшую точность может
дать применение элементов цифровой техники.
Описанные выше модели относят к моделям с бесконечной па-
мятью, поскольку их импульсные передаточные функции, опре-
деляющие длительности переходных процессов, формально зату-
хают только при /-><».
На практике процессы как в объектах, так и в моделях при
идентификации можно наблюдать лишь на ограниченных интер-
валах, при этом допустимо применение моделей с конечной памя-
тью. Очевидно, что выбираемая «длина» памяти должна быть не
меньше практической длительности реакции идентифицируемого
объекта.
Пример простейшей модели с конечной памятью показан на
рис. 6.6, а. Элементом памяти здесь служит многоотводная линия
задержки, которая и определяет максимальный интервал запо-
минания поступающих на вход сигналов.
Если предположить, что линия задержки является непрерыв-
ной и не затухает, ее описание по каждому выходу можно пред-
ставить импульсной переходной функцией в виде смещенной 5-фун-
кции:
Ф, (/) = 5(t- /Д/); i = 0,1,..., п.
Неперекрывающиеся во времени функции ф,(/) являются ор-
тогональными. При этом значения моделируемой импульсной пе-
150
б
Рис. 6.6. Модели объектов с конечной памятью на линии задержки с при-
менением аппроксимирующих функций диагонального (а) и приспособ-
ленного (б) базисов
редаточной функции wu(t) в каждый момент времени t= i&t опре-
делены заданными коэффициентами Р,.
Фильтр нижних частот на входе модели служит для подавления
высокочастотных компонент сигнала в целях уменьшения погреш-
ностей, обусловленных его временной дискретизацией с шагом
Д/ в линии задержки. Известно, что при дискретизации для неис-
каженной передачи сигнала с полосой частот от 0 до необхо-
димо соблюдать условие
1/Д/>1/тах,
определяемое теоремой Котельникова—Шеннона. Для повыше-
ния точности модели требуется уменьшать интервалы задержек
Д/, а это — при заданной «длине» памяти — увеличивает число
перестраиваемых коэффициентов р(. При приемлемой для систем
151
идентификации точности размерность п такой модели, определя-
емая числом настраиваемых величин Р„ должна быть не менее
30—40. Поскольку в системе идентификации с настраиваемой
моделью решается оптимизационная задача, при такой большой
размерности модели подобная система из-за сложности матема-
тического и технического обеспечения практически становится
нецелесообразной.
Эффективное сокращение размерности изоморфной модели
с конечной памятью можно получить за счет применения до-
полнительного базиса из таких функций, форма которых при-
способлена к аппроксимации импульсных передаточных функ-
ций заданного класса. Каждая функция приспособленного бази-
са синтезируется из суммы взвешенных функций исходно-
го базиса {<Р/(0}:
v* (0 = iakt Ф/ ('); к = °, 1, •••> т-
1=0
Построение модели с таким базисом показано на рис. 6.6, б.
Размерность т такой модели при удачном выборе функций v*(0
не превышает 5 — 7. Простой метод формирования приспособлен-
ных ортонормированных функций, задаваемых на конечном ин-
тервале, описан в учебном пособии [21]. Перестраиваемые модели
с памятью на элементах задержки легко реализуются в цифровой
модификации как в виде специализированных устройств, так и
на ЭВМ с соответствующим программным обеспечением.
6.3. Алгоритмы настройки модели
Как отмечалось выше, настройка модели может рассматриваться
как задача нахождения экстремума функции 7(Р) в пространстве
параметров. В качестве критерия /ф) обычно используют функ-
цию ошибки:
е(0 = Уоб(0-Ум(0-
Это может быть мгновенное значение квадрата ошибки:
Л = e2(t)
или среДнеинтегральная квадратичная ошибка:
Ji = J e2(/)d/.
t-T
152
Используется также среднеинтегральная абсолютная ошибка:
J3 - j |e(/)|d£.
t-T
Критерии J2 и J3 могут вычисляться с взвешивающей функци-
ей. Смысл применения взвешивания заключается в придании зна-
чениям ошибки различного веса, например, старой информации
придается меньший вес.
Для достижения экстремума используют различные методы
поиска, которые определяют алгоритм работы автоматического
оптимизатора. Чаще других используют методы покоординатного
спуска, градиентные и методы случайного поиска. Все эти методы
реализуют последовательность одномерных процедур оптимизации,
а различаются они способом выбора направления оптимизации.
В методе Гаусса—Зайделя (методе покоординатного спуска) про-
изводится циклическая оптимизация по направлениям, параллель-
ным осям координат. Движение происходит с шагом, задаваемым
исследователем. С уменьшением величины шага растет точность
достижения экстремума, но растут и затраты (количество измере-
ний). Метод Гаусса—Зайделя эффективен для сепарабельных по-
верхностей (главные оси линий равного уровня параллельны ко-
ординатным осям). Поверхность J(0) оказывается сепарабельной
при отсутствии перекрестного влияния параметров 0, (сигналы на
выходе фильтра изоморфной модели независимы). В других случа-
ях метод Гаусса—Зайделя обладает плохой сходимостью.
В градиентных методах для организации движения к экстрему-
му используют понятие градиента (векторной производной):
gradJ(0) = f—' .
W Э0,’ d0„J
Градиент указывает направление наискорейшего роста функ-
ции (обратное направление будет направлением наискорейшего
спуска).
Таким образом, применение градиентных методов связано с
изучением поверхности в исходной точке. Шаг определяется как
Д0' = a' grad J(0' ).
В зависимости от способа выбора параметра шага а' различают
следующие модификации:
• а' = а = const — поиск с постоянным параметром шага;
• а' = а/1| grad J(0) || — поиск с постоянным шагом;
• а' = —, (уе 0,1) — поиск с переменным параметром шага.
Г
153
Существуют и другие модификации. Например, в целях умень-
шения на каждом шаге числа экспериментов и ускорения сходи-
мости используют более экономный алгоритм, называемый ме-
тодом наискорейшего спуска. В этом случае градиент определяют в
исходной точке, затем производят многошаговую оптимизацию
вдоль направления градиента, далее процедуру повторяют. За счет
этого удается уменьшить затраты на определение градиента.
Методы случайного поиска отличаются от регулярных намерен-
ным введением случайности и являются развитием метода проб и
ошибок, когда удачное решение принимается, а неудачное — от-
вергается. Такой подход опирается на уверенность в том, что слу-
чайность содержит в себе все возможности, в том числе и иско-
мое решение. Эти методы являются универсальным средством ре-
шения задач при недостаточной априорной информации об объекте
и часто более эффективны, чем регулярные.
Существует большое количество алгоритмов случайного поис-
ка. Простейший алгоритм состоит в том, что система переходит в
новую точку при удачном шаге, а при неудачном — возвращается
в исходную.
Если состояние системы близко к экстремальному, использу-
ют линейную тактику, т.е. удачные шаги повторяют до тех пор,
пока не появится неудачный шаг. Радиус сферы, на которой рас-
пределен случайный вектор, может варьировать (например, при
поиске глобального экстремума).
Случайные методы используют в сложной ситуации при боль-
шой размерности задачи. Поиск этими методами с линейной так-
тикой при малом радиусе сферы распределения Д0 близок к гра-
диентному алгоритму.
Важной составной частью алгоритмов поиска экстремума яв-
ляется критерий остановки. Алгоритм распадается на ряд цикли-
ческих процедур (например, шаги по выбранному направлению),
переход между которыми осуществляется по некоторым правилам
(критериям): можно говорить, например, о критерии смены на-
правления или остановки поиска.
Для остановки поиска можно использовать следующие пра-
вила:
• провести остановку через N шагов;
• провести остановку, когда приращение функции /(0) (или
нормы градиента) станет меньше заданной величины;
• провести остановку, когда при любом из возможных шагов
не происходит улучшения функции.
Рассмотренные алгоритмы могут реализовываться не только как
шаговые, но и в непрерывном плане. Например, при реализации
блока настройки прямой модели, работающей по градиентному
алгоритму, в простейшем варианте схема настройки состоит из
отдельных каналов настройки по каждому параметру. Обычно ско-
154
рость изменения параметра полагают пропорциональной соответ-
ствующей составляющей градиента по этому параметру:
Умножая обе части (6.2) на dt и интегрируя, запишем
z° л л
= <6-3>
о
В случае если используется изоморфная модель вида
№ (0 = (О
/=0
и применяется квадратичный критерий близости модели к объекту
ЛР) = e2(t), e(t) = y^t) -
величину ЭУ/Эр, можно выразить через сигналы, присутствующие
в системе:
(6.4)
др/ др/
Рис. 6.7. Система идентификации объекта с реализацией блока настройки
модели по градиентному алгоритму
155
Подставляя выражение (6.4) в (6.3), получим
о
Такая система идентификации показана на рис. 6.7, где изоб-
ражен один из каналов настройки. При анализе подобной систе-
мы следует учитывать следующее:
• система идентификации с блоками настройки является нели-
нейной, поэтому анализ траекторий р,(/) затруднителен;
• траектории р,(/) зависят от усиления в контурах настройки и
начальных условий; при больших коэффициентах усиления систе-
ма может стать неустойчивой;
• при малых коэффициентах усиления в контурах скорость из-
менения параметров ниже скорости изменения сигналов; в этих
случаях при анализе системы можно использовать гипотезу о ква-
зистационарности;
• число контуров настройки определяется размерностью системы.
Для квазистационарного случая траектории p,(Z) описываются
системой дифференциальных уравнений первого порядка [24].
Заметим также, что в схеме, приведенной на рис. 6.7, факти-
чески отсутствуют как отдельные элементы вычислитель крите-
рия и оптимизатор. Учет априорной информации о виде критерия
и модели позволил заменить эти устройства блоком настройки
модели (обведен пунктиром).
Качество работы системы настройки зависит от степени пере-
крестного влияния параметров р,, которое определяется взаимо-
зависимостью сигналов на выходах фильтра изоморфной модели.
Можно показать, что если сигналы «,(/) ортогональны:
т
Jм, (t)Uj (/)d/ = (ц,Uj) = c8ij,
о
где 3,у — символ Кронекера, то при квадратичном критерии
т
J = Je2(/)d/ = (e,e), e(t) = y(t)~ £p,«,(t) (6.5)
0 i=Q
параметры модели могут быть определены из простых соотноше-
ний. Действительно, используя критерий (6.5), можно записать
систему уравнений ЭУ/ЭР = 0 в виде
(Ио,Ио) ... («„,Wo)jrpo
(Ио,И„) ... (м„,Ип)_|[р„
(у,«о)
(у,и„\
(6.6)
156
По существу, это формула метода наименьших квадратов
UrUp = UY,
которая с учетом ортогональности сигналов на выходе фильтра
преобразуется к виду
P = -UrY.
с
Из полученного выражения следует, что все параметры оцени-
вают независимо, поверхность J(p) является сепарабельной и
любой метод настройки обеспечивает быструю оптимизацию мо-
дели. Используя теорему Парсеваля, для остаточной погрешности
можно записать:
п
Jns = fy2 (Od<~CllPi-
О ‘=0
Из этого выражения можно определить «вклад» каждого пара-
метра модели в остаточное значение критерия (ошибку оптими-
зации).
Для получения условия ортогональности сигналов на выходах
фильтра запишем
и, (?) = J«(? -£)<р, (£)d£, ик (?) = Jm(? -v)<pt (v)dv,
О о
откуда следует
7 J J J W (^ - ^) W (^ - v) ф| (^) ) d^dvd? =
1 о о о
= JJКии (S-v)(p, (£)ф* (v)d^dv = 5/Jt. (6.7)
0 0 ♦
Соотношение (6.7) является условием независимости настро-
ек, которое может быть переписано с использованием теоремы
Планшереля в частотной области
J Suu (<о)Ф, (»ФЛ (-jco)dco = 8Л.
о
Из соотношения (6.7) видно, что в случае, когда сигнал на
входе объекта (и модели) представляет собой «белый шум», при-
157
Рис. 6.8. Структурная схема системы идентификации с дополнительным
тестирующим сигналом
менение ортогонального фильтра (в основу построения фильтра
положен ортогональный базис) позволяет получить независимые
настройки. Если же сигнал на входе системы недостаточно широ-
кополосен (матрица UTU в соотношении (6.6) теряет диагональ-
ное преобладание), то условия настройки ухудшаются.
Таким образом, для успешного формирования рассмотренной
системы входной сигнал должен быть достаточно «богатым». Он
должен возбуждать все собственные частоты объекта, т.е. объект
должен быть управляемым. При этом выходной сигнал объекта
должен содержать достаточно информации о протекающих внут-
ри него процессах, т.е. должны выполняться условия наблюдае-
мости и идентифицируемости объекта. Невыполнение первого ус-
ловия на практике приводит к тому, что модель не может быть
настроена. Один из приемов преодоления этой трудности состоит
в добавлении к входному сигналу специального тестирующего сиг-
нала. Часто для этой цели используют шумоподобные сигналы типа
/«-последовательностей. Применение таких сигналов оправдано тем,
что они имеют достаточно широкий спектр (энергия их практи-
чески равномерно распределена в широкой спектральной облас-
ти), легко реализуемы и управляемы. Структурная схема с допол-
нительным тестирующим сигналом показана на рис. 6.8.
Систему идентификации можно реализовать и в виде, пока-
занном на рис. 6.9, где модель не имеет элементов настройки, а в
Рис. 6.9. Структурная схема системы иденти-
фикации с реализацией настройки модели в
вычислительном устройстве
158
вычислительном устройстве формируется и решается система (6.6).
При независимых настройках матрица UrU становится диагональ-
ной, и система распадается на отдельные уравнения. Уровень вза-
имосвязи сигналов можно оценить мерой обусловленности мат-
рицы иги.
Следует обратить внимание на то обстоятельство, что система
идентификации, показанная на рис. 6.9, не имеет в явном виде
обратной связи и компенсации. Однако по функционированию
данная система может быть и замкнутой, но в таком случае эти
особенности оказываются скрытыми в алгоритме вычислительно-
го устройства, который обычно строят на основе рекуррентных
процедур, за счет чего достигается его высокое быстродействие.
6.4. Точность методов идентификации с настраиваемыми
моделями
Рассмотрим точность методов идентификации с настраивае-
мой моделью, используя алгоритмы, ориентированные на конеч-
ное число наблюдений, т.е. на выборочные значения [24]. Такая
постановка соответствует изоморфной модели, изображенной на
рис. 6.10, в которой фильтр представляет собой линию задержки.
Используя обозначения на рис. 6.10, можно записать:
Ум=Щ,
гДе Ум = (Умь---,Умк)т — значения сигнала на выходе модели в
дискретные моменты времени; 0 = (0О, ..., 0„)г — вектор парамет-
ров модели; U — матрица, содержащая значения сигналов на вы-
ходах фильтра в дискретные моменты времени:
«о(1),...,ми(1)
и =
Рис. 6.10. Структурная схема идентификации с
изоморфной моделью, реализованной на ли-
нии задержки
159
Для объекта запишем
у = Ub + п,
(6.8)
где у = (Уь ук)т — выборочные значения сигналов на выходе
объекта; b = (Ьь Ь„)т — вектор параметров объекта; п = (п{,
пк)т — выборочные значения помехи.
Обычно помеху задают математическим ожиданием и ковариа-
ционной матрицей:
М [л(1)л(1)]...Л/ [л (Л)л(1)]
Л/[п] = 0, Л/[п, пг] =
= N.
М [л (1) п (к)]... М [л (Л) п (Л)]
Сразу обратим внимание на то обстоятельство, что для «белого
шума»
N = <#.
Если в качестве функции ошибок выбрать положительно опре-
деленную форму J= erRe, где е = у - ум, R — весовая матрица, то
оценка Р, обеспечивающая минимум J, может быть найдена из
системы уравнений
IFRUP = UrRy
и при невырожденной матрице UrRU получим
р = (UrRU)-1 UrRy.
(6.9)
Из выражения (6.9) с учетом (6.8) можно получить соотноше-
ния
Р = b + (UrRU) ' UrRn = b + Qn, cov[p] = QNQr, (6.10)
где
Q = [UrRU]-1 UrR.
Эти соотношения справедливы и для метода наименьших квад-
ратов. Приведенные формулы позволяют сделать ряд выводов об
ошибках оценивания параметров.
Составляющая ошибки, возникающая из-за случайного шума,
который добавляется к выходному сигналу объекта, может быть
оценена по cov[p]. Для расчета ковариационной матрицы кроме
160
Рис. 6.11. Разложение импульсной пере-
ходной функции с учетом ее усечения
Модель 1
апостериорной информации (значений U, из которых составлена
матрица Q) необходима также величина cov[n] = N, которая зада-
ется априори.
Применим операцию математического ожидания к первому со-
отношению в выражении (6.10):
Af[p] = b + M[Qn].
Второе слагаемое определяет смещение оценки р. Для того
чтобы оно было нулевым, необходимо выполнение двух условий:
1) сигнал и и шум п должны быть статистически независимы;
2) математическое ожидание помехи должно быть равно нулю.
В этом случае можно записать
Af[p] = b + Af [Q]Af [п] = Ь.
Третья группа ошибок связана с тем, что часть параметров
объекта не оценивается (ошибки усечения). В рассматриваемом слу-
чае это может быть связано с тем, что предположение о длитель-
ности импульсной переходной функции системы не соответству-
ет действительности.
При этом можно говорить о том, что выход объекта (модели)
состоит из двух частей (рис. 6.11): у = + U2b2, и можно пока-
зать [24], что Ар = р — Ь] и соу[др] не зависят от уровня входного
сигнала. Ошибки усечения определяют размерность модели и опе-
ратора фильтра.
6.5. Использование беспоисковых моделей
при идентификации объектов
Рассмотрим один из примеров, отражающих особенности по-
строения системы идентификации с моделью-аналогом, в каче-
стве которой используем обобщенную модель (рис. 6.12). Блоки
F0,...,Fm,Gq,..., Gn представляют собой операторы (например, пе-
161
Рис. 6.12. Структурная схема обобщенной модели
редаточные функции для линейного объекта); величины р0, ...,
рт, ао, ..., а„ образуют вектор параметров модели.
Настройка модели ведется по минимуму обобщенной ошибки
e(t). Заметим, что в данном случае обобщенная ошибка является
линейной функцией параметров модели:
п т
e(t) = £а,у,(0 + £
i=0 j=0
Рассмотрим один из способов построения операторов Fj и (?,
для объекта с простой передаточной функцией
H/(5) = 2^ = _L_. (6.Ц)
u(s) 1 + as
В процессе идентификации в этом случае необходимо найти
оценки параметров а и Ь. Из выражения (6.11) следует:
y(s) + asy(s) = bu(s). (6.12)
Переходя к параметрам модели-аналога, можно записать для
обобщенной ошибки выражение
е($) = j($) + ayy(s) - ₽m(s). (6.13)
Сравнение выражений (6.12) и (6.13) дает возможность опре-
делить вид операторов, а именно:
F0(s) = -l, = 1 Gt(s) = S.
Такую же операцию можно провести и с объектом, передаточ-
ная функция которого имеет более высокий порядок. В этом слу-
чае операторы Fj и (?, будут идеальными дифференцирующими
звеньями, наивысший порядок которых равен порядку объекта.
162
Однако, как известно, практически реализовать такие операторы
в модели не удается. Чтобы преодолеть эту трудность, умножим
(6.12) на выражение W(s):
W(s)y(s) + asW(s)y(s) = bW(s}u(s). (6.14)
Введя обозначения
УоСО = ИЧОХД y!(s) = 51T(s)y(5), Uq(s) = fF(s)u(s),
уравнение (6.14) можно записать в виде
y0(s) + ayl(s) = bu0(s). (6.15)
Соответствующим выбором IF(s) (например, с фильтрующи-
ми свойствами) можно добиться простой практической реализа-
ции операторов Fj и G/. В рассматриваемом примере достаточно
принять
Используя уравнение (6.15), выражение для мгновенной обоб-
щенной ошибки можно представить в виде
e(t) = y0(t) + ayi(0 - р«о(/).
Выберем в качестве критерия настройки модели квадрат мгно-
венной ошибки е(Г)
Р = ^(0-
Функции чувствительности по параметрам будут иметь вид
Эр=ф£)=2*.
да да да
эр эр эр
Далее, принимая градиентные уравнения в виде (т.е. считая,
что скорость настройки каждого параметра пропорциональна част-
ной производной критерия по этому параметру):
Эа Эр » ,Л
dt да
можно построить структуру модели-аналога, включающую часть,
называемую оптимизатором (рис. 6.13). Простота'построения оп-
163
y(t) Рис. 6.13. Структурная схема беспоисковой
модели
тимизатора в данном случае является следствием линейности
ошибки по параметрам модели. Фактически реализованная струк-
тура идентификации с помощью настраиваемой модели отлича-
ется от структуры, приведенной на рис. 6.1. Непосредственно кри-
терий р здесь не вычисляют, вычислитель критерия и оптимиза-
тор реализованы как единый блок, при построении которого ис-
пользована информация о виде модели и форме критерия. По
существу эта система относится к беспоисковым системам само-
настройки.
Следующим примером построения беспоисковых моделей яв-
ляется система идентификации объекта, в которой процесс на-
стройки как таковой отсутствует, при этом параметры модели
непрерывно вычисляются. Разумеется, система идентификации в
этом случае оказывается разомкнутой (рис. 6.14).
Используем обозначение
Z = YaiZi
/=1
и критерий настройки параметров зададим в виде
p = Af{|y-z|2}.
Предположим, что найдены настройки а*, соответствующие
minp, при этом значение z будет оптимальным с точки зрения
поиска параметров модели:
£опт (6.16)
1=1
164
Рис. 6.14. Построение беспоисковой
модели на ортогональных фильт-
рах
Умножим левую и правую части равенства (6.16) на Zj (j = 1, п)
и применим к обеим частям операцию математического ожида-
ния. В результате получим систему уравнений
п ___
YM{ziZj}a*=M{zoirtZj}, j = l,n, (6.17)
или в матричной форме
Ка = В,
где К — матрица размера п х п, элементы которой Kv = К^г(0)
определяются взаимной дисперсией сигналов на выходах эле-
ментов модели, представляющих собой ортогональные фильтры;
а — (л + 1)-мерный вектор параметров а,; В — (л + 1)-мерный
вектор с элементами
Фактически сигнал ^oIIT неизвестен, однако, используя вид кри-
терия, можно записать
Эау Эау
п
y-£a*Zi
/=1
= 2M{-yZj +Zom^} = 0,
откуда следует, что
М {yzj} = М {ZonT-Zy }.
(6.18)
Соотношение (6.18) показывает, что вектор В в системе (6.17)
можно формировать из элементов ЛГКу(О). Предполагается, что в
структуре модели, изображенной на рис. 6.14, определение всех
взаимнокорреляционных функций и решение системы (6.17) про-
водится в вычислительном устройстве.
Использование при построении модели ортогональных фильт-
ров, когда выполняется условие
1 ч ч , <. Г1, / = т
— f =8im=l
2л _J 10, Itm,
165
существенно упрощает работу такой системы идентификации.
В этом случае матрица К становится диагональной, потому что
сигналы Zt на выходах не коррелированы. При этом сигнал, посту-
пающий на вход объекта и модели, по своим характеристикам
должен приближаться к «белому шуму».
Темы для повторения
1. Виды структур идентификации объектов с применением настраи-
ваемой модели, их состав, назначение элементов.
2. Виды критериев, используемых в системах идентификации с на-
страиваемыми моделями.
3. Свойства настраиваемых моделей.
4. Свойства изоморфных моделей.
5. Использование моделей с бесконечной памятью в системах иден-
тификации с настраиваемыми моделями.
6. Использование моделей с конечной памятью в системах идентифи-
кации с настраиваемыми моделями.
7. Основные алгоритмы достижения экстремума функции (критерия),
применяемые в системах идентификации с настраиваемыми моделями.
8. Характеристики, используемые для оценки точности методов иден-
тификации с настраиваемыми моделями.
9. Особенности функционирования систем идентификации с беспо-
исковыми моделями.
Глава 7
ХАРАКТЕРИСТИКИ КАЧЕСТВА ИДЕНТИФИКАЦИИ
7.1. Критерии адекватности объекта и модели
При решении задачи идентификации появляется необходимость
введения некоторой меры близости объекта и получаемой мате-
матической модели, иначе говоря, необходимо иметь некоторый
критерий их адекватности. В качестве такой универсальной меры
теоретически возможно использование некоторого функционала
от рассогласования динамических характеристик объекта и моде-
ли, а именно для идентификации линейного объекта — функцио-
нал от рассогласования импульсных переходных функций объекта
w(t) и модели например такого вида:
Um i J [w(0-wM(/)]2d/.
г-»~ 2. J -у
Однако применение такого критерия на практике невозмож-
но, так как динамические характеристики объекта, в данном слу-
чае w(t), неизвестны и являются целью идентификации. Заме-
ной подобного критерия адекватности объекта и модели может
быть критерий, характеризующий не близость динамических ха-
рактеристик объекта и модели, а близость их выходных сигна-
лов.
Широко используемыми критериями близости выходных сиг-
налов являются байесовские критерии минимума среднего риска.
Рассмотрим порядок формирования таких критериев.
Пусть y(t) — выходной сигнал объекта, уы(1) — выходной сиг-
нал модели, их рассогласование обозначим через е(/)- Точность
идентификации будем оценивать некоторой функцией от рассо-
гласования Q(e), называемой функцией потерь. Учитывая, что зна-
чения е(/) имеют разную значимость на разных интервалах на-
блюдения, обычно в рассмотрение вводят некоторую функцию
веса со(/). Таким образом, в общем случае функция потерь будет
определяться не только значением рассогласования, но и его ве-
сом, т.е. Q = Q[e(t), «>(/)]. Используя данную функцию потерь,
предлагается [6] оценивать качество решения задачи идентифика-
ции в среднем для заданной реализации входного сигнала x(t)
167
<2[е(0] =
условным математическим ожиданием функции потерь для дан-
ной реализации входного сигнала
p(Q/x) = х(/)]},
которое обычно называют условным риском. Для всех возможных
входных сигналов х(?) при оценке среднего качества решения за-
дачи идентификации можно использовать математическое ожида-
ние условного риска, равное безусловному математическому ожи-
данию функции потерь:
R(Q) = Л/[р(0А)1 = л/{(2[£(01},
которое называют средним риском. Учитывая, что большинство
решений задач идентификации получены на основе критерия
минимума среднего риска, эти решения являются байесовскими.
Рассмотрим получение некоторых критериев в зависимости от
вида функции потерь.
Положим, что функция веса ©(/) = 1, что означает равноцен-
ность значений е(/) во все моменты времени. Если функция по-
терь имеет вид
1 при |е(/)| > <р(0,
О при |е(/)| < <р(0,
где <р(/) — некоторая заранее заданная функция, то значения
среднего риска представляют собой вероятность выхода рассогла-
сования из заданного интервала (-<p(t), <р(/)):
Л/{е[е(/)]} = 1 • Р (|е (0|) > <р(0 + 0 • Р (|е (/)| < <р(0) =
= Р(|е(/)|)>ф(0,
где Р — вероятность.
Примем 0[е(О] - с - 5[е(/)], где 8 — функция Дирака, с = const,
можно получить широко распространенный в математической ста-
тистике критерий максимального правдоподобия.
При 0[е(О] = е2(О получим также широко применяемый кри-
терий среднеквадратичной ошибки. Этот критерий имеет то достоин-
ство, что представляет собой выпуклую одноэкстремальную функ-
цию, позволяющую получить единственное решение задачи иден-
тификации. Кроме того, применение данного критерия приводит,
как правило, к достаточно простым алгоритмам поиска парамет-
ров модели.
В случае если Q[e(/)] = e(t), имеем дело с равномерным крите-
рием
о
168
недостатком которого является то, что минимум его достигается
не только в точке наибольшей близости выходных координат объек-
та и модели, но и в точках, где положительные и отрицательные
отклонения приблизительно равны. Чтобы избежать такой ситуа-
ции можно принять
= |е(01,
тогда
E(t) = J|e(O|d/,
о
однако применение этого критерия на практике приводит к ана-
литическим трудностям.
Одним из способов улучшения критериев является рациональ-
ный выбор функции веса <о(/). Если, например, а>(0 = t, можно
добиться такого положения, что начальное рассогласование будет
незначительно сказываться на значении критерия, но критерий
будет весьма чувствителен к е при больших значениях t. Хорошие
результаты получают [6] при выборе функции веса в виде
<£>(/) = е т° ,
где То — некоторое заранее выбранное время памяти.
Достоинством рассмотренных критериев является относитель-
ная простота их формирования. Однако следует иметь в виду, что
линии равного уровня для критериев типа Q[e(t), <£»(/)] в про-
странстве настраиваемых коэффициентов оказываются незамкну-
тыми, при этом соблюдается условие известности входных сигна-
лов, которые не должны оказывать какое-либо влияние на про-
цесс экстремизации критерия [6]. С учетом этого обстоятельства
получаемая при использовании подобных критериев оценка пара-
метров объекта будет в общем случае неоднозначной, ввиду того
что выходные сигналы идентифицируемого объекта и его матема-
тической модели зависят, естественно, не только от их парамет-
ров, но и от входных сигналов.
Лучшие результаты получают при использовании критериев
типа Q[e(O, Я01, которые учитывают входные сигналы. Приме-
ром является критерий Мэрриема [6]:
£2(/) - J{«>(/)[у(0 - Ум(0]2 + x2(r)}dt
Некоторые статистические аспекты выбора критерия иденти-
фикации рассмотрены авторами [6] в предположении, что изме-
ряемые значения входного сигнала х(п) точно известны, а выход-
169
ной сигнал у(п) наблюдается с погрешностью А(и), т.е. наблюда-
ется сигнал z(n) = у(п) + А(л), л = 1, 2,..., N. При этом в линейном
случае по наблюдениям z(l), z(2), ..., z(N) ставится задача опре-
деления значений импульсной переходной функции НО, w(2),
w(N), а также квадрата дисперсии о2. Результатом проведенных
расчетов является вывод о том, что при центрированных «гаус-
совых белых шумах» А(л) наилучшим оказывается квадратичный
критерий. Определенным недостатком квадратичной оценки яв-
ляется, во-первых, то, что она не содержит информации о на-
правлении приближения, а, во-вторых, необходимо подтверж-
дение гипотезы о том, что ошибка является «гауссовым белым
шумом».
В случае если шумы являются гауссовыми, но не «белыми», то
квадратичный критерий оказывается неоптимальным. Примене-
ние среднеквадратичного критерия при негауссовых помехах не
всегда оправдано, так как может привести к плохо сходящимся
алгоритмам идентификации или к получению несостоятельных
оценок параметров модели.
7.2. Основные ошибки оценок параметров моделей,
получаемых в процессе идентификации объектов
управления
При проведении активного эксперимента в процессе иденти-
фикации объекта управления необходимо обеспечить получение
максимума полезной информации при минимальном числе и дли-
тельности тестовых возмущений, подаваемых на исследуемый
объект. Полученные в результате эксперимента и обработки его
результатов оценки являются приближенными. Ошибки в этих
оценках определяются целым рядом факторов, в частности нали-
чием шумов при измерениях на промышленных объектах, несо-
ответствием принятых априорных сведений реальным условиям
функционирования объекта, квантованием наблюдаемых сигна-
лов, конечностью времени наблюдения и т. п.
Влияние этих факторов на конечный результат, т.е. на погреш-
ность, с которой проведена идентификация объекта, следует рас-
сматривать в единстве, поскольку все эти факторы влияют друг
на друга. Так, например, время наблюдения зависит от шумов,
конечного времени затухания переходного процесса в объекте,
а для улучая нестационарного (или квазистационарного) объек-
та — и от динамики изменения его параметров. Поэтому рассмот-
рение влияния на точность идентификации каждого из факторов
по отдельности обусловлено лишь удобством с методологической
точки зрения.
170
При проведении как активного, так и особенно пассивного
экспериментов на функционирующих объектах наличие шумов
является неотъемлемым обстоятельством, сопровождающим из-
мерение необходимой информации. Безусловно, это мешает об-
работке полученных данных, а иногда делает ее и совсем невоз-
можной. Показателем, позволяющим оценить возможное влияние
на точность идентификации шума, может служить отношение
«сигнал: шум», для которого берут эффективные их значения. Для
широкополосных шумов в качестве подобного показателя исполь-
зуют следующее отношение:
9 = 201g^,
^эф
(7.1)
где /max ~ максимальное значение полезного сигнала; — эф-
фективное значение шума.
Показатель (7.1) имеет смысл только для широкополосных
шумов. При его использовании математическое выражение будет
иметь следующий вид:
<7 = 201g^-,
z(t)
(7.2)
где
у = max y(Of, Z (t) =. U J z2 (t) dz.
V о
Если значение q оказывается мало, то необходимо применять
различные методы, повышающие его. Обработка результатов изме-
рения переходной характеристики линейного объекта возможна при
q > 16 дБ, а импульсной переходной функции — при q > 6 дБ [6].
Простейшим способом повышения значения q является много-
кратное повторение измерений с последующим применением
процедуры усреднения. В этом случае среднеквадратичное откло-
нение стационарной помехи после л-го независимого измерения
будет равно
о
° = ~7=’
у/п
где о — среднеквадратичное отклонение каждого измерения.
Выражение (7.2) при л-кратных измерениях принимает вид
q = 201g—-Ул,
о
увеличение q за одно повторное измерение будет равно Дб? = 101g л.
171
К другим простейшим способам повышения значения q отно-
сят фильтрацию высокочастотных составляющих сигналов, в том
числе и при использовании графоаналитических методов сглажи-
вания.
Без сглаживания шумов при измерении выходных сигналов
линейного объекта возникает ошибка, определяемая как
t
е = Jw(t, т)л(т)ск.
о
Если помеха n(t) представляет собой «белый шум» со спект-
ральной плотностью N, то ошибку можно вычислить по формуле
ё2 = N2jw2(t, т)бт.
о
Для характеристики влияния шумов на результаты идентифи-
кации может быть использован коэффициент избыточности, оп-
ределяемый как
г_М-N=М
~ N~ N ~ N ’
где N = TJht — минимальное необходимое число измерений вы-
ходных координат; Ts — время затухания процесса на выходе иден-
тифицируемого объекта; 2N- 1 — минимальное необходимое чис-
ло измерений входных координат; М — полное число измерений
входных координат; г = М - N — число избыточных значений
выходных координат.
При выборе R следует иметь в виду, что увеличение его значе-
ния в определенных пределах повышает точность результатов иден-
тификации, но при этом приходится искать определенный опти-
мум, так как чрезмерный рост R затрудняет обработку получен-
ной информации.
Рассмотрим погрешности, связанные с конечным временем за-
тухания, конечностью полосы пропускания, нестационарностью
объекта идентификации.
Как было показано ранее, весьма распространенным способом
идентификации линейного объекта является использование урав-
нения Винера—Хопфа. При этом в качестве тестового сигнала до-
статочно часто используют псевдослучайный двоичный сигнал,
т.е. сигнал типа двоичного «белого шума».
Из рис. 7.1, на котором изображена периодическая корреляци-
онная функция этого сигнала и кривая переходного процесса,
видно, что условием отсутствия погрешности, связанного с ко-
нечным временем затухания переходного процесса, будет выпол-
172
Рис. 7.1. Корреляционная функция псев-
дослучайного двоичного сигнала (7)
и импульсная переходная функция
объекта (2)
нение условия Т» Ts, где Ts — определенное на практике время
затухания этого процесса.
Однако при этом также необходимо искать некоторый комп-
ромисс. Если интервал Т меньше допустимого, возникает систе-
матическая ошибка; если этот интервал больше необходимого,
это приводит к уменьшению коэффициента избыточности R, т. е.
ухудшаются сглаживание шумов и точность. В этой связи рекомен-
дуется [6] для постоянного интервала наблюдения уменьшить зна-
чение Ts, увеличив коэффициент избыточности, чтобы система-
тическая ошибка имела порядок ошибки, обусловленной влия-
нием шумов.
Любой реальный объект имеет конечную полосу пропускания;
это обстоятельство необходимо принимать во внимание при изу-
чении ошибок, влияющих на точность идентификации. Действи-
тельно, предположив, что объект обладает верхней частотой /р,
на основе теоремы Котельникова динамические характеристики
этого объекта без существенных потерь информации можно пред-
ставить рядом дискретных величин. Формально, следуя этой теоре-
ме, экспериментальную импульсную переходную функцию, напри-
мер, можно представить в виде w (иД/), где Д/ = '/г/гр- Однако в
большинстве случаев априори частотаточно неизвестна.
Поэтому если А/ < ’/Jrp, возрастает число параметров, кото-
рые нужно определить на постоянном интервале затухания Ts, так
как число дискретных величин равно N= Ts/M. С ростом N увели-
чиваются ошибки в определении параметров. Так, если помеха
носит характер «белого шума», то для постоянного интервала на-
блюдения погрешность растет пропорционально 4N. Коэффи-
циент избыточности при этом остается постоянным, так как при
изменении полезного сигнала на интервале Д/разность между зна-
чениями его дискретных величин будет при уменьшении Д/ также
уменьшаться, в то время как разность между значениями диск-
ретных величин шумов остается постоянной. Иначе говоря, при
уменьшении Д/рост отношения «сигнал: шум», т.е. величины q,
происходит быстрее роста ошибки.
Если А/ > ‘Л/гр, то возникает систематическая ошибка в опре-
делении параметров модели. Наименьшая ошибка будет иметь ме-
сто при таком значении интервала наблюдения Т„, когда систе-
173
магическая ошибка и ошибка, вызванная наличием шумов, будут
приблизительно равны [6]. Минимальное время наблюдения Тп
можно найти из выражения:
(Гн)мин = (2 - 1/ЛГ)Т„
откуда следует, что
(Т’н)мин < 27;.
При проведении эксперимента необходимо учитывать свойства
применяемой аппаратуры. Так, если аппаратура имеет граничную
частоту пропускания /ф, то в этом случае она сама будет служить
фильтром высокочастотных шумов, правда, при этом не исклю-
чается некоторая потеря полезной информации, находящейся в
высокочастотном диапазоне.
Необходимо также учитывать и свойства исполнительного орга-
на генератора тестового сигнала, который во многих случаях яв-
ляется интегрирующим звеном. Если постоянная времени интег-
ратора /’„нт больше постоянной времени объекта, применение в
качестве тестовых двоичных или прямоугольных сигналов недопу-
стимо; следует применять треугольные входные сигналы [6].
Применение компьютерной техники в задачах идентификации
приводит к естественной необходимости оперирования дискрет-
ными величинами, что в свою очередь требует проведения проце-
дуры квантования, если первичные сигналы являются непрерыв-
ными. Поэтому вполне естественно остановится на погрешности,
связанной с дискретизацией сигналов, являющихся исходной ин-
формацией для алгоритмов обработки этой информации при ре-
шении задач идентификации.
Обычно при дискретизации непрерывных сигналов в качестве
дискретных величин выбирают средние значения измеряемой ве-
личины на интервале квантования:
Лис =4; J
Важным моментом является выбор интервала квантования по
времени Д/, который согласно теореме Котельникова определяет-
ся граничной частотой пропускания идентифицируемого объек-
та, т.е. Д/ = 'Л/ф.
Однако Учитывая, что эта частота, как правило, неизвестна,
для ее оценки рекомендуют выбирать величину
/ф=(5-10)/пих,
где /щах — частота наивысшей из наблюдаемых в измеряемом сиг-
нале гармоник.
174
При идентификации линейных объектов с использованием
уравнения Винера—Хопфа точность получаемого решения, как
было показано ранее, в значительной степени зависит от точно-
сти определения корреляционных функций. В этом случае следует
иметь в виду, что если частота квантования /кв = 1/ЛГ много боль-
ше ширины спектра сигналов, снимаемых с объекта, то для более
точной оценки корреляционных функций необходимо увеличи-
вать интервал наблюдения. При этом в процессе вычисления оце-
нок корреляционных функций рекомендуют [6] применять метод
скользящего среднего, который в данном случае можно реализо-
вать следующим образом: сигналы, полученные от объекта, пред-
ставляют выборки, длительность которых равна интервалу наблю-
дения Т. После их квантования получают множество из N дискрет-
ных величин, которое далее разбивают на / + 1 подмножеств. Ко-
личество элементов т, входяших в каждое из подмножеств, вы-
бирают из соотношения: |/?(т) | < е, где R — коэффициент избы-
точности; е — некоторая заранее заданная положительная вели-
чина; т = m/fKB — время корреляции.
Далее порознь вычисляют перекрестные произведения всех эле-
ментов каждого из / + 1 подмножеств, а также соответствующие
значения для соседних подмножеств. Искомые оценки корреля-
ционных функций определяют как соответствующие средние зна-
чения по подмножествам.
Проблема дискретизации непрерывных сигналов связана, как
известно, не только с квантованием по времени, но и с кванто-
ванием по уровню. Обычно искажение непрерывной функции за
счет дискретизации по уровню можно рассматривать как шум,
вносящий погрешность в определение статистических характери-
стик сигналов и в процедуру идентификации, которая убывает с
ростом числа уровней квантования. На основании требуемого числа
различных уровней квантования формулируют требования к точ-
ности и масштабу шкалы аппаратуры, используемой для измере-
ния сигналов при решении задач идентификации объектов.
При оперировании дискретными величинами входящие в урав-
нения идентификации интегралы аппроксимируют суммами, при
этом аппроксимация может быть произведена различными извест-
ными из математики методами. Следует иметь в виду, что во всех
этих методах точность возрастает с уменьшением интервала кван-
тования по времени АЛ Однако при постоянной величине А/ са-
мой точной является аппроксимация по Симпсону, затем следу-
ют метод касательных и метод трапеций. Наиболее часто приме-
няемая аппроксимация по методу прямоугольников является наи-
менее точной. Однако при решении задач идентификации из-за
наличия шумов и их большего влияния на результаты вычислений
аппроксимация по методу прямоугольников оказывается вполне
приемлемой.
175
Вообще говоря, требования, предъявляемые к выбору интер-
вала наблюдения над сигналами идентифицируемого объекта,
достаточно противоречивы. Действительно, для повышения по-
мехоустойчивости необходимо, чтобы интервал наблюдения был
большим, обеспечивая достаточный коэффициент избыточности Л
Наличие нестационарности объекта требует ее учета и приводит,
как правило, к уменьшению интервала наблюдения. Однако в
любом случае этот интервал целесообразно выбирать таким, что-
бы он превышал время затухания объекта. Нельзя не принимать
во внимание и отношения «сигнал: шум».
На практике выбор оптимального интервала усреднения опре-
деляется видом входного тестового сигнала, характеристиками шу-
мов в объекте, скоростью дрейфа параметров объекта, имеющи-
мися аппаратными и вычислительными средствами.
Темы для повторения
1. Выбор критериев адекватности объекта и получаемой математиче-
ской модели как статистической меры их близости.
2. Факторы, влияющие на погрешность определения оценок парамет-
ров модели при проведении идентификации объекта.
3. Способы уменьшения влияния различных факторов при проведе-
нии экспериментальных исследований в .процессе идентификации объекта
на погрешность определения оценок параметров его модели.
4. Способы уменьшения влияния различных факторов при обработке
информации, полученной путем экспериментальных исследований объек-
та, на погрешность определения оценок параметров его модели.
Глава 8
МОДЕЛИ ПРОЦЕССОВ И ОЦЕНИВАНИЕ
ИХ СПЕКТРАЛЬНО-КОРРЕЛЯЦИОННЫХ
ХАРАКТЕРИСТИК В ЗАДАЧАХ ИДЕНТИФИКАЦИИ
ДИНАМИЧЕСКИХ ОБЪЕКТОВ УПРАВЛЕНИЯ
8.1. Характеристики случайных процессов
При идентификации динамические объекты могут находиться
под воздействием как детерминированных, так и случайных сиг-
налов. В последнем случае целесообразно применять статистиче-
ские методы идентификации. При этом одной из важных проце-
дур статистической идентификации является оценка корреляци-
онных и спектральных характеристик входных w,(0 и выходных
у,(0 реализаций. Здесь уместно обратить внимание на то обстоя-
тельство, что задача статистической идентификации будет приво-
дить к корректным результатам только в том случае, если в каче-
стве входного воздействия используется случайный процесс с рав-
номерной спектральной плотностью мощности в полосе частот,
превышающей полосу пропускания исследуемого динамического
объекта.
Результаты идентификации существенно зависят от выбора
моделей, используемых для описания входного воздействия и ре-
акции объекта на это воздействие. При этом необходимо учиты-
вать условия решаемой задачи, количество и длину зарегистриро-
ванных реализаций, форму представления сигнала и другие фак-
торы. Принимаемая модель должна отражать существенные осо-
бенности сигнала, быть достаточно универсальной и ориентиро-
ванной на известные методы решения задачи идентификации.
Модель также должна быть достаточно экономичной, т. е. иметь малое
число входящих в нее параметров. Часто указанные требования в
совокупности трудно выполнимы, и поэтому при выборе модели
сигнала приходится руководствоваться некоторыми общими сооб-
ражениями, сущность которых будет рассмотрена далее.
В зависимости от априорной информации о сигналах использу-
ют либо детерминированные, либо статистические модели. Если
первые аналитически описывают непосредственно само изучае-
мое воздействие, то вторые оперируют теми или иными статис-
тическими характеристиками, используемыми при анализе слу-
чайных процессов. При этом детерминированные процессы могут
быть описаны математическими соотношениями, точность кото-
рых соответствует требованиям данной практической задачи.
177
Отличительной особенностью детерминированного описания
сигналов является то, что по их параметрам можно однозначно и
с заданной точностью определить значение сигнала в любой за-
данный момент времени. Как уже было показано ранее, в каче-
стве детерминированных моделей при идентификации объектов
управления наиболее часто используют следующие математиче-
ские функции: 5-импульс, единичный скачок 1(0, треугольный
и прямоугольный импульсы, гармонические функции sintoZ, cos mt,
экспоненциальную функцию exp jmt и др. Детерминированные мо-
дели сигналов более сложного вида могут быть сформированы из
элементарных сигналов путем их линейной комбинации. В зависи-
мости от формы представления детерминированных сигналов (не-
прерывной или дискретной) используют те или иные информа-
тивные параметры. Например, для гармонического сигнала таки-
ми параметрами являются амплитуда, частота и начальная фаза,
а для дискретного сигнала, состоящего из последовательности
прямоугольных импульсов, информативными являются амплиту-
да, полярность, длительность импульса, его временное положе-
ние.
Разделение исследуемых процессов на детерминированные или
случайные в какой-то мере условно. Так, например, при повыше-
нии точности измерения параметров физического процесса, счи-
тавшегося ранее детерминированным, процесс приобретает при-
знаки стохастического, поскольку начинают сказываться влияние
внешней среды, погрешности измерительной системы, помехи
канала передачи сигнала и другие факторы.
Определение статистических характеристик предполагает ис-
пользование ансамбля реализаций случайного процесса. Отметим,
что каждая реализация такого ансамбля является детерминиро-
ванной функцией. На практике при решении задачи идентифика-
ции необходимо убедиться, является ли анализируемый процесс
стационарным. При этом обычно вопрос о стационарности реша-
ется всего лишь по одной реализации, и стационарность в этом
случае означает, что характеристики, рассчитанные по коротким
(или ограниченным) отрезкам времени, не меняются значитель-
ным образом для различных реализаций.
Из наиболее широко применяемых характеристик случайных
процессов используют корреляционную функцию К(х) и спект-
ральную плотность мощности 5(<о), которые в соответствии с тео-
ремой Винера—Хинчина связаны следующими соотношениями:
5 (со) = J (т)е->Мт, К (г) = у- J 5(®)e><OTdco.
Спектральная плотность и корреляционная функция по суще-
ству отражают статистические закономерности случайных процес-
178
сов в динамике их проявления, что отличает их от моделей, осно-
ванных на законах распределения, используемых в вероятност-
ном анализе. Это позволяет применять спектрально-корреляцион-
ные модели и для описания нестационарных процессов, вводя в
качестве параметра время: 5(<о, t), K(tx, t2).
При изложении методов статистической идентификации были
показаны важность и эффективность использования в качестве
испытательного воздействия сигнала, моделью которого является
«белый шум». Упрощение решения уравнения Винера—Хопфа в
этом случае определяется тем, что корреляционная функция та-
кого сигнала равна
Кии(т) = с08(т),
откуда следует, что
$ии (®) = 0)>
Заметим, что «белый шум» имеет равномерный спектр с уров-
нем с0 на всех частотах. Такой чисто теоретический «белый шум»
не может быть реализован на практике, и поэтому используют
другие сигналы, модели которых в некотором смысле приближа-
ются к его идеальной модели. Примером подобного сигнала мо-
жет служить стационарный случайный процесс с постоянной спек-
тральной плотностью в ограниченной полосе частот:
[со, 0<соо-.В/2<С1)<®о + Л/2,
^ии (ф) “ 1 Л
[О, в остальных случаях,
где Юо — центральная частота полосы.
Согласно теореме Винера—Хинчина соответствующая корре-
ляционная функция равна
„ , х „sinidfr
Кии (т) = CqB—-—costo0T.
ллт
В частном случае, когда (о0 = 2?/2, корреляционная функция
определяется выражением
„ , ч Dsin2nl?T
Рассмотрим реакцию низкочастотного фильтра с частотной
характеристикой
1 + 7/©
179
на идеальный «белый шум». Спектральная плотность сигнала на
выходе фильтра будет определяться выражением [22]:
следовательно
’ \ + Т2(й
откуда
Куу^) = ^Т
Этот пример показывает простой путь представления реально-
го случайного воздействия, поступающего на вход исследуемого
объекта, как «белого шума», пропущенного через низкочастот-
ный фильтр с заданными свойствами.
На практике при решении задач идентификации большое рас-
пространение получили шумоподобные сигналы в виде псевдо-
случайных двоичных последовательностей (ПСДП). Их можно тех-
нически просто формировать с помощью регистров сдвига с об-
ратной связью. По существу эти сигналы являются периодически-
ми, но они обладают свойствами, которые приближают их к слу-
чайным сигналам.
Один из возможных способов формирования ПСДП показан
на рис. 8.1. В окрестности значений т = 0 корреляционная характе-
ристика ПСДП напоминает соответствующую функцию «белого
шума». Вообще говоря, из-за регулярности ПСДП эта характери-
стика является периодической. На интервале, равном периоду,
аналитически она определяется выражением
*ии(т) =
TV А/
-£/2/7V,
О < |т| < Af,
|т| > А/,
где N = 2п - 1; п — число ячеек регистра сдвига.
Статистические свойства ПСДП можно приближать к харак-
теристикам «белого шума», увеличивая длину этой последователь-
ности N. Обычно выбирают N= 2Л - 1, задавая п > 10.
На рис. 8.2 показана спектральная плотность мощности ПСДП,
определяемая зависимостью
$ии (®) —
N ы
sm(kn/N}
kn/N
180
Рис. 8.1. Псевдослучайная двоичная последовательность:
а — генератор; 6 — реализация; в — корреляционная функция
Спектральные компоненты псевдослучайного двоичного сиг-
нала имеют кратные частоты с шагом Дсо = 2л/ Т = 2nfT/N. Макси-
мальная частота в основной полосе определяется заданной такто-
вой частотой
(О/' = 2л//.
При этом в пределах до от/2 спад характеристики 5ии((о) со-
ставляет около трех децибел. Это отклонение можно в значитель-
Рис. 8.2. Спектральная плот-
ность мощности ПСДП
181
ной степени устранить с помощью корректирующего фильтра (по-
казано пунктирной линией на рис. 8.2). Получаемый в результате
сигнал является практически имитацией «белого» шума в полосе
частот, ширина которой легко задается выбором значения такто-
вой частоты сог.
8.2. Оценивание корреляционных функций случайных
процессов
При экспериментальных методах идентификации, основанных
на статистической обработке случайных сигналов, наблюдаемых
на входе и выходе идентифицируемого объекта, важную роль иг-
рают корреляционные функции этих сигналов. Существует мно-
жество методов их вычисления. Наибольшее распространение по-
лучили прямые методы, в основу которых положена гипотеза эр-
годичности. Если входной сигнал u(t) и выходной сигнал y(t)
представляют собой стационарные и стационарно связанные эр-
годические случайные процессы с нулевым математическим ожи-
данием, оценка автокорреляционной функции Кии(х) вычисля-
ется по формуле
Кии(т) = ——— J u(t)u(t + x)dt,
/ -т J
оценка взаимнокорреляционной функции Киу(х) — по выраже-
нию
Kuy(t) = —— j м(/)у(/ + т)<1/,
т о
где Т — длина реализаций случайных процессов u(t), y(t); т —
корреляционный сдвиг.
Вычисление оценок корреляционных функций по ранее при-
веденным формулам предполагает, что процессы и(/) и y(t) пред-
ставляют собой центрированные реализации случайных процес-
сов. На практике операцию центрирования проводят путем опре-
деления среднего арифметического значения реализации и вычи-
тания его из исходной реализации.
Математическое ожидание оценки A'uj-(x) равно
м {Киу (т)} = J М {к (/) у (t + т)} d/ = 1J Киу (т) dt = т).
* ° 1 о
При этом независимо от длины реализации Т величина Киу(х)
является несмещенной оценкой функции Kuy(i)^ Естественно, ана-
логичный вывод можно сделать и о функции Кии(х).
182
Как известно, оценка Кии(т) отличается от точного значения
*ии(т) дисперсией случайной величины А'шДт):
D{£ии(т) (т)} = Л/ [£ии(т) (т) - Кии (т)
Дисперсию при нулевом сдвиге (т = 0) позволяет определить
следующее соотношение [10]:
а для достаточно больших т:
Если входной сигнал является «белым» шумом, ширина поло-
сы которого равна В, то для значений ВТ > 1 000 справедливо
неравенство [10]:
0{^ИИ(Т)}<-1;^И(0),
L J DI
откуда следует, что среднеквадратическое отклонение равно
Е<М£)
ВТ
Поэтому если оцененная корреляционная функция является
центральной линией полосы шириной +Кии(0)/4вТ (рис. 8.3),
то эта полоса образует доверительную область для истинной авто-
корреляционной функции с доверительной вероятностью 68 %. Что
касается дисперсии оценки взаимнокорреляционной функции, то
для достаточно больших Т справедлива формула [10]:
D{£,,(!)} = у J [кии фКуу (Q + Киу (£ + т) Куи (£ - т)]d^,
а для случая, когда и(1) является «белым шумом», — неравенство
^{^(т)}<А-[ЛГии(0)^(0)].
183
Рис. 8.3. Оценивание корреляционной функ-
ции с учетом доверительной области
Весьма часто оценку корреляционных функций получают по
непрерывно-шаговому алгоритму, имеющему для оценивания ав-
токорреляционной функции следующий вид:
- 1 т
Кии (т) = — J«(/)w(Z + iAT)<k,
* о
где Дт — шаг дискретности корреляционного сдвига.
Таким образом, оценка корреляционной функции представля-
ет собой ряд дискретных отсчетов в фиксированных точках т,- - /Дт.
Величина Дт определяет разрешающую способность измерений кор-
реляционной функции. По мере ее уменьшения разрешающая спо-
собность увеличивается, однако число измерений при этом воз-
растает. Поэтому вопрос о выборе Дт является, как правило, ком-
промиссом между разрешающей способностью измерений и про-
должительностью анализа. Обычно рекомендуется выбирать Дт из
условия:
^Jmax
где /„ах — наибольшая частота составляющей процесса, облада-
ющей заметной энергией.
Иначе говоря, для того чтобы описать процесс на заданной
частоте, необходимо иметь по меньшей мере две точки корреля-
ционной функции на один период колебания с такой частотой.
Однако на практике для получения приемлемой погрешности оп-
ределения корреляционной функции требуется выполнение усло-
вия
^-(7-10)/^-
Вычисление корреляционных функций может быть осуществ-
лено на ЭВМ. В этом случае оценки корреляционных функций
(для центрированных реализаций) вычисляют по алгоритмам:
184
— 1 N
Кии (/At) = — £ I/ (иДт) и [(" + *) Дт] ’
™ Л=1
где /Ат — интервал сдвига; N — число измеряемых ординат кор-
реляционной функции.
Точность оценивания корреляционной функции определяется
длительностью интервала наблюдения Т = NM, шагом квантова-
ния по времени Ат и числом ординат корреляционной функции,
выбираемых на интервале 0 < т < тЛ. Величина тЛ — интервал корре-
ляции — в свою очередь определяется как время т, после которо-
го функция К(х) не превышает наперед заданной величины, обыч-
но принимаемой 0,05Атах(т). Практически интервал корреляции
определяют из соотношения
/win
Для этого, как правило, предварительно проводят приближен-
ную оценку высшей fmax и низшей /П11П гармоник в исследуемых
сигналах (величина fmax используется также для выбора Дт). Число
дискретных значений /, задаваемых на интервале 0 < т < тъ можно
выбирать, воспользовавшись зависимостью / > 2fmaxTk + 1.
Применение ЭВМ для расчетов приводит к оперированию дис-
кретными величинами. Ранее уже упоминалось, что при дискре-
тизации непрерывных сигналов проводят квантование и по вре-
мени, и по уровню. Искажение непрерывной величины за счет
дискретизации по уровню можно рассматривать как шум, внося-
щий погрешность в определение корреляционной функции. Эта
погрешность сравнительно быстро убывает с ростом числа уров-
ней квантования:
Число уровней Погрешность
4..............................20,0
8...............................5,0
16..............................1,2
32..............................0,3
64.............................0,09
Как видно, при п > 16 корреляционные функции могут быть
определены с достаточной для практики точностью.
Конечная длина интервала наблюдения Т также приводит к
погрешности определения корреляционной функции. Для увели-
чения точности время наблюдения необходимо увеличивать. Од-
185
нако из-за возможной нестационарности объекта и для уменьше-
ния объема вычислений этот интервал целесообразно выбирать
минимальным. Ниже приведены погрешности вычисления корре-
ляционной функции для центрированного процесса в зависимо-
сти от интервала наблюдения Т= кТн (Т„ — период низшей гар-
монической составляющей в сигнале; к — кратность интервала
наблюдения):
Кратность Погрешность
1,6.......................... 10,0
3,2.............................5,0
8,0.............................2,0
16,0............................1,0
160,0...........................0,1
Очевидно, что достаточно выбирать интервал наблюдения рав-
ным Т- (10—15)Тн.
Остановимся кратко на весьма важном при решении задачи
идентификации вопросе аппроксимации вычисленных корреля-
ционных функций аналитическими выражениями. При аппрокси-
мации корреляционных функций следует иметь в виду, что в ка-
честве аппроксимирующих выражений необходимо выбирать та-
кие, которые, отражая общее свойство аппроксимируемой кор-
реляционной функции, были бы удобны для их дальнейшего ис-
пользования при вычислении параметров математической моде-
ли идентифицируемого объекта. Так, например, корреляционные
функции удобно аппроксимировать в виде суммы экспоненци-
альных составляющих
п т
К (т) = Y А^’х + £ В^\
/=1 ;=1
что при использовании метода А. Н.Скляревича позволяет доста-
точно просто найти аналитическое выражение передаточной функ-
ции идентифицируемого объекта. При такой аппроксимации ста-
новится возможным также и аналитическое решение уравнения
статистической идентификации. Так, при аппроксимации авто-
корреляционной функции выражением
Кии (т) =
где — дисперсия входного сигнала, решение уравнения стати-
стической идентификации для стационарного случая вида
*уи(т) = JW(/)^u(/-T)d/, (8.1)
186
определяется, как показано в подразд. 4.7, формулой:
w(z) =
а
2о2
Kyu(t)-
1 dKyu (/) 1
а2 dz2 о2
1 <ькуи (О
а dt
t=o
5(/) +
А^(0)-
1
F (Т\ I 1 ^Куи (О
уи^ > а d/
8(/-Т).
Аналитическое решение уравнения (8.1) может быть получено
при других аппроксимирующих выражениях для корреляционной
функции. Если, например, корреляционная функция имеет вид,
показанный на рис. 8.4, то ее можно аппроксимировать выраже-
нием
Кии (т) - Ле “М coscot,
где А = Кии(0).
Для такого вида аппроксимации уравнение (8.1) также можно
решить аналитически.
Как было показано, ввиду плохой обусловленности уравнения
Винера—Хопфа использование в исходных значениях оценок кор-
реляционных функций вместо истинных значений, как правило,
приводит к большим погрешностям.
Рассмотренный ранее подход к регуляризации этого уравне-
ния основан на предварительном сглаживании авто- и взаимно-
корреляционных функций аппроксимацией их некоторыми си-
стемами функций.
Если корреляционные функции абсолютно интегрируемы на
интервале своего задания [О, Т], они могут быть разложены в ряд
по некоторой системе функций {<р(/)}, также абсолютно интегри-
руемых на том же интервале времени:
^(т) = £а„Ф„(/).
Л=1
Рис. 8.4. Пример аппроксимации корре-
ляционной функции:
7 — исходная корреляционная функция; 2 —
аппроксимирующая экспонента
187
При этом коэффициенты аппроксимации ап выбирают так, что-
бы минимизировать некоторый критерий приближения. Извест-
но, что аппроксимирующая система функций {ф (/)} должна быть
линейно независимой, что необходимо для достижения заданной
точности приближения ограниченным набором функций. Для не-
зависимого определения коэффициентов ап выгодно выбирать си-
стему ортогональных функций, тогда
= I АГ (/)<p(/)dt
1 о
Если выбранная система функций {/(0} линейно независима
на интервале [О, Т], но неортогональна, ее можно ортогонализо-
вать с помощью процедуры Грама—Шмидта, в соответствии с
которой получают новую систему функций:
Ф1 (0 = <hf (/),
Ф2(0 = °2(/1(^) + «з/2(0)’
фз (0 = «4 (/1 (0 + O5/2 (0 + «б/з (0)>
где az для обеспечения ортонормированности системы выбирают
из условия
т
|фЛ(^)фт(0(1/ = 8«т>
О
где 8лт — символ Кронекера.
Наиболее часто для аппроксимации используют ортогональ-
ные полиномы Лежандра, Чебышева, Лагерра. Последние кроме
всего прочего обладают тем преимуществом, что имеют рацио-
нальную преобразуемость по Фурье. Для полинома Лагерра и-го
порядка
1 Я"
преобразование по Фурье имеет вид
Ln (У®) = ?—е' — (/”е“') e’-^d/ = .
о«! at (jo)
В случае применения полиномов Лагерра корреляционные функ-
ции можно представить следующим образом:
АГии(т) = £С/»Д(т), *вДт) = £<ТД(т).
1=0 1=0
188
Переходя к спектральным плотностям, получим
suu (®) = (у®),
/=0
<=0
и частотную характеристику идентифицируемого объекта в виде
= v----------•
<=0
Рассмотренные прямые методы оценки корреляционных функ-
ций в общем дают удовлетворительные результаты. Однако при
использовании цифровых методов обработки сигналов определе-
ние оценок корреляционных функций осуществляется путем вы-
числения финитного обратного преобразования Фурье оценок
спектральной плотности:
Кии (т) = J Suu (/) cos 2л/т d/, (8.2)
о
Ксиу (т) = fj[Cuy (/)cos 2nfx+(/)sin 2л/т1 d/, (8.3)
0 L J
где fc — самая высокая частота составляющей, которая может
присутствовать в данных; Suu(f), Cuy(f), Quy(f) — «несглажен-
ные» оценки спектральной, коспектральной и квадратурной плот-
ности соответственно.
Следует обратить внимание на то, что оценки корреляцион-
ной функции Kc(t), найденные по выражениям (8.2), (8.3), бу-
дут смещены из-за влияния «циклического» эффекта в ходе вы-
Рис. 8.5. Циклическая оценка корреляцион-
ной функции
189
Рис. 8.6. Корреляционная функция и ее зеркальное отражение
числений. Полученная циклическая оценка корреляционной фун-
кции (рис. 8.5) имеет вид [3]:
Для того чтобы устранить этот эффект, необходимо исход-
ную реализацию «(/), заданную на интервале 0 < t < Т, продол-
жить нулем (при условии, что ее среднее значение равно нулю)
на дополнительный отрезок длиной Т. Таким образом, новая ре-
ализация z(t) длиной 2 Т будет задаваться следующим образом:
г(/) [«('). °^<Т,
v ’ [о, Т < т < 2Т.
Корреляционная функция, вычисленная как обратное преоб-
разование Фурье спектра такой продолженной реализации, опре-
деляется выражением [3]:
^(т) =
Т-х
Т
' х-Т
. т
К(2Т-х),
О < т < Т,
Т<х< 2Т.
Как видно из рис. 8.6, искомая корреляционная функция и ее
зеркальное отражение оказываются разделенными. Отбросив зна-
чения оценки при х > Т, получим смещенную оценку корреляци-
онной функции на интервале 0 < х < Тс устраненным цикличе-
ским эффектом. Несмещенную оценку К (т) на интервале 0 < х < Т
окончательно находят по выражению
Эта оценка статистически эквивалентна оценкам корреляци-
онной функции, полученным прямым путем.
190
8.3. Оценивание спектральных плотностей случайных
процессов
В задачах идентификации наряду с корреляционными широко
используют спектральные характеристики, которые зачастую поз-
воляют упростить вычисления и дают возможность получать фи-
зическую интерпретацию результатов вычисления на основе ши-
роко известных частотных представлений. При этом в качестве ос-
новной характеристики процессов на входе и выходе динамичес-
кого объекта обычно используют спектральную плотность мощ-
ности. Спектральная плотность мощности случайного процесса оп-
ределяется выражением
Su (®) = Um -A- J и2 (t, А®) а/,
'->°°Дсо7 J
где «(/, Дсо) — составляющие функции u(t), имеющие частоты от
со до со + Асо.
Оценку спектральной плотности мощности можно получить,
например, при помощи анализатора спектральной плотности,
реализующего алгоритм:
&«(®) = J«2 (/,A®)d/,
где u(t, А®) — часть процесса «(/) на выходе узкополосного филь-
тра с полосой пропускания А® и центральной частотой ©о-
Изменяя центральную частоту узкополосного фильтра, можно
получить график спектральной плотности мощности — энергети-
ческий спектр — в зависимости от частоты.
Спектральные плотности можно также определить по корреля-
ционным функциям, применяя к ним преобразование Фурье. Из-
вестно, что для эргодического стационарного случайного процес-
са выполняется соотношение
5аи(®)= J^(T)e-^dT,
(8.4)
которое с учетом четности корреляционной функции может быть
записано в виде
Suu (ю) - 2$ Кии ('c)cOS(OTdx.
о
(8.5)
Соотношение, аналогичное (8.4), для взаимной спектральной
плотности Suy(j<o) двух стационарных и стационарно связанных
191
реализаций случайных процессов и(1) и y(t), имеющих взаимно-
корреляционную функцию Киу(т:), может быть представлено в виде
suy (до) = J Киу (T)e-7<OTdT.
Так как взаимнокорреляционная функция не является четной,
взаимная спектральная плотность является комплексной величи-
ной, причем вещественная ее часть — четная функция частоты, а
мнимая — нечетная:
Suy (7®) = J Киу (т) cos сот dr + J j Киу (T)sin<ordT .
При численной оценке спектральной плотности мощности
обычно используют дискретный аналог зависимости (8.5) в виде
Sии (со) — 2Л
Ко + 2£ Кг cos (гАсо)
г=1
где h — интервал времени между отсчетами; Кг — оценка авто-
корреляционной функции при шаге г, т — максимальное число
шагов.
При этом для вычисления оценки спектральной плотности
5uu(co) вначале необходимо найти оценку Кг(х) корреляционной
функции.
На практике определение спектральной плотности проводят
по усеченной оценке корреляционной функции:
^ус
Кии (т) =
О, т>т*.
(8.6)
Учитывая (8.6), выражение (8.5) можно представить в виде
Suu (со) = 2 j vm (т) Кии (т) cos сот dx,
где г„(т) — прямоугольная функция (рис. 8.7).
Преобразование Фурье функции vm(T):
Vm (®) = J Vm (t) e-'^dT = j e-yurtdT = 2?m Sm{OTm ,
изображенное на рис. 8.8, является спектральным окном. Таким
образом, первичная оценка 5uu(co) будет сверткой истинной спек-
192
о
Рис. 8.8. Преобразование Фурье пря-
моугольной функции vw(t)
Рис. 8.7. Прямоугольная весовая
функция vm(x)
тральной плотности 5ии((о) со спектральным окном Иш(со). При
расчете оценки спектральной плотности мощности на частоте соо
роль свертки
5'«Л«)о) = раи(^)Ит(<о0-^)^
о
сводится к смещению главного максимума спектрального окна
на эту частоту, умножению Suu(m) на это смещенное спект-
ральное окно и интегрированию произведения по всем часто-
там. Следовательно, оценка спектральной плотности на частоте
®о содержит помимо истинного значения спектральной плот-
ности на этой частоте вклад от всех других частот, иначе гово-
ря, происходит взаимное «просачивание» энергии. Это может
привести к существенным ошибкам при оценке спектральной
плотности.
Для того чтобы получить более достоверные результаты, про-
водят процедуру сглаживания первичных оценок, используя раз-
личные корреляционные окна. Если целью идентификации объекта
является получение частотных характеристик, то чаще всего для
сглаживания используют окно Парзена:
193
При этом сглаженную оценку спектральной плотности мощ-
ности вычисляют по формуле
Suu (®)— 2А
W-1
Хо + 2^ DrKr cos(rAco)
r=l
(8.7)
При использовании соотношения (8.7) следует придерживать-
ся следующих рекомендаций:
• интервал дискретности h должен удовлетворять условию
Л/max
гДе /max — наиболее высокая частота компоненты, наличие кото-
рой возможно в анализируемом процессе;
• число отсчетов корреляционной функции выбирают из соот-
ношения:
1
Ш =
AFh
где AF — желаемая эквивалентная разрешающая способность при
расчете энергетического спектра.
Все изложенное справедливо и при нахождении оценок взаим-
ных спектральных плотностей мощности.
Рассмотрим далее некоторые моменты, связанные с нахожде-
нием частотных характеристик динамических систем с использо-
ванием спектральных плотностей мощности. Известно, что час-
тотная характеристика идентифицируемого объекта может быть
найдена из соотношения:
= (8.8)
SUU (®)
Однако оценка частотной характеристики, вычисляемая по этой
формуле, может содержать ошибку смещения, которую вызыва-
ют следующие факторы:
• нелинейность и нестационарность параметров объекта;
• смещение оценок спектральной и взаимной спектральной
плотностей;
• присутствие инструментального шума на входе объекта;
• наличие других входов, коррелированных с рассматриваемым
входом.
Первый источник смещения появляется в случае, если апри-
орное предположение о стационарности и линейности парамет-
ров объекта не выполняется. Например, линейность идентифици-
194
Рис. 8.9. Измерение входного сигнала
руемого объекта может быть нарушена, если диапазон изменения
сигналов на входе оказался шире предполагаемого. Однако даже
применительно к нелинейным системам использование соотно-
шения (8.8) обеспечивает наилучшее (в среднеквадратическом
смысле) линейное приближение для эквивалентной частотной ха-
рактеристики.
Наличие в измеряемом на входе процессе u(t) посторонне-
го шума, т.е. не проходящего через систему «инструментально-
го» шума, также приводит к появлению ошибки при оценке
частотной характеристики. Действительно, если, как показано
на рис. 8.9, u(t) = x(t) + n(t), то, пренебрегая всеми другими
ошибками смещения, получим
SxyUto) ~|Г ^(го)
_ _ Snn (®)
^(у<о) L*S'«(o>)+‘5n»(o>)JL‘S'Ay(j<o)J
При спектральной плотности шума в измеренном на входе
объекта процессе, составляющей 10% спектральной плотности
сигнала, оценка частотной характеристики оказывается смещен-
ной в сторону снижения примерно на 10 %.
При появлении ошибки в оценке частотной характеристики
из-за коррелированности выхода с неизмеряемым другим вход-
ным сигналом объекта можно показать [3], что
И^(у®) =
Suu (®)[1 - У2ш> (®)]
(8.9)
где u(t) — измеряемый входной процесс; v(t) — неизмеряемый
на входе процесс; y(t) — выходной процесс; у^Дсо) — функция
когерентности, определяемая выражением
2 / Ч М»|
Suu (®)*$w (®)
(8.10)
195
Из соотношения
|$w Of Suu (a>)5TO(a>)
получаем, что функция когерентности удовлетворяет следующе-
му условию: 0 <у2р(ш) < 1.
Следовательно, если при некотором значении частоты выпол-
няется условие y2v(®) = О, то это означает, что функции «(/) и
v(t) при данной частоте некогерентны. Если функции u(t) и v(t)
статистически независимы, то у^((о) = 0 при всех значениях час-
тоты. Функции u(t) и v(t) будут полностью когерентны, если при
всех значениях частоты у^(ю) = 1.
Пренебрегая всеми другими ошибками смещения, из соотно-
шений (8.8) и (8.9) получим
А/{^(/<о)} 1-уЦ<о)
И" О) j _ Sm(j<o)Svy(jG>) ‘
sw (<»)suy (»
(8.П)
При некоррелированности измеряемого u(t) и неизмеряемого
v(t) входных сигналов имеем у^(со) = 0, Suv(j(n) = 0, что обраща-
ет правую часть выражения (8.11) в единицу. Только в этом случае
ошибка смещения становится равной нулю.
Темы для повторения
1. Характеристики случайных процессов, используемые при реализа-
ции алгоритмов обработки информации в процессе идентификации объек-
тов управления.
2. Получение оценок корреляционных функций случайных процес-
сов.
3. Факторы, влияющие на погрешности определения оценок корре-
ляционных функций.
4. Аппроксимация экспериментальных корреляционных функций ана-
литическими выражениями.
5. Получение оценок спектральной плотности мощности случайного
процесса.
6. Вычисление частотных характеристик динамических систем с ис-
пользованием спектральных плотностей мощности.
Глава 9
ОБЩИЕ ПРИНЦИПЫ ПОСТРОЕНИЯ
ДИАГНОСТИЧЕСКИХ СИСТЕМ
9.1. Основные задачи диагностики технических объектов
и систем управления
Понимание роли и места технической диагностики, ее на-
значения на всех этапах разработки, доводки, производства,
эксплуатации и ремонта современных сложных технических уст-
ройств безусловно является важным для определения задач,
которые решаются методами технической диагностики. И в этой
связи необходимо отметить, что хотя главной проблемой диаг-
ностики является разработка и практическая реализация алго-
ритмов оценки параметров состояний объекта, диагностирова-
ния без его разборки по характеристикам процессов, сопро-
вождающих режим тестовых испытаний или нормального функ-
ционирования, тем не менее методы и средства технической
диагностики, применяемые на различных этапах жизни техни-
ческого устройства, существенным образом различаются между
собой. Это обусловлено различием и условий, и целей диагнос-
тирования на каждом из этапов жизненного цикла техническо-
го устройства.
На этапе разработки и доводки машин и механизмов главной
задачей является необходимость создания в кратчайшие сроки с
минимальными трудовыми затратами конструкций, имеющих тре-
буемые прочностные, вибрационные и другие эксплуатационные
характеристики при минимальных расходах материалов. Доводка
конструкции технического устройства при его разработке вклю-
чает в себя последовательность нескольких циклов, приведенных
на рис. 9.1. Ресурсные испытания, проводимые обычно на специ-
альных стендах, позволяют выявить, во-первых, потенциально
ненадежные элементы и, во-вторых, определить наличие повы-
шенных динамических нагрузок, вибраций и других отклонений
от расчетных параметров.
Используя методы и средства технической диагностики, мож-
но не только определить «слабые» места конструкции, но и уста-
новить причины выхода их из строя, что позволяет внести соот-
ветствующие изменения в конструкцию. При стендовых испыта-
ниях для сокращения материальных и временных затрат на дора-
ботку конструкции целесообразно стремиться к параллельному
197
Рис. 9.1. Последовательность циклов при доводке конструкции
съему диагностической информации в максимально возможных
местах конструкции.
Следует также отметить, что на этом этапе обычно отрабаты-
вают методы и разрабатывают соответствующие штатные средства
диагностики, позволяющие выявить дефекты, появление кото-
рых либо наиболее вероятно при эксплуатации технического уст-
ройства, либо может приводить к аварии.
На этапе эксплуатации технических систем главной задачей ди-
агностических средств является текущая оценка состояния диа-
гностируемой системы, определение трендов основных парамет-
ров системы и прогнозирование поведения отдельных устройств
и механизмов, образующих эту систему. При наличии развитой
штатной системы диагностики возможно осуществление практи-
чески непрерывного контроля состояния отдельных узлов и си-
стемы в целом, что позволяет во многих случаях избежать плано-
во-предупредительного ремонта, назначаемого через заранее оп-
ределенные интервалы времени на основе результатов, получен-
ных при ресурсных испытаниях или из предшествующего опыта,
независимо от фактического состояния технической системы. При
этом следует обратить внимание на то обстоятельство, что если, с
одной стороны, процедура планово-предупредительных работ су-
щественно уменьшает вероятность аварии, то, с другой — она не
только не гарантирует отсутствие повреждений в межремонтный
период, но даже может увеличивать вероятность появления неис-
правности [4]. Это происходит, в частности, из-за того, что при
переборке машин и конструкций могут появиться перекосы, люф-
ты, нарушения соосности, что, в конечном итоге, и приводит к
сокращению срока жизни механизмов.
198
Рис. 9.2. Зависимость вероятности р выхода
из строя технического устройства от време-
ни t наработки (при условии непроведения
профилактического ремонта)
Тр Тс Т„ t
На рис. 9.2 приведена типичная зависимость вероятности выхо-
да из строя технического устройства от времени наработки без
проведения профилактического ремонта (Тр — время назначен-
ного ресурса; Тс — среднее наиболее вероятное время поломок; Т„ —
наибольшее время наработки до поломки) [4].
Однако в большинстве случаев время безаварийной эксплуата-
ции превышает назначенное время профилактического ремонта,
хотя не исключено возникновение неисправностей и на интерва-
ле времени t < Тр [4]. Именно это обстоятельство делает актуаль-
ной организацию контроля средствами диагностики текущего со-
стояния машин и механизмов и особенно выявление дефектов на
стадии их зарождения.
Особое место занимают системы технического диагностирова-
ния в безлюдных автоматизированных производствах, неотъемле-
мой частью которых они являются. В задачу таких систем входит
предупреждение внезапных отказов, набор статистики для реше-
ния задач прогнозирования, а также ускорение процесса отладки
при гибком характере автоматизированного производства путем
проверки правильности его функционирования, поиска конкрет-
ных нарушений работы технологического оборудования и конт-
роля точностных параметров технологического процесса. Заметим
также, что в безлюдных производствах системы диагностики дол-
жны работать в основном в автоматическом режиме, выполняя
функции органов чувств системы автоматизированного управле-
ния в условиях изменяющейся технологии мелкосерийного или
даже единичного производства, что существенно усложняет раз-
работку и эксплуатацию таких систем.
Рис. 9.3. Основные циклы ремонтных работ
199
При проведении ремонтных работ, основные циклы которых
приведены на рис. 9.3, основной задачей диагностических средств
является выявление поврежденных элементов конструкции, оценка
степени повреждения и, по возможности, оценка остаточного ре-
сурса, а по окончании ремонтных работ — проверка их качеств.
В целом применение систем диагностики позволяет получить
значительный экономический эффект за счет своевременного
проведения мероприятий по выявлению дефектов, устранению
неисправностей и, следовательно, предотвращению аварийных си-
туаций. Однако поскольку диагностика проводится в условиях не-
полноты и неопределенности информации, при неполном пред-
ставлении о закономерностях и характере связей между дефекта-
ми и диагностическими параметрами, возможны пропуски дефек-
тов и ложные заключения об их наличии при полной исправности
объекта. Именно поэтому одной из важнейших задач любой систе-
мы диагностики является накопление информации в целях уточ-
нения причин и условий возникновения и развития дефектов,
оценки влияющих факторов и, как следствие, уточнение методи-
ки диагностических процедур.
9.2. Виды неисправностей технических систем
В процессе эксплуатации современных технических систем в
них происходят изменения, которые приводят не только к ухуд-
шению показателей качества их функционирования, но и к воз-
никновению неисправностей, причем в любой части такой систе-
мы: в управляющем и исполнительном устройствах системы уп-
равления, в самом объекте управления. Потерю системой или ее
частью способности выполнять требуемые функции будем назы-
вать отказом [25].
Многообразие видов отказов технических систем и многообра-
зие их причинно-следственных связей с различными факторами,
действующими как внутри, так и вне системы, затрудняют про-
ведение четкой классификации типов отказов.
Прежде всего отказы в системах принято делить по скорости их
проявления на постепенные и внезапные. Постепенные отказы воз-
никают вследствие медленного изменения параметров, например
из-за износа, когда ухудшение технического состояния системы
происходит постепенно. Внезапные отказы связаны с переходом
количественных изменений в качественные, при этом развитие
неисправностей в системе происходит в относительно короткое
время, как бы внезапно. И постепенные, и внезапные отказы мож-
но подразделить на отказы полные, при которых система или уст-
ройство полностью теряют способность выполнять свои функции,
и отказы частичные, при которых происходит выход показателей
200
качества системы за допустимые пределы, заданные технически-
ми условиями ее функционирования.
На практике частичный отказ технической системы или пол-
ный отказ ее отдельного элемента могут привести к различным
последствиям, что определяется назначением данной системы. Так,
например, для прецизионной системы даже частичный отказ от-
дельных ее узлов делает, как правило, невозможной ее дальней-
шую работу. В ряде случаев даже полный отказ отдельного обору-
дования существенно не влияет на функционирование системы в
целом, в других — подобный отказ может привести к катастрофи-
ческим последствиям. Типичным примером отказов первого рода
может служить отказ одного из гребных валов судна, примером
отказа второго рода является отказ единственного двигателя са-
молета. Также существует разница между отказами устройств в за-
висимости от степени их ответственности. Например, очевидно,
что отказ какого-либо узла системы управления ядерным реакто-
ром и отказ аналогичного узла на тепловой электростанции могут
привести к совершенно разным результатам.
По физической природе существует деление отказов на скач-
кообразные (перемежающиеся) и постоянные. При скачкообраз-
ных отказах происходит потеря некоторых функций устройства
только на короткий промежуток времени, причем после отказа
устройство вновь приобретает утраченные свойства, т.е. возвра-
щается к своим номинальным характеристикам. При постоянных
отказах происходит прекращение функционирования техничес-
кой системы или потеря некоторых ее функций, которые устра-
няются только заменой отказавших элементов системы.
События, которые приводят к отказу технической системы,
как уже отмечалось выше, носят многофакторный и, как прави-
ло, случайный характер. Причинами отказа механических, элект-
ромеханических, гидравлических, пневматических и тому подоб-
ных устройств, образующих подавляющее большинство техничес-
ких систем, может быть износ элементов и узлов оборудования,
их коррозия и эрозия, усталость металла, деформации, разрывы,
трещины, нарушения изоляции, крепления и т.д.
Связь наиболее распространенных видов разрушений, которые
могут приводить к отказам, с основными типами воздействий,
возникающих в реальных условиях эксплуатации технических си-
стем, приведена на рис. 9.4.
Эксплуатационные механические нагрузки, приводящие к раз-
рушениям, бывают трех различных типов: статические, динамиче-
ские и циклические.
При статических нагрузках все элементы конструкции нахо-
дятся в равновесии, и при кратковременности действия таких на-
грузок не возникает условий для появления каких-либо усталостных
явлений. При длительном характере подобных воздействий ползу-
201
Рис. 9.4. Связь различных видов разрушений с основными типами воз-
действий
честь (пластичность) материала является фактором, приводящим,
как правило, к деформации элементов системы.
Динамические нагрузки в технических системах происходят в слу-
чае, если масса, находящаяся в покое, внезапно прикладывается
к объекту или при столкновении одного объекта с другим. При
этом возникают высокие напряжения, приводящие к появлению
разрывов, трещин, нарушению крепления и т.д.
Циклические нагрузки являются более распространенными, так
как сопровождают работу многих технических устройств. При цик-
лических нагрузках действующие напряжения циклически изме-
няются с высокой частотой, что приводит в первую очередь к
возникновению усталостных явлений, а именно, к появлению и
росту усталостных трещин и разрывов, изменению геометричес-
кой формы деталей, что в свою очередь приводит к концентрации
напряжений, которые особенно опасны для твердых и хрупких
материалов. Типичным примером циклических нагрузок является
вибрация конструкций технических систем, вызываемая различ-
ными причинами. Так, например, зарегистрированы такие фак-
ты, как разрушения элементов морской бурильной установки из-
за вибрации, вызванной действием волн, и разрушение руля ко-
рабля из-за вибрации в кильватерной струе.
Однако не только эксплуатационные факторы могут стать при-
чиной отказов оборудования, причинами могут быть и ошибки
при проектировании, и нарушения в технологии изготовления
материалов и деталей, а также в процессе сборки технических
устройств. На рис. 9.5 приведены наиболее часто встречающиеся
ошибки в процессе проектирования, производства и монтажа. Если
основным методом борьбы с ошибками подобного рода при изго-
товлении деталей и их сборке является повышение технологиче-
ской дисциплины и внедрение все более совершенных методов
контроля качества, то при проектировании избежать ошибок мож-
202
Рис. 9.5. Типичные ошибки при проектировании, производстве и монта-
же технических устройств
но путем применения при разработке технических систем дости-
жений современной теории управления и средств автоматизиро-
ванного проектирования.
Действительно, если при конструировании технической си-
стемы выбор элементов производить без учета влияния вариаций
их реальных характеристик на параметры системы, это может не
только привести к отклонению полученного качества системы от
заданного, но и вызвать появление в системе непредусмотренных
процессов, например вибраций или резонансных колебаний. Что-
бы избежать подобных явлений, необходимо при разработке тех-
нических устройств использовать в частности методы теории чув-
ствительности, позволяющие провести минимизацию дополни-
тельных движений, которые могут возникнуть при работе такого
устройства.
9.3. Диагностические модели
В основе любых диагностических методов лежит исследование
связей между параметрами технического состояния диагностиру-
емого объекта и характеристиками некоторых сигналов, являю-
щихся диагностическими признаками. Как известно, в теории
управления подобные связи определяют в виде моделей, причем
наиболее общими по степени формализации являются математи-
ческие модели. При выборе типа модели и ее построения в зави-
симости от целей исследования во главу угла могут ставиться те
или иные аспекты ее поведения, отражающие наиболее важные
для этих целей присущие объекту закономерности.
Процесс идентификации объектов управления сводится в ко-
нечном счете к поиску параметров модели, структура которой
априори задается или определяется на этапе структурной иденти-
203
фикации. При этом, как было показано ранее, традиционные ме-
тоды параметрической идентификации базируются на использо-
вании информации, получаемой в результате наблюдения за сиг-
налами как на выходе идентифицируемого объекта, так и на его
входе в режимах активного и пассивного эксперимента. Это прин-
ципиальное положение теории идентификации во многих случаях
может оказаться ограничительным фактором ее непосредствен-
ного применения для диагностики состояния функционирующей
системы, когда источник возбуждающих сигналов находится внутри
самого диагностируемого объекта и недоступен для измерения.
Кроме того, традиционные методы идентификации оказываются
практически неприменимы для выявления источников собствен-
ного возмущения, являющихся, как правило, следствием какого-
либо дефекта в диагностируемом объекте [25].
Именно по этой причине возникла необходимость разработки
специальных методов контроля состояния функционирующих тех-
нических систем, которые и составляют суть технической диагно-
стики, основным содержанием которой является (в соответствии
с ГОСТ) изучение и обоснование способов косвенных измере-
ний скрытых параметров устройства по характеру его функцио-
нального поведения.
Таким образом, диагностические модели должны отражать
функциональные связи между характеристиками наблюдаемых
выходных сигналов и внутренними процессами в объекте диагно-
стирования.
Общий подход при построении диагностических моделей за-
ключается в следующем [4]: пусть состояние объекта диагности-
рования можно оценить набором диагностических параметров,
представленным в виде некоторого вектора
R = {й, Ъ,..., гл},
где г, — параметр, характеризующий состояние объекта; i = 1,
2, ..., л.
Естественно, что параметры г, являются диагностическими при-
знаками только в том случае, если они могут быть непосредствен-
но измерены или вычислены на основе измеренных параметров
диагностируемого объекта и являются функцией структурных па-
раметров объекта aj(j = 1, 2, ..., т), состояние которых необхо-
димо контролировать и изменение которых может привести к по-
явлению отказа в диагностируемом объекте:
п = 7/(01, а2,..., ат).
В этом случае определение текущих значений диагностических
параметров г, и сравнение их с эталонными значениями парамет-
204
ров rf\ величины которых определены априори и соответствуют
нормальному (бездефектному) состоянию технической системы,
позволяют в принципе осуществить оценку состояния этой систе-
мы. В частности, такой подход является особенно эффективным,
если необходимо различить только два состояния диагностируе-
мой системы, одно из которых соответствует отсутствию, а дру-
гое — наличию дефекта. В этом случае выход одного или несколь-
ких диагностических признаков за заранее заданные пределы яв-
ляе^ся признаком наличия в технической системе какой-либо
неисправности (например, трещины в конструкции, разбаланси-
ровки ротора и т.д.)
Все изложенное выше справедливо, если набор признаков, об-
разующих вектор R, выбран правильно и является достаточно
полным, т. е. если можно с достаточной уверенностью говорить о
наличии связи между всеми предполагаемыми дефектами (неис-
правностями) и этими параметрами.
При этом также нужно иметь в виду, что при тестовых испыта-
ниях и тем более при диагностике в режиме нормального функ-
ционирования диагностируемой системы неизбежна вариация
значений параметров г„ измеренных в различные моменты вре-
мени при гарантированном отсутствии каких-либо неисправно-
стей или дефектов в системе. Это объясняется наличием помех,
сопровождающих функционирование системы, и погрешностями
измерительного тракта диагностической системы. По этой причи-
не при определении эталонных значений диагностических пока-
зателей rf необходимо устанавливать и пределы допустимых от-
клонений Дг, для бездефектного состояния объекта, т. е. порого-
вых значений гГтах(гГт1п), набор которых соответствует границе
работоспособности объекта.
Вполне естественно, что в процессе диагностики текущего со-
стояния технической системы в большинстве случаев целесооб-
разно осуществлять контроль не за абсолютными значениями ди-
агностических показателей, а за их отклонениями от нормы
Дт, =г/-г/эт.
Поэтому при разработке алгоритмов диагностирования необ-
ходимо принимать во внимание главным образом статистически
значимые отклонения от нормы компонентов диагностического
вектора состояния AR (в дальнейшем тексте для удобства будем
обозначать AR через R).
Полагая, что изменение со временем наработки технической
системы какого-либо ее структурного параметра (появление де-
фекта) должно привести к изменению одного или нескольких
(и даже всех) диагностических признаков-компонентов вектора R,
в общем случае каждому у’-му структурному параметру можно по-
205
ставить в соответствие л-мерный вектор диагностических призна-
ков
= (б/, r2j,Гф), j = 1, т, (9.1)
что является основой для решения в процессе диагностики задачи
распознавания, т. е. определения вида неисправности.
Однако при этом следует иметь в виду, что при относительно
малой размерности вектора R различным дефектам могут соот-
ветствовать одинаковые изменения значений параметров г,. В та-
ком случае диагностическая модель, использующая эти парамет-
ры, может применяться для решения упрощенной задачи опреде-
ления отсутствия или наличия дефектов без их классификации.
Диагностические параметры могут также оказаться неинфор-
мативными при слабой их коррелированности (или вообще отсут-
ствии корреляции) с дефектами, т.е. в случае, когда появление
дефекта не вызывает каких-либо статистически значимых изме-
нений величины г,.
Таким образом, диагностическая модель должна отражать вли-
яние возникающих в диагностируемой системе дефектов на пара-
метры технического состояния динамической системы и, следо-
вательно, на значения диагностических признаков. Влияние это
может быть весьма многообразным. Текущее состояние сложной
технической системы зависит от скорости и характера протекаю-
щих в ней физических и химических процессов, в результате ко-
торых в силу деградационных явлений и могут возникать дефекты
в виде износа, появления трещин, ослабления крепления и т.д.
Для выявления этих дефектов, как уже отмечалось ранее, не-
обходимо проводить диагностические испытания либо в режиме
нормального функционирования, либо подавая на вход тестовые
сигналы. При этом следует иметь в виду, что появление в конст-
рукции дефекта приводит не только к изменению условий про-
хождения сигналов от источников возмущения к месту съема, но
может вызвать изменение внутренних возмущающих сил. Напри-
мер, разбалансировка ротора электрической машины приводит к
увеличению амплитуды вибрации на частоте вращения ротора, и
оценка отклонения амплитуды колебаний на этой частоте может
быть основой диагноза.
Таким образом, в сигналах, снимаемых в контролируемых точ-
ках технической системы, будет содержаться информация о вход-
ных воздействиях и характере пути, который эти сигналы прошли
от точки приложения до точки съема, что можно выразить в виде
х(/) = 5{и(0,а},
где х(/) = {xi(/), x2(t), ..., xk(t)} — вектор выходных сигналов;
ii(Z) = {«1(0, u2(t), ..., И/(0} — вектор входных воздействий; а = {оь
а2, ..., ат} — вектор структурных параметров.
206
Обработав выходные сигналы, получим их характеристики,
являющиеся диагностическими признаками:
R = Дх(/)},
где L — оператор преобразования; в итоге получим
R = Л{а}.
Здесь А — оператор, характеризующий преобразование пара-
метров технического состояния я, в пространство диагностичес-
ких признаков.
Задача диагностики при таком представлении может быть вы-
ражена обратной зависимостью
а = Л-1{Я}, (9.2)
где А~х — оператор, обратный А.
Выражение (9.2) представляет в самом общем виде связь меж-
ду пространством параметров, характеризующих состояние тех-
нической системы, и пространством диагностических признаков,
т.е. является диагностической моделью. При этом для решения за-
дачи диагностики не имеет принципиального значения, какой
конкретный вид имеет эта модель. Главным требованием к модели
является только наличие связи (9.1), и именно по этой причине
для получения диагностических моделей может быть использован
специальный математический аппарат, в том числе и такой, ко-
торый не применяется при идентификации объектов управления.
Выше уже отмечалось, что появление дефекта может влиять не
только на изменение конструктивных параметров системы, но и в
ряде случаев в неявной форме входить в функцию вынуждающей
силы*.
и(/) = и(/, а*),
где а* = {я*, •••> ар} — вектор параметров состояния системы,
непосредственно влияющих на источники возбуждающих сил и
составляющих часть вектора а.
Безусловно также, что модель (9.2) можно использовать для
целей диагностики только в том случае, если и эталонные, и теку-
щие значения вектора R получены в адекватных условиях, т. е. при
подаче на вход одинаковых тестовых воздействий или при одних и
тех же режимах функционирования. Практически выполнить это
требование сложно, особенно для диагностики состояния функцио-
нирующей системы, работа которой сопровождается значительным
уровнем помех. Это обстоятельство, так же как и неполнота клас-
сов состояний диагностируемой системы, неопределенность гра-
ниц между этими классами, вынуждает применять статистические
методы обработки информации на одном или нескольких этапах
решения задачи диагностики, особенно на заключительном —
классификации состояния диагностируемого объекта.
207
9.4. Классификация состояния при диагностике
технических систем
В самом общем случае задачу диагностики технических систем
можно сформулировать следующим образом: необходимо опреде-
лить текущее состояние объекта диагностики посредством отне-
сения его на основе выбранного критерия к тому или иному клас-
су возможных состояний из заранее определенной общей сово-
купности состояний в некотором признаковом пространстве. В та-
кой постановке диагностическая задача является классификаци-
онной, для решения которой целесообразно использовать методы
теории распознавания образов. Причем в типовой процедуре диаг-
ностики процесс распознавания имеет два разных по характеру и
способу решения проблемы уровня. На первом уровне осуществ-
ляется распознавание полезных сигналов в их смеси с помехами в
целях обнаружения, выделения и формирования диагностических
признаков. Эта задача решается методами фильтрации сигналов,
некоторые из них будут рассмотрены далее. На втором уровне про-
исходит классификация состояний объекта диагностирования по
значениям диагностических признаков, определенным на первом
уровне. Именно здесь может оказаться весьма полезным матема-
тический аппарат теории распознавания образов. Рассмотрим крат-
ко некоторые основные положения этой теории, на базе которых
строятся процедуры диагноза состояния технических систем.
Положим, что априори исходное множество состояний (ситуа-
ций, процессов и т.п.) W подразделено на классы Wh i = 1, т, т.е.
составлен некоторый алфавит классов W = {И^,..., и опреде-
лен словарь признаков U„ = {«],..., и„}. Далее с помощью языка
признаков uh j = 1, п составлено описание каждого класса И^, т.е.
получены функциональные зависимости вида = р^щ, ..., и„).
Пусть в результате проведения на объекте диагностирования
испытаний диагностические признаки для распознаваемого со-
стояния приняли значения: и\ = и*, и2 = и2, ..., ип = и*п. Для реше-
ния задачи распознавания, т. е. определения к какому классу от-
носится неизвестное состояние, необходимо провести сопостав-
ление апостериорной информации с априорным описанием клас-
сов на языке признаков при помощи алгоритмов распознавания.
Признаки распознаваемых состояний, наиболее часто исполь-
зуемые при диагностике технических систем, можно разделить на
детерминированные и вероятностные. К детерминированным от-
носят признаки, принимающие конкретные числовые значения,
которые можно рассматривать как координаты точки в многомер-
ном признаковом пространстве. К вероятностным относят при-
знаки, случайные значения которых распределены по всем клас-
208
сам состояний, к ним можно отнести и признаки — числовые
значения в случае, если их измерения проводятся с ошибками.
Распознавание состояний диагностируемого объекта основы-
вается на сравнении той или иной меры близости распознаваемо-
го состояния с каждым классом. В случае, когда выбранная мера
близости L признаков U данного состояния w с признаками како-
го-либо класса Wk, к = 1, т превышает меру близости с призна-
ками других классов, принимают решение о принадлежности те-
кущего состояния wк этому классу Wk, т.е. we Wk, если
L(w, И*) = extr(w, И^); к = 1,...,т; 1 = 1, ...,т; к * i.
В алгоритмах распознавания, базирующихся на использовании
детерминированных признаков, в качестве меры близости наибо-
лее часто используют среднеквадратичное (евклидово) расстоя-
ние в признаковом пространстве между данным состоянием w и
совокупностью состояний {w*,..., и’**}, представляющих собой
класс Wk [4]:
1 8к ,
_5к 5=1
В случае если необходимо учитывать веса о, признаков состо-
яния w и признаков и* состояний w* класса то возможно при-
менение \^етрики вида:
1 gk л , , э
_8к 5=1 j=\
1/2
или более простой метрики взвешенного евклидова расстояния.
Вообще выбор метрики в метрическом пространстве достаточ-
но произволен, необходимо лишь выполнение трех аксиом:
1) /(Х|, х2) = 0 тогда и только тогда, когда х, = х2;
2) /(хь х2) = /(х2, х0 (аксиома симметрии);
3) /(хь х2) < /(хь х3) + /(х3, х2) (аксиома треугольника).
Здесь /(хь х2) — однозначная неотрицательная действительная
функция, определяющая расстояние между двумя любыми точка-
ми Xj и х2, принадлежащими метрическому пространству.
Применительно к задачам диагностики метрическое простран-
ство — это признаковое пространство, каждая i-я точка которого
может быть задана вектором признаков U, = {иа, ..., uin}. Расстоя-
ние 1у между двумя точками признакового пространства U, и U,
можно определить, используя один из возможных показателей рас-
стояний, приведенных в табл. 9.1.
209
Таблица 9.1
Расстояние ly между точками признакового пространства для разных
показателей расстояния
Показатель расстояния
Евклидово расстояние и 2“ £(и« -«#) _*=1 J 1/2
Взвешенное евклидово расстояние J -мл)2 ы -1/2
Расстояние по Хэммингу £|и*-иЛ| fc=l
Квадрат расстояния -Ujk)2 к=\
Обобщенное расстояние л v * _*=1 J i/v
Обычное евклидово расстояние целесообразно использовать,
когда компоненты вектора диагностических признаков однород-
ны по своему физическому смыслу, и все они одинаково важны с
точки зрения отнесения распознаваемого состояния к тому или
иному классу [8].
Взвешенное евклидово расстояние предпочтительно применять
в том случае, если удается каждой из компонент вектора призна-
ков обоснованно приписать некоторый неотрицательный вес ц*,
пропорциональный степени его важности для диагностирования.
Обычно значения веса ц* варьируют от 0 до 1.
Учитывая, что каждый класс характеризуется перечнем вхо-
дящих в него элементов, при построении диагностических систем
необходимо иметь эталон каждого класса, под которым понима-
ют некий образ класса, формируемый из усредненных значений
элементов этого класса. В этом случае процесс распознавания об-
разов будет основан на определении принадлежности текущего
состояния объекта к одному из классов путем сравнения этого
состояния с эталонами классов. При этом решение о принадлеж-
ности к тому или иному классу принимают на основе оценки рас-
стояния между испытуемым состоянием и эталоном к-го класса в
признаковом пространстве.
210
Формирование эталонного вектора признаков возможно при
наличии некоторой обучающей выборки. Если эта выборка содер-
жит R членов класса состояний с диагнозом в качестве этало-
на можно использовать вектор
{1 R 1 R 1 R ]
Л Г=1 К Г=1 К r=i J
называемый центром тяжести области диагноза.
Таким образом, распознавание испытуемого состояния техни-
ческой системы, заданного вектором признаков U,, осуществля-
ется оценкой расстояний до каждого из эталонов у, и отнесением
к соответствующему классу состояний Wj в соответствии с прави-
лом:
w е Wj, если 1у = min /,*; k = 1, ..., т.
Применение указанного подхода можно проиллюстрировать
с помощью рис. 9.6, на котором показано распознавание состоя-
ния в двумерном признаковом пространстве по минимуму рас-
стояния до эталонов. Видно, что из расстояний от точки простран-
ства, заданной вектором U,(nyl, wj2), Д° эталонов Nq(q = /, к, т)
минимальным является расстояние /у, что позволяет сделать вы-
вод о принадлежности испытуемого состояния классу
На практике необходимо учитывать то, что компоненты векто-
ра Ц- могут быть определены с ошибкой из-за влияния помех,
ошибок измерения, вычислений и т.д. Для уменьшения вероятно-
сти ошибки распознавания точку в признаковом пространстве,
характеризующую у-й класс, обычно заменяют сферой радиусом
Ру. Правило распознавания при попадании точки в сферу для от-
несения ее к у'-му классу в этом случае может быть сформулиро-
вано следующим образом: we W], если |t/( -К,| < р7.
Рис. 9.6. Распознавание состояния в двумер-
ном пространстве признаков
211
Радиус ру целесообразно выбирать так, чтобы сфера включала
с небольшим запасом все точки обучающей последовательности,
принадлежащие данному классу. Необоснованное увеличение ра-
диуса pj может привести к затруднению при распознавании состо-
яния в случае примерного равенства расстояний от испытуемого
вектора до двух или более эталонов.
Классификацию состояний технических систем можно осуще-
ствлять, пользуясь не только мерой близости векторов, но и ме-
рой сходства. При этом распознавание диагностируемого состоя-
ния осуществляют оценкой меры сходства вектора признаков с
описанием каждого класса и отнесением к тому из классов, мера
сходства с которым максимальна:
w е Wj, если Ry = max Rik; к = 1,..., п.
Одной из распространенных мер сходства двух векторов явля-
ется угловая мера, а именно косинус угла <р,у между векторами U,
и U,-:
Максимум сходства достигается в случае, если направления
распознаваемого Ц и эталонного Vy- векторов совпадают (рис. 9.7).
В алгоритмах распознавания, базирующихся на применении
вероятностных характеристик, наиболее часто используемым яв-
ляется байесовский способ классификации, когда классификатор
причисляет распознаваемое состояние к классу, которому соот-
ветствуют наименьшие условные потери. Для реализации этого
подхода необходимо иметь некоторые априорные описания клас-
сов состояний.
Рис. 9.7. Использование меры сходства при
сравнении распознаваемого и эталонного
векторов
212
При этом должны быть известны:
• p,(U) — функция плотности значений признаков состояний
объектов, относящихся к классу Wh i = 1, т;
• Р( И'') — априорная вероятность нахождения объекта в состо-
янии И^-го класса;
• вектор признаков U = {иь и„};
• риски правильных и ошибочных решений, представляющие
собой элементы платежной матрицы вида [4]:
С[2 ••• Qm
С m2 • • • Стт
По главной диагонали платежной матрицы расположены поте-
ри при правильных решениях, а по обеим сторонам от нее —
потери при ошибочных решениях. В случае если Сй <0 (/ = 1, т),
такие отрицательные потери можно рассматривать как выигрыш
при правильных решениях.
Пусть в результате диагностических испытаний найдены зна-
чения признаков и, = И]°,..., и„ - и° распознаваемого состояния w.
Обозначим это событие ап. Тогда значение риска, связанного с
решением Ьида w е Wg при условии, что имеет место событие а„,
будет
т
B(we Wglan) = B(Wglan) = YCigP{Wilan),
/=1
где условная апостериорная вероятность того, что we Wh в соот-
ветствии с формулой Байеса равна
Р(И<)р,•(<...,и°)
ЛШ = „
/=1
В общем случае решение вида w е И' принимают при условии,
что
В(Щ/а„) = гп1пВ(Щ/ап).
Следует обратить внимание еще на один важный аспект прак-
тического применения теории распознавания образов при диаг-
ностике технических систем [8]. В связи с тем что обычно число
объектов и число экспериментов, проводимых на них для получе-
213
ния обучающих выборок, ограничено, то и число диагностичес-
ких признаков приходится во многих случаях ограничивать. Есте-
ственно, что при этих обстоятельствах становится актуальной оцен-
ка возможностей распознавания состояний объектов диагности-
рования по ограниченному числу признаков. В частности, оценка
эффективности распознавания диагностируемых состояний при
условии, что признаки двух классов состояний И7, и подчиня-
ются нормальным законам распределения с равными ковариаци-
онными матрицами, и при наличии корреляционных связей меж-
ду диагностическими признаками описана авторами [8]. Оказыва-
ется, что при этих условиях отрицательная корреляция между двумя
признаками может значительно уменьшить ошибку распознава-
ния, тогда как положительная корреляция несколько увеличива-
ет ее. Однако при распознавании классов с разными матрицами
ковариаций учет даже положительной корреляции между призна-
ками одного класса при отсутствии корреляции признаков друго-
го класса позволяет уменьшить ошибки распознавания.
9.5» Формирование словаря диагностических признаков
В предыдущем параграфе уже отмечалось, что при построении
реальной системы диагностики возможно вынужденное ограни-
чение размерности вектора признаков. Рассмотрим некоторые об-
щие положения формирования словаря диагностических призна-
ков [4].
Совершенно очевидно, что размеры алфавита классов и слова-
ря признаков взаимозависимы. Действительно, если зафиксиро-
вать размер словаря признаков, то расширение алфавита классов
приводит к уменьшению достоверности распознавания, и наобо-
рот. Расширение словаря признаков в общем повышает достовер-
ность распознавания, но требует увеличенных аппаратурных и
вычислительных ресурсов диагностической системы или приво-
дит к увеличению времени, затрачиваемого на классификацию
состояний. Вот почему так важно при разработке системы техни-
ческого диагностирования проводить тщательную оценку возмож-
ных классов состояний диагностируемого объекта, с тем чтобы
определить целесообразность их включения в алфавит диагности-
ческих состояний.
Рациональный выбор диагностических признаков предполага-
ет учет ряда требований, вытекающих из задачи оптимизации си-
стемы диагностирования. Прежде всего признаки должны быть
однозначно связаны с состоянием диагностируемого объекта и
образовывать достаточную систему для обеспечения достоверного
диагноза на возможно более ранних стадиях развития дефектов.
Выбор признаков связан также и с требуемой глубиной диагноза.
214
Формирование рабочего словаря диагностических признаков
обычно проводится в несколько этапов. На первом шаге построе-
ния системы диагностирования образуется априорный словарь при-
знаков, уточняемый на последующих итерациях разработки сис-
темы диагностирования. Рабочий словарь диагностических при-
знаков формируется с учетом главным образом их информатив-
ности и возможных ограничений, налагаемых на вычислительные
ресурсы диагностической системы.
Говоря об информативности признаков, следует обратить вни-
мание на такую составную часть свойства информативности,
как разделительность признаков. Если признаки распознавае-
мых состояний иь ..., ип статистически независимы, т.е. спра-
ведливо условие:
Pi (Ui,...,un) = П а(«>); i = (9.3)
/=i
где Pi(u) — плотности распределения признаков в И^-м классе;
это является достаточным условием аддитивности информации
п
J(uh...,u„) = ^J(Uj), (9.4)
где /(и) — информативность признака.
При выполнении условий уравнения (9.4) поиск диагности-
ческих признаков можно осуществить следующим путем [4]: пусть
задан алфавит классов W = {..., РКт}, априорный словарь при-
знаков U = {wb ..., ит}, априорные вероятности состояний P(^)>
а также условные плотности вероятностей значений признаков
по классам, т.е. функциир{и{,..., и„}. Исходная энтропия системы
в этом случае будет равна
tfo=-XW)lnP(»9.
<•=1
После измерения признака «, энтропия системы станет равной
т
H(uj) = -X P(Wi/uj) In Р( Wi/Uj),
i=l
где P{Wi/Uj} — апостериорные вероятности отнесения распозна-
ваемого состояния технической системы к классу Wt‘.
1=1
215
Количество информации, которое получает система распозна-
вания при измерении признака т.е. информативность этого
признака, определяется в виде
т
J(Uj) = Н0- H(uj) = -% W)In Р(Г<) +
/=1
т т nj
L Л ka/»9W/«#) in Л
/=1 /=1£=1 .
если признак принимает дискретные значения с вероятностями:
т
= YP(^)P^jk/^); к = 1,.... nj.
1=1
Определение значений J(u2),J{un) дает возможность
проранжировать признаки с точки зрения их информативности,
исключив из словаря признаков те из них, информативность ко-
торых ниже заранее обусловленного порога.
Кроме того, вычисление значений J(w7) позволяет провести
минимизацию маршрута распознавания. Рассмотрим алгоритм ра-
боты диагностической системы при реализации такого маршрута.
При распознавании каждого нового состояния, поступившего на
вход системы, в первую очередь определяют наиболее информа-
тивный признак, затем — следующий за ним по ранжиру и т.д.
Такой подход позволяет уменьшить в первую очередь временные
затраты и повысить эффективность работы диагностической сис-
темы, так как во многих случаях диагноз состояния может быть
поставлен при вычислении первых т из п диагностических при-
знаков.
Однако в задачах распознавания статистическая независимость
признаков (9.3) может оказаться недостаточным условием адди-
тивности информации, так как при диагностических процедурах
обычно происходит учет априорной информации. Поэтому инфор-
мативность вновь поступивших на вход системы признаков зави-
сит от того, какова информативность признаков, включенных в
рабочий словарь диагностических признаков на предыдущих ите-
рациях. В связи с этим рассмотренный выше подход к проблеме
выбора словаря диагностических признаков носит ограниченный
характер. Для достаточно общего случая решение этой задачи рас-
смотрено в [4].
Пусть задан алфавит классов W = {И7,,..., и определен ап-
риорный словарь признаков U = {«|,..., «„}. Вводя величину
принимающую значение 1 (признак Uj используется в рабочем сло-
варе признаков) или 0 (признак в словаре не используется),
будем рассматривать
216
w=
kg kg fl
KqK'q-i k=[ /=1 j=l
1/2
в качестве меры близости между состояниями внутри класса И^, а
величину
S(Wq,Wp) =
в качестве меры близости между состояниями данной пары клас-
сов.
Приведенные выражения представляют собой средний квадра-
тичный разброс состояний внутри класса и средний квадратичный
разброс состояний классов и Wp с учетом вектора X = (Хь
Х„) соответственно. Величина uJqk является у-м диагностическим при-
знаком к-го состояния <?-го класса.
Положим, что измерение у-го признака сопряжено с затрата-
ми С} ресурсов, причем общие затраты ресурсов составляют
п
а для реализации диагностической системы определен лимит ре-
сурсов в виде величины Со и при этом С > Со. При таких условиях
выбор рабочего словаря диагностических признаков сводится к
решению следующей оптимизационной задачи.
Необходимо найти такое подмножество признаков {«д, ..., ujn}
множества U = {wb ..., «„}, которое обеспечивало бы экстремаль-
ное значение некоторого критерия эффективности системы диа-
гностирования при соблюдении ограничения С < Со. В качестве
такого критерия рекомендуют [4] величину
„ 5г(1Г,,И$)
Вполне очевидно, что при максимизации такого критерия эф-
фективность системы диагностирования в смысле повышения до-
стоверности установления правильного диагноза будет тем выше,
чем больше средние квадратические расстояния между классами
S( И^р) и чем меньше среднее квадратическое расстояние внутри
классов S( W). В такой постановке решением оптимизационной за-
дачи будет вектор Х°, удовлетворяющий условию Л(Х°) = max R
при ограничении
217
У=1
(9.5)
т.е. необходимо определить
max min =
X q,p
s(w4,wp)
S(Wq)S(Wp)
с учетом (9.5). В простейших случаях, когда число пар классов
сравнительно невелико, указанная задача может быть решена про-
стым перебором.
В заключение можно сформулировать некоторые общие требо-
вания, предъявляемые к диагностическим признакам, для вклю-
чения их в словарь признаков. В первую очередь таким требовани-
ем является инвариантность признака к изменению внутри класса
и резкое изменение значения при переходе от одного класса к
другому. Необходимое свойство признаков — их стабильность при
задании одних и тех же параметров технического состояния во
время проведения однотипных испытаний технических систем.
Важным требованием является и высокая чувствительность при-
знака Uj к изменению контролируемого параметра (дефекта) х„
т.е. большая относительная скорость dUj/dXj при переходе от нор-
мального состояния системы Wn к дефектному - Оценкой этого
свойства информативности может быть величина
j Uj
где и1-, uj — значения диагностических признаков при нормаль-
ном и дефектном состояниях технической системы.
9.6. Структура типовой системы диагностики
Конечной целью любой системы диагностики является фор-
мирование диагностических признаков, позволяющих провести
классификацию состояния диагностируемой системы. Эта цель
может быть достигнута путем достаточно разнообразной аппара-
турной реализации различных алгоритмов обработки информа-
ции. Анализ принципов функционирования диагностических си-
стем позволяет выделить основные функциональные блоки, ко-
торые присущи большинству таких систем. Рассмотрим типовую
структурную схему диагностики, приведенную на рис. 9.8.
Прежде всего остановимся на таком элементе системы, как
блок формирования тестовых (испытательных) сигналов. Нали-
чие такого блока определяется возможностью проводить диагнос-
218
40
Рис. 9.8. Типовая структурная схема системы диагностики
Диагноз
Прогноз
тирование объекта в режиме периодического регламентного кон-
троля, когда допускается подача на объект специально сформи-
рованных испытательных сигналов заданной формы и величины.
Однако во многих случаях необходимо проводить диагностирова-
ние объекта в режиме его нормального функционирования, и в
этом случае подача тестовых сигналов на вход объекта исключена.
Временные сигналы, снимаемые с первичных преобразовате-
лей (датчиков), мало пригодны для целей диагностики, как из-за
большого уровня помех, сопровождающих функционирование
большинства объектов, так и из-за того, что эти сигналы содер-
жат избыточную информацию, характеризующую работу отдель-
ных узлов объекта диагностирования и их взаимодействие. Поэто-
му в первую оч'ередь возникает задача выделения полезного сиг-
нала, решаемая, как правило, традиционными методами фильт-
рации, детектирования. При этом также возможна дополнитель-
ная предварительная обработка сигнала с применением методов
частотной и временной селекции, с использованием априорной
и апостериорной статистики и других достаточно известных спо-
собов извлечения информации [4].
Блок вычисления диагностических признаков состояния иссле-
дуемого объекта в соответствии с алгоритмами преобразования
информации, используемыми в конкретной системе диагности-
ки, выполняет роль формирователя компонент вектора диагнос-
тических признаков. Такими компонентами могут быть, напри-
мер, определенные составляющие частотного спектра сигнала. Во
многих случаях подобных диагностических признаков оказывает-
ся вполне достаточно для принятия решения о состоянии объекта.
Иногда эти «первичные» признаки оказываются малочувствитель-
ными к небольшим вариациям состояния объекта и, следователь-
но, не могут быть использованы для выявления дефектов объекта
на стадии их зарождения. В таких случаях возникает необходимость
дополнительных вычислений в целях получения «вторичных» ди-
агностических признаков, которые и выступают в роли информа-
тивных параметров диагностической модели, характеризующих те-
кущее состояние диагностируемого объекта.
На основании сравнения текущих и эталонных значений пара-
метров диагностической модели в блоке классификации состоя-
ния объекта диагностирования осуществляется процедура приня-
тия решения о принадлежности к тому или иному заранее опре-
деленному классу состояний. При этом первым этапом распозна-
вания состояний, осуществляемого в этом блоке, как правило,
является сравнение текущих параметров диагностической модели
с их пороговыми значениями для определения предаварийных (а
также недопустимых по технологическим или иным причинам)
состояний объекта. Результаты проведенного диагноза использу-
ют для управления исследуемым объектом: переключения на дру-
220
гой режим в целях проведения дополнительного (уточняющего)
исследования, аварийного останова и т.д.
Анализ трендовых характеристик параметров диагностической
модели дает возможность провести оценку тенденции изменения
состояния диагностируемого объекта и тем самым осуществить про-
гнозирование его остаточного ресурса. Нахождение этих трендовых
характеристик предопределяет наличие в системе диагностики блока
хранения текущих состояний объекта диагностирования.
Любая процедура диагностирования содержит операцию срав-
нения текущих значений диагностических признаков с их эталон-
ными значениями, получаемыми во время предварительного изу-
чения объекта. Набор эталонных параметров диагностических мо-
делей, соответствующих нормальному и различным дефектным
состояниям объекта, формируется на этапе «обучения» системы
диагностики. С этой целью анализируются свойства физических
процессов (вибраций, тепловых полей и т.д.), являющихся ис-
точником первичной информации при нормальном состоянии
объекта и) наличии дефектов, на основе чего и определяют ин-
формативные признаки исправного и неисправного состояний для
последующего выбора диагностической модели. На этом же этапе
в признаковом пространстве формируют области, соответству-
ющие особым состояниям объекта: предельно допустимое значе-
ние параметра технического состояния, предаварийная ситуация,
прекращение нормального функционирования.
Основной проблемой при таком способе формирования эта-
лонных диагностических признаков является недостаточный объем,
а зачастую и полное отсутствие информации о процессах, соот-
ветствующих тому или иному возможному дефекту, из-за невоз-
можности «внесения» такого дефекта в действующую техничес-
кую систему. По этой же причине и границу между областями
нормального и дефектного состояния определить непросто.
Разрешить эту проблему можно двумя путями. Первый (и са-
мый простой) заключается в организации непрерывного контро-
ля за техническим состоянием объекта в процессе его эксплуата-
ции и определении соответствия параметров диагностической
модели различным состояниям объекта. К сожалению, при таком
подходе не удается сформировать достаточно богатый словарь ин-
формативных признаков неисправностей, подлежащих диагнос-
тированию. Конечно, при диагностировании однотипных техни-
ческих систем возможен путь стендовых испытаний и формирова-
ние эталонов для данного типа технической системы с учетом
статистики. Однако следует заметить, что разброс параметров диа-
гностической модели может оказаться настолько большим, что
на практике это делает невозможным осуществление достаточно
достоверного распознавания состояний объекта наблюдения. В та-
ких случаях перед началом функционирования диагностической
221
системы возникает необходимость уточнения эталонов диагно-
стических признаков, т.е. их «индивидуализации».
Второй путь заключается в предварительном нахождении аде-
кватной физической или математической модели технической си-
стемы, позволяющей моделировать различные возможные дефек-
ты и имитировать соответствующие им процессы в «точках съема»
первичной информации. В этом случае на этапе «обучения» диа-
гностической системы словарь информативных признаков запол-
няется путем моделирования неисправностей, а на этапе ее функ-
ционирования происходит уточнение эталонов. Успех данного
подхода определяется главным образом степенью адекватности
модели реальным объектам и возможностью нахождения величин
разбросов параметров эталонных характеристик.
Очевидно, что существует связь между «обучением» системы
диагностики и ее функционированием в процессе диагностирова-
ния. Действительно, в последнем случае уже решается обратная
задача, при которой по текущим параметрам диагностической
модели, найденным обычно в условиях действия помех, ищут со-
ответствие текущего технического состояния объекта некоторому
из заранее определенных.
Таким образом, успешное решение проблемы диагностирова-
ния технических систем зависит как от того насколько успешно
реализован процесс «обучения», так и от эффективности алго-
ритмов получения информативных диагностических признаков и
алгоритмов классификации состояний.
Темы для повторения
1. Основные задачи, решаемые посредством использования систем
диагностики.
2. Особенности решения диагностических задач.
3. Виды отказов в технических системах.
4. Связь различных видов отказов с основными типами воздействий,
возникающими в реальных условиях эксплуатации технических систем.
5. Ограничения для использования «традиционных» методов иденти-
фикации при решении диагностических задач.
6. Требования, предъявляемые к диагностическим моделям.
7. Предпосылки использования теории распознавания образов для
решения диагностических задач.
8. Использование меры сходства векторов при классификации состо-
яния диагностируемого объекта.
9. Этапы формирования рабочего словаря диагностических признаков.
10. Требования, предъявляемые к диагностическим признакам, для
включения их в словарь признаков.
11. Состав и назначение основных элементов, входящих в типовую
структурную схему диагностики.
Глава 10
ДИАГНОСТИЧЕСКИЕ СИГНАЛЫ И ПАРАМЕТРЫ
10.1. Диагностические сигналы
Функционирование технических систем — это взаимодействие
составляющих их частей, которое сопровождается преобразова-
нием и выделением механической, электрической, тепловой и
другого вида энергии. Измерение параметров происходящих при
этом процессов позволяет получить исходную информацию, ис-
пользуемую для решения задачи диагностики.
Как уже отмечалось, при диагностировании технических си-
стем существуют два принципиально отличающихся друг от друга
подхода.
Первый подход использует методы получения математических
моделей по входу и выходу испытуемой системы, развитые в тео-
рии идентификации. Для идентификации проводят наблюдения
как над входными воздействиями, так и над выходными реакци-
ями, что в условиях активного эксперимента требует подачи на
вход системы специально сформированных тест-воздействий, ими-
тирующих отсутствующие рабочие входные воздействия. При этом
параметры тест-сигналов и режимы испытаний должны быть вы-
браны такими, чтобы, с одной стороны, не происходило искаже-
ние динамики системы, соответствующей ее нормальному функ-
ционированию, с другой стороны, была обеспечена требуемая
точность диагностирования.
Второй подход базируется на формировании информатив-
ных диагностических признаков только на основе анализа вы-
ходных процессов, сопровождающих функционирование техни-
ческой системы, когда возмущающие воздействия не наблюда-
емы. В обоих случаях алгоритмы диагностирования предполага-
ют наличие математического описания процессов на входах и
(или) выходах технической системы. При этом в зависимости
от вида системы и характера изучаемых явлений проводится из-
мерение различных параметров: ускорения, давления, напря-
жения, температуры и т.д. Все измеряемые параметры являют-
ся функциями времени, переносящими информацию о состоя-
нии диагностируемой системы. Такие функции принято назы-
вать сигналами [3, 10].
223
Многообразие форм представления сигналов требует краткого
описания их основных особенностей, которые могут оказаться су-
щественными при постановке и решении задач диагностики. Сиг-
налы характеризуются определенными энергетическими и инфор-
мативными свойствами, из которых наибольший интерес в диаг-
ностических целях представляют информативные признаки, а
именно такие характеристики сигналов, как степень их регуляр-
ности, форма и размерность.
Очевидно, что рациональность выбора модели сигналов может
оказать большое влияние на скорость и результаты их обработки
при формировании диагностических признаков. В общем случае
модель сигнала должна отражать все основные особенности сиг-
нала, быть достаточно универсальной (т.е. обеспечивать возмож-
ность подстройки к другим разновидностям сигналов), экономич-
ной (иметь малое число входящих в нее параметров), а также при-
способленной к применяемым средствам и алгоритмам обработки.
Часто эти требования взаимно противоречивы и поэтому при вы-
боре модели руководствуются некоторыми соображениями целе-
сообразности. Так, в зависимости от априорной информации о
сигналах используют либо детерминированные, либо статисти-
ческие модели. И если первые выражают аналитическим описани-
ем непосредственно самого сигнала, то вторые описывают теми
или иными вероятностными характеристиками, применяемыми
при анализе случайных процессов.
Обычно в качестве детерминированных моделей сигналов ис-
пользуют следующие математические представления: 5-импульс;
функцию включения (скачок) о(/) = 1(Z); треугольный импульс;
последовательность прямоугольных импульсов; гармонические
функции sin о/, costor, экспоненциальную функцию ехраГ и др.
Детерминированные модели сигналов более сложного вида могут
быть сформированы из элементарных путем их линейных комби-
наций.
В зависимости от формы представления детерминированных
сигналов — непрерывной или дискретной — используют те или
иные информативные параметры. Так, например, для непрерыв-
ного детерминированного сигнала в виде постоянного тока ими
будут величина, полярность, моменты включения и выключения;
для гармонического колебания — амплитуда, частота и начальная
фаза. Дискретный сигнал, состоящий из последовательности пря-
моугольных импульсов, можно описать временным положением,
амплитудой, полярностью и длительностью каждого импульса.
К классу сигналов, представляемых статистическими моделя-
ми, относятся случайные процессы. Так как случайный процесс
является функцией с непредсказуемыми в детерминированном
смысле значениями, то его математической моделью может быть
подходящая статистическая характеристика.
224
Как известно, по своему характеру случайные процессы разде-
ляются на стационарные (т.е. с неизменными во времени стати-
стическими характеристиками) и нестационарные, однородные (т.е.
с неизменными по пространственным переменным статистиче-
скими характеристиками) и неоднородные. Безусловно, однород-
ность и особенно стационарность случайного процесса являются
важными факторами, которые необходимо учитывать, решая за-
дачу классификации состояния диагностируемой системы.
Наиболее широко при математическом описании случайных
процессов используют подход, базирующийся на методах теории
спектрально-корреляционного анализа. Его применение требует
знаний моментных функций процессов не выше второго порядка
(математического ожидания, дисперсии и корреляционной функ-
ции). Фундаментальное значение для обычной практики выявления
спектральной структуры случайного сигнала имеет теорема Вине-
ра—Хинчина. Она связывает между собой функцию корреляции
К(х) = М {x(z)x(/ + t)},
где М{*} — символ математического ожидания, и энергетиче-
ский спектр (спектральную плотность мощности) 5(со):
5(со)= J ^СОе-'^дт,
K(X) = _L ] S((o)e-J™d(o.
2^ Joo
Спектральная 5(ш) и корреляционная К(х) характеристики от-
ражают статистические закономерности случайных процессов в
динамике их проявления. Это позволяет применять спектрально-
корреляционный анализ и к нестационарным случайным процес-
сам, вводя в рассмотрение нестационарные характеристики 5(<о, t)
и K(t\, t2). Хотя соответствующая теорема, связывающая эти ха-
рактеристики, неизвестна, их использование при оценке состоя-
ния технических систем может оказаться полезным.
Обычным для многих технических систем является использо-
вание при их диагностировании процессов, сопровождающих ре-
жим нормального функционирования таких систем. При этом в
большом числе случаев эти процессы необходимо рассматривать
с учетом их нестационарности. Модели нестационарного процес-
са y(t) обычно представляют собой либо аддитивную смесь ста-
ционарной х(0 и детерминированной /(/) компонент, либо их
мультипликативную смесь:
у(/) = х(/)/(0-
225
Например, первыми описывают случайные процессы с изме-
няющимся математическим ожиданием (трендом), а вторыми —
случайные процессы с изменяющейся дисперсией (т.е. модулиро-
ванные). Такие процессы можно привести к стационарным, если
в первом случае выполнить низкочастотную фильтрацию детер-
минированной компоненты, а во втором — предварительную нор-
мировку реализаций нестационарного случайного процесса по
дисперсии, т.е. осуществить выравнивание по энергии.
Важной информативной характеристикой детерминированных
сигналов при их использовании в диагностике является свойство
периодичности. Периодическим считается сигнал y(t), удовлетво-
ряющий равенству
у(г) = у(/±/пТ)
при любых целых значениях т.
Полигармоническим называют периодический сигнал y(t), име-
ющий разложение в ряд Фурье:
У (*) = У ± тТ) = % + Ck cos(2я#о> + Qk),
2 k=\
где
\2
J у (z)cos Znltfotdt
1° J
rr
Jy(z)sin2n4/'ozd/
1°
A2-|V2
f0= T~x — основная частота (наименьшее общее кратное); отно-
шение любой пары частот fm /fn — рациональное число.
К квазипериодическим относят такой полигармонический сиг-
нал, для которого хотя бы одно отношение пары частот fm/fn яв-
ляется иррациональным:
У (t) = £ ck cos(2nfkt + Qk),
k=0
причем fmlfn — иррациональное число.
Непериодическим полагают ограниченный по времени процесс,
определяемый интегралом Фурье:
у (/) = | Л(у<о)еув*<1«) = V- J |ЖУ<о)| е-^е^ско.
2 л 2 л д,
Отметим, что это преобразование Фурье применяют для квад-
ратично интегрируемых функций.
226
Для многих случайных процессов (примером которых может
быть виброакустический шум двигателя) характерно свойство рит-
мичности. Оно проявляется в виде периодичности одной из его
статистических характеристик: математического ожидания M(t),
дисперсии о2(?) или корреляционной функции — К(х).
С точки зрения различия по размерности сигнал может пред-
ставлять функцию, зависящую не только от временной, но и от
пространственных координат, т. е. в этом случае можно говорить о
соответствующей пространственно-временной структуре сигнала.
Характерным примером пространственно-временного сигнала
может быть многомерный сигнал, компонентами которого явля-
ются измеренные значения вибраций в различных точках диагно-
стируемого объекта. Такой многомерный сигнал представляет со-
бой случайное волновое поле. Случайный характер поля проявля-
ется в неповторяемости конкретных форм колебаний в каждой
его точке на разных отрезках времени.
Нужно заметить, что анализ волновых полей имеет свою спе-
цифику, обусловленную чрезвычайно большим объемом инфор-
мации и трудоемкостью получения соответствующих характерис-
тик, в частности спектров по пространственным частотам и вол-
новым числам.
Подобный подход позволяет использовать в качестве первич-
ной диагностической информации поля различной физической
природы (акустические, вибрационные, тепловые, оптические
и т.д.), имеющие самые разные временные и пространственные
масштабы. Достаточно общим при математическом представлении
таких сигналов является спектральный подход, универсальный
характер которого проявляется прежде всего в том, что независи-
мо от масштабов явлений все волновые поля характеризуются
некоторым распределением интенсивности по времени, простран-
ству, частоте и волновым числам.
10.2. Основные требования к первичной диагностической
информации
Объектами диагностики являются различные по своей слож-
ности и назначению технические системы. К первоочередным
объектам диагностирования можно отнести устройства, выход из
строя которых влечет за собой тяжелые последствия, например
ядерные и химические реакторы, авиационные и судовые двига-
тели, турбины и т.д. Очевидно, что в таких сложных технических
системах количество и вид дефектов измеряются десятками и
сотнями. Поэтому создание контрольно-диагностической систе-
мы, в которой выделяют и классифицируют всевозможные де-
фекты произвольного вида, на практике трудно реализуемо. Од-
227
ним из реальных путей решения этой задачи является агрегирова-
ние возможных дефектов, позволяющее свести задачу поиска кон-
кретного дефекта к задаче поиска дефектного узла. При этом умень-
шается «глубина» поиска дефекта, так как задача диагностирова-
ния в пределе может быть сведена только к указанию дефектной
составной части технической системы с точностью, до которой
определяется место дефекта.
Если же требуется решение задачи диагностики в полном объе-
ме, т.е. необходимо при диагностировании определить место и
вид конкретного дефекта в технической системе, в этом случае
целесообразно строить систему диагностирования как многоуров-
невую. При таком подходе каждому уровню диагностирования со-
ответствует определенная совокупность диагностических призна-
ков, необходимых для определения состояния диагностируемого
объекта с заданной точностью.
На первом уровне диагностирования решают задачу обнаруже-
ния самого факта появления дефекта в диагностируемом объекте.
Второй уровень предполагает локализацию узла, в котором име-
ется дефект. На третьем уровне диагностирования решают задачу
локализации самого дефекта и определения его вида, а также сте-
пени развития.
Очевидно, что при построении такой иерархической системы
диагностики принципиальные отличия задач, решаемых на каж-
дом уровне диагностирования, предполагают различный объем ин-
формации, поступающий на каждый из уровней (рис. 10.1).
Тем не менее в ряде случаев на все три уровня подается один и
тот же состав первичной информации, однако алгоритмы ее об-
работки на каждом из уровней безусловно отличаются (рис. 10.2).
Рис. 10.1. Структурная схема иерархической системы диагностики с разным
объемом первичной информации, поступающей на каждый уровень
228
Объект
диагностирования
Система диагностики
Рис. 10.2. Структурная схема иерархической системы диагностики с одина-
ковым объемом первичной информации на всех уровнях
Отличия в объемах первичной информации или алгоритмах ее
обработки определяются различиями в способах построения ди-
агностических моделей соответствующего уровня.
В диагностических моделях первого уровня, несмотря на раз-
нообразие методов диагностирования и способов реализации ди-
агностических моделей, информативным признаком появления
неисправности в диагностируемом объекте является выход за ста-
тистически обоснованные границы любого контролируемого диа-
гностического параметра. Причем в качестве диагностического па-
раметра могут использоваться как непосредственно измеряемые
на объекте сигналы (например, амплитуда вибрации), так и ре-
зультаты обработки первичной информации (например, величи-
на составляющей спектра сигнала определенной частоты).
Диагностические модели второго и тем более третьего уровней
предполагают использование достаточно большого объема пер-
вичной информации (иногда различной физической природы),
получаемой в разных местах диагностируемой технической систе-
мы. При этом диагностическая модель, являющаяся результатом
обязательной обработки первичной информации, должна содер-
жать такие информативные признаки, которые позволяют решать
задачу распознавания места дефекта с точностью до заданного
узла и его характера также с соответствующей точностью.
В ряде случаев различные по характеру дефекты или однотип-
ные, но находящиеся в разных частях технического устройства,
могут вызывать практически одинаковые изменения информа-
тивных признаков выбранной модели диагностирования. Есте-
ственно, что в этом случае может быть решена только задача
диагностики первого уровня. Для различения дефектов необхо-
димо изменить либо состав первичной информации, либо алго-
ритмы ее обработки (и тем самым изменить вид диагностиче-
ской модели).
229
Одним из достаточно широко распространенных путей упро-
щения систем диагностики, позволяющим значительно умень-
шить объем первичной информации, снимаемой с объекта диа-
гностирования, является отход от «универсальности» при пост-
роении таких систем. В этом случае в перечень элементов, охва-
тываемых диагностическим контролем, включают не все устрой-
ства диагностируемого объекта, а только те из них, которые свя-
заны с безопасностью его работы или лимитируют ресурс, т.е.
являются наиболее «слабыми» узлами устройства. «Слабость» эле-
ментов объекта диагностирования обычно можно определить
расчетным путем, путем стендовых испытаний или анализа ста-
тистических данных, получаемых в процессе эксплуатации од-
нотипных устройств. Эти сведения могут быть использованы уже
на этапе проектирования и разработки конструкций объектов
аналогичного назначения для априорного выделения их «слабых»
узлов.
«Слабость» объекта диагностирования обычно оценивают час-
тотой повторяемости неисправностей определенного вида, а так-
же стоимостными и временными затратами на устранение возмож-
ных неисправностей. Исходя из этих априорных сведений, появля-
ется возможность оптимизации мест обязательного контроля и съема
первичной информации, определения частоты ее съема, глубины
поиска дефекта и других параметров системы диагностики.
При определении вида первичной информации, мест ее съе-
ма и выбора алгоритма ее обработки для получения информа-
тивных диагностических признаков необходимо учитывать также
наличие «слабых» и «сильных» первичных сигналов. Различие меж-
ду ними заключается в том, что в «сильных» диагностических
сигналах полезные составляющие, несущие информацию о со-
стоянии диагностируемого объекта, превалируют над остальны-
ми составляющими. Уровень «слабых» диагностических сигналов,
как правило, сравним по своему проявлению с помехами, дей-
ствующими в технической системе в процессе ее функциониро-
вания. Естественно, что в последнем случае требования к выбору
вида первичной информации и особенно к способам ее обработ-
ки являются более жесткими. Например, при диагностике энер-
гетических агрегатов значительную информационную ценность
представляют колебания и регулярный шум малого уровня, ко-
торые обычно сопровождают режим нормального функциониро-
вания таких агрегатов и, как правило, даже не принимаются во
внимание, скажем, при борьбе с шумом. Однако изменения в
спектрах этих сигналов могут нести информацию о возникнове-
нии тех или иных дефектов.
Безусловно, диагностическая система должна быть достаточно
чувствительной, чтобы выявлять изменения параметров «слабых»
сигналов. Их особой ценностью является также и то, что такие
230
сигналы могут возникать в диагностируемом объекте на самой
ранней стадии зарождения дефекта. Другими словами, появление
дефекта провоцирует и появление некоторого «слабого» сигнала,
обладающего определенной регулярностью, и уже определение
факта наличия такого сигнала может являться диагностическим
признаком.
Если рассмотреть первичную информацию, снимаемую с объек-
тов различной физической природы и назначения, можно выде-
лить несколько общих свойств.
Во-первых, эта информация является косвенной, т.е. для оп-
ределения текущего состояния диагностируемого объекта не про-
водят измерение конкретных дефектов, а используют сигналы,
либо поданные на вход объекта (режим тестовых испытаний), либо
возникшие внутри него в процессе функционирования, прошед-
шие до точки съема и, следовательно, несущие информацию о
динамике объекта на пути следования этих сигналов.
Например, к «традиционным» дефектам, возникающим в тех-
нических системах в процессе их эксплуатации, относятся трещи-
ны и всякого рода износ, в том числе эрозийный, а также корро-
зийные и усталостные изменения и т.п. Однако непосредственное
наблюдение и измерение подобного рода дефектов в большинстве
случаев либо невозможно, либо является чрезвычайно трудоем-
кой задачей.
Именно по этой причине при разработке диагностических ал-
горитмов необходимо учитывать возможности измерения первич-
ных сигналов, их доступности как в. смысле принципиальной воз-
можности измерения определенного физического параметра, так
и в смысле технической возможности съема исходной информа-
ции в требуемом месте объекта диагностирования.
Таким образом, в процессе диагностирования оценку состоя-
ния технической системы приходится проводить по результатам
обработки «доступных» физических величин, т.е. тех «доступных»
первичных сигналов, изменение параметров которых имеет чет-
кую корреляцию с изменением параметров технической систе-
мы, которые необходимо контролировать.
Из изложенного выше также вытекает и второе общее свой-
ство — неполнота первичной информации, т.е. невозможность по-
лучения всех необходимых сведений в любой желаемой точке ди-
агностируемого объекта.
В-третьих, информация является неопределенной из-за влия-
ния помех, которые неизбежны в любой функционирующей сис-
теме, и неточности математического описания диагностируемого
объекта ввиду того, что любая математическая модель является
приближением той или иной степени грубости.
Таким образом, предварительное изучение объекта диагно-
стирования в целях оптимизации состава первичной информа-
231
ции и выбора точек ее съема на основе изложенных выше требо-
ваний позволяет, используя достаточно известные методы обра-
ботки информации, решить задачу оценки текущего состояния
объекта с высокой степенью достоверности.
10.3. Обработка измерений и выделение информативных
признаков
Получение диагностической информации из сигналов, снима-
емых с контролируемого объекта, предполагает математическую
обработку этих сигналов, которую условно можно разделить на
два этапа. На первом этапе отделяют закономерные изменения
измеряемых величин от случайных, на втором — разделяют зако-
номерные изменения, связанные с дефектами и неисправностя-
ми, и изменения, вызванные влиянием внешних условий и дру-
гих факторов. Иногда при практической реализации в диагности-
ческих системах эти этапы могут быть совмещены, т. е. выделение
«полезного» сигнала (или какой-то его компоненты) одновременно
означает и получение необходимого диагностического признака.
Однако в общем случае предварительная обработка измеряемого
сигнала (фильтрация, нормализация и т.п.) является необходи-
мой процедурой перед реализацией алгоритмов получения соот-
ветствующих характеристик сигналов, так как в условиях нормаль-
ного функционирования технических объектов измерения произ-
водят на фоне достаточно сильных шумовых помех.
При аддитивном взаимодействии регулярной составляющей и
помехи ее выделение из измеренного сигнала не представляет
принципиальных трудностей и осуществляется путем примене-
ния самых разнообразных фильтров: нижних или верхних частот,
полосовых фильтров с постоянной абсолютной или относитель-
ной полосой.
Полодовая фильтрация, при которой выделяют только опреде-
ленный частотный диапазон, или избирательная фильтрация, при
которой происходит подавление или усиление отдельных частот-
ных компонент сигнала, может значительно уменьшить размер-
ность вектора диагностических признаков и тем самым упростить
решение задачи диагностики на этапе распознавания состояния.
Практически эти задачи решаются путем применения самых
разнообразных фильтров, как аналоговых, так и цифровых. На
рис. 10.3 показаны амплитудно-частотные характеристики анало-
говых фильтров |Иф(усо)|. Сплошной линией изображены характе-
ристики идеальных фильтров, пунктирной — физически реализу-
емых. Для фильтрации сигналов применяют и более сложные филь-
тры, в частности спектральные анализаторы с набором аналого-
вых полосовых фильтров (рис. 10.4).
232
|^ф|
W0
|^ф|
^0
|^ф|
----------ПТ--------
/
/
/
/
О ®min ®
в г
Рис. 10.3. Амплитудно-частотные характеристики аналоговых фильтров:
а — полосовая фильтрация; б — фильтрация с подавлением в полосе; в — низко-
частотная фильтрация; г — высокочастотная фильтрация
Значительно сложнее обстоят дела с выделением из анализи-
руемого сигнала его информативной части при мультипликатив-
ном характере взаимодействия помехи и полезной составляющей
этого сигнала.
Как правило, математическую обработку таких сигналов про-
водят исходя из представления, что мультипликативность взаи-
модействия имеет вид, характерный для одного из известных ви-
дов модуляции (амплитудной, частотной или фазовой). Методы
анализа модулированных сигналов широко известны.
Например, для обнаружения дефектов контактирующих поверх-
ностей анализируют сигнал, представленный узкополосным про-
цессом в виде [4]:
y(t) = A(t)cos[2nf0t + <р(/)],
где A(t), <p(f) — медленно меняющиеся по сравнению с cos(2n/0Z)
амплитуда и фаза процесса соответственно; f0 — средняя частота
сосредоточения энергетического спектра анализируемого сигнала.
С учетом того, что диагностическая информация содержится в
амплитудной и фазовой составляющих этого сигнала, задачу ее
233
1/2|
о
\ Рис. 10.4. Набор аналоговых полосовых фильтров
выделения решают с помощью специальных амплитудного и фа-
зового детекторов. При этом операцию детектирования целесооб-
разно осуществлять после предварительной полосовой фильтра-
ции сигнала.
В ряде случаев задачу диагностики решают, используя для вы-
деления информативной составляющей из смеси с помехой мето-
ды синхронной обработки сигналов. Исходя из сути этих методов,
требующих перемножения анализируемого сигнала с опорным,
становится ясной необходимость наличия в диагностической си-
стеме некоторых опорных сигналов, имеющих жесткую привязку
к процессам, происходящим в контролируемом объекте. Особен-
но эффективным оказывается применение синхронной обработ-
ки сигналов при диагностировании сложных машин и механиз-
мов ударного действия, когда для выделения информативных при-
знаков требуется анализ импульсных возбуждений с большим пе-
риодом повторения или когда возникают трудности непосредствен-
ного наблюдения сигнала, возбуждаемого диагностируемым уз-
лом из-за наложения ударных импульсов от других узлов. Напри-
мер, при диагностике поршневых машин синхронизацию вибро-
сигналов можно осуществить частотой вращения коленчатого вала,
при этом за начало отсчета времени обычно берут положение пор-
шня в верхней точке одного из цилиндров. Применение временной
селекции позволяет не только отделить полезный сигнал от поме-
хи, но и определить ряд параметров, которые могут быть исполь-
234
зованы в качестве диагностических признаков для оценки теку-
щего состояния.
В диагностике находят применение и другие методы синхрон-
ной обработки сигналов [7]. В частности, рассмотрено примене-
ние метода выделения составляющих от быстрых переходных про-
цессов с малой частотой повторения. Суть этого метода заключа-
ется в разложении сигнала на периодические составляющие про-
извольной формы, но с конкретными частотами:
п
где v,(/) — периодические сигналы; z(t) — случайные составля-
ющие.
Составляющие у, описывают только двумя параметрами — ча-
стотой fi и мерой интенсивности, в качестве которой рекоменду-
ют использовать среднеквадратическое значение
ч Л
Si = fi J
Разложение y(t) на yft) не является ортогональным даже в
случаях, когда частоты f не имеют общей кратной частоты, что
обусловлено появлением перекрестных произведений при фор-
мировании более чем одного у((/).
Определение любой функции рекомендуется проводить
по методике [8]. Ее суть заключается в усреднении последователь-
ных отрезков сигнала продолжительностью в один период. В этом
случае среднее любого сигнала, некогерентного с частотой f, бу-
дет стремиться к нулю, а когерентные части останутся неизмен-
ными. Каждую функцию у,- определяют отдельно путем усредне-
ния по периодам соответствующей частоты, после чего произво-
дят вычисление St отфильтрованной составляющей. Такая методи-
ка обработки сигналов позволяет получить зависимость £(/), вид
и параметры которой могут являться диагностическими призна-
ками состояния контролируемого объекта.
На рис. 10.5 показана последовательность импульсов, возбуж-
даемых локальными дефектами подшипника. Результаты обработ-
ки по рассмотренной методике отражены на рис. 10.6, на котором
ясно видно наличие периодической составляющей около 205 Гц,
что и позволяет выявить имеющийся дефект.
Рис. 10.5. Последовательность импульсов, I
возбуждаемых локальными дефектами под- Лк) к)
шипников
235
Рис. 10.6. Результаты обработки сигналов, показанных на рис. 10.5
Задачу фильтрации сигналов в проблеме диагностики состоя-
ния технических систем можно рассматривать шире, чем просто
удаление из анализируемого сигнала высокочастотной помехи,
например. Как известно, методы фильтрации успешно использу-
ют и при решении задач сжатия информации. При этом под сжа-
тием информации понимают устранение избыточности в анализи-
руемой информации, т. е. сокращение размерности пространства
исходного описания. Поскольку обрабатываемая информация имеет
обычно случайный характер, сжатие случайных процессов осуще-
ствляют в целях повышения либо достоверности формируемых ста-
тистических характеристик, либо информативности данных, либо
скорости обработки. Все эти задачи, безусловно, являются акту-
альными и в диагностике технических систем, особенно на по-
следнем этапе — при решении задач классификации состояний.
Эффективность решения задачи сжатия информации опреде-
ляется характером и степенью полноты априорных сведений об
анализируемом процессе, что и позволяет правильно выбрать ме-
тод сжатия. Наиболее распространенными методами сжатия явля-
ются спектральные, что обусловлено линейностью и ортогональ-
ностью спектральных преобразований, их хорошими сглажива-
ющими свойствами. При этом важное значение имеет выбор под-
ходящей системы базисных функций, что обеспечивает по вы-
бранному критерию приближения наименьшее число коэффици-
ентов разложения значимого уровня. Алгоритм сжатия информа-
ции в этом случае состоит из двух этапов. На первом этапе исход-
ную информацию отображают в спектральную область. На втором
этапе по заданному критерию отбрасывают компоненты малого
уровня, т.е. устраняют избыточность информации путем сокра-
щения размерности ее спектра.
236
При решении задач сжатия информации без последующего ее
восстановления (а именно такое сжатие используют при решении
задачи классификации в проблеме диагностики состояния техни-
ческой системы) наряду с линейными ортогональными преобра-
зованиями применяют также и нелинейные операции типа вы-
прямления, квадрирования, логарифмирования, объединения в
новое множество и т.д.
Сложность выбора и извлечения информативных признаков
обусловлена чаще всего высокой размерностью исходного описа-
ния. Спектральные преобразования по различным системам орто-
гональных функций позволяют добиться существенного сниже-
ния размерности путем перераспределения дисперсий компонент
разложения в спектральной области, которое можно сделать су-
щественно неравномерным именно в этой области. Другими сло-
вами, с помощью спектрального подхода создается возможность
группировки или концентрации существенных свойств объектов
распознавания.
10.4. Численные характеристики процессов
и их использование в задачах диагностики
Первичная информация о процессах, протекающих в диагно-
стируемой технической системе, также как и ее характеристи-
ки, служащие основой для формирования диагностических при-
знаков, являются некоторыми параметрами, имеющими опре-
деленную размерность, связанную с измеряемой физической
величиной: температурой, давлением, смещением, ускорением
и т.п. Однако привязка к абсолютным значениям измеряемых
параметров не всегда удобна. Очевидно, что определенные пре-
имущества может дать использование некоторых безразмерных
характеристик наблюдаемых процессов, которые были бы инва-
риантны к виду диагностируемого объекта и определялись бы
только видом неисправности. Такие численные характеристики,
называемые дискриминантами, достаточно широко используют
в радиотехнике, электротехнике и других областях обработки сиг-
налов, а также в области контроля и диагностики технических
систем.
Если наблюдаемый в технической системе сигнал x(t) пред-
ставляет стохастический процесс с одномерной плотностью ве-
роятностей мгновенных значений р{х), измеряемую амплитуду
процесса можно представить как момент /-го порядка:
J и' p(x)dx
237
или во временной области в виде
Г1£
-|1//
|/
где xt — среднее значение амплитуды процесса как корень 1-й
степени из /-го момента [11].
В зависимости от значения / получаем:
• I = 1/2, X/ = 4х — корень квадратный из амплитуды;
• I = 1, X/ = х — среднее значение амплитуды;
• / = 2, X/ = х — среднее квадратичное значение амплитуды;
• / -> о®, X/ = х — пиковое значение амплитуды.
Во временной области эти параметры определяются следу-
ющими выражениями:
х = J|x(Z)|d/,
1 о
г 1т Т/2
х= — Jx2(/)d/ ,
. о
х = flmaxIxfOl}, t g (О, Т),
где Е — усреднение по максимальным значениям процесса |х(/) |.
Для одного и того же процесса х(/) каждый из этих параметров
ведет себя по-своему [4]. При использовании первого параметра
(корня квадратного из амплитуды) для характеристики, напри-
мер, колебательного процесса увеличивается значимость компо-
нент с малой колебательной энергией. Все компоненты равно-
значны при использовании средней амплитуды. Напротив, при
применении для характеристики процесса средней квадратичес-
кой амплитуды возрастает значимость компонент с большей ко-
лебательной энергией. Величина х как усредненная мера значи-
мости максимальных выбросов наблюдаемого процесса использу-
ется на практике в основном для оценки характеристик импульс-
ных процессов, где энергетическая значимость выбросов невелика.
В диагностике можно использовать различные комбинации рас-
смотренных выше параметров — безразмерных амплитудных дис-
криминантов, определяемых в форме отношения [11]:
238
->i//
j |xf p(x)dx
d~
- i1/'" ’
J |x|m p(x)dx
В частных случаях (в зависимости от значений I и т) получают
комбинации параметров, удобные для использования в диагно-
стических приложениях:
• К = х/х — коэффициент формы (/ = 2, т = 1);
• С = х/х — пик-фактор (/ -> ~, /и = 2);
• J = х/х — коэффициент динамичности или импульсный ин-
декс (/ -> °°, т - 1);
• L = х / 4х — коэффициент фона или коэффициент «люф-
та» (/ —> оо, т = 1/2).
Значения безразмерных дискриминантов для некоторых сигна-
лов приведены в табл. 10.1.
Важным свойством безразмерных дискриминантов, которое мо-
жет быть, в частности, использовано при вибродиагностике для
оценки ударов, возникающих в кинематических парах машин,
является их чувствительность к присутствию в наблюдаемом про-
цессе импульсных составляющих. На рис. 10.7 приведены резуль-
таты исследований вибропроцессов, имеющих периодический ха-
Таблица 10.1
Безразмерные дискриминанты для сигналов разного типа
Тип сигнала Дискриминанты
К С J L
Синусоидальный л 2?2 V2 л 2 J3
Треугольный пилообразный 2 № V3 2 2,25
Случайный гауссовский процесс для различных вероятностей пи- ковых амплитуд: 0,3200 0,0460 0,0027 0,0010 0,0001 1,0 2,0 3,0 3,3 3,9 — 1,253 2,506 3,759 4,135 4,887 1,445 2,890 4,335 4,769 5,636
239
Рис. 10.7. Результаты исследования вибропроцессов, имеющих периоди-
ческий характер
рактер [11]. Первый случай (дискриминант с индексом 1) соот-
ветствует появлению на периоде вибросигнала двух дополнитель-
ных симметричных ударных импульсов, второй (дискриминант с
индексом 2) характеризует вибрации с ударными импульсами,
случайно распределенными на том же периоде.
Как видно из рис. 10.7, коэффициент формы К и пик-фактор С
почти не различают этих двух случаев и нечувствительны к отно-
шению амплитуды дополнительного импульса к амплитуде ос-
новного сигнала, характеризуемого коэффициентом а.
При линейном изменении масштаба процесса безразмерные
дискриминанты не зависят от амплитуды и инвариантны к часто-
те. Это позволяет рассматривать изменение безразмерных дискри-
минантов вибропроцессов при изменении режимов работы в ка-
честве диагностического признака, характеризующего состояние
наблюдаемого объекта или изменения параметров сил, вызываю-
щих контролируемую вибрацию. Например, при нормальном со-
стоянии подшипников качения пик-фактор виброускорений ра-
вен 4—6; в начальный период появления дефектов он возрастает
до 6—8; в случае интенсивного развития дефекта подшипника
этот дискриминант достигает значений порядка 8 — 20, а затем
может уменьшаться [11].
По аналогии с рассмотренными выше амплитудными дискри-
минантами можно ввести количественные характеристики спект-
рального состава — частотные дискриминанты [11].
Средняя частота процесса, или средняя частота пересечений
нуля, определяется в виде отношения амплитудных дискрими-
нантов первой и нулевой производных процесса:
240
2кх’
где х* — первая производная по времени процесса х.
Информацию о ширине спектра процесса дает гармонический
индекс, характеризующий разброс компонент процесса относи-
тельно средней частоты:
Для гармонического процесса = 1, для «белого шума» = 0.
Поэтому гармонический индекс может служить диагностическим
признаком дефектов, появление которых вызывает расширение
спектра наблюдаемого сигнала. Например, его уменьшение может
характеризовать появление такого дефекта как износ кинемати-
ческих пар, а величина уменьшения может быть информативным
признаком степени изношенности.
Используя различные характеристики сигналов, можно конст-
руировать размерные и безразмерные дискриминанты, которые
могут оказаться более информативными и менее чувствительны-
ми к помехам, чем исходные характеристики. Так, например, от-
ношение спектров ударных процессов дает дискриминант как без-
размерную функцию частоты более чувствительную к малым ис-
кажениям формы импульса, чем спектр процесса, определенный
преобразованием Фурье.
Темы для повторения
1. Виды сигналов, применяемых при решении задач диагностики.
2. Математические модели сигналов, используемых при решении за-
дач диагностики.
3. Особенности построения иерархических систем диагностики.
4. Требования, предъявляемые к диагностическим моделям в зависи-
мости от их уровня.
5. Понятие «слабости» элементов объекта диагностирования и «слабо-
сти» первичных сигналов, их учет при создании систем диагностики.
6. Методы выбора и извлечения диагностических признаков из пер-
вичной информации.
7. Использование безразмерных характеристик наблюдаемых процес-
сов для решения диагностических задач.
Глава 11
СПЕКТРАЛЬНЫЕ МЕТОДЫ ДИАГНОСТИКИ
ТЕХНИЧЕСКИХ СИСТЕМ
11.1. Вибрационные процессы в технических системах
Среди многих методов диагностики текущего состояния тех-
нических систем в режиме нормального функционирования виб-
рационная диагностика является одним из перспективных. Объяс-
няется это в первую очередь тем, что функционирование многих
технических устройств сопровождается возбуждением в них коле-
баний, распространяющихся по конструкциям этих устройств;
подобные колебательные процессы принято называть вибрацион-
ными. Учитывая прохождение вибрационных сигналов от источ-
ников их зарождения до точек съема, можно отметить их потен-
циально высокую информативность, так как параметры вибраци-
онных сигналов достаточно адекватно отражают состояние эле-
ментов и узлов диагностируемой системы, расположенных на пути
следования этих сигналов.
Однако необходимо также отметить и то, что в общем случае
сама процедура вибрационной диагностики не является триви-
альной задачей. Дело в том, что оценка состояния технической
системы производится по косвенным признакам, а именно по
изменению некоторых свойств вибропроцессов. В то же время от-
казы и дефекты, возникающие в технической системе, могут быть
связаны с вибропроцессами самым различным образом. В частно-
сти, сами дефекты могут быть причиной возбуждения конструк-
ции или изменения характера существующей вибрации. Кроме того,
при вибродиагностике необходимо принимать во внимание также
следующее обстоятельство, которое влияет на достоверность по-
лучаемых результатов: вибрационные процессы могут изменяться
по мере эксплуатации технического объекта даже при отсутствии
явно выраженных неисправностей, а вследствие ряда необрати-
мых процессов, происходящих в технических объектах, — износа
взаимодействующих кинематических пар, ползучести материала
сильно нагруженных элементов конструкции, коррозийного и
эрозийного износа деталей и др. [8].
Основой современной вибродиагностики является функцио-
нальный подход, предполагающий недоступность для исследова-
теля точки приложения возбуждающих сил и исключающий, как
242
правило, тестовые воздействия на исследуемый объект. Источни-
ком или генератором возбуждения вибрационного поля работаю-
щего технического объекта могут быть дисбаланс ротора, турбу-
лентность цотока газа или жидкости, кинематические погрешно-
сти изготовления и сборки, зазоры, изменения частоты и геомет-
рии контактирующих поверхностей и многие другие причины.
Характер вибрационных процессов различен в зависимости от
частотного диапазона, в которых они наблюдаются. Это предопре-
делило разбиение всего частотного диапазона, в котором возмож-
но возникновение вибраций, на несколько поддиапазонов частот:
• низкие (от 0 до 200 — 300 Гц);
• средние (от 200 — 300 Гц до 1 — 2 кГц);
• высокие (от 1 — 2 до 10 — 20 кГц);
• сверхвысокие (от 10—20 до 100—200 кГц).
Низкочастотная вибрация вызывается, как правило, неуравно-
вешенностью вращающихся масс и периодическими силами, со-
здаваемыми рабочим процессом функционирующего объекта.
Именно поэтому вибрационные колебания в этом поддиапазоне
имеют преимущественно гармонический характер.
Причинами вибрации среднечастотного поддиапазона в боль-
шинстве механизмов и устройств являются нарушение геомет-
рии кинематических пар, динамическое взаимодействие элемен-
тов технического устройства между собой и окружающей средой
и т.д. В этом поддиапазоне колебания носят квазиполигармониче-
ский характер. Кроме того, в большей степени для этого подди-
апазона характерно наличие случайного возбуждения, являюще-
гося результатом воздействия технологических, кинематических,
регулировочных и других случайных факторов.
Колебания машин и механизмов в поддиапазоне высоких час-
тот представляют собой упругие волны, распространяющиеся по
конструкции, и их характерной особенностью является то, что,
во-первых, они несут небольшую часть энергии всего частотного
спектра, и, во-вторых, при движении по конструкции эти волны
подвергаются сильному демпфированию.
Помимо перечисленных выше причин, вызывающих вибро-
процессы в машинах и механизмах, в них могут возбуждаться ко-
лебания, определяемые параметрами самой конструкции, т. е. ко-
лебания на Собственных частотах.
Очевидно, что как при решении задачи диагностики, так и в
процессе эксплуатации при доводке машин и механизмов в боль-
шинстве случаев предполагается определение основных источни-
ков возмущающих сил, порождающих вибрационные процессы в
объекте.
Остановимся на наиболее характерных силах, возбуждающих
вибрацию в технических устройствах, которые могут быть меха-
нического, магнитного и аэродинамического происхождения.
243
Источниками механической вибрации являются неуравновешен-
ные вращающиеся или колеблющиеся детали, опоры, зубчатые
передачи, токопередающие узлы и другие элементы технических
устройств. Неуравновешенность вращающихся элементов обычно
вызывает вибрационные процессы в виде колебаний с частотами,
кратными частоте вращения. Так, например, в турбомашинах ос-
новными источниками вибрации являются неуравновешенные
силы инерции, возбуждающие поперечные колебания роторов на
частоте вращения Д, и ее гармониках. Кроме того, в турбоагрега-
тах наблюдаются полигармонические колебания на кратных час-
тотах
/= kzfsp,
где k = 1, 2, 3, ...; z — число лопастей винта турбины, компрессо-
ра и т.д.
В электрических машинах из-за ударных и фрикционных взаи-
модействий щеток с пластинами коллектора возникают колеба-
ния, параметры которых зависят от частоты вращения, числа пла-
стин, технологических неточностей изготовления и сборки. В ре-
дукторе основными источниками вибрации являются опоры и зуб-
чатые колеса, поэтому вибрации от этих источников наблюдают-
ся на так называемых «зубцовых частотах», также кратных частоте
вращения.
Что касается механической вибрации в двигателях внутреннего
сгорания, то к основным причинам ее возникновения можно от-
нести силы инерции возвратно-поступательно движущихся и вра-
щающихся частей, шум всасывания, выхлопа газов и пр.
Возникновение магнитной вибрации и шума в технических ус-
тройствах обусловлено периодическим изменением электромаг-
нитных усилий в воздушном зазоре электромагнитной системы
устройства, отклонениями формы и расположения ее элементов.
Параметры колебаний определяются как параметрами магнит-
ной системы, частотами стационарного движения, так и техно-
логическими дефектами изготовления и сборки магнитной сис-
темы [25].
Основными источниками аэродинамической (гидродинамической)
вибрации являются лопаточные узлы технических устройств — винт,
вентилятор, компрессор, турбина. Винтовая вибрация возникает
из-за неидентичности аэродинамических характеристик лопастей
винта и неравномерности потока среды, обтекающего винт, и оп-
ределяется отклонением углов атаки лопастей от номинальных. Если
неидентичность аэро- и гидродинамических характеристик лопас-
тей винта приводит к появлению вибрации с частотой первой гар-
моники, то неравномерность потока приводит к появлению коле-
баний с частотами кратностью z = 2, 3, ... [7]. Каждая i-я рабочая
ступень генерирует вибрацию, частоты которой равны частоте вра-
244
щения узла и частоте в iz раз большей. При фиксированном угле
установки лопаток интенсивность вибрации пропорциональна квад-
рату частоты вращения и плотности среды [8].
На практике возникающие в функционирующем техническом
объекте колебания от вышеперечисленных факторов, т.е. механи-
ческая, магнитная и аэродинамическая вибрации, взаимодействуют
между собой, и в результате в объекте возникает вибрация в ши-
роком спектре частот с различными амплитудами.
Кроме того, каждый из элементов в диагностируемой техничес-
кой системе может вибрировать на одной или нескольких дискрет-
ных частотах, причем различные элементы могут возбуждаться на
разных частотах. Некоторые частоты являются результатом механи-
ческого резонанса различных частей машины из-за возбуждения
периодической вынуждающей силы. Взаимодействие всевозможных
колебаний, возникающих в функционирующей сложной системе,
приводит к сложной волновой картине в точках получения первич-
ной информации. Более того, изменение вибрации в наблюдаемом
диапазоне частот может также происходить и вследствие измене-
ния характера и параметров вибрационных сигналов в других диа-
пазонах частот, которые в данном случае могут рассматриваться
как сумма аддитивных или мультипликативных помех.
Именно по этой причине при определении текущего состоя-
ния диагностируемой системы, особенно при решении задачи
классификации дефектов, как правило, необходимо проводить
сложный анализ вибрационных сигналов.
11.2. Диагностические признаки вибрационных процессов
Вибрационные процессы в технических системах — непосред-
ственный результат взаимодействия отдельных узлов и механиз-
мов, образующих эту систему. Как уже отмечалось выше, вибра-
ционный сигнал является носителем достаточно полной диагно-
стической информации о текущем состоянии элементов и систе-
мы в целом, причем извлечение этой информации из вибросиг-
нала может быть осуществлено различными методами в зависи-
мости от найденных закономерностей воздействия дефектов сис-
темы на характеристики вибрационных процессов, т.е. от вида
диагностической модели.
Однако задача формирования и измерения диагностических
признаков является непростой и ее сложность во многом объяс-
няется отсутствием априорной информации о возбуждающих воз-
действиях и, следовательно, невозможностью в большинстве слу-
чаев использовать такие традиционные для технических систем
управления математические модели, как передаточные функции,
дифференциальные уравнения и некоторые другие, коэффици-
245
енты которых в этом случае являлись бы диагностическими при-
знаками. Поэтому обычно оценку состояния технических систем
приходится проводить только по выходным колебательным про-
цессам, причем в условиях, когда анализируемый сигнал наряду
с полезной информацией о состоянии системы содержит и массу
ненужной, вследствие чего проблема формирования диагности-
ческих признаков неразрывно связана и с проблемой выделения
полезного сигнала на фоне помех. В этих целях возможно исполь-
зование всех известных операций, повышающих отношение
«сигнал:помеха», таких, например, как фильтрация, стробиро-
вание, детектирование, синхронное накопление и т.д.
В простейших случаях процедура диагностики опирается на ис-
пользование детерминированной модели вибрационного сигнала,
когда последний представляют периодическими функциями, обу-
словленными вращением или периодическим соударением элемен-
тов технической системы. При этом в качестве информативных диа-
гностических признаков используют амплитуду, продолжительность
и момент появления импульсов, частоту, амплитуду и фазу гармо-
нического сигнала. Такой подход дает неплохие результаты для срав-
нительно низкооборотных машин с небольшим числом источни-
ков возбуждения колебаний. Например, в роторных механизмах в
низкочастотном диапазоне (до 200—300 Гц) одной из основных
частот возбуждения является частота вращения /вр ротора
Увр = ®вр/(2л),
где <овр — угловая частота вращения ротора.
Колебания механизмов х(1) в этом диапазоне частот имеют гар-
монический вид, т.е. x(t) = acosroBpZ, и обусловлены, главным об-
разом, неуравновешенностью вращающихся масс, причем энергия
таких колебаний достаточно велика, поэтому они хорошо распро-
страняются по конструкции механизма [4]. Информативным пара-
метром в такой диагностической модели может служить значение
амплитуды колебаний (или ее приращение) на роторной частоте.
Изменение уровня вибрации при появлении трещин в валах
некоторых роторов турбин низкого давления турбоагрегата мощ-
ностью 500 МВт иллюстрирует рис. 11.1. Запись вибрации осуще-
ствлялась во время выбегов турбины, так как измерение вибра-
ции под нагрузкой не дало положительных результатов. Из рисун-
ка видно, что появление трещин привело к резкому возрастанию
вибрации (кривая 2) по сравнению с результатами, полученны-
ми при отсутствии дефекта (кривая 7).
В общем случае периодическую вибрацию можно рассматри-
вать как колебательное движение наблюдаемого технического
объекта относительно положения равновесия. Следовательно, для
ее описания вполне достаточно двух параметров: периода Т или
частоты колебаний/= l/Т и амплитуды колебаний а (рис. 11.2).
246
14
Рис. 11.1. Вибрационный процесс в турбоагрегате (запись во время выбе-
га турбины):
1 — при отсутствии дефектов; 2 — при появлении трещин
В практике вибродиагностики в качестве информативных пара-
метров наиболее часто используют:
• пиковое значение амплитуды = а, характеризующее макси-
мальный размах колебаний относительно положения равновесия;
• среднее абсолютное значение амплитуды
Рис. 11.2. Модельное представление периодической вибрации техниче-
* ского объекта
247
• среднее квадратичное значение амплитуды
Х.кв = (l/T)Jx2(i)dt.
V о
Однако большинство вибрационных процессов в технических
устройствах не могут быть достаточно точно представлены в фор-
ме синусоидальных колебаний. При этом если решение диагнос-
тической задачи на базе использования гармонической модели
колебаний в смысле выявления появившегося в объекте дефекта
еще иногда и может быть найдено, то задача классификации де-
фектов обычно оказывается неразрешимой.
Так, например, увеличение амплитуды колебаний на частоте
вращения ротора может быть вызвано отклонением от соосности
валов, нарушением геометрии узлов вращения и периодическими
силами, создаваемыми рабочим процессом. Все эти источники воз-
буждения, вызывающие низкочастотные колебания роторного ме-
ханизма с одной и той же частотой fBp, являются когерентными и
не поддаются разделению с помощью каких-либо математических
операций, так как каждый из источников неуравновешенности за-
ставляет колебаться этот механизм как единое целое.
Поэтому для того чтобы определить дефекты механизма, вы-
звавшие изменение амплитуды на оборотной частоте, необходи-
ма дополнительная информация, которая, в частности, может быть
Таблица 11.1
Диагностическая карта неисправностей
Дефект Основные частоты Примечание
Неуравновешенность ротора /вр Наиболее вероятная при- чина увеличения вибро- акгивности механизма
Отклонение от соосности валов Обычно /вр, часто 2/щ,, иногда 3/вр и 4/вр Обычный дефект
Зазор в подшипнике скольжения Субгармоники /вр, особенно Уг/врИли 73/вр Дефект проявляется толь- ко на рабочей скорости и рабочей температуре
Механический люфт 2/вр Присутствуют также суб- и комбинационные гар- моники
Вибрация, вызы- ваемая электриче- скими силами /вр или сумма/вр и 2/вр, синхронизиро- ванная частотой * электродвигателя Исчезает при отключе- нии электродвигателя
248
Рис. 11.3. Спектр вибросигнала, являющего-
ся осциллирующими затухающими колеба-
ниями
IWI
представлена в виде диагностической карты неисправностей [4],
пример которой приведен в табл. 11.1.
Из табл. 11.1 видно, что л-мерный вектор диагностических при-
знаков формируется из амплитуд компонент kfBp. Но этого может
оказаться недостаточно и тогда необходимо использовать допол-
нительную информацию, содержащуюся в других частотных диа-
пазонах колебаний механизма, например в зоне среднечастотных
колебаний.
Вибрационные процессы, спектр которых занимает среднечас-
тотную область, возникают обычно как ответ конструкции на
пульсации типа ударных возмущений, причина появления кото-
рых — попадание локального дефекта в зону контакта или в мо-
мент схватывания контактирующих поверхностей. Последователь-
ность пульсаций и вызывает отклик механической системы на
собственной частоте дефектного узла в виде осциллирующих за-
тухающих колебаний. Типичный спектр такого вибросигнала, при-
веденный на рис. 11.3, состоит из набора комбинационных частот
®с ± кО (сос — собственная частота системы; Q — частота повторе-
ния дефекта) с огибающей в форме резонансной кривой гармо-
нического осциллятора.
Если система имеет п степеней свободы, то в ней наблюдается
отклик на всех собственных частотах. Это приводит к тому, что в
зоне среднечастотных колебаний (от 200—300 Гц до 1 — 2 кГц)
вибрационные процессы в окрестностях частот вынужденных ко-
лебаний представляют результат воздействия нескольких локаль-
ных вибропроцессов. Выделение информативных компонент диаг-
ностического сигнала в этом случае требует применения доста-
точно сложных алгоритмов обработки сигналов, например гре-
бенчатой фильтрации синхронно с частотой вращения дефектной
детали.
Однако чем выше собственная- частота узла технического
объекта, тем меньше проявляется описанное выше взаимодей-
ствие. В диапазоне частот выше 2 кГц и до 10—20 кГц, в котором
временное и пространственное затухание волновых процессов до-
статочно велико, отклик на подобного рода возмущения возника-
ет в основном лишь в ближайших к источнику возбуждения узлах.
Это обстоятельство позволяет упростить выделение информатив-
ного признака дефекта, так как наибольшая амплитуда отклика в
249
этом случае будет наблюдаться только на одной из собственных
частот дефектного узла.
Из изложенного выше становится ясной важность методов спек-
трального анализа вибропроцессов для формирования диагности-
ческих признаков. В этой связи необходимо обратить внимание на
следующее обстоятельство. Информативные (полезные) состав-
ляющие анализируемых вибрационных сигналов и неинформатив-
ные составляющие (помехи) этих сигналов имеют сложные спек-
тры, занимающие широкий диапазон частот и, следовательно,
для выделения диагностических признаков (полезных составляю-
щих спектра) необходимо использовать частотно-избирательные
системы с высокой разрешающей способностью. При этом, как
правило, приходится учитывать тот факт, что «опорные» частоты
при диагностировании функционирующего объекта могут изме-
няться в довольно широких пределах, например вследствие изме-
нения частоты вращения роторов, что вынуждает осуществлять
синхронную перестройку частотно-избирательных систем, при-
чем в достаточно широком диапазоне [8].
Исходя из физики явлений, протекающих в технических си-
стемах, возникающие в них колебательные процессы, являющие-
ся носителями информации о текущем состоянии наблюдаемой
системы, можно представить в виде двух составляющих, а имен-
но, в виде собственных и вынужденных колебаний системы. Вполне
естественно, что характер и объем информации, содержащейся в
каждой из этих составляющих, должен быть различным. Действи-
тельно, для того чтобы заставить конструкцию вибрировать, тре-
буется достаточно большая мощность источника, вызывающего
эти вибрации. Поэтому амплитуды вынужденных колебаний обычно
содержат информацию лишь о грубых изменениях параметров тех-
нического состояния, фактически о предаварийной ситуации. Что
касается «окраски» вынужденных колебаний и колебаний в зоне
собственных частот конструкции, т. е. глубины амплитудной или
фазовой модуляции, соотношений между амплитудами гармоник,
характеристик случайных выбросов в резонансных зонах и других
параметров вибросигналов, все это является источником инфор-
мации о наличии дефектов на ранней стадии их развития. Отсюда
ясно, что в общем случае амплитудно-частотный состав колеба-
ний еще не является диагностической информацией. Это своего
рода фон, на котором развиваются изменения свойств вибросиг-
нала при появлении неисправности. Именно эти изменения тре-
буется выявлять, именно они являются диагностической инфор-
мацией.
В ряде случаев в качестве информативного диагностического
признака возможно использование изменения пиковых значений
спектральных плотностей мощности вибросигнала конструкции
при появлении в ней дефекта. На рис. 11.4 приведены результаты
250
Рис. 11.4. Пиковые значения спектральных плотностей мощности вибро-
сигнала конструкции:
а — без дефектов; б — при наличии дефектов
диагностических испытаний одного из широко применяемых в
различных технических системах элемента — редуктора. В процес-
се этих испытаний было выявлено, что при появлении неисправ-
ности в редукторе максимальные значения спектральной плотно-
сти в некоторых полосах частот возрастают. Кроме того, оказа-
лось, что удобным и достаточно информативным диагностиче-
ским параметром является отношение максимальных значений
спектральной плотности для двух полос частот.
Энергетический спектр для исправной редукторной передачи
приведен на рис. 11.4, а. Здесь отношение максимального значе-
ния спектральной плотности полосы Д/i к максимальному значе-
нию спектральной плотности полосы равно 0,667. Для неисп-
равного редуктора (рис. 11.4, б) это отношение оказалось равным
3,2. Установив определенные критические пороговые уровни от-
ношений максимальных значений спектральных плотностей для
выбранных априори полос частот, можно реализовать диагности-
ческую систему, отслеживая эти отношения.
Вариации параметров вибросигнала могут проявляться не только
в росте амплитуд спектральных компонент, но и в появлении новых
компонент и перераспределении энергии между ними. В частно-
сти, в качестве диагностических параметров можно использовать
и изменяющиеся при появлении дефектов соотношения между
регулярными (информативными) компонентами спектра и его
шумовой составляющей. Так, например, достаточно равномерный
рост шумовой составляющей в наблюдаемом диапазоне частот
может говорить об увеличении степени износа контактирующих
поверхностей в механических элементах системы.
Особенно характерным является перераспределение энергии для
нелинейных колебательных систем, где, исходя из самой приро-
251
ды таких систем, возможно возникновение субгармонических ко-
лебаний, автоколебаний, явлений захватывания и затягивания
и т.д. Это обстоятельство также может быть использовано при фор-
мировании диагностических признаков в целях решения задачи
выявления возникновения в технической системе какого-либо
дефекта (без его классификации). Действительно, если при отсут-
ствии дефектов поведение системы описывается достаточно аде-
кватно линейной моделью, то при любом повреждении конст-
рукции, как правило, начинают проявляться ее нелинейные свой-
ства. Так, например, при появлении в конструкции трещины ее
берега при вибрации будут подвергаться поочередному сжатию и
растяжению. При сжатии материал конструкции будет вести себя
как сплошной, а при растяжении общая жесткость конструкции
уменьшается. Таким образом, конструкция, в которой возникла
трещина, имеет различные жесткости на растяжение и сжатие,
т.е. является, безусловно, нелинейным объектом и его вынужден-
ные колебания будут отличаться от гармонических. Конечно, не-
линейные свойства конструкции начинают проявляться при до-
стижении трещиной определенных размеров; при небольших раз-
мерах трещины по сравнению с размерами конструкции ее вы-
нужденные колебания будут мало отличаться от колебаний кон-
струкции при отсутствии такого дефекта.
Присутствие высших гармоник в разлагаемых в ряд Фурье вы-
нужденных колебаниях может не только служить «индикатором»
возникновения в конструкции трещины (конечно, при условии
исключения появления в конструкции дефектов другого рода),
но и быть критерием размеров трещины. Однако определение за-
висимости между соотношением амплитуд гармоник и относи-
тельными размерами трещины является весьма сложной задачей,
которую необходимо решать для каждой конструкции заново. Для
резонансных режимов в модели колеблющейся системы с трещи-
ной получена [7] приближенная искомая зависимость в виде
bi _ 1 Сдоб
Ьх 3 С ’
т. е. отношение амплитуд второй Ь2 и первой Ь\ гармоник пример-
но такое же, как отношение добавленной Сдоб и основной С жес-
ткостей, которое в свою очередь приблизительно равно отноше-
нию длины трещины к размеру конструкции в направлении тре-
щины. Необходимость выделения компонент из зашумленных виб-
росигналов при диагностике современных сложных технических
систем, кроме рассмотренных выше традиционных спектральных
характеристик, заставляет применять и другие общеизвестные
количественные характеристики детерминированных и случайных
процессов, причем как в отдельности, так и в комбинации друг с
252
другом. В частности, представление колебаний функционирующих
технических систем в виде случайных процессов делает естествен-
ным применение методов статистического анализа. Наиболее из-
вестными и широко используемыми являются спектрально-кор-
реляционные оценки вибросигналов. Кроме корреляционных функ-
ций в задачах диагностики находят применение и другие момент-
ные характеристики случайных процессов.
Примером использования одной из таких характеристик в ка-
честве диагностического признака является текущее значение ко-
эффициента эксцесса Ек [4], т.е. безразмерной характеристики,
дающей оценку степени отклонения плотности распределения ве-
роятности случайного процесса от нормального распределения
вероятностей и определяемой по формуле
Ек = (щ/о2) - 3,
где ц4 — центральный момент четвертого порядка; о2 — диспер-
сия случайного процесса.
На рис. 11.5 приведен график изменения коэффициента экс-
цесса, характеризующего в данном случае степень деградации
контактирующих поверхностей высоконагруженного подшипни-
ка скольжения. Коэффициент эксцесса был получен в результате
обработки вибросигнала, представляющего узкополосный случай-
ный процесс в зоне резонансной частоты диагностируемого узла.
Большой динамический диапазон изменения коэффициента
эксцесса при изменении состояния диагностируемого узла от нор-
мально функционирующего (Ек ~ 0) до входа в зону разрушения
(Ек = 20—27) говорит о достаточно высокой чувствительности дан-
ной характеристики.
Удобство использования коэффициента эксцесса в качестве диа-
гностического признака состоит также в том, что его не нужно
нормировать, так как при нормальном функционировании Ек ~ 0.
Нестабильность диагностического параметра, оцениваемого как
размах \Ек, может быть использована в качестве самостоятельно-
го признака неисправности диагностируемого узла.
253
В этой связи целесообразно обратить внимание на принципи-
альную возможность использования эффектов нестационарности
в вибродиагностике технических систем. Традиционно большин-
ство методов диагностики базируется на использовании гипотезы
о стационарности (или квазистационарности) процессов, проте-
кающих в диагностируемых системах. При этом игнорируется тот
факт, что нестационарность может быть напрямую связана с раз-
витием дефекта, вносящего возмущение в наблюдаемый колеба-
тельный процесс, которое и несет основную информацию о при-
чине появления дефекта.
Параметры сигнала, характеризующего его нестационарность,
различаются по скорости изменения и соответственно отражают
разные стороны изменения состояния технической системы. Быст-
рые скачкообразные изменения этих параметров говорят, как
правило, о возникновении предаварийной или аварийной си-
туации (вышеприведенный пример изменения Ек при начале раз-
рушения подшипника достаточно хорошо иллюстрирует это по-
ложение). В то же время трендовые характеристики позволяют во
многих случаях сделать выводы о возникновении и характере раз-
вития дефектов в технической системе, сделать прогноз на буду-
щее.
11.3. Кепстральный и биспектральный анализ
вибропроцессов
Ввиду сложности возникающих в современных технических
устройствах неисправностей и дефектов и необходимости во мно-
гих случаях анализа слабых сигналов при формировании диагно-
стических признаков, кроме традиционного спектрального пре-
образования Фурье, в практике диагностирования технических си-
стем нашли применение и другие методы анализа сигналов. Од-
ним из таких методов, используемых в виброакустической диаг-
ностике, является кепстральный анализ.
Кепстральный анализ нашел широкое применение при изуче-
нии спектров речи в целях определения основной частоты голоса
и ее гармоник. Метод позволяет достаточно легко определять пе-
риодичность в частотном спектре, присутствие боковых частот,
распределенных на равных интервалах вокруг одной или некото-
рого числа несущих частот. Именно это свойства кепстра может
быть использовано для оценки состояния технического объекта.
Примером может служить диагностирование с применением кеп-
стра низкоскоростной коробки передач.
Получение кепстральных характеристик базируется на приме-
нении нелинейного преобразования исходного спектра мощно-
сти, а именно его логарифмирования с последующим преобразо-
254
ванием Фурье. Кепстр обычно определяют как спектр мощности
от логарифмического спектра мощности:
С(т) = S{log5xt(<o)},
где символ S обозначает прямое преобразование Фурье; 5«(®) —
спектр мощности процесса х(/).
Известно также другое определение кепстра:
С(т) = S’1 {log^(®)},
т. е. в качестве кепстра используют обратное преобразование Фу-
рье от логарифмического спектра мощности.
Одной из причин применения такого определения кепстра яв-
ляется, по-видимому, его сходство в этом случае с функцией кор-
реляции, которая также является обратным преобразованием
Фурье, но от спектра мощности:
= S-‘{£„((.>)}.
Независимая переменная т в обеих формулах, определяющих
кепстр, имеет размерность времени и обычно называется кефрен-
си (в литературе также встречается термин «кьюфренси» и даже
«сачтота», очевидно по аналогии с «частотой» для спектра).
Однако сходство кепстра с функцией корреляции носит фор-
мальный характер, так как кепстр обладает рядом свойств, вы-
годно отличающих его от функции корреляции при применении
их в вибродиагностике.
Рассмотрим преимущество использования кепстра на таком при-
мере. Если на вход диагностируемого объекта поступает тест-сиг-
нал U(t), то спектр вибросигнала x(t), измеряемого в точке съема
*5хг(®), заключает в себе информацию как о тестовом сигнале, так
и о пути, по которому этот сигнал проходит до точки съема. Путь
прохождения сигнала можно описать передаточной функцией
Тогда спектр ^(со) определяется как произведение спектральной
характеристики 5uu((o) и передаточной функции:
^(®) = |И/их(усо)|2 5ии(со).
После логарифмирования этого выражения получим
log (<о) = 21og|Bzux(j(o)| + log Suu (со).
Выполняя обратное преобразование Фурье, перейдем к кепст-
ральным характеристикам:
3-41og5«(®)} = S-421og|^(>)|} + S-Ulog^Cco)}.
255
S, дБ
100
90
80-
70-
60-
500
/, кГц
Рис. 11.6. Спектр вибрационного сигнала
Таким образом, в результате получаем аддитивный эффект от
источника возбуждения и пути распространения, которые имеют
совершенно различные свойства, проявляющиеся на различных
частотах, что позволяет разделить их с помощью кепстра. В то же
время функция корреляции является сверткой функций, что, ес-
тественно, препятствует разделению этих эффектов.
Кепстр является инвариантной функцией по отношению к
месту установки датчика на диагностируемой конструкции, по-
скольку он реагирует на изменение всех модуляционных компо-
нент в совокупности. Что касается амплитуд спектральных ком-
понент, они могут значительно изменяться даже при относи-
тельно небольших перемещениях датчика, так как форма спект-
ра зависит от соотношения индексов амплитудной и фазовой
модуляции сигнала, влияя на амплитуды боковых полос, что и
приводит к нарушению их симметрии относительно несущей
частоты. В то же время первая «рахмоника» кепстра (термин, ис-
пользуемый в кепстральном анализе для обозначения аналога
«гармоники» спектральной характеристики) практически не за-
висит от упомянутых фазовых соотношений, являясь функцией
только глубины развития дефекта, а изменение соотношений
между боковыми полосами сказывается лишь на высших рахмо-
никах, причем незначительно.
Конечно, основным достоинством кепстра, в значительной сте-
пени определяющим перспективу его использования в диагностике,
является свойство сжатия диагностической информации, содержа-
щейся в частотном спектре и распределенной по всему его диапа-
зону в виде множества модуляционных компонент (рис. 11.6).
При переходе в кепстральную область происходит преобразо-
вание этого множества в ограниченное число значимых рахмоник
кепстра (рис. 11.7).
Перспективно для формирования диагностических признаков
также и применение многомерных спектров, в частности биспек-
256
Рис. 11.7. Кепстр вибрационного сигнала
тров. Биспектр В[&1, со2) представляет спектральную характерис-
тику колебательного процесса, определяемого как преобразова-
ние Фурье от двумерной автокорреляционной функции:
В(в>1, су,) = J J т2)ехр(-усо1т1 - )dT,dT2,
-00-00
где т2) =(x(t)x(t + Tj)x(r + т2)) — двумерная автокорреляцион-
ная функция (угловые скобки обозначают операцию усреднения
по времени).
Биспектральная функция обладает свойством подавления шу-
мовых компонент, так как момент третьего порядка от гауссов-
ского процесса равен нулю [4].
Ввиду того что биспектр является комплексной величиной,
в диагностических целях обычно используют модуль биспектра
I со2) | как обобщенный диагностический признак с пред-
ставлением его в матричной форме с последовательной разверт-
кой по столбцам или строкам. На рис. 11.8 приведен биспектр виб-
Рис. 11.8. Биспектр вибраций редуктора при двух значениях нагружающе-
го момента в зацеплении
257
раций редуктора при двух значениях нагружающего момента в за-
цеплении [4]. Биспектр — трехмерная функция, поэтому на ри-
сунке приведены линии равного уровня для функции | Б(/1, /2) I,
где/= <о/(2л).
В практике диагностирования механических конструкций встре-
чаются случаи, когда появление дефекта вызывает малые энерге-
тические изменения вибросигнала, влияя в то же время на фазо-
вые соотношения между кратными частотными компонентами
сигнала. По частотному спектру мощности такие изменения уло-
вить невозможно, в то время как биспектр позволяет выявить
фазовую информацию даже при наличии шумовой помехи, при
этом наиболее чувствительной к фазовым соотношениям будет
функция бикогерентности [4]:
[$(«>, )$(«►, )$(»)!+И,)]'
Значение этой функции определяется фазовым соотношением
кратных гармоник (ob = 2<вь <в3 = За)]:
BicC®!, ©г) = ехр[/(<р1 + <р2 - <рз)1,
где величина (ф] + ф2 - ф3) называется бифазой.
11.4. Применение пространственно-временных
спектральных преобразований при построении
диагностических моделей
При диагностике технических систем наблюдение за их состо-
янием обычно осуществляют путем проведения последовательно-
параллельного контроля состояния отдельных элементов, образу-
ющих диагностируемую систему. Обработка по диагностическим
алгоритмам сигналов, снимаемых с распределенных в простран-
стве источников первичной информации, происходит, как пра-
вило, независимо. Такой подход, в частности, широко применя-
ется и тогда, когда в качестве исходной информации, характери-
зующей состояние технической системы, используют вибрацион-
ные процессы, сопровождающие режим нормального функцио-
нирования диагностируемой системы или создаваемые в ней ис-
кусственно. При вибрации системы каждая ее точка совершает ко-
лебания, совокупность которых образует вибрационное поле. Это
поле может рассматриваться в качестве многомерного ритмичес-
кого случайного процесса, и измерения, проведенные одновре-
менно в нескольких точках исследуемого объекта, позволяют по-
258
лучать пространственно-временной сигнал. Очевидно, что такой
сигнал должен обладать более информативными признаками, чем
сигнал, снятый в одной точке вибрационного поля. Действитель-
но, появление в конструкции технической системы дефектов в
виде трещин, изломов изменяет условия распространения коле-
баний, что и проявляется в изменении характера вибрационного
поля и, следовательно, в изменении параметров этого поля.
Компоненты характеристик вибрационного поля, получаемые
путем применения ортогонального преобразования исходной ин-
формации в спектральную область, могут служить в качестве ин-
формативных диагностических признаков. В общем случае вибра-
ционное поле можно рассматривать как суперпозицию бегущих
волн от различных источников вибраций, расположенных внутри
и вне диагностируемой технической системы. Для получения пер-
вичной информации, характеризующей вибрационное поле, про-
изводят измерение сигналов в различных точках конструкции диа-
гностируемой системы с помощью датчиков, образующих «решет-
ку». При этом выходы чувствительных элементов представляют од-
нородное случайное поле, характеризуемое для случая плоских волн
взаимной по пространству спектральной плотностью 5(со, £), ко-
торая связана преобразованием Фурье с пространственным спек-
тром Р(&, к) соотношением [2]:
к) = ttv J J 5(®> ^)exp(-j4)d^,
—00—00
где — вектор, определяющий положение чувствительного эле-
мента на плоскости виброполя; к — волновое число, связанное с
вектором скорости распространения волны д соотношением
В случае если сигнал, проходящий через решетку чувствитель-
ных элементов, представляет распространяющуюся со скоростью
до монохроматическую (с частотой <oq) плоскую волну единичной
амплитуды ехр[-у((Во/+ к0£)], то взаимная спектральная плотность
будет определяться выражением
5(щ ^) = exppjk0^]5((o-«)o),
и, следовательно:
Р((й, к) = 8(®-Юо,к-ко).
Таким образом, пространственный спектр в данном случае бу-
дет иметь вид дельта-функции, сосредоточенной на частоте ©о и
волновом числе ко (рис. 11.9).
259
Рис. 11.9. Пространственно-временной спектр мо-
нохроматической волны с единичной амплитудой
При распространении в однородной среде со скоростью t>0 от
одного источника вибрации сигнала, представляющего супер-
позицию гармонических колебаний с различными амплитуда-
ми, пространственный спектр будет иметь вид, приведенный на
рис. 11.10. Из этих рисунков, в частности, видна возможность ис-
пользования Дсо, к) для определения направления распростра-
нения волны, что позволяет при расположении на объекте по
крайней мере двух решеток датчиков решить задачу локализации
источника вибрации.
Ритмический случайный процесс, реально наблюдаемый в объек-
те, можно представить в первом приближении как полигармони-
ческий сигнал, инициируемый т источниками колебаний при
наличии широкополосного и реверберационного шума. Матема-
тической моделью такого сигнала может служить аддитивная смесь
суммы конечного числа узкополосных компонент x,{t) = Л,cosco/ и
широкополосного шума v(/):
a^(0 = Zx/(0 + v(0.
/=1
Вид части проекции пространственной функции к) на
плоскость (кх, ку) показан на рис. 11.11 эквипотенциальными ли-
Рис. 11.10. Пространственно-вре-
менной спектр сигнала — супер-
позиции гармонических колебаний
с различными амплитудами
Рис. 11.11. Часть проекции про-
странственной функции Р(со, к)
ритмического случайного процесса
260
Рис. 11.12. Пространственный спектр виброполя
ниями. Это группа близко стоящих «пиков», образующих плавный
максимум, — «гряду». Форма этой «гряды», т.е. высоты отдельных
пиков, различны для разных состояний объектов.
Конечно, в реальных условиях диагностического эксперимен-
та неоднородность среды, по которой распространяются вибро-
сигналы, как правило, от нескольких источников, приводит к
появлению отраженных сигналов, изменению скорости прохож-
дения сигналов (основных и отраженных), изменению траекто-
рий распространения сигналов, их наложению друг на друга и т.д.
Все эти факторы в свою очередь приводят к тому, что простран-
ственный спектр реального виброполя представляет собой доста-
точно сложную поверхность, «натянутую» на конечное множе-
ство «взвешенных» дельта-функций, при этом «вес» каждой дель-
та-функции определяется интенсивностью суммарного простран-
ственного спектра в данной точке пространства волновых чисел
(рис. 11.12).
Если для получения первичной информации на объекте распо-
ложены М датчиков, то оценка пространственного спектра виб-
рополя Р(оз, к) базируется на оценке взаимной спектральной плот-
ности:
1 м м ,
^(®Л) = ^уХ£^7(®)ехр{-;к(^-^)},
где — вектор, определяющий положение z-го чувствительного
элемента в принятой системе координат; 5,/(со) — оценка взаим-
ной по пространству спектральной плотности, которая в свою
очередь определяется в виде:
5z/(co) = 5((со)5;(®),
где 5, = ехр{->Р®} — фурье-преобразование выходного
₽=о
сигнала z-го датчика; — коэффициенты, определяющие форму
спектрального окна.
261
Чувствительные элементы важно расположить таким образом,
чтобы охватить весь вероятный диапазон волновых чисел и вместе
с тем избежать сбора избыточной информации. Известно, что для
любой конкретной структуры решетки чувствительных элементов
справедливы соотношения теоремы отсчетов. Разрешающая спо-
собность для заданной компоненты волнового числа обратно про-
порциональна апертуре решетки в этом направлении. Наиболь-
шее волновое число, которое может быть получено в результате
наблюдений, определяется следующей границей:
lkmaxl = 2дГ’
где Л£ — расстояние между чувствительными элементами.
Таким образом, функция Р(а>, к) является оценкой простран-
ственного спектра, причем погрешность этой оценки зависит от
геометрических свойств решетки датчиков. При построении диаг-
ностической системы геометрия решетки должна быть такой, чтобы
имелась возможность определить ту область волновых чисел к, где
пространственно-временной спектр достоверно отражает реаль-
ный вибрационный процесс, хотя эта область может оказаться
весьма малой. Обязательным условием должна быть высокая чув-
ствительность формы Р(<о,к) к изменению состояния диагности-
руемого объекта. И хотя получить полное пространственное спек-
тральное разложение виброполя с помощью такой решетки не-
возможно, для целей диагностики решетку с такими параметра-
ми можно считать вполне приемлемой.
Однако следует обратить внимание, что недостатки, присущие
обычным спектрам Фурье при использовании их в диагностиче-
ских задачах, а именно «размытость» во многих случаях информа-
тивных параметров по всему спектру, полностью проявляются и в
случае применения пространственных спектров. Причем в послед-
нем случае задача классификации состояния может оказаться еще
более трудной из-за увеличения размерности признакового про-
странства. Чтобы уменьшить размерность этого пространства, це-
лесообразно провести еще одно спектральное преобразование с
использованием идеи адаптивных базисов.
Рассмотрим один из возможных путей использования ортого-
нальных разложений по системам адаптивных базисных функций,
формируемых на основе результатов первичного спектрального
преобразования исходной информации [2]. Для упрощения изло-
жения примем вначале, что исходные сигналы являются одно-
мерными. Решение задачи диагностики в этом случае, как нео-
днократно отмечалось выше, сводится к задаче классификации
этих сигналов.
262
Пусть классификации подлежат М дискретных случайных сиг-
налов, каждый из которых принадлежит одному из т классов
Xm = ,
где Хт — Л'-мерный вектор; т = 1, М.
Полагаем, что для каждого т известна классифицированная
выборка
{ХГ}, I = 1Л,
где L — объем выборки, которая определяется на этапе «обуче-
ния».
Полагая, что векторы имеют единичную норму:
||Xm|| = 1, те
выполним ортогональное преобразование Фурье для каждого X”:
уг=1фл,хг,
где Y” - [У^*, У”,..., У," (— JV-мерный вектор, компоненты ко-
торого являются дискретным спектром вектора X” той же раз-
мерности; <bN — квадратная матрица спектрального оператора Фу-
рье размерности NxN.
Выбор преобразования Фурье обусловлен свойством инвари-
антности этого преобразования к временному сдвигу анализируе-
мых сигналов. Это обеспечивает однозначное сравнение сигналов
по независимой переменной в частотной области.
Каждый класс сигналов т охарактеризуем соответствующим
эталонным спектром Фурье Y”, определяемым в простейшем
случае как среднее по множеству спектров Yf классифицирован-
ной выборки {X"}:
1 L
угт _ * X1 V»>
жэт - ’/ •
ь /=1
Каждому классу сигналов поставим в соответствие вспомога-
тельную систему ортогональных функций, выбранную с учетом
вида эталонного спектра так, что разложение эталона по этим
функциям будет содержать всего один спектральный коэффици-
ент, отличный от нуля. Используя метод синтеза дискретных ор-
263
тогональных функций, можно сформировать систему информа-
тивных признаков
Z;=k,2”,z;,...,c,]r, 0 = 1,И.
При этом процедура формирования каждого вектора Z” за-
ключается во вторичном преобразовании вектора Ym по вспомо-
гательным системам дискретных ортогональных функций, при-
способленных к виду Y™ :
Jm _ 1 т>Р V'»
"Л ** ’
где — квадратная матрица приспособленного спектрального
оператора размерности NxN для класса р.
Естественно, что из разложений Ym в адаптивных базисах всех
классов лучшее качество разложения будет иметь место в базисе,
соответствующем классу т, к которому относится классифициру-
емый вектор Хт, т. е. когда р - т. В этом случае из всех компонент
вектора Z™ существенной будет первая компонента а ос-
тальные будут описывать индивидуальные отклонения вектора Ym
от эталона класса.
В случае если р * т, существенными могут оказаться другие
компоненты. Если качество разложения вектора ¥'" по адаптив-
ным базисам оценить величиной
AM. 12
«'=zkl.
к=\
то для того чтобы определить, какому из классов р е 1, М при-
надлежит вектор Хт, необходимо сравнить качество его спект-
рального разложения Ym в адаптивных базисах и выбрать класс,
для которого размерность разложения в соответствующем базисе
минимальна.
Критерий классификации в этом случае можно записать следу-
ющим образом: если Gmp = Нт - Нр для всех р = 1, М (р * т), то
классифицируемый объект относится к классу т.
При переходе от рассмотренного выше случая одномерного
вибросигнала к вибрационным полям в качестве основы для фор-
мирования адаптивного базиса используется пространственный
спектр. Существует ряд способов формирования вектора Y, про-
стейшим из которых является способ покоординатного сканиро-
вания в пространстве проекций спектра Р(а>, к) на плоскость ком-
понентов волнового числа кх, ку.
264
Выходы датчиков
13d
131
131
13d
Пространственная спектральная
плотность мощности
Спектры в базисе Фурье
Спектры в адаптивном базисе
*$а.б
П
Рис. 11.13. Последовательность преобразований исходных сигналов для
выделения диагностических признаков
*$а.б
П
265
Эффективность рассмотренного выше подхода при решении
диагностических задач можно проиллюстрировать на примере де-
фектоскопии конструкции летательного аппарата [2]. В процессе
диагностических исследований объект подвергался внешнему рит-
мическому воздействию, вследствие чего в нем возникал вибра-
ционный процесс. Измерение параметров виброполя осуществля-
лось решеткой датчиков, размещенной на поверхности конструк-
ции. Последовательность преобразований исходных сигналов для
выделения диагностических признаков приведена на рис, 11.13. Ко-
нечно, конкретный вид дефекта по виду пространственного спектра
или по спектральному разложению в адаптивном базисе опреде-
лить без этапа «обучения» невозможно. Однако эффективность ре-
шения диагностической задачи первого уровня, т. е. распознава-
ние неисправного состояния, очевидна, особенно в спектраль-
ном пространстве адаптивных базисов, где число информативных
признаков сведено к минимуму.
Необходимо обратить внимание на то, что применение адап-
тивных базисов при решении задачи диагностики предполагает
формирование таких базисов на основе априорных сведений о
классе процессов, являющихся первичной информацией при
реализации алгоритма диагностики. Кроме того, целесообразно
провести сравнение базисов в целях выбора подходящего бази-
са, допускающего относительно несложную алгоритмическую
и техническую реализацию. На основании сопоставления по та-
кому комплексу вопросов для оптимального и неоптимального
базиса принимают решение о предпочтении той или иной си-
стемы функций при решении конкретной задачи. После того
как система базисных функций выбрана, выполняют фильтра-
цию сигналов.
Обычно фильтр включает в себя анализатор (отображает про-
странство исходных данных в спектральную область) и избира-
тельную систему (обеспечивает устранение избыточности с помо-
щью установленного порогового уровня, или сигнатуры, или уров-
ней в соответствующих спектральных областях по выбранному кри-
терию оценивания).
Если в качестве критерия используют подавление компонент
высших порядков, тем самым решают задачу фильтрации нижних
обобщенных частот; если используют подавление заданных ком-
понент, то осуществляют фильтрацию полосы частот и т.д.
В случае если назначением системы диагностирования являет-
ся обнаружение предаварийных состояний, то в качестве диагно-
стического признака можно использовать даже общий уровень сиг-
нала в широкой полосе. Однако при детализации вида неисправ-
ностей целесообразно проводить сужение полосы спектрального
анализа в выбранном базисе с привязкой компонент спектра к
определенному виду дефекта.
266
При сигнатурном спектральном анализе превышение заданных
пороговых уровней сигнализирует о возникновении в системе пред-
аварийной ситуации, т.е. такой анализ направлен на выявление
грубых дефектов. При выборе небольшого уровня сигнатуры мо-
жет произойти ложное срабатывание системы аварийной сигна-
лизации, если в исходной информации возрастут флуктуации слу-
чайной компоненты. В то же время увеличение уровня срабатыва-
ния приводит, естественно, к снижению чувствительности систе-
мы диагностики. Отсюда вытекает необходимость при разработке
диагностической системы тщательного учета назначения диагно-
стируемого технического объекта, конкретной ситуации и апри-
орных сведений о процессах, протекающих в этом объекте.
Темы для повторения
1. Особенности процедуры диагностики по вибрационным процес-
сам, происходящим в наблюдаемом объекте.
2. Частотные диапазоны вибрационных процессов.
3. Виды вибрационных процессов в объектах управления, причины их
возникновения.
4. Использование детерминированной модели вибрационного сигна-
ла для формирования информативных диагностических признаков.
5. Особенности использования собственных и вынужденных колеба-
ний, возникающих в объекте, для формирования диагностических при-
знаков.
6. Связь дефектов в объекте с возникающими нелинейными свой-
ствами диагностической модели.
7. Преимущества использования кепстральных характеристик при ана-
лизе вибрационных процессов по сравнению с частотными.
8. Возможности использования биспекгральной функции при анали-
зе вибрационных процессов.
Глава 12
ПРИМЕНЕНИЕ НЕЧЕТКИХ МНОЖЕСТВ
В ЗАДАЧАХ ТЕХНИЧЕСКОЙ ДИАГНОСТИКИ
12.1. Основные понятия теории нечетких множеств
В последнее время разработчики информационных систем раз-
личного назначения все чаще обращаются к теории нечетких мно-
жеств, которая, взяв старт в 1965 г. из работ профессора Л. Заде,
получила развитие до такого уровня, что позволяет описывать
нечеткие понятия и знания, оперировать этими знаниями и де-
лать нечеткие выводы. Одной из предпосылок развития данной
теории является существенное усложнение математического опи-
сания систем управления с увеличением размеров и сложности
таких систем. Действительно, при использовании известных спо-
собов идентификации для получения более-менее адекватного
описания сложных систем управления необходимо существенно
увеличивать число переменных и параметров, измерение кото-
рых, как правило, является трудной, а зачастую и неразрешимой
задачей. В лингвистических моделях, являющихся основой теории
нечетких множеств, для описания процессов и явлений, проис-
ходящих в наблюдаемых объектах, используют словесное описа-
ние, которое, естественно, не обеспечивает такую же точность,
какой обладают «традиционные» математические модели, но по-
зволяет создавать достаточно хорошие качественные модели.
Можно сказать, что основанная на теории нечетких множеств
новая методология уже превратилась в рабочий инструмент при
создании сложных систем управления, систем распознавания изоб-
ражений и речи, систем обеспечения безопасности и т.д. Про-
гресс в области нечетких систем не обошел стороной и диагно-
стические системы.
Применение теории нечетких множеств и нечеткой логики для
такой конкретной области, как диагностика технических объек-
тов, требует знакомства с некоторыми понятиями этой теории.
Однако прежде чем приступить к рассмотрению основных поло-
жений теории нечетких множеств, представляется целесообраз-
ным привести некоторые необходимые сведения из теории четких
множеств и двузначной (булевой) логики.
Пусть имеется совокупность элементов, составляющих неко-
торое множество X, которое будем обозначать X = {х}, а тот
268
факт, что х является элементом совокупности X, обозначим
следующим образом: х е X. В качестве названий (меток) мно-
жеств в дальнейшем будем использовать прописные буквы, для
описания свойств данного множества будем использовать сле-
дующий способ записи:
А = {х|х — свойства множества},
т. е. справа от вертикальной черты записываются все свойства множе-
ства; например, А = {х|х — четное число, большее 0 и меньшее 21}.
Весьма важным для понимания теории нечетких множеств яв-
ляется понятие характеристической функции множества. Харак-
теристическая функция %А, определяющая множество А в полном
пространстве X, представляет собой отображение, для которого X
есть область определения, а {0, 1} — область значений:
%А : X -4 {0,1}
Ш
X
W
Ха(х) =
0, х g А,
1, хе А.
При этом хА(х) = 1, если элемент х удовлетворяет свойствам
множества А, и хА(х) = 0, если — не удовлетворяет. Графическое
представление характеристической функции, определяющей мно-
жество А, приведено на рис. 12.1, где Ас — дополнение множества
А, определяемое законом комплементарности: А п Ас = 0 (пустое
множество).
Основой для понимания нечеткой логики является классиче-
ская логика, основоположником которой считается Аристотель,
а также двузначная булева алгебра, где каждая переменная мо-
жет принимать только два значения: «1» («да», «истина») и «0»
(«нет», «ложь»).
Однако в устройствах, основанных на нечетких логических
выводах, на первый план выдвигается такая операция, как имп-
ликация, обозначаемая следующим образом: Х[ -> х2 (если — хь
то — х2). В этой логической операции переменная Х| называется
тА
Рис. 12.1. Графическое представление харак-
теристической функции, определяющей мно-
жество А
269
Таблица 12.1
Таблица истинности
X) Х2 *1 ->*2
0 0 1 1 0 1 0 1 1 1 0 1
условием (антецедентом), х2 — заключением (консеквентом). Зна-
чения операции импликации, приведенные в табл. 12.1 (таблице
истинности), показывают, что эту операцию можно реализовать
с помощью применения операций НЕ и ИЛИ:
Х1 Х2 = Х( +х2.
Операция импликации лежит в основе силлогизма, выполняе-
мого при логических выводах, наиболее часто осуществляемых в
системах, реализующих алгоритмы, основанные на нечеткой ло-
гике. Силлогизм можно представить несколькими формулами; на-
пример, формула
%! Х2
х2 х3
Х| —> х3
может иллюстрировать вывод из двух утверждений: 1) если тем-
пература в агрегате превысила Гдоп, то технологический процесс
вышел из режима (Xi -» х2); 2) если технологический процесс
вышел из режима, то необходимо привести в действие аварий-
ную защиту (х2 -> х3); из этих двух утверждений следует заключе-
ние: если температура в агрегате превысила 7],оп, то необходимо
привести в действие аварийную защиту (х! х3).
Важное значение в диагностической практике имеет также сил-
логизм, представленный формулой типа
*1
*1
Х2
В этом случае, например, заключение «в устройстве имеется
дефект» (х2) получается из двух утверждений:
1) если уровень вибрации превышает величину 5тах, то в диа-
гностируемом устройстве имеется дефект (х3 х2);
270
2) уровень вибрации превышает величину 5тах (х,).
Используя математический аппарат классической логики, опе-
рирующей только двумя понятиями, а именно понятиями «исти-
на» и «ложь», исключающими любые промежуточные значения,
практически невозможно представить все многообразие окружа-
ющего мира и, в частности, описать все возможные состояния
сложного объекта управления. Решить эту проблему и призвана
нечеткая логика, положенная в основу теории нечетких множеств.
Отметим, что при использовании нечеткой логики появляется
возможность создания неограниченного числа операций, и в этой
связи теряется смысл введения каких-либо базовых операций не-
четкой логики, с помощью которых возможно описание всех ос-
тальных операций. Для изучения технологии создания диагности-
ческих систем на основе нечеткой логики наиболее важной явля-
ется методология нечетких выводов.
Остановимся кратко на ее особенностях. Прежде всего необхо-
димо отметить, что методология нечетких выводов базируется на
знаниях и интуиции эксперта и применении различной инженер-
ной эвристики. При этом для описания состояния наблюдаемого
технического объекта используют слова и обороты естественного
языка; например, такие: «высокий», «довольно высокий», «горя-
чий», «теплый», «холодный», «далеко», «близко» и т.д. Эти слова
носят названия термов. Чтобы связать любую физическую величи-
ну, для которой необходимо иметь больше двух значений («да» и
«нет»), с формальным логическим описанием, в теории нечетких
множеств вводится понятие лингвистической переменной. Так, при
описании уровня жидкости в химическом реакторе можно исполь-
зовать лингвистическую переменную «уровень», имеющую не-
сколько термов: «очень низкий», «низкий», «средний», «доволь-
но высокий», «очень высокий» и т.п. Следует заметить, что при
выборе числа термов исходят из поставленной конкретной задачи
и необходимой точности описания наблюдаемого явления. В боль-
шинстве случаев оказывается достаточно 3 — 7 термов на каждую
переменную. Если лингвистическая переменная содержит всего три
терма, то такое определение предполагает описание наблюдаемо-
го явления, как правило, двумя экстремальными (максимальное
и минимальное) и одним средним значениями контролируемого
процесса.
Конечно, при физической реализации лингвистической пере-
менной необходимо определить точные значения для термов этой
переменной. Для этого, выбрав необходимое число термов и поста-
вив каждому из них в соответствие некоторое конкретное значение
наблюдаемой физической величины, необходимо также определить
и значение функции принадлежности, т.е. степень принадлежнос-
ти данного конкретного значения контролируемой величины к тому
или иному терму соответствующей лингвистической переменной.
271
Функция принадлежности тА, являясь характеристикой нечет-
кого множества, используется в таком же качестве, как и харак-
теристическая функция %А в четком множестве, и обычно ее ин-
терпретируют следующим образом: величина тА(х) обозначает
субъективную оценку степени принадлежности х множеству А.
Следует обратить внимание на то, что нечеткое множество строго
определяется с помощью функции принадлежности, т. е. оценоч-
ных значений [0, 1]. Так, нечеткое множество А в полном про-
странстве X определяется через функцию принадлежности тА(х)
следующим образом:
тА : X -> [0,1]
ш Ш
х тА(х).
Например, если X представляет множество целых чисел, со-
стоящих из десяти цифр меньших 10:
Х= {0, 1, 2, 3, 4, 5, 6, 7, 8, 9},
то нечеткое множество А «маленьких чисел» можно обозначить в
виде:
А = 1/0 + 1/1 + 0,8/2 + 0,5/3 + 0,1/4.
В этой записи 0,8/2, например, означает, что тА(2) = 0,8, а это
в свою очередь означает, что число 2 на 80 % принадлежит мно-
жеству А.
Вид функции принадлежности может быть различным. Однако
наиболее часто используют функции, называемые стандартными.
Вид этих функций представлен на рис. 12.2. При решении каких-
либо специфических задач можно получить лучшие результаты, если
вместо стандартных функций принадлежности использовать другие
функции, имеющие более подходящую для этих случаев форму.
По аналогии с четкими множествами в теории нечетких мно-
жеств используют такие операции, как отношения вложения А с В,
дополнительное нечеткое множество Ас, произведение нечетких
множеств А п В, сумма нечетких множеств А о В. Графически с
а б в г
Рис. 12.2. Стандартные функции принадлежности:
а — z-функция; б — П-функция; в — «-функция; г — S-функция
272
Рис. 12.3. Операции с нечеткими множествами:
а — операция отношения вложения А с В (1 — тА(х); 2 — тв(х)); б — операция
дополнительного нечеткого множества Ас(1 — тА(х); 2 — в — операция
произведения нечетких множеств А п В (1 — тА(х); 2 — т^х)\ жирная линия —
тЛг,д(х)); г — операция суммы нечетких множеств А и В (7 — тА(х); 2 — т^х);
жирная линия — тА^,в(х))
помощью колоколообразной функции принадлежности эти поня-
тия изображены на рис. 12.3.
Переход от конкретных значений входных переменных систе-
мы диагностики к значениям лингвистических переменных назы-
вается фаззификацией (от англ, fuzzy — нечеткий). Этот переход
осуществляется посредством реализации некоторого алгоритма
[18], построение которого можно представить в виде последова-
тельности следующих этапов:
1) для каждого терма взятой лингвистической переменной
определяют числовое значение (или диапазон значений), наилуч-
шим образом характеризующие данный терм, и этому значению
(диапазону) приписывают единичное значение функции принад-
лежности;
2) определяют значение параметра с нулевой принадлежно-
стью к данному терму (например, это значение может быть вы-
брано как значение с единичной принадлежностью к другому терму
из числа определенных ранее);
3) после определения экстремальных значений выбирают (из
числа стандартных) или задают соответствующие функции при-
273
надлежности, которые будут использоваться при определении
промежуточных значений.
Описание зависимостей между лингвистическими переменны-
ми проводится на основе продукционных правил нечеткой логи-
ки в форме ЕСЛИ ТО, т.е. использующих рассмотренную выше
операцию импликации. При этом антецедент (часть ЕСЛИ ...) мо-
жет содержать несколько посылок, объединяемых посредством ло-
гических связок И и ИЛИ.
Процедура использования продукционных правил в процессе
решения задач управления или распознавания состояний диа-
гностируемого объекта носит название нечеткого логического вы-
вода, который можно разделить на два этапа: обобщение и зак-
лючение.
На этапе обобщения логического вывода определяют степень
принадлежности всего антецедента правила. Для этого использу-
ют один из двух операторов, существующих в нечеткой логике:
MIN(...) и МАХ(...). Первый оператор вычисляет минимальное
значение степени принадлежности, второй — максимальное. При-
менение конкретного оператора зависит от того, какой связкой
соединены посылки в правиле. При использовании связки И при-
меняется оператор MIN(...). Если же посылки объединены связ-
кой ИЛИ, то необходимо применять оператор МАХ(...). Наконец,
если в правиле всего одна посылка, то операторы оказываются
ненужными.
Следует также заметить, что в диагностических системах обыч-
но возникает необходимость создания «своего» продукционного
правила для каждого диагностируемого параметра. Такая же необ-
ходимость применения отдельных правил принятия решения мо-
жет возникнуть и в случае расчленения диагностической процеду-
ры на отдельные ситуации (режимы), каждая из которых ориен-
тирована на выявление определенного вида дефекта (дефектов).
Диагностическая модель при этом будет представлять набор не-
скольких фрагментарных моделей, каждая из которых адекватна
состоянию диагностируемого объекта только для соответствующих
условий.
В случае наличия нескольких продукционных правил, исполь-
зуемых для решения данной задачи, рассмотренную выше проце-
дуру определения степени принадлежности антецедента продук-
ционного правила применяют для каждого из частных нечетких
правил.
На этапе заключения (логического вывода) осуществляют соб-
ственно сам вывод, для чего подобным же образом посредством
операторов MIN/MAX вычисляют значение консеквента. Исход-
ными данными для этой процедуры служат значения степеней
принадлежности антецедентов правил, полученные на предыду-
щем этапе.
274
Естественно, результат нечеткого вывода будет также нечет-
ким, т. е. будет представлен соответствующим термом. В ряде слу-
чаев в системах контроля состояния технического объекта этот
результат оказывается вполне удовлетворительным (например, если
задачей диагностической системы будет определение только эк-
стремальных (предаварийных) значений параметров). Однако при
необходимости конкретизации полученного результата возникает
проблема устранения его нечеткости. Этот процесс получил на-
звание дефаззификации (от англ, defuzzification — преобразование
нечеткого множества в четкое представление). При дефаззифика-
ции определение числового значения параметра осуществляют на
основе соответствующей функции принадлежности, при этом
используют несколько методов (метод центра максимума, центра
тяжести и др.) [18].
Выполнение нечетких выводов по правилам поясним на при-
мере. В качестве диагностируемого объекта рассмотрим некий аг-
регат, одним из контролируемых параметров которого является
внутреннее давление рабочего тела. Целью диагностической про-
цедуры является определение текущего значения контролируемо-
го параметра для того, чтобы исходя из его величины в случае
необходимости принять определенные меры для предотвращения
аварийной ситуации. Диагностика состояния объекта проводится
на основе знания, которое можно представить в виде следующего
продукционного правила: «если уровень давления высокий, то от-
крыть клапан».
При этом экспертная интерпретация понятия «высокий» с по-
мощью нечеткого множества может, например, выглядеть следу-
ющим образом:
«высокий» = 0,1/1,5 атм + 0,3/1,6 атм + 0,7/1,7 атм +
+ 0,8/1,8 атм + 0,9/1,9 атм + 1,0/2,0 атм +
+ 1,0/2,1 атм + 1,0/2,2 атм. (12.1)
Аналогичным образом процесс открытия клапана для выпуска
рабочего тела может быть представлен в виде следующей функции
принадлежности:
«открыть» = 0,1/30° + 0,2/40° + 0,3/50° + 0,5/60° +
+ 0,8/70° + 1,0/80° + 1,0/90°. (12.2)
В выражении (12.2) угол поворота клапана, равный 90°, при-
нимают за полное открытие клапана.
Полученные функции принадлежности составляют базу зна-
ний, которая в процессе функционирования объекта может кор-
ректироваться и дополняться.
275
Положим также, что из-за особенностей диагностируемого
объекта получить точное значение наблюдаемого параметра (на-
пример, внутреннее давление, равное 1,57 атм) нельзя хотя бы
по причине технологической невозможности установки на дан-
ном объекте соответствующих датчиков давления. В этом случае
контролируемый параметр может быть оценен по различным кос-
венным измерениям в виде: «уровень давления довольно высокий».
Это наблюдение в свою очередь может быть представлено с
помощью нечеткого множества, например следующим образом:
«довольно высокий» - 0,5/1,6 атм + 1,0/1,7 атм +
+ 0,8/1,8 атм + 0,2/1,9 атм. (12.3)
Система диагностики в этом случае должна реализовать силло-
гизм в виде:
«если уровень давления высокий, то открыть»
«довольно высокий»
2
При этом если оценку состояния будет осуществлять человек-
оператор (эксперт), то он путем приближенного сопоставления
предпосылки «если уровень давления высокий, то открыть» и на-
блюдения «довольно высокий» скорее всего получит вывод в виде:
«слегка открыть». Очевидно, что приведенный выше вывод явля-
ется достаточно естественным, если говорить о мышлении чело-
века на лингвистическом уровне. Однако какой алгоритм должен
быть реализован, если вывод проводят с помощью средств вы-
числительной техники? Рассмотрим один из возможных вариан-
тов получения нечеткого вывода, который достаточно часто ис-
пользуют на практике [18].
Используя формулы (12.1), (12.2), нечеткое продукционное
правило можно графически изобразить так, как представлено на
рис. 12.4, а. Здесь полное антецедентное пространство — это зна-
чения давления, а полное консеквентное пространство — это углы
поворота клапана. Обозначим их соответственно через Хи Y. Кро-
ме того, обозначим А — нечеткое множество «высокий» в предпо-
сылке X и В — нечеткое множество «открыть» в заключении У.
Нечеткое множество «довольно высокий» в данных наблюдения X
обозначим А'; используя данные из формулы (12.3), его можно
представить так, как изображено на рис. 12.4, б.
Процесс нечеткого вывода графически изображен на рис. 12.5.
Результат приближенного сопоставления предпосылки правила А
и данных наблюдения А' получен как результат операции А п А’,
при этом в качестве меры сопоставления А г\ А' можно выбрать
276
Рис. 12.4. Графическое представление нечеткого продукционного прави-
ла (а, б) и данные наблюдения (в):
а — «если высокий» (нечеткое множество А); б — «то открыть» (В); «довольно
высокий» (нечеткое множество А')
максимальное значение а. В результате редукции по мере а за-
ключения В в правиле и получится результат вывода (рис. 12.5, а).
В качестве способа редукции В использовано отсечение на основе
меры сопоставления а.
Таким образом, для текущих данных наблюдения А’ («доволь-
но высокий») в результате применения продукционного прави-
ла А В («если высокий, то открыть») получается В' («слегка
открыть»), т.е. результат вывода является также нечетким множе-
ством в Y. Для того чтобы конкретизировать полученный вывод,
необходимо на основе функции принадлежности тв(у) для В' про-
вести процедуру дефаззификации. Рисунок 12.5, б иллюстрирует
применение метода центра тяжести.
Выполненный нечеткий вывод можно формализовать следу-
ющим образом: обозначим нечеткое причинное отношение
предпосылки и заключения А —> В через R — нечеткое отноше-
ние. В этом случае процесс получения нечеткого результата выво-
да В' с использованием данных наблюдения А’ и знания А -> В
можно представить в виде композиционного правила нечеткого
вывода [18]:
В’ = A'* R = А • (А -> В). (12.4)
277
Рис. 12.5. Графическое изображение процесса нечеткого вывода:
а — операция А п А’\ 6 — операция В’ = аУп Д; в — операция дефаззификации
В выражении (12.4) символ • означает процедуру свертки не-
четкого множества.
Используя функции принадлежности, а также применяя мак-
симинную композицию в качестве композиционного правила и
операцию взятия минимума в качестве нечеткой импликации, фор-
мулу (12.4) можно представить в виде
тВ' = v (тА'(х)лтк(х,у)). (12.5)
хе л
Раскрывая в выражении (12.5) скобки, получим
/пг = v (тА(х) л (тА(х) л тв(у))) =
хе Л
= ( V (тА-(х) Л тА(х))) Л тв(у) =
хеХ
= тлг\А(х) л тв(у) = а л тв(у) = maYr>B(y). щ.6)
Следует также заметить, что на практике обычно приходится
проводить вычисления в соответствии с выражениями (12.5) и (12.6)
одновременно с использованием нескольких продукционных пра-
вил. При этом часто за окончательный результат принимают сумму
нечетких множеств — результатов вывода по каждому правилу,
получаемую путем применения операции логической суммы.
278
12.2. Построение систем диагностики, основанных
на использовании нечетких множеств
Рассмотрим возможное построение диагностической системы,
использующей модель на основе нечетких отношений. Положим,
что полное пространство предпосылок X состоит из т возможных
дефектов, а полное пространство заключений Y состоит из п ди-
агностических признаков:
X = {xj, х2, ..., хт},
Y= {УьЛ, -,Уп}-
Между каждым членом пространства предпосылок и каждым
членом пространства заключений существуют причинные отно-
шения, которые являются нечеткими отношениями х, и уу. Обо-
значим эти отношения в виде Гу - х, -> у,. Все вместе нечеткие
отношения Гу образуют матрицу нечетких отношений Rem стро-
ками и п столбцами:
R = [^], i = j = \,n.
Для каждого Гу можно ввести меру причинных отношений в
виде вещественного числа в [0, 1]. При анализе диагностической
модели предпосылки будут рассматриваться как входы, а заклю-
чения — как выходы модели (рис. 12.6). В этом случае конкретные
предпосылки (входы) и заключения (выходы) можно считать как
нечеткие множества А и В на пространстве X и Y. Следуя [18],
отношения этих множеств можно обозначить
В = А • R. (12.7)
Символом • в формуле (12.7) обозначено применение правила
композиции нечетких выводов. Следует обратить особое внима-
ние, что в этом случае применяются нисходящие выводы, т.е. на-
правление выводов будет обратным по отношению к направле-
нию выводов для правил.
Входы
Выходы
Рис. 12.6. Структурная схема диаг-
ностической модели на основе не-
четких отношений
*1
*2
Xi
хт
i= 1, т
J=Vn
----о У1
----о У2
----О yj
Уп
А
(нечеткое
множество в X)
В
(нечеткое
множество в У)
279
Таким образом, компоненты матрицы R идентифицируют ап-
риори по совокупности знаний эксперта, а в процессе диагности-
ческой процедуры наблюдают выходы В (или симптомы), а опре-
деляют входы А (или факторы).
Рассмотрим в качестве объекта диагностики автомобиль [18],
ограничив число возможных неисправностей двумя: Х\ — неисп-
равность аккумулятора, х2 — отработка машинного масла. В свою
очередь пространство заключений ограничим тремя членами: У[ —
затруднение при запуске, у2 — ухудшение цвета выхлопных газов,
Уз — недостаток мощности. Положим, что опыт эксперта (автоме-
ханика) выражается в виде
ГО,9 0,1 0,2'
“[о,6 0,5 0,5
Примем также, что в процессе диагностических испытаний ав-
томобиля выявлены трудности при его запуске при условии со-
хранения мощности и качества выхлопных газов. В этом случае
состояние автомобиля может быть оценено нечетким множеством
в пространстве Y в виде следующей зависимости:
В = 0,9/yi + 0,1/у2 + 0,2/ уз.
Для определения причины такого состояния составим соотно-
шение, определяющее нечеткое множество в пространстве X в
виде
А = щ/xi +а2/х2,
где at — мера неисправности аккумулятора; а2 — мера отработки
машинного масла.
Записав компоненты нечетких множеств А и В в виде векторов-
столбцов, получим
0,9
0,1
0,2
0,9 0,6
0,1 0,5
0,2 0,5
<h
аг
(12.8)
Применяя к выражению (12.8) в качестве композиционного
правила максиминную композицию, получим систему уравнений
0,9 = (0,9ла!)у(0,6ло2), (12.9)
0,1 = (0,1лО])у(0,5ла2), (12.10)
0,2 = (0,2Aa!)v(0,5Aa2). (12.11)
280
Учитывая, что в уравнении (12.9) второй член правой части не
влияет на левую часть, получим
0,9 = 0,9 л а,, 4 >0,9. (12.12)
Далее из выражения (12.10) следует
0,1 >0,5 л а2, а2<0,1. (12.13)
Так как формулы (12.12) и (12.13) удовлетворяют выражению
(12.11), в итоге получаем решение в виде
1,0 >^>0,9, 0<а2<0,1,
откуда следует вывод: неисправным элементом автомобиля явля-
ется аккумулятор.
Рассмотрим еще один подход к использованию нечетких мно-
жеств при решении задач диагностики. Положим, что целью со-
здаваемой диагностической системы является выявление дефек-
тов, множество которых определено как и ранее в виде
X = {х,}, / = 1, т.
Эта задача решается на основе анализа диагностических при-
знаков, составляющих множество У = {у7}, j = 1,п.
Пусть Л,- — гипотеза появления z-го дефекта, Bj — факт наблю-
дения у-го диагностического признака, Гу — взаимосвязь между
дефектами х,- и диагностическим признаком yj. Очевидно, что каж-
дое из этих заключений включает элемент недостоверности, и,
следовательно, в этом смысле их можно считать нечеткими мно-
жествами. Используя введенные понятия, можно установить, что
достоверность
Pj = «В} -> v л Л,)» (12.14)
/
есть достоверность следующего утверждения: «если имеется диаг-
ностический признак By, то на основании взаимосвязи Гу между
дефектами и признаками проявляется по крайней мере дефект Л,»,
а достоверность
Ру^«(гулА^Ву» (12.15)
есть достоверность утверждения: «если на основании взаимосвязи
Гу между дефектами и признаками проявляется дефект Л„ то име-
ется диагностический признак Вр. Однако вследствие «нечетко-
сти» самой диагностической модели, а также из-за условий полу-
чения первичной информации (наличие помех, ошибок измере-
ния и т.д.) как Pj, так и Ру не могут быть абсолютно достоверны.
281
Таблица 12.2
Лингвистические значения истинности
Обозначение Лингвистическое значение истинности
VT Очень правдивое
RT Довольно правдивое
РТ Возможно правдивое
PF Возможно ложное
RF Довольно ложное
VF Очень ложное
UN Неизвестное
В общем случае дефекты, возникающие в техническом объек-
те, как неоднократно отмечалось ранее, могут влиять одновре-
менно на несколько диагностических признаков, причем влия-
ние дефекта на каждый из диагностических признаков может варь-
ироваться от очень сильного до полного отсутствия какого-либо
влияния. Степень этого влияния, т.е. величину г&, предлагают оце-
нивать с помощью лингвистических значений истинности, пред-
ставленных в табл. 12.2 [18].
Используя нечеткости, представленные в форме лингвистичес-
ких значений истинности, можно составить таблицу, отражаю-
щую взаимосвязь между дефектами и диагностическими призна-
ками rtJ (табл. 12.3).
Для того чтобы в диагностической системе реализовать соот-
ветствующий алгоритм нечетких выводов, необходимо преобра-
зовать нечеткости, выраженные лингвистическими значениями
истинности, в числовые значения истинности.
В этих целях по функции принадлежности каждого лингвисти-
ческого значения истинности выбирают значения принадлежно-
Таблица 12.3
Взаимосвязь между дефектами и диагностическими признаками
Дефект Диагностический признак
У1 У2 Уз У„
*1 RT RT
*2 VT VT
Хз РТ RT RT
...
Хщ RF RT
282
Рис. 12.7. Связь между лингвистическими значениями истинности, а-се-
чением и значениями принадлежности
сти, называемые а-сечениями [18]. Значение, выбранное для А с
использованием а-сечений, обозначают Аа и определяют в соот-
ветствии с выражением
Аа = {х|/п/((х) > а}.
Связь между лингвистическими значениями истинности, а-се-
чением и значениями принадлежности показана на рис. 12.7.
Применение к формулам (12.14) и (12.15) нечетких правил
позволяет получить следующие взаимосвязи между дефектами и
диагностическими признаками:
у (Л 4“), = (в1;)(- )" V о, (12.16)
(Л? .4"). = (B“)_ )“ у Л 1 (12.17)
для Va е [0,1]; / = 1, т; J = 1, п.
283
В формулах (12.16), (12.17) символ 1 означает отрицание в не-
четкой логике; индексы /, и указывают соответственно на нижние
и верхние границы значений соответствующих величин. При этом
достоверности знаний для Pj, Ру, Bj определяются через интер-
вал их значений [нижнее значение, верхнее значение] следу-
ющим образом:
^=[ру,1],^=[р,,1],
^=[/i,(l),/j,(2)],
Bj фу(1), 6,(2)].
Задавая наблюдаемые диагностические признаки Bj и знания
Pj, Ру, Rv, можно определить множество дефектов {Л,}, для чего
необходимо найти общее решение для соотношений (12.16),
(12.17).
На примере реализации диагностической системы для оценки
текущего состояния доменной печи остановимся еще на одном
способе определения показателя достоверности, а именно с по-
мощью трехмерной обобщенной функции принадлежности.
В общем случае при оценке состояния сложного объекта, како-
вым и является доменная печь, измеряют многочисленные пара-
метры. В диагностической системе доменной печи обычно контро-
лируют состав отходящих газов, давление, температуру в различ-
ных областях печи, уровни засыпки исходных материалов, расход
и давление дутья. Учитывая, что в печи протекают одновременно
три сложные взаимосвязанные реакции газовой, твердой и жид-
костной фаз, при нарушении динамического равновесия между
которыми могут возникнуть различного рода аномальные явле-
ния, на практике для контроля состояния современной доменной
печи используют до тысячи датчиков. При этом показания всех
датчиков, особенно датчиков, используемых для косвенных из-
мерений различных параметров, включают в себя шумы. Следова-
тельно, интерпретация этих показателей будет непременно со-
держать нечеткость, которую необходимо учитывать при построе-
нии диагностической системы.
Положим, что состояние объекта оценивают по некоторой пе-
ременой значение которой в свою очередь оценивают по изме-
ренным значениям соответствующего параметра т. На практике
функция Е, = /(т) в большинстве случаев является непрерывной;
при использовании нечеткого описания в диагностической моде-
ли, как отмечалось ранее, эту функцию необходимо разделить на
несколько уровней, исходя из требуемой полноты описания пе-
ременной
284
Для рассматриваемого примера с доменной печью переменной £
может быть нагрев в определенной области печи, параметром т —
измеренное значение температуры чугуна. В качестве примера при-
ведем один из возможных вариантов разделения состояния нагре-
ва на семь уровней:
Номер уровня Состояние нагрева
1..............................Сильный недогрев
2..............................Недогрев
3..............................Легкий недогрев
4.............................Нормальный нагрев
5..............................Легкий перегрев
6..............................Перегрев
7..............................Сильный перегрев
Естественно, что по одному замеру практически невозможно
определить точно уровень, на котором находится оцениваемая
величина. Для того чтобы вывод был обоснованным, целесооб-
разно пользоваться показателем достоверности по каждому уров-
ню. Возможным способом представления показателя достоверно-
сти на каждом уровне является использование трехмерной обоб-
щенной функции принадлежности, состоящей из трех элементов:
фактические данные (здесь — температура чугуна), заключение
(уровень нагрева) и показатель достоверности.
На рис. 12.8 показана обобщенная функция принадлежности
для температуры, уровня нагрева и показателя достоверности.
Рис. 12.8. Обобщенная функция принадлежности для температуры т, уров-
ня нагрева £ и показателя достоверности £
285
Использование такой функции в процессе решения диагности-
ческой задачи позволяет определить показатель достоверности при
переходе от качественного уровня нагрева к его количественной
оценке. Если, например, измеренное значение температуры со-
ставляет т0, то сечение £ — £ при т = т0 дает показатели достовер-
ности C,j для каждого уровня нагрева (j - 1 — 7).
Таким образом, в данном разделе кратко рассмотрены некото-
рые подходы к использованию принципов теории нечетких мно-
жеств при решении диагностических задач. Достоинства нечеткой
обработки информации становятся особенно очевидными, если
алгоритмы нечеткой логики будут реализованы не только про-
граммно, но и аппаратно с помощью специальных вычислитель-
ных устройств — нечетких компьютеров.
12.3. Методы кластерного анализа при диагностике
систем
Ранее отмечалось, что отличительной особенностью матема-
тических моделей, используемых при решении задачи оценки те-
кущего состояния диагностируемой системы, является наличие
определенной связи между пространством параметров, характе-
ризующих это состояние, и пространством диагностических при-
знаков, при этом вид модели не имеет существенного значения.
Примером такой качественной модели объекта диагностики мо-
жет служить кластерная модель — набор кластеров в пространстве
признаков, каждый из которых соответствует определенному со-
стоянию объекта [12]. Использование методов кластерного анали-
за позволяет решать задачу предварительного разбиения простран-
ства диагностических признаков на классы и отнесения текущего
состояния объекта к тому или иному состоянию, т. е. достаточно
эффективно решать задачу классификации.
Рассмотрим кратко основные положения кластерного анализа.
На рис. 12.9 приведены разнообразные конфигурации точек, пред-
ставляющие информационные диагностические признаки, харак-
теризующие различные состояния объекта диагностирования. Гра-
ницы классов на рисунке проведены в соответствии с интуитив-
ным представлением о том, что кластер — скопление точек —
представляет собой некоторую целостность, чем-то отличающу-
юся от другого скопления точек, причем геометрически разные
кластеры могут касаться друг друга или пересекаться. Анализ рас-
пределения точек в этих кластерах позволяет сделать некоторые
выводы. Например, расстояния между некоторыми точками клас-
са С больше, чем межклассовые расстояния ряда точек в классах В
и С; средние значения признаков в классах Е и F, К и Я одинако-
вы; классы Р и Q соединены цепочкой, которую нужно выделить,
286
Рис. 12.9. Кластерное представление различных состояний объекта диа-
гностирования
и т.д. Следует заметить, что различить все кластеры, подобные
изображенным на рис. 12.9, единым формальным способом чрез-
вычайно трудно. Именно поэтому существуют различные алгорит-
мы формирования и разделения кластеров.
Один из способов формирования кластеров заключается в том,
что задают точное определение кластера и отыскивают скопление
точек, обладающее соответствующими свойствами. Например, кла-
стер можно определить как такое скопление точек, в котором
среднее межточечное расстояние меньше среднего расстояния от
данных точек до остальных. Поэтому основой такого подхода кла-
стерного анализа является формулировка понятия кластера и раз-
биение совокупности точек (в нашем случае — диагностических
признаков) на части, каждая из которых представляет собой кла-
стер в данном смысле. Такой подход часто называют эвристиче-
ским. Алгоритмы, ориентированные на выделение кластеров с за-
ранее заданными свойствами, называют процедурами прямой кла-
стеризации. Основной чертой таких процедур является использо-
вание только одного понятия кластера, т.е. все классы разбиения
будут удовлетворять только этому определению. Если классы име-
ют различный вид, подобные алгоритмы не смогут их разделить.
Поэтому в этом случае используют процедуры комбинированной
прямой кластеризации, которые выделяют классы в смысле не-
скольких определений, т.е. подыскивают для каждого скопления
свойственное ему определение кластера.
На этапе решения задачи классификации, т.е. отнесения теку-
щих диагностических признаков к тому или иному кластеру, важ-
ным является наличие или отсутствие пересечений кластеров. При
этом возможен вариант, при котором пересечение совсем не до-
пускается (отношение эквивалентности). В этом случае все объек-
ты внутри найденного класса считаются тождественными. Если
допускается небольшое пересечение кластеров, то объекты, на-
287
холящиеся на границе двух кластеров, принадлежат обоим клас-
терам. Применительно к задаче диагностики такое состояние бу-
дет иметь место, если одна и та же группа диагностических при-
знаков соответствует разным дефектам. Существует и третья воз-
можность, при которой допускается полное включение одного
кластера в другой, обусловленное определенными правилами, но
не допускается их пересечение. В этом случае имеем дело с иерар-
хическим кластерным анализом, позволяющим и задачу диагнос-
тики решать с иерархических позиций.
Построение кластеров безусловно зависит от характера апри-
орных сведений. При отсутствии априорных сведений — случай
свободной классификации — задают либо число классов, либо
пороговые значения величины близости объектов (классов). При
наличии априорной информации на множестве объектов может
быть задано несколько эталонов — исходных зон, полей. Этало-
ны могут быть следующих видов: подмножество исходного мно-
жества (т.е. первоначальное разбиение на классы); отдельные
объекты; отдельные зоны (точки) метрического пространства (на-
пример, центр тяжести класса или область, в которой предпола-
гается модальная плотность на основании предыдущих исследо-
ваний).
Наличие разнообразных методов кластеризации объясняется
тем, что, по-видимому, не существует универсального метода
кластеризации, пригодного для любых типов исходных данных,
контекстов и целей классификации. Более того, выбор конкрет-
ного метода кластеризации, наиболее удачно классифицирующе-
го данные, сам по себе является довольно сложной задачей, так
как пользователю часто бывает легче сравнить результаты класси-
фикации с интуитивным представлением о структуре данных, чем
сформулировать принципы формирования кластеров. Подобная
ситуация особенно часто возникает в задачах анализа структуры
впервые встретившихся «нестандартных» данных, когда отсутствует
априорная информация о данных, формализуемая в виде опреде-
ленных требований к алгоритму кластеризации и результату его
работы. Поэтому в подобных задачах необходимо исследовать до-
пустимые кластеризации исходного множества для выявления
общего в их структуре, с тем чтобы разработать соответствующие
алгоритмы кластеризации [12].
Таким образом, процедура построения кластерной модели
объекта сводится к следующему. Пусть априори исходное множе-
ство состояний объекта D подразделено на классы Dy (/= 1,..., X)
и проведен выбор наиболее информативных диагностических при-
знаков, на множествах значений которых будет осуществляться
классификация X = {хь ..., х(,..., х„}. Для построения кластерной
модели объекта диагностические признаки, соответствующие раз-
личным состояниям объекта, формируются в признаковом про-
288
странстве в кластеры при помощи выбранного алгоритма класте-
ризации. В результате для каждого класса Dy получают зависимости
вида Dy = Pj{xx, xt,х„), т.е. каждому состоянию диагностиру-
емого объекта ставят в соответствие набор значений диа-
гностических признаков — вектор, элементы которого могут быть
непосредственно измерены (первичные диагностические призна-
ки) или вычислены (вторичные диагностические признаки).
При решении этой задачи необходимо также оценить нечет-
кость классов: если классы хорошо различимы в пространстве
признаков, можно использовать алгоритмы четкой диагностики,
дающие однозначный ответ о принадлежности сигнала к одному
из сформированных кластеров. Если существует пересечение клас-
сов, требуется построить функции принадлежности классов, на
основании которых будет осуществляться нечеткая диагностика.
Для оценки степени пересечения классов необходимо определить
объем их пересечения.
Таким образом, каждый класс состояний объекта диагностики
характеризуется кластером — совокупностью точек в диагности-
ческом пространстве признаков, полученных в результате проце-
дуры кластеризации, а также в зависимости от используемого ал-
горитма кластеризации — центром или центральной линией и
функцией принадлежности. В процессе проведения оценки теку-
щего состояния диагностируемого объекта эти кластеры будут
представлять эталонные классы, с которыми и будет соотносить-
ся текущее состояние этого объекта.
Для выполнения проверки значимости процедуры кластериза-
ции целесообразно сформулировать подходящую нулевую гипотезу
(например, все коэффициенты сходства равны нулю; все Sv= 1;
все Sy равны между собой, но не равны 0 или 1) и проверить ее
выполнение [12].
Алгоритмы кластерного анализа находят особенно широкое
применение при оценке состояния динамических систем, харак-
теризующихся временной изменчивостью структуры, аналитиче-
ское выражение которой затруднено (либо невозможно) непос-
тоянством в процессе развития набора входных и выходных пара-
метров системы, а также зашумленностью и значительным уров-
нем априорной неопределенности.
12.4. Fuzzy-технологии в задачах диагностики систем
Кластеризация представляет собой метод разбиения множества
разбросанных данных на несколько групп. Разбиение осуществля-
ют так, чтобы данные в одной группе обладали похожими свой-
ствами, а свойства в среднем между группами максимально раз-
личались. Для решения задач классификации подобного рода пред-
289
ложено [16] использовать новое понятие — свойство размытой
близости, которое означает следующее:
• если степень сходства объектов х и у велика, то у них высока
степень принадлежности к некоторому кластеру;
• если степени принадлежности объектов х и у к различным кла-
стерам высоки, то они не обладают высокой степенью сходства.
Кластеры, порожденные процедурой кластеризации, называ-
ют размытыми, если они обладают свойством размытой близости.
Метод fuzzy-кластеризации использует в качестве исходных дан-
ных пространство состояний X исследуемого объекта:
X = {х1; х2, ..., х„},
где X; g R1 — d-мерный вектор состояния, элементами которого
являются значения параметров объекта, полученные на этапе сбора
информации.
Перед кластеризацией целесообразно провести выбор наибо-
лее информативных координат, на множествах значений которых
будет осуществляться кластеризация. Задача состоит в том, чтобы
разбить множество X на с кластеров (2 < с < п).
Степень принадлежности ху Л-му кластеру обозначают ukj. При
жесткой кластеризации ukj принимает два значения: 0 или 1, т.е.
ukj е {0, 1}, при нечеткой кластеризации значение ukJ может быть
любым от 0 до 1: ukj е [0, 1], но всегда должно выполняться усло-
вие:
>0-
j
Нечеткая кластеризация допускает принадлежность данных к
двум или более кластерам, но при этом сумма степеней принад-
лежности составляет 1, a ukJ является весом принадлежности к кла-
стеру, которую можно определить, применяя нечеткую логику.
Пусть Mfc — множество (сх л)-матриц U (называемых матрица-
ми разделения), элементами которых являются степени принад-
лежности uig вектора х7- к-му кластеру. В этом случае кластеризация
является процедурой соединения множества данных X и матрицы
разделения U.
Одной из таких процедур, основанной на методе ^-средних с
учетом нечеткой кластеризации, является алгоритм, когда за це-
левую функцию, определяющую качество размытого разбиения,
принимают сумму квадратичных ошибок, или функционала каче-
ства, в обобщенной группе:
ПС j
•ми, v) = z t КГ к - М ’1 *т < °°, (12.18)
где Xj — d-мерные измеренные данные; v* — d-мерный вектор,
центр £-го кластера; ||. ..|| — произвольная норма, отражающая
290
подобие измеренных данных и центра кластера; т — коэффици-
ент нечеткости.
Эта процедура носит название процедуры нечеткой кластери-
зации по с-средним FCM (Fuzzy C-Means) [16]. При решении
задачи диагностики целесообразно использовать в качестве нор-
мы евклидово расстояние как наиболее универсальное.
При т = 1 и ukj, = {0, 1} процедура минимизации критерия
(12.18) выполняется по классическому методу ^-средних. Чем су-
щественнее значение т превосходит 1, тем более нечеткой стано-
вится кластеризация. Таким образом, особенностью FCM-алго-
ритма является возможность произвольным образом адаптироваться
к нечеткостям, иначе говоря, чем меньше уверенность в точности
данных, снимаемых датчиками с диагностируемого объекта, тем
большее значение задается для коэффициента нечеткости.
Сумма квадратичных ошибок Jm(U, v) выполняет роль оценки
взвешенной дисперсии точек из X относительно оптимального
расположения центров кластеров v„ ..., v*. Значения ukj и при
которых Jm (U, v) принимает минимальное значение, обозначают
Ukj и vA; при т > 1 они удовлетворяют следующим условиям [16]:
(12.19)
--~Ук-
v*
(12.20)
Значения и^, обеспечивающие минимум выражения (12.18), мож-
но найти с помощью итеративной процедуры, изложенной в [16].
Сначала выбирают значение коэффициента нечеткости т, число
кластеров с и задают соответствующую норму в выражении (12.19).
Для матрицы разделения U задают начальное значение U(0), кото-
рое целесообразно выбрать случайным образом независимо от ukj.
Далее, используя U(0) по выражению (12.20) вычисляют векторы
центров кластеров {vp} и затем в соответствии с выражением
(12.19) определяют новые значения элементов матрицы степеней
принадлежности U(1). После задания подходящей нормы и гра-
ничного значения е для определения момента завершения вычис-
лений выполняют все предыдущие шаги до тех пор, пока не будет
выполнено условие ||U<₽) - U(/,_|)|| < е.
Полученные таким образом элементы ukj матрицы U характе-
ризуют степень принадлежности ху кластеру к. Данная процедура
291
нечеткой кластеризации в соответствии с FCM-алгоритмом все-
гда сходится [17]. При ее реализации вначале число кластеров с
выбирают приблизительно на основе предварительной оценки про-
цессов, происходящих в диагностируемом объекте. Варьируя чис-
ло с как в меньшую сторону, так и в большую, следует выяснить,
какое из них будет наилучшим образом представлять возможные
состояния контролируемого объекта.
Для оценки качества полученного разбиения может служить
критерий на основе матрицы разбиения [17]:
пс
<12.21)
;=1 к=1 п
где U — матрица степеней принадлежности для выбранных ко-
эффициента нечеткости и числа кластеров.
Расчет критерия (12.21) осуществляют для определенного ко-
эффициента размытости и различного числа кластеров. Чем мень-
ше размытость данных, тем большие значения принимает ко-
эффициент. Максимальное его значение соответствует оптималь-
ному числу кластеров. Варьируя коэффициент нечеткости и число
кластеров, можно построить поверхность в трехмерном про-
странстве, позволяющую выбрать оптимальное число класте-
ров.
Поскольку формулы (12.19) и (12.20) определяют минимум
функционала качества Jm, то, изменяя начальное значение мат-
рицы степеней принадлежности U, можно изменять и результа-
ты кластеризации. Для получения хорошего результата следует
более внимательно подходить к выбору начального значения.
Кроме того, при нахождении минимума функционала Jm в лю-
бом случае трудно распознать небольшую изолированную область,
т. е. вместо глобального минимума можно при поиске экстрему-
ма функционала достичь локального минимума, что приведет к
получению неадекватных результатов. Поэтому рекомендуют вы-
полнять процедуру в соответствии с FCM-алгоритмом несколь-
ко раз с различными начальными значениями матрицы разделе-
ния.
Результатом реализации FCM-алгоритма является алфавит клас-
сов, на основе которого формируют нечеткую кластерную модель
объекта (рис. 12.10) путем задания лингвистического соответствия
полученным эталонам возможных различных состояний (в том
числе и дефектов), которые может принимать в процессе функ-
ционирования контролируемый объект.
Недостатком рассмотренного метода получения кластерной
модели объекта, который получил название алгоритма эталонной
fuzzy-классификации, является то, что эта модель жестко задана
292
Пространство состояний объекта (выборка)
Рис. 12.10. Алгоритм получения нечеткой кластерной модели объекта
293
после этапа кластеризации. В то же время fuzzy-модель состояний
объекта целесообразно использовать для работы в условиях, когда
множество состояний этого объекта не может быть априори сфор-
мировано, что происходит, если в процессе предварительного изу-
чения объекта в целях выявления его возможных состояний были
исследованы не все возможные варианты и которые не будут уч-
тены в кластерной модели, что может привести к неверной оцен-
ке текущего состояния объекта. Кроме того, если объект не стаци-
онарен, т.е. его модель, составленная на конкретный момент вре-
мени, не соответствует реальности в другой момент времени,
сформированное на этапе предварительной кластеризации мно-
жество будет также неполным.
Для решения этих проблем целесообразно применять алгоритм
fuzzy-классификации с динамическим формированием классов,
который предоставляет возможность изменять модель объекта в
процессе его исследования в соответствии с текущим состоянием
и дополнять ее новыми классами.
Кластерную модель объекта уточняют прямо в ходе диагности-
рования, при этом добавляют новые кластеры, уточняют уже
имеющиеся параметры модели. Исходную модель строят на осно-
ве первого полученного вектора состояний объекта — координа-
ты первого кластера полагают равными значениям информатив-
ных признаков. В этой модели хранится информация обо всех по-
лученных кластерах и на каждом шаге кластеризации центры уже
существующих кластеров будут «подстраиваться» для новых дан-
ных. Число кластеров в такой модели не постоянно, т.е. новые
кластеры добавляют постепенно в процессе работы системы диаг-
ностирования, поэтому если появляется новый кластер, целесо-
образно сделать пересчет уже имеющихся центров кластеров, чтобы
не утрачивать информацию. Распознавание состояний объекта ос-
новывается на сравнении той или иной меры близости распозна-
ваемого состояния с каждым классом и в случае, если новое со-
стояние сложно отнести к какому-либо уже имеющемуся классу,
формируют новый класс, которому дают лингвистическое описа-
ние. Таким образом, происходит построение fuzzy-модели клас-
сификации состояний диагностируемого объекта с динамическим
формированием классов [16].
Процедуру работы алгоритма fuzzy-классификации с динами-
ческим формированием классов (рис. 12.11) можно представить в
виде последовательных этапов. За исходную модель состояний
объекта принимают эталонную кластерную модель, полученную
в результате реализации алгоритма эталонной fuzzy-классифика-
ции. При поступлении сигнала текущего состояния объекта вы-
числяют значения его т информативных признаков и значения
степени принадлежности сигнала ц, (/ = 1, ..., п) каждому из эта-
лонных классов. Затем вычисляют евклидовы расстояния между
294
Рис. 12.11. Алгоритм fuzzy-классификации с динамическим формирова-
нием классов
295
центрами эталонных классов 1у и выбирают максимальное из них
(max 19):
MWI2-
После этого определяют расстояния между центрами эталон-
ных классов и текущим сигналом Нк и выбирают максимальное
(max lik):
Ы1*/-М2-
Если max lik < max ly, можно сделать вывод о принадлежности
текущего сигнала /-му классу по максимальному значению степе-
ни принадлежности.
12.5. Нейросетевая эталонная fuzzy-классификация
Для реализации алгоритма эталонной fuzzy-классификации
может быть использована нейронная сеть Кохонена [17]. Рассмот-
рим основные свойства этой сети. Простейшая структура нейрон-
ной сети Кохонена, состоящая из двух слоев нейронов, представ-
лена на рис. 12.12.
Нейроны входного нулевого слоя служат лишь точками развет-
вления и не выполняют вычислений. Каждый нейрон этого слоя
имеет соединение с каждым нейроном первого слоя, называемо-
го слоем Кохонена, отдельной связью с весом wm„.
Сила связей нейронов слоя Кохонена, расположенных на плос-
кости, зависит от расстояния между этими нейронами. Такой вид
связей обеспечивает взаимное усиление сигнала близкими нейро-
нами и ослабление влияния далеких нейронов, что делает более
контрастной границу раздела возбужденных нейронов от осталь-
ных, ложное возбуждение которых таким образом подавляется.
Результатом работы сети Кохонена при подаче на входной слой
некоторого вектора является определение нейрона, который воз-
бужден более других («нейрон-победитель»). В простейшей форме
сеть Кохонена функционирует по принципу: «победитель получа-
ет все», т.е. для данного входного вектора один и только один
нейрон Кохонена выдает на выходе логическую единицу, на вы-
ходах остальных нейронов наблюдается логический ноль.
Таким образом, каждый нейрон Кохонена соединяется через
входной слой с входными сигналами хь хг, ..., хт, составляющи-
ми входной вектор X. Например, на рис. 12.12 нейрон Кохонена
К, соединяется с входными нейронами с весами wlb w21, ..., wml,
которые будут составлять весовой вектор w,. Набор весовых векто-
ров образует матрицу весов W, характеризующую сеть в целом.
296
Вектор wi
Слой
Кохонена
Рис. 12.12. Структура нейронной сети Кохонена
Подобно нейронам большинства сетей выход NET каждого
нейрона Кохонена является просто суммой взвешенных входов,
что может быть выражено следующим образом:
NET; = WVX| + wyx2 + - + wmJxm,
где NETy — это выход NET j-ro нейрона Кохонена.
Нейрон Кохонена с максимальным значением NET является
«нейроном-победителем».
Слой Кохонена классифицирует входные векторы в группы
схожих векторов. Это достигается с помощью такой подстройки
весов слоя Кохонена, что близкие входные векторы активируют
один и тот же нейрон данного слоя.
Процесс обучения сети Кохонена является самообучением,
протекающим без учителя. Поэтому трудно предсказывать, какой
именно нейрон Кохонена будет активироваться для заданного
входного вектора. Необходимо лишь гарантировать, чтобы в ре-
зультате обучения разделялись несхожие входные векторы.
При обучении слоя Кохонена на вход сети подают входной
вектор X и вычисляют его скалярные произведения с векторами
весов, каждый из которых характеризует связь со всеми нейрона-
ми Кохонена. Нейрон с максимальным значением скалярного про-
изведения объявляют «победителем» и его веса подстраивают. Про-
цесс обучения состоит в выборе нейрона Кохонена с весовым
вектором, наиболее близким к входному вектору, и дальнейшем
приближении весового вектора к входному. При этом нейронная
сеть самоорганизуется таким образом, что определенный нейрон
297
Кохонена имеет максимальный выход для определенного входно-
го вектора. Уравнение, описывающее процесс обучения, имеет
следующий вид:
WH = wc + а(х - wc),
где wH — новое значение веса, соединяющего входную компонен-
ту х с выигравшим нейроном; wc — предыдущее значение этого
веса; а — коэффициент скорости обучения, который можно варь-
ировать в процессе обучения.
Переменная а является коэффициентом скорости обучения, ко-
торый вначале обычно равен - 0,7 и может постепенно умень-
шаться в процессе обучения. Это позволяет делать большие на-
чальные шаги для быстрого грубого обучения и меньшие шаги
при подходе к окончательной величине. Как правило, обучающее
множество включает много сходных между собой входных векто-
ров, и сеть должна быть обучена активировать один и тот же ней-
рон Кохонена для каждого из них. В этом случае веса этого нейро-
на должны получаться усреднением входных векторов, которые
его активируют. Постепенное уменьшение коэффициента а сни-
жает воздействие каждого обучающего шага, так что окончатель-
ное значение будет средней величиной от входных векторов, на
которых происходит обучение. Таким образом, веса, ассоцииро-
ванные с нейроном, примут значение, находящееся вблизи «цен-
тра» входных векторов, для которых данный нейрон является «по-
бедителем».
Всем весам сети перед началом обучения следует придать на-
чальные значения. Общепринятой практикой при работе с ней-
ронными сетями является присваивание весам небольших случай-
ных значений. При обучении слоя Кохонена случайно выбранные
весовые векторы необходимо нормализовать, тем самым сокра-
тив время обучения.
Для полностью обученной сети вероятность того, что случайно
выбранный входной вектор (в соответствии с функцией плотности
вероятности входного множества) будет ближайшим к любому за-
данному весовому вектору, равна 1/к, где к — число нейронов Ко-
хонена. Это оптимальное распределение весов на сложной поверх-
ности. Так как обучение проводится без указания целевого вектора,
нет возможности определить заранее, какой нейрон будет соответ-
ствовать данному классу входных векторов. Тем не менее эта проце-
дура легко проводится путем тестирования сети после обучения.
Рассмотренный алгоритм обучения сети обеспечивает форми-
рование набора из п входных весов нейрона как вектора в «-мер-
ном пространстве.
После подачи вектора X на вход нейронной сети определяют
расстояния Dj (в «-мерном пространстве) между X и весовыми
298
векторами wy каждого нейрона. В евклидовом пространстве это рас-
стояние вычисляют по следующей формуле:
где х, — i-я компонента входного вектора X; — вес /-го входа
для каждого у-го нейрона, при этом нейрон, который имеет весо-
вой вектор, самый близкий к X, объявляют «победителем».
Далее для всех весовых векторов происходит настройка групп
весовых векторов в соответствии со следующим выражением:
W,(/ + l) = Wy(r) + a[X-Wy(/)].
Эту процедуру повторяют для каждого входного вектора X.
В процессе обучения нейронной сети значения D и а постепен-
но уменьшаются. Рекомендуется устанавливать коэффициент а в
начале обучения приблизительно равным 1 и уменьшать его в про-
цессе обучения до 0.
Обучающий алгоритм настраивает весовые векторы в окрест-
ности возбужденного нейрона таким образом, чтобы они были
похожими на входной вектор. Так как все векторы нормализуются
в векторы с единичной длиной, они могут рассматриваться как
точки на поверхности единичной гиперсферы. В процессе обуче-
ния группа соседних весовых точек перемещается ближе к точке
входного вектора. Предполагается, что входные векторы факти-
чески группируются в классы в соответствии с их положением в
векторном пространстве. Определенный класс будет ассоцииро-
ваться с определенным нейроном, перемещая его весовой вектор
в направлении центра класса и способствуя его возбуждению при
появлении на входе любого вектора данного класса.
После обучения выполняют классификацию посредством по-
дачи на вход сети испытуемого вектора, вычисления возбуждения
для каждого нейрона с последующим выбором нейрона с наи-
высшим возбуждением как индикатора правильной классифика-
ции.
Идея модификации сети Кохонена состоит в введении в алго-
ритм обучения значений принадлежности и комбинирования па-
раллельности FCM-алгоритма со структурой и адаптационным пра-
вилом сети Кохонена. В этом случае принимают сетевую структуру
сети Кохонена и вместе с этим в правило адаптации встраивают
FCM-алгоритм.
Процедура использования модифицированной сети Кохонена
состоит из ряда этапов. Сначала определяют сетевую структуру
путем задания числа нейронов не менее двух, и устанавливают
299
порог конвергенции е > 0. Кроме того, задают меру расстояния,
например евклидово расстояние. Затем проводят инициализацию
весовых векторов v,, нейронов с использованием случайных чисел
и выбирают подходящие значения для величины т0 > 1 и ширины
шага Ат:
с; У к = 1,
aik,t — (uik,t)"" •>
mt = т^1Лт,
где v/;/ — весовой вектор z-го нейрона на протяжении обучающего
шага /; — принадлежность объекта к /-му нейрону на обучаю-
щем шаге Г, хк — характеристический вектор объекта Л; mt — экс-
поненциальный вес на протяжении обучающего шага Г, т$ — стар-
товое значение экспоненциального веса; Ат — экспоненциальная
ширина шага; с — число нейронов; К — число объектов.
Адаптацию весовых векторов v,;, проводят в соответствии с
выражением
к
= Vij-I + v/ = 1,..., с.
k-l
Для оценки качества процесса обучения рассчитывают матри-
цу принадлежности Е, на последнем шаге:
с к ~
Е, = £ X II"/*./ ~ "/*./-111 •
<=1 t=i
Процесс обучения сети заканчивается в случае, если измене-
ние для выбранной нормы матрицы принадлежности будет мень-
ше, чем заранее заданное значение порога конвергенции е. В про-
тивном случае возвращаются в начало и формируют новый шаг
обучения.
После того как получена нейронная модель объекта, можно
осуществлять эталонную классификацию (рис. 12.13). Ее реализу-
ют путем сопоставления полученного вектора диагностических при-
знаков объекта с функциями принадлежности каждого нейрона.
При проведении классификации следует учесть, что функции
принадлежности имеют дискретный вид, т. е. если текущее состо-
300
Рис. 12.13. Алгоритм формирования соответствия лингвистических термов
полученным нейронам
яние не было представлено в пространстве состояний перед про-
ведением обучения сети, то, чтобы найти его степень принадлеж-
ности к данному нейрону, следует применить аппарат аппрокси-
мации, используя точки в этом пространстве, между которыми
оно оказалось. Таким образом, находят значения функций при-
надлежности каждого нейрона для текущего состояния. Конеч-
ным результатом работы алгоритма классификации являются сте-
пени принадлежности вектора текущего состояния к различным
нейронам, что позволяет определять, например, наличие конк-
ретной неисправности или состояние нормального функциони-
рования объекта диагностирования.
301
Темы для повторения
1. Основные особенности методологии нечетких выводов.
2. Свойства функции принадлежности тА.
3. Продукционные правила нечеткой логики.
4. Построение диагностической модели на основе нечетких отноше-
ний.
5. Использование трехмерной обобщенной функции принадлежности
для решения диагностической задачи.
6. Основные положения кластерного анализа.
7. Использование априорных сведений при построении кластеров.
8. Процедура построения кластерной модели объекта диагностирова-
ния.
9. Метод fuzzy-кластеризации, его преимущества при решении диаг-
ностических задач.
10. Этапы формирования нечеткой кластерной модели диагностируе-
мого объекта.
11. Этапы проведения fuzzy-классификации с динамическим форми-
рованием классов.
12. Процедура использования модифицированной сети Кохонена.
Глава 13
ПРОГНОЗИРОВАНИЕ СОСТОЯНИЯ ТЕХНИЧЕСКИХ СИСТЕМ
13.1. Задача прогнозирования
Задача прогнозирования изменения свойств технической си-
стемы тесно связана с задачей диагностики текущего состояния
этой системы. Принципиальное отличие заключается в том, что
при прогнозировании оценка состояния диагностируемой систе-
мы производится для будущего момента времени. Эту оценку на-
ходят по результатам текущих наблюдений на определенном про-
межутке времени путем экстраполяции значений параметров на
будущий момент времени. Естественно, что достоверность про-
гноза определяется объемом информации о механизме происхо-
дящих в диагностируемой системе процессах, наличием обосно-
ванных физических и математических моделей отдельных измене-
ний, возможностью учета множества действующих факторов. Кроме
того, имеется еще одна сложность при решении задачи прогнози-
рования, которая заключается в индивидуальном характере изме-
нения параметров устройств, что связано с первоначальным раз-
бросом параметров комплектующих элементов, погрешностями
сборки и другими факторами.
Поэтому задача прогнозирования качества функционирова-
ния технических систем сводится к задаче экстраполяции век-
торного случайного процесса по результатам его наблюдения
на некотором интервале времени. При этом прогноз предсказы-
вает будущее значение случайного процесса не точно, а с не-
которой вероятностью (точечный прогноз), или предсказывает
ту область, в которую с заданной вероятностью попадает буду-
щее значение процесса (интервальный прогноз).
В такой постановке прогнозирование состояния технической
системы переходит в текущий диагностический контроль при
нулевом времени экстраполяции и, следовательно, прогнози-
рование можно рассматривать как более общий случай проце-
дуры диагностирования.
Таким образом, множество параметров, характеризующих те-
кущее состояние системы, можно рассматривать в качестве век-
торного случайного процесса. Именно случайный характер изме-
нения физических параметров технических систем в процессе их
303
эксплуатации делает трудно предсказуемыми будущие значения
этих параметров и накладывает естественные ограничения на при-
менение для решения задач прогнозирования так называемых ана-
литических методов, при которых изменение параметров рассмат-
ривается как детерминированный процесс. Хотя нужно заметить,
что такой подход из-за его относительной простоты находит дос-
таточно широкое распространение на практике и дает более-ме-
нее удовлетворительные результаты при небольших интервалах эк-
страполяции.
При формальной постановке задачи прогнозирования возмож-
ны два принципиально разных случая. В первом случае, называе-
мом интегральным, оператор прогнозирования 6, определяется
из условия экстремума выбранного критерия оптимальности, при-
меняемого ко всему множеству диагностических сигналов
{Х(*/)}, i = 1,л. Это позволяет получить значение оценки вектора
параметров в будущий момент времени ,tn + т в виде
U(/„ + T) = (71{X(0},/ = i^,
где т — время прогнозирования; U(4 + т) — оценка вектора пара-
метров в будущий момент времени.
Во втором случае, называемом рекуррентным, оператор про-
гнозирования G2 необходимо определить из условия экстремума
критерия оптимальности, который применяют только к поел е -
днему наблюдению Х(/„) и оценке вектора параметров, по-
лученной на предшествующем шаге tn\'-
U(4+T) = G2{X(/n),U(/„_l+t)}.
Тем самым при применении рекуррентного оператора после
каждого последующего наблюдения проводится прогноз на время
т. Преимущество такого подхода заключается прежде всего в ми-
нимизации объемов требуемой памяти вычислительного устрой-
ства, так как для расчетов в этом случае необходимо хранить
только значение вектора + т) и последнего наблюдения
Х(/„). Таким образом, если вектор параметров имеет размерность
т, то в памяти должно находиться 2т чисел. При интегральном
алгоритме прогнозирования необходимо запоминать тп чисел,
поскольку при обработке используются все предшествующие п
наблюдений /n-мерных векторов. Поэтому интегральный способ
прогнозирования целесообразно применять в случаях, когда от-
сутствуют ограничения на время решения задачи прогнозирова-
ния и имеется вычислительная машина с достаточным объемом
памяти.
304
Определение операторов прогнозирования Gj и G2 возможно
традиционным путем минимизации среднего квадрата ошибки
D = min М |[U(/n + т) - U* (t„ + т)]Г [U(/„ + -с) - U* (tn + т)]},
где М — оператор математического ожидания; U*(/„ + т) — «ис-
тинное» значение вектора параметров в прогнозируемый момент
времени.
Минимизация величины D осуществляется путем выбора опе-
ратора (?! или G2.
Таким образом, для решения задачи прогнозирования необхо-
дима априорная информация о характеристиках вектора парамет-
ров U(Z). В процессе функционирования технических систем эти
параметры, как уже неоднократно отмечалось, имеют как бы две
составляющие, а именно: медленную — дрейф и быструю — скач-
кообразные отклонения. Под дрейфом параметров понимают сово-
купность физико-химических процессов коррозии, усталостной
деформации, механического износа, которые в свою очередь обу-
словлены различного рода дефектами диагностируемого устрой-
ства и эксплуатационными перегрузками. Заметим, что дрейф
параметров может способствовать возникновению скачков, так как,
например, накопление усталостной деформации или коррозия
уменьшает пределы прочности конструкции. Из всего сказанного
выше можно сделать вывод о том, что задача прогнозирования
состояния технической системы во многом сводится к прогнози-
рованию дрейфа параметров этой системы.
Экспериментальные данные показывают, что в большинстве
случаев дрейф параметров является нестационарным случайным
процессом, причем характерной особенностью этого процесса
является большое время корреляции, превосходящее время ре-
сурса того или иного элемента или устройства в целом.
В качестве математической модели дрейфа параметров возмож-
но использование полиномиальной зависимости в виде
X
(13.1)
к=1
где i — номер параметра; X — порядок полинома; uik — случайные
коэффициенты, характеризующие: иа — начальное значение,
иа — скорость изменения, — ускорение и т.д.
На практике, как правило, ограничиваются полиномом второ-
го порядка. В этом случае выражение (13.1) можно записать, опус-
кая номер параметра, в виде
и = щ + u2t + u2t2. (13.2)
При небольших временах прогноза в ряде случаев можно огра-
ничиться и линейной зависимостью
305
и = щ+ u2t.
(13.3)
Следует отметить, что полное описание моделей дрейфа пара-
метров, кроме зависимостей (13.2) или (13.3), должно включать
также совместный закон распределения вероятности коэффици-
ентов полинома — случайных величин, который в большинстве
случаев аппроксимируется нормальным законом с уровнем зна-
чимости 0,05.
Полная модель процесса изменения параметров должна вклю-
чать и модель, описывающую скачки параметров. В качестве тако-
вой может служить случайный процесс, в котором появление скач-
ков происходит в случайные моменты времени, а значения пара-
метров после скачка являются случайными величинами. Обычно
ограничиваются упрощенной моделью, в которой закон распре-
деления вероятности моментов времени появления скачков при-
нимают пуассоновским, а значение параметра после скачка счи-
тается известным. В этом случае математическое ожидание неко-
торого параметра записывают в виде
«(/) = е_₽'(М| + u2t + i/3/2) + (1 - е_р')й>
где е_₽' — вероятность того, что скачка за время t не будет; (1 -
- е"^') — вероятность появления хотя бы одного скачка за время /;
(«I + u2t + w3/2) — значение параметра до скачка; а — значение
параметра после скачка.
Рассмотренные модели не отражают того факта, что реальное
измерение параметров сопровождается помехами и ошибками
измерения. Для учета в модели этого факта в предположении, что
справедлива гипотеза об аддитивном характере смеси «истинно-
го» значения параметра u(t) и ошибки наблюдения N(t), можно
наблюдаемое значение параметра представить в виде
x(Z) = u(t) + N(t).
Рассмотренный подход к прогнозированию параметров реали-
зован в виде алгоритмов вычисления коэффициентов полиномов
по наблюдаемым данным. Формулы для оптимальной оценки /-го
коэффициента полинома для общего и ряда частных случаев при-
ведены в [2].
13.2. Основные методы прогнозирования
В основу решения задачи прогнозирования могут быть положе-
ны два различных подхода. Первый базируется на том, что оценка
прогнозируемого явления осуществляется на основе аналогии с
достаточно хорошо известными явлениями и процессами, позво-
306
ляющей построить соответствующую прогностическую модель. Вто-
рой подход к получению прогноза предполагает условное продол-
жение в будущее тенденций и закономерностей изменения состо-
яния диагностируемого объекта в настоящем и прошлом, т.е. яв-
ляется экстраполяционным.
Методы прогнозирования, реализующие первый подход, пред-
полагают наличие некоторой математической прогностической
модели, например в виде системы интегродифференциальных
уравнений, достаточно адекватно описывающей процессы, про-
исходящие в диагностируемом объекте. Однако во многих случаях
получение таких адекватных моделей объектов, которые к тому
же отражали бы их индивидуальные особенности, является делом
весьма трудным, что в значительной мере ограничивает примене-
ние на практике подобных методов. Более распространенными
являются методы прогнозирования, основанные на схеме экстра-
поляции. Основу этих методов составляет оценка трендовых тен-
денций параметров на базе временных рядов.
Генерирование временных рядов значений параметров в целях
получения экстраполяционных прогнозных оценок требует вычис-
ления взвешенных значений предыдущих наблюдений путем при-
менения различных способов сглаживания [14]. Одним из таких
способов, достаточно широко распространенных, является метод
экспоненциального сглаживания, фактически являющийся обобще-
нием метода скользящего среднего, также применяемого для опе-
рации сглаживания результатов текущих наблюдений.
Экспоненциальным сглаживанием данных называется опера-
ция [8]:
ut = aut + (1 - a)ut~i, (13.4)
где ut — сглаженное значение результата наблюдения, проведен-
ного в момент Г, и, — текущее значение результата наблюдения за
диагностируемой системой в момент Г, ut\ — сглаженное значе-
ние результата наблюдения в предыдущий момент (/ - 1); а —
коэффициент сглаживания (весовой коэффициент), 0 < а < 1.
Выражение (13.4) означает, что текущее значение сглаженной
величины ut равно сумме предыдущего значения и некоторой
доли разности между текущим значением результата наблюдения
и предыдущим значением сглаженной величины.
С учетом того, что операция сглаживания проводится одина-
ково для всех наблюдений, имеем
~ л-1
(! - а)' «г-1 + (1 - а)л «о,
<=1
где п — число наблюдений; м0 — значение начального наблюде-
ния.
307
Отсюда видно, что в сглаженной оценке ut наибольший вес
имеет текущее значение и„ а для предыдущих наблюдений веса
убывают по геометрической прогрессии.
Нахождение оценок коэффициентов прогнозирующего поли-
нома путем применения операции экспоненциального сглажива-
ния можно показать на простом примере, когда наблюдаемый
процесс описывается линейной моделью вида
и(0 = Ц>+а1/. (13.5)
Применение экспоненциального сглаживания к выражению
(13.5) дает
м(Г) = Ц) + <V~4(1 -а)/а; (13.6)
после повторного экспоненциального сглаживания, называемого
двойным экспоненциальным сглаживанием, получим
и2) =Оо +о1^-2а1(1-а)/а. (13.7)
Решая совместно уравнения (13.6) и (13.7), можно найти оценку
коэффициента ах в модели процесса
Г" ~<2>1г //1 м
Ci = lur-ut |a/(l-a)J,
а точечный прогноз в точке (/ + ДО будет определяться как
u(t + Д/) = ut + а, Д/.
Используя рекуррентные соотношения [8], связывающие те-
кущие значения прогнозируемых коэффициентов линейной мо-
дели с их предыдущими значениями и линейным поправочным
членом, можно определить прогнозируемое на т измерений воз-
можное значение параметра, обозначенного и("р т):
«("%» =аооо+ацп)т,
где значения а0(Л) и ацП) вычисляют по рекуррентным зависимос-
тям:
Ц)(Я) = «(«) + (1 - а)2 [«$ - «(Л) ],
ацп) = °1(я-1) _а2[и("р - ы(и)].
В этих соотношениях и(л) — значение параметра, вычисленного
при и-м измерении; — прогнозированное на один замер зна-
308
чение параметра, полученное при предыдущем прогнозе, т.е. по
п - 1 измерениям.
При этом начальные условия, необходимые для вычисления а0
и аь задаются в следующем виде:
^(п-к) = и(п-к)>
а\(п-к) = О,
где «(„_*) — значение параметра, определенное при ранее прове-
денном измерении с номером (л-Л); к — граничное число значе-
ний, используемых при прогнозе.
Важную роль в методе экспоненциального сглаживания играет
выбор а. В зависимости от значения а прогнозные оценки по-раз-
ному учитывают влияние исходного ряда наблюдений. Очевидно,
что чем больше а, тем больше вклад последних наблюдений в
формирование тренда, а влияние начальных условий быстро убы-
вает. При малых а прогнозные оценки учитывают большую часть
наблюдений и, естественно, уменьшение влияния более «старой»
информации происходит медленно.
Зависимость, определяющая вес наблюдения, сделанного в
момент времени (/ - л), при применении экспоненциального сгла-
живания будет выражаться в виде а(1 - а)л, т.е. вес такого наблю-
дения будет пропорционален (1 - а)". По данным, приведенным в
табл. 13.1, для обычно рекомендуемых значений а можно сделать
заключение о числе наблюдений, необходимых для прогноза.
Дополнительным фактором, влияющим на ошибку прогноза,
является размер интервала упреждения. Действительно, с увели-
чением этого интервала дисперсия возрастает. Для линейной мо-
дели прогнозируемого процесса дисперсию прогноза (при дей-
ствии аддитивной помехи) можно вычислить по формуле [8]:
Л«,+д/) = + 4₽ + 5₽2 + 2d + 2Р - 302)Д, + 2(1 - р2)/Д/2] Dn,
где р = 1 - a; Dn — дисперсия помехи.
Используя оценки дисперсии прогноза как доли дисперсии
помехи при различных интервалах упреждения, приведенных в
табл. 13.2, можно выбрать возможный интервал упреждения, удов-
летворяющий требуемым показателям качества при определенных
значениях а.
Все изложенное выше справедливо в основном при стабиль-
ном протекании процесса на участках наблюдения и упреждения.
Общая рекомендация по уменьшению ошибок прогноза путем
увеличения объема исходного числа точек на интервале наблюде-
309
Таблица 13.1
Коэффициент сглаживания и число наблюдений, необходимых
для прогноза
а (1-а)"
71 = 2 77 = 4 77 = 8 77 = 16 77 = 32 77 = 64
0,05 0,900 0,815 0,664 0,440 0,194 0,038
0,10 0,810 0,656 0,430 0,185 0,034 0,0001
0,20 0,640 0,410 0,168 0,028 0,0008 =0
ния, используемых для формирования трендовой модели, а так-
же уменьшения интервала упреждения, играет особую роль в слу-
чае нестационарного характера изменения диагностируемых па-
раметров.
При отсутствии гарантий стационарности выбор значения а по-
зволяет в какой-то степени уменьшить ошибку прогноза. Малое
значение а обеспечивает в общем случае более высокую точность
оценки коэффициентов при неизменной модели процесса, в то
время как увеличение а будет способствовать росту скорости реак-
ции прогнозирующего алгоритма на изменение модели.
Таблица 13.2
Коэффициент сглаживания и интервал упреждения, как факторы,
определяющие качество прогноза
а Интервал упреждения (число шагов) Ошибка прогноза
1 0,072)
0,05 10 0,202)
20 0,532)
50 2,702)
1 0,152)
0,10 10 0,842)
20 4,802)
50 20,602)
1 0,322)
0,20 10 0,842)
20 10,802)
50 62,502)
310
Возможным путем уменьшения ошибок прогноза при неста-
ционарном характере изменения прогнозируемого параметра яв-
ляется применение методов адаптации для корректировки значе-
ний а. При реализации такого подхода наблюдения за диагности-
руемой системой для вычисления прогнозных значений контро-
лируемых параметров используют корректировку величины а,
проводимую на основании анализа ошибки прогноза, которую
можно представить в виде
е(л+/л) м(и+/и) м(л+/л)’
где w*+m) — фактическое значение параметра в момент времени,
определяемый (п + /п)-м измерением; u"f+m) — прогнозируемое
для этого момента времени значение контролируемого параметра.
Для минимизации ошибки прогноза е(П+т) можно использо-
вать любой из известных способов, например метод наимень-
ших квадратов. Структурная схема, поясняющая адаптивный ме-
тод корректировки коэффициентов сглаживания а, приведена
на рис. 13.1.
Использование дополнительной информации о характере из-
менения прогнозируемого параметра позволяет повысить эффек-
тивность прогноза, а именно информации о системе, полученной
в результате испытаний, в процессе ее эксплуатации, наконец,
информации об аналогах контролируемой системы, что позволя-
ет делать предположения о возможном характере изменения про-
гнозируемых параметров.
В книге [25] описан метод прогнозирования на основе канони-
ческого представления нестационарной случайной функции, пред-
Рис. 13.1. Структурная схема адаптивного метода корректировки коэффи-
циентов сглаживания а
311
ложенного В. С. Пугачевым. При его использовании случайную
функцию u(t) можно представить в виде
i
где M{u(t)} — математическое ожидание случайной функции «(/);
Vj — некоррелированные случайные величины, математическое
ожидание которых равно нулю; /(/) — детерминированные функ-
ции. Прогнозируемое значение случайной функции для момента
времени (/ + Д/) можно в этом случае определить с помощью
выражения
u(t + М) = М {u(t + А/)} + У, Vjfi (t + А/)
i
в предположении, что вид функций /(/) на участке прогнозиро-
вания остается неизменным по сравнению с их видом на участке
наблюдения. Практический метод нахождения /(0 и коэффици-
ентов Vt рассмотрен в работе [14]. При его использовании предпо-
лагают, что Vt — случайные величины, обладающие следующими
свойствами:
Af{K} = 0; M{ViVj} = Q для i * j.
При этом также вводится в рассмотрение центрированная слу-
чайная функция
«(О = Етао,
для которой известна корреляционная функция Ku(t, t') и значе-
ния u(tv), где tv — произвольная последовательность значений t.
Рекуррентные соотношения, позволяющие провести необходимые
расчеты, имеют вид
V\=u(tx),Dx = Ku(tx,t{),
Di = ад,/;)-хл[А0,)]2,
Х=1
fi(t)= Ku(t,ti)
где Dx — дисперсия коэффициента Vt.
Таким образом, рассмотренный метод предполагает наличие
определенной априорной информации в виде M{u(f)} и K(t, t').
При известных закономерностях изменения параметров, харак-
теризующих состояние технической системы, для прогнозирова-
312
ния их изменений можно также использовать следующую модель
прогноза [25]:
и(0 = 5>Л(0 + П(0,
/=1
где f — детерминированные, линейно независимые функции; а, —
коэффициенты, изменяющиеся скачкообразно в случайные мо-
менты времени; т|(/) — стационарный случайный процесс с ну-
левым математическим ожиданием, характеризующий погрешно-
сти измерения, а также отклонение реальной системы от модели.
Оценка коэффициентов а„ проведенная по результатам изме-
рений во временном интервале (/ - At, t), позволяет прогнозиро-
вать изменение функции «(/) к моменту (/ + At):
u(t + At) = ^ai(t)fi(t + At),
i=i
где ai(t) — оценка коэффициента a^t); f(t) — априорно извест-
ные функции.
Соотношение, позволяющее найти необходимые оценки ко-
эффициентов ah имеет вид [25]:
» N-1
а = S - J&T)fT(t- JAt)g,
j=o
где a = (ai, аг, ..., an) — искомый вектор коэффициентов; fT = (_/[,
f2, ..., f„) — вектор детерминированных независимых функций;
АТ — временной интервал дискретных измерений параметра «(/);
N — число наблюдений u(t) к моменту времени t', у, — весовой
коэффициент для у-го измерения (0 < у < 1); J = О, N -1.
Координаты gj(t) вектора g определяют по формуле
ЛГ-1
gW^yJtt-JATMt-JAT).
j=o
Дальнейшим развитием методов прогнозирования является
применение более сложных динамических моделей, характеризу-
ющих изменение состояния технических систем, в частности на
базе фильтра Калмана [25]. Прогнозируемое значение параметра
при использовании фильтра Калмана определяется как преобра-
зование предыдущей оценки плюс дополнительное слагаемое, за-
висящее от разности результата измерения наблюдаемого вектора
состояния и его оценки в предыдущей точке.
313
13.3. Ресурсные испытания
Фактором, имеющим исключительно важное значение при
эксплуатации технических систем, является их ресурс, оценка ко-
торого проводится либо в стендовых условиях (на стадии разра-
ботки), либо в эксплуатационных условиях; последнее, как пра-
вило, для систем с длительными сроками активного существова-
ния мало подходит, так как информация успевает устареть, теря-
ется ее ценность. В этой связи особое значение приобретают уско-
ренные методы испытаний. Методы ускоренных ресурсных испы-
таний должны обеспечивать связь ускоренных и эксплуатацион-
ных режимов работы технических систем, позволяющих анализи-
ровать полученные результаты и переносить их на нормальные
эксплуатационные условия. Существующие методы ускоренных ис-
пытаний можно разделить на две группы: методы испытаний в
форсированном и в нормальном эксплуатационном режиме [25].
Испытания, проводимые в нормальном эксплуатационном ре-
жиме, основаны на экстраполяции характеристик случайного про-
цесса появления отказов. Ускорение при этом достигается за счет
ограничения времени испытаний до момента появления отказов
только определенной части однотипных технических систем или
выявления тенденций и закономерностей изменений контроли-
руемых параметров.
При проведении ускоренных испытаний в форсированном ре-
жиме ускорение достигается путем применения более жестких
условий функционирования по сравнению с эксплуатационны-
ми в целях увеличения скорости протекания всех процессов ста-
рения в контролируемой технической системе. Однако следует
иметь в виду, что «жесткость» режимов имеет свои ограничения,
превышение которых может приводить к качественным измене-
ниям в испытуемой системе, включая разрушение. Таким обра-
зом, главным условием адекватности ускоренных и эксплуата-
ционных испытаний является требование совпадения или незна-
чительного отличия характера и вида протекающих в испытуе-
мой системе процессов.
Масштабным параметром, связывающим скорости протекания
процессов в нормальных условиях и при ускоренных испытаниях,
является коэффициент ускорения Ку, под которым понимают сле-
дующее отношение [25]:
Т
Ку = 4г > 1,
У гр
где Тэ — время, затраченное на получение требуемой информа-
ции при испытаниях в условиях, аналогичных эксплуатационным;
Ту — время, в течение которого эта информация получена мето-
дом ускоренных испытаний.
314
Рис. 13.2. Определение коэффициента К?
ускорения на основе дискретной ап-
проксимации
Л Т2
Следует обратить особое внимание, что коэффициент ускоре-
ния в общем случае не может быть постоянным в течение всего
интервала испытаний, так как характер протекания процессов,
в том числе и их скорость, изменяется в зависимости от времени,
прошедшего от начала эксплуатации технической системы.
Для обеспечения эквивалентности процессов, характеризую-
щих изменение состояния технической системы при различных
режимах испытаний, коэффициент Ку приближенно можно опре-
делить, используя дискретную аппроксимацию (рис. 13.2), при
которой весь временной интервал (Го, Тп) разбивают на непере-
секающиеся временные интервалы (7}_ь 7}):
п
В этом случае для каждого интервала справедливо равенство
Uy(c(/),T) = иэ(ЛГу,т),
(13.8)
которое, строго говоря, при дискретной аппроксимации будет
соблюдаться лишь в узловых точках. В выражении (13.8) U(t) —
вектор параметров, характеризующих состояние технической си-
стемы; с(0 — вектор, характеризующий ускоряющий фактор;
т, t — время, характеризующее соответственно «медленные» и
«быстрые» процессы в испытуемой системе.
Выбор вида и параметров ускоряющих воздействий, анализ их
влияния на испытуемую систему наиболее удобно производить,
если имеются уравнения, описывающие изменения состояния
системы во времени. Ускоряющий фактор может носить детерми-
нированный и стохастический характер, оказывая влияние на про-
текающие в технических системах процессы путем увеличения ин-
тенсивности их изменения. Например, увеличение скоростей дви-
жения трущихся элементов технической системы приводит к из-
менениям интенсивности износа, а также к увеличению вибра-
ций. В то же время на интенсивность износа трущихся элементов
можно повлиять, увеличивая статические нагрузки, но при этом
снижается уровень собственных вибраций, и, следовательно, фак-
315
тор, определяющий динамические нагрузки, изменяется в про-
тивоположную сторону.
Из приведенных примеров следует, что каждое воздействие,
как правило, имеет комплексный характер, изменяющий одно-
временно интенсивность и «быстрых» (вибрационные колебания),
и «медленных» (износ элементов системы) процессов. Теорети-
ческое обоснование ускоренных испытаний, оптимальность их про-
ведения, однозначность анализа полученных результатов возмож-
ны, как отмечалось выше, при наличии уравнений, описывающих
изменение технического состояния. Решить эти задачи удается при
совместном исследовании этих уравнений при наличии ускоряю-
щего воздействия c(Z) и эксплуатационных условиях (с(/) = 0).
Однако в практике ресурсных испытаний находят достаточно
широкое применение и эмпирические методы определения коэф-
фициента ускорения и других параметров ускоренных испытаний.
Определение этих параметров также может осуществляться с ис-
пользованием моделей технических систем, имитирующих эксп-
луатационные условия и работу системы при форсирующем воз-
действии с(/). Такой подход требует создания достаточно точных
моделей изменения технического состояния системы.
Темы для повторения
1. Связь задачи прогнозирования состояния технической системы с
задачей диагностического контроля.
2. Интегральный и рекуррентный операторы прогнозирования.
3. Использование дрейфа параметров технической системы для реше-
ния задачи прогнозирования ее состояния.
4. Методы получения экстраполяционных прогнозных оценок.
5. Влияние на ошибку прогноза величины интервала упреждения.
6. Метод прогнозирования на основе канонического представления
нестационарной случайной функции.
7. Условия проведения испытаний в ускоренном режиме.
8. Выбор вида и параметров ускоряющих воздействий при проведении
ресурсных испытаний.
Глава 14
ТЕХНИЧЕСКИЕ СРЕДСТВА ДИАГНОСТИКИ
СИСТЕМ
14.1. Средства измерения первичной информации
Главной задачей современных средств диагностики является
предотвращение внезапных отказов технических систем путем
оценки текущего состояния в процессе их функционирования без
остановки и проведения профилактического контроля, включаю-
щего вскрытие и разборку механизмов и узлов системы. Реализа-
ция данной задачи возможна лишь при наличии необходимой
исходной информации о процессах, происходящих в контролиру-
емой системе, получаемой с помощью датчиков, фиксирующих
какие-либо физические или химические изменения, происходя-
щие в системе. Обычно в технических системах измеряемыми ве-
личинами являются температура, давление, плотность, скорость
или характер протекания химических реакций, крутящий момент,
расход тех или иных компонентов, акустические и вибрационные
процессы и другие параметры. При этом нужно заметить, что весьма
часто в современных средствах решение задачи диагностирования
базируется на одновременном анализе первичной информации
различной физической природы. Например, процедура диагнос-
тирования технической системы может включать контроль темпе-
ратуры и давления в нескольких наиболее критических точках, а
также съем и соответствующую обработку вибросигналов.
Исходя из конкретных задач, решаемых средствами диагности-
рования, их можно условно разбить на две группы. Первую группу
составляют системы контроля общего назначения с ориентацией
на обнаружение предаварийных ситуаций. Датчики, применяемые
в таких системах, обычно являются источниками информации для
реализации сигнатурного алгоритма контроля за априори уста-
новленными «слабыми» местами диагностируемого объекта. Вто-
рую группу систем диагностического контроля составляют специ-
ализированные системы, главной задачей которых является выяв-
ление дефектов на стадии их зарождения и классификация обна-
руженных дефектов. В частности, в основу построения подобных
систем диагностики состояния электромеханических и механи-
ческих объектов во многих случаях положены методы анализа виб-
роакустических процессов.
317
Любая диагностическая система состоит из двух частей (двух
подсистем). Первичная подсистема предназначена для сбора ис-
ходной информации, ее предварительной обработки и регистра-
ции в запоминающих устройствах. Например, первичная подси-
стема типовой диагностической системы, в основу которой поло-
жен анализ вибросигналов, состоит из датчиков колебаний раз-
личного типа (микрофонов, акселерометров, тензодатчиков, то-
ковихревых, индукционных и других датчиков механических ко-
лебаний), согласующих устройств, нормализаторов, усилителей-
формирователей, аналого-цифровых преобразователей, оператив-
ных и долговременных запоминающих устройств. Вторичная под-
система инвариантна к характеру первичной информации, так
как предназначена для ее обработки. Она может содержать как
ЭВМ общего назначения, так и комплекс отдельных модулей
(электронных приборов и спецпроцессоров) с периферийными
устройствами (блоками ввода и вывода информации, внешней
памятью, дисплеем, печатающим устройством, графопостроите-
лем), устройством сопряжения отдельных блоков и пультом уп-
равления [4].
Учитывая, что диагностические процедуры в современных си-
стемах связаны с обработкой значительного объема информации
по достаточно сложным алгоритмам и во многих случаях в режиме
реального времени, вычислительные средства, используемые в та-
ких системах диагностирования должны отвечать требованиям вы-
сокого быстродействия и обладать достаточной емкостью памяти.
Однако любые самые сложные алгоритмы обработки инфор-
мации, любые средства вычислительной техники могут оказаться
бессильными в случае введения в диагностическую систему заве-
домо недоброкачественной исходной информации. Поэтому оче-
видна та роль, которую играют при построении систем диагно-
стирования первичные источники информации — датчики.
Основным назначением датчика как элемента диагностической
системы является преобразование измеряемой физической (или
химической) величины в форму, воспринимаемую средствами
обработки информации. При этом должно выполняться требова-
ние обеспечения определенной, по возможности линейной, за-
висимости между выходным сигналом датчика и уровнем измеря-
емого параметра. Не менее важными требованиями является ма-
лая зависимость выходного сигнала от изменений внешних усло-
вий, надежность его работы.
Учитывая характер современных средств обработки информа-
ции, в большинстве случаев необходимо преобразовать измеряе-
мую величину в электрическую, т. е. датчики должны иметь элек-
трический выход. Примерами датчиков с электрическими выхода-
ми являются термопары и термосопротивления для измерения
температуры, тензодатчики для измерения натяжения, давления
318
или незначительного смещения, потенциометры для измерения
положения, некоторые типы вибродатчиков. В ряде датчиков в
качестве выходной величины используется изменение сопротив-
ления, емкости или индуктивности, которые достаточно просто
преобразовать в напряжение или ток. Заметим, что в системах диа-
гностического контроля наряду с датчиками постоянного тока
находят применение и датчики переменного тока, а также датчи-
ки с импульсно-модулированным выходом. Однако, во-первых,
датчиков такого типа относительно мало, во-вторых, при необ-
ходимости сигналы с их выходов можно преобразовать в сигналы
постоянного тока, и, наконец, каких-либо принципиальных от-
личий на дальнейшую обработку сигналов такого вида в диагно-
стической системе эти особенности не накладывают. Учитывая это
замечание, далее будем рассматривать в основном датчики, выхо-
дом которых является сигнал постоянного тока.
Сигнал с датчика, как правило, поступает на вход согласую-
щего устройства, обеспечивающего согласование выходного со-
противления датчика с другими блоками первичной диагности-
ческой подсистемы. В качестве такого устройства обычно приме-
няют усилитель, имеющий высокий входной импеданс и низкий
выходной импеданс с относительно небольшим коэффициентом
усиления. Этот усилитель может также использоваться и для вы-
полнения ряда дополнительных функций. К ним можно отнести,
во-первых, реализацию операции слежения-запоминания вход-
ного сигнала. Выход усилителя, работающего в таком режиме, про-
порционален или равен (при коэффициенте усиления ку = 1) вхо-
ду до тех пор, пока не последует команда запоминания, после
чего выходной сигнал остается постоянным до конца действия
этой команды (рис. 14.1).
Наличие таких усилителей является необходимым, например,
при обработке виброполей, когда требуется информация о значе-
нии вибросигналов в один и тот же момент времени в различных
точках диагностируемого объекта.
Во-вторых, усилители могут быть использованы для выполне-
ния операции интегрирования, позволяющей получить сигналы,
пропорциональные смещению или скорости. Необходимость в этом
может возникнуть, если выход датчика (например, акселеромет-
ра, применяемого при измерении вибраций) пропорционален
ускорению. Тогда после однократного интегрирования сигнала
датчика выходной сигнал интегратора будет пропорционален ам-
плитуде скорости, а после двукратного интегрирования, когда
сигнал пройдет через два последовательно включенных интегра-
тора, выходной сигнал будет пропорционален амплитуде переме-
щения. При двукратном интегрировании сокращается частотный
диапазон измерений, повышается чувствительность к низкочас-
тотным составляющим исходного сигнала, включая низкочастот-
319
Вход усилителя
Слежение
Запоминание
Рис. 14.1. Реализация операции слежения-запоминания входного сигнала
ные помехи, и уменьшается выходной сигнал высокочастотных
составляющих. Способы расширения частотного диапазона актив-
ного интегратора при заданных значениях погрешностей интегри-
рования в области нижних и верхних граничных частот достаточ-
но хорошо изучены (см., например, [12]).
Дальнейшее преобразование информации обычно обозначают
термином «нормализация», под которым подразумевают фильт-
рацию, смещение уровня, линейную и нелинейную компенса-
цию, преобразование тока в напряжение. Имеются исчерпываю-
щие описания соответствующих устройств и их применений в ди-
агностических системах [7, 11]. Поэтому рассмотрим кратко лишь
некоторые особенности, связанные с применением фильтрации
сигналов в диагностических системах.
Частотная фильтрация осуществляется в целях отделения по-
лезного сигнала от помех различного происхождения, к которым
относят наводки от различных периодических и случайных им-
пульсных источников, собственные шумы усилительных каска-
дов, фон с частотой, кратной частоте питающей сети, сигналы от
других физических источников, воздействующие на датчик. Сле-
дует заметить, что уровень помех может быть одного порядка и
даже превышать полезный сигнал. Как отмечалось ранее, для час-
тотной фильтрации применяют фильтры верхних и нижних час-
тот, полосовые и узкополосные фильтры с различным рядом цен-
тральных частот. В последнем случае выделяют полигармонические
сигналы. Для разделения сигналов с одинаковыми частотами, но
различными фазовыми сдвигами, могут быть использованы синх-
ронные детекторы.
Следует особо остановиться на проблеме фазовых искажений,
которые свойственны в той или иной степени применяемым на
320
практике фильтрующим устройствам. Так, например, низкочас-
тотные активные RC-фильтры, построенные на операционных
усилителях, вносят большие фазовые искажения, особенно в об-
ласти частоты среза. В узкополосных фильтрах изменения фазы могут
происходить от -л/2 до +л/2. Это ограничивает применение таких
фильтров в случаях, когда для формирования диагностических
признаков используют сигналы с двух и более измерительных ка-
налов, так как обеспечение идентичности фазовых сдвигов по всем
каналам является достаточно трудной задачей.
Поэтому в последнее время операцию фильтрации сигналов
все чаще осуществляют цифровым методом, реализуя цифровые
фильтры с помощью вычислительной машины или специальных
процессоров. Как известно, цифровые фильтры обладают боль-
шой точностью задания характеристик и гибкостью реализации,
позволяющей изменять их временные и частотные характеристи-
ки программным путем.
Принимая во внимание тот факт, что в современных диагно-
стических системах обработка информации проводится с помо-
щью цифровых вычислительных средств, обязательным элемен-
том первичной подсистемы является аналого-цифровой преобра-
зователь, с помощью которого происходит переход от сигнала в
аналоговой форме к его представлению в цифровой, т.е. форме,
совместимой с форматом данных в применяемой вычислитель-
ной машине. Существует много способов преобразования анало-
гового сигнала в цифровой, каждый из которых имеет свои досто-
инства. Используемый тип аналого-цифрового преобразователя
зависит главным образом от требований к быстродействию и раз-
решающей способности, предъявляемых конкретной системой ди-
агностики. Однако во всех случаях представление сигнала в циф-
ровой форме предполагает выполнение двух независимых опера-
ций: дискретизацию и квантование по уровню. Операцию дискре-
тизации аналогового сигнала, т.е. квантование его по времени,
необходимо проводить таким образом, чтобы выполнялась фун-
даментальная теорема Котельникова о дискретном представлении
сигнала. Иначе говоря, частота опроса должна по крайней мере
вдвое превышать наибольшую значащую частотув спектре пре-
образуемого сигнала. При невыполнении этого условия, как изве-
стно, наступает явление маскировки (наложения) частот, иска-
жающее спектр исходного сигнала. На практике для получения
достоверных результатов, особенно при расчете спектральных и
корреляционных характеристик, частоту дискретизации устанав-
ливают значительно выше: она превышает граничную частоту fv
в 10—20 раз.
Операция квантования по уровню, осуществляемая в аналого-
цифровом преобразователе, предполагает, что входной сигнал
переводится в числовой код с определенным шагом — интерва-
321
лом квантования. С понятием интервала квантования тесно связа-
но понятие разрешающей способности, которую можно охарак-
теризовать наименьшим изменением во входном напряжении,
всегда приводящим к изменению в цифровом выходном слове.
Естественно, что требование к разрешающей способности опре-
деляется требованиями к точности представления исходной ин-
формации, что в итоге выражается требованием к параметрам
разрядной сетки аналого-цифрового преобразователя.
Важное значение при построении диагностических систем име-
ют вопросы помехозащищенности датчиков и входных цепей из-
мерительного тракта системы. Сравнивая, например, два распро-
страненных типа датчиков, а именно датчики, реализующие со-
ответственно емкостной и индукционный принципы преобразо-
вания, можно сделать вывод, что индукционные датчики облада-
ют более высокой помехоустойчивостью. Это обусловлено, в част-
ности, тем, что емкостные преобразователи имеют более высокое
выходное сопротивление, что и определяет в значительной степе-
ни их повышенную чувствительность к внешним помехам и на-
водкам.
Повышение помехоустойчивости может быть достигнуто также
путем использования в измерительном тракте устройств, вклю-
ченных по дифференциальной схеме, или дифференциальных со-
гласующих устройств, подключаемых к симметричному выходу
предыдущих элементов. При таком включении особенно эффек-
тивно подавляются синфазные помехи [11].
Имеется еще один фактор, который может оказать существен-
ное влияние на результаты измерений первичной информации, —
изменение окружающей температуры в месте размещения датчи-
ка. Влияние температуры на параметры чувствительного элемента
датчика и соединительных элементов, различный температурный
коэффициент расширения материалов, используемых в конструк-
ции датчика, — все это может быть причиной изменения коэф-
фициента преобразования датчика и, как следствие, причиной
появления дополнительной погрешности. Одним из очевидных
путей предупреждения возникновения подобной помехи является
поддержание температурной стабильности в месте установки дат-
чика путем применения различного рода термоизолирующих кон-
струкций. Однако по ряду причин такое решение проблемы не
всегда оказывается возможным. В этом случае в диагностической
системе необходимо предусмотреть либо аппаратную, либо алго-
ритмическую компенсацию этой погрешности.
С влиянием помех на исходную информацию тесно связан и
вопрос выбора местоположения датчиков. Обычное правило раз-
мещения датчиков — максимально возможное приближение к
диагностируемому узлу, установка датчиков в наиболее информа-
тивных точках диагностируемой конструкции, позволяющих оце-
322
нить работоспособность данного узла. Нужно иметь в виду, что в
общем случае справедливо утверждение: чем меньше путь инфор-
мативного сигнала от места его возникновения до места съема,
тем меньше влияние всякого рода факторов, затрудняющих выде-
ление этого сигнала. Например, при вибродиагностике датчики
обычно устанавливают на жесткие элементы конструкции. При
этом желательно, чтобы число стыков деталей на путях прохож-
дения вибросигналов от диагностируемого узла к месту установки
преобразователя было минимальным. При выборе этого места учи-
тывают также резонансные свойства конструкции в требуемом диа-
пазоне частот. Направление оси чувствительности преобразовате-
ля желательно ориентировать по линии действия силы, вызываю-
щей вибродиагностический сигнал. Следует также принимать во
внимание то большое влияние на форму низкочастотных вибро-
сигналов, которое оказывают нелинейности упругих элементов
машин. При возрастании жесткости упругих элементов форма сиг-
налов становится ограниченной по амплитуде, при уменьшении —
обостренной. Несимметричные искажения формы сигналов ука-
зывают на несимметричность колебаний упругих элементов в из-
меряемом направлении. С учетом этого фактора вибродатчик дол-
жен быть максимально приближен к потенциальным источникам
возбуждения колебаний. Так, во многих случаях вибродатчик мо-
жет быть размещен, например, на опорах подшипников. Это це-
лесообразно сделать, хотя бы потому, что, во-первых, именно в
этих местах прикладываются основные динамические нагрузки и
усилия, во-вторых, подшипники обычно являются одними из
слабых звеньев механизма. С другой стороны, при использовании
той же вибродиагностики для контроля за возникновением таких
дефектов, как трещины, ослабления крепежа необходимо, чтобы
путь вибросигнала от точки зарождения (приложения) возбужда-
ющих сил до точки съема пролегал через диагностируемые участ-
ки конструкции.
Качество первичной информации в не малой степени зависит
от метода крепления датчика в месте его установки на диагности-
руемом объекте. Приведенные на рис. 14.2 собственные частотные
характеристики одного из типов вибродатчика (акселерометра)
являются примером влияния на эти характеристики способов креп-
ления датчика к поверхности конструкции. Из рисунка видно, как
происходит изменение частотного диапазона в зависимости от
способа крепления.
С учетом того, что практически все диагностические алгорит-
мы предполагают периодический режим получения первичной
информации в течение времени эксплуатации диагностируемого
объекта, предпочтительным является стационарный способ креп-
ления датчиков. В этом случае в значительной степени исключа-
ются погрешности, связанные с вариацией (даже относительно
323
Рис. 14.2. Частотные характеристики акселерометра в зависимости от спо-
соба крепления:
а — с помощью стальной шпильки; б — с помощью тонкой ленты; в — с по-
мощью толстой ленты; г — с помощью магнита
f, кГц
небольшой) места установки датчика и ориентации его в про-
странстве, а также параметров материалов, с помощью которых
происходит крепление датчика.
14.2. Основные типы датчиков
Реализация алгоритмов диагностирования технических систем
может включать в себя измерение любых измеряемых физических
и химических параметров, изменение которых коррелировано с
изменением состояния технической системы. К таким параметрам
могут относиться давление и температура, наличие и процентное
содержание определенного рода примесей в контролируемых жид-
костях или газе, степень износа и коррозии, характеристики виб-
раций и акустического шума, а также другие параметры. Остано-
вимся кратко на наиболее широко используемых в диагностике
технических объектов электро- и механической природы датчи-
ков для измерения температуры, давления, вибраций и акусти-
ческих шумов.
Температурные характеристики (значения температур в диаг-
ностируемых точках, температурные градиенты, параметры тем-
пературных полей и т.д.) являются достаточно важными, так как
тесно связаны с состоянием движущихся элементов и теплоэнер-
324
гетических узлов таких технических систем, как энергоустановки
различного типа, генераторы, двигатели и т.д. Из многочислен-
ных первичных средств термометрии наиболее известны такие
контактные датчики температуры, как биметаллические и тер-
моэлектрические (термопары) измерители, термометры сопро-
тивления, терморезисторы и термисторы (полупроводники с боль-
шим отрицательным температурным коэффициентом). Из бескон-
тактных датчиков наибольшее применение находят пирометры,
радиометры, тепловизоры [7].
В качестве примера контактного датчика температуры рассмот-
рим термосопротивление, чувствительным элементом которого
служит обычно платиновая (теллуросеребряная, медная) прово-
лока, намотанная на каркас из изоляционного материала. Каркас
помещается в защитную трубку. При изменении температуры сре-
ды, в которой находится датчик, изменяется сопротивление про-
водника. Именно на этом основан принцип действия датчика. За-
висимость электрического сопротивления проводника от его тем-
пературы выражается формулой
/г = ЛЬф(0-0о), (14.1)
где 0 — температура проводника; Ro — сопротивление проводни-
ка при температуре 0О; <р(0 - ©о) — определенная функция раз-
ности температур, которая в широком диапазоне температур ап-
проксимируется экспоненциальной зависимостью
<р(0-Оо) = е ’“(в ’во). (14.2)
Знание характеристик (14.1), (14.2) позволяет при обработке
информации программным путем учесть отсутствие линейной за-
висимости между измеряемым параметром и выходным сигналом
датчика. Обычно таким сигналом является напряжение на сопро-
тивлении нагрузки, включенном в диагональ мостовой схемы,
одним из плеч которого служит термосопротивление.
В качестве примера бесконтактных датчиков температуры мож-
но рассмотреть пирометры — приборы, принцип действия кото-
рых основан на использовании зависимости мощности и спект-
рального состава инфракрасного излучения от температуры. С по-
мощью пирометров определяют температуру по излучению диаг-
ностируемого объекта, при этом необходимо отметить, что пиро-
метр не вносит никаких искажений в температурное поле объекта.
Воспринимаемое оптической частью собственное тепловое излу-
чение объекта преобразуется с помощью преобразователей излу-
чения в электрический сигнал, который после усиления и соот-
ветствующей обработки визуализируется и (или) поступает в вы-
числительное устройство для формирования диагностического
325
признака. Подробное описание принципов построения пиромет-
ров, их технические характеристики приведены в [7]. Там же даны
сведения и о тепловизорах — сканирующих пирометрах, снабжен-
ных системой наблюдения тепловых полей, приведены примеры
термометрического диагностирования механических и энергети-
ческих установок.
Измерение переменных давлений проводится в целях оценки
состояния потока газа или жидкости в элементах и узлах таких
технических систем, как турбины, компрессоры, насосы, тепло-
вые двигатели и т.д. В зависимости от интенсивности потока и
характера его изменения во времени возможно возбуждение вы-
нужденных и резонансных колебаний вращающихся и неподвиж-
ных деталей и узлов, потеря газодинамической устойчивости,
возникновение акустических шумов и другие явления, влияющие
на техническое состояние функционирующих объектов. При этом
анализ таких характеристик параметров переменных давлений, как
спектральная плотность мощности, корреляционная функция [11],
позволяет провести диагностическую и прогнозную оценку со-
стояния вышеназванных объектов. Для этого необходима досто-
верная и точная первичная информация, получаемая с помощью
датчиков давления. Поэтому в каждом конкретном случае первич-
ный преобразователь давления следует выбирать и ориентировать
в потоке с учетом влияния внешних дестабилизирующих факто-
ров (загрязненность потока, вибрации, высокие температуры,
электрические помехи), которые могут повлиять на результаты
измерений и надежность работы датчика. Кроме того, датчики пе-
ременных давлений должны иметь небольшие размеры, для того
чтобы не влиять на характеристики исследуемого потока газа или
жидкости.
Наиболее широкое применение в практике исследования пе-
ременных давлений нашли пьезоэлектрические, тензорезистив-
ные и индуктивные преобразователи. Пьезоэлектрические преобра-
зователи имеют большие габаритные размеры, ограниченный со
стороны низких и высоких частот диапазон измерений, обладают
относительно высокой чувствительностью к вибрациям. Наиболее
часто их применяют для измерений больших интенсивностей пе-
ременных давлений при относительно небольших вибрационных
ускорениях. Индуктивные преобразователи давления обладают бо-
лее высокой помехоустойчивостью и значительно меньшей чув-
ствительностью к вибрациям, применяются для измерения пере-
менных давлений до 10 кГц. Для измерения более высокочастот-
ных давлений (до 100 кГц и выше) используют тензорезистивные
преобразователи давления, имеющие небольшие размеры и доста-
точно высокую чувствительность.
Для измерений вибрационных процессов применяют датчики,
в основу работы которых положен один из следующих принци-
326
пов: электромагнитный, электродинамический, емкостной, пье-
зоэлектрический или тензорезистивный. Наиболее полно требо-
ваниям измерения вибраций для диагностических целей удовлет-
воряют пьезоэлектрические и тензорезистивные вибропреобразо-
ватели.
Тензорезистивные вибропреобразователи имеют небольшие раз-
меры инерционной массы и чувствительного элемента, в каче-
стве которого используются полупроводниковые тензорезисторы.
Поэтому их собственные частоты находятся в пределах десятков и
даже сотен килогерц, что дает возможность применять эти преоб-
разователи для измерений вибрационных ускорений в диапазоне
от нуля до нескольких десятков килогерц. Следует обратить вни-
мание также на то, что в рабочем диапазоне частот тензорезис-
тивные вибропреобразователи практически не вносят фазовых ис-
кажений измеряемых процессов, важность этого свойства отмеча-
лась выше. Еще одно полезное для практики свойство тензорезис-
тивных вибропреобразователей — низкое выходное сопротивле-
ние, что уменьшает влияние различного рода электрических по-
мех и наводок на точность преобразования. К недостаткам рас-
сматриваемого типа преобразователей относятся их относительно
малая чувствительность в области высоких частот, требование че-
тырехпроводной соединительной линии и наличие специального
источника питания чувствительных элементов.
Пьезоэлектрические вибропреобразователи по своим техническим
и метрологическим характеристикам превосходят все другие типы
преобразователей, так как имеют достаточно высокую чувстви-
тельность, широкий частотный и динамический диапазоны изме-
рений, относительно небольшие размеры и массу, высокую тер-
мостойкость и вибропрочность. Главным недостатком пьезо-
электрических вибропреобразователей является их высокое выход-
ное сопротивление, из-за которого предъявляются повышенные
требования к помехоустойчивости, а также изоляционным харак-
теристикам соединительного кабеля и входных цепей усилитель-
но-преобразующей аппаратуры. Анализ и описание ряда конст-
рукций пьезоэлектрических вибропреобразователей приведен в [11].
Акустический шум, излучаемый работающими машинами и
механизмами, не только создает дискомфортные условия для че-
ловека, но и может быть причиной возбуждения вынужденных и
резонансных колебаний, а при достаточной интенсивности излу-
чения — усталостных повреждений элементов конструкции. С по-
мощью анализа шума проводят диагностический контроль как
самых разнообразных технических систем, так и отдельных эле-
ментов и узлов этих систем: дизельных и реактивных двигателей,
оборудования подводных лодок, гидравлических насосов и т.д. При
этом в подавляющем числе случаев проводят корреляционный ана-
лиз или анализ спектральной плотности энергии.
327
Основными параметрами акустических шумов являются звуко-
вое давление и интенсивность звука (т. е. акустическая мощность
на единицу площади в звуковой волне). В связи с тем что интен-
сивности и давления звуков, встречающиеся на практике, нахо-
дятся в очень широких пределах, введена специальная логариф-
мическая шкала измерений, при которой эти параметры измеря-
ют в децибелах. Для измерения акустических характеристик тех-
нических систем используют специальную аппаратуру, содержа-
щую микрофоны, линейные и логарифмические усилители, ок-
тавные и '/з-октавные фильтры, корректирующие фильтры, де-
текторы, усредняющие и запоминающие устройства, индикатор-
ные устройства 11. Наибольшее применение в качестве первичных
преобразователей находят измерительные микрофоны, чаще кон-
денсаторные и пьезоэлектрические. По своим техническим и мет-
рологическим характеристикам более предпочтительны конденса-
торные микрофоны: они имеют достаточно высокую чувствитель-
ность, широкие частотный и динамический диапазоны измере-
ний, относительно небольшие размеры, удовлетворительную тер-
мо- и влагостойкость. Достоинством конденсаторных микрофонов
является также равномерность и идентичность амплитудно-час-
тотных и фазово-частотных характеристик, что играет важную роль
при определении взаимных спектральных и корреляционных ха-
рактеристик. К недостаткам конденсаторных микрофонов можно
отнести высокое выходное сопротивление, необходимость пода-
чи постоянного (поляризующего) напряжения на их электроды,
повышенную чувствительность к изменениям статического давле-
ния и влажности. Пьезоэлектрические микрофоны не требуют на-
пряжения поляризации и обладают остальными недостатками в
меньшей степени, но отличаются высокой виброчувствительно-
стью. Обычно они находят применение для измерений высоких
уровней звукового давления.
Для измерения интенсивности звука применяют специальный
зонд, содержащий два идентичных микрофона, расположенных
друг от друга на расстоянии, которое существенно меньше мини-
мальной длины звуковой волны исследуемого процесса. С их по-
мощью одновременно измеряют звуковое давление и градиент
давления вдоль линии, проходящей через акустические центры
микрофонов, что позволяет определить абсолютное значение ин-
тенсивности и направление распространения звука.
Наряду с интенсивностью звука в качестве диагностических
признаков значительно чаще используют уровни и частоты от-
дельных составляющих спектров шума. При этом следует иметь в
виду, что при получении шумовых спектров кроме обычных про-
цедур, уменьшающих статистическую погрешность измерения
спектральных компонент (измерение первичной информации в
течение достаточно большого интервала времени, выбор соответ-
328
ствующей разрешающей способности и частотного диапазона ана-
лизатора, проведение усреднения полученных спектров и т.д ),
необходимо принимать специальные меры, связанные с влияни-
ем на микрофоны изменений параметров окружающей среды.
14.3. Технические комплексы диагностики
Рассмотренные в предыдущих главах основные подходы к по-
строению диагностических систем могут служить базой для реа-
лизации таких систем как с использованием универсальных вы-
числительных машин, так и путем разработки специальных аппа-
ратных средств. Известны примеры диагностических комплексов
для оценки состояния технических систем различного назначе-
ния, разработанные и отечественными, и зарубежными фирмами.
Системы диагностики общего назначения обычно включают ав-
томатизированную многоканальную систему сбора информации,
локальные процессоры и центральную ЭВМ, супервизорную си-
стему, управляющую режимами проведения диагностических ис-
пытаний. В ряде случаев функции супервизорной системы выпол-
няет вычислительная машина.
Такие системы диагностики строятся, как правило, в модуль-
ном исполнении, что позволяет адаптировать их структуру и со-
став в зависимости от конкретных условий.
В процессе проведения диагностических испытаний и текущего
наблюдения за диагностируемым объектом в современных систе-
мах диагностики предусматривают режимы как ручного, так и
автоматического управления контролем за объектом. Автоматичес-
кий режим позволяет, во-первых, иметь систематическую инфор-
мацию и, соответственно, получать параметры трендовых харак-
теристик; во-вторых, своевременно выявлять опасные тенденции
развития дефектов, ведущих к аварии.
Универсальность построения таких систем позволяет исполь-
зовать в качестве входных параметров физические величины раз-
личной природы, причем набор их может варьировать в зависи-
мости от требуемой глубины диагноза.
Так, например, системы контроля и диагностики техническо-
го состояния оборудования на судах включают контроль темпера-
туры, расхода воздуха и воды, измерение уровней вибрации и ее
спектральный анализ.
Универсальность рассматриваемого подхода к построению диа-
гностических систем заключается и в том, что их программное
обеспечение ориентировано на выполнение «стандартных» про-
цедур диагностики:
• ввод с установленной периодичностью множества измеряе-
мых величин;
329
• редактирование вводимых данных в целях выявления и ис-
ключения аномальных и искаженных сигналов, которые могут
возникнуть при сборе и регистрации данных из-за помех, пло-
хой работы датчиков, нарушения контактов, обрыва линии свя-
зи и т.д.;
• цифровую фильтрацию и масштабирование данных;
• проверку случайных сигналов на стационарность;
• приведение входных величин к относительным величинам;
• вычисление наиболее распространенных характеристик про-
цессов (обычно спектральных характеристик и корреляционных
функций);
• сравнение реальных и эталонных величин.
Однако, как было показано, существует достаточно большое
число разнообразных характеристик, которые можно с успехом
использовать для формирования диагностических признаков
функционирующих технических систем. При этом во многих слу-
чаях диагностические системы, в которых реализованы сложные
алгоритмы диагностики и распознавания, позволяющие обнару-
жить дефекты на ранней стадии их развития, локализовать и про-
вести классификацию, имеют специализированный Характер и
ориентированы на определение состояния объектов конкретно-
го типа.
Примером универсальной системы диагностики может служить
система контроля «Impuls», разработанная фирмой «Schlumberger
Technologies». Одним из возможных практических применений этой
системы является текущий контроль за работой паровых турбин в
процессе их эксплуатации. Базовый принцип построения системы
позволяет иметь одинаковую конфигурацию как для турбины мощ-
ностью 100 МВт с простым регенерационным циклом, так и для
турбины мощностью 200 МВт с одним циклом повторного нагре-
ва и регенерации. Основной задачей этой диагностической систе-
мы является постоянный температурный контроль с помощью
датчиков, установленных в рабочем контуре паровой турбины.
Сигналы с датчиков подаются на автономные измерительные бло-
ки, которые проводят их регистрацию и через карту адаптера на-
правляют информацию в компьютер, где и происходит дальней-
шая обработка (рис. 14.3).
Разработанное для системы математическое обеспечение поз-
воляет отслеживать изменения температуры в реальном времени.
Изменения температуры выше ранее заданного порогового значе-
ния, превышение которого по расчету вызывает предельные ме-
ханические напряжения в роторе, запускает программу, вычис-
ляющую выработку ресурса. Под «выработкой ресурса» понимают
достижение 70% ожидаемого времени наработки на отказ, при
его наступлении сигнальная система выдает оператору информа-
цию о необходимости проверить состояние ротора.
330
Рис. 14.3. Структурная
схема системы темпе-
ратурного контроля
паровой турбины:
1 — термопара; 2 — ав-
тономный измеритель-
ный блок; 3 — компью-
тер; 4 — периферийные
устройства
Информацию о температурных напряжениях, выработанном
ресурсе регистрируют и запоминают в системе, а также выводят
на дисплей. Получаемые результаты представляют в таблицах с
выделенными полями в виде столбчатых диаграмм или графиков
изменения во времени измеряемых величин (трендов).
Система имеет возможность опрашивать различные датчики с
различной частотой. В ней предусмотрен также контроль за уровнем
вибрации в определенных точках во время снижения оборотов.
Отличительной особенностью системы является использование
автономных измерительных блоков, размещаемых непосредственно
на турбине. Сам блок является дистанционным измерительным
блоком с предварительной обработкой сигнала, включая подав-
ление шумов, и содержит аналого-цифровой преобразователь.
Подсоединение к управляющему компьютеру осуществляется про-
стым двухпроводным кабелем. Целостность системы связи управ-
ляющего компьютера с измерительным блоком усиливается вве-
дением протоколов обмена, контролем ошибок и посылкой по-
вторных запросов. Все это осуществляет специальный микропро-
цессор, входящий в состав интерфейса в управляющем компью-
тере, обслуживающем сеть связи.
Примером специализированной диагностической системы мо-
жет служить устройство для оценки технического состояния меха-
низма [2]. На рис. 14.4 представлена блок-схема устройства, содер-
жащего предварительный усилитель с фильтром, анализатор спек-
тра, классификационные каналы и блок визуализации и регист-
рации. Вибросигналы с контролируемого объекта (турбоагрегат,
дизельная установка) поступают с вибродатчика через предвари-
тельный усилитель на анализатор спектра.
Спектральные представления вибросигналов в адаптивных ба-
зисах, соответствующих М эталонным векторам, формируются в
классификационных каналах, запоминаются в регистрирующем
устройстве, где затем производится сравнение полученных спект-
ров по минимуму энтропии коэффициентов разложения. Опреде-
ленное наименьшее значение энтропии, соответствующее разло-
жению в базисе т-го канала, позволяет сделать вывод о том, что
331
Рис. 14.4. Структурная схема устройства для оценки технического состоя-
ния механизма
диагностируемый объект находится в /n-м состоянии (из М воз-
можных состояний).
Описан способ диагностирования, базирующийся на анализе
пространственно-временных спектров вибрационных полей [2]. Ре-
ализация этого способа осуществляется с помощью программно-
аппаратного комплекса для диагностического мониторинга меха-
нических и энергетических объектов. Основу этого комплекса,
структурная схема которого представлена на рис. 14.5, составляют
автономные интеллектуальные блоки, осуществляющие опрос
датчиков, а также прием и предварительную обработку измери-
тельной информации.
Рис. 14.5. Струк-
тура програм-
мно-аппаратного
комплекса для
диагностическо-
го мониторинга
механических и
энергетических
объектов
332
Благодаря встроенному микроконтроллеру и скоростной двух-
проводной линии связи с компьютером существенно упрощается
процесс управления измерениями и значительно разгружается от
«рутинной» обработки центральный компьютер. Это позволяет
реализовать алгоритмы обработки пространственных полей, тре-
бующие одномоментного опроса десятков датчиков. Внутреннее
оперативное запоминающее устройство в автономном интеллек-
туальном блоке дает возможность реализовать определенный на-
бор микрокоманд, изменяемый центральным процессором в со-
ответствии с алгоритмом контроля и диагностирования, и, в ча-
стности, обеспечивает программно-последовательный опрос дат-
чиков. С помощью этого запоминающего устройства также сохра-
няется текущая информация, поступающая с датчиков в авто-
номный блок.
Программные средства комплекса обеспечивают:
• установку и конфигурирование системы контроля в диалого-
вом режиме;
• реализацию различных алгоритмов обработки информации;
• различные режимы визуализации измерительной информа-
ции в виде графиков, столбчатых и круговых диаграмм, элект-
ронных таблиц;
• архивацию обработанной информации.
Математическую основу алгоритмов диагностики составляют
перестраиваемые ортогональные преобразования, при этом фор-
ма базисных функций адаптируется по статистическим характе-
ристикам контролируемых процессов при любой их размерности.
Процедура выделения диагностических признаков по набору вы-
борок измеряемых сигналов на основе перестраиваемых базисов
обладает вычислительной эффективностью одного порядка с ал-
горитмами быстрого преобразования Фурье.
Темы для повторения
1. Основные задачи первичной подсистемы диагностической системы.
2. Основные задачи вторичной подсистемы диагностической системы.
3. Назначение датчика как элемента диагностической системы.
4. Назначение усилителя как элемента диагностической системы.
5. Роль операции фильтрации сигналов в диагностических системах.
6. Выбор местоположения и способов крепления датчиков.
7. Первичные средства термометрии.
8. Первичные средства измерения переменных давлений.
9. Первичные средства измерения вибрационных процессов.
10. Измерение акустических шумов.
11. Состав и основные функции систем диагностики общего назначе-
ния.
12. Пример построения специализированной диагностической системы.
ПРИЛОЖЕНИЯ
Приложение 1
Особенности базисных функции систем Фурье, Уолша и Хаара
Условием наиболее высокой эффективности спектрально-корреляци-
онного анализа случайных процессов является обоснованный выбор под-
ходящего базиса разложения [21].
Методы спектрального анализа непрерывных (аналоговых) сигналов
в базисе тригонометрических функций Фурье имеют строгую теорию и
получили достаточно широкое распространение. Но несмотря на исполь-
зование способов вычисления дискретных спектров с помощью алго-
ритмов быстрого преобразования Фурье, получение спектральных ха-
рактеристик представляет собой весьма сложную задачу из-за необходи-
мости устранения искажений (эффектов размывания энергии в боковые
лепестки и наложения частот). Поэтому большой интерес представляют
методы спектральной обработки сигналов в базисах кусочно-ступенча-
тых функций Уолша и Хаара, которые более приспособлены к цифро-
вым преобразованиям.
Проведем сопоставление базисов Фурье, Уолша и Хаара, для чего
рассмотрим некоторые их основные свойства. На рис. П1, а приведены
гармонические функции {cosAco/, sin Arco/}, образованные из системы ком-
плексно-экспоненциальных функций Фурье {еусо/}. Набор этих функций
представляет полную систему многозначных ортонормированных на ин-
тервале [0, 2л] функций, которая используется для разложения детерми-
нированных сигналов, а также для получения спектральных характерис-
тик и их оценок при анализе одномерных и многомерных случайных
процессов.
Полные системы функций Уолша (рис. Ш, б) и функций Хаара
(рис. П1, в), в отличие от базиса Фурье, состоят из функций с конечным
числом уровней, что позволяет избавиться от погрешностей, связанных
с их квантованием. На рис. Ш пунктирными линиями показано дискрет-
ное представление базисов Фурье, Уолша и Хаара.
В противоположность гармоническим функциям, содержащим в об-
щем случае три параметра: амплитуду, частоту и начальную фазу, базис-
ные функции Уолша описываются четырьмя параметрами: амплитудой А,
номером функции v, интервалом задания (временной базой) Т и сдви-
гом /:
у(А,/) = wal (v, t) = y4wal
Для функций Хаара используется еще и номер группы /и, в которую
объединяют функции с одинаковой длительностью:
334
t-t<A
v, •
Т )
v(*,t) = Xm(v, t) = A%m (v, J.
Наличие дополнительного параметра T (или N = 7/ДГ при дискрет-
ном представлении интервала) в описании базисных функций Уолша и
Хаара приводит к принципиальным отличиям от базиса Фурье. Одно из
них состоит в том, что функции Уолша и Хаара не инвариантны к изме-
нению масштаба аргументов времени и частоты, т.е. для них не всегда
выполняются условия теоремы масштабирования:
х(а/) <-> Л(усо/а),
кроме значений Т\ кратных 2Л, и теоремы сдвига:
x(t± tQ) <-> Л(/ш)ехр(±Уш/0),
за исключением t = Т/2\
Эти соотношения, которые связывают между собой сигнал и его
спектр, обусловлены тем, что базисные функции Уолша и Хаара опре-
делены на ограниченном интервале [О, Г] и имеют кусочно-линейную
зависимость от аргумента.
cos О/
sin 1/
wal(2, t)
wal(0, t)
! j j i j !l
t
cosh
sin2r
cos 2/
sin3r
cos3r
sin 4/
О лД/
a
wal(5, t)
wal(6, t)
П1П1 iFIrP-
wal(7, t)
П-П-Гиъ
О лДГ
в
Рис. Ш. Первые функции базисов Фурье (а), Уолша (б) и Хаара (в)
335
Рис. П2. Первые функции Радемахера
Функции Уолша могут быть сфор-
мированы разными способами. Одним
из распространенных способов их по-
лучения является формирование функ-
ций Уолша из линейных комбинаций
меандровых функций Радемахера,
приведенных на рис. П2.
Например, для получения функции
Уолша wal(7, /) с помощью функций
Радемахера необходимо выполнить
операцию:
wal(7, t) = rad(l,/)rad(2,/)rad(4,0.
Функции Хаара можно получить на основе линейных комбинаций
функций Уолша, например:
Хо(1,О = wal(l,/),
Хо(2,0 = wal(2,f),
Xi (3, /) = 0,5 [wal(3, Z) + wal(4, /)],
Xi (4, t) = 0,5 [wal(3, t) - wal(4, /)].
Функции Уолша образуют мультипликативный базис, поскольку вы-
полняются следующие свойства:
wal [(vj Ф v2), /] = wal(v1,/)wal(v2,Z),
wal [v(/j Ф Z2)] = wal(v, fj)wal(v,Z2),
wal (v,r) = |wal(v,Z)|-1»
|wal(v,/)| = 1.
Здесь символ Ф означает суммирование по модулю два, причем деся-
тичные (v, /) и двоичные (vz, /,) числа связаны соотношением
v Ф / = v + t - 2£ v, th п = log2 N.
/=1
336
Базис Хаара не обладает мультипликативными свойствами, но его функ-
ции, принадлежащие т-й группе, получают с помощью сдвига на соот-
ветствующий двоичный интервал. Например, для случая т = 2 имеем
Х2(5, /) = Х2(4,Г - 2-Г) = Z2(4,Z - Г/8).
Матрицы дискретных комплексно-экспоненциальных функций Фурье
и вещественных функций Уолша и Хаара при размерности Ух N = 8 х 8
имеют вид
W° W° W° W° W° W° И>° W0
И>° W1 W2 W3 W4 W5 W6 W7
W° w2 w4 w6 w8 w10 w12 w14
W° W3 W6 W9 W12 W15 W18 W21
w° w4 w8 w12 w16 w20 w24 w28
w3 w20 w23 w3^
w^2 w^8 w24 w30 w3^ w42
_w° w7 w14 w21 w28 w35 w42 w49_
'11111111'
11 1 1 -1 -1 -1 -1
1 1 -1 -1 -1 -1 1 1
11-1-11 1-1-1
"1-1-11 1-1-11
1-1-11-11 1-1
1-11 -1-11 -11
1 -11-11-11 -1
111 1111 1
111 1 -1 -1 -1 -1
V2 V2 -42 -42 0 0 0 0
0 0 0 0 42 42 -42 -42
2 -2 0 0000 0
002 -2 000 0
000 0 2 -2 0 0
000 0 002 -2
Каждая из этих матриц может быть факторизована, и, следователь-
но, разложения в указанных базисах имеют алгоритм быстрого преобра-
зования. При этом в базисе Фурье число комплексных операций составляет
величину порядка ~kN\og2N, в базисе Уолша число вещественных опера-
ций составляет Mog2./V, в базисе Хаара число операций равно 2(^ - 1).
Здесь N — размерность вектора исходных данных.
337
Приложение 2
Синтез ортогональных базисов с перестраиваемыми функциями
В диагностических задачах чрезвычайно важным является устранение
избыточности при обработке первичной информации, т.е. значительное
сокращение размерности пространства исходного описания. Случайный
характер первичной информации существенно усложняет анализ этой
информации и выделение диагностических признаков. Одним из наибо-
лее эффективных подходов к получению пространства минимальной раз-
мерности для случайных процессов с известной ковариационной функ-
цией R является метод Карунена—Лоэва. Разложение Карунена—Лоэва
является оптимальным и обеспечивает наивысшую среди всех линейных
преобразований концентрацию информации в малом числе коэффици-
ентов разложения и, кроме того, позволяет устранить корреляционные
взаимосвязи между исходными данными. В матричной форме разложе-
ние Карунена—Лоэва имеет вид
'PR'P* = Л, а = *Рх,
где 4х — матрица собственных векторов; Т* — комплексно-сопряженная
матрица; Л — матрица собственных значений; а — вектор спектральных
коэффициентов в базисе Карунена—Лоэва; х — вектор исходных данных.
Полученная таким образом совокупность коэффициентов разложе-
ния {ак} может рассматриваться в качестве признаков исходных данных.
Эти признаки обладают рядом свойств.
1. Эффективность признака, т.е. его полезность при описании исход-
ных данных, определяется соответствующим собственным значением
При этом если некоторый признак ак исключается из рассмотрения, то
среднеквадратичная ошибка увеличивается на соответствующую вели-
чину \к, Поэтому для уменьшения числа признаков необходимо исклю-
чить в первую очередь признаки с наименьшими собственными значе-
ниями.
2. Декорреляция коэффициентов разложения имеет важное значение для
сокращения избыточности данных и устранения их взаимозависимостей.
Тем самым она позволяет получить такое распределение в пространстве
признаков, которое является компактной характеристикой данного класса
сигналов.
3. Минимальность среднеквадратической ошибки при заданном числе чле-
нов ряда, которая обеспечивается за счет разложения по собственным
векторам исходной ковариационной матрицы, а также минимальность
энтропии как меры неравномерности распределения.
Но метод Карунена—Лоэва требует громоздких вычислений, связан-
ных с нахождением собственных значений и соответствующих им соб-
ственных функций.
Значительные вычислительные трудности появляются уже при об-
работке массивов данных с размерностью ковариационной матрицы
338
Рис. ПЗ. Пример разложения импульсного сигнала (а) в базисах Фурье (б),
Уолша (в) и Хаара (г)
N= 50 — 200. Особенно большой объем вычислений приходится на пред-
варительное получение матриц R, 4х, Л. Если же они найдены, то на
этапе выполнения ортогонального преобразования по собственным фун-
кциям потребуется MN операций (М — размерность пространства при-
знаков). Отсюда вытекает необходимость сокращения числа операций
путем использования алгоритмов быстрых преобразований. При этом путь
решения данной задачи базируется на изложенном в [21] подходе к по-
строению многообразия базисных систем функций с быстрым преобра-
зованием.
Правомерность постановки задачи обоснованного выбора подходя-
щего базиса разложения исходного процесса при спектральном анализе
можно проиллюстрировать на простом примере. Рассмотрим спектраль-
ное представление импульсного сигнала (рис. ПЗ, а) с использованием
разложений по системе тригонометрических функций (Фурье) и функ-
ций Уолша, Хаара. На рис. ПЗ, б—г приведены соответственно спектры
Фурье, Уолша и Хаара. Можно видеть, что если спектры Фурье и Уолша
содержат полные наборы компонент, то спектр Хаара содержит всего
две компоненты. Отсюда вытекает естественный вывод о том, что для
данного типа сигналов наиболее выгодно применение базиса Хаара.
Таким образом, среди разных систем базисных функций, использу-
емых для разложения исходной информации, наибольший интерес пред-
ставляют те из них, которые имеют минимально возможное число ин-
формативных компонент, т.е. являются оптимальными в смысле сказан-
ного выше.
Авторами [21] предложен подход к формированию различных бази-
сов на основе матрично-ядерных представлений. Суть этого метода со-
стоит в таком факторизованном представлении матрицы спектрального
оператора, при котором ненулевые элементы факторизованных матриц
взаимосвязаны условиями ортонормированности и полноты, а также
имеют параметры, изменением которых можно формировать множество
базисов с алгоритмами быстрых преобразований. Таким образом, созда-
ется возможность целенаправленного получения базисных функций, при-
способленных по своей форме к условиям задачи и обеспечивающих при
этом быстроту расчета спектральных разложений.
Если исходный сигнал представляет собой дискретную последова-
тельность и задан в виде вектор-столбца
x = [xl,x2,...,x„]T, N = 2n,
339
„(М) 0 0 0 «01
(/,/) «10 0 0 0 ап
Рис. П4. Пример матрицы Гуда
то спектральные коэффициенты могут быть вычислены с помощью мат-
ричного уравнения
а = -^Нх, (П1)
где Н — квадратная матрица спектрального оператора размерности Nx N.
Выразим матрицу Н в факторизованном виде
H = G1G2. G„=nG„
/=1
где Gz представляет собой разреженную нулями и далее неразложимую
матрицу.
Одна из регулярных возможных форм матрицы G,, называемой мат-
рицей Гуда, показана на рис. П4. Ее строки и столбцы пронумерованы в
двоичной системе счисления. Заштрихованы ненулевые элементы а мик-
роблоков М, /.
Матрица минимальной размерности, полученная из ненулевых эле-
ментов микроблока
4° 4°
(/,/) „(М)
10 а\\
(П2)
называется спектральным ядром.
Факторизованное представление спектрального оператора Н безыз-
быточными матрицами Гуда G, приводит к сокращению числа операций
в преобразовании (П1). Заметим, что все алгоритмы быстрых спектраль-
ных преобразований основаны на этом свойстве.
Если к функциям базиса предъявить фундаментальные требования
ортонормированности и полноты образуемой ими системы, то спект-
ральное ядро (П2) можно получить в форме:
340
у COS<P/’/ еХР[(2ЯУ/ ^)©i,/]Sin(P/,/
',Z sirup,, exp [(2л//#)©,/] cos <p/;/
j = 17, / = 1JV/2.
Вид спектрального ядра Vz>/ показывает, что изменяемыми парамет-
рами являются углы {ф/;/} и {0/,/}, которые выполняют роль степеней сво-
боды конкретного ядра V. Именно это обстоятельство создает возмож-
ность синтеза бесчисленного многообразия базисов, имеющих алгорит-
мы быстрого преобразования, причем традиционные базисы Фурье,
Уолша и Хаара в этом многообразии являются частными случаями. По-
этому ядро (ПЗ) называют обобщенным спектральным ядром. Его геомет-
рической моделью является геометрическое место точек на поверхности
сферы радиусом V2 с центром в начале координат (рис. П5). Каждой
точке такой поверхности с координатами <рЛ/ и 0Z / однозначно соответ-
ствует ядро (ПЗ).
Геометрическая модель обобщенного спектрального ядра в виде сфе-
ры позволяет дать наглядное объяснение элементам матрицы - ядра V.
Например, при фиксированном значении ф/;/ движение точки может про-
исходить в любом направлении по «меридиональной» траектории. В тех
же случаях, когда углы 0, / = 0 (случай вещественного базиса), движение
точки происходит вдоль «экваториальной» траектории в любом направ-
лении.
Общее число ядер формируемого спектрального оператора равно nN/2,
при этом все ядра могут быть различными либо совпадающими частично
или полностью. В частности, на рис. П5 приведены точки ядра, соответ-
ствующие системе дискретных экспоненциальных функций Фурье (ф/;/ =
= л/4; 0/?/ = 0, л/2, Зл/4), базису Уолша (ф/;/ = л/4; 0Z/ = 0), базису Хаара
(Ф1 = 0; ф2 = л/4; 0,;/ =0).
Из выражения (ПЗ) следует возможность параметрического воздей-
ствия элементов матриц (ядер) на элементы базисных функций (векто-
ров). И очевидно, что чем больше углов (параметров) участвует в фор-
мировании матрицы Н, тем выше степень изменяемости формируемого
Рис. П5. Геометрическая модель обобщен-
ного спектрального ядра:
I — точки ядра, соответствующие системе диск-
ретных экспоненциальных функций Фурье;
II — базису Уолша; III — базису Хаара
341
базиса. При этом в многоядерных базисах изменением какого-либо пара-
метра можно перестроить либо две строки, либо два столбца, либо блок
(подматрицу), т.е. осуществить локальную перестройку.
Таким образом, из изложенного выше следует, что поиск оптималь-
ного базиса основывается на априорных сведениях о классе процессов,
являющихся первичной информацией при реализации алгоритмов диа-
гностики. Кроме того, целесообразно провести сравнение базисов с це-
лью выбора подходящего базиса, допускающего относительно неслож-
ную алгоритмическую и техническую реализацию. На основании сопо-
ставления по такому комплексу вопросов для оптимального и неопти-
мального базиса принимается решение о предпочтении той или иной
системы функций при решении конкретной задачи. После того как си-
стема базисных функций выбрана, выполняется фильтрация сигналов.
Обычно фильтр включает анализатор (он производит отображение про-
странства исходных данных в спектральную область) и избирательную
систему (она обеспечивает устранение избыточности с помощью уста-
новленного порогового уровня (сигнатуры) или уровней в соответству-
ющих спектральных областях по выбранному критерию оценивания).
Если в качестве критерия используют подавление компонент высших
порядков, то тем самым решают задачу фильтрации нижних обобщен-
ных частот; если используют подавление заданных компонент, то осу-
ществляют фильтрацию полосы частот и т.д.
В случае если назначением системы диагностирования является обна-
ружение предаварийных состояний, то в качестве диагностического при-
знака можно использовать даже общий уровень сигнала в широкой по-
лосе. Однако при детализации вида неисправностей целесообразно про-
водить сужение полосы спектрального анализа в выбранном базисе с
привязкой компонент спектра к определенному виду дефекта.
Следует обратить внимание еще на одно обстоятельство. При сигна-
турном спектральном анализе превышение заданных пороговых уровней
сигнализирует о возникновении в системе предаварийной ситуации, т.е.
такой анализ направлен на выявление грубых дефектов. При выборе не-
большого уровня сигнатуры может произойти ложное срабатывание си-
стемы аварийной сигнализации, если в исходной информации возрастут
флуктуации случайной компоненты. В то же время увеличение уровня
срабатывания приводит, естественно, к снижению чувствительности
системы диагностики. Отсюда вытекает необходимость при разработке
диагностической системы тщательного учета назначения диагностируе-
мого объекта, конкретной ситуации и априорных сведений о процессах,
протекающих в этом объекте.
Приложение 3
Сжатие диагностической информации
При использовании традиционных спектральных характеристик, по-
лученных путем преобразования Фурье, практически невозможно обой-
тись одной-двумя спектральными составляющими для формирования
вектора признаков состояния диагностируемой системы. Это происхо-
дит потому, что в общем случае ни одна отдельно взятая составляющая
спектра Фурье не является достаточно информативной, поэтому при-
ходится прибегать к построению «-мерного диагностического вектора
спектральных компонент. Действительно, учитывая, что основная идея
диагностики состоит в сравнении анализируемых данных с заранее из-
вестным эталоном (или эталонами) и последующем выявлении отличий
исходных данных от эталона и их надлежащей интерпретации, а обра-
ботка исходной информации на основе спектрального преобразования
в традиционном базисе Фурье зачастую дает «размытый» спектр, воз-
никает необходимость значительного уменьшения размерности этого
вектора.
Использование ортогональных базисов с перестраиваемыми функ-
циями открывает путь при обработке информации к формированию та-
'Ких базисов, которые позволяют получать спектральные компоненты,
имеющие резко неравномерное перераспределение дисперсий по срав-
нению с распределением дисперсий отсчетов преобразуемых данных [21].
Рассмотрим возможность применения перестраиваемых базисов для
обработки случайных процессов ритмического типа, т. е. процессов, ко-
торые характеризуются периодическим повторением статистических ха-
рактеристик (математического ожидания, дисперсии, автокорреляцион-
ной функции). Именно к таким процессам можно отнести вибрации,
акустические шумы и т.п.
Пусть имеется множество первичных сигналов {X} = {х/л}, i = \,К,
n = Q,N -1. В качестве исходной характеристики при формировании адап-
тивных базисов возможно использование вектора математического ожи-
дания
М {xin} = mx = [Z„f =
который и будет являться эталоном, и, следовательно, в спектральной
области ему будет соответствовать только один коэффициент, отличный
от нуля. При этом отклонения текущих реализаций от эталона во вре-
менной области будут, очевидно, приводить к появлению новых коэф-
фициентов в спектральной области. Учет последних при выборе порого-
вых значений в соответствующей метрике позволяет решить задачу рас-
познавания.
Матричное уравнение для определения параметров обобщенного спек-
трального ядра {ср,/} по заданному математическому ожиданию [ZJ и од-
343
ному ненулевому спектральному коэффициенту равному согласно
равенству Парсеваля сумме квадратов значений отсчетов zn:
[а] = К0, ...,0]г =
r>v—1
Z г2,0,
_ и=0
-|Т
..,0
при условии, что существует обратное преобразование, которое в случае
вещественного базиса [Н] можно записать в виде
[Zj = VjV[Hr,[*] = VjV[H1][a].
Выразив матрицу [HJ через обобщенное спектральное ядро вида
cos ф, z sin z
sin фл/ - cos ф, z
(П.4)
можно получить при N = 8 следующее соотношение для углов-парамет-
ров {ф, /}, образующих ядра спектральных операторов [21]:
tg<P31 = — > tg<p32 = —, tg<p33 =
*2 z2
<_2 . _2 >У2
ШФ21= П—% , ШФй =
I Zo + Zl J
tgcpn =
tgq>34=—,
Zi %
|Ч2+*П1/2
Ч2 + ?5 +*6 +?7 "Г
. з? + г2 + z22 + z2 J
,2 V/2
(П.5)
Известны также соотношения для углов-параметров, образующих ядра
спектральных операторов, для общего случая, когда = 2Л [21].
Расположение ядер спектральных операторов в факторизованных мат-
рицах Н имеет следующий вид:
Н = G|G2...G„ = nG„
/=1
где G, представляет собой разреженную нулями и далее неразложимую
матрицу.
Для случая N=8 матрица Н имеет вид
где прямоугольниками обозначены ядра вида (П4), значения элементов
которых определяются соответствующими параметрами ф/7, причем сплош-
344
ними прямоугольниками отмечены ядра, параметры которых определя-
ются на основании (П5), пунктиром — ядра, параметры которых не за-
висят от исходных данных; эти ядра определяют оставшиеся степени
свободы и позволяют проводить дальнейшую оптимизацию базиса в со-
ответствии с заданными условиями (упрощение вида базисных функ-
ций, уменьшение объема памяти ЦВМ и т.д.).
В частности, для экономии памяти ЦВМ целесообразно принять
Ф12 ~ Ф13 ~ Ф14 “ Ф11, Ф23-Ф21, Ф24~Ф22- (П6)
Базис с параметрами (П6) в соответствии с принятой [21] терминоло-
гией называется приспособленным базисом I типа. Использование такой
закономерности расстановки ядер в факторизованных матрицах значи-
тельно упрощает процедуру определения углов-параметров для уточнения
разложения при увеличении размерности исходного вектора. Причем ра-
нее вычисленные значения углов остаются без изменения, а расчет новых
углов-параметров проводится только для добавляемых матриц [GJ.
Полученный ортонормированный базис приспособлен к функции
математического ожидания и в записи через обобщенную форму прямо-
го произведения принимает вид
[HJ = [(фн), (ф|2),(ф1з)> (ф|4)1 ® [(ф2|), (ф22>,
(ф2з). (Ф24>] ® Кф31), (Ф32), (ФЗЗ), (Ф34)],
где [(...), (...), (...), (...)] — символическая запись соответствующей фак-
торизованной матрицы; ® — символ прямого (или кронекеровского)
произведения матриц, которое соответствует перемножению каждого эле-
мента первой матрицы на всю правую матрицу:
®г*
а4 J
01*2
«1*3 й2^3
а3Д а3*2 a4Z>j <24*2
.«3^ О3*4 <74*j О4*4_
С учетом (П6) выражение (П7) принимает окончательный вид
[Hj] = [(Ф11 )4] ® [(Ф21 )г> (ф22)г! ® [(фз1 )> (фзг)> (фзз )> (фз4 )1 •
Применение данного базиса для классификации сигналов достаточ-
но эффективно при равновероятном отклонении текущей реализации
сигнала от эталона на всем интервале его наблюдения (рис. П6).
При локальном отклонении реализации от эталона на относительно
небольшом интервале (рис. П7) наилучший результат обеспечивает та-
кой базис, функции которого отличаются локальным поведением на ин-
тервале наблюдения и равны нулю на его большей части. Такой базис
можно синтезировать, используя ядра двух типов, одно из которых име-
ет нулевые значения элементов.
345
Рис. П6. Пример равновероятного отклонения текущей реализации сиг-
нала х (пунктирная линия) от эталона т (сплошналя линия)
Для рассматриваемого примера расположение ядер в факторизован-
ных матрицах будет иметь вид [21]:
О1
□
JP24 = <£
Ы
5*12 =
u<PL4 =
В этом случае полученный базис называется приспособленным бази-
сом II типа и может быть записан в виде
*$32
~^32
534
-С34
A*331
где Сц = cos(p/ Z; Su = sincp, z; i = 1, 3; I = 1, 3; запись (...)2 и (...)3 означает, что
данное ядро повторяется в матрице соответственно дважды или трижды.
х, т
0
Рис. П7. Пример локального отклонения текущей реализации сигнала х
(пунктирная линия) от эталона т (сплошналя линия)
346
Из расчетов и экспериментальных данных [21] видно, что показатель
сжатия исходных процессов при разложении в приспособленных базисах
в 3—10 раз выше, чем при разложении в базисах Фурье, Уолша или
Хаара. При этом преимущества приспособленных базисов особенно вы-
являются с повышением размерности исходных данных. Наконец, они
обеспечивают оперативное сжатие обрабатываемых сигналов благодаря
присущему им алгоритму быстрого преобразования.
При практическом применении в диагностических задачах рассмот-
ренного выше метода формирования приспособленного базиса необхо-
димо принимать во внимание то, что первичная информация, использу-
емая для формирования диагностических признаков, характеризуется
большим разнообразием классов сигналов, разным положением во вре-
мени и пространстве, наличием случайных помех. Это обстоятельство
затрудняет формирование приспособленных базисов в пространстве ис-
ходных данных и вынуждает подвергать их предварительной обработке с
помощью линейных и нелинейных преобразований, например методом
последовательного формирования признаков, инвариантных к опреде-
ленным преобразованиям исходных данных. В качестве первичного орто-
гонального преобразования используется преобразование Фурье, амп-
литудный спектр которого инвариантен к временному сдвигу. Это свой-
ство позволяет свести динамическую задачу к статической и тем самым
охарактеризовать каждый класс сигналов своим эталоном в простран-
стве спектральных признаков Фурье. Далее каждому классу ставится в
соответствие система функций, приспособленная к виду эталонного спек-
тра Фурье. Процедура формирования информативных диагностических
признаков выполняется с помощью вторичного ортогонального преоб-
разования вектора спектральных признаков Фурье по приспособленным
системам дискретных ортогональных функций. При этом классификация
сигналов выполняется в зависимости от выбранного критерия.
СПИСОК ЛИТЕРАТУРЫ
1. Адлер Ю.П. Планирование эксперимента при поиске оптимальных
условий / Ю.П.Адлер, Е.В.Маркова, Ю.В.Грановский. — М. : Наука,
1976.
2. Алексеев А. А. Диагностика в технических системах управления : учеб,
пособие для высш. техн. учеб, заведений / А. А. Алексеев, А. И. Солодов-
ников ; под ред. В.Б.Яковлева. — СПб.: Изд-во СПбГЭТУ «ЛЭТИ», 1997.
3. БендатД. Применения корреляционного и спектрального анализа /
Д.Бендат, А.Пирсол. — М. : Мир, 1983.
4. Генкин М.Д. Виброакустическая диагностика машин и механизмов /
М.Д. Генкин, А. Г. Соколова. — М. : Машиностроение, 1987.
5. Герасимов В. А. Методы решения проблемы нечеткости в задачах уп-
равления / В. А. Герасимов. — Новосибирск : Наука, 1999.
6. Дейч А.М. Методы идентификации динамических объектов /
А. М. Дейч. — М. : Энергия, 1979.
7. Канарчук В. Е. Бесконтактная тепловая диагностика машин / В. Е. Ка-
нарчук, А.Д.Чигринец. — М. : Машиностроение, 1987.
8. Карасев В.А. Доводка эксплуатируемых машин. Вибродиагности-
ческие методы / В. А. Карасев, А. Б. Ройтман. — М. : Машиностроение,
1986.
9. ЛъюингЛ. Идентификация систем. Теория для пользователя / Л.Лью-
инг. — М.: Наука, 1991.
10. Макс Ж. Методы и техника обработки сигналов при физических
измерениях. Т. 1. /Ж.Макс. — М.: Мир, 1983.
11. Максимов В.П. Измерение, обработка и анализ быстроперемен-
ных процессов в машинах / В. П. Максимов, И. В. Егоров, В. А. Карасев. —
М. : Машиностроение, 1987.
12. Мандель И.Д. Кластерный анализ / И. Д. Мандель. — М.: Финансы
и статистика, 1988.
13. Методы классической и современной теории автоматического уп-
равления : учебник : в 5 т. Т. 2 : Статистическая динамика и идентифика-
ция систем автоматического управления / под ред. К. А. Пулкова, Н. Д. Егу-
пова. — М.: Изд-во МГТУ им. Н.Э. Баумана, 2004.
14. Мирский Г Я. Характеристики стохастической взаимосвязи и их из-
мерения / Г. Я. Мирский. — М. : Энергоиздат, 1982.
15. Музыкин С. Н. Моделирование динамических систем / С. Н. Музы-
кин, Ю. М. Родионова. — Ярославль : Верх.-Волж. кн. изд-во, 1984.
348
16. Нечеткие множества в моделях управления и искусственного ин-
теллекта / под ред. Д. А. Поспелова. — М.: Наука, 1986.
17. Обработка нечеткой информации р системах принятия решений /
под ред. А. Н. Борисова. — М.: Радио и связь, 1989.
18. Прикладные нечеткие системы / под ред. Т.Тэрано, К. Асаи, М. Су-
гэно. — М.: Мир, 1993.
19. Пухов Г. Е. Критерии и методы идентификации объектов / Г. Е. Пу-
хов, Ц.С.Хатиашвили. — Киев : Наук, думка, 1979.
20. Растригин Л. А. Введение в идентификацию объектов управления /
Л.А.Растригин, Н. Е. Маджаров. — М. : Энергия, 1977.
21. Солодовников А. И. Основы теории и методы спектральной обра-
ботки информации : учеб, пособие / А. И. Солодовников, А. М. Спиваков-
ский. — Л. : Изд-во ЛГУ, 1986.
22. Теория управления : учебник / [А. А. Алексеев, Д.Х. Имаев,
Н.Н. Кузьмин, В.Б.Яковлев]. — СПб.: Изд-во СПбГЭТУ «ЛЭТИ», 1999.
23. Типовые линейные модели объектов управления / под ред.
Н.С.Райбмана. — М.: Энергоатомиздат, 1983.
24. Эйкхофф П. Современные методы идентификации систем / П. Эй-
кхофф, А. Ванечек, Е.Савараги. — М.: Мир, 1983.
25. Явленский К.Н. Вибродиагностика и прогнозирование качества
механических систем / К. Н.Явленский, А. К. Явленский. — Л.: Машино-
строение, 1983.
ОГЛАВЛЕНИЕ
Предисловие..........................................................3
Введение.............................................................5
Глава 1. Общие принципы построения математических моделей
объектов и систем управления......................................10
1.1. Основные понятия...............................................10
1.2. Общая характеристика методов идентификации.....................13
1.3. Особенности идентификации как оптимизационной задачи...........16
1.4. Структурная идентификация объекта управления...................21
1.5. Аналитическое составление математических моделей...............29
Глава 2. Методы идентификации статических характеристик объектов
управления........................................................33
2.1. Метод наименьших квадратов.....................................33
2.2. Полный факторный эксперимент...................................40
2.3. Дробный факторный эксперимент..................................45
2.4. Обработка экспериментальных данных методом дисперсионного анализа ...47
Глава 3. Идентификация объектов управления при детерминированных
воздействиях...................................................д..53
3.1. Экспериментальные методы исследования объектов управления
при периодических воздействиях......................................53
3.2. Предварительное изучение объекта управления....................55
3.3. Определение частотных характеристик объектов управления........58
3.4. Экспериментальное определение частотных характеристик..........63
3.5. Определение динамических характеристик линейных
объектов при апериодических воздействиях............................69
3.6. Обработка результатов эксперимента по снятию переходных функций.71
3.7. Определение частотных характеристик объектов управления
по переходным функциям..............................................75
Глава 4. Статистические методы идентификации........................82
4.1. Уравнение статистической идентификации.........................82
4.2. Уравнение статистической идентификации в частотной области.....85
4.3. Методы решения уравнения статистической идентификации..........88
4.4. Регуляризация решения уравнения статистической
идентификации.......................................................91
4.5. Метод «типовой» идентификации объектов управления..............95
4.6. Оценка структуры и параметров модели объекта
при «типовой» идентификации.........................................98
4.7. Решение уравнения статистической идентификации
с использованием аппроксимирующих функций...........................104
4.8. Идентификация объектов управления в замкнутых системах........106
4.9. Идентификация объектов управления методами оценивания..........ПО
Глава 5. Методы идентификации нелинейных объектов..................118
5.1. Особенности идентификации нелинейных динамических
объектов...........................................................118
350
5.2. Идентификация нелинейных объектов с использованием
линеаризованных моделей............................................122
5.3. Идентификация нелинейных объектов с использованием
функциональных степенных рядов.....................................127
5.4. Использование рядов Вольтерра для идентификации нелинейных
объектов, содержащих множительные устройства.......................133
5.5. Использование рядов Вольтерра для построения
моделей при идентификации нелинейных объектов......................136
5.6. Идентификация нелинейных объектов класса Гаммерштейна.........138
5.7. Блочно-ориентированные нелинейные модели......................140
Глава 6. Методы идентификации с настраиваемыми моделями............144
6.1. Принципы построения систем идентификации с настраиваемыми
моделями...........................................................144
6.2. Структурные и изоморфные модели...............................147
6.3. Алгоритмы настройки модели....................................152
6.4. Точность методов идентификации с настраиваемыми
моделями...........................................................159
6.5. Использование беспоисковых моделей при идентификации
объектов...........................................................161
Глава 7. Характеристики качества идентификации.....................167
7.1. Критерии адекватности объекта и модели........................167
7.2. Основные ошибки оценок параметров моделей, получаемых
в процессе идентификации объектов управления....................170
Глава 8. Модели процессов и оценивание их спектрально-корреляционных
характеристик в задачах идентификации динамических объектов
управления......................................................177
8.1. Характеристики случайных процессов............................177
8.2. Оценивание корреляционных функций случайных процессов.........182
8.3. Оценивание спектральных плотностей случайных процессов........191
Глава 9. Общие принципы построения диагностических систем..........197
9.1. Основные задачи диагностики технических объектов
и систем управления................................................197
9.2. Виды неисправностей технических систем........................200
9.3. Диагностические модели........................................203
9.4. Классификация состояния при диагностике
технических систем.................................................208
9.5. Формирование словаря диагностических признаков................214
9.6. Структура типовой системы диагностики.........................218
Глава 10. Диагностические сигналы и параметры......................223
10.1. Диагностические сигналы......................................223
10.2. Основные требования к первичной диагностической
информации.........................................................227
10.3. Обработка измерений и выделение информативных признаков.....232
10.4. Численные характеристики процессов и их использование
в задачах диагностики..............................................237
Глава 11. Спектральные методы диагностики технических систем.......242
11.1. Вибрационные процессы в технических системах.................242
11.2. Диагностические признаки вибрационных процессов..............245
11.3. Кепстральный и биспектральный анализ вибропроцессов..........254
351
11.4. Применение пространственно-временных спектральных преобразований
при построении диагностических моделей..............................258
Глава 12. Применение нечетких множеств в задачах технической диагностики . 268
12.1. Основные понятия теории нечетких множеств....................268
12.2. Построение систем диагностики, основанных на использовании
нечетких множеств...................................................279
12.3. Методы кластерного анализа при диагностике систем............286
12.4. Fuzzy-технологии в задачах диагностики систем................289
12.5. Нейросетевая эталонная fuzzy-классификация...................296
Глава 13. Прогнозирование состояния технических систем.............303
13.1. Задача прогнозирования.......................................303
13.2. Основные методы прогнозирования..............................306
13.3. Ресурсные испытания..........................................314
Глава 14. Технические средства диагностики систем..................317
14.1. Средства измерения первичной информации......................317
14.2. Основные типы датчиков.......................................324
14.3. Технические комплексы диагностики............................329
Приложения.........................................................334
Список литературы..................................................348
Учебное издание
Алексеев Алексей Александрович,
Кораблев Юрий Анатольевич,
Шестопалов Михаил Юрьевич
Идентификация и диагностика систем
Учебник
Редактор А. И. Яловская
Технический редактор О. Н, Крайнова
Компьютерная верстка: Р. Ю. Волкова
Корректоры Л. В. Гаврилина, А. П. Сизова
Изд. № 101112265. Подписано в печать 12.02.2009. Формат 60x90/16.
Гарнитура «Таймс». Бумага офсетная № 1. Печать офсетная. Усл. печ. л. 22,0.
Тираж 2 500 экз. Заказ № 6458
Издательский центр «Академия», www.academia-moscow.ni
Санитарно-эпидемиологическое заключение № 77.99.02.953.Д.004796.07.04 от 20.07.2004.
117342, Москва, ул. Бутлерова, 17-Б, к. 360. Тел./факс: (495)334-8337, 330-1092.
Отпечатано с электронных носителей издательства.
ОАО "Тверской полиграфический комбинат", 170024, г. Тверь, пр-т Ленина, 5.
Телефон: (4822) 44-52-03,44-50-34, Телефон/факс: (4822) 44-42-15
Home page - www.tverpk.ru Электронная почта (E-mail) - sales@tverpk.ru
*