Текст
                    МЕТОДЫ ТЕОРИИ
АВТОМАТИЧЕСКОГО
УПРАВЛЕНИЯ
Цикл учебников и учебных пособий
основан в 1997 г.
Под общей редакцией заслуженного деятеля науки РФ,
доктора технических наук, профессора
К А. Пупкова


МЕТОДЫ КЛАССИЧЕСКОЙ И СОВРЕМЕННОЙ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Учебник в трех томах ТОМЗ МЕТОДЫ СОВРЕМЕННОЙ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Под редакцией заслуженного деятеля науки РФ, доктора технических наук, профессора Н.Д. Егупова Рекомендовано Министерством образования Российской Федерации в качестве учебника для студентов высших учебных заведений, обучающихся по машиностроительным и приборостроительным специальностям Москва Издательство МГТУ им. Н.Э. Баумана 2000
УДК 681.5:681.3(075.8) ББК 14.2.6 М54 Рецензенты: 1. Академик РАН ЕЛ. Попов; 2. Кафедра автоматических систем Московского института радиотехники, электроники и автоматики (заведующий кафедрой, член-корреспондент РАН ЕЛ Теряев). Авторы: Д-р техн. наук, проф. К А. Пупков, д-р техн. наук, проф. НД. Егупов, д-р техн. наук, проф. А.И. Баркин, д-р техн. наук, проф. ЕМ. Воронов, канд. техн. наук, доц. Л.Г. Комарцова, канд. техн. наук, доц. В.Г. Коньков, д-р техн. наук, проф. Ю.П. Корнюгиин, канд. техн. наук, доц. В.И. Красно- щеченко, канд. техн. наук, доц. АЛ. Курдюков, канд. техн. наук, доц. А. В. Максимов, инженер ЮЛ. Мышляев, канд. техн. наук, доц. В Л. Пи- лишкин, канд. техн. наук, доц. В.И. Сивцов, д-р техн. наук, проф. А.И. Трофимов, д-р техн. наук, проф. Н.В. Фалдин М54 Методы классической и современной теории автоматического управления: Учебник в 3-х т. Т.З: Методы современной теории автоматического управления / Под ред. Н.Д. Егупова. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2000. - 748 с, ил. ISBN 5-7038-1632-7 (Т.З) ISBN 5-7038-1579-7 В третьем томе учебника изложены основные теоретические положения некоторых направлений теории автоматического управления, интенсивно развиваемых в последние десятилетия Рассмотрены методы расчета и проектирования систем, использующие аппарат дифференциальной геометрии Отражены центральные положения теории катастроф, теории хаоса; приведены понятия, связанные с теорией фракталов и их использованием В конце 70-х годов возникла теория робастного управления. Рассмотрены перспективные направления теории робастного управления, основанные на методах Н°° -оптимизаций. Значительное внимание уделено освещению вопросов оптимизации многообъектных многокритериальных систем на основе стабильно-эффективных компромиссов (игровые подходы в управлении) Достаточно полно рассмотрен класс адаптивных систем Впервые в учебной литературе с необходимой полнотой и глубиной отражены основные положения теории интеллектуальных систем В последней главе третьего тома рассмотрены вопросы применения нейрокомпьютеров в системах управления Материал является частью общего курса теории автоматического управления, читаемого студентам МГТУ им Н Э Баумана, ТулГУ, ОИАТЭ и других вузов. Учебник предназначен для студентов вузов; он может быть также использован аспирантами и инженерами, а некоторые положения - научными работниками, занимающимися автоматическими системами. УДК 681.5:681.3(075.8) ББК 14.2.6 ISBN 5-7038-1632-7 (Т.З) © Пупков К.А, Егупов Н.Д, Баркин А И. и др , 2000 I<sRN 5 7018 157Q 7 © МГТУ им. Н.Э. Баумана, 2000 i д огч э- / и jo- 1 э / у- i о Издательств0 МГТу им Н Э Баумана, 2000
Нашим учителям посвящается. ОБЩЕЕ ПРЕДИСЛОВИЕ К УЧЕБНИКУ I. Особенности учебника. Учебник издается в трех томах, с >стоящих из четырех частей и заданий для самостоятельной работы. Для него характерно следующее: 1. Учебник охватывает основные положения, составляющие содержание теории автоматического управления. Изложение материала начинается с основных понятий и определений (сущность проблемы автоматического управления, определение системы управления, фундаментальные принципы управления, основные виды и законы автоматического управления и др.) и заканчивается детальным рассмотрением содержания некоторых современных направлений теории автоматического управления. Поскольку курс теории автоматического управления включен в учебные планы различных инженерных специальностей и является одним из важнейших элементов общетехнического образования, учебник может быть рекомендован студентам, заново приобретающим знания в области теории автоматического управления, и специалистам, которым приходится эти знания восстанавливать. Учебником могут пользоваться также студенты тех специальностей, для которых курс является профилирующим, определяющим квалификацию инженера. При изучении курса студент или специалист должен сделать выборку материала, определяемого конкретной задачей и возможностями общего плана обучения. 2. Содержание учебника имеет инженерную направленность, поэтому изложение ведется с инженерной точки зрения: подчеркиваются главные идеи, лежащие в основе методов, но не всегда приводятся строгие математические доказательства. Учитывая, что без освоения технического аспекта изучение методов теории автоматического управления не приводит к нужному результату (часто имеют место трудности в постановке и решении инженерных задач даже при хороших знаниях теоретических положений), физическая и содержательная сторона дела подчеркивается в течение всего курса. Более того, значительное внимание уделено рассмотрению конкретных промышленных систем управления. Например, в главе 7 тома 2 рассмотрены системы управления теплоэнергетическими параметрами атомных электростанций; в заданиях для самостоятельной работы описаны системы управления, применяемые в атомной промышленности. Примеры, иллюстрирующие теоретические положения и методы расчета, тесно связаны с решением конкретных инженерных задач в таких отраслях, как атомная энергетика, производство летательных аппаратов и др. 3. Методы теории автоматического управления, рассмотренные в учебнике, в большинстве своем ориентированы на применение ЭВМ. Интенсивное развитие процессов автоматизации проектирования систем автоматического управления, обусловленное развертыванием высокопроизводительных вычислительных комплексов в проектно-конструкторских организациях, перемещение центра тяжести процесса проектирования от аппаратного обеспечения к алгоритмическому и программному обеспечению приводят к необходимости разработки нового методологического обеспечения, включая соответствующие вычислительные технологии ([156], том 1).
Предисловие Для содержания книги характерна, в известной мере, «вычислительная окраска», поскольку возможности современных ЭВМ позволяют значительно ускорить сроки проектирования САУ и, таким образом, налагают свой отпечаток на вычислительную часть ТАУ. Успех в решении поставленных задач расчета и проектирования с использованием ЭВМ зависит от многих факторов, основными из которых являются: степень адекватности математической модели системы; степень эффективности численных методов ТАУ, используемых в алгоритмическом обеспечении; наличие высококачественного программного обеспечения; от того, насколько успешно используется творческий потенциал исследователя-проектировщика. При этом решающий фактор остается за человеком, который может решать многие неформализованные задачи. Поскольку системы автоматизированного проектирования (САПР) являются в настоящее время одним из наиболее эффективных средств повышения производительности инженерного труда и научной деятельности, сокращения сроков и улучшения качества разработок, то в главе 8 (том 1) кратко отражены соответствующие положения, в том числе изложены численные методы (аппарат матричных операторов). Рассмотренное в трехтомнике методологическое обеспечение, ориентированное на применение ЭВМ, может служить базой для решения весьма сложных задач инженерного проектирования САУ. 4. В учебнике с единых позиций изложены как основные методы классической ТАУ, так и положения, определяющие содержание некоторых современных направлений теории управления. При рассмотрении материала учитывался тот факт, что периодизация развития ТАУ не является установившейся и общепринятой ([156], том 1). К классическим можно отнести положения, базирующиеся на рассмотрении линейных и нелинейных дифференциальных и разностных уравнении с постоянными и переменными коэффициентами применительно к описанию систем, исследованию их устойчивости и качества процессов. К классическим положениям также можно отнести и описание процессов в про- странствах состояний, поскольку в классической теории широко применялось описание движения в фазовом пространстве. В конце пятидесятых - начале шестидесятых годов появились известные работы Л.С. Понтрягина, Р. Белмана, Р. Калмана, в которых заложены основы теории оптимального управления: принцип максимума, динамическое программирование, функционально-аналитические методы и др. Хорошо известно, что многие идеи теории оптимального управления сформировались на инженерном уровне в классический период ТАУ. Важнейшие результаты теории оптимального управления можно отнести к классическим положениям ТА У. Все указанные положения с необходимой глубиной и полнотой изложены в первых двух томах учебника. Методы современной ТАУ, интенсивно разрабатываемые в настоящее время и включающие аппарат синтеза грубых систем автоматического управления в пространстве состояний, Н* -теория оптимального управления, задачи оптимизации многообъектных многокритериальных систем с использованием стабильно- эффективных компромиссов, синтез систем автоматического управления методами дифференциальной геометрии (геометрический подход), использование непро- компьютерных управляющих вычислительных систем, основные положения теории катастроф, фракталов, хаоса, а также задачи исследования и проектирования адаптивных и интеллектуальных систем отражены во 2-м и в 3-м томах учебника. Таким образом, учебник охватывает наиболее важные разделы теории автоматического управления; вместе с тем он не претендует на всесторонний охват проблема-
Предисловие как инвариантность, теория чувствительности, методы и алгоритмы оценивания динамических процессов, идентифицируемость и методы и алгоритмы идентификации (отражены лишь содержание проблемы и подходы к ее решению), системы со случайной структурой, стохастические системы, теория нелинейной фильтрации и др. 5. Основное содержание и структуру учебника определил коллектив авторов, включающий представителей разных российский школ науки об управлении: К.А. Пупков (МГТУ им. Н.Э. Баумана), А.И. Баркин (Институт системного анализа РАН), Е.М. Воронов (МГТУ им. Н.Э. Баумана), Н.Д. Егупов (МГТУ им. Н.Э. Баумана), В.Г. Коньков (МГТУ им. Н.Э. Баумана), А.П. Курдюков (Институт проблем управления РАН), Л.Т. Милов (Московский государственный автомобильно-дорожный институт (МАДИ)), В.Н. Пилишкин (МГТУ им. Н.Э. Баумана), В.И. Рыбин (Московский государственный инженерно-физический институт (МИФИ)), В.И. Сивцов (МГТУ им. Н.Э. Баумана), Я.В. Слекеничс (Обнинский институт атомной энергетики (ОИАТЭ)), А.И. Трофимов (Обнинский институт атомной энергетики (ОИАТЭ)), Н.В. Фалдин (Тульский государственный университет); этими авторами написана большая часть трехтомника. II. Методические вопросы. Необходимо указать, что никакой учебник не может дать окончательных рецептов для решения широчайшего спектра задач, порожденных практикой проектирования сложных систем автоматического управления. Изложенный в книгах материал призван служить базой, фундаментом, позволяющим с большей скоростью и эффективностью находить пути для решения задач практики. Вместе с тем материал излагается таким образом, чтобы читателю были видны пути практического применения рассматриваемых методов. В большинстве своем методы доведены до расчетных алгоритмов, приводятся таблицы и другой вспомогательный материал, облегчающий их применение. Положения, изложенные во всех разделах, иллюстрируются подробно рассмотренными примерами, связанными с задачами расчета и проектирования конкретных систем. Весьма важным является вопрос методики изучения курса «Теории автоматического управления» с целью стать специалистом в этой области, пользуясь циклом учебных пособий и учебников, издаваемых указанным выше коллективом авторов. Весь цикл учебников и учебных пособий можно условно разбить на три серии: 1-я серия - базовая; эта серия включает три тома настоящего учебника. 2-я серия - базовая повышенного уровня, в которой основное внимание уделено глубокому и достаточно полному изложению методов, определяющих содержание современных направлений теории автоматического управления. 3-я серия - серия учебных пособий, посвященная полному и глубокому изложению теоретических положений конкретных направлений ТАУ, например, статистической динамике нелинейных САУ и др. Сказанное выше иллюстрируется рис. В.1. Базовый уровень приобретается изучением предлагаемого учебника, в котором систематически изложены методы классической и современной теории управления и дано достаточно полное представление о проблематике и путях развития науки об управлении техническими объектами. Содержание каждого из томов учебника серии базового уровня иллюстрируется рис. В.2. После освоения базового уровня можно приступить к специализации в той или другой области теории автоматического управления, изучая соответствующие тома 2-й серии, а также статьи и монографии по специальным проблемам теории управления.
Цикл: Методы теории автоматического управления 1-я серия учебников "Методы классической и современной теории автоматического управления" - серия базового уровня Том 1: Анализ и статистическая динамика систем автоматического управления. М: Изд-во МГТУ, 2000. - 748 с. ♦ Том 2: Синтез регуляторов и теория оптимизации систем автоматического управления. М: Изд-во МГТУ, 2000. - 736 с. Том 3: Методы современной теории автоматического управления. М.: Изд-во МГТУ, 2000. - 748 с. ♦ 2-я серия учебников - серия повышенного базового уровня Том 1: Методы синтеза оптимальных систем автоматического управления. М.: Изд-во МГТУ, 2000. - 512 с. ♦ Том 2: Оптимизация многообъектных многокритериальных систем. М.: Изд-во МГТУ, 2001. ♦ Том 3: Адаптивные, робастные и интеллектуальные системы автоматического управления. М.: Изд-во МГТУ, 2001. 3-я серия - серия учебных пособий, в которых отражены конкретные направления ТАУ (специализация) К.А. Пупков, Н.Д. Егупов, А.И. Трофимов. Статистические методы анализа, синтеза и идентификации нелинейных систем автоматического управления. М.: Изд-во МГТУ, 1998. - 562 с. * К.А. Пупков, Н.Д. Егупов, В.Г. Коньков. Методы анализа, синтеза и оптимизации нестационарных систем автоматического управления. М.: Изд-во МГТУ, 1999.- 684 с. Рис. В.1. Структура цикла учебников и учебных пособий «Методы теории автоматического управления»
Предисловие 1 том: Анализ и статистическая динамика систем автоматического управления В этом томе изучаются* Математическое описание классов систем, отраженных на приводимой ниже структурной схеме 1 САУ, 2 Линейные САУ, 3 Нелинейные САУ, 4 Непрерывные САУ, S Дискретные САУ, 6 Непрерывно-дискретные САУ, 7 Стационарные САУ, 8 Нестационарные САУ, 9 САУ с сосредоточенными параметрами, 10 САУ с распределенными параметрами Анализ и статистическая динамика САУ Детерминированный анализ систем 1 Устойчивость, 2 Качество в переходном режиме, 3 Качество в установившемся режиме и др Статистический анализ линейных и нелинейных систем Линейная фильтрация (фильтры Винера - Колмогорова, фильтры Калмана - Бьюси), нелинейная фильтрация Идентификация объектов управления в классе линейных и нелинейных систем 2 том: Синтез регуляторов и теория оптимизации систем автоматического управления ^ -— Методы и задачи. *———^_^ Синтез систем по заданным показателям качества Методы синтеза регуляторов 1 Группа методов, основанная на принципе динамической компенсации, 2 Группа методов, использующая аппарат математического программирования, 3 Частотный метод, 4 Модальное управление, 5 Методы синтеза грубых систем управления 6 Метод моментов и др Синтез оптимальных систем Методы оптимизации 1 Вариационное исчисление, 2 Принцип максимума, включая управление при ограничениях на фазовые координаты, 3 Динамическое программирование, 4 Аналитическое конструирование регуляторов, S Нелинейное программирование, 6 Метод моментов, 7 Синтез оптимальных обратных связей и др 3 том: Методы современной теории автоматического управления: 1 Синтез систем методами дифференциальной геометрии, 2 Теория катастроф Детерминированный хаос Фракталы, 3 Я" -теория оптимального управления, 4 Адаптивные системы, 5 Оптимизация многообъектных, многокритериальных систем, 6 Интеллектуальные системы и др 7 Нейросетевые методы для решения задач проектирования вычислительных систем Рис. В.2. Структурная схема, иллюстрирующая содержание трехтомника «Методы классической и современной теории автоматического управления» (базовый уровень)
JO Предисловие Если специализация предусматривает расширенное изучение статистической динамики нелинейных систем автоматического управления, то можно воспользоваться учебным пособием К.А. Пупкова, Н.Д. Егупова, А.И. Трофимова «Статистические методы анализа, синтеза и идентификации нелинейных систем автоматического управления». - М: Издательство МГТУ им. Н.Э. Баумана, 1998. - 562 с. (под редакцией д-ра техн. наук, проф. Н.Д. Егупова), в котором систематически изложено содержание основных положений статистической теории нелинейных систем, методов их анализа, синтеза, оптимизации и идентификации. При специализации в области систем автоматического управления с переменными параметрами полезным может оказаться учебное пособие К.А. Пупкова, Н.Д. Егупова, В.Г. Конькова, Л.Т. Милова, А.И. Трофимова «Методы анализа, синтеза и оптимизации нестационарных систем автоматического управления». - М.: Издательство МГТУ им. Н.Э. Баумана, 1999. - 684 с. (под редакцией д-ра техн. наук, проф. Н.Д. Егупова). Этот труд представляет собой первое учебное пособие в отечественной литературе, специально посвященное рассмотрению методов математического описания, детерминированного и статистического исследования, синтеза и оптимизации нестационарных систем. Работа включает две части: в первой части изложена теория линейных систем с переменными параметрами; вторая часть посвящена разработке алгоритмов исследования, синтеза и оптимизации сложных нестационарных систем, поведение которых описывается скалярными и векторно-матричными дифференциальными уравнениями высокого порядка. Алгоритмы предназначены для решения задач, имеющих место в повседневной инженерной практике при расчете и проектировании систем управления одноконтурными и многоконтурными сложными объектами с переменными параметрами. Авторы выражают глубокую благодарность рецензентам - академику РАН Е.П. Попову и коллективу кафедры «Автоматические системы» Московского государственного института радиотехники, электроники и автоматики (МИРЭА), руководимой членом-корреспондентом РАН Е.Д. Теряевым, за ценные замечания, способствовавшие улучшению содержания книги. Авторы благодарят заслуженного деятеля науки и техники РФ, д-ра техн. наук, проф. А.С. Шаталова, заслуженного деятеля науки и техники РФ, д-ра техн. наук, проф. Б.И. Шахтарина (МГТУ им. Н.Э. Баумана), которые своими советами позволили значительно улучшить структуру учебника, углубить изложение отдельных теоретических положений, улучшить окончательный вариант рукописи. Авторы благодарят концерн «Росэнергоатом», научно-исследовательский центр космической системотехники, департамент образования и науки Правительства Калужской области, а также Издательский Дом «Манускрипт» за помощь в издании учебника. Большой объем книги и широта охваченного материала вызвали большие трудности при ее написании. Конечно, эти трудности не всегда удавалось преодолеть наилучшим образом. Читатели, вероятно, смогут высказать много замечаний и дать свои предложения по улучшению книги. Авторы заранее признательны всем читателям, которые не сочтут за труд указать на замеченные неточности, ошибки, на пути совершенствования структуры учебника и его содержания. К.А. Пупков Н.Д. Егупов
Предисловие 11 ПРЕДИСЛОВИЕ К 3-МУ ТОМУ Настоящая книга представляет собой 3-й том учебника «Методы классической и современной теории автоматического управления». Авторы ставили своей целью в 3-х томах изложить как единое целое положения классической и современной теории автоматического управления. Если в первом томе изучаются математические модели широкого класса систем и их динамические характеристики, методы детерминированного и статистического анализа, то второй том целиком посвящен изложению задач синтеза СА У при соблюдении противоречивых требований к устойчивости и качеству и теории оптимизации. В третьем томе отражены основные положения важных направлений теории автоматического управления, развиваемых в последние десятилетия. Назначение IV части третьего тома состоит не в том, чтобы студенты получили полное представление об изучаемой проблеме, а в том, чтобы познакомить их лишь с некоторыми актуальными направлениями и указать пути глубокого изучения их содержания. При этом изложенный во втором и в третьем томах круг вопросов, которые сами по себе имеют важное значение, может служить основой для последующего изучения монографий и статей, связанных с рассмотрением таких проблем, как применение в теории управления геометрических методов, теории катастроф и теории хаоса, Н"3-теории оптимизации, методов оптимизации многокритериальных систем, класса интеллектуальных систем и нейрокомпьютеров и др. В IV части введено понятие бифуркаций, рассматриваются соответствующие определения, для класса операторов определены точки бифуркации, т.е. точки, в которых в уравнении с соответствующим оператором происходит рождение нового, нетривиального решения этого уравнения. Показано также, что хаотическое поведение динамических систем определяется высокой чувствительностью к начальным условиям и невозможностью предсказания поведения на большом интервале времени. Рассмотрены некоторые положения Я00-теории оптимизации. Проектировщик часто не располагает полной информацией о моделях объектов, т.е. последние содержат неопределенности и, таким образом, имеют место информационные ограничения, например, при проектировании новых технологических процессов, объектов новой техники и др. Однако и в этих случаях задача обеспечения требуемых характеристик замкнутой системы должна получить необходимое решение. Сформулированную проблему называют проблемой робастного управления. При проектировании систем автоматического управления часто используют свойство адаптации, когда недостаточная' степень априорной информации восполняется обработкой по соответствующим алгоритмам текущей информации. Системы, обладающие свойством адаптации (что позволяет сократить сроки их проектирования, наладки и испытаний), называют адаптивными. С учетом сказанного можно поставить вопрос о решении проблемы оптимизации в условиях неполной априорной информации (адаптивное оптимальное управление). Подходы к решению указанных задач изложены в учебнике. Пятая часть учебника «Задания для самостоятельной работы и методические пояснения» играет важную роль и содержит 14 тем; она ориентирована на систематизацию, закрепление и расширение теоретических знаний и практических навыков при решении конкретные технических задач. Подчеркивается положение, что абстракт-
\2 Предисловие нов изучение теории автоматического управления без учета физических процессов, протекающих в проектируемой системе, недопустимо и может привести к полной беспомощности в постановке и решении практических задач [108, том 1]. При проведении расчетных работ с помощью ЭВМ студенты обязаны с необходимой глубиной освоить численные методы и иметь представление о реально используемых в вычислительной практике алгоритмах и таких понятиях, как корректность, устойчивость и обусловленность вычислительных задач; об особенностях поведения вычислительной погрешности и др. Другими словами, V часть является органической составляющей учебника и соответствующие темы должны быть освоены с необходимой глубиной: студент должен показать умение использовать теоретические знания, накопленные в результате изучения I - IV частей для решения конкретных задач и освоить в короткий срок соответствующие численные методы, алгоритмическое и программное обеспечение. Некоторые материалы, изложенные во всех томах учебника, могут быть использованы для самостоятельной работы, в частности, для написания рефератов, отражающих с необходимой полнотой содержание актуальных проблем с привлечением других источников. Соавторами отдельных разделов третьего тома являются: канд. техн. наук, доц. И.Г. Владимиров (глава 3 части IV), канд. техн. наук, доц. В.Н. Тимин (глава 3 части IV), инженер К.Ю. Савинченко (глава 4 части IV), канд. техн. наук, доц. Д.А. Аки- менко (часть V), инженер Э.Р. Ахундова (часть V), канд. техн. наук М.О. Габибулаев (часть V), канд. техн. наук, доц. А.К Карышев (часть V), канд. техн. наук, доц. A.M. Макаренков (часть V), инженер Д.В. Мельников (часть V), канд. техн. наук, доц. Я.В. Слекеничс (часть V); главы 3 и 5 части II второго тома и главы 1, 2 части IV третьего тома написаны кандидатом техн. наук, доцентом В.И. Краснощеченко. Авторы выражают признательность сотрудникам редакционно-издательского отдела Калужского филиала МГТУ им. Н.Э. Баумана К.И. Желнову, С.Н. Капранову, К.Ю. Савинченко, МЛ. Трубачеву за подготовку рукописи к изданию и создание оригинал-макета учебника.
ЧАСТЬ IV МЕТОДЫ СОВРЕМЕННОЙ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
14 Методы современной ТАУ. Часть IV ВВЕДЕНИЕ В IV части учебника отражены основные положения некоторых направлений, интенсивно развиваемых в настоящее время. Одно из них формулируется так: расчет и проектирование САУ с использованием методов дифференциальной геометрии. В учебнике изложены основные теоретические положения, в частности, теория алгебры и групп Ли для гладких векторных полей. Рассмотрены подходы к решению актуальных задач теории оптимальных систем, таких как управляемость и наблюдаемость нелинейных объектов. Значительное внимание уделено вопросам синтеза систем стабилизации со скалярным и векторным управлением. В современной теории управления широко применяются такие понятия, как бифуркации, катастрофы, фракталы, теория хаоса. Изучены особенности гладких отображений, приведены основные типы элементарных катастроф. Изучение основных положений теории катастроф направлено на их применение в теории систем управления, в частности, для рассмотрения свойств объектов, связанных с их управляемостью. В этой же главе введено понятие детерминированного хаоса; показано, что он возникает только в нелинейных системах; изучены парадигмы хаоса, приведены классические примеры, характеризующие хаос. Аттракторами хаотических систем являются фрактальные множества с дробной размерностью Хаусдорфа. В третьей главе отражены положения метода Я00 -теории автоматического управления и алгоритм построения робастных регуляторов. Некоторые положения одного из наиболее перспективных направлений теории робастного управления, основанного на методах Я00-оптимизации, изложены в 3-ей главе части. В IV части достаточно подробно рассмотрены методы оптимизации многокритериальных систем, составляющие содержание игровых подходов в управлении. Значительное внимание в IV части уделено рассмотрению теории нового класса систем - интеллектуальным системам. Подробно изложены модели и алгоритмы интеллектуальных систем, параллельные алгоритмы обработки информации, инструментальные средства и пути реализации интеллектуальных систем (глава 6). На решение сложных задач автоматического управления огромное влияние оказало появление вычислительное систем. Наиболее перспективным классом вычислительных систем являются распределенные вычислительные системы (РВС), состоящие, в общем случае, из большого числа удаленных вычислителей, образующих сетевую структуру. Распределенные вычисления позволяют полностью задействовать все ресурсы сети. Вычислительные системы на основе модели распределенных вычислений обладают такими свойствами, как масштабируемость, совместимость, мобильность, т.е. являются открытыми системами. В главе 7 рассмотрены процедуры проектирования РВС с использованием нейронной сети и ряд других вопросов, связанных с применением нейрокомпьютеров в системах управления.
Список используемых аббревиатур и обозначения 15 СПИСОК ИСПОЛЬЗУЕМЫХ АББРЕВИАТУР АдСУ - адаптивная система управления АСГ -алгоритм скоростного градиента АСУ ТП - автоматизированная система управления технологическими процессами БД - база данных БЗ - база знаний ВИ - внезапные изменения ВС - вычислительная система ДАЗУ - динамическое автоматическое запоминающее устройство ДЭС - динамическая экспертная система ИС - интеллектуальная система ИСУ - интеллектуальная система управления МВГ - метод ветвей и границ МВС - многопроцессорная вычислительная сеть ОНО - обобщенный настраиваемый объект ООУ - обобщенный объект управления ОУ - объект управления ПП - переменные переключения ППП - процессор параллельного представления СНС - самонастраивающаяся система СПС - система с переменной структурой СТР - среда транспьютерной реализации ЦУ - цель управления
п 16 Методы современной ТАУ. Часть IV СПИСОК ИСПОЛЬЗУЕМЫХ ОБОЗНАЧЕНИЙ ~, R - отношение эквивалентности = -отношение изоморфизма X,Y -векторные поля в естественном базисе как дифференциальные операторы для гладких функций, определенных на многообразии Мп X(x),Y(x) -координатные представления векторных полей в точке хеМ х -точка многообразия Мп , вектор состояния Мп -гладкое многообразие размерности п U(x) -окрестность точки jc e Мп Gr -r-параметрическая группа G - непрерывная группа преобразований, изоморфная своей г-параметрической группе Gr (группа Ли) ф(я,6) -групповая операция в группе Gr L(G) - алгебра Ли группы Ли G а,Ь,с - элементы г-параметрической группы Gr TaiTb - элементы группы преобразования G (действия группы Gr на многообразии Мп) Xt,Yt -однопараметрическая группа преобразований, фазовый поток для векторных полей X(x)9Y(x) [X,Y](x) -коммутатор, скобка Ли векторных полей X(x),Y(x) I(D) - наименьшая алгебра Ли, содержащая множество управляемых векторных полей D Lx -производная Ли вдоль векторного поля AT(jc) J (Т) - наименьшее линейное подпространство дифференциальных 1-форм, замкнутое относительно операции дифференцирования Ли функций множества функций / векторными полями алгебры /0(£>) у - вектор выхода размерности / х 1 и - вектор управления размерности т х 1 ClczRm - множество управлений (xl9...,xw) - координаты точки хеМп в Rn в исходном базисе (Уи—уУп) - координаты точки хеМп в Rn в новом базисе х' -точка многообразия Мп (х'еМп ), полученная преобразованием точки хеМп х - производная по / по функции x(t)
Глава 1. Синтез САУ методами дифференциальной геометрии 17 ГЛАВА 1. СИНТЕЗ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ МЕТОДАМИ ДИФФЕРЕНЦИАЛЬНОЙ ГЕОМЕТРИИ В 1872 г. Феликс Клейн в своей знаменитой Эрлангенской программе сформулировал идею классификации всех видов геометрий на основе симметрии, согласно которой каждая геометрия характеризуется преобразованиями, которые допускается в ней производить над геометрическими объектами, а также свойствами этих объектов, которые не изменяются, остаются инвариантными при этих преобразованиях. Каждая геометрия определяется группой преобразований (группой симметрии), оставляющих те или иные свойства геометрических фигур инвариантными. Так были классифицированы евклидова, аффинная, проективная геометрия и «резиновая геометрия» - топология. Эта идея применения группового подхода давно, широко и с успехом используется в прикладных науках: квантовой механике, кристаллографии, небесной механике и др. Два десятилетия назад геометрический язык проник и в теорию управления, где симметрия реализуется в виде непрерывных групп преобразований (групп Ли). О значении этого подхода говорит тот факт, что ведутся работы по созданию «Единой геометрической теории управления» (ЕГТУ) [38]. Автор ЕГТУ А.Г. Бут- ковский пишет [39]: «Каждое поколение говорит на своём языке: 30 - 40 лет назад в теории управления начался переход на язык функционального анализа, в механике ещё раньше происходил небезболезненный переход на векторный и тензорный языки. Сейчас, по-видимому, настало время переходить на язык современной геометрии. Причём это веление не только внутренних императивов науки. Можно указать, в частности, весьма актуальные научно-технические проблемы, для решения которых нужны более мощные, по сравнению с существующими, теоретические и технические средства. Такие средства нужны, например, для создания распределённых регуляторов для активных, нелинейных, неоднородных и неизотропных сплошных сред». Геометрический подход позволяет с гораздо более широких позиций взглянуть на фундаментальные проблемы теории управления: управляемость, наблюдаемость, инвариантность, декомпозицию и агрегирование. Особенно он полезен для исследования нелинейных систем управления, трудности анализа и синтеза которых общеизвестны. В данном разделе будут изложены основные математические понятия, теоремы и некоторые методы, используемые при геометрическом подходе к задачам синтеза систем управления. Рассмотрены геометрические аспекты управляемости, наблюдаемости, синтеза регуляторов для нелинейных систем управления, приведены многочисленные примеры. К сожалению, охватить все проблемы теории управления достаточно сложно. Более подробную информацию о применении дифференциально- геометрических методов в теории управления можно найти в прекрасном обзоре Ю.Н. Андреева [2]. 1.1. ГЛАДКИЕ МНОГООБРАЗИЯ И ИХ РОЛЬ В ИССЛЕДОВАНИИ НЕЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ Развитие теории для достаточно общих классов нелинейных систем требует применения класса пространств состояний более общих, чем линейные пространства. Об этом свидетельствуют следующие примеры [2]: О о~„ л л с
JUj Методы современной ТАУ. Часть IV 1) Множества достижимости билинейных систем (простейших нелинейных систем) подпространствами не являются. 2) При изучении задач управления ориентацией твёрдого тела в качестве пространства состояний фигурирует векторное расслоение (объединение касательных пространств) группы SO(3) (группа кососимметричных ортогональных матриц третьего порядка). Это расслоение не обладает структурой векторного пространства (сумма двух положительных поворотов может дать нулевой поворот). 3) Часто требуется рассматривать движение системы в открытой области Rn, которая не обладает структурой векторного пространства. 4) В задачах аналитического конструирования регуляторов целесообразно рассматривать движение системы не из определённого фиксированного состояния, а сразу из всех возможных состояний, принадлежащих некоторой области, т.е. изучать не отдельные траектории, а переходные отображения системы, заданные фиксированным управлением. При таком обобщении задачи, существенном с позиции приложений, «-мерное дифференциальное уравнение заменяется матричным, а в качестве пространства состояний рассматривается группа по умножению невырожденных квадратных матриц п-го порядка. Такой приём, называемый иногда подъёмом динамики системы из фазового пространства в группу, оказывается весьма полезным в различных задачах. Необходимое для изучения перечисленных ситуаций обобщение достигается применением в качестве пространств состояний дифференцируемых гладких многообразий. 1. Дифференцируемые многообразия. Основная идея дифференциальной геометрии состоит в применении математического анализа к решению геометрических задач. Поэтому объектами изучения должны быть топологические пространства, в которых имеют смысл такие понятия, как дифференцирование и интегрирование. Кривые и поверхности в трехмерном пространстве являются именно такими объектами. Основными инструментами их изучения являются криволинейные координаты. Рассмотрим, как они вводятся на произвольном топологическом пространстве. Введение координат. Если в окрестности U(x) топологического пространства MaRN введены координаты (xu...,xN), то каждую точку окрестности U можно отождествить с некоторой точкой у = (у\,—,у„) арифметического (координатного) пространства Rn(n<N), используя непрерывное взаимнооднозначное (т.е. гомео- морфное) отображение (р. Определение 1.1 [10]. Если задан гомеоморфизм: q>: U(x)-> R", n<N, удовлетворяющий условиям: 1) феС,г>1 (Сг - пространство r-непрерывно дифференцируемых функций), как отображение из RN в Rn\ 2) rank — = п для любой точки у е R" , то пара (U (х) ,ф) называется картой \ду ) точких в Мкласса Сг, или Сг -картой в М Замечание 1.1. Из определения 1.1 следует что карта (£/(л:),ф) точки х является картой любой точки z eU(x). Таким образом, задание карты означает локальное задание множества М (задание окрестности U(x)) в виде:
Глава 1. Синтез САУ методами дифференциальной геометрии 19_ ': (1.1) где ф;, / = 1,2,..,« (n<N) - функции класса Сг, определяющие гомеоморфизм ф. Окрестность точки U(x) часто называют координатной окрестностью ввиду того, что гомеоморфизм (1.1) определяет на множестве U(x) криволинейные координаты уи...,уП9 не связанные, вообще говоря, со стандартными координатами объемлющего пространства RN . Для линейных систем характерно то, что карта (£/(*), ф) взаимнооднозначно отображает всё множество М. Для нелинейных систем это несправедливо. Поэтому карт требуется несколько. Введём ещё одно определение. Определение 1.2. Множество М <zRN называется «-мерным подмногообразием в RN класса Сг(г>1), или Сг -подмногообразием, если каждая его точка имеет некоторую Сг -карту. Будем обозначать это подмногообразие через Мп . Другими словами, множество М в ¥?* - «-мерное подмногообразие, если для каждой его точки можно построить координатную систему; каждая координатная система определена локально (и называется локальной системой координат). Но всё множество координатных систем «охватывает» всё многообразие. Множество координатных систем определяет многообразие Мп с помощью атласа. Определение 1.3. Атласом многообразия Мп называют такое множество карт {(£/а,фа)} класса Сг, открытые множества {Ua} которых образуют покрытие Мп . Атлас {(Ua, фа)} многообразия Мп задает множество координатных систем, «обслуживающих» всё многообразие. Чтобы задать многообразие, достаточно задать какой-нибудь атлас. 00 Ясно, что Мп = [JUa и так как каждая окрестность Ua является открытой, то в а=1 окрестности отдельных карт Ua и U$ (Ua n Up) отображения фа и фр должны быть согласованы, т.е. должен существовать гомеоморфизм перехода от одной системы координат к другой. Пусть (£/,ф) (ф: U->R"% (F,v|/) (у:I/ -> R") - две карты Мп и U п V* 0. Тогда каждой точке Jce£/nF отвечают две системы координат: {^(л:),...,^(д:)} и {А, (л:),..., Aw(jc)} - координаты точек ф(л:)еф(£/пР) и v|/ (jc)gv|/ (UnV), которые, вообще говоря, различны. Обе системы координат равнозначны в том смысле, что существует гомеоморфизм перехода \\1Ц>'] :ц>(иnV)->\\j(UnV)9 связывающий обе системы координат и позволяющий первые координаты непрерывно выразить через вторые: (1.2)
20 Методы современной ТАУ. Часть IV и, наоборот, вторые непрерывно выразить через первые: А, =К,(4,,-..,4„), (1.3) В формулах (1.2) и (1.3) через Хь"-,Хт Viv» Vw обозначены координатные функции отображения q>V~l=(Xi.-.Xii). Если все карты Ua, Fp согласованы таким образом в атласе, то атлас называют согласованным. Для любого атласа А обозначим через Атах множество всех карт, согласованных с каждой картой атласа, и назовем Атах - максимальным атласом атласа А или гладкой структурой на М". Определение 1.4. Хаусдорфово пространство Мсо счетной базой и с заданной на нем гладкой структурой называется гладким (дифференциальным) многообразием. При этом число п (размерность образа карт) называется размерностью многообразия. Другими словами, дифференцируемое многообразие в окрестности каждой своей точки устроено как R", т.е. существует диффеоморфное (гладкий изоморфизм) отображение окрестностей каждой точки в Rn, причем дифференцируемые окрестности близких точек согласованы таким образом, что при помощи гладких замен переменных можно перейти с одной окрестности в другую. Графически это выглядит следующим образом. <V(Ur\V) #nF) Рис. 1.1. Гладкое многообразие и две его карты Пример 1.1. В качестве примера гладкого многообразия рассмотрим проективную плоскость RP2 и найдем максимальный атлас этого многообразия. Точками RP2 являются всевозможные прямые, проходящие через начало координат в R2. Каждая такая прямая однозначно определяется своим направляющим вектором а, а *■ 0. При этом векторы а и Ха, X * 0, являются направляющими для одной и той же прямой. Обозначим через (х\: х2: х») прямую с направляющим вектором а = (хх; х2, *3)т Будем считать, что (х\: х2: *з) = (у\ • Уг: Уз) в том и только том случае, когда ~_« Л „а„,тдВпА иырпп* что v, = Хлл. v->=Xx->. vi= A*3.
Глава 1. Синтез САУ методами дифференциальной геометрии zj_ Введём следующие координаты на RP2 Рассмотрим множество прямых U, (/ = 1,2, 3), у которых /-я координата направляющего вектора не равна нулю. Заметим, что если у одного направляющего вектора а какой-то прямой /-я координата не равна нулю, то это верно и для любого другого направляющего вектора этой прямой, т.к. этот (второй) вектор имеет вид Ха, \±0. Поэтому множества U\, U2> Иъ определены однозначно. А т.к. направляющий вектор прямой не равен нулевому вектору, то, по крайней мере, одна его координата не равна нулю, и, значит, r?,.\ Ut= RP2 Пусть (х\ : х2 : х3) 6 U\. Поставим в соответствие этой прямой точку R2 с координатами ух = x2lx^ у2 =хъ1хх. Числа у\ и у2 назовём координатами прямой (хь х2 x$) как точки RP2 в системе координат, связанной с U\. Таким образом, получено отображение фь (х\: х2 дгз) -> (у\ Уг) Отображение ф| должно иметь обратное, т.к. ф| - диффеоморфизм, имеем фГ1 {у\ у2)=-> (1 У\ )'i), что проверяется непосредственной подстановкой У\=х2/хь у2=х3/х{ и учетом х\ ф О Аналогично определяются диффеоморфизмы Ф2 : U2 -> R2 * (*i: х2. хъ) -> {хх1хг: x3fx1), y3:U3^>R2: (х]: х2 • хъ) -> (х{ 1хъ: хг1х£. Таким образом, на RP2 вводятся три локальные системы координат (три карты) и атлас на RP2 можно задать из 3-х карт (U,, ф,), / =1,2,3 ^i={*-*i*0}> 9iW = (^2/^i^3/^i). и2 = {х:хг*0}9 4>2{x) = (xl/x2ix3/x2)i U3 = {x:x3±0}, щ(х) = (х]/х3,х2/хъ). Найдём отображение перехода из одной системы координат в другую, в такую, где определены обе системы координат. Пусть /= (х{: х2: *з) е U\n U2. В системе координат (£Д, ф,) точка / имеет координаты У\-х21хх> У2=хъ1хь а в системе {и2^2)~У\ =х\1хг> У2~хз^х2- Легко видеть, что У\=\/у\, У2 - У2 I У\ • Эту же связь можно получить, записав в координатах отображениеугуСх. Действительно, {УиУг)-^-^^ У\'У2)-^-*{иУьУг1У\) Так как прямая / = (*,: х2: хъ) - (1: ух у2) лежит в(/|П U2i тоу\ * 0 и отображение ф2 ° фГ1 задается бесконечно дифференцируемыми функциями Аналогичное утверждение верно и для отражений Ф1°Ф21> Фз°Ф21» Фг^з1» Ф^Фз1. Фз°ФТ1- Многообразия - это наиболее общая формулировка пространства состояний (фазового пространства) для динамической системы. Для исследования поведения динамической системы важно знать, как взаимосвязаны точки этого многообразия. И здесь на первый план выходит нахождение группы преобразований, которая действует на заданном многообразии. К изучению свойств таких групп мы и приступаем. 1.2. ГРУППЫ И АЛГЕБРЫ ЛИ 1.2.1. Определение группы Множества и функции на них - вот два типа объектов, к изучению которых сводится, в конечном счете, любая математическая теория [48]. Если аргументы функции/пробегают множество М и она принимает при этом значения из того же самого множества, то / называется алгебраической операцией на множестве М. Наука, изучающая алгебраические операции, называется алгеброй. При этом алгебру интересует только вопрос, как действует та или иная алгебраическая операция, и вовсе не интересует вопрос, на чем она действует. Отвлечься от второго вопроса и сосредоточиться на первом позволяет понятие изоморфизма. Пусть заданы два множества с отмеченными на них алгебраическими операциями, и можно установить взаимно однозначное соответствие между самими множествами и между множествами операций на них, причем соответственные операции будут функциями одинакового числа аргументов и при соответствующих значениях аргументов будут принимать соответ-
22 Методы современной ТАУ. Часть IV ственные значения. Тогда эти множества с операциями называются изоморфными. Изоморфные объекты одинаково устроены в смысле операций, поэтому в алгебре их не различают. Каждый класс изоморфных объектов выделяет в чистом виде некоторый тип алгебраических операций. Это сводит задачу алгебры - изучение алгебраических операций - к более осязаемой задаче изучения множеств с операциями с точностью до изоморфизма. Один из самых распространенных типов алгебраических операций - бинарная (двуместная) операция, подчиненная некоторым аксиомам, которая стала самостоятельным разделом современной алгебры, - а именно разделом теории групп. Сразу заметим, что термин «алгебра», используемый выше, - это термин, используемый для названия одного из разделов современной математики. Далее, при введении понятий «группа Ли» и «алгебра Ли» термин «алгебра» трактуется в более узком смысле и будет раскрыт позднее. Чтобы понять всю мощь применения теории групп для решения задач математики и прикладных наук, достаточно упомянуть следующий факт: в 1830 г. Эварист Галуа, (который ввел термин «группа»), используя групповой подход, достаточно просто показал неразрешимость в общем случае алгебраического уравнения в радикалах при п > 5. Широкое применение эта теория в форме непрерывных групп преобразований получила в физике, в частности, в квантовой механике, в небесной механике и, в последнее время, в теории управления [2, 6, 14]. Непрерывные группы (преобразований) иначе называются группами Ли -в честь норвежского математика Софуса Ли, стоявшего у истоков этой теории и получившего в своих трудах на основе группового подхода основные теоремы о разрешимости системы дифференциальных уравнений в квадратурах. Прежде чем изучать группы Ли, дадим определение абстрактному понятию «группа». Пусть G - множество элементов произвольной природы. Введем на этом множестве бинарную операцию. Бинарная операция (также используется термин «групповая операция») на множестве G - это соответствие, при котором каждой упорядоченной паре элементов данного множества отвечает однозначно определенный элемент этого же множества. Бинарную операцию будем обозначать точкой •. Определение 1.5. Множество G с бинарной операцией • называется группой, если выполнены следующие 3 аксиомы: 1) Ассоциативность (a>b)-c = a-(b-c),Va,b,ceG; (1.4) 2) Существование единицы. В множестве G существует единственный элемент ее G, такой, что а-е = е-а = a,VaeG', (1-5) 3) Наличие обратного элемента. Для любого а е G существует в G элемент х, такой, что а-х = х-а = е. (1-6) Обратный к а элемент будем обозначать а'1. Если V а, Ь е G имеет место равенство a-b = b-a, тогда группа называется коммутативной, или абелевой. Изоморфизм, т.е. взаимно однозначное гомоморфное отображение, абстрактно равных групп позволяет распространить полученные результаты для одной группы на группу, изоморфную ей, т.к. изоморфные группы имеют одну и ту же групповую структуру. Напомним, что гомоморфным отображением (гомоморфизмом) называ-
Глава 1. Синтез САУ методами дифференциальной геометрии 23_ ется отображение одной группы, алгебраической структуры в другую, сохраняющее операции. Последнее означает, что образ результата операции (в частности бинарной), производимой над элементами исходного множества, можно получить, выполнив над образами элементов операцию, определенную на содержащем их множестве. Другими словами, если, например, рассматриваются две группы Gx и G2 с соответствующими бинарными операциями ®! для Gx и ®2 - G2, а/- гомоморфизм/: Gx -> G2, то V а, Ь е Gx имеет место равенство f{a®xb) = f(a)®2f{b), где f(a),f{b)eG2. Рассмотрим пример, где структуру одной плохо формализованной группы Н можно изучать по изоморфной ей хорошо формализованной группе G. Пример 1.2. Пусть элементами группы G служат корни уравнения jc4 — 1 = О, G = {\J-\-j}, где j = <fl . Групповая операция • - обычное умножение. Рассмотрим группу Я вращений квадрата в плоскости, где элементами служат повороты квадрата на соответствующие углы: д° .ф = 0 ; а . ф = 90; а2 • ф =180; а2: ф = 270°, те Я = {e,a = al,a2,a3} В группе G. единичный элемент е-\. Обратные элементы для 1->1; для j->-j ; для -1 -> -1, для -у->/ В группе Я единичный элемент е = а°. Обратные элементы, для а->а3, для а2-+а2, для аг -> а, для е -> е. Обозначим через/. Я -> G отображение группы Я на G а0 а а2 аъЛ 1 J -I -J) Легко проверить, что для любых элементов r,s e И f(rs) = f(r)of(s) Можно показать, что это отображение является изоморфным Например, г • ^ = а4 = а0 (поворот на 360°); /(г.5) = /К) = 1 = / = /(г)./(5) = ;.(-у). Таким образом, изучить структуру группы Я (группы вращения квадрата) можно с помощью более формализованной изоморфной ей группы G 1.2.2. Группы Ли Определение 1.6. Гладкое многообразие Gr размерности г называется группой Ли, если на Gr задана структура гладкого многообразия, т.е. групповые операции гладкие. Иначе говоря, группа Ли (или непрерывная группа преобразований) - это множество преобразований, которое наделено двумя структурами: 1) алгебраически - это группа; 2) топологически - это многообразие, причем обе структуры согласованы между собой. Что она преобразует, мы рассмотрим чуть ниже, а пока определим, в чем заключается согласованность двух этих структур. Пусть ao,bQeGr - некоторые элементы Gr. Существуют такие координатные окрестности Va^, Vbo, VCq точек а0, b0, со= а0- Ьо (• - групповая операция), соответственно с координатами (д1,...,аг),(61,...,6г),(с1,...,сг) - структура многообразия, - что Vao-VbodVCQ и координаты с,-=ф1(а1,...,аг;й,,...,6г) / = 1,г, точки c = a-beVCo являются гладкими функциями от координат точек aeVa),be VbQ, где КО|) • Vba = [а ■ Ыа е Vao,b e Vb<>} (см. рис. 1.2).
24 Методы современной ТАУ. Часть IV Рис. 1.2. Топологическая группа Gr и ее элементы Требование гладкости операции а-> а~х означает следующее. Пусть вблизи точки с0 = Oq1 есть карта Vc с координатами (сь..., сг). Тогда существует такая координатная окрестность VOq точки а0 с координатами (аи...,аг\ что Го~] с VCq и координаты с, =А|-(а1,...,аг), / = 1,г точек с = а"1еГС() - гладкие функции от координат точек ае FO(), где V~} = [a~l \aeV%) (рис. 1.3). Gr Рис. 1.3. К согласованности топологической и алгебраической структур группы С Иначе говоря, если а - групповой элемент вблизи а0, тогда а~] - групповой элемент вблизи uq {. Элементы a, be Gr называются параметрами и определяют группу Gr как r-параметрическую группу. Благодаря изоморфизму непрерывные группы Gr можно рассматривать как непрерывные группы преобразований (действий) на гладком многообразии Мп . Пусть Gr - группа Ли, Мп - гладкое многообразие размерности п. Скажем, что группа Ли Gr действует на многообразии Мп , если для любого элемента а е Gr, хеМ" задано гладкое отображение Та : Мп -> Мп . По другому: каждой паре (а, х), где aeGr, хеМ", соответствует точка ТахеМ", т.е. задано отображение h\Gr хМп -> М" .На отображение И накладываются следующие 3 ограничения (соответствующие аксиомам группы). 1) Отображение h: Gr xM" -> Мп - гладкое. Пусть (х\,...,х'п) - локальная система координат в окрестности Ua Мп точки Та^х0 e(J , где aoeGr, xQeM". Тогда найдутся такие координатные окрестности V, W точек aoeGr, хое М" соответственно, что VWcz{Tv W\v e V с: Gr, w e W аМ" }е U. Поэтому отображение Та : W -+ U можно записать в виде *' = У;(а1,...,аг;л:1,...,х/7), / = 1,л, (1.7)
Глава 1. Синтез САУ методами дифференциальной геометрии 25_ где яь..., аг- локальные координаты в окрестности V, а хь..., хп - локальные координаты в окрестности W, В (1.7) штрих « '» обозначает не производную, а служит для введения новой точки. Тогда требование гладкости отображения h заключается в том, что все функции xl = fl(al,...,ar;xb...,xn), i = \,n гладкие по а иjc. 2) Произведению двух элементов a, be С с групповой операцией (р(я, Ь) соответствует композиция соответствующих преобразований с групповой операцией •, т.е. Тф,ь)=Та.Ть. (1.8) 3) Единичному элементу eeGr отвечает тождественное преобразование id (от английского identity - тождество) многообразия Мп , т.е. Tex = id(x) = x. (1.9) В этом случае r-параметрическая группа Gr изоморфна непрерывной группе преобразований Gf (конечно, каждая группа имеет свою групповую операцию). Структурные свойства группы - это те, которые одновременно принадлежат всем изоморфным между собой группам, а также их алгебрам. Поэтому при изучении структуры группы преобразований G? можно ограничиться ее r-параметрической группой Gr. Исходя из этого, мы в дальнейшем G будем называть r-параметрической группой преобразований (действующей на гладком многообразии Мп) (G = Gr) и не делать между ними различий. Пример 1.3. Группа вращений плоскости. Действует в R2. Преобразование Та _ ( costf s\na\ V-sina cosoy параметр а е G1 (однопараметрическая группа преобразований). Действие в R2 (х'А-т Y-(cosa sina)(x^ х~\ II х'2) " y-sina соБаДд Композиция преобразований (cos a sinaVcos^ sinZ>^| (cos(a + b) sin(a-+-6)^ a b l^-sina cosaj^-sin6 cos^J [-sin(a + ^) cos(a + 6)J Отсюда делаем вывод, что групповая операция в G1 (p(a,b) = a + b соответствует обычному сложению, а групповая операция в O\'TaTh- обычному умножению матриц У данной группы есть специальное обозначение 50(2), что означает: специальная ортогональная, действующая в R2. Группа 50(2) интересна и тем, что здесь можно наглядно проанализировать две структуры (алгебраическую и топологическую). Покажем это: а) алгебраическая структура: cos a sin а} } :0<а<2п[; -sin a cos a) J б) топологическая структура. G1 можно отождествить с единичной окружностью (многообразие с 2-мя картами) Sl ={(cosa,sma):0<a<2n) в R2, что позволяет определить на S0(2) структуру многообразия.
26 Методы современной ТАУ. Часть IV Определение 1.7. Пусть задано действие группы Ли GrHa многообразии Мп. Орбитой точки хеМ" называется множество O(x) = {Tax\aeGr}cMn. Пример 1.4. Орбитой для любой точки х0 = (x]0,x2i))е ^2 группы SO(2) будет окружность радиуса г = ^xw + х20. Пример 1.5. Найдем орбиту действия группы линейных замен координат на множестве матриц линейных операторов. Пусть х - матрица линейного оператора размера nxn,aeG" - множество невырожденных квадратных матриц (пхп) Тогда О(х) = {тах оха"1, VaeG"2} является орбитой (матрицы) х и определяет множество матриц, подобных х . Определение 1.8. Функция co(jc), постоянная на орбитах, называется инвариантом группы преобразований, т.е. co(ro,jc) = co(jc) для всех aeGr,xeO(x)a M". 1.2.3. ИНФИНИТЕЗИМАЛЬНЫЙ ОПЕРАТОР НЕПРЕРЫВНОЙ ГРУППЫ ПРЕОБРАЗОВАНИЙ Рассмотрим преобразования (1.7), которые определяют действие г-параметриче- ской группы Gr на многообразии Мп. Пусть г = 1, тогда *;=/;(я;л:), / = 1Я (1.10) причем /(0;л:)=л:. Пусть z(xj,...,jt^) = z(jc') - произвольная функция от х'. Проведем линеаризацию группы (1.10) в окрестности ее единицы, т.е. разложим функцию z(x') по степеням а в окрестности точки а = 0. Имеем , ,, , . dz(x')\ a2 d2z(x') 2(x) = z(x) + a-^rl\ + — ■—^ da I _n 2 da2 \a=0 (1.11) a=0 Обозначим V да Ja=0 и запишем оператор Учитывая правило дифференцирования сложной функции, можем в первом приближении записать равенство (1.11) как z(x') = z(x) + aXz. (1.14) Равенство (1.14) называется инфинитезимальным преобразованием группы, а (1.13) - ее инфинитезимальным оператором.
Глава 1. Синтез САУ методами дифференциальной геометрии 2Л_ 1.2.4. Алгебры Ли Изучение структуры и свойств группы Ли G - достаточно сложная проблема, подчас неподдающаяся решению. Поэтому неоценимо открытие, сделанное С. Ли, который уже в первых работах установил, что многие свойства, связанные с группами преобразований, такие как инварианты, вопросы структуры, изоморфизм и др., выражаются в терминах алгебры Ли, порожденной данной группой. Алгебра Ли L является линеаризацией группы Ли G в окрестности ее единичного элемента. Поэтому вопросы, связанные с действиями группы Gr, на многообразии (фазовом пространстве) Мп в теории управления определяет управляемость, наблюдаемость, инвариантность, возможность декомпозиции. В силу локального изоморфизма между группой и алгеброй Ли эти групповые свойства можно исследовать по линеаризованной модели группы - ее алгебре Ли. Теория алгебр Ли играет при этом примерно ту же роль, какая отводится в теории линейных систем линейной алгебре. Дадим определение алгебры Ли. Определение 1.9. Алгеброй Ли L называется векторное пространство над вещественным полем R, для любой пары элементов которых а, Ь определена билинейная операция (умножение), удовлетворяющая определенным условиям, а-Ъ = с так, что полученный вектор с принадлежит этому же пространству. Иначе говоря, алгебра Ли - это векторное пространство, занкнутое относительно операции умножения. Это умножение называется коммутатором элементов a, b и обозначается с = [а,Ь]. (1.15) В теории управления коммутатор часто называют скобкой Ли [30, 31, 34, 36], в механике его называют скобкой Пуассона [17, 23]. Мы далее будем называть это умножение коммутатором (это наиболее общее название) либо скобками Ли - когда элементами алгебры Ли будут векторные поля. Введенный коммутатор (операция умножения) должен отвечать следующим условиям: 1) билинейности [сш + №9с] = [а{а,с)] + $[Ь,с], ^ ^ [а>о6 + Рс] = а[а,6] + Р[а,с]; 2) кососимметричности М=-М; (1.17) 3) для него справедливо тождество Якоби [[а,б],с] + [[6>с]>а] + [[с>а]>б] = 0 (1.18) для любых а,Ь,сеЬи a,$eR. • Из выражений (1.17) и (1.18) видно, что алгебра Ли является антикоммуникативной (формула (1.17)) и неассоциативной, где условие ассоциативности заменено тождеством Якоби (1.18). Из свойства 2) также следует, что [а,а] = 0. (1.19) Примеры алгебр Ли 1) Пространство R3 с обычным векторным умножением axb, a,beR3 является алгеброй Ли. Тождество Якоби следует из равенства а х (b х с) = b(a, с) - с(а, Ь), справедливого для произвольных трех векторов a,b,ce R
28 Методы современной ТАУ. Часть IV 2) Множество полиномов от вещественной переменной с коммутатором [p(x)M*)>P{*)fyQ-4{x)fyiy 3) В теории гладких многообразий алгебры Ли (над полем R) возникают как алгебры векторных полей. Векторные поля на гладких многообразиях (обобщение понятия поверхности) выступают как элементы касательных пространств к данному многообразию. Линейное пространство всех касательных векторов к многообразию Мп в точке х называют касательным пространством к многообразию Мп в точке jc и обозначают ТМпх (1.4). Рис. 1.4. Касательное пространство к многообразию Рассмотрим дизъюнктивное объединение всех касательных пространств к многообразию М", которое называется касательным расслоением. Свое название расслоение берет из свойств касательных пространств к многообразию: касательные пространства ТМпх Г\ТМп2 =0 не пересекаются, если х1 фх2, т.е. это объединение выглядит как слоеный вертикально стоящий пирог (см. рис. 1.5). ТМ\ ТМп2 / v - -гМ \ М" хх х2 Рис. 1.5. Касательное расслоение Можно показать [15], что на множестве ТМп можно также ввести структуру гладкого многообразия. Определение 1.10. Векторным полем на многообразии Мп называется отображение Х:М" ->.ТМ", такое, что Х(х)е ТМ" для каждого х е Мп.
Глава 1. Синтез САУ методами дифференциальной геометрии 29^ Векторное поле иногда называют сечением касательного расслоения ТМп. На рис. 1.5 это отображено сплошной волнистой линией на касательном расслоении ТМ" (подробнее см. [10, 17, 42]). Каждое векторное поле AT(jc) является инфинитезимальной образующей для од- нопараметрической (параметр /) группы непрерывных преобразований (диффеоморфизмов, т.е. гладких изоморфизмов) G = {Xt} на многообразии Мп. Выше было рассмотрено, как по действию группы получить ее инфинитезимальную образующую (инфинитезимальной оператор) X , и ниже будет показано, как по инфинитезималь- ному оператору восстановить группу. Векторное поле Х(х) для каждой гладкой функции z(x), определенной на многообразии Мп, является линейным дифференциальном оператором X (оператором дифференцирования вдоль векторного поля Х{х)). Будем придерживаться следующих обозначений: • Ar(jc) = (^1 (jc),...,£w(a:)) - это координатное представление поля в конкретной точке х. • X = ^^i(x)— - векторное поле как дифференциальный оператор для гладких функций, определенных на М". Векторные поля AT(jc), заданные на произвольном гладком многообразии М", образуют алгебру Ли L с коммутатором (скобками Ли) - дифференциальным оператором первого порядка, имеющим координаты [*,Г]Д*) = Лть(*)-И-,(дс), / = 1Я (1.20) где [X,F].(jc) - /-я координата векторного поля [Л',У].(л:) в точке jc. В координатной форме векторное поле (1.20) можно записать в виде [X,F]W = [|]xW-[|]fW, (1.21) fdQ] , ч где т— - матрица Якоби вектор-функции Q(x). 1.3. ГРУППОВОЙ АНАЛИЗ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ. ОДНОПАРАМЕТРИЧЕСКИЕ ГРУППЫ ПРЕОБРАЗОВАНИЙ Для исследования системы обыкновенных дифференциальных уравнений, где в качестве параметра используется время, важно рассмотреть так называемые однопараметри- ческие группы (локальных диффеоморфизмов - взаимно однозначных и непрерывно дифференцируемых отображений), часто называемые фазовыми потоками [17,18]. Пусть на «-мерном арифметическом координатном пространстве Rn задана группа G однопараметрических преобразований (параметр /?), связывающая две точки фазового пространства следующим соотношением (см. формулу (1.10)) х',=Ъ(х,р), (1.22)
jK) Методы современной ТАУ. Часть IV где Ft{x,p) - аналитическая функция по переменным (х,р) в некотором открытом множестве изменения переменной х и в некоторой окрестности параметра р0, соответствующего тождественному преобразованию (pQ — единичный элемент группы G, т.е. х = F(x, p0)). Для удобства сделаем следующее преобразование. Заменим Р = Ро+а, (1.23) где а - также скалярный параметр. Замена (1.23) позволяет свести преобразование (1.22) к следующему х;=^Д*,/?0 + я) = /,(л:,а), / = 1,л, (1.24) где тождественному преобразованию х\ = /; (х,а) соответствует ненулевое значение параметра а, т.е. единичный элемент а0 - 0. Инфинитезимальный оператор для преобразования (1.24) группы G имеет вид (см. пункт 1.2.3) *=!>ц£-> (125) /=1 где $/ = _Щх,а) да 'дх, >У({Х,а)\ _. _ да , / = 1,«. (1.26) 'о Так как группа G преобразований (1.24) является непрерывной, естественно рассмотреть постепенное преобразование точек пространства, по мере того, как мы изменяем непрерывным образом параметр а ота0=0. Итак, имеем *' = /(*,*). (1.27) Рассмотрим вариацию параметра а\а-* a + da. Соседнее значение параметра а л-da будет переводить х в jc' + atc', т.к. / - аналитическая функция параметра а. Но мы можем также найти значение параметра 5а очень близкое к 0 (т.е. преобразование очень близкое к тождественному), которое переводит точку х' в х' + dx'. Значит, мы имеем 2 пути перехода из точки х в х' + dx': а) x' + dx' = f(x,a + da), (1.28) б) *' = /(*,*); x' + dx' = f{x',8a). ' (1.29) Геометрически это выглядит следующим образом (рис. 1.6). f(x';5a) " > X f(x;a+5a) x+dxf Рис. 1.6. Действие однопараметрической группы в окрестности единичного элемента Разложим последнее соотношение (1.29) в ряд Тейлора в окрестности тождественного преобразования а0 = 0.
Глава 1. Синтез САУ методами дифференциальной геометрии 31 Имеем jc'+c&' = /(jc',O) + df{x\b) ЪЪ 6 = 0 5a+... = jc'+$(jc')6a+.... (1.30) В формуле (1.30) учтена зависимость (1.26). Если вариация параметра Ъа очень мала, можно принять ах' = ^(х')да. (1.31) С другой стороны, пользуясь определением группы Ли, имеем x' + ck' = f(x\8a) = f(f(x9a),8a) = f{xMa>4)> С1-32) где q>(a,b) - групповая операция параметрической группы Gj(cm. ниже). Сравнивая выражения (1.28) и (1.32), получим a + da = y(a,ba). (1.33) Найдём, как связан дифференциал da с вариацией параметра 5а. Разложим правую часть (1.33) в ряд Тейлора в окрестности а0 = 0 а + яя = ф(а,0) + S(p(fl,fr) 5b 6 = 0 5я + ... = а + 5q>(a,fr) ЪЬ 6 = 0 Ьа +. Если вариация Ъа мала, то можно принять ,_dq>(a,fr) da = - Откуда 8а = д^{а,Ь) дЪ дЪ 6 = 0 6 = 0 -1 5а. da- \y(a)da. Подставляя формулу (1.36) в (1.31), получим dx' = t,(x')\y(a)da. Если ввести новый параметр / а t = $\\f(a)da, т.е. dt = \\t(a)da, тогда из (1.37) можно определить dx^ dt = фс'),х'{0)=х. (1.34) (1.35) (1.36) (1.37) (1.38) (1.39) (1.40) Новый параметр / для однопараметрической группы преобразований G называется каноническим, т.к. в этом случае групповая операция имеет простейший вид 'з=ф('1>'2) = '1+'2- С1-41) Обратный элемент канонического параметра группы G rl=-t. (1.42) Свойства (1.41) и (1.42) очевидны, т.к. согласно (1.40) дифференциал преобразования dxr линейно связан с дифференциалом параметра / Лс' = $(х')Л, конечно же, при условии, что £(•) не является функцией параметра /. Если параметр t определить как время, то соотношение (1.40) можно трактовать следующим образом:
32 Методы современной ТАУ. Часть IV между однопараметрической группой преобразований в пространстве Rn и системой автономных обыкновенных дифференциальных уравнений с аналитическими правыми частями существует взаимно однозначное соответствие (с точностью до несущественной замены параметра). Интегрируя систему (1.40) мы полностью восстанавливаем группу по её инфинитезимальному оператору (с точностью до замены параметра). Связь однопараметрической группы преобразований G с введенным каноническим параметром / и автономными обыкновенными дифференциальными уравнениями позволяет дать следующее (широко используемое) её определение [3,5]. Определение 1.11. Локальная однопараметрическая группа G (диффеоморфных преобразований) {xt} в многообразии Мп - это отображение RxM в М, (t,x)e IxM -^ Xt(x)eMn ,1 = (-е,е)е R, которое удовлетворяет следующим аксиомам группы: 1) для каждого t e R Xt : х -» Xtx есть преобразование в Мп ; 2) для всех t,s e /, t + s e /, хеМ" Xt+sx = Xt \Xsx) = XtXsx\ (1.43) 3) обратное преобразование имеет вид: если х' = Xtx, то x = X~lx = X_tx'. (1.44) Замечание 1.2. Термин «локальная» показывает, что для нелинейной системы дифференциальных уравнений решение может существовать не для всех t e R . Ниже мы будем придерживаться этого определения, но прилагательное «локальная» для краткости опустим. Сопоставляя введенные аксиомы с аксиомами абстрактной группы (см. §1.2), мы видим, что: 1) параметр а здесь единственный и обозначен через t\ 2) групповой операцией параметрической группы G1 ц>(а,Ь)= a + b = t + s является обычное сложение; 3) умножением в группе преобразований G = {xt) является в общем случае композиция преобразований. Пример 1.6. Рассмотрим группу подобия G , действующую в пространстве R2(n = 2) х' = рх, peR, xeR2 (145) Найдем однопараметрическую группу преобразований и канонический параметр / для данной группы Представим параметр р в окрестности единичного элемента р0 -1 в виде р- ро + а = \ + а . Согласно аксиомам группы а) условие композиции преобразований х' = (\ + а)х, х" = (l + b)x' = (l + b){\ + a)x = (l + a + b + ba)x = (l + c)x Таким образом, групповая операция параметрической группы G1, где единичным элементом является я О = 0, имеет вид с - q>\a,b) = a + b + ab ; (146) б) обратный элемент группы G1 ф(д,а"1) = а + а"|+а"1а = ао = 0, (I 47) где а0 =0 - единственный элемент группы G1. Напомним, что единичным элементом группы G является р0 = 1 . Заметим, что в формуле (1.47) нельзя перемножать а~ха обычным образом, т.е. а~1а -1 , т.к. в этом случае получаемое значение а'1 = -(1 + а) не удовлетворяет групповой операции
Глава 1. Синтез САУ методами дифференциальной геометрии 33_ ф(д,я~1) = а + а~1 +а'1а = а-(\ + а)-(\ + а)а = -(\ + а + аа)* О . Выражала"1 из (1.47), получим а-'=--^-. (1.48) \ + а В этом случае ф(я,я~Ч = 0. Найдем инфинитезимальный оператор группы G . Имеем х\ = ft (х,а) = (1 + a)xh / = 1,2. Согласно формуле (1 26) _У,(х,д) да т.е. оператор группы подобия имеет вид 1.-'-« Ых) = ^РЩ =х„ / = 1,2. • (1.49) С*2 Определим функцию у(д) (см. (1.36)) *В*«ЖГ+*'ЖГ " (150) v(g)=l д. ; = (i + e)-'=-L А = 0J 1 + а Канонический параметр Откуда /-j9(flVfa-f—=ln(l + a) = lnp о ol + fl р = г/. (1.51) Подставляя (1.51) в (1.45), окончательно получим х;=в'х„ 1 = 1,2, (1.52) где / = 0 - единичный элемент параметрической группы G соответствует е = 1 единичному элементу группы преобразований G. Уравнения (1.52) - не что иное, как решение системы дифференциальных уравнений xt = xt, / = 1,2 с начальными условиями х, (о) = х, . Пример 1.7. Рассмотрим на плоскости группу вращения (параметр а - угол поворота): х\ = Xicosa + x2sma = / (х,а), 11 2 -М ' '' (1.53) хг2 = -х, sina + x2cosa = /2(х,а). Найдем инфинитезимальный оператор данной группы. По определению .5/,(д W* «--^ да |а = о 2 Таким образом, оператор имеет вид: *=<-<■ (U4) Найдем групповую операцию* xJ = x',cos^ + X2sina = (x1cosa + X2sina)cos^+(-A:,sina + X2COSa)sin6 = = х, cos(a + b) + x2sin(a + b); x\ = -x'j sinb + x'2cosb = -(xjcosa + x2sina)sin6 + (-XjSina+x2cosa)cos6 = = -x, sin (a + b) + x2 cos(a + b) Таким образом, групповая операция параметрической группы G есть с = ф(д,б)=д + 6. (1.55) А параметр а группы (1.53) является в то же время каноническим, т.е. а = t, преобразование самой группы G имеет вид *,=fC0S' ""'I 0.56) V sin ^ cos /)
М Методы современной ТАУ. Часть IV Можно заметить, что преобразование (1 56) однопараметрической группы вращения G - это переходная матрица состояния для системы дифференциальных уравнений, определяемых оператором группы (1.54) ^! = * т.е. 0(t, 0) = Xt.. Это же утверждение справедливо и для примера 1 6. 1.4. ВЕКТОРНЫЕ ПОЛЯ НА МНОГООБРАЗИЯХ. ПОЛНЫЕ ВЕКТОРНЫЕ ПОЛЯ С каждым элементом а е G группы Ли G связаны два гладких отображения: Ra\ Gr ->Gr ,La: G ->G группы Ли G , которые определяются равенствами Ra{b) = ba, (1.58) La{b)=ab. (1.59) Отображение La называется левым сдвигом, a Ra - правым сдвигом на элемент а е Gr. В координатах имеем: (Lab)t =ф|-(а1,...,аг,й,,...А). О-60) {Rab). =<pl{bb...9br,a]9...9ar), / = l,r, (1.61) где а имеет координаты (a\9...9ar)9 a (bu...,br) - координаты элемента b, La и Ra - гладкие отображения, которые имеют обратные. Формулы (1.60) и (1.61) определяют собой координатные представления групповой операции группы Ли G . Между левым La и правым сдвигом Ra имеют место следующие соотношения: a) LaLb =Lab, b)RaRb=Rab, (1.62) с) LaRb=RbLa. В дальнейшем при исследовании глобального поведения динамической системы на многообразии нам потребуется специальные векторные поля на группах Ли - так называемые лево инвариантные векторные поля. Определение 1.12. Векторное полезна группе Ли Gr называется левоивариант- ным, если оно переходит в себя при увлечении любым левым групповым сдвигом, т.е. L{a\x{Thx)=X{TJbx) (1.63) для произвольных элементов a,b e G . Здесь (La)+ - увлечение векторов Х(Тух) отображением La, т.е. {La)*:TGrb-*TGrab. (1.64) Иначе говоря, при рассмотрении группы G как многообразия увлечение (La)* определяет отображение касательного пространства элемента beG в касательное пространство элемента abe Gr, и это отображение определяется дифференциалом действия элемента а, т.е. (La)*=>dTa. (1.65) Графически левоинвариантность векторного поля X может быть показана следующим образом (рис. 1.7).
Глава 1. Синтез САУ методами дифференциальной геометрии 35 rju^V^ wax) Рис. 1.7. Графическая интерпретация левоинвариантного векторного поля Итак, соотношение (1.63) запишется следующим образом dTa(Tbx)=X(TJbx). (1.66) Это говорит о том, что левоинвариантные векторные поля многообразия Мп касательными отображениями группы переводятся в векторные поля этого же многообразия Мп. Другими словами, левоинвариантное векторное поле всюду на многообразии не имеет особенностей. Это свойство отражено в следующей лемме. л Лемма 1.1 [25]. Левоинвариантные векторные поля на группе Gr однозначно определяются своими значениями в единице группы. Это значит, что единица параметрической группы Gr a = О соответствует тождественному преобразованию: Тох =х (единица группы преобразований) и X{Tax) = (LalX{Tox) = {La),X(x) = dTa(x), (1.67) т.е. касательным отображением группы преобразований можно получить вектор Х(х) в любой точке jc е Мп , где 5с = Тах. Следствие (леммы 1.1) [25]. Пространство левоинвариантных векторных полей на группе Ли конечномерно и его размерность равна размерности группы Ли Gr. Определение 1.13. Алгеброй Ли L(Gr) группы Ли Gr называется пространство всех левоинвариантных векторных полей на группе Ли Gr с операцией умножения - коммутатором векторных полей [•,]. Пример 1.8. Покажем, что инфинитезимальный оператор X группы вращении формирует левоинвариантное векторное поле Х(х). Имеем: 1) оператор X = х2 xj ; дхх дх2 2) векторное поле в координатах х2 3) группа G1 (один параметр а = /) х\ = дг, cos г + дг2 sin r, х\ = —jr, sin/ +дг2 cos/; 4) действие группы Та = Х( х (cost sin/ ^ ' [-sin/ cos/J' Пусть в единице группы (/0 = О, Хо = Е ), дс(О) =дсь Имеем:
36 Методы современной ТАУ. Часть IV x10cos/ + :)C2osinO {-x]0sint + x20cost) Тогда векторное поле в точке Х#о X(TaXo) = X(XlXQJ **<f)U -*»*>' + *»*"'. I -*i(')J l,-(^ocos/ + jr20sin/)j С другой стороны, векторное поле в начальной точке Хо Касательное отображение группы G v " 1^-cos/ - sin /J что дает l^-COS/ -SlnfJ^20J ^-(ДС10С08» + *2051П/); Отсюда мы делаем вывод, X(X,xe)-dX,{xt), т.е. векторное поле Х(х) левоинвариантно. Важнейшее свойство левоинвариантных векторных полей - их полнота. Определение 1.14. Векторное поле Х(х) называется полным, если его однопара- метрическая группа G = (Xt) определена для всех /е(-оо,оо), т.е. решение дифференциального уравнения x(t) = X(x) (1.68) может быть продолжено неограниченно. Уравнение (1.68) с действием группы Xt может быть записано в следующем виде —(Xtx) = X(Xtx), XtxeM\ VxeM", teR]. (1.69) dt Полные векторные поля и их группы G = {х,} удовлетворяют уравнению (1.69) для любого /е (-оо,оо), для неполных это справедливо только в локальной окрестности. Пример 1.9 [17]. Рассмотрим дифференциальное уравнение х = 1. Пусть фазовым пространством (многообразием) для этого уравнения будет открытое подмножество R: M]={xeR:0<x<\}. (1.70) Группа преобразования G определяется действием Х( = (l + f), что приводит к тому, что для всех teO преобразование Xt не переводит фазовое пространство в себя, т.е. XtM] Ч> М] при teO, т.е. векторное поле Х{х) = 1 не имеет однопараметрической группы на этом фазовом пространстве (многообразии). Так как решение определено только для / = 0 - векторное поле не является полным. Причина этого - в некомпактности многообразия Мх (1.70). Имеет место следующая теорема о существовании однопараметрической группы преобразований для некоторого векторного поля Х{х). Теорема 1.1 [17]. Пусть М" - гладкое (класса С,г>2) многообразие, X: Мп -» ТМп - векторное поле. Пусть вектор Х(х) отличен от нулевого вектора ТМпх только лишь компактной части К многообразия Мп. Тогда существует однопа- раметрическая группа преобразований Xt :M" *->Mw, для которой поле Х(х) является полем фазовой скорости, т.е. удовлетворяет дифференциальному уравнению 4(ад=ед*)- (i.7i) at
Глава 1. Синтез САУ методами дифференциальной геометрии 37 1.5. СВЯЗЬ СИСТЕМЫ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ И ЛИНЕЙНОГО УРАВНЕНИЯ В ЧАСТНЫХ ПРОИЗВОДНЫХ ПЕРВОГО ПОРЯДКА. МЕТОД ХАРАКТЕРИСТИК Многие свойства групп преобразований могут быть изложены как решения уравнения в частных производных, поэтому важно знать, как соотносится система обыкновенных дифференциальных уравнений, которыми обычно описывается динамика систем управления, с уравнениями в частных производных. 1.5.1. Метод характеристик решения дифференциальных уравнений в частных производных -Рассмотрим простейший тип дифференциального уравнения в частных производных первого порядка - линейное однородное дифференциальное уравнение для одной неизвестной функции z = z(xl9x2) двух независимых переменных (п = 2) или где дх2 ох2 X -z(x). О, /=1 mi (1.72) (1.73) (1.74) - векторное поле, рассматриваемое как дифференциальный оператор, действующий на гладкую функцию z(x), определённую на поверхности z = v|/(*). (1.75) Уравнение (1.72) имеет тривиальное решение z = const, (1-76) которое мы не рассматриваем, а ищем нетривиальное решение вида (1.75). Дифференциальное уравнение (1.72) будем рассматривать в области 8(х), в которой коэффициенты £,•(*), / = 1,2 определены и непрерывны. Особенность дифференциальных уравнений в частных производных первого порядка состоит в том, что их решение вполне определяется интегральными кривыми некоторых систем обыкновенных дифференциальных уравнений. Для дифференциального уравнения (1.72) к этому результату можно прийти следующим путём. Любое решение z = \\f(x) изображается поверхностью в (z, xh x2) пространстве, лежащей над плоскостью хх0х2 (рис. 1.8). z = m>(a:)>^ линия УР°ВНЯ О (*! =Ф1(О,*2=Ф2(О) Рис. 1.8. К выводу метода характеристик
38 Методы современной ТАУ. Часть IV Точки этой поверхности, лежащие на одной и той же высоте С z = 4/(*) = C, (1.77) образуют некоторую кривую, называемую линией уровня. Уравнение линий уровня имеет вид *1 =Ф1(0» Х2 =Ф2(0» ^ = v(Pl(0» Ф2(0) = С» С1'78) где t - параметр. Дифференцируя соотношение Ч/(ф1(0>Ф2(')) = С по /, получим: f^M')> <P2(')H.(')+|rW')> Ф2('))-Ф2(') = °- (1-79) Так как функция vj/ удовлетворяет уравнению (1.72), то имеем: SiMO. v2(t))'^-M)'Ф2(О)+^(Ф.(О.ф2(0)~(ф.(0.ф2(')И. (1.80) ОХХ ОХ2 Если 5vj/ ас, 5v|/ > 0 всюду, то из соотношений (1.79), (1.80) следует, что <Pi ('Mi Ы')>Ф2 (>))>] Ф2 (0 = ^2 (Ф1 (0» Ф2 (^))-J Итак, проекции линий уровня на плоскости х\Ох2 заданы уравнениями (1.81) и для всех интегральных поверхностей одинаковы. На основании сказанного можно сделать вывод об отыскании интегральных поверхностей: находим интегральные кривые системы дифференциальных уравнений: *'м"!1(м1 <182> *2('M2(*)J Xj =9j(/), jc2 =ф2(^) и поднимаем эти кривые на подходящую высоту так, чтобы они образовали некоторую дифференцируемую поверхность z - v|/(jc). Каждая кривая *l=9l(')>*2=92(0>Z = C О'83) с произвольной константой С называется характеристической кривой или просто характеристикой дифференциального уравнения (1.72). Дифференциальные уравнения (1.82) по отношению к дифференциальному уравнению (1.72) называют характеристическими уравнениями. Интегральные кривыехх =yx{t), х2 =Фг(О в приложениях теории групп Ли называются орбитами действия однопараметрических групп диффеоморфизмов. Справедливы следующие утверждения [4]: 1) каждый интеграл z = \\f(x) уравнения (1.72) постоянен вдоль каждой характеристической кривой (орбиты), т.е. Ч>(ф1(0>Ф2(0) = сош*; С1-84) 2) каждая характеристика (орбита) (1.83), которая имеет хотя бы одну общую точку с интегральной поверхностью уравнения (1,72), целиком лежит на этой поверхности. Таким образом, каждая интегральная поверхность (в теории групп Ли - дифференцируемое многообразие) построена из характеристик (орбит);
Глава 1. Синтез САУ методами дифференциальной геометрии 39^ 3) если две интегральные поверхности уравнения (1.72) имеют общую точку, то они имеют и всю характеристику (орбиту), проходящую через эту точку. Пример 1.10. Найти решение уравнения *'£--*>£-=0- (185) Из характеристического уравнения (1.82) *1=*2' (1.86) х2 = -х, находим *1*1 = *\*2 х2х2 - -ххх2 хххх + х2х2 = 0 или х? +х2= const, т.е. все характеристические кривые являются концентрическими окружностями с центром в начале координат. Но можно подойти к решению этой задачи иначе. Рассмотрим действие векторного поля (оператора) *=*£■*£ (187) на функцию z(x). Тогда уравнение (1.86) примет вид Х-г{х)=0. (1.88) Уравнение (1.88) показывает, что функция z(x) является инвариантом (см. §1.6) группы вращения G, для которой X является инфинитезимальным оператором. Интегрируя уравнения (1.86) или используя ряд Ли (см. §1.6), восстановим эту группу G. Ее действие имеет вид ^ (cos/ sin^ ' ^-sin/ cost) а орбиты (характеристики) определяются выражением с константой уровня с- xf(o)+x2(6). Замечание 1.3. Для дифференциального уравнения (1.72) при п>2 все выводы, полученные для задачи с п - 2, остаются в силе. Замечание 1.4. Инварианты однопараметрических групп Xz(x) = 0 расслаивают пространство Rn на непересекающиеся между собой поверхности, что напрямую в задачах управления связано с управляемостью систем (это будет рассмотрено ниже). 1.6. ВОССТАНОВЛЕНИЕ ГРУППЫ ПО ЕЕ ИНФИНИТЕЗИМАЛЬНОМУ ОПЕРАТОРУ. РЯД ЛИ. ИНВАРИАНТЫ ГРУППЫ Рассмотрим однопараметрическую группу преобразований в окрестности ее единицы (формула (1.14) для z(x') = х') х5=х,+§,(х)-/ + ..., (1.90) где *'<*> = (ir] =i" / = I^ (L91) V ot jt=0 t - канонический параметр. Пусть z(jc) - некоторая функция. Рассмотрим, как преобразуется данная функция с помощью однопараметрической группы (1.90). Имеем z(jc') = z(xi+§1(jc)-/ + ...>x2+§2(jc)-/ + ...,x/i+§ii(jc)./ + ...) = 5(jc;/). (1.92)
_40 Методы современной ТАУ. Часть IV Найдём полную производную функции z(x') по параметру /: ± = ±?LK. (1.93) Учитывая, что (считаем поле левоинвариантным) |Ц,И. (1-94) формулу (1.93) можно записать в виде ^ = Xz(x'), (1.95) at где * = Ъм4т d-96) /=1 oxi - инфинитезимальный оператор. Уравнение (1.95) называется уравнением Лиувилля. Найдем связь преобразованной функции z(x;t) с исходной z(x) и оператором X . Разложим функцию z[x;t) по степеням / в ряд Тейлора в окрестности точки t = 0 . Получим + ... . (1.97) /=о Из выражения (1.92) ясно, что z(x;0) = z(x), а из уравнения Лиувилля (1.95) имеем dt dt v ' В формуле (1.97) это соотношение дает f =XZW- Обозначив Xz(x') = q(xr), т.е. вводя новую функцию, получим согласно уравнению (1.95) ^ = ХЯ(х') = Х(Щх'))=Х^(х'), т.е. dt2 dt2 v ; dt2, n = X2zW. Продолжая аналогичную процедуру, мы находим искомую связь л z(jc;/) = z(jc) + /-X-z(jc) + — -X2-z(jc) + ... . (1.98) Данный ряд называют рядам Ли. Формально рассматривая (1.98) как экспоненциальный ряд, можно записать z{x;t) = etxz(x)9 (1.99) где еа называется операторной экспонентой. Если z(x) = х, тогда формула (1.99) примет вид
Глава 1. Синтез САУ методами дифференциальной геометрии 41_ xi(x;t) = xl =etXxh i = \,n (1.100) или *;=*,.+/■£,.(*) + ..., i = ~n. (1.101) Формулы (1.100), (1.101) показывают, как можно с помощью ряда Ли восстанавливать группу по ее инфинитезимальному оператору X. Учитывая соотношение (1.101), формулу Лиувилля (1.95) можно записать в следующем виде: ИЛИ — = А5. (1.102) dt Дополнив (1.102) начальным условием z(x;0) = z(x), получаем задачу Коши для линейного управления в частных производных относительно искомой функции z(x\t), эквивалентную системе нелинейных дифференциальных уравнений (1.91), т.е. если решение системы (1.91) будет *;. = /;(*,/), /=п, (1.ЮЗ) тогда решение уравнения (1.102) имеет вид z(x;t) = z(/, (*;*), /2 (*;')>-> fn №)). (1.104) Пример 1.11. Рассмотрим группу вращений плоскости х\ =costtj +s'mtx2 (1.105) х2 = —sin/Xj + cosfic2,' которая порождается следующим инфинитезимальным оператором х=**х~ж«т-- (1106) СИГ] ОХ2 Пусть функция z(a:) имеет вид z(x) = Xlx2. (1107) Найдем, как будет изменяться функция z(x) при действии Xt группы вращений *,-(Т sin'l. см») ^-sin/ cos/J В точке д:' функция z(x') будет z{x') = x'vx2i (1.109) а функцию z(x\i) найдем подстановкой выражений (1.105) в (1.109). Получим Убедимся, что функция (1.110) удовлетворяет уравнению (1.102), а значит, является его решением, т.е. при подстановке выражения (1.110) в левую и правую часть (1.102) мы должны получить тождество. Итак, ~ = cos2/(x|-x12)-2sin2fic,x2; (1.111) Xz = \x2——xl^\\-s\n2t(xl-xf) + cos2lxlx2\ = cosb(xl-xf)--2sm2txlx2. (1.112) ^ dx] dx )\2 x ' ) y ' Из выражений (1.111), (1.112) видно, что соотношение (1.110) действительно является решением уравнения (1.102). Рассматривая ряд Ли (1.98), мы можем сделать вывод, что некоторая функция z(x') не изменяется при действии однопараметрической группы, т.е. 2(^;/) = 2(^') = (cos^l+sin^2)(-sin^1+cos^2) = -sin2/(x2-Jc12) + cos2ficix2. (1.110)
_42 Методы современной ТАУ. Часть IV z(x;t) = z(x), (1.113) если Xz(x) = 0. (1.114) Напомним, что такая функция называется инвариантом группы (см. §1.2). Однородное линейное уравнение в частных производных (1.114) позволяет найти орбиты действия Xt. Основное свойство инварианта группы: при умножении инварианта z(x) на произвольную функцию у(х) инвариант является константой для инфинитезимального оператора данной группы. Действительно, учитывая, что z(x) - инвариант, получим X{y(x).z(x)) = X(y(x))z(x) + y(x)X(z(x)) = z(x)X(y(x)). (1.115) Пример 1.12. Для группы вращений плоскости с инфинитезимальным оператором инвариантом группы является функция z(x) = xf+xl, что находится непосредственной проверкой. Инвариантное семейство. Если функция z(x) является инвариантом группы, то, приравнивая ее произвольной постоянной z(x) = c, получим семейство кривых, каждая из которых группой не изменяется, т.е. каждая кривая преобразуется сама в себя, т.е. любая кривая такого семейства является инвариантом кривой. Для практических применений важен иной случай. Пусть задано семейство кривых z(x) = c, причем функция z(jc) не является инвариантом группы G, т.е. преобразования (действия) группы Xt изменяют кривые семейства. Найдем условия, при которых действия группы преобразуют кривые семейства в другие кривые того же семейства. Такое семейство будем называться инвариантным. Задача: найти функцию z(x), которая определяет инвариантное семейство. Пусть zx (х) = с{ и z2(x) = c2 два представления одного и того же семейства. Это значит, что константы сх и с2 функционально связаны, т.е. c2=P(q), (1.116) тогда *2(*)=рЫ*)) 0-Ц7) и условие инвариантности семейства zx (х) = сх состоит в следующем zx(x'j) = ${zx{x)j). (1.118) Разложим lx(x\t) в ряд Тейлора по степеням /, получим z,(Jr,0 = 2l(*) + lpI[zI(*)] + ^p2[z1(*)] + .... (1.119) Сравнивая этот ряд с рядом Ли (1.98), находим необходимое условие инвариантности семейства Аг1(дс) = р(г1(дс)). (1.120) Это условие является и достаточным, т.к. если оно выполняется, то
Глава 1. Синтез САУ методами дифференциальной геометрии 43_ х\(х) = ХЬ(ъ(х)) = ^(21(х)) = р2(ф)) (1.121) azx (см. основное свойство инварианта), т.е. p,^^*)), P2(*i(*)) и т.д. являются инвариантами. Эти условия нахождения инвариантного семейства можно привести к более компактному виду, если учесть следующее. Так как некоторая функция Q(zj (x)) определяет то же инвариантное семейство, то ХО(21(дс)) = Л(2,(дс)). Отсюда следует f.X{zx{x)) = h{zx{x)). Пользуясь свободой в выборе функции Q, положим f-*('.W> Это приводит к условию Az,(*) = l, • (1.122) которое позволяет найти инвариантное семейство. Пример 1.13. Найдем инвариантное семейство для группы вращений плоскости. Инфинитезимальный оператор группы Из условия (1.122) получим *-Х2&Г*'&Г *&-x'a£=1- (1123) Уравнение (1.123) является неоднородным уравнением. Его можно привести к однородному, если воспользоваться следующим правилом. Пусть (рассматривается общий случай) (o(zux) = 0 (1.124) - неявное решение уравнения (1.122). Тогда имеем dxt oz{ oxt cbc; откуда После подстановки (1.126) в (1.122) получим однородное уравнение ±Ш£+Г-0, 0-127) где по-прежнему /=1 uxi Продолжим решение примера. С учетом (1.127) (п = 3) имеем *2- *! —+_ = 0. (1.128) дхх дх2 ozx
44 Методы современной ТАУ. Часть IV Этому однородному дифференциальному уравнению первого порядка в частных производных соответствует следующая система обыкновенных дифференциальных уравнений: Л, dt dt dt = *2> = 1. После исключения параметра t из системы (1.129) получим следующую систему уравнений dxx _ dx-y dzi 2) 1 ' . jc, x< => ou = z, -arcsm—- = z, -arcsin . ' 'af-x? ai >K^ x2 -X| которая имеет следующие первые интегралы: 1) *L.*l => (1.129) (1.130) a,=^?+^2; = 2,-arctg- x2 Общее решение уравнения (1.128) co = p(a1,a2) = pk/xf+:tL2i-arctg-L ' V х2; где р - произвольная функция от 2-х первых интегралов (у однородного уравнения должно быть п -1 первых интеграла: для (1 128) п = 3 ). Пусть \ / х2 Приравнивая р() = 0 , согласно (1 124) получим z^arctg^ + yUxf + xl). х2 \ / Для у^О z', =arctg—^- = 0, х2 определяет пучок прямых, для у = у]х* + х\ z\ = arctg— + yjxf +x\-c2 х2 - семейство спиралей Архимеда. Оба семейства zj, z\ являются инвариантными относительно действия группы вращений. На рис. 1.9 изображено инвариантное семейство arctg—*- = с] х2 arctg—- = c" х2 (второе инвариантное семейство) x' = Xtx JCi - arctg—L = c\ x2 (первое инвариантное семейство) ^ действие группы вращений Рис. 1.9. Инвариантное семейство для группы вращений
Глава 1. Синтез САУ методами дифференциальной геометрии 45_ 1.7. КАНОНИЧЕСКИЕ КООРДИНАТЫ Известно, что для линейных систем управления можно подобрать такой базис, при котором виды дифференциальных уравнений имеют особенно простой вид (диагональная или жорданова матрица общего вида). Такие координаты называют каноническими. В теории непрерывных групп преобразований вид инфинитезимального оператора также зависит от выбранного базиса, поэтому важно найти такую систему координат, при котором вид оператора будет наиболее простым. Попробуем определить ее. Без уменьшения общности рассмотрим однопараметрическую группу преобразований на двумерном многообразии М2. Пусть х = (хьх2)9 хеМ2 - исходные координаты. Введем новые координаты х[=х[{х), х'2=х'2(х). (1.131) Пусть в старых координатах х инфинитезимальный оператор X имеет вид Х = ф)^- + ф)^. (1.132) дхх дх2 Обозначим через X данный оператор в новых координатах X = Ux')^- + l2{x')-^r- (1-133) dXj ox2 Дифференциальному оператору (1.133) соответствует следующая система обыкновенных дифференциальных уравнений (см. §1.5): ., \ (1-134) Уравнение Лиувилля (1.95) здесь имеет вид *± = Хх'и^ = Хх'2. (1.135) at at Таким образом, имеем ' (1-136) где указано, что после применения оператора X необходимо перейти от старых координат к новым. Итак, в новых координатах оператор X имеет вид Х = (Ъ\)\х--х{хщНМ2)\х=х{х.щ. (1.137) Если найти такие координаты х\ что Ajc{ = 1, Х*;=0, (1.138) то в этом случае оператор (1.137) имеет вид х=4т- О-139) Назовем такие координаты дс', где оператор X имеет вид (1.139), каноническими. Для случая, когда п > 2, уравнения перехода к каноническим координатам *i = А (дс), х'2 = х'2 (х), ..., х'„ = *; (х)
46 Методы современной ТАУ. Часть IV выглядят следующим образом: Хх[=1, Л*;=0,..., Хх'„=0, (1.140) где х'2(х), ...,х'п(х) - представляет собой (п-\) функционально независимых инварианта группы инфинитезимального операторах. Функция х[(х) определяет инвариантное семейство группы. Инварианты х'2 (jc), ..., х'п (х) и функция х[(х) являются каноническими координатами группы. 1.8. ФОРМУЛА ХАУСДОРФА. ГРУППЫ СИММЕТРИИ. ТЕОРЕМА ЛИ В § 1.6 было рассмотрено действие Xt однопараметрической группы на функцию z(x). Основной же задачей непрерывных групп преобразований (групп Ли), ради которой и была разработана Софусом Ли теория непрерывных групп, является изучение- групповых свойств дифференциальных уравнений. Поэтому определим, как изменяется система дифференциальных уравнений при действии на нее некоторой однопараметрической группы преобразований. Без уменьшения общности будем рассматривать систему второго порядка: ах{ , ч ах2 с / \ хеМ2. (1-141) Пусть на многообразии М2 задана однопараметрическая группа преобразований: х\ =/j(a:,t),] It \ (1Л42) где т - канонический параметр преобразования. Согласно §1.3 уравнения (1.141) порождают однопараметрическую группу преобразований (диффеоморфизмов) с оператором А = ф)^- + ?>2{х)^-, (1.143) дхх ох2 а группа преобразований (1.142) определяется ее инфинитезимальным оператором Х = ф)-Ц- + г\2{хУ£-. (1.144) axi ох2 Необходимо найти, как изменится уравнения (1.141) при преобразованиях (1.142). В новых переменных х[, х2 уравнения (1.141) примут вид: 7, (1-145) ах2 z / , \ Этим дифференциальным уравнениям соответствует инфинитезимальный оператор группы л=^*'т)^2(*'т)^г (1Л46) Найдем связь между дифференциальными операторами А,Х,А . Для чего запишем преобразование группы (1.142) и обратное ему в виде рядов Ли (операторной экспоненты (1.99)). Имеем:
Глава 1. Синтез САУ методами дифференциальной геометрии 47 х[=е«хь х'2=ехХх2, хх=е хХх{, х2=е *хх2. (1.147) Воспользуемся формулами (1.147) и (1.136), для того чтобы представить оператор А в старых координатах. Имеем: "-(А'>1~(.>£+Ы~м5Г от Из формулы (1.148) находим (Ае-*х\)\х,=хЬ)=^(х), {Ае-*хх'2)\х.=Ах)=ЬП- Так как £, (x)(i = 1,2) не зависит от т (это параметр группы с оператором X), имеем (1.149) откуда — е~хХх[ - AXe~zXx\ + ХАе~хХх[ = 0 . di (1.150) В формуле (1.150) первые два слагаемых - это дифференцирование функций а(х\т) и е~хХ по т, а последний член определяется формулой Лиувилля (1.95) для функции z = Ае~хХх[. Аналогичная формула имеет место для координаты х2. Таким образом, из соотношения (1.150) имеем дифференциальные уравнения с начальным условием — = АХ-ХА = [А9Х\ А{х\т]Хж0=А{х'). (1.151) (1.152) Уравнение (1.151), определяющее преобразованный оператор А, является аналогом уравнения Лиувилля, определяющего преобразованную функцию. Из соотношения (1.151) можно дать другое определение коммутатора (скобки Ли): это есть производная преобразованного оператора А по параметру группы, определяемой оператором X . Решение задачи Коши (1.151), (1.152) осуществим разложением оператора а(х',т) в ряд Тейлора по степеням параметра т : А(х\ Из формул (1.151), Аналогично можнс и ряд примет вид о- --А(х')+х дА дх т2 Э2А т = о+2! di2 152)имеем дА dz ) показать, что д2А дг2 ^о = [[А,Х],Х], + ... . т = 0 (1.153)
(1.157) ^8 Методы современной ТАУ. Часть IV А = А + т[А,Х] + ^[[а,Х\х} + ... . (1.154) Данный ряд называется формулой Хаусдорфа, которая связывает операторы А,Х,А . Если в (1.154) имеет место равенство [Л,Х] = О, (1.155) тогда А = А, (1.156) т.е. преобразования группы с оператором X не изменяют оператора А (или системы дифференциальных уравнений (1.151)). Такая группа (1.142) называется группой симметрии и основная особенность ее преобразований заключается в том, что любое решение системы дифференциальных уравнений (1.141) она переводит в решение этих же дифференциальных уравнений. Основное назначение групп симметрии - это возможность понижения порядка системы дифференциальных уравнений и, в конечном счете, решение этой системы в квадратурах. Именно этой цели и добивался С. Ли при формировании своей теории групп непрерывных преобразований. Полученный результат справедлив для произвольной размерности п. Имеет место следующая теорема. Теорема 1.2 [24]. Пусть задана система обыкновенных дифференциальных уравнений Если известна группа симметрии этой системы, оператор которой Х=2>м^' (1Л58) т.е. [/4,х] = 0 , где А - оператор системы (1.157), тогда система (1.157) может быть понижена в порядке. Доказательство. Предположим, что известна полная группа инвариантов группы оператора (1.158), т.е. известны ее канонические координаты х{=х[{х), х' =х'(х) I в которых оператор X имеет наиболее простой вид (см. §1.7) Тогда условие [/4,x] = 0 переходит в условие [Л,х] = |Я-|г| = 0, (1.15S которое говорит о том, что все координаты оператора
Глава 1. Синтез САУ методами дифференциальной геометрии 49 не зависят от переменной х{, т.е. система уравнений (1.157) в новых координатах х' имеет вид ^i _ I ( \ ~Г -^п\х2>хЪ>"''>хп)- (1.160) Система уравнений (1.160) имеет порядок (п -1): л; 2 _ л -£>2\х2>хЗ>—>хп)> at (1.161) а решение первого уравнения (1.160) может быть получено после получения решения системы (1.161). Итак, было показано, что если рассматривается однородное дифференциальное линейное уравнение первого порядка в частных производных Az = 09 (1.162) где А = 1Ьъ{х)4г> хеМ" (1Л63) и на многообразии Мп задана однопараметрическая группа преобразований {xt} с инфинитезимальным оператором д *-Z*M£, (1.164) /=i то группа G = {Xt} является группой симметрии для дифференциального уравнения (1.162), если она переводит любое решение уравнения (1.162) в некоторое решение этого же уравнения. Необходимым и достаточным условием этого является выполнение равенства [Л,Х] = О. (1.165) Условие (1.165) довольно жесткое, а наличие оператора X , который переводит решение (1.162) в его же решение, можно ослабить, если ввести следующее определение. Определение 1.15. Скажем, что уравнение (1.162) допускает оператор (1.164), который переводит решения уравнения (1.162) в его же решения тогда и только тогда, когда [А,х] = Х{х)А, (1.166) где Х(х) - некоторая функция, зависящая от вида оператора X . Ясно, что если ш(л:) - решение (1.162), тогда [А, Х](о{х) = А{хф))- Х{А®{х)) = \(х)Аа>{х) = 0 . (1.167) Из этого следует, что А{х{(о{х))) = 09 (1.168) т.е. функция ^{х)=Х{4х)) (1.169) 5 Зак 416
_50 Методы современной ТАУ. Часть IV тоже является решением уравнения (1.162), а это значит, что оператор X переводит любое решение (1.162) в другое его решение. Тогда решение (1.162) ш(дс) = const (1.170) должно быть инвариантным семейством для однопараметрической группы преобразования {xt} оператора X (см. §1.6). Для практических приложений важно определить действие нескольких однопара- метрических групп. Но предварительно введем некоторые определения, которые расширяют известные понятия из линейной алгебры. Определение 1.16. Вектор-функции ф;(л:) =(ф;1(д:),...,ф/Л(д:)), / = 1,/и называются линейно связанными, если существуют такие ненулевые функции c,(jc), не все равные нулю, что т 2>,(*М*)=о. /=0 Если (1.170) справедливо только для c,(jc) = 0, / = 1,/и, тогда вектор-функции {ф, (х), / = 1, т) называются линейно несвязанными. Ясно, что введенные термины являются обобщением понятия линейной зависимости и независимости для векторных пространств. Если в (1.170) с, [х) = ch i = 1,т , т.е. это константы, тогда вектор-функции ф, (х) называются линейно зависимыми. Определение 1.17. Операторы Х} =У]£д(*) ,j = hw являются полной сис- к=\ &* темой, если в некоторой открытой области выполнены следующие два условия: 1) операторы Х} линейно не связаны, т.е. гапк{^,(л:)Д2(.х),...^„,(л:)}=/и; (1.171) 2) коммутатор любой пары операторов линейно связанно выражается через операторы системы г 1 т [x,,X,j = ]Tc,,iA (*)*,. (1.172) к=\ Полную систему в теории управления часто называют инволютивной [31, 43]. Если у полной системы операторы коммутируют, т.е. [Х7,Х;] = О, V/,y = lT^, (1.173) тогда такую систему называют инволюционной [4]. Каждую инволютивную систему подходящей заменой базиса можно привести к инволюционной [4] (см. также §1.13). Для инволютивных (инволюционных) систем имеется следующая важная теорема. Теорема 1.3 [13]. Инволютивные (инволюционные) системы характеризуются тем, что однопараметрические группы преобразований (диффеоморфизмов), определенные операторами системы, имеют (п-т) общих функционально независимых инвариантов (интегральный базис), т.е. система уравнений А> = 0, / = Cw (1.174) имеет (п-т) функционально независимых решения coj(jc),...,co/i_/ii(jc) , а любое другое решение является функцией от этих решений. При этом нахождение каждого инварианта позволяет понизить порядок системы на единицу.
Глава 1. Синтез САУ методами дифференциальной геометрии 51 Зная h частных интегралов (инвариантов) со, (л:),...,соЛ (л:), 1 <h<n-m , можно найти остальные (n — m — h) инвариантов посредством введения новых независимых переменных: У\=®\{х)> >>2=ю2(*)>-> Ун=®1,{х)>} Ун+\ ~х/1+\^—->Уп ~хп- В этом случае число переменных уменьшается на h, и переменные y\...yh pac- (1.175) сматриваются как параметры. Пример 1.14. Даны два дифференциальных оператора. OJCj U%2 3 В координатной форме а д / ч а а *,w= (1 176) ' 1 ^ 1 -2 . 0, х2 ~{х\+х2) Хл Коммутатор операторов [xt,X2lx)= <1 0 -1 .0 0 1 -1 0 0 0 0 0 (Г 0 0 1. г 1' 1 -2 о, -(о)= f 1 ^ 1 -2 о, = AT,W, те. система {Х1,АГ2} является инволютивной (полной), где С\г{х)- 1 Составим уравнения для нахождения инвариантов операторов (1 176) (л = 4, т = 2, число инвариантов-2) Аг,со(л-) = 0, Х2а(х) = 0. (1.177) Первый инвариант для (1.177): <й]{х)=х1+х2+х3. Введем новые переменные* У\ =*i +*2+*з> Уг =Х2> Уз =*з; ^4 =*4 (1.178) Обозначим преобразования (1.178) через У = ^(^) • Выразим старые координаты через новые: *1 =У\-У2~УЗ> Х2 =УЪ ХЪ =^3; Х4 =^4 (1 179) Тогда x = g-l(y)- Если в старых координатах х, каждое уравнение в частных производных X,со = 0 соответствует системе обыкновенных дифференциальных уравнений **= Sit (*),* = 1,2,3,4, / = U, то в новых координатах (у^} имеем • ±дук V,. = > -^-^-Х . = Ук U*j xj=r\,k{y) = xiyk{x) х=8'ЬУ В этом случае операторы Хх,Хг в новых координатах имеют вид УМ-хА^п-^-хЦ **к-\у) '' (\ 0 0 0 1 1 0 0 1 0 1 0 (Г 0 0 1 г п 1 -2 0 '<р 1 -2 0 , 5*
52 Методы современной ТАУ. Часть IV r1=JL-2J- ду2 дуъ (1.180) Аналогично, для оператора Y2 получим Уг(у) = Х2у(х) _»(*) *=к"'(у) Зх *,(*) ~«"<у) ■ '1 0 0 ,0 1 1 0 0 1 0 1 0 0^ 0 0 h Х] 1 х4 ) -{х]+х2 V х4 ) ) Х=*\У) ' 0 > Уг Уъ~У\ У2 = У2-г-+(уз-У1)т-+У4—- ду2 ду2 ду4 (1.181) Из соотношений (1.180), (1.181) видно, что в новых координатах понижен порядок системы, координата у{= const является параметром. Ищем второй инвариант (в координатах у ). Инвариант для (1 182): ±2.-2-^ = 0, ду2 ду3 «.М-2***-* (1.182) Заменяя новые координаты на старые получим второй инвариант в исходных координатах х4 Рассмотрим теперь действие нескольких однопараметрических групп. Пусть на многообразии Мп действует г однопараметрических групп преобразования G, (/ = 1, А (параметр /;) с инфинитезимальными линейно несвязанными операторами AT, (i = lr). В этом случае можно считать, что на многообразии Мп действует одна /--параметрическая группа Gr [45], где G, (/ = l,rj - однопараметрическая подгруппа группы Gr. Если г - п-\, то знаменитая теорема Ли о разрешимости уравнения (1.1) в квадратурах определяется следующим образом. Теорема 1.4 (С. Ли, 1873 г.) [8,23]. Если уравнение (1.162) и, соответственно, система обыкновенных дифференциальных уравнений (характеристические уравнения): *i=M*). ; (1.183) *i/i=ii(*). допускает (л-1) -параметрическую разрешимую группу G""1, операторы которой Х1,...,Хп_1 вместе с оператором А составляют линейно несвязанную систему, то уравнение (1.162) решается в квадратурах.
Глава 1. Синтез САУ методами дифференциальной геометрии 53_ Так как локальные свойства группы Ли (непрерывных групп преобразований) можно изучать по их линейному приближению - их алгебре Ли, то, не вдаваясь в подробное изложение термина «разрешимая группа» (детали см. в [45]), покажем, как эта теорема выглядит в алгебраической форме. Пусть {Х]9...,Хп_х} - базис алгебры Ли Ln_x (полная система операторов), т.е. \/Xi е Ln_x, / = 1, п -1, имеем и все другие Скобки Ли также принадлежат Ln_x. Составим новую подалгебру V алгебры Ln_x, которая состоит из элементов У*=[х,.,АД,и = пй * = 1,2... (1.185) и их линейных комбинаций. Из V получим новую подалгебру L\ где элементами являются операторы Zk=[Yi>Yj\> '>> = U-1, * = 1,2... (1.186) и т.д. Определение 1.18. Подалгебра Ls с Lr некоторой алгебры Lr называется идеалом в Lr, если для любых X eLriY e Ls справедливо включение [X,Y]gLs. Для алгебры разрешимой группы Gr (разрешимой алгебры) имеют место включения: Ln_x эГэГз...эО, (1.187) где каждое следующее L является идеалом предыдущего. Теорема 1.5. Уравнение (1.162) решается в квадратурах тогда и только тогда, когда алгебра Ли Ln_x группы Gn~l является разрешимой, т.е. имеет место включение (1.187). Эта теорема имеет важное значение в теории управления для синтеза регуляторов. Рассмотрим уравнение второго порядка Л =/,*!. (,.188) dt2 Ч'7* Если это уравнение допускает оператор Хх, то оно сводится к уравнению первого порядка ^- = v(/,x'). (1.189) at В свою очередь, если это последнее уравнение допускает оператор Х2, оно решается в квадратурах. Легко показать, что любая алгебра L2 = {X]9X2}IA разрешима, точнее, в ней можно выбрать базис так, что [хх, Х2 ] = ${х)Хх. Это означает , что Хх составляет в L2 идеал и мы имеем цепочку L2 zd Lx z>0, т.е. уравнение (1.25) допускает разрешимую группу и разрешимо в квадратурах. Пример 1.15. Рассмотрим уравнение Az = 0, (1190) где AJ± + -2—2-f\. (1191) {дх{ дх2 дх3) Уравнение (1 190) имеет («-l)= (3-l)= 2 интегралов а1(х),(а2(х) Найдем их с помощью групп симметрии. Уравнение (1.190) допускает оператор
_54 Методы современной ТАУ. Часть IV X = xt± + X2JL-(Xl+X2)±. (1192) ОХ\ 0X2 °х\ Действительно, коммутатор двух операторов [А,Х] = А (1.193) подтверждает это и, следовательно, оператор X является инфинитезимальным оператором группы симметрии Для перехода к каноническим координатам У-g(x), y = (yl,y]iy3)T найдем инварианты группы симметрии aj(A*),a2(jc) Имеем (см §1 7 о нахождении канонических координат)- ^ = ^ = _^_ (1 194) *1 Х2 -(Х\+Х2) Из уравнения dxx dx-y находим первый инвариант a,(jc) = -S- = const. (1.195) Х2 dx2 _ с^ъ Из уравнения х2 -(а1*2 + *г) получим второй инвариант a2(*)= ^i + х2 +х3 = const . (1.196) Найдем канонические координаты Составим систему уравнений A>,(x)=l, Ху2{х)=0, (1.197) *л(*)=о.. Две координаты у2(дс) = а,(дс) = ^-, уАх) = *2(х) = *х+*г + Хз d-^8) х2 известны Необходимо найти третью каноническую координату у\{х). Неоднородное уравнение ^>W=i соответствует следующему однородному уравнению *'аГ*21Г(*+*2)аГфГ0' (И99) из которого имеем следующую систему уравнений* dxL=dxL=dxL__dyL (1200) *1 Х2 (Х\+Х2) 1 первые два уравнения дали нам два инварианта cti(:c),a2(:c). Из уравнения ^1 = У] (1.201) х\ получим У\{х)= \пх} . Это и есть третья каноническая координата. Найдем, как будет выглядеть оператор А в новых координатах (канонических) Л = Лух(х)-1- + Луг(х)±-+Луг(х)-Ц- =-^-4--^)^-*0^-\ . (1.202) оу\ оуг оуъ -«-W *'*' V*2 X2j^2 ^3|«.f-W Найдем обратные преобразования д: = g~](y)'. Х2= > У2 >^2 J хъ = уъ-еу<-—. (1.203)
Глава 1. Синтез САУ методами дифференциальной геометрии 55 Заменяя старые координаты в (1 202) на новые (1.203), получим* ^е-л1 + в-л(Л-,|)1 (1.204) Заметим, что в выражении (1.202) это значит, что является интегралом уравнения (1 140), второй интеграл исходного уравнения определим из уравнения Лг = 0. (1205) Этому уравнению соответствует следующая система обыкновенных дифференциальных уравнений1 dt dt (у>-у1) (1 206) Данная система легко решается: j,=ln Уг Уг-\ + 1пс. Переход к исходным координатам определяет еще один интеграл уравнения (1.190) ©2(*)=*,-дг2. (1207) Проверим, что оператор X действительно является оператором группы симметрии: *©,(*)= 0, что уже показано выше, Лю2(дс)= х, —+ *2- (х, +х2)—- (х, -х2) = х{ -х2 , ^ дхх дх2 дх3) т.е. оператор X переводит решения уравнения (1.190) в его же решения 1.9. КОММУТАТИВНОСТЬ ОДНОПАРАМЕТРИЧЕСКИХ ГРУПП И РАЗДЕЛЕНИЕ ДВИЖЕНИЙ В НЕЛИНЕЙНЫХ СИСТЕМАХ Групповой подход к анализу систем-обыкновенных дифференциальных уравнений может быть весьма полезен, когда имеется возможность разделить общее движение системы на отдельные составляющие (эквивалент принципа суперпозиции для линейных систем). При этом не требуется восстанавливать всю группу, а вывод о разделимости можно сделать по их инфинитезимальным операторам. Рассмотрим две системы обыкновенных дифференциальных уравнений: (1.208) л dt d^_ di d-z = $„ = Л„ (*). (x). Этим системам уравнений соответствуют однопараметрические группы: Gx : x)=/)(x,/), / = l,w, (1.209) (1.210)
^6 Методы современной ТАУ. Часть IV G2: *; = ?,(*, т), / = п; (1.211) причем х'{0) = х. (1.212) Инфинитезимальные операторы этих групп: В = Тг\1(х)^-- С1-214) Выясним, как влияет последовательное действие каждой из групп на некоторую точку хе М", т.е. определим коммутацию преобразований из разных групп. Имеем: x' = f(x,t), 1 L (1 215) дс' = *(*',т) = *(/(дг,г),т),| т.е. это коммутация действий однопараметрических групп АпВх: х" = ВхА(х. (1.216) Теперь в другом порядке: x' = BxAtx. (1.217) Определим, при каких условиях х" = х", т.е. композиция преобразований не зависит от порядка выполнения преобразований: BxAt =AtBx. (1.218) Оказывается, коммутативное свойство (1.218) групп G, и G2 имеет место тогда и только тогда, когда коммутируют их инфинитезимальные операторы: АВ = ВА. (1.219) Связь между соотношениями (1.218) и (1.219) легко выявить из рядов Ли. Практическая значимость полученного соответствия определяется следующим утверждением. Утверждение [23]. Если группы G] и G2 коммутируют, то их коммутация является также группой при условии, что отождествляются параметры / и т обеих групп, т.е. q{f[x'9t)9t) = f(q(x,t),t) -группа. Доказательство. Согласно теореме о восстановлении однопараметрической группы G по ее инфинитезимальному оператору А с помощью ряда Ли имеем: q(f(xj)j) = e8teAtx = BtAtx9 f(q{x,t),t) = eAte8tx = AtBtx, тогда условие коммутативности дает BlAtx = AtBtx = (A + B)tx, (1.220) т.е. получена новая параметрическая группа с преобразованием Ct={A + B)t (1.221) и инфинитезимальным оператором С = А + В. (1.222) Из соотношения (1.222) вытекает следующая теорема. Теорема 1.6 (принцип суперпозиции в нелинейных системах) [23]. Если система дифференциальных уравнений
Глава 1. Синтез САУ методами дифференциальной геометрии 57 ~Л{х)^В(х) (1.223) такова, что операторы А и В коммутируют: [Л,/?] = 0, тогда решение системы (1.223) является суперпозицией решений систем (1.208), (1.209) * = ?(/(*o>')>')s/(tf(*o>')>0' где д:0 - начальные условия для систем (1.208), (1.209). Пример 1.16. рассмотрим следующую систему дифференциальных уравнений: Запишем ее в следующем виде: х4 = Зх? + Х\ х = А(х) + Х2+Х3. + В(х), (1.224) где ' 0 ^ 1 1 Г 1 Л 0 0 М+Х3> А(х) = Найдем коммутатор (скобку Ли) векторных полей (дифференциальных операторов) А и В: (1 225) дх2 дх3 дх4 ■i^+<= [А,В](х) = 0 0 0 01 0 0 0 0 0 0 0 0 6х, 0 1 0 ( 0 > 1 1 0 0 ь 0 0 0 1 0 0 0 0 0> 0 0 1 л 0 0 + x3j 0 0 т.е. операторы А и В коммутируют, поэтому можно рассмотреть две системы. 1. (Оператор А) i,=0, хг=1, *з=1, Х4 = JCj +Х2, решение которой x2(t) = t + x20, x3(t) = t + x2Q> ,2 x4(t) = xlQt + -j + x2Qt + x4Q, где xi0, i - 1,2,3,4 - начальные условия для системы (1.226). 2, (Оператор В) *,=1, х4 =3xf + x3, решение которой 4 Зак 416 (1 226) (1 227) (1.228)
_58 Методы современной ТАУ. Часть IV *2(') = *20, V6 ) (1.229) где xlQ, i= 1,2, 3,4 - начальные условия для системы (1.228) Общее решение системы дифференциальных уравнений (1.224) определяется композицией действий однопараметрических групп At,B(, причем в любой последовательности Пусть для определенности *'(') = Vo. т.е. *И') = *2<» *'з(') = *з<» Лз Л Х\ (') = 3 Т + /2ДГЮ + *">' -Y30/ + -Г4() I6 ) Действие однопараметрической группы А, на х' определяет общее решение *(/) = *"(/) = 4*r(/) = 4£,Xo, или покоординатно' x2(t) = t + x'2(t) = t + x20, x3{t) = t + x'3(t) = t + x3l), Г /2 Г/3 1 x4(t) = x\t + — + x2t + x\t = (t + xl0)t+ — + x2{{ + 3 — + t2xU)+x]{(\ + x3{1 + xAl> 2 * ч ч 1и/ 2 "г [в ) Изменение порядка действий однопараметрических групп x(t) = BtAtx0 даст тот же результат После введения основных понятий и теорем рассмотрим теперь, как применяются дифференциально-геометрические методы для решения конкретных проблем теории управления. И начнем мы с основной проблемы теории управления - проблемы управляемости систем управления. 1.10. УПРАВЛЯЕМОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ В начале 60-х годов Р. Калман сформулировал понятия и критерии для управляемости и наблюдаемости. Аналогичные вопросы применительно к нелинейным системам были рассмотрены в начале 70-х годов. Опираясь на работы Чоу (Chow), Германа (Herman), Хеймса - Хермеса (Heymes - Hermes), Брокетта (Brockett [30]) и работая независимо, Лобри (Lobry [47]), Суссман - Джурджевич (Sussman - Jurdjevic [36]) и Кре- нер (Krener [37]) разработали нелинейный аналог линейной управляемости в терминах алгебры Ли /(D) векторных полей на многообразии Мп, генерируемых векторными полями /к иг1'), полученными при постоянных управлениях ir7' e Q,y = 1,2,.... 1. Постановка задачи. Рассматривается нелинейная система управления общего вида У: * = /(*'И)> (1.230) где ueQaR"\ хеМ" - гладкое многообразие размерности n,yeRl, / и g - гладкие функции.
Глава 1. Синтез САУ методами дифференциальной геометрии 59^ Ставится задача: найти алгебраические условия управляемости для системы ]Г . Замечание 1.5. Если рассматриваются неавтономные системы, то вид (1.230) сохраняется, если в качестве переменной состояния возьмем время / с уравнением состояния х0 = 1. Предположим, что у системы ^ векторные поля /к п^'\ являются полными, т.е. для каждого jc° e Ып существует решение дифференциального уравнения х- f[x[t)y*/(')), удовлетворяющего условиям x(t0) = x°,x(t) е Мп для всех te R . Обозначим через (z(/) ,[^o^i]) функцию, определенную на интервале [/0>'i] • Чтобы выяснить, какие возникают тонкости для определения условий управляемости, и найти алгебраические критерии управляемости, введем некоторые определения. Отношение эквивалентности. Термин «отношение» используется для обозначения некоторых видов отображений, заданных на одном и том же множестве. Пусть отображение (Н,#) является отношением, гдеН - некоторое множество, R - некоторое отношение между элементами этого множества. Будем говорить, что элемент у е Е находится в отношении R к элементу х е S, и запишем это в виде yRx. (1.231) Некоторые элементы множества можно рассматривать как эквивалентные в том смысле, что любой из этих элементов при рассмотрении может быть заменен другим. В этом случае говорят, что данные элементы находятся в отношении эквивалентности. Чтобы разбить множество Е на группы (классы эквивалентности) эквивалентных элементов, необходимо выполнить три условия: 1) каждый элемент эквивалентен сам себе, т.е. xRx - условие рефлективности; (1.232) 2) два элемента являются эквивалентными вне зависимости от их расположения в отношении эквивалентности, т.е. если xRy , то yRx - условие симметричности] (1.233) 3) два элемента, эквивалентные третьему, эквивалентны между собой, если xRy и yRz , то xRz - условие транзитивности. (1.234) Таким образом, отношение R является отношением эквивалентности, если оно рефлексивно, симметрично и транзитивно. Заметим, что свойства отношения эквивалентности в точности повторяют в более общем виде аксиомы группы. Действительно: 1) рефлексивность - соответствует наличию единичного элемента группы; 2) симметричность - соответствует наличию обратного элемента; 3) транзитивность - соответствует аксиоме ассоциативности. Вернемся к задаче управляемости. Определение 1.19. Для заданного подмножества U е М" точка д:1 является U -достижимой из начальной точки л:0 (обозначение х] Ах°), если существует ограниченное измеримое управление (w(/),[/0>^]) > удовлетворяющее условию u[t) e Q для t e[/0,/,], такое, что соответствующее решение (*(0>['o»'i]) дифференциального уравнения (1.230) удовлетворяет соотношению лг(/0) = х° , x(i}) = л:1 и jc(/) eU для всех / е [/0)/, ]. Мп -достижимость или достижимость любой точки многообразия jc1 e Мп из х° будем обозначать 4*
^0 Методы современной ТАУ. Часть IV А(х°)={х1еМп:х]Ах0}. Определение 1.20. Будем называть систему ]Г управляемой в точке л*°, если а(х°) = Мп , и управляемой, если Л[х) = Мп для любой точки х е М" . Данное определение управляемости характеризует глобальные свойства системы ]Г и отображает ее групповые свойства. К сожалению, в реальных условиях групповые отношение нам неизвестны, и мы можем воспользоваться только линеаризацией группы Ли, действующей на многообразии М" G = fra eG:xl =Тах°',х\х° е М"\ в окрестности ее единицы, и тем самым рассмотреть ее алгебру Ли. Это приводит к необходимости ввести понятие локальной управляемости. Определение 1.21. Динамическая система управления ^ называется локально управляемой в точке л:0 , если для каждой окрестности U точки л:0 множество достижимости A^jlx0) также является окрестностью точки л:0 (рис. 1.10). U {х1 еМп :х1Аих()} = Аи(х0) Рис. 1.10. Множество достижимости /^Д*0) Определение 1.22. Динамическая система управления ^ называется локально управляемой, если она локально управляема для любой точки х е Мп . Последние два определения также не в полной мере отражают возможность анализа алгеброй Ли динамической системы ^ для оценки управляемости, т.к. для достижимости выполняются условия рефлексивности, т.е. хАх и транзитивности х]Аих° и х2Аих1 следует х2Аих°, но в общем случае не удовлетворяется условие симметричности, т.к. нелинейные системы не обязательно должны быть симметричными, т.е. из х]Аих° не обязательно следует x°AiJxl\ симметричные системы характеризуются тем, что f(x,u) = -/(jc,w) , т.е. существует управление ueQ, позволяющее, сохраняя длину вектора скорости, изменить его на противоположный. По этой же причине вводится более слабое отношение. Для заданного открытого множества [/сЛ/ существует (если система ]£ управляема) единственное наименьшее отношение эквивалентности на U , которое содержит все U -достижимые точки и на которых выполнены все три аксиомы отношения эквивалентности: рефлексивность, симметричность и транзитивность. Будем называть это отношение слабой U -достижимостью и обозначим через WAy. Тогда легко заметить, что x'WAyx" тогда и только тогда, когда существуют точки л:0,...,** е U , такие, что л:0 = х'9...9хк = х", и либо х'Ах1~{, либо xl~xAxl для всех i = \,k. Пллпотто лллтилшриир vc*v ncn YanairTpnunvpT гтапйгтш! РИММРТПИЧНПГ.ТИ
Глава 1. Синтез САУ методами дифференциальной геометрии 61_ Определение 1.23. Система ]Г является слабо управляемой в точке л:0, если WA(x) = M" для всех хеМ". Заметим, что слабая управляемость является глобальной концепцией и не отражает локального поведения системы ^, рассматриваемого в окрестности точки х°, поэтому вновь вводится понятие локальности. Определение 1.24. Динамическая система уравнений ])Г называется слабо локально управляемой в точке л:0 , если для каждой окрестности U точки дс° множество WAy (x° J также является окрестностью точки д:0. Система ^ является слабо локально управляемой, если она локально слабо управляема для каждой точки хеМ". Связь между всеми введенными видами управляемости для нелинейных систем можно изобразить в виде коммутивной диаграммы (рис. 1.11). ]>] локально управляема => ^ управляема ^ локально слабо управляема => ]Г слабо управляема Рис. 1.11. Связь между типами управляемости для нелинейных систем Заметим, что для линейных стационарных систем все 4 вида управляемости эквивалентны [37]. Из всех видов управляемости мы рассматриваем только слабую локальную управляемость, преимущество которой перед остальными видами заключается в том, что она имеет аналог критерия управляемости для линейных стационарных систем, а именно алгебраический критерий управляемости. Пусть V\Mn\ определяет множество векторных полей на многообразии Мп. Введем на V\Мпj операцию умножения двух элементов множества, в качестве которой используем коммутатор (скобки Ли) X-Y = [X,Y] = XY-YX. Пусть D = |/(*>к ) • к £ Q,ir^ = const, / = 1,2, ...> - множество векторных полей для системы ]Г , каждое из которых получено введением некоторого постоянного управления ir ' e Q. Предполагается, что Da V\Mn\ Обозначим через l[D) наименьшую подалгебру V\Mn j, которая содержит D и все линейные комбинации произведений управляемых векторных полей ([*,]) всех порядков, полученных из элементов D . Типовыми элементами I(D) являются линейные комбинации вида где f'(x) = f(x,u ''М для некоторого постоянного управления ir' eQ, / = 1,2,.... Если l(D)(x) = {X(x):X e/(£>)}, тогда для каждого хеМ",I(D) .является ли-
62 Методы современной ТАУ. Часть IV нейным подпространством (в общем случае переменной размерности) касательного пространства ТМ" в точке JC,T.e. l(D)(x)aTM". Подпространство /(D)(jc) постоянной размерности связано с таким понятием теории гладких многообразий как распределение, которое позволяет строить интегральные подмногообразия на многообразии М", что, в свою очередь, связано с управляемостью, инвариантностью, декомпозицией динамических систем. Определение 1.25. Назовем р -мерным дифференциальным распределением (1 < р<п) (или дифференциальной системой размерности р) на многообразии М" отображение Ар:М" ->Tp(x)qTM" (где Тр(х) - р-мерное подпространство касательного пространства ТМ" Vjc е М" ), такое, что Ар = Тр (jc) с ТМ", р = const. Иначе говоря, распределение А^ размерности р на многообразии Мп есть сопоставление каждой точке дсиз М" р -мерного подпространства ^(jc) из ТМ" . Распределение Ар называется инволютивным, если [AT,F](jc)e Ар(х) как только два векторных поля Х(х) и У(х) принадлежат Ар для всех хеМ". Пусть Xl(x)(i = \,p) - гладкие векторные поля, такие, что в каждой точке хеМ" векторы Xl(x)(i = \,p) образуют базис в Ар(х). Требование инволютив- ности заключается в следующем: [xhXJ](x) = fjCl(x)Xk(x),k=\Tp (1.235) (т.е. скобка Ли любых векторных полей Xf (д:), Xj (л:) е Ар является линейно связанной комбинацией базисных векторов распределения), где С~ (х) - гладкие функции на М" . Условие (1.235) говорит о том, что если векторы Х{ (x)(i = \,p\ формируют базис в А^ инволютивного распределения, то их взаимодействие - умножение [у] - не изменяет данного базиса, т.к. нетрудно показать [6], если Xt (x)(i = l9pj порождают инволютивное распределение Ар и функции fl} (дс)еС°°Ши j таковы, что Vjc е Л/, det||/7 (д:) ^ 0, эти векторные поля Х{ {х) = 2^fy {x)Xj {x) порождают то 7=1 же распределение Ар, только с другой параметризацией. Отсюда можно записать, что инволютивное распределение формирует подалгебру Ли размерности р. Мы делаем вывод, что множество I(D) является инволютивным распределением для системы ^ , если dim l(D)(x) = dim Ар (дс) = /? = const, Vjc g M" . Инволютивное распределение на любом гладком многообразии формирует интегральные подмногообразия, связанные с управляемостью, наблюдаемостью, инвариантностью и другими важнейшими понятиями теории управления.
Глава 1. Синтез САУ методами дифференциальной геометрии 63_ Каждое гладкое полное (см. §1.4) векторное поле Х(х) на гладком многообразии формирует одномерное интегральное многообразие (однопараметрическую группу диффеоморфизмов {Xt}) y(t) = Xtx0, причем y(t) = X(Xtx0). Из этого можно заключить, что, в отличие от параметризованной кривой р(/): р: / -> М,I = [to,t{] на многообразии Мп, которая имеет самый общий вид, в том числе и самопересечения (в локальной окрестности), р('1 интегральная кривая y(t) (как одномерное многообразие) векторного поля Х(х) точек самопересечения иметь не может, y{t)=X{X,x0) а в каждой точке х касательным вектором к интегральной кривой у(/) будет Х(х). Инволютивность определяет, как должны быть связаны векторные поля Хх(х)9...9Хр{х)9 чтобы формировать интегральное многообразие размерности \<р<п. Определение 1.26 [3]. Связное подмногообразие Np размерности р в Мп называется интегральным многообразием распределения Ар, если Va: е Np AP = TN"X, т.е. интегральное многообразие Np в каждой точке хе Np касается распределения А^. Распределение Ар называется (вполне) интегрируемым, если для любых х е Мп существует р -мерное интегральное многообразие, проходящее через jc. Если не существует других интегральных многообразий для А^, которые содержат Np, то Np называется максимальным интегральным многообразием для Ар. Классическая теорема Фробениуса устанавливает связь между инволютивными распределениями и интегральными многообразиями. Эта теорема может быть сформулирована в нескольких вариантах, в зависимости от того, какой аспект важен. Теорема Фробениуса 1.7 [34]. Распределение А^ тогда и только тогда интегрируемо, когда оно инволютивно. Теорема Фробениуса 1.8 [3]. Пусть Ар - инволютивное распределение на многообразии Мп . Через каждую точку х е Мп проходит единственное максимальное
64 Методы современной ТАУ. Часть IV интегральное многообразие Np для Ар. Любое интегральное многообразие, проходящее через х, есть открытое подмногообразие в Мп . Теорема Фробениуса 1.9 [37]. Если размерность I(D) = p для каждых х, т.е. /(D) = Др, тогда существует разбиение многообразия Мп на максимальные интегральные многообразия, которые все имеют размерность р и либо не пересекаются, либо совпадают. Ранее мы показали, что действие однопараметрической группы преобразований G = {Xt) на многообразии Мп формирует орбиту (интегральную кривую) Xtx0. Теорема Фробениуса обобщает этот случай при действии нескольких однопараметри- ческих групп {^л,,* = hp\ и показывает, что для инволютивных распределений эти действия формируют орбиту (максимальное интегральное многообразие). Орбиты действия группы локальных диффеоморфизмов обладают очень важным свойством: все точки максимального интегрального многообразия (орбиты) могут быть соединены под действием этой группы, т.к. все точки орбиты находятся в отношении эквивалентности. А это уже определяет управляемость системы. При этом размерность инволютивного распределения Ap(x) = TNp является одной и той же для всех точек х, принадлежащих данной орбите 5,dim Ар (х) = р9 Va: e S . Сформируем теперь алгебраический критерий управляемости. Теорема 1.10 (достаточные условия управляемости). Если динамическая система управления ]Г удовлетворяет ранговому условию управляемости в точке л:0, т.е. RC: dim /(D)(a:°)= dim &„(х°)=п, (1.236) тогда ^ локально слабо управляема в точке л:0 . Замечание 1.6. Если правая часть ])Г является аналитической вектор-функцией, тогда ранговые условия (1.236) являются необходимым и достаточным условием локальной управляемости [37]. 2. Рассмотрим, как полученный критерий соотносится с известным алгебраическим критерием для линейных стационарных систем. В этом случае уравнения состояния ]Г определяют множество векторных полей Z) = {Ax + Bii:iieQ}, (1.237) так что алгебра Ли генерируется векторными полями Х1(х) = Ах,Х2{х) = Ь{9...,Хт+1{х) = Ьт, (1.238) где bj - /-ый столбец матрицы В , */ = 1,т рассматривается как постоянное векторное поле. Заметим, что управление и не входит в базисные векторные поля |Х;л(д:), f = 1,/и + 1>,т.к. система (1.237) линейна по управлению и, а как было сказано выше, умножение векторного поля на ненулевую функцию не измени интегральную кривую поля, а лишь изменит параметризацию векторного поля. Вычисляя скобки Ли (коммутаторы) векторных полей Хх (jc),...,ATm+1 (*), получим (в координатной форме) [Ax,bj](x)=-AbJ,[bi,bj](x)=0;
Глава 1. Синтез САУ методами дифференциальной геометрии 65 [Ax,[Ax,bj]](x) = -A2br [bj[Ax9bj]](x) = 0 и т.д. По теореме Кэли - Гамильтона алгебра Ли I(D) управляемых векторных полей включает в себя постоянные векторные поля A'bj9 i = 0, л -1, j = 1, т. Данная система является аналитической, так что согласно теореме Хермана - На- гано [37] существуют максимальные интегральные многообразия множества D, проходящие через каждую точку xeR". Ранговое условие управляемости (1&36) приводит к хорошо известному критерию Калмана гапк{В;АВ;...,Ап"1в} = л. Несмотря на то, что ранговое условие управляемости (1.236) определяет слабую локальную управляемость, для линейных систем оно определяет и их полную управляемость [37]. • 3. Рассмотрим линейную нестационарную систему x = A(t)x + B(t)u, xeR\ ueRm, (1.239) где A[t)yB[t) - гладкие функции переменной /. Введем дополнительную переменную х0 = t и перепишем уравнение( 1.239) в виде xQ = 1. х = А(хо)х + В(хо)и. (1.240) Построим алгебру для векторных полей D = {(l^(x0)x)T)(0,6l(x0))T,...,(0,ftm(x0))T} = {Xl(x0)Jc))...,Xm+I(x0^)}. Сформируем алгебру Ли I(D) 0 ['••*лм-[и^)Ц,. о о l—bJ(x0)-A(x0)bJ(x0) , j,k=\,m. ; y = i,w; Из этих выражений видно, что ранговое условие управляемости (1.236) для системы (1.240) эквивалентно следующему требованию (достаточное условие управляемости): rank(B{t);DAB{t);D2AB(t);...) = n (1.241) для каждого / е R , где DAB(t)=-B(t)-A(t)B(t), (1.242) (1.243) D'AB(t) = [j-rA(t)yA-lB(t). Условие (1.241) будет и необходимым, если A(t)x,bx(t)9...,bm[t) - аналитические векторные поля. Пример 1.17. Проанализируем управляемость линейной нестационарной системы вида Х = 2 2 й<" (1.244)
66 Методы современной ТАУ. Часть IV Решим задачу управляемости сначала классическим способом с использованием граммиана управляемости ^M)-Hwi)b(0bt(0*tM<*. о где Ф(*,*о) - (ф(/0,/))~ - переходная матрица состояния для системы (1.244). Для матрицы (1.245) А« = 1 / 2 I t1 0 2 t j переходная матрица управляемости имеет вид [1]: Ф(','о) = 'п U 4 ,0</0£/, что дает Ф('о.<) = 1 J к t 0 tl Кроме того, из (1.244) имеем в(0 = 0) Подставляя (1.246), (1.247) в формулу (1.245) получим И<о,'») = /о—*" 8 1 2/02 з"/о з/,3 is/о"/, arf'ftfj (1 246) (1.247) (1.248) Если система (1.244) управляема, то для /, > t0 матрица W(tQitx) должна быть положительно определенной. Чтобы проверить это, в формуле (1.248) сделаем подстановку /, =а/0 , где а>1 . После замены граммиан (1.248) примет вид ' 'о(а-0 W(tQiat0)-- 2^1 3 а + 3а3 ^З"а + 3а3 foll5 а + 3а3 5а5 J, Проверка матрицы W(tQiato) на положительную определенность по критерию Сильвестра дает: Д,=/0£(а-1)>0, л (8 7 7 1 W89 1 10 1 > Л д, = -—а+—+ j + —г - —+—7 + —г + —г >0- ~ \\5 За 15а4 5а5J \45 За2 9а3 9a6J Матрица W^ (/0, /,) - положительно определена (0 < г0 < /,). Это говорит о том, что система (1.244) полностью управляема. Проверим теперь управляемость системы (1.244) по алгебраическому критерию (1.236). Используя выражения (1.243), (1.247), получим •*)=(;> ед. ^в(0=|в(0-а(»)в(»)=- 'I о L 1 (i> ( П \t = Хг{х).
Глава 1. Синтез САУ методами дифференциальной геометрии 67 02в(О=Ц-А(,))о,в(,)=(4-а(о| ч/ V г ( 2 \ 10 u = р,Х1(дС)-р2Х2(л:) = [Х„Х2](д:) Отсюда делаем вывод, что базис алгебры /(D) составляют векторные поля Х^х) и Л^дг). Проверка рангового условия rank/(£>) = rank 1 -j = 2 = я , для / > 0, значит система полностью управляема, что совпадает с ранее полученным результатом. 4. Управляемость билинейных систем. Билинейные системы (БС) описывают динамику многих систем в науке и технике. Уравнения описывают динамику управляемых объектов электроники, химии, биологии, экономики, теплофизики, квантовой механики и имеют следующий вид: *(о4л+У>Л'и]*(>)> 1 ' [ U ) (1-249) y(*)=Cx(t)9 где xeR£ =R" -{0}, С -матрица /хя, ut{t) - скалярные функции, Л, В -матрицы пхп. Из уравнения (1.249) видно, что БС могут служить моделями систем с переменной структурой. В качестве гладкого многообразия для системы (1.249) рассматривается пространство Щ . Сформулируем алгебру Ли I(D) для совокупности векторных полей D = Iax,B,x, i = 1,/wl. Скобки Ли (коммутатор) имеют вид [Нх,Кх] = (НК-КН)х = [Н,К](х) для любых Нх,Кхе D . Тогда /(D) = {^^;ZJ2^;...;^^;[^^i]^;[^H,^]]^;[^H,^]]^;...}. (1.250) Вид алгебры /(£>) говорит о том, что все векторные поля получаются умножением некоторой матрицы размера пхп на один и тот же вектор дге R£ . Из этого можно заключить, что алгебра /(£>) изоморфна (взаимнооднозначный гомоморфизм) подалгебре L алгебры Ли gl (n,R) всех вещественных матриц размера пхп, где в качестве операции умножения (•) используется коммутатор квадратных матриц RrR2=[R,9R2] = R{R-R2R]9 (1.251) где /?,,/ = 1,я е gl(n,R) - произвольные матрицы. Восстановить группу G, которая действует на /^ , по ее алгебре I(D) можно с помощью экспоненциального отображения (см. §1.6) G = {exptX:Xel(D)}. (1.252)
j>8 Методы современной ТАУ. Часть IV Свойство управляемости для БС связано с транзитивностью группы G на R% . Говорят, что множество матриц Q транзитивно на R% , если для любых х, у е R£ существует матрица РeQ, такая, что Рх = у . Транзитивность матричной алгебры означает, что любой линейный базис этой алгебры C\,C2,...,CW,т < п удовлетворяет условию гапк/({С1д:;С2д:;...;Сшдс}) = « для всех хе/?£. (1.253) Для однородных билинейных систем (А = 0) транзитивность алгебры Ли является необходимым и достаточным условием управляемости на /?J [44]. Для неоднородной билинейной системы (1.249) транзитивность матричной алгебры L - это условие только необходимое. Во многих работах рассмотрены и достаточные условия управляемости для билинейных систем (подробнее см. обзор [2]). 5. Выделение базиса и проверка управляемости нелинейных систем общего вида. Рассмотрим систему уравнений ^- = fi(x9u), (1.254) at где х = (х{,...,хп)е Мп,u = (u]9...,um)eQ<z Rm . Функции fi(x9u) полагаем такими, что при каждом допустимом управлении u(t) существует единственное решение, проходящее через точку дс0. Ранее было показано, что движение системы происходит в том, что здесь есть управляющее воздействие и, которое входит нелинейно и параметризует векторное поле Х(х), координаты которого при фиксированном управлении и в каждой точке описываются вектор-функциями (yj (дс,£Г),/ = 1,...,л?). Иногда удается за конечное число шагов выделить базис и для параметризованных векторных полей. Рассмотрим процедуру построения такого базиса. Введем оператор Х = £/,{х>«)^- (1-255) и рассмотрим этот оператор как семейство, параметризованное управлением и. Придавая управлению и различные постоянные допустимые значения и е Q, получаем операторы семейства. Выделим в этом семействе базис, т.е. подставим в (1.255) такие допустимые управления ir1',ir',-,и , что операторы /=1 Я*/ где £>iJ(x)=fi(x9uu)}, п^ =lu{J\...9uJjA9 j = Up - линейно не связаны, а подстановка в формулу (1.255) любого другого допустимого уравнения приводит к оператору, который линейно связанно выражается через ХХ,Х29...>Хр Х = £ц,(*,1<)Х7.. (1.257) Процесс выделения базиса сводится к исследованию на линейную зависимость. Подставляем в (1.255) любое допустимое значение и1 и решаем задачу: найдется ли такое допустимое управление и, что ранг матрицы размера их2
Глава 1. Синтез САУ методами дифференциальной геометрии 69 (Л(х,и) /;(*>«(1)Л rank = 2. Если такое и = ir2' е Q находится, то решаем задачу нахождения такого и е Q, что ранг матрицы размера п х 3 '/,(*,«) а(х,^) fi(x,&f rank = 3 ^(дси) /Я(*,Я«) Л(*,В<2))^ . и т.д. Если на некотором шаге р для любого и е Q ранг матрицы '/,(*,«) /if*,*05) - A(x,n{p)f rank </> + !, то это означает, что левый ее столбец линейно связанно выражается через остальные. После выделения базиса Xj9 j = 1,2,...,р, он пополняется, в результате чего возникает полная система операторов Хх,Х2->~.,Хк\к <п (не путать с полным векторным полем). Таким образом, каждой точке х е Мп ставится в соответствие полная система операторов Хх,Х2,».<>Хк, но, вообще говоря, в разных точках может быть свое число операторов. Определение 1.27. Динамическую систему (1.230) будем называть регулярной [13], если в каждой точке jc e M" рассматриваемой области один и тот же набор постоянных допустимых управлений «'%..., lvp' выделяет базисные операторы и пополненная система X]fX29'.',Xk состоит из одного и того же их числа к операторов. Заметим, что полная система операторов для регулярной системы формирует конечномерную алгебру Ли и, более того, т.к. базис остается одним и тем же для всех х е Мп , можно сделать вывод о том, что полная система операторов для регулярной системы формирует инволютивное распределение А* размерностью к < п (см. определение 1.25). Пример 1.18 [13]. Рассмотрим систему управления d*\ 2 -^- = щххх2+х2ъи2, cbc7 - = «1*1. dt dx3 -£ = *2«2, Ы*1. |*2|<1. (1.258) Для такого класса систем, которые называются аффинными системами управления (т.е. системы, линейные по управлению), имеются другие критерии управляемости в случае, когда и,, / = 1,2 неограниче- ны. Здесь же мы рассмотрим предложенный выше алгоритм. Рассмотрим первый оператор для «W:«<"=0,5<"=l: -, 1 О \j 'а*
^70 Методы современной ТАУ. Часть IV Второй оператор для и® • ti^ = 1, п^ = 0: v _ д д Проверяем их линейную несвязанность: , f х-уХ-х 0 х71 п rank 23 2 =2,если хгх2*0. \Х\Хг х\ °) Третий оператор для i/(3): wf3) = -1, п^ = 0: v - д д Проверка линейной несвязанности: rank хгх\ 0 х2 ххх2 х, 0 = 3, если д:, • х2 * 0. -х{х2 х, 0 Система операторов ХЬХ2,ХЪ является полной. Действительно, при любых допустимых управлениях и,,и2 оператор X выражается линейно связанно через ХиХ2,Хъ (это инволютивная система для области х1х2 * 0) в виде Х = щХ, + Х-(их-и2)Х2-±{щ + и2)Хъ. Полная система операторов позволяет судить об управляемости системы (1.254) по наличию у нее первых интегралов. У системы уравнений Ху(о(^) = 0,у=п (1.259) имеется (n-к) функционально независимых инварианта, которые являются первыми интегралами для системы (1.254). Если у динамической системы (1.254) есть первый интеграл co(jc), тогда пространство Rn расслаивается на (п-\)-мерные инвариантные поверхности со(д:) = С: если начальная точка принадлежит поверхности со(д:) = Со , то при любом управлении u(t) траектория *(/) будет оставаться на этой поверхности. Следовательно, наличие у динамической системы первого интеграла исключает полную управляемость. Из этого следует следующая теорема. Теорема 1.11 [13]. Динамическая система управления (1.254) управляема тогда, когда система операторов Хх> АГ2,..., Хк , полученная в результате пополнения операторов Х\,Х2>—> Хр , содержит п операторов, т.е. к = п. Рассмотренный выше пример не имеет первых интегралов (инвариантов), поэтому она управляема в локальной окрестности некоторой точки хх ф 0,х2 * 0. Замечание 1.7. Фактически теорема 1.11 - это другая формулировка рангового условия управляемости (1.236), где полная система операторов {Х1,Х2,...9Хк,к = п) получена для системы управления общего вида: vwfc{XuX2,...,Xk}u=r*nkl(D) = n. 1.11. НАБЛЮДАЕМОСТЬ В НЕЛИНЕЙНЫХ СИСТЕМАХ 1. Рассматривается динамическая система управления общего вида
Глава 1. Синтез САУ методами дифференциальной геометрии 7j_ где и е Q с Rn\ х е М" - гладкое многообразие (фазовое пространство) размерности п, у е R\ f и g - гладкие функции. Наблюдаемость системы ^ отражает возможность по наблюдениям за вектором выхода y(t) однозначно восстановить вектор состояния x(t). Отсутствие полной наблюдаемости возникает в случае неоднозначности восстановления, т.е. когда одному и тому же выходу y(t) соответствует два и более состояния jc1 (/), х2 (/). Система ^ определяет следующее отображение: для каждого допустимого входа {и (0 > 1Уо А ]) и начального условия jc(/0 ) = х0 дифференциальное уравнение д: = /(л:,1/(/)) определяет решение (■*('), ['о >'il) с заданным начальным условием, которое, в свою очередь, формирует выход {у(*),[(о>*\]) согласно соотношению .КО = g{x{t)) • Обозначим это отображение как 2,0 :(«(<).['<>>'.])-*CK'UW.])- (1-261) Определение 1.28. Будем говорить, что пара точек х0 и Jc0 неразличима (обозначение: хо1хо), если для каждого допустимого управления (w(^),[^o,^]) имеем Ч (u(t),[t0A]) = 4 {«ШМ])> (1-262) т.е. при одном и том же входном воздействии и(/) и разных (в общем случае jc0 ф Jc0) начальных условиях выходные сигналы (j>(')>lA)>'i]) совпадают. Неразличимость / (как некоторое отношение на М") определяет на множестве Мп отношение эквивалентности. Действительно, это отношение удовлетворяет аксиомам эквивалентности: 1) a:0/Jc0 , рефлексивность, 2) jco/jco о хо1хо, симметричность, 3) если хо1хо, a jco/Jco , то jco/jco , транзитивность. Данный подход позволяет нам дать следующее определение наблюдаемости. Пусть 1(х0) обозначает класс эквивалентности (т.е. множество элементов МЛ, которые эквивалентны по отношению / элементу jc0 ) х0 е Мп. Определение 1.29. Говорят, что система ^ наблюдаема в точке д:0, если 1(хо) = {хо), т.е. класс эквивалентности (неразличимости точек) состоит из одной точки д:0. Если /(*) = {jc} Va: е Мп, то система ]Г называется наблюдаемой. В отличие от линейных стационарных систем, где понятие наблюдаемости является глобальным понятием и определяется только видом матриц А и С (jc = Ax + Bu;y = Cx + Du)9 для нелинейных систем необходимо ввести локальное понятие наблюдаемости. Определение 1.30. Пусть U - это некоторое подмножество Мп и xo,xoeU. Будем говорить, что точка х0 U -неразличима от хо(хо1ихо), если для каждого управления (w(/),[/o^il) траектории (*(/),I/o>'i])> (Jc(/),[/0,/1 ]), начинающиеся
12 Методы современной ТАУ. Часть IV соответственно в точках хои х0, обе лежат в £/,т.е. x(t)eU , x(t)eU для [/0,'i], и при этом Me(').[<o.'i]) = Me('MWi])- (1-263) ^/-неразличимость 1и в общем случае не является отношением эквивалентности (в отличие от глобального отношения /). И в основном не выполняется аксиома о транзитивности [37]. Поэтому вводят понятие локальной наблюдаемости. Определение 1.31. Система ]Г является локально наблюдаемой в точке х0, если для каждой открытой окрестности U точки дс0, 1и (xQ) = {x0) . Система ^ является локально наблюдаемой, если она локально наблюдаема в каждой точке х е Мп. С другой стороны, понятие «наблюдаемость» можно ослабить, т.к. на практике достаточно различать точку дс0 не от всех точек многообразия М", а только от ее соседей. Поэтому введем следующее определение. Определение 1.32. Система ]Г называется слабо наблюдаемой в точке jc0, если существует окрестность U точки д:0, такая что l(xo)nU(xo) = {xQ). Система ^ - слабо локально наблюдаема, если это условие выполнено в каждой точке л: е Мп. Локальный вариант этого вида наблюдаемости может быть определен следующим образом. Определение 1.33. Система ^ -локально слабо наблюдаема в точке д:0, если существует открытая окрестность U точки jc0 , такая, что для каждой открытой окрестности V[x0) точки х0, V(xo)q U(x0), Iy (x0) = {xq} , и называется локалъно слабо наблюдаемой, если это условие выполнено для каждой точки х е Мп. Другими словами, ^Г является локально слабо наблюдаемой, если можно мгновенно различить каждую точку от соседней. Между различными видами наблюдаемости существует следующая связь (рис. 1.12). ^ локально наблюдаема => ]Г наблюдаема ]Г локально слабо наблюдаема => ^ слабо наблюдаема Рис. 1.12. Виды наблюдаемости в нелинейных системах Эти соотношения справедливы для нелинейных систем, но для линейных стационарных систем можно показать, что все 4 вида наблюдаемости совпадают [37, 47]. Как для локальной слабой управляемости нелинейных систем ранее был получен алгебраический критерий, так и для проверки локальной слабой наблюдаемости имеет место простой алгебраический критерий. Обозначим через Lx производную Ли вдоль векторного поля Х(х), т.е. для вел* кой гладкой функции q>(je), определенной на многообразии Мп, имеем Хф(*).А»(»(*))-ЙЙ,ДГ(лг)1 (1.264) *м - («. м.ь м i. «)т .*£Ч*& ^1. дх [ дх{ дхп
Глава 1. Синтез САУ методами дифференциальной геометрии 73^ (v) - скалярное произведение векторов. Обозначим через dq> градиент —.Пусть fJ (x) = f(x,u^ ) определяет вектор- ное поле на многообразие М" для некоторого постоянного управления sO)=fc0) jiWf / = 12 Из теории линейных систем известна дуальная связь между управляемостью и наблюдаемостью. Для нелинейных систем эта связь проявляется как дуальность между векторными полями и дифференциальными 1-формами (подробнее см. [18]). Покажем, как наблюдаемость определяется через 1-формы. Пусть F0 обозначает подмножество гладких функций на многообразии М", состоящее из функций g\(x),...,gl(x):Jr° = {g, (*),/ = 1,/} , и пусть Т определяет наименьшее линейное подпространство гладких функций С00 \М" J, которое замкнуто относительно дифференцирований Ли векторными полями I(D) множества Т . Элемент Т является линейной комбинацией функций вида V(-(M*'■))••)■ (1265) Если обозначить fl =Xuf2 = Х2,..., то для любых Xi9Xj e I(D), [Xi9Xj]e I(D) имеем LXi (LXi (ф))-1Х2 (LXi (ф)) = V,^] (ф)' С-266) где [AT,, АГ2 ] - скобка Ли (коммутатор) операторов Xl9X2. Ранее нами получено, что l(D)(x) = Ap(x)<zTMnx, (1.267) где A/7(jc) - распределение размерности /? в точке jc, TM" - касательное пространство к многообразию Мп в точке х. Элементами ТМ" являются касательные векторы Х(х) (х - фиксировано). Если рассмотреть действие оператора X (мы отождествляем касательные вектора с соответствующими им дифференциальными операторами) на функцию (p(jc) е С00 \Мп\ и зафиксировать ф, то возникает линейный функционал на пространстве ТМ" :Х(х)-+ Х(ц>)(х). Этот функционал обозначается символом d<p(x). По определению d<p(X)(x) = X(<p)(x). (1.268) Элемент d(p(x) принадлежит ТМ"* - сопряженному с ТМ" пространству. ( д Т Пусть — - базис в ТМ" , a dx - дифференциал функции х; (х), тогда согласно (1.268) имеем ( Y7 ( \ dxt = х, = 8„ (символ Кронекера). (1.269)
_74 Методы современной ТАУ. Часть IV Следовательно, {А,}"=1 - двойственный к < — > базис в ТМ"*. Отсюда следу- ет, что ТМ"* (х - фиксировано) состоит из всевозможных линейных комбинаций ^tf/A, \ с вещественными коэффициентами. Для произвольной функции ф(д:) е С00 Шп ) и оператора X = ^£, (д:)— имеем соотношение d9(X)(x) - Х(Ф)(х) -1§, (x)^i . (1.270) Это соотношение, названное нами выше производной Ли функции ф(дс) применительно к дифференциальным формам, называется значением линейной дифференциальной 1-формы со = af(p на векторе X в точке д:: со(Х) = ^ф(Лг)(д:) [18]. Найдем явную формулу для dq>. Имеем *=&/(*)■£■• о-271) Используя соотношения (1.268), (1.269), получим dxt (X)(x) = dx, {fj-j (x)^-\ = %t (х). (1.272) Подставляя левую часть (1.272) в (1.270) вместо £7 (х), найдем МХ)(х)-\±^Ь,ух)(х). (1.273) В силу произвольности Х(х)еТМ" имеем Получен полный дифференциал функции ф(дс). Полный дифференциал функции Лр является частным случаем более общего дифференциального геометрического объекта, а именно дифференциальной 1-формы, общий вид которой следующий ю-!>,(*) А,, О-275) где а, (х) - гладкие функции на М". Элементы множества ТМ"* называются ко- векторами в точке х е Мп . Вернемся к рассмотрению слабой локальной наблюдаемости. Обозначим подпространство J(F)(x)<zTMnx* -подпространство дифференциальных 1-форм (с/ф:фе^*). Производная Ли Lx(ty){x) показывает, как воздействует векторное поле (дифференциальный оператор) X на гладкую функцию ф(:к).
Глава 1. Синтез САУ методами дифференциальной геометрии 75_ Рассмотрим, как действует дифференцирование Ли на дифференциальные 1-формы. Пусть со - дифференциальная 1-форма вида (1.275), тогда имеет место формула [3] Lx (со)(д:) = d((o(X))+ d<x>(X). (1.276) Если со = ^ф, т.е. это полный дифференциал или точная форма, то согласно лемме Картана[12] d(u = d(dy) = 0. (1.277) Поэтому формулу (1.276) с учетом (1.277) можно записать как Lx(dq) = d(Lx(<p))9 (1.278) т.е. операции дифференцирования Ли Lx и d (так называемое внешнее дифференцирование) перестановочны. Из этого следует, что J^F) является наименьшим линейным подпространством дифференциальных 1-форм, которое замкнуто относительно операции дифференцирования Ли элементами I(D). Элементы J^) - конечные линейные комбинации дифференциальных 1-форм для функций множества Т d{lf (...(l,. (&))••))= Lfl (...(Lft (dg,))..), (1.279) где по-прежнему /' (jc) = f(xfu^1' j для некоторых постоянных управлений и>1' е Q. Ковекторное пространство J[Jr)(x) определяет локальную слабую наблюдаемость системы ]|Г в точке д:0. Определение 1.34. Говорят, что ^ удовлетворяет ранговому условию наблюдаемости в точке jc0 если размерность пространства J(Jr)(x0)равна и. ^ удовлетворяет ранговому условию наблюдаемости, если это условие справедливо для каждого jc е Мп. Теорема 1.12 [37] (о локальной слабой наблюдаемости). Если ]Г удовлетворяет ранговому условию наблюдаемости в точке д:0, тогда ]Г локально слабо наблюдаема в точке д:0. Доказательство. Для доказательства теоремы используем следующую лемму. Лемма 1.2 [37]. Пусть V - некоторое открытое множество Мп . Если д:0, jco e V; хо1ух0, тогда ф(л:0) = ф(jco) для всех ф е Т. Если размерность dimУ(^*)(д:0) = «, тогда существует п функций ф^фз,..., ц>пе!Г, таких что дифференциалы dty (xo),dq>2{xo)>—>^Фи(-^о) линейно независимы. Определим отображение: Ф:д:-^(ф1(д:)...фДд:))Т. Якобиан отображения Ф в точке д:0 невырожден, т.е. .д(Ф.(*)-фД*)) rank- d(Xl...xn) X=Xq поэтому по теореме о неявной функции [10] отображение Ф взаимнооднозначно отображает открытую окрестность U точки д:0. Если V(xQ)czU(x0) - открытая
76 Методы современной ТАУ. Часть IV окрестность точки jc0, тогда по лемме 1.2 1у(хо) = {хо}9 так что ^ является локально слабо наблюдаемой. 2. Рассмотрим хорошо известную задачу наблюдаемости для линейных стационарных систем. Имеем систему управления д: = Ах + Ви9] у-СХ. } (1280) Обозначим через С,* - /-ю строку \хп матрицы С, т.е. д>,=С,.*, / = п. (1.281) В соответствии с (1.260) имеем ft(jc) = C^Jc, i = M 0.282) При выводе условий управляемости получено, что алгебра Ли I(D) для системы (1.280) формируется векторными полями <Ах, Albj : / = 0, п -1, j = 1, т |, где bj - у-столбец матрицы В. Пусть /o(D)(jc) = span{Ac,^*y:i = O,/i-l,y = ui}, (1.283) где span - линейная оболочка векторов Ax,A'bj ... в точке д:. Найдем линейное пространство J(P) дифференциальных 1-форм, получаемых дифференцированием множества функций ^ = {a(*),..,g,(*)}={c,.x, / = U} (1-284) векторными полями /0 (D)(x). Имеем М^*) = Е1Х*У^ £СЛ | = ZS^A =С/И^ / = U (L285) Тогда общая формула дифференцирования Т вдоль векторного поля Ах будет L^ (ct.AJx)= СрА'+1х, j = 0,1,... • (1.286) По аналогии получим выражение для дифференцирования вдоль векторных полей A'bj. Имеем ЬА^{с^Акхус^кЬг (1.287) что приводит к следующему результату L^faA'bj^CpA'bj =0, / = 0,1,.... (1.288) Тогда пространство гладких функций Т, замкнутое относительно дифференцирований Ли Lx (Х е /0 (D)), с учетом теоремы Кэли - Гамильтона имеет вид Т = span fcj*Akx, C^Akbi :/ = Ц j = ппЛ =0,«~l|. Построим алгебру дифференциальных 1-форм для функций пространства Т . Для каждой точки х е Мп имеем j(f)(x) = df(x) = span{Cl.Ak :i = V, *=0f/i-l}f (1.289) т.к.
Глава 1. Синтез САУ методами дифференциальной геометрии 77_ d(ci*Akx) = Cl*Ak; В силу того что базис пространства (1.289) не зависит от jc , то он имеет постоянную размерность. Ранговый критерий наблюдаемости (теорема 1.12) rankJ(F) = rank\с^Лк : / = U, к =0,«-l} = п (1.290) приводит к известному критерию наблюдаемости Калмана. Замечание 1.8. Элементами J(Jr) как ковекторного пространства являются дифференциальные 1-формы-вида А^)==\^(Сф4)^Л-0^Л, / = UL (1.291) [7=1/7=1 J где akpi -элемент apj(p = \,n, j = 1,л)) матрицы Ак, к = 0,л-1. Всего в J{F) nx\ дифференциальных 1-форм. 3. Линейные нестационарные системы. Как и в задаче управляемости, добавим к вектору состояния дополнительную переменную х0 =t, получим х = А(хо)х + В(хо)и, У = С{хо)х. Рассмотрим два векторных поля: (1.292) Дифференцирование функции yi=Ci(x0)xf / = 1,/ вдоль векторного поля Х}(х) дает нам | ( rs П П Я | /1 | П Я LxC,(x0)x= _ + ^^(xo)xy— ХСф(^о)^ =£т-С/рЫ*л + ^ar0 M>l ar^j^, j л.,&о (1294) Аг=1 у=1 Обозначим через П П ( Q \ + miakj{xo)xjCik{xo)=\^-Ci'(xo) + C,(x0)A{x0) \х, i = l,l. k=\j=i K^o ) DAC(x0)J-£-C(x0) + C(x0)A(x0)\ (1.295) Тогда (1.294) можно переписать в виде LXi(C(x0)x) = DAC(x0)x. (1.296) Дальнейшее дифференцирование функции DAC(x0)x приводит к реккурентной формуле (LXi(...(LxC(xo)x))) = LkXiC(xo)x = DkAC(xo)x = * (1.297) = {^-DA->C(xo) + DA->(c(xo)A(xo))y
78 Методы современной ТАУ. Часть IV Так как векторное поле Х2 (х) не зависит от х, то при формировании линейного пространства J{F) (кораспределения) дифференциальных 1-форм J(F)(x) = dF(x) необходимо учитывать только функции вида (1.297) (см. формулу (1.289) для стационарного случая), поэтому ранговый критерий наблюдаемости (теорема 1.12) для системы (1.292) приводит к следующему критерию наблюдаемости: DAC(x0) D2AC(xQ) rankj(^*) = rank DkAC{x0) -п. (1.298) Перепишем условие наблюдаемости (1.298), заменив переменную jc0 на /. Получим ( c(t) ) DAC(t) D\C{t) гапкУ(^г) = гапк DkAC{t) = n, где /)^c(/)-Jc(0+c(/H(/), ^с(/) = -|(^-1с(/))+(1)Гс(/))^(0, (1.299) Л = 1,2,... . 4. Рассмотрим практический пример применения рангового критерия наблюдаемости для нелинейной системы. Пример 1.19. Наблюдаемость в нелинейной системе. Рассмотрим следующую систему 3-го порядка: Х2=-*1Х3, *з=0, >> = *!• Определим необходимые элементы (л = 3, / = 1). Векторное поле (как дифференциальный оператор), определяющее динамику системы дх} дх2 дхъ Множество функций Т* = {g, (x)} ={х1}. Сформируем пространство функций Т : , ( \ ( д д) ^ йх, дх2) (д д ^ *2*3 д ХХХЪ— кдг3 =~Х]Хз, ах{ ахг )
Глава 1. Синтез САУ методами дифференциальной геометрии 79^ 4',(gl(*)H*2*3-I *1*3— (-*!*>)= *2*?; ^ охх dx2) 4,(g,(A:)) = U^^--^^— 1(-*2*з) = *1*з3; Сформируем из полученных функций Т пространство J(F) дифференциальных 1-форм ^{^В1(х)) = х3сЬс2+х2сЫ3- d[L2Xtgl(x)) = -x3dxl-xldx3; d{^xxS\ (*)) = -*? А* -2хъх2сЬсъ\ d(L%gl(x)) = xldxl+3xlx23ch3- d[L5Xy g, (*)) = x\dx2 + 4x2x3dx3; Для проверки рангового условия сформируем матрицу Мс из коэффициентов (гладких функций) полученных дифференциальных 1-форм: 'О ,3 -дг3 0 -д;, К с- О -*J -2хъх2 х\ О Здг^з2 . О х$ Ах2х\ w Из анализа данной матрицы видно, что rank Мс < 3, если либо дг30 = 0 , либо дг10 = х20 = 0 , где Xjo,jc,0,jc20 -точка, в окрестности которой рассматривается наблюдаемость данной системы. Исходя из полученных соотношений можно определить области слабой локальной (в том числе м локальной) наблюдаемости. Например, I: дг30 >0;х10 > 0; II: jc3o <O;*io >0- 1.12. ЛИНЕЙНЫЕ ЭКВИВАЛЕНТЫ НЕЛИНЕЙНЫХ СИСТЕМ. СИНТЕЗ НЕЛИНЕЙНЫХ РЕГУЛЯТОРОВ Проблема построения регуляторов для нелинейных систем в отличие от линейных все еще далека от решения. Тем не менее идея использования хорошо разработанной теории построения линейных регуляторов для нелинейных систем остается весьма притягательной и актуальной. Главная сложность здесь - найти диффеоморфизм (гладкий изоморфизм) между исходной нелинейной системой и некоторой линейной системой. Здесь будет показано, что наличие преобразования, позволяющего перейти от нелинейной системы к линейной, сводится к условию существования группы симметрии для нелинейной системы управления. В [7] получено, что для автономных управляемых систем dx/dt = f(x,u) группа симметрии действует на множестве решений данной системы, если диффеоморфизм имеет следующую структуру: и' = и'(х,и), х' = х'{х) , где (х,и) - старые локальные координаты и управление, (х\и') - соответственно новые. 1. Постановка задачи. Рассматривается класс нелинейных динамических систем линейных по управлению, класс так называемых аффинных систем
$0 Методы современной ТАУ. Часть IV dx/dt = X(x) + uY(x)9 хеМ", ueR\ Y(xo)*O9 (1.300) где Мп - гладкое многообразие размерности л, д:0 - равновесная точка, Х(х), Y(y) - гладкие векторные поля на М\ Х(х) = [Ъ(х),...Л„(х)]\ ¥(х) = [щ(х),..,Цп(х)]7 ■ Если векторные поля рассматриваются как дифференциальные операторы g гладких функций, определенных на многообразии Мп , то они представляются в виде (см. пункт 1.2.4) х-±ь(х)±;Гш£ц,(х)±. ы\ dxi /=1 о^- Ставится задача: найти преобразования для гладкой замены координат у = у{х) и управления v = v(jc,w) (статическая обратная связь), такие, что система (1.300) приводится к некоторой изоморфной ей системе вида dy/dt = Acy + Bcv, (1.301) где Ас, Вс -матрицы канонической формы Бруновского [19, 32]. 2. Линейные эквиваленты. Каноническая форма Бруновского имеет следующий вид dy\/dt^y29 , _ (1.302] dyn^/dt = yn9 dynldt-\. Таким образом, если известно некоторое преобразование ух = 7J (х), то последующие преобразования yi = 7](дс), / = 2,а? можно получить последовательным дифференцированием функции Т{(х) вдоль векторного поля (Х(дс) + иК(дс)),т.е, нахожде нием производных Ли функции 7] (*) вдоль векторного поля (X(x) + uY(x)). Система дифференциальных уравнений, определяющих преобразование 7] (*) Имеем т.к. у2=Т2(х) не зависит от управления и и поэтому У(Г,(дс)) = О. (1.304 Аналогично получаем dy2 Idt = у, - LX+H,X(TX (*)) - X2 (Г, (х))+и¥(х(Ц (*))) = X2 (Г, (*)). (1.305 соответственно F(JV(7J (*))) = 0. (1.306 Заметим, что в формуле (1.305) и ниже под ^(^(дс)) понимается производна Ли/-го порядка функции 7j(:t) вдоль векторного поля Х[х)
Глава 1. Синтез САУ методами дифференциальной геометрии 81_ Х'(7|(х))-Л'(х(..ЛГ(7'1(х))...)) Продолжая находить производные Ли более высоких порядков, получим dyn-ildt = yn = Lx+uYXn-2(Tx{x)) = = Х»-'{Тх{х)) + иУ(х»-*{Тх(х))Ух^{Тх{х)). (1'307) Итак, из (1.304), (1.306) и (1.307) имеем ■ Y(x'(Tl[x))) = 0, i = 2,и-2, (1.308) dyn/dt = v = Lx+uYXn-i(Tl{x)) = Xn{Tl{x)) + uY(x"-\T,(x))). (1.309) Для того, чтобы из (1.309) определить и, необходимо обязательно выполнить условие Г^""1 (7] (*)))* 0. (1.310) Из анализа (1.308) - (1.310) можно сделать следующие выводы. Преобразование (невырожденная замена координат) ух = 7] (дс) определяется из решения системы линейных дифференциальных уравнений в частных производных (1.308), (1.310), т.е. y(xi(T1(x))) = 09 1 = 2^=2, (1.311а) Г^""1 (7] (*)))* 0. (1.3116) Остальные координаты получим из (1.303), (1.305), (1.307), т.е. Л=ХМ(ВД),1=2^. (1.312) Формулу (1.312) можно записать в более привычной форме yi=Tl(x)=X(ri_l(x))=(dTi_l(x)/dxiX{x)),i = 2^9 (1.313) где (d,r) - скалярное произведение векторов dи г. Теорема 1.13. Для аффиных систем (1.300) система дифференциальных уравнений в частных производных (1.311), из которой находится преобразование 7^(л:), эквивалентна системе дифференциальных уравнений в частных производных первого порядка, определенных последовательным дифференцированием векторного поля Y[x) вдоль векторного поля Х[х) и последующим дифференцированием функции Тх[х) вдоль полученных векторных полей, т.е. (ad',F)(7i(*))=0, / = M^2, (1.314а) (ad7lF)(r1(^))^0, (1.3146) где ad^F - производная Ли векторного поля аё/^1К(д:) вдоль векторного поля Х[х), причем для / = 0: ad°xY{x) = Y(x), , = i adxY(x) = LxY(x)=(XY-YX)(x)={X,Y](x) = = ((dY(x)/dx)X(x)-(dX(x)/dx)Y(x))(x), i = k: adxY(x)=Lxad^Y(x)=[xMlx1Y(x)], здесь [X,F](x) - скобка (коммутатор) Ли векторных полей Х(х) nY(x). 7 Зак 416
J$2 Методы современной ТАУ. Часть IV Доказательство. Доказательство проведем по индукции. Для / = 0: ad^ Y(Tx (л:)) = К(Г1 (л:)) = 0 и первые уравнения (1.311) и (1.314) совпадают. Для (ad^F)(7-1(*)) = IrF(7-I(*))-(^-Hf)(7-,(JC)) = ^(хХг(т1(х)))уг(х(т1{х)))ш-г(х(т1{х))). т.к. К(Г,(д:)) = 0. Выше было использовано свойство производной Ли ^](Г.(*)) = [^,^](7-1(*))[3]. Исходя из определения скобок Ли и непосредственными вычислениями можно показать, что для (аЧхг)(Тх(х)) = 1х(^г)(Т,(х)) = = t(-iyc)Ar^KY^(7'1(x))=(-i)iKv:i(r1(x))=o, ■(1315) 7=о т.к. YXj(Tx(x)) = 0, j = O,k-l, (1.316) причем в (1.315) с)=км(р.{к-]у). Формулы (1.315), (1.316)справедливы для к = 0,п-2. Для к-п-\ (ай"х-'¥)(Т,(х)) = (-1)п-1¥Х"-х{Тх(х))^0. (1.317) Эквивалентность формул (1.311), (1.314) доказана. Функция Тх (л:) определяется из системы линейных дифференциальных уравнений в частных производных первого порядка (1.314), но при этом векторные поля adlxY(x) п = 0,л-2] должны подчиняться условию их совместной интегрируемости - условию инволютивности. Заметим, что при Y(x) = Y = const (ad'<fF)(7-1(*)) = (-l)'(FY')(7-1(jC)), / = 0^1, (1.318) и формулы (1.311) и (1.314) полностью совпадают. Инволютивность. Инволютивность является краеугольным камнем при выводе условий интегрируемости уравнений в частных производных и фактически при этом является синонимом термина «интегрируемость». Подробно этот вопрос мы рассмотрели в §1.10. Говорят, что множество векторных полей ^Xl(x),.,.,Xm(x)] инволютивно, если существуют скалярные поля (функции) aijk[x)y такие, что В этом случае совокупность ^X](x),...iXm(x)] определяет алгебру Ли {х1(д:),...,Лгш(д:)} относительно бинарной операции [•,•]. Фробениус показал [6] (см. теоремы 1.7-1.9), что система векторных полей тогда и только тогда интегри-
Глава 1. Синтез САУ методами дифференциальной геометрии 83^ руема, когда она инволютивна. Сначала рассмотрим только класс так называемых инволюционных систем. Система векторных полей S = (Х} (л:),...,Хт (jc)) находится в инволюции, т.е. векторные поля попарно коммутируют, если XiXJ{z{x)) = XjXl{z{x))i ij = ui или [XhXJ](x) = (XrXJ-Xj-Xi)(x) = O (1.320) для любой дважды и более дифференцируемой функции z[x) [4], т.е. условия (1.320) совпадают с (1.319) для а^ =0. Покажем, что любая инволютивная система векторных полей имеет в качестве канонического (исходного) базиса инволюционную систему, из которой она определяется умножением на некоторые гладкие функции, определяя тем самым то же самое гладкое инволютивное распределение Ая (подпространство касательного пространства ТМ" постоянной размерности, базисные векторные поля которого замкнуты относительно бинарной операции [•,]) размерности/?, что и исходная инволюционная система. Пусть S = {Х1(х),...,Хп_1 (*)} - инволюционная система на подмногообразии V. Пусть из системы S получена новая система 5' = {F1(a:),...,Fw_1(a:)} умножением векторных полей Хх на гладкие функции £,(*), i = \,n-\, не обращающиеся в нуль в окрестности точки xQ. В этом случае Sx определяет то же распределение \_х , но с другой параметризацией [6]. Например, для «-1 = 2 имеем Yx = gx(x)X], Y2 =82{X)X2- ТогДа [К1,К2]/(л:)=(у1(^)К1+у2(л:)К2(л:)+Уз(л:)[Х1,Х2])/(л:) = = Ых)Ух+У2{х)У2(х))А*)> т.к. из (1.320) [Х{,Х2] = 0 . Функции у, (*), / = 1,2,3 находятся из следующих соотношений yl{x)^(-g2{x)X2(gl{x)))/gl(x)9 y2(x)=[gi(x)Xx(g2(x)))/g2(x)9 Уз(*) = g\(x)-g2{x). Видим, что если S = {Хх,...,Хп_1) - инволюционная система на подмногообразии V, то Sx ={F1,...,FW_1} определяет инволютивную систему на том же подмногообразии. Что касается исходной системы S = {Xx(x),...,Xn_x(x)} ={ad^ У(х), / = 0,л-2|, определяющей систему (1.314а), то из вывода уравнений (1.311а) следует, что в общем случае это инволютивная система на подмногообразии V, т.к. из условия Гл^Л^ ]/(*) = 0, \/Xt е Ап_{ не обязательно следует, что Гх,, X Л = 0. Группы преобразований. Вопрос о существовании преобразования у = Т(х), v = v( x9u) для исходной системы (1.300) сводится к проблеме наличия группы симметрии - группы диффеоморфизмов, переводящих решения управляемой системы 7*
JS4 Методы современной ТАУ. Часть IV (1.309) в решения системы (1.301) и наоборот. Здесь основную роль играет теорема С. Ли (аналог теоремы Руффини - Абеля - Галуа о разрешимости алгебраического уравнения в радикалах) о разрешимости линейного дифференциального уравнения в частных производных Az = 0, рассмотренная в §1.8. Эта теорема приводит к следующим условиям наличия у (1.300) группы симметрии: 1) Х,(Т1(х)) = 0, i = l,/i-l, (1.321а) Хп(Т{(х))*0; (1.3216) 2) система S = {Xl(x),...,Xn_l(x)} = ladlxY(<x)j = 0,n-2\ -является инволю- тивной; 3) векторные поля {^(д:),...,^., (д:)} =|ас!/хУ(д:), / = 0,л-1| - линейно независимы в окрестности равновесной точки х0. Формулы (1.321а), (1.3216) в точности повторяют условия (1.311а), (1.3116) или (1.314а), (1.3146), условия 2) выполнены для S и единственным дополнительным условием существования является 3). Если равновесная точка х0 &Q , тогда преобразование ^=7](*)-7iW (1.322) позволяет получить интегральное многообразие, проходящее через данную точку х0. Суммируя вышесказанное, сформулируем основную теорему о наличии линейных эквивалентов у системы (1.300). Теорема 1.14. Нелинейная система (1.300) тогда и только тогда имеет линейный эквивалент - систему (1.301) в окрестности равновесной точки х0, когда выполнены следующие условия: а) система 5' = |ad/v У{х), i = 0,и-2} - инволютивна; б) ad^"1 Y(х) * 0 в точке равновесия и ее окрестности; с) векторы ad'jf Y[x), / = 0, л -1 линейно независимы в точке равновесия и ее окрестности; д) преобразование 7] (л:), полученное из системы дифференциальных уравнений (1.314а), связано с переменной ух соотношением (1.322), остальные преобразования находятся из (1.303), (1.305), (1.307); е) статическая обратная связь определяется из уравнения (1.10) v = X"-I(7'1(x)) + W.ad"x-IF(7i(^))) откуда после нахождения v = v(j») и замены у = Т(х) получим обратную связь в исходной системе и(х)= У l 'J. . /'; ". (1.323) Рассмотрим пример синтеза регулятора. Пример 1.20 [27]. Задан нелинейный объект управления *1=*2> х2 =sinjt, +х3. (1 324)
Глава 1. Синтез САУ методами дифференциальной геометрии 85^ Математическая модель (1.324) описывает движение математического маятника в верхнем неустойчивом положении, при этом хх - угол отклонения маятника от вертикали, х2 - скорость отклонения, х3 - момент, приложенный к маятнику. Уравнениями (1.324) описываются многие электромеханические объекты: синхронные генераторы, двигатели с асинхронным пуском и др. Поставим задачу синтеза регулятора для системы (1.324). Для этого проверим, можно ли свести данную систему к канонической форме Бруновского заменой координат и введением статической обратной связи. Имеем векторные поля ( Ч ) (0] X(x) = \sinXl+xA Y(x) = \o\. (1.325) Для получения невырожденного преобразования 7* = (7],Г2,Г3) и статической обратной связи v проверим все условия теоремы. Имеем. (°1 (°1 (Ч 1) ad°xY(x) = Y(x) = \ О , аЛхГ(х) = [Х,Г](х)-\-\ \, аЛхГ(х) = [Х,вЛхГ] = \ О Ы loj [о) rank{ad'rK(jc),J! = 0,1,2} = 3 в точке равновесия дго=О,- условие с) выполнено 2) Так как все векторные поля ad'^ Y(x), i = 0,1,2 не зависят от х, то система |ad'v Y(x), / = 0,1,2} векторных полей инволютивна (полная система), - условие а) выполнено Р1 3) ad^ Y(x) =0*0 - условие б) выполнено. W Таким образом, преобразование Т(х) существует и статическая обратная связь v(T(x)) также может быгь получена. Приведем исходную систему к канонической форме Бруновского Находим компоненту преобразования ух = 7] (*). Согласно (1314) \дх ) obc, дх2 дхъ ^,ad,KW] = 0;H.0 + ^.(-l) + ^.0 = 0, дх'"л'""') " дхх " дх2 v '' дх3 ' " ° 326) ?Ь.МхУ(х))*0. ^.1 + ^04-^.0*0. дх х v }) дхх дх2 дхъ Данной системе дифференциальных уравнений в частных производных, в частности, удовлетворяет следующее решение И =7; (*) = *,. Остальные компоненты преобразования Т2(х),Тъ(х) и статическую обратную связь v найдем из выражений (1.303), (1 305), (1.308), (1.309) гйт ^ *2 ^ У2 = Г2(х) = (°±,Х(х)у(\А0) sin xx +х3 =д:2, о Уз = Гз(лг)=(1г'х(л:))=5'п*|+*3' (1327) [8Т \ —-,X(x) + uY(x) =cos x, -x2+u дх ) Проверим невырожденность преобразования у-Т(х) в окрестности равновесной точки Имеем ( 1 0 Q\ б4—\А о 1 оUо, {дх) U^oiJ а это значит, что существует взаимооднозначная связь между решениями исходной системы (1 324) и ее линейным эквивалентом в форме Бруновского
L = v. 86 Методы современной ТАУ. Часть IV а/ Ввиду диффеоморфности систем (1 324) и (1.328) синтезируем регулятор для линейной системы (1 328), а из уравнения (1 327) найдем синтезируемое управление для исходной системы. Пусть для определенности для системы (1.328) был синтезирован регулятор по известным методам синтеза ч(у)=К\У1+К2У2+КзК, где Кх = -1, К2 - Къ = -3. Тогда уравнение и(х) для исходной системы будет м(дг) = v(r(:c))-cos хххц =-х, -3*2 — 3(sin ^ +^)-cos xlx2. Замечание, если управление и в уравнении (1.300) будет векторным, тогда вид его линейного эквивалента является блочно-диагональным, где каждый блок - клетка Бруновского. Пример такого синтеза приведен в [24]. 1.13. ПРОВЕРКА ИНВОЛЮТИВНОСТИ РАСПРЕДЕЛЕНИЯ ВЕКТОРНЫХ ПОЛЕЙ При получении линейных эквивалентов нелинейных систем и нахождения общих инвариантов для нескольких однопараметрических групп необходимо определить, является ли заданная система инфинитезимальных операторов инволютивной, т.е. составляет ли она базис алгебры Ли векторных полей. Рассмотрим достаточно простой, аналитический метод решения данной проблемы, основанный на взаимно однозначном соответствии между инволютивным семейством векторных полей V и инволюционным (с попарно коммутирующими векторными полями) семейством векторных полей V-\хп / = 1,/и|, полученном из V некоторым невырожденным преобразованием. Пусть на гладком многообразии Мп задано множество векторных полей в естественном базисе Xi=^lJ(x)^r;i = ut;\<m<n-\. (1.329) 7=1 VXj Теорема 1.15. Для того, чтобы независимые векторные поля Х1(х),...9Хт(х), \<т<п-\, где п - размерность вектора хеМп, определяли инволютивное распределение Дда(дс), необходимо и достаточно, чтобы базис Х{(х),...,Хт(х), полученный из Хх (х),...,Хт ( jc), был инволюционным. Доказательство. Необходимость. Пусть векторные поля Хх (х),...,Хт(х) определяют инволютивное распределение &т(х) касательного пространства ТМ" многообразия Мп, т.е. m [*,,Ху](*)=2>91А(*)**(*). (1.330) *=1 где atJ k [х] - гладкие функции на Мп . Кроме того, по теореме Фробениуса, выраженной через дифференциальные 1-формы [6], для инволютивного распределения Ат(х) существуетанну^ятор Ann(Am)
Глава 1. Синтез САУ методами дифференциальной геометрии 87 Ann(Aw) = {со, = dzt:со, (*,) = 0, / = 1,л-т\ j = 1,w], где со, - дифференциальная 1-форма, здесь, в частности, дифференциал функции (скалярного поля) z,- (х). Пусть некоторый дифференциал dz e Ann (Ат). В этом случае с учетом (1.329) имеем д_ dz{x)(xJ) = XJz{x)=Y4^k{x)—z = 0i y = l,да> (1.331) к=\ °Хк т.е. (1.331) определяет систему однородных дифференциальных уравнений в частных производных первого порядка. Пусть (без уменьшения общности) в системе уравнений (1.331) первые т координат каждого из векторных полей Xj[x) lj = \,m\ определяют невырожденный минор Л[х) порядка т в области решения (1.331). Представим (1.331) в виде п .... .... ■z-A(x)- ' д " ах, д •z- i=m+\ О*! Z = 0, где |Чц(*) - кМ) А(х)= \ \ I Запишем уравнение (1.332) следующим образом: я \ ( » я \(У Л .... .... -А(х). ' д ' дх, д [дхт) - \\ /=/и+1 z = 0. Домножим слева левую и правую часть (1.333) на А~х [х) и, обозначая М*1 -л-Чху /=/и+1 ^ z^w^-, V/=m+l ^ j = ^-'(х). (1.332) (1.333) (1.334) (1.335) получим
88 Методы современной ТАУ. Часть IV '*N \famj \\ ,=m+i ca< z = 0. (1.336) Умножение слева невырожденной матрицы Л"1 (х) на столбец векторных полей (Xl9...9Xm) определяет столбец векторных полей (xl9...9Xm) , которые также удовлетворяют условию (1.331), т.е. dz{x)(Xj) = Xjz[x)=09j=ui9 (1.337) где ~ д vp z i \ д . -— ,. „ -,-. (1-338) Л7 i=m+\ ^i Выразим из уравнений (1.338) постоянные независимые векторные поля (естественный базис (репер)): ~J /=/И + 1 Из отношения (1.338) имеем д ~ А: мй . г (1.339) */=5Х* (*)**. ^=l (1.340) Тогда скобка Ли (коммутатор) векторных полей XhXj через векторные поля Xt, t = 1,/и выразится следующим образом: mm mm /=1 JU1 /=1 Л=1 m m -§>Л*/^)**)=ХЕ(§^/[**"*/]+ (1.341) /=1 A=l С другой стороны, учитывая (1.338), получим v=m+lji=m+l^ OXv ^ ал:ц ал:у д (I \ ' д д (£ \ д (1.342) Из выражений (1.338) и (1.342) замечаем, что скобка Ли [х^,^/] не может быть выражена в виде линейно связанной комбинации векторных полей Xt, t = 1,/и , т.к. Гх^АГЛ зависит только от последних [п-т) координат, а первые т координат
Глава 1. Синтез САУ методами дифференциальной геометрии 89 равны нулю. Подставляя в (1.341) вместо Хп t = \,m правую часть (1.338) и учитывая (1.330), получим т т т ш (1.343) к=\ /=1 к=\ <И где P^W^ZZ^i^^^K'-^y^^^J^OW^^^^bw (1.344) /=i к=\ и А~] (x)-(t,s) -элемент обратной матрицы А~1(х). Равенство (1.343) в силу сделанного выше замечания и формулы (1.338) будет иметь место тогда и только тогда, когда *«ЛХ) = К(*)> Ш = п^> (1.345) [xk,Xt] = 0, kj = lm. (1.346) Последняя формула указывает на то, что векторные поля Xt(x), t = \,m являются инволюционными (т.е. попарно коммутирующими). Достаточность. Пусть для совокупности полей Xnt = \,m справедливо соотношение (1.346), т.е. это инволюционные векторные поля, причем векторные поля Xnt = \,m связаны с векторными полями Xnt = \,m матричным уравнением (1.334). Подставляя (1.334) и (1.346), получим 0 = Ш III q=\ q=\ t=\ (1.347) ^=i u=i J /=i U=i ) Уравнения (1.347) определяют систему С% линейных алгебраических уравнений относительно скобок Гх^^хЛ; qj = \,m, решая которую, получим т [Xq,Xt] = Y,a4t,v{x)Xv>cl = ^c]<t^m> v=l т.е. инволюционность векторных полей Хп t = \,m определяет инволютивную систему Хп t = \,т в области, где матрица А(х) невырождена Таким образом, алгоритм проверки инволютивности семейства векторных полей Хи...,Хт сводится к получению семейства Хп t = \9m и проверки последнего на инволюционность (попарную коммутируемость). Если условие инволюционности выполнено, то исходная система инволютивна. Пример 1.21. Рассмотрим 2 векторных поля Х1(х),Х2(х) гладкого распределения Am(x)(zTMl, инволютивность которого традиционным путем проверить достаточно сложно Векторные поля в координатном представлении: вд= *2 . вд= <(х{+хъ)х2) Скобка Ли этих векторных полей имеет вид 1 (1 348) 6 Зак 416
90 Методы современной ТАУ. Часть IV -(*,+*2) [ХиХ2](х) = -1 , (1.349) <-xl-x2(xl+x2)j и сказать что-либо определенное об инволютивности Хх (х) и Х2 (х) сразу нельзя Тем не менее они действительно инволютивны в области, где хъ * х2 и их скобка Ли может быть выражена в виде линейно связанной комбинации векторных подлей Х] (х) и Х2 (х): [Х1,Х2](х)= V =И*.+*2)ад+*(*+*)-*ад = ^(х)ад> (135о) (-X]-x2(Xl+X2)} Х>-Х> а это значит, что векторные поля Хх(х) и Х2(х) формируют инволютивное распределение и соответственно интегральное подмногообразие. Функции а, (*)(/ = 1,2) имеют сложный вид, и определить их методом проб и ошибок непросто . Рассмотренный подход позволяет найти функции чисто формально. Покажем это. Исходные векторные поля в естественном базисе согласно (1.329) имеют вид- 1 1 (хх+х2) ) & (Х*+Х*)]£Г i = А(х) дхх д дх2 j_ {дх3) дхх _5_ [дх2) ■(? ?) дх, дхг) (1.351) Домножая (1.351) слева на Л 1 (д:) и считая, что определитель <\е\(А(х)) = хъ-х2*0, получим ' а ^ дх, д [дх2 + ( д\ а или в координатном представлении *,(*)= ° L*2W= 0 (1.352) (1.353) Проверка Гх1,Л'2](д:) = 0 показывает, что Х^х), Х2(х) образуют инволюционную систему Найдем связь между X, и Х2 (/ = 1,2), а затем определим функции а, (*)(/ = 1,2) инволютивности Х{,Х2 . Из (1 352) выделим естественный базис: дх2 Подставляя (1.354) в (1.351), получим 3 _i> a ^ '3 J (1.354) X, =х3 Хх -х2— \ + х2\ Х2-хх— \ + (х] +хъ)х2—- = хъХ{ +х2Х2 (1.355) Формулы (1.335) определяют связь между инволютивными л", (/ = 1,2) и инволюционными Л".,(/ = 1,2) векторными полями Теперь найдем функции а, (*)•(/= 1,2). Из (1.335) имеем
Глава 1. Синтез САУ методами дифференциальной геометрии 91 х2) U i)[xj Тогда X, 1 -х-у хъ-х2 хъ-х2 -1 *з \хъ-х2 х3-х2) {% Ранее было получено Подставляя в (1.358) выражения (1.354), имеем [XuX2} = -(xl+X2)±-JL--(X] + X2(xl+x2))±. -(*, +х2(Х] +х2))— = -(хх +х2)Х1 -Х2. 0ХЪ И, наконец, сделав замену в (1.359) инволюционных векторных полей Xt (/ = 1,2) на X, (/ формуле (1.357), окончательно получим х3-х2 хъ-х2 /=, что и доказывает инволютивность распределения Ат (х). (1 356) (1 357) (1.358) (1.359) = 1,2) по 6*
_92 Методы современной ТАУ. Часть IV ГЛАВА 2. ТЕОРИЯ КАТАСТРОФ. ДЕТЕРМИНИРОВАННЫЙ ХАОС. ФРАКТАЛЫ 2.1. ТЕОРИЯ КАТАСТРОФ 2.1.1. Введение Теория катастроф родилась на стыке двух дисциплин - топологии и математического анализа, ее источниками являются теория особенностей гладких отображений X. Уитни и теория устойчивости и бифуркаций динамических систем А. Пуанкаре, А. Ляпунова, А. Андронова. Оба эти направления слились, благодаря усилиям французского математика Р. Тома, в единую теорию, которая получила название - теория катастроф. При изучении свойств решений дифференциального уравнений сначала необходимо явно оценить полное множество решений и лишь потом анализировать их свойства. Проблем не возникает, если это линейная, лучше стационарная система дифференциальных уравнений. Для нелинейных систем полное множество решений можно построить для уравнений второго порядка (например, методом фазовой плоскости). Что же -касается уравнений третьего и более высокого порядка, то здесь известны решения только частных задач. Как же поступать в этом случае? Выдающийся французский ученый Анри Пуанкаре убедительно показал, что во многих случаях необходим лишь ограниченный объем информации качественного характера, которая, в конечном итоге, и представляет интерес при изучении конкретных динамических систем. Основы современного подхода к определению качественных изменений в поведении решений обыкновенных дифференциальных уравнений были заложены А. Пуанкаре в конце 19 века. Он впервые ввел такие понятия, как структурная устойчивость, динамическая устойчивость и критические множества. Особенно интересовало Пуанкаре, как качественно меняется поведение динамической системы при изменении описывающих ее параметров. Перестройка качественной картины движения динамической системы при изменении ее параметров получила название бифуркации (буквально, раздвоение). Работы А. Пуанкаре по исследованию структурной (топологической) устойчивости динамических систем в 30-е годы XX века продолжили советские ученые А.А. Андронов и Л.С. Понтрягин. Структурно устойчивые системы они назвали грубыми [1]. В это же время Марстон Морс исследовал структуру некоторой функции (которую теперь называют морсовской) в окрестности изолированной точки многообразия, которое содержит траектории динамической системы. Он показал, что невырожденные критические точки такой функции являются изолированными точками, что определяет структурную устойчивость данной динамической системы к возмущениям. Одновременно Хаслер Уитни описал особенности гладких отображений. Рене Том заметил (в конце 50-х годов), что эти две теории - особенности гладких отображений и структурная устойчивость динамических систем - могут быть объединены в одну общую теорию. Он ввел важное понятие «трансверсальность», которое стало основным при описании структурной устойчивости. Позднее Р. Том использовал его при описании канонических форм определенных особенностей отображений R" -> R1 (функций), которые он назвал катастрофами.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 93_ Предмет теории катастроф - изучение зависимости качественной природы решений уравнений от значений параметров, присутствующих в заданных уравнениях. Для данной теории требуется определенный математический аппарат, с изучения которого и начинаем изложение. 2.1.2. От аналитичности к гладкости. К-струи и ростки функций Рассмотрим некоторую дифференцируемую функцию f:R->R и разложим ее в ряд Тейлора в окрестности некоторой точки xQ f(xo+x) = ao+alx + a2x2+.... (2.1) По традиции представление этим рядом считается полезным только в том случае, если он сходится в некоторой окрестности UX) и сумма его равна f(xo+x). В этом случае /(*) называют аналитической в точке х0. Ряд можно дифференцировать в некоторой (возможно) меньшей окрестности VXq и его коэффициенты равны 1_ /! Z)'/l = *Х I ° ax1 где х=х0 Для дальнейшего анализа нам потребуется ввести некоторые определения и обозначения. Пусть Мп с Rn ,Nm с: Rm - гладкие многообразия (подробнее см. главу 1) и имеется некоторое отображение /: Мп -> Nm . Определение 2.1. а) Будем говорить, что отображение / является дифференцируемым класса к и обозначается f eCk(M"9Nm), если каждая их функций fi(x\ / = 1,/и является к раз дифференцируемой вещественной функцией на Мп ; б) Отображение / называется (вещественно) аналитическим и обозначается /еС®(Мп,Nm), если каждая из функции /Дх), / = 1,/й является аналитической, т.е. может быть разложена в сходящийся ряд Тейлора; в) отображение / называется гладким (или бесконечно дифференцируемым, или принадлежащим классу С00) и обозначается f еС™(Мп,Nm), если для всякого неотрицательного целого к отображение / является дифференцируемым класса Ск . Справедливо включение: С03 с С00 с... с С1 е С0. Рассмотрим теперь функцию f(x) = sin x . Данная функция является аналитической, т.е. f(x) e С03(/?,[-1,1]) и ее ряд Тейлора имеет вид А , х(2*+1) На рис. 2.1 показаны графики полиномиальных функций, которые получаются, если ограничиться первыми к членами к < 13 . Из рис. 2.1 отчетливо видна сходимость ряда Тейлора. Однако замечаем, что даже при очень большом числе членов разложения приближение очень плохое вдали от начала координат. Но, с другой стороны, вблизи начала координат приближение очень хорошее. С увеличением числа членов разложения интервал, на котором точность приближения улучшается, также растёт. Это принципиальное отличие аналитических функций от другого класса функций, а именно гладких функций.
94 Методы современной ТАУ. Часть IV Рис. 2.1. Усечение ряда Тейлора для аналитической функции y = sinx (цифры определяют число членов разложения) Для гладких функций ряд Тейлора может расходиться или сходиться, но не к той сумме. Рассмотрим пример. / е С00 (/?, R), [О, х = 0, [е Ux , х*0. Данная функция имеет следующий вид (рис. 2.2). Рис. 2.2. Гладкая функция f(x) = e 1/х Легко проверить, что для любого к *->0 Действительно, например, для к = 1 имеем 2 , Hi (*-'"1 HmD1 fl=\\mA-e~Ux =21im^ ^=lim^ ^- = ... = 0. lim D /L- ..п. --. x-+0 -\lx Это значит, что функция е очень «плоская» вблизи начала координат, причем более «плоская», чем любой одночлен xJ, у = 3,5,7,.... Так как D*/10= 0 для любого к , ряд Тейлора вблизи начала координат имеет вид 0 + 0х2 +0х3+ (2.4)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 95^ Он, конечно, сходится, но не к /(*), а к /(х) = 0, т.е. f(x) является гладкой, но не аналитической функцией. Следует ли из этого, что гладкие функции не могут использоваться для приближений. Отнюдь! Как остроумно заметил Зиман (один из теоретиков теории катастроф), пора, когда сходимость остаточного члена R0(x) = f(x0+x)-(a0 + alx + ... + akxk) при к -> оо являлась основным инструментом приближений и когда «было дозволено, чтобы «хвост» (ряда Тейлора) вилял собакой», явно прошла. Например, ряд Тейлора (2.4) хотя и не сходится к /(*), прекрасно приближает эту функцию в начале координат с качественной точки зрения. Он чётко улавливает, что /очень плоская в нуле. Чего он не улавливает, так это то, что начало есть локальный минимум для/ Для любой гладкой функции /е С00 (R,R) определим ряд Тейлора в начале как формальный ряд /(*) = Zj^V !<>*'• (2-5) <=о/! Ограничиваясь членами степени не выше к, получаем Л-струю. Определение 2.2. к-струей гладкой функции fe С00 (R,R) в точке л:0 (обозначение j\ f(x)) назовем усеченный ряд Тейлора данной функции в окрестности точки /=0 ' • Если ввести замену переменных у = х-х0 и перейти от функции /(*) к функции /(у), т.е. Дх) = Ах(у)) = Яу+хо) = Ау), то Д/оо-Е-^аУ- (2-7) /=0 1' Поэтому без снижения общности точку л:0 можно считать началом координат и в дальнейшем мы считаем, если нет особой оговорки, что л:0 = 0, а формулу (2.6) мы запишем в следующем виде (индекс «О» у jkf опущен) /Л*) = 1Т[Я71о*'. (2-8) Замечание 2.1. Обозначение jkf(x) для £-струи взято по первой букве английского слова «jet» - «струя». Замечание 2.2. Определение (2.8) для Л-струи, вообще говоря, не совсем математически строгое, а является представлением Л-струи в некоторой координатной системе; в данном случае это координаты х0,*1,*2,...,** . Строгое же определение дается в бескоординатной форме, но мы всегда будем рассматривать £-струи в некотором координатном представлении, поэтому выражение (2.8) принимаем за определение. Усеченный ряд Тейлора (2.8) представляет собой многочлен, задающий полиномиальные функции
% Методы современной ТАУ. Часть IV //: R -> R (2.9) независимо от того, сходится или нет ряд Тейлора. Напомним некоторые определения. Определение 2.3. Степенью одночлена назовем сумму степеней всех переменных, входящих в данный одночлен. Например: х[х\х™ - многочлен 26-й степени. Определение 2.4. Степенью многочлена (полинома) р(х) назовем наивысшую из степеней одночленов, входящих в данный многочлен. В случае, когда х е R1, степень многочлена определяет наивысшая степень переменной х. Определение 2.5 [20]. Порядком многочлена (полинома) р{х) назовем наинизшую из степеней одночленов, входящих в данный многочлен. Для xeR1 порядок многочлена определяет наинизшая степень переменной х. Определение 2.6. Будем говорить, что функция f:R->R имеет в начале координат (т.е. в точке х0 = 0) порядок к, если /(O) = D/|o=D2/lo=- = ^"1/lo = O. (2.10) Если jkf(x) многочлен степени к, то многочлен f(x)-jkf(x) имеет порядок (к+\). Другими словами, /-е производные в нуле для jk f(x) и f(x) совпадают для / = 0Д. Тем самым ряд Тейлора и его усечение в виде Л-струи оказывается удобным формальным средством для получения информации о производных функции/и, значит, о ее форме вблизи начала координат, т.е. х0 = 0. 2.1.3. Регулярные и критические невырожденные точки гладких функций Ниже мы будем рассматривать только гладкие функции, т.е. /: Мп -» N с: Rl, либо семейство гладких функций / :М" хАр -» N1 qR\M" qR" ,Ар с Rp - множество параметров, Мп,Ар - гладкие многообразия. Рассмотрим, какие особенности присущи функциям. В свое время П. Монтень тонко заметил, что «функции, как и живые существа, характеризуются своими особенностями» (цит. по [4]). Именно особенности гладких функций (а в общем случае, гладких отображений) позволяют выявить качественные изменения фазовых траекторий динамических систем на основе их особенностей анализа на данном фазовом пространстве. И здесь большую роль играют критические точки гладких функций. Определение 2.7. Пусть задана гладкая функция / на гладком многообразии М" c:Rn ; /: М" -> N czR1. Точка х0 е Мп называется регулярной (некритической) точкой функцииДх), если _ df а/ —I ...... .5*1 dxnyxQ *0. (2.11) Для регулярных точек известна теорема о неявной функции, которая определяется следующим образом. Теорема 2.1 [8] (теорема о неявной функции). Пусть U с R", V a Rm - открытые множества и (xo,yo)eUxV с: R"+m. Если f:UxV->Rm-Cl - отображение, Дхо>Уо) = 0 и det — ф 0, то существует такая открытая окрестность W(\0)dU
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 97 точки х0 и такое отображение g:W(xo)-> V , что g(xo) = yo и /(x,g(x)) = 0 для любого х е W(xq) , причем такое отображение g единственно. Кроме того, g e С1 и (2.12) dg) R-iA — =-В А, дх) (fif • ^ (fif Л где матрицы В и А получаются из матриц —(х,у) и —(х,у) соответственно \ду ) \дх ) при замене аргумента у на g(x). Используя теорему о неявной функции, для регулярных точек можно провести гладкую замену координат у = у(х), при которой данную функцию в точке х0 и ее окрестности можно представить в канонической форме /(х) = Xj, т.е. /(x) = /(x(x)) = /(x) = x,. (2.13) Соотношение (2.13) не что иное, как отображение того факта, что / и / являются эквивалентными функциями (ниже дается строгое определение этому отношению). Покажем один из возможных вариантов такой регулярной замены. Пусть /(х) и /(х) две функции, которые описывают один и тот же физический процесс в различных системах координат. Сделаем следующую замену х = х(х) в окрестности точки л:0: x2=a2lx]+... + a2nxl9 Ху, =аи,х,+... + аиихи. (2.14) Матрица Якоби этого преобразования в данной регулярной точке х0 не вырождена при условии, что дхх ' ' дх„ det \dxt = det x=xoeR" Л2\ *n\ <*2n 9tO. (2.15) Если Df Ц * 0 , то вещественные числа ay-(i = 2,n, j = l,ri) можно выбрать таким образом, чтобы якобиан был отличен от нуля. В этом случае преобразование (2.14) обратимо и по теореме о неявной функции имеет место равенство (2.13). Пример 2.1. Пусть в системе координат (xltx2) функцияJ[\) имеет вид /(х) = 2х,х2. (2.16) Сделаем замену переменных *,=2х,д:2, (2.17) х2=х2. (2.18) Рассмотрим окрестность точки *0 = (x,o,*2o)T » причем дг20 * 0 . В этом случае якобиан преобразования det ы= = det 2х20 2xh О . 1 = 2х2о*0. Перепишем уравнение (2.17) и (2.18) в следующем виде* /|(х,х) = (5,-2х|дг2) = 0, /2(х,х>(*2-х2) = 0. (2.19) (2.20)
98 Методы современной ТАУ. Часть IV Согласно теореме 2.1 о неявной функции выделим из (2.19) и (2.20) координаты х1 и х2 как функции от переменных (х\,х2). Хотя это легко можно сделать и алгебраически, но мы сделаем полные выкладки. Имеем *i=gi(*h (2.21) *2 = *2(*). (2-22) Тогда (2.19) и (2.20) примут вид: /,(g(x),x) = 0, (2.23) /2Wx),x) = 0. (2.24) Взяв полную производную в (2.23) и (2.24) по х, получим 4Г(^(х)>х) = У(ж,ж) dx дх lx=g(x) lx=g(x) М)ш0> дх (2.25) где / = [/|,/2]т. Разрешая (2.25) относительно . , получим ^ Эх ; Ж, а*, foffl dg2(x) аг, аг. = 2g,(i) I о или в координатной форме: х=К(х) 1 0 0 1 £fci(x)=__L_; а^, 2g2(x)' dg,(x)= gl(ic). ag2(x) = 0; ag2(x)_1 dx2 Интегрируя (2.29), с учетом (2.28) получим *2=£2(*) = *2+С|. (2.26) (2.27) (2.28) (2.29) (2.30) С учетом того, что /(g(x),x) = 0, из (2.18) получим С, =0 . В этом случае два уравнения (2.26) и (2.27) в частных производных приводятся к следующему виду dgl(x)_ 1 . dx, 2x2 Из (2.31), (2.32) легко находим 3gi(*)= gi(*) 5^2 х2 *l=g|(« = ^- ^Х2 (2.31) (2.32) (2.33) Ранее было получено *2=g2(*) = *2+e|- ' (2-34) Выражения (2.33), (2.34) определяют переход от координат (х,,*2) к {х\,х2), причем в координатах (jcj,jc2) имеем /(х) = /(х) = 2ххх2 = /(g(x)) = 2^-х2 = х,. ix2 т.е. получен канонический вид (2.13).
"лава 2. Теория катастроф. Детерминированный хаос. Фракталы 99^ В том случае, если в некоторой точке х0 £>/|Х(=0, а /(х) имеет смысл потенциальной функции, то эта точка характеризует состояние равновесия (устой- швого или неустойчивого) и ее называют критической. При этом тип равновесия определяется собственными значениями матрицы устойчивости, или матрицы Гессе в точке х0 G/(xo) = 9V(x) (2.35) J х„ dxfixj Так как Df |Xq = 0, то условия применимости теоремы о неявной функции не выполняются, поэтому /(х) не может быть представлена в канонической форме (2.13). Однако если det(G/(xo))*O, (2.36) то лемма Марстона Морса гарантирует существование гладкой замены переменных, такой, что /(х) локально (в окрестности Ux ) может быть представлена квадратичной формой Дх) = /(х(у)) = /(у) = /(Хо)-у? -у\ -:.:-yl + у2ш +... + у2п. (2.37) Число отрицательных членов /(у) называется индексом функции Морса, саму функцию называют h-м морсовским седлом и обозначают МЦу). Если й = 0, то в точке х0 = 0 достигается минимум /(х), если И = я, то соответственно максимум. Такого рода точки х0 , где Df\x = 0, detG/*(xo):?tO, называют критическими невырожденными точками. Если все критические точки функции /(х) являются критическими невырожденными, то функция /(х) называется морсовской. Далее мы рассмотрим лемму Морса, но прежде нам необходимо ознакомиться с широко используемой в дифференциальной геометрии и топологии леммой о представлении гладких функций. Лемма 2.1 (о представлении гладких функций) [8, 21]. Пусть f-Cr+] -функция (г > 0 ) (имеет производные до (г+1) порядка), заданная на выпуклой окрестности Vx точки х0 в R" . Тогда существуют С -функции gt:Vx ->Rl, / = 1,л, такие, что причем /(х) = Дхо) + £&(хХ*, -*,<>), (2-38> /=1 ft(xo) = |r(xo). (2*39) дх, Доказательство. Положим ftW = J-J-(xO+^-xo))A (2.40) Это всегда можно сделать, т.к. х е VXq ,аКХ() - выпуклая окрестность точки х0 . Применяя элементарные преобразования анализа, получаем
100 Методы современной ТАУ. Часть IV /(»)-/(».)-Jy('°'"('~Ko)df-}ft(»i-^.)|L(»o-b<(»-».)V- 0 Ut (Л/=1 °Xi ) п г df n = Y<(xi-xio)\j-(xo+t(x-4)dt = Y,(xi-xio)gi(xl i=\ о dxi i-l что и требовалось доказать. Пример 2.2. Рассмотрим гладкую функцию f:R->R Дх) = хъ + 3х2 (2.41) и найдем ее представление (2.38) в окрестности точки дг0 = 1. Имеем дх dx Найдем функцию g\(x). Согласно (2.40) получим i gi(x) = J3(\+t(x-l))2+6(\ + t(x-\))dt = (x-\)2+6(X'\) + 9i о тогда f(x0) = /(1) = 4 и представление имеет вид /М = 4 + ((х-1)2 + 6(х-1) + 9)(;с-1). ' (2.42) Это точное представление, т.к. раскрытие скобок формулы (2.42) дает (2.41). Лемма 2.2 (лемма Морса [8, 9, 19]). Пусть Мп - гладкое многообразие (обобщенное понятие поверхности, см. подробнее главу 1) и пусть /: Мп -> R{ и х0 - невырожденная критическая точка функции/ Тогда в некоторой окрестности VXq точки х0 существует такая локальная система координат у\,...,у„9 что ^(хо) = О, / = 1,и и в КХ() справедливо тождество /(х) = /My)) = /(У) = Дхо)-*2 -...-yl +y2h+1 +... + У2п , (2.43) где У)9~.,у„ - координаты точки у, а А - индекс функции /в точке х0, т.е. число отрицательных членов в формуле (2.43). Доказательство. Применим лемму 2.1 о представлении гладких функций к функции Дх). Имеем /00 = /M+Za(x)(*i -*.«). (2-44) /=1 где 1 причем g,(x) = J-^(xo+/(x-xo)A, (2.45) 0 ™i а(хо) = -^(хо),/ = п (2.46) Так как х0 - критическая точка, то а(хо) = О,/ = п. (2.47) Применим к g/(x) вновь лемму о представлении гладких функций. Имеем
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 101 П rsr Дх) = /(х0) + ЕтЧхо)(**-*-о) + •_i OXi '-' (2.48) +SS VXK*i ~Xio){Xj ~Xjo)> i=l 7=1 где l ^(х)=№(хо+/(х-хо))А, /,У = 1,«. (2.49) С учетом (2.47) представление (2.48) имеет вид /(x) = /(xo) + ZZ^(x)(*/-*/o)(^-^o) (2-50) /=1 7=1 Сделаем замену переменных yt =xi-xi09 / = l,/i. (2.51) Тогда (2.50) можно записать в следующем виде: /(х) = Д*(у)) = /(у) = Дхо) + ZS^, (У)Л^- (2-52> i=i j=\ Обозначим /(У) = /(У)-/(ХО). (2.53) Тогда ку) = ££~Ь0{у)у>Уу (2.54) /=1 7=1 Матрицу вторых частных производных £//(.?) сделаем симметричной, вводя замену 4 =^ft+W'"л=ь* (2-55) После чего получаем Лу) = ЕЕ4(у)^г (2.56) /=1 7=1 Отметим, что 1 а2/ 2%9Р7 и по определению матрица р,7(0) невырождена, соответственно матрица б/ДО) тоже невырождена. Если бы функции by (у) были константами, то для доказательства теоремы (леммы Морса) нам было достаточно привести квадратичную форму (2.56) к каноническому виду. В общем же случае процедура приведения состоит в следующем. д2? Пусть для определенности —у (0)^0 (это не снижает общности, т.к. линейным дух изменением координат всегда можно добиться этого), т.е. 6ц(0) ф 0 . Тогда в некоторой окрестности точки у0 = 0 можно записать %(0) = ^г^<0) (2-57)
102 Методы современной ТАУ. Часть IV /(у)=ZS4 Ш& = Si (у)ti+ 2Z5i {уУуГух +ZI4 (у)яру = i-l 7=1 />1 />1 У>1 = sign6n(0) '»sign4i,(0)Vii,(y) J Mfl ZZ5i (y)5y (y)A^+ZZ4 (у)луу = (2.58) Ы ;>i />i y>i = sign^(0)7l2+XZ ;>1 >>1 ^(У)- WiMl, Ь,|(У) V^y где новая координата ух зависит от координат уи...,у„ У\ =Ku)\*+±-—i Матрица ы signal (0)^, (у). ■ ш- 5.(у)*л(у) ш\ , \<ij<n (2.59) (2.60) невырождена в точке у0 = 0 и симметрична. Следовательно, мы сможем применить приведенное выше рассуждение к функции ЕЕ />l j>\ ш- шш ш УгУ, (2.62) и т.д., как в классическом алгоритме Лагранжа приведения квадратичной формы к каноническому виду. Пример 2.3. Рассмотрим функцию Дх) = х\ -4х, + х{х2 -х\ + х2. (2.61) Градиент этой функции grad/(х) = 0x1 - 4 + х2;-2х2 + х, + 1)т. Критические точки функции: grad/(х) = 0, => У- = 0; $- = 0; дхх дх2 х0 -(1,1) ,х0 -^ 6, i2j. Рассмотрим критическую точку х0 = х^. В данной точке гессиан функции/*) det(G/(x)) = det^ _У = -Щ-2 невырожден detG(xo) = -14^O, поэтому данная критическая точка является невырожденной и изолированной, а по лемме Морса ее можно представить некоторой квадратичной формой в каноническом виде. Получим это представление. Сначала найдем функции g,(x), / = 1,2 (формула (2.40)) &« = Яг(*о+'(1-*о))Л. [^ (2.63)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 103 Имеем х7 5 g1(x) = {3(l + ^!-l))2-4 + (l + ^2-l))^ = xI2+x1+^-^. о 1 1 Согласно (2.48) найдем коэффициенты для квадратичной формы: bu(x) = \f&.(x0 + t(x-x0))dt = \(2(\ + t(xl-\)) + l)dt = xl+2; № М*) = )|£Ч*о + Ф'-*о))<* = }^' = |; Jo*2 *21(х) = |^-(х0+'(х-х0))Л = )1л = 1; b22(x) = \^(x(t+t(x-xa))dt = \(-l)dt = -l. Итак, имеем матрицу >2 В(х) = х, +2 1 1 2 Г 2 -1 ) Заметим, что *(*„)= = fG/(x0). Получено следующее представление функции^Дх) (с учетом g/(x0) = 0, / = 1,2, /(х0) = -2) /(х) = -2 + (х1 +2)(Xi -1)2 +(х, -1)(*2 -1)>(^ -I)2 (2.64) Если раскрыть скобки в (2.64), то получим искомое выражение (2.61), т.е. представление квадратичной формы (2.64) выполнено верно. Введем замену переменных: U=*! -*!0 =*1 "I (2-65) У2=х2-х2О=х2-\ (2.66) Тогда *1 = Л + 1;*2=Л + 1- (2-67) Подставляя (2.67) в (2.64), получим f(y) = -2 + (yl+3)yf+yry2-yl. Матрица *(У) = ^ -. (2.68) является симметрической, поэтому Z?(y) = В(у). Обозначим /(У) = 7(У) + 2. Тогда имеем ку) = (п+1)у?+У1У2-У22. (2-69) Приведем квадратичную форму (2.69) к каноническому виду. Согласно (2.59) введем замену координат Ч^Л+^Ч (2.70) где sign £ц(0) = I. После замены имеем
104 Методы современной ТАУ. Часть IV /(**) = >?+ -1" у1 Обозначив окончательно получим /(у) = у\-у1 (2 71) (2.72) С точностью до перестановки индексов (сначала идут положительные, затем отрицательные члены) мы получили каноническую квадратичную форму индекса 1. Если сделать обратную замену, то имеем следующую цепочку: /(У) = /ОЧУ) = /(У) = /(У) + 2 = /(Ях» + 2 = /(х) + 2 . Действительно, (2 70),(2 71) /СКУ)) = sign bu(0)\ 1 = U+3)>f + yry2 + - У\ |Л+3|] I1 + 4|j>,+3| 1 Й = Т~>>2 "ТГ^ (2 65), (2 66) = (х, + 2)(х1-1)2 + 4|*+3| "2 4|й+3| + (xl-\)(x2-\)-(x2-\)2=f(x)-f{x0)=f(x) + 21 т е. представление выполнено верно. Следствие 2.1 (леммы Морса) [19]. Всякая невырожденная критическая точка функции/ изолирована в множестве всех критических точек этой функции, т.е. обладает окрестностью, свободной от других критических точек. Критические точки имеют большую ценность, чем регулярные (некритические), т.к. именно они в основном характеризуют глобальные качественные изменения в поведении функции/*). Рассмотрим морсовскую функцию fM{x\xe R], имеющую вид (рис. 2.3). Здесь три критические изолированные точки, причем точки х§\х^ имеют по морсовской классификации индекс 0, а х^ - индекс 1. Точки j$\jcJ2) являются аттракторами (множествами притяжения; в данном случае каждый состоит из одной точки), причем каждый со своим «бассейном» (областью притяжения) [3]. Важность критических точек состоит в том, что при переходе из одного «бассейна» в другой всегда необходимо проходить через критическую точку, имеющую другой морсовский тип. Следовательно, если/х) имеет лишь изолированные критические точки (является морсовской) и координаты всех этих точек известны, можно определить все качественные изменения в поведении функции/*) при условии, что известен тип каждой морсовской точки. Рис. 2.3. Морсовская функция с двумя «бассейнами» (областями притяжения) и аттракторами Xq\x^
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 105^ Немалую роль в поведении некоторых динамических систем играют критические вырожденные точки, наличие которых подчас приводит к внезапному качественному изменению состояния систем. Появление критических вырожденных точек Df \ч = 0, det||G/(xo)|| = O обычно связано с погружением данной функции fix) в параметрическое семейство функций, т.е. / = /(х,а),где а = (а{,...,аку - вектор параметров. Перестройки качественной картины движения динамической системы, появление особенностей отображения у функции fix, а) при плавном изменении параметров изучают теория бифуркаций (бифуркация - раздвоение), теория особенностей гладких отображений, а приложения этих теорий к исследованию скачкообразных реакций механических, физических, химических, биологических, экономических систем, систем управления и иных систем на плавное изменение внешних условий (управляющих параметров) получили название теории катастроф [4]. 2.1.4. Неморсовские функции. Лемма расщепления. Функции катастроф Определение 2.8. Критические точки функции fix), в которых гессиан det(G/(x0)) = 0, являются неизолированными вырожденными, или неморсовскими критическими точками. Если функция fix) зависит от одного или более управляющих параметров ах,...,ар, то матрица Гессе Gfix) и ее собственные значения зависят от этих параметров. В этом случае возможно, что при некоторых значениях управляющих параметров одно (или несколько) собственных значений матрицы G может (могут) обратиться в нуль. Если это так, то det(G/(x0)) = 0 и, следовательно, условие, необходимое для леммы Морса Df\Xo = O, det(G/(xo))*O, не выполняется и в точке равновесия функция fix) не может быть представлена в канонической форме (в виде квадратичной формы). Но, оказывается, можно найти каноническую форму функции /(х), х е Rn ив неморсовской критической точке. Пусть в критической точке х0 = 0 (для определенности и без снижения общности) D/Lo = O Hdet(G/(xo)) = O. Пусть rank G/(x) = («-/), (2.73) т.е. матрица Гессе Gfix) имеет / нулевых собственных значений (/ > 1). В этом случае лемма Морса не применима, т.е. представление fix) в виде квадратичной формы Г и Л ~Х-У'2+ X у) невозможно. Рене Том [31] показал, что в этом случае функцию fix) можно также привести к некоторой канонической форме. Лемма 2.2 (лемма расщепления). Пусть / собственных значений матрицы Гессе G/(xo,a°) обращаются в нуль в точке (хо,а°), х0 =(х10,...,*л0)Т, а0 =(а10,...,^) . Тогда можно найти такую замену переменных х = я(х).,.лто функция fix) может быть представлена в виде суммы двух функций: неморсовской fm, зависящей от координат
106 Методы современной ТАУ. Часть IV *!,...,х,, которые являются гладкими функциями переменных (хь...,хп) и параметров а^,...,а°р , и морсовскойум зависящей от х1+{9...,хп, которые являются гладкими функциями только искомых координат [х},..., хп), т.е. Дх,а°) = /(*(х),а) = /(х,а) = Л /о о \ Л Q-74) = /мм{х\(х'>* ),-..,*/(х,а )))+/м(х1+](х),...,хп(х)). Назовем координаты х = (хх,...,хе) - неморсовскими, х = (х/+1,...,х„) -соответственно морсовскими. Более того, если / = /(х,а), х е Rn, a e Rp , то при р < 5 (т.е. когда число параметров семейства не более 5), Р. Том показал [31], что (2.74) может быть представлено в следующем виде: /(х, а) = /(х, а) = /(х, х; а) = Cat (x, a) + fM (x), (2.75) где x = (i,,...,5/)T, x = (x/+1,...,*w)T, a = (a1,...,a/7) , Cat(x,a) = [Cat](x) + /7(x,a), (2.76) fM(x) = ±xf+{±xj+2±...±x2n (2.77) (знак ± в (2.77), означает, что тип морсовского седла в точке х0А/£(х0) может быть любым). Функцию Cat(x,a) называют функцией катастрофы, или просто катастрофой, I - число нулевых собственных значений матрицы Гессе G/(x0) (число не- морсовских координат),/? - число управляющих параметров, [Cat]0(x) - росток катастрофы в точке х0 =0 (определение ростка функции будет дано ниже), р(х,а) - возмущение ростка. Из представления (2.75) и названия функций можно сделать предварительный вывод о том, что именно неморсовские функции «создают катастрофы», в чем мы далее убедимся. 2.1.5. Возмущение морсовских и неморсовских функций. Элементарные катастрофы В чем же качественное отличие морсовских и неморсовских функций в их критической точке х0 ? Прежде всего в их реакции на возмущение. Пусть х0 = 0 - критическая точка /(х). Пусть /(хо,а°) характеризует для критической точки х0 и некоторого значения вектора параметров а0 состояние равновесия. Для удобства возьмем х0 = 0, а0 = 0 (это всегда можно сделать, вводя соответствующую замену переменных для сдвига начала координат). Возмущенная функция F(x, а) в окрестности точки (хо,а°]е Rn xRp определяется следующим образом: F(x,a) = /(x)+/>(x;a), (2.78) где/дс) - значение функции/в окрестности точки х0 = 0,/?(х;а) - возмущение данной функции. ' Посмотрим, как ведет себя морсовская функция при возмущении. Пусть хе R1 (скалярный аргумент) и Дх) = Хх2(Х*0). (2.79)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 107 Разложим возмущение р(х, а) по степеням х в окрестности точки х0 = 0, а е Уо - окрестность точки а0 = 0 . р(х;а) = р(0,а)Л\ -хА КО/») э*2 •X +... . (0/1) Объединяя (2.79) и (2.80), получим возмущенную функцию F(x;a) = p(0,a) + др\ дх 0,а) •JC+ Л.+ Обозначим для удобства Р\ дх (0,о) дгр дх (0,о) д'р ■;р'=-д7 (2.80) (2.81) (2.82) (0,а) Сделаем замену переменных х = у + В2у2+В3у3+...9 (2.83) в результате которой из ряда (2.81) можно исключить члены выше второй степени. Покажем это. Сделав подстановку (2.83) в (2.81), с учетом (2.82) получим: у '. Произвольная константа = /?j \ у '. Произвольная константа = Р\В2 + (А, + р2 )\ y3:0 = PlB2+(X + p2)-2B2+p3- j. (2.84) / :0 = PlBA +(X + p2)-(2B3 + В\)+ ръ -ЗВ2+рл; Если р\ = 0, то система уравнений, определяемая при членах выше второй степени уг,у*,..., является линейной и может быть легко решена: Ръ В2=- 2(\ + р2У в,-^- рА (2.85) &(\ + p2f 2(X + p2y В этом случае все коэффициенты В2,В3,... определены корректно, т.к. единственный множитель, который встречается в знаменателях, - это отличная от нуля сумма (к + р2). Если же рх *0, система уравнений может быть также разрешена и коэффициенты 52(р1),53(/?1)... зависят от рх непрерывным образом. Существенным моментом является то, что, если X Ф 0, всегда может быть найдено гладкое обратимое преобразование (2.83), удаляющее все члены выше второй степени. Таким образом, в новых координатах возмущенная функция F(x, а) примет вид F(x(y),a) = P(0;a) + Ply + {(\ + p2) + PlB2}y2 = p(0;a) + Ply + iy2. (2.86) Сделав замену переменных у -» у = \Ц2 у и перенося начало координат А У = V+ Д^, у = у + 2#|
108 Методы современной ТАУ. Часть IV имеем Пу,а) = \р(0;а)-Я\ + \у2. (2.87) Таким образом, возмущение функции одной переменной в морсовской критической точке не влияет на качественную природу этой функции и, хотя при этом критическая точка сдвигается, тип критической точки остается без изменения (рис. 2.4), т.е. морсовские функции структурно {качественно) устойчивы. Рис. 2.4. Возмущение функции в морсовской критической точке Можно показать, что для xeR" возмущение морсовского/i-седла М£(у) также не приводит к локальным качественным изменениям. Рассмотрим, что происходит, если возмущение действует в окрестности немор- совской критической точки. Из леммы расщепления (лемма 2.2) следует, что невозмущенная функция имеет вид /М = /ш 00+ /*(*)■ (2.88) где х = (х,,...,*,),х = (х/+1,...,х„). Напомним, что матрица Гессе в точке xo-G/(xo) имеет / нулевых собственных значений. Самое общее возмущение функции/задается следующей формулой (считаем, что р(0,а) = 0): F(x;a) = /(х) + /?(х;а) = £аЛ +£Ё(±8(/ + Py)xixj +/ш00 + + члены 3-й степени и выше, (2.89) (0/1) R ГI ' = J, dp dp где5/7=<! . . Pi=—\ ; Ау=т-г- Можно показать [9, 10], применяя описанную выше процедуру нелинейного преобразования координат, что каноническая форма возмущенной неморсовской функции имеет вид F(x(y);a) = F(y;a) = FNM (y;a) + FM (y;a), (2.90) где / / / Ш=ЕМ+Е±^ (2-93) /=/+1 /=/+1
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 109 у = (yl(xia)9...,yl(x,a))T9 у = (yl+l(xl.,.,yn(x)). (2.94) Напомним, что знак ± в (2.93) указывает на любой тип морсовского //-седла М% в данной критической точке. Из выражений (2.91) - (2.94) можно сделать следующие важные выводы. Если в семействе функций fix; а) встречается функция /(х,а°), имеющая немор- совскую критическую точку в х0, то согласно (2.90) для любой другой точки fix; a) а Ф а0 близкой к fix; а) можно найти такую координатную систему, что возмущенная функция /(х;а) = /(х;а°) + /?(х) может быть получена отдельным возмущением п морсовской ^Г ±xf и неморсовской fNM части функции / Мы уже выяснили, что /=/+1 возмущение морсовской функции (морсовской части) не вызывает качественных изменений. Возмущения же неморсовской части функции fix) - кардинально меняет топологию этой функции. Покажем это. Но прежде обратим внимание на то, что fNM (ух,...,.у()не содержит члены 1-м и 2-й степени, т.к. по определению точка х0 - критическая и вырожденная, т.е. /м/(>'!»•♦•>>'/) = /ла/(у) включает члены 3-й степени и выше. Р. Том изучил неморсовские критические точки с одной (/= 1) и двумя (/ = 2) степенями вырождений и показал, что в канонической форме FNM(y;u) может быть представлена в виде ростка неморсовской функции, называемого ростком катастроф, [Cat]0(y) и возмущения этого ростка. Если число управляющих параметров /?<5, то для (/= 1, / = 2) Р. Томом были получены следующие элементарные катастрофы (табл. 2.1). Элементарные катастрофы Р. Тома Таблица 2.1 1 1 2 Тип катастрофы Л2 4з А, As А Д+4 о5 р 1 2 3 4 5 3 3 4 5 5 5 Росток [<*].(*) хъ ±х4 х$ ±х6 х1 v2v г5 *i хг ~ хг х\хг+х\ х\±4 Возмущение Р(х;а) ахх а^х + а2х ахх+а2х2 + аъхъ ахх + а2х2 + аъхг + а4х4 ахх+а2х2 + а3х3 + а4х4 + аьхь аххх+а2х2+аъх\ ахх+а2х2 + аъх2 ахх + а2х2 + аъх2 + аАх2 ахх + а2х2 + аъх2 + аАх2 + аъх\ ахх + а2х2 + а3х2 + а^х\ + аьх\ а\х\ + агхг + аъх\х2 + а*х\ + а5х\х\ Пример 2.4. Рассмотрим неморсовскую функцию одной переменной х (/= I) в 1-м параметрическом семействе, т.е. рассмотрим росток элементарной катастрофы А2 (по табл. 2.1) /м/« = *3=[Са1]0(х) (2 95)
110 Методы современной ТАУ. Часть IV Покажем, что каноническим возмущением для этого ростка является ахх. Действительно, возмущение p(x;a) = po + plx + p2x2+p3x3+p4xA + ., (2.96) где ро = р(0;а), А=-ТТ Тогда / = 1,... . :о,«) (2.97) Если сделать замену переменных х = у + В1у2+В3у3+..9 (2.98) то, так же как и в (2.84), в силу того, что коэффициенты (1 + р3) не являются малыми, а р^р^рг считаем малыми вблизи а0 = 0 , можно подстановкой (2.98) в (2.97) и выбором соответствующих коэффициентов pi9 i = 2,3,... исключить все члены ряда (2.97), начиная сх4.В этом случае имеем /nm (У) + возмущение = ро + Р\У + Р2У2 + /• (2.99) Сделаем замену переменных в (2.99) (как в методе решения уравнения 3-й степени) "*-f. получим /nm (z) + возмущение = qo+qxz + z3. (2.100) Постоянная составляющая q0 не влияет на качественные изменения неморсовской функции, поэтому можно принять q0 = 0 . Таким образом, возвращаясь к исходным обозначениям, имеем: каноническое возмущение [Cat]()(x) = x3 -> x3 + alX. (2.101) Проанализируем свойства этого 1-параметрического семейства функций F(x\a) (рис. 2.5): 1) при ах = 0 F(jc;O) имеет критическую вырожденную точку в х0 = 0; 2) при ах < 0 F(x;a) имеет в плоскости две изолированные морсовские критические точки. При возрастании ах эти две критические точки стремятся друг к другу и становятся вырожденной точкой при ах = 0; 3) при а} > 0 F(x;a) не имеет критических точек. А 1 S 1 а s а -5 1 0 1 S Ь F(x\a) ■—^ У -^ а, <0 Рис. 2.5.1-параметрическое семейство функций F(x\a) = х3 +ахх
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы Ш_ В общем случае возмущение ростка катастрофы, имеющего вырожденную критическую точку, вызывает расщепление вырожденной точки на ряд невырожденных критических точек («морсификация»). Максимальное число изолированных критических точек, получаемых при возмущении ростка катастрофы, указывается в нижнем индексе ростка. Например, росток А2 может при возмущении иметь 2 изолированные критические точки. Отсюда можно сделать вывод: возмущение функции f(x) в неморсовской критической точке вызывает качественное изменение в поведении f(x) в окрестности данной критической точки. 2.1.6. Устойчивость. Качественные изменения в системе Теория катастроф с самого начала пыталась дать ответ на вопрос: почему при плавном изменении некоторых параметров динамические системы вдруг качественно меняют свою динамику? Чтобы понять, почему данная наука смогла ответить на многие такие вопросы, необходимо сказать, что ее фундаментом стали следующие теории: • теория особенностей устойчивых гладких отображений (Уитни); • теория бифуркаций. В теории катастроф теория особенностей гладких отображений используется при изучении качественных изменений гладких функций, т.е. отображений /еС°°(мп,я\, а теория бифуркаций позволяет рассмотреть целое семейство таких функций, зависящих от управляющих параметров, которые могут плавно изменяться на некотором многообразии. Качественное изменение поведения динамической системы прежде всего связано с понятием устойчивости гладких отображений. Поэтому изложение мы начнем с раскрытия этого понятия. Здесь необходимо сказать, что такие изменения возможны только с изменением топологической картины фазовых траекторий. Топология, или как ее еще называют, «резиновая геометрия» не делает, например, различия между устойчивыми фокусом и узлом на плоскости. Здесь важно, что поведение двух систем с такими фазовыми портретами качественно одинаковое. Как же выразить на языке математики такую эквивалентность! Введём определения. Определение 2.9 [И]. Пусть/ и / -два элемента С00 (мп, Nm V Назовем/и / эквивалентными, если существуют такие диффеоморфизмы (взаимно-однозначные отображения, дифференцируемые вместе со своими обратными) g: Мп -»Мп и h\Nm -> Nm , что диаграмма (2.102) коммутативна. На языке локальных координат это трактуется следующим образом: если х = g(x) - гладкая замена независимых координат на многообразии Мп (подробнее о многообразиях см. главу 1), у = h(y) - гладкая замена зависимых координат, тогда коммутативность диаграммы (2.102) означает, что справедливы следующие соотношения: м" gi мп f f -» N i N
112 Методы современной ТАУ. Часть IV /00 = *(/(*"'(*)))> или (2.103) (2.104) f(x) = h-\f(g(x))). Выражения (2.103), (2.104) говорят о том, что два отображения f \Мп —» Nm и /: Мп -» Nm эквивалентны, если можно одно отображение преобразовать в другое при помощи гладкой замены независимых и зависимых переменных. Пример 2.5. Пусть М2 -двумерное многообразие (плоскость), вложенное в пространство R3 с координатами: 1) (х,,х2) и 2) (*1»*г) (рис 2.6) Отобразим многообразие М2 в R3 в многообразие N3 с /?3 (седло), используя отображения/ и / : М2 : (хьх2) eR2->N2\ [хьхъ-х2 +х\) е Л3, M2:(xlix2)eR2^N3:(xlix2i2xlx2)eR2. Уз=Уз Рис. 2.6. Изображение морсовского 1-седла М2 зависит от выбранной системы координат Покажем, что отображения / и / являются эквивалентными. Для этого, согласно формулы (2 103), надо найти диффеоморфизмы h и g. Определим g. Л/2 -> Л/2 следующим образом Замена координат в пространстве независимых переменных. , ч Хг+Х2 - / ч ~Xi+X2 ^l=gl(x)=-J-7rJ-, X2=g2(x)=—V-2-. V2 V2 Отображение /: Л/2 -> //3 ^=yi(x) = x,, ;уз = /з(х) = -*|2+*2- В координатах (^1,^2'^з) многообразие Л^3 задается уравнением у3=-у?+у1 (седло) Отображение /: М2 -> Л^3 55i=/i(^) = ^i, Уг =Л(*) = *2. >)3=/з(^)=2^2 В координатах (i'l,^,^) многообразие /V3 задается уравнением .Рз^йй (седло). Найдем теперь отображение A N3 -> /V3 (замена координат в пространстве зависимых переменных)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы ИЗ Й=*(У> = ^. Уз=*>2(у) = -у}+у1 Убедимся теперь, что полученные отображения действительно удовлетворяют, например, первому выражению (2.104). Имеем g"l00: _ хх - х2 Jc,+jc2 /(«"'(5)) = У\ Уг Х\ ~ Х2 1 I Х\ + Х2 I -» - - :,х2 и, наконец *(/(*-(*)))= Уг = !Г = *: V2 - \2 = ^2> - \2 = /(*), что подтверждает правильность найденных преобразований. Перейдем к понятию устойчивости отображений. Определение 2.10 [1]. Пусть feC00 \Mn ,Nm Y Отображение/называется (c/w/ту/с- турно) устойчивым, если существует такая окрестность Wj точки/в С00 (мп, Nw Y что всякое отражение f ^Wf эквивалентно/ Иными словами, отображение/устойчиво, если всякое достаточно близкое отображение / может быть превращено в/с помощью подходящих замен координат в прообразе и образе / . Как же определить, когда для гладких отображений и, в частности, для гладких функций имеет место устойчивость? И здесь, прежде всего, необходимо найти тот атрибут отображения (функции), который отвечает за устойчивость. Таким атрибутом является росток отображений (функции), о котором мы ранее уже упоминали, теперь дадим ему определение. Определение 2.11 [11]. Пусть М" - гладкое многообразие их- точка Мп. а) Две гладкие вещественные функции / и g, определенные в некоторых окрестностях Ux и Vx точки х, называются эквивалентными вблизи х, если они совпадают (/ = g) в некоторой окрестности GxczUxnVx. Замечание. Это отношение эквивалентности отлично от того, что дано в определении 2.9, и относится к определению ростка функции, а неустойчивости отображений. 9 Зак 416
114 Методы современной ТАУ. Часть IV Пусть f \UX-+ R - гладкая функция, где Ux - некоторая окрестность точки х. Тогда ростком функции f в точке х (обозначение [f]x) называется класс эквивалентности функции по отношению к эквивалентности, введенному в пункте а). Про две функции из одного класса говорят, что они имеют общий росток в точке х. Графически это определение можно отобразить следующим образом (рис. 2.7). Рис. 2.7. Функции/и g с общим ростком в точке jc Таких функций/и g, имеющих общий росток в точке х, может быть бесконечное множество, поэтому росток [/] определяют как класс, т.е. как множество однотипных (эквивалентных) функций по определенному выше отношению эквивалентности. По аналогии с эквивалентностью функций введем эквивалентность ростков функций. Определение 2.12 [4]. Два ростка [f]x и Г/1 гладких функций f:M"^>R и /: М" -> R называются эквивалентными, если существуют ростки диффеоморфизмов прообраза [g]x и образа [h] , переводящие первый росток во второй [/l-MH'L-IV'l- Определение 2.13 [4]. Росток [f]x гладкой функции f\Mn-*R в точке хеМп называют устойчивым, если для сколь угодно малой окрестности Ux точки х существует окрестность Wf функции / в С00 (мп ,/Л, в которой для любой функции feWj в Ux найдется точка х, такая, что росток [/]. эквивалентен ростку [f]x- Устойчивость функции в точке - это свойство ростка, а не функции [4]. Это свойство не теряется при изменении/ не затрагивающих хоть как-нибудь окрестность точки х. Правила нахождения ростков функции и определение их устойчивости будет рассмотрено ниже. 2.1.7. Трансверсальность и устойчивость Теперь мы приступаем к изучению вопросов о том, что определяет структурную устойчивость, как определить ростки функций и найти наиболее универсальное возмущение для данного ростка функции. Начнем с фундаментального понятия, введенного Р. Томом, а именно с понятия «трансверсальность». Г.Э. Винкелькемпер назвал трансверсальность «ключом к открытию секретов многообразий». Существуют различные виды трансверсальности: трансверсальность многообразий, трансверсальность отображений и многообразий, трансверсальность отображе-
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 115 ний. В дальнейшем для нас наиболее важную роль будет играть трансверсальность отображений и многообразий, поэтому мы дадим определение именно этому понятию (по остальным видам трансверсальности см., например, [9, 10, 11, 20]). Определение 2.14 [10]. Пусть Мп и Nm - гладкие многообразия и f\Mn-+Nm - гладкое отображение Мп ci?w,iVm ci?m . Пусть W - подмногообразие в N"1 и х е Мп . Тогда говорят, что отображение/трансверсально многообразию We точке хеМ" (обозначается f rhW в х), если выполняется одно из двух условий: а)/(х)*Ж, (2.105) б) f(x)eW и TNm(f(x)) = TW(f(x)) + (Df)TM"(x). (2.106) Условие б) говорит о том, что если /(х) е W , то касательные пространства к W и f\Mn \ в точке х порождают пространство Rm . Введенные условия трансверсальности позволяют определить структурную устойчивость или неустойчивость отображений и, в частности, функций. А именно: если отображение/трансверсально W в точке х, то оно будет трансверсальным W при малых возмущениях этого отображения [11,31]. Сформулируем это в виде следующего факта. Утверждение 2.1 [11]. Если зависящее от параметра семейство отображений (функций) трансверсально данному многообразию, то для плотного множества значений параметра индивидуальные отображения (функции) также трансверсальны этому многообразию. Рассмотрим пример определения трансверсальности отображений и многобразий. Пример 2.6. Пусть W- одномерное многообразие (прямая), вложенное в Я3 и задаваемое координат- но: W = {xeR3:xx =\ух2= 2,х3}<=>(1>2,х3)• Пусть M2 = R2 - двумерное многообразие в R3 (плоскость) Отобразим М2 = R2 в R2, используя следующее отображение: /: (xj,jc2) e R2 Ц 2хь3х2>е~^+xlA e R3. Тогда /(м2) и Wпересекаются в точке хо=(1;2;еч)'694)еЛ3. В касательном пространстве к^в точке х0 можно взять базисный вектор V3 = (0,0,1) . В касательном пространстве к f\M2) в точке х0 можно взять базисные векторы (рис. 2.8) *3ь / W = (l,2,x3) Рис. 2.8. Определение трансверсальности/и УУк примеру 2.6
116 Методы современной ТАУ. Часть IV Так как det 2 О ,,-0,694 О 3 ~е* О 0 1 = 6*0, то векторы V,,V2,V3 порождают пространство R3. Следовательно, /(^2) трансверсально W в любой точке их пересечения. Пример 2.7. Пусть М = R = W,W <zR2 и / R->R2, /(x) = (x,*2). Тогда f cf\W для всех ненулевых х f можно возмутить сколь угодно мало и сделать / трансверсальным к V/ для всех х А именно: f(M)rfiW = 0 (рис. 2.10, а\ f(M)nW в точках пересечения *„ / = 1,2 (рис. 2.10, б). L f(M) R* Л") w Рис. 2.9. Определение трансверсальности/и Wk примеру 2.7 f(M) ./ f(M) w a) f(M)nW = 0=*f(M)rfiW б) f(M)(t\W в точках дг„/ = 1,2 Рис. 2.10. Возмущение отображения/(к примеру 2.7) Видно, что здесь fix) является морсовской функцией, и теперь мы наглядно видим, а ранее показали это аналитически, что морсовские функции являются структурно устойчивыми. 2.1.8. Многообразия катастрофы и бифуркационные множества Рассмотрим семейство функций f:MnxAp^R9 (2,107) где Мп - гладкое многообразие, Мп с Rn; Ар - другое гладкое многообразие, Лр е Rn ; Rn - пространство состояний; Rp - пространство управляющих параметров (управлений). Определение 2,15 [20]. Многообразие катастрофы М* назовем подмножество в Rn xRp, определяемое уравнением М#: D/(x;a) = 0, (2.108)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы П7^ т.е. это пересечение п гиперповерхностей в Rn xRp: М#:-^-(х;а) = 0, /=п. (2.109) dxt Определение 2.16. Отображением катастрофы % называется ограничение на Мп естественной проекции n:RnxRp->Rp, т.е. п(х,Ар)=Ар. Определение 2.17. Особым множеством S называется подмножество в Мп , сб- стоящее из особых точек отображения х> те- точек (х,а)еМиА где х является особым, т.е. rank D% < p. Определение 2.18. Образ особого множества %(S)<zAp называется бифуркационным множеством и обозначается JB. Особое множество S с Ми и бифуркационное множество JB с Ар имеют меру нуль в соответствующих пространствах, о чем свидетельствует следующая теорема. Теорема 2.2 (теорема Сарда) [11]. Пусть Мп и Nm - гладкие многообразия и f\Mn-±Nm - гладкое отображение. Тогда множество критических значений/имеет меру нуль в Nm . Из введенных определений, в частности, следует, что S - это множество точек (х,а) € М , в которых /(х;а) имеет вырожденную критическую точку, а значит JB - место, где меняется число и природа критических точек; ввиду структурной устойчивости (устойчивость относительно малых возмущений) морсовских функций такое изменение может произойти лишь при переходе через вырожденную критическую точку. Рассмотрим подробно пример, где определим все отображения и множества, которые были введены выше. Пример 2.8. Катастрофа Аъ (катастрофа «сборки»): /(*;а) - [Cat]0 (х) + каноническое возмущение = -х4 + ахх + -а2х2. (2 110) Замечание. Коэффициенты 1/4 и 1/2 взяты для удобства. Итак, последовательно определяем: 1) Многообразие катастрофы (множество критических точек) M*:Df(x;*) = x* + a2x + al=Oy (2 111) ах=-а2х-х\ (2.112) Любая точка реМ* имеет следующие координаты: (хуа2,щ) = (х,а2-а2х-х3). (2 113) Это отображение: Д2->М, (хуа2)->(х,а2,-а2х-х3). (2 114) 2) Множество критических вырожденных точек (особое множество Sa Ми): 3x2+a2=0, D2/(x;a) = 0, (2.115) 6х = 0, D3/(*;a) = 0. (2.116) Из (2.115) получаем точки пространства управляющих параметров, которые определяют вырожденную критическую точку на S с М*(1 = 1):
118 Методы современной ТАУ. Часть IV (2Ш) а2=-3х , => я, =2*. 3) Если исключить xeS из (2.117), то получим \3 / \2 т) ♦(?) -' (2.117) (2.118) Уравнение (2 118) определяет часть бифуркационного множества JB. Оставшуюся часть найдем из выражения (2 116) для дважды вырожденных точек (/ = 2). „ Точка сборки Многообразие катастрофы Л/* а2 Рис. 2.11. Многообразие катастрофы и бифуркационное множество элементарной катастрофы А3 А"2 . +/(*) /м ЧУ U м \ V7 /н ^ ♦ /W «1 Рис. 2.12. Бифуркационное множество JB и вид функции /(х;а) при разных значениях параметров (аьа2): I - 1 критическая точка, II - 2 критические точки, III -3 критические точки
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 119 Имеем: (2 115) (2 111) 6х = 0=>х = 0 => д2 = 0 => д,=0 (2 119) Итак, бифуркационное множество (сепаратриса управляющих параметров) JB состоит из точки (я,,я2) = (0,0) (точка сборки) и-кривой складок, описываемой уравнением (2.118) (рис. 2.11). Функция /(х;а) в разных областях пространства управляющих параметров А2 имеет вид (рис. 2.12). 2.1.9. Топология Уитни. Эквивалентность (устойчивость) функций С ТОЧКИ ЗРЕНИЯ ТЕОРИИ НЕПРЕРЫВНЫХ ГРУПП Цель этого параграфа - ввести топологию на множестве гладких отображений (гладких функций). Все понятия эквивалентности отображений (функций), которые мы ввели ранее, определялись тем, что нелинейной заменой координат можно одно отображение перевести в другое. Но конечные нелинейные преобразования достаточно сложны и трудно реализуемы. Можно ли найти какой-нибудь инфинитезимальный, т.е. работающий с бесконечно малыми преобразованиями, аналог такой нелинейной процедуры, который бы позволил относительно просто решать задачу приведения гладкой функции к каноническому виду? Такой анализ был найден, для чего использовались i-струи гладких отображений (функций). Напомним (см. §2.1), что i-струя в точке х0 =0 (для определенности) jkf(\) - это усеченный ряд Тейлора отображения/в точке х0 = 0 до членов порядка к включительно. Определение 2.19 [11]. Пусть Мп и Nm - гладкие многообразия и хоеМ". Пусть f,g: Мп -> Nm - гладкие отображения, удовлетворяющие условию /(х0) = = £(*о) = Уо- 1) /имеет касание первого порядка с g в точке х0, если Df \Xo = Dg |^ как отображение ТХ()Мп -+TyQNm (т.е. как отображение касательных пространств). 2) /имеет касание к-то порядка с g в точке х0, если Df: ТМп -> TNm имеет касание (к -1) порядка с отображением (Dg) в каждой точке ТХМ" . Этот факт записывается следующим образом: « / ~к g в точке х0 » (к - положительное целое число). 3) Обозначим через Jk [Mn,Nm) множество классов эквивалентности по от- ношению « ~к в точке х0 » в пространстве отображений /: Мп -> Nm, удовлетворяющих условию /(х0) = у0. 4) Сформулируем множество Jk(Mn,Nm)= u Jk (м",Nm ) Элементами множества Jk (Mn,Nm\ являются Л-струи в любой точке \0еМп9 причем каждый элемент j4f можно рассматривать как некоторый класс эквивалентности, т.е. набор элементов, которые эквивалентны друг другу по признаку «все функции, входящие в данный класс, имеют одинаковый усеченный ряд Тейлора до к-й степени включительно в данной точке х0 ». Теперь на множестве гладких отображений можно ввести топологию.
120 Методы современной ТАУ. Часть IV Определение 2.20. Пусть Мп и Nm - гладкие многообразия. 1) Обозначим через С™ (M",Nm j множество гладких отображений из М" в Nm . 2) Фиксируем неотрицательное целое число к. Пусть U некоторое подмножество в Jk(M\Nm}. Обозначим M(U) = {feC-(M\Nm):jkf\x€Mnc:u}. 3) Семейство множеств {M(U)}, где U - открытое множество в Jk (мп,Nm\ образует базис некоторой топологии на С00 [Мп\Nm). Эта топология называется Ск -топологией Уитни. Обозначим через Wk множество открытых подмножеств в С™ \Мп,Nm j в Ск -топологииУитни. 4) С*-топологией Уитни называется топология, базисом которой является w = [}wk. к=0 Введем на Jk \Mn\Nm j метрику d, совместимую с топологией. Открытая окрестность элемента/в пространстве С00 \Мп\Nm\ в Ск -топологии Уитни Bb(f)^{geC^(M\Nm):d(jkf(x)Jkg(x))<5(x)yxeMn]. Семейство {#§(/)} образует базис окрестности точки / в С00^",^) в Ск -топологии Уитни. Мы можем представить себе Bb(f) как множество гладких отображений, у которых к частных производных 5 близки к соответствующим производным/ После введения топологии в пространстве Cco(Mn,Nm ) его можно рассматривать как многообразия Фреше [И]. Более детально структуру и свойства этого многообразия мы рассматривать не будем (подробнее см. [II]). Главная же цель введенных понятий и множеств - это сформулировать инфинитезимальный критерий устойчивости отображений Джона Мазера, который позволит получить конструктивный алгоритм поиска ростка и деформации функции. Так как С00 Шп\Nmj - гладкое многообразие, то можно рассмотреть на C°°(Mn,Nm) действие непрерывных групп преобразований (диффеоморфизмов) (подробнее о группах см. главу 1) где Diff\Mn\ (соответственно Diff\Nm\) - группа всех диффеоморфизмов многообразия Мп (соответственно Nm ). Это действие знакомо нам по диаграмме, определяющей эквивалентность двух отображений/и / е С00 (мп, Nm \
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 12^ мп —£-> Nm gi ih Мп —£-> Nm9 geDiff(Mn\heDiff(Nm\ {gih)eG. Действие G на элемент f еС*{мп,Nm\ определяется равенством (#,/*)•/ = = h-f-g~l = f, т.е. элемент группы G, действуя на/ переводит его в /. Напомним определение (подробнее см. главу 1). Определение 2.21. Орбитой точки f еС*[мп ,Nm\ называется множество G.f = {feC«(M\Nm):f = {g,h).fy{g,h)eG}9 т.е. орбита точки/- это всевозможные элементы, принадлежащие Cco(MniNm)i которые могут быть получены действием на/всеми элементами группы G. Лемма 2.3 (об устойчивости) [11]. Пусть feC°° (Mn,Nm). Отображение/является устойчивым тогда и только тогда, когда орбита / под действием группы G = DifflM") х DiffyN™) является открытым множеством в С00 (Мп, Nm 1. Это лемма говорит о том, что / лежит в орбите/тогда и только тогда, когда / эквивалентно/ Применение этого критерия для нахождения эквивалентных функций также затруднительно, в силу того что весьма сложно определить элемент группы G. Но можно линеаризовать группу, рассмотрев ее инфинитезимальные преобразования в окрестности тождественного преобразования В этом случае решение во многих случаях будет намного проще. Используя фундаментальное свойство устойчивости трансверсальных к многообразиям отображений, Джон Мазер дал инфинитезималь- ный критерий устойчивости отображений (замены переменных). 2.1.10. Инфинитезимальная устойчивость. Алгоритм Д. Мазера Изложим алгоритм Д. Мазера [20, 27, 28]. Предположим, что мы имеем Острую jkf(\) ряда Тейлора функции/в окрестности х0 = 0 . Ясно, что jk f{\) - это полином k-й степени. Если считать, что функция (полином) 7(х) = //(х), (2.120) то задачей является определение всех функций geCco(Mn,Nm)i эквивалентных данной функции /. Если сама функция/будет эквивалентна /, тогда усечение ряда Тейлора не влияет на качественные изменения в поведение данной функции. Пусть xeR. Рассмотрим однопараметрическую замену (действие однопарамет- рической группы Xt) координат (параметр t). Пусть Xtx = х + tq(x)9 Xox = х, где Я(0) = М =0, dxL т.е. полином порядка 2. Функция 8 Зак. 416
122 Методы современной ТАУ. Часть IV foXt:x^f(Xtx) начинает изменяться с Л Мы хотим привести ее к более простому виду. Для этого рассмотрим как начинает смещаться (£+1)-струя jk+\foXtx). Чтобы найти независимые смещения (&+1)-струи в точке jk+lf(x), используем бесконечно малые преобразования. Имеем вектор касательного пространства в точке jk+lf(x) /-►о t в пространстве (£+1)-струй, который будем считать выходящим из точки jMf(x). Из свойств линейного разложения Тейлора вытекает, что Если положить F{x,t) = foXtx = f{Xtx\ то v limJk+\nx,t)-F(x,0)) Компонентами вектора jk+l (F(x9t)-F(x90)) являются различные производные по х. Так как F гладко (по построению), порядок дифференцирования можно изменить v = /♦« r,im^,Q-F(,,O)-| = /+1 СшЛх + *х))-Ю\ V'->o t ) V^o t ) Рассмотрим разложение в ряд Тейлора функции f(x + tq(x)>j по степеням / в точке х. Имеем f(x + tq(x)) = f(x) + tq(x)Df\x -И2/(х,0, (2.122) где /(л:, 0 - гладкая функция (это не зависит от того, сходится этот ряд Тейлора или нет). Поэтому (2.121) с учетом (2.122) примет вид v = /+1 {\im±(nx) + tq(x)Df\x +t2l(x,t)-f(*)fj = /+1 (q(x)Df \x). (2.123) Таким образом, для (М1 = Rl) v является конструкцией функции q— = qDf \x, т.е. ^ dxJ \ (2.124) <7(0) = ^(0) = 0. ах Для дальнейшего анализа алгоритма Мазера нам необходим некоторый дополнительный математический аппарат. Имея дело со струями, часто приходится производить «усеченные» алгебраические операции. Для данного многочленар(\), где х = (хх,...,хп), мы назовем его усечением до степени к (включительно), многочлен, образованный всеми членами к /?(х), степени которых равны или меньше к. Это усечение обозначим через р[\) . Например: г 2 Ъх-2у + 1ху + 9х j+43jc^ = Зх - 2у + 7ху. Фактически (напоминаем х0 = 0)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 123^ Щк=/р(х). (2.125) (Проверить!). Фиксируем какое-нибудь значение &, и пусть р и q - произвольные многочлены. Тогда p + q =pk+qk. (2.126) Для произведений соответствующая формула имеет вид РЯ=ркЯк . (2.127) На основании этого анализа мы сможем рассмотреть операции над ^-струями: j\p + q) = jkp + jkq, (2-128) 7* jk{pq) = (jkp)(jkq) > (2.129) JkUoq) = jkjojkgk (2.130) (струйный аналог «цепного правила»). «Цепное правило» - обобщенное правило дифференцирования сложных функций, суть которого состоит в следующем. Если / :Rn -» Rm - дифференцируемое отображение в точке, a g\Rm —» Rp - дифференцируемое отображение в точке /(х), то композиция отображений gof:Rn^Rp9^gof = g(f(x)) также является дифференцируемым отображением в точке х и ее производная находится по формуле D{gof)\x=Dg\f{x)oDf\x. С А:-струями функций связан ряд векторных пространств (пространства /:-струй), где элементами векторов являются соответствующие коэффициенты ряда Тейлора в точке х0 = 0: Ek={jkf:BCQf:Rn^R}9 (2.131) 4={//:все/:ЛЛ^/?с/(0) = 0}, (2.132) /*={//:Bce/:^->«c/(0) = 0,zy|0=0}, (2.133) Мк = {jkf: все/: R" -+ R порядка к(к> 2); (2 ] щ ряд Тейлора начинается с &-го элемента}. Короткий комментарий. Пространство Ек совпадает с пространством Jk(Rn,R) в обозначениях предыдущего параграфа; Jk не требует комментария; 1к - множество £-струй функции с критическими точками; Мк - множество Л-струй функций, у которых отсутствует начальный участок ряда Тейлора С учетом алгебраических операций (2.128) - (2.130) вектор v (2.124) касательного пространства можно записать следующим образом: v = /+I(**)f)-/+W/+If'+1. (2-135) Струи jk+]q(x) образуют векторное пространство /j*+1, которое можно представить себе как пространство всех многочленов со степенями одночленов, заключен- 8*
124 Методы современной ТАУ. Часть IV ных между 2 и (£+1). Выбрав какой-нибудь i тересующего нас касательного пространства iep, странстве jk+lf(x) будет ных между 2 и (£+1). Выбрав какой-нибудь базис в /j*+1, мы можем найти базис ин- Например, если полиномы р{(х),...,рг(х) в 1хк+], тогда базис в касательном про- /+1(Л(*)01£«-£г. (2.136) Из них можно отбросить те, которые после усечения оказываются линейными комбинациями других. Очевидно, базис в IXM: jc2,jc3,...,jc*+i . Возьмем для примера 1хк+\к = 3). Предположим, что ff{x) = px2+qx3+rx4. Тогда /[ — I (х) = 2рх + Зрх2 + 4гх3 + ах4, \dx) где а зависит от 5-й производной/ которую нельзя определить по 4-струе. Выбирая x2,*3,*4 в качестве базиса для 1хк+х, приходим к следующей системе образующих для касательного пространства к орбите струй f f под действием группы замены переменных: рх = / Г*2 (2рх + 3qx2 + 4пс3 + осе4 )1 = 2рх3 + 3qx4; р2 = / [х3(2рх + 3qx2 + 4гх3 + осе4)] = 2рх4; ръ = f [V (2рх + 3qx2 + 4гх3 + осе4 )] = 0. Для/? Ф 0 получаем 4 1 ' -тР»_ Д. Мазер показал, что, если базис phi = l,r позволяет получить любой одночлен степени (Л+1) в виде линейной комбинации базисных элементов phQ= Ь^) с постоянными коэффициентами, тогда Л-струя jkf(x) эквивалентна множеству функций jkf(x) + g(x)» гДе &(*) ~ полином порядка (к+1). В этом случае такую функцию называют ^-определенной. Дадим точное определение. Определение 2.22. Функцию /(х) назовем к-определенной в точке х0 (здесь принято х0 = 0), если для любой другой функции / с той же самой Л-струей существует гладкая замена переменных, такая, что Дх) = /(*(х)). Нахождение ^-определенности функции /(х) позволяет найти (если, конечно, это возможно) полином конечной и достаточно небольшой степени, эквивалентный/ Из этого следует, что если jkf(x) = f(x) и /(х) эквивалентна /(х), то возможно усечение ряда Тейлора для функции /(х) до &-й степени включительно.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 125^ В случае функций многих переменных f:Rn-+R общий касательный вектор к орбите (£+1)-струи jk+]f(x) будет [4] где Qj - произвольный полином из Ixk+l. Так как любой член порядка к и (£+1) в jk\ — исчезает после умножения на элементы QXx) порядка >2 и усечения до [dxj *+i. (Л+1)-й степени, касательное пространство к орбите j f зависит только от много- членов jk+l -I- . Итак, ^-определенность функции /(х),х е R" означает, что каж- [dxj дое направление в Mnk+l (см. (2.134)) фяд Тейлора начинается с (&+1)-й степени) лежит в этом касательном пространстве. Алгоритмически это означает, что Ht+i Л taW/+1(^J :flW6//+1 • (2-138) Если (2.138) выполнено, то каждая гладкая функция g: Rn —> R порядка (k+\) может быть представлена в некоторой окрестности нуля (х0 = 0) в виде %^ь ■ где <?Дх) - гладкие функция порядка < 2 . Алгоритм Д. Мазера для вычисления ^-определенности функции //-переменных [9, 27, 28]. 1. Вычислить полиномы: RiJ(x) = jM\jj-pJ(x)\ /,7 = 1,2,..., (2.139) где {pj(x)) - базис пространства |//+l :х,2,...,^, ххх2,..., ^i^...}. 2. Функция f{x) будет k-определенной, если все одночлены (к + \) степени могут быть записаны в виде линейных комбинаций полиномов Ry(x) с постоянными коэффициентами, т.е. выполнено включение (2.138). Пример 2.9. Вычислить определенность функции (х0 = 0) Предположим, что к - 3, тогда Найдем полином Rlt(x): /(x) = i(JCl+jt2)2+iX|. (2 140) +(6*,+2*2)|^=ол;?+4^^ х} + хх\ х,+ (2 141)
126 Методы современной ТАУ. Часть IV где знак = означает равенство с точностью до некоторых постоянных множителей, не влияющих на базовый полином Ru(x). Представление (2.141) говорит о том, что если разложение в ряд Тейлора производится в нуле хо = О, то (А+1)-струя для всех полиномов со степенью s<,k + \ будет совпадать с самим полиномом. Это было показано для полинома (х, + x2)xf . Рассмотрим случай, где s > к +1. Например, 1 В табл. 2.2 приведены полиномы R,j(x) для функции /(*) = — (х, +х2) +—х\. Таблица 2.2 j 1 2 3 4 5 6 7 8 PjM *!*2 4 х\х2 ххх\ 4 (хх+х2)х1 (xl+x2)xlx2 (xt+x2)xl (x{+x2)xl (x]+x2)xfx2 (*1+*2)*2*1 (Xi+x2)x\ 0 1 дхх J _ Rij(x) = / ~fPjw _dx2 J (xt + x^xf+xfxl (xl+x2)xlx2 + xlxl (x{+x2)xl + xt (Х,+Л2)х,3 (хх + х2)х^х2 (*!+*2>*2*l (xi+x2)xl 0 I Все множество одночленов степени k+\ = 3+1 = 4 может быть выражено через Яу(х). Действительно: x42=R23(x)-Rn(x), xlxl = R12(x)-Rl2(x), xtxl = R2i(x)-Rn(x), xlx2=R25(x)-(R2l(x)-Rn(x)), xf = R24{x) - {R25(x) - (R2l(x) - Rx ,(x)). Таким образом, функция fix) в нуле является 3-определенной. 2.1.11. Деформация (универсальные возмущения) функции Функции с неморсовскими критическими точками, к которым относится и ростки функции катастроф, могут устойчиво встречаться лишь в семействах функций, зависящих от одного или более управляющих параметров. Поэтому можно изучить возмущения на данную функцию с вырожденной критической точкой, вложив немор- совскую функцию/х) в семейство функций F(x\a): / = /(х),х = (*!,...,*„), (2.142) F = F(x;a),a = (a1,...,a;?) (2.143) - вектор параметров /(x) = F(x;0). (2.144) Определение 2.23. Семейство функций F(x\ а) называетсяр-мерной деформацией функции^х). Чем больше семейство функций, тем больше общие возмущения могут быть описаны. Можно ли найти такое семейство, которое, с одной стороны, достаточно велико, чтобы с его помощью можно было описать все возможные качественно различ-
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 127_ ные возмущения X*), а с другой стороны, достаточно мало, чтобы с ним было легко работать? Такие возмущения были найдены. Определение 2.24 [20]. Заданная р-мерная деформация F(x;a) называется вер- сальной, если любая другая деформация F(x\a) функции Дх) может быть получена из нее путем гладкой замены переменных: (2.145) uj =aj(a),j = lp, где р не обязательно равно р. Определение 2.25. Деформация F(x\ а) называется универсальной деформацией /(х), если она является версальной и имеет минимальную размерность. Д. Мазер [27, 28] предложил алгоритм определения универсальной деформации (возмущения) функции (в теории катастроф - это ростки функции катастроф). Алгоритм требует найти число ^-определенность функции/*), для того чтобы ра- боть лишь с полиномом f(x) = jkf(\). При этом предполагается, что • иу-последовательность одночленов от переменных xl,x2,...ixl (/ - число не- морсовских переменных) степеней 0, 1, 2... rij : l\xl9X2,..,xl\Xx,xlx2.. ; (2.146) • F(x:a) является/?-мерной деформацией полинома f(x). Определим многочлены Г,(х) =—jk+lF(x-a)\a__o. (2.147) aj Кроме того, должны быть перечислены все многочлены вида: 5(/(х) = /|^-«у(х)1. (2.148) Тогда, если все одночлены степени не выше к могут быть выражены в виде: любые одночлены степени < к = ^s^Sy (x) + ^tjTj(x), (2.149) U J (где Sy-ytj - вещественные числа), то это означает, что F(jc; а) является версальной деформацией /(х); если 7}(х) минимально, то F(x;a) - универсальная деформация полинома /(х). Полиномы Tj(x) образуют минимальное множество тогда и только тогда, когда они линейно независимы. При нахождении канонической линейной (по 7)(х)) формы универсальной деформации полинома f(x) F(x;a) = /(x) + f>y7}(x) 7=1 для определения параметров деформации яу может быть применена теорема о неявной функции. Пример 2.10. Вычислить универсальную деформацию функции (ростка катастрофы D^ , см. табл. 2.1) Дх) = х?х2+х1/3. Ясно, что полином
128 Методы современной ТАУ. Часть IV /« = /А*) = /« = *12*2+*23/3. Функция /(*) является 3-определенной (проверить!). Имеем Найдем полиномы S,j(x) (формула (2.148)). . |4*) = 2*,*2,£-(x) = *? + **. Таблица 2.3 j 0 1 2 3 "j 1 х2 sly(x) = / f*;(x)~ ax, ; xfx2 х\4 0 *|(*|2 + *2> X2(X,2+X22) 0 Ни один из одночленов первой степени х{,х2 не может быть выражен в виде линейной комбинации S,j , поэтому полагаем 7J(x) = xly Т2(х) = х2. Для одночленов второй степени в качестве базисных можно использовать Su(x) = xlx2, S2l(\) = дг,2 + х\. Множество полиномов второй степени является линейным вектором пространства размерностью 3. Два базисных вектора Su{\\ S2X{\) уже есть. В качестве третьего вектора можно взять х2,*2 или х2 -х\ . Возьмем Т3(х) = х\. Все одночлены х\,х\хъххх\,х\ (А: = 3) могут быть выражены с помощью полиномов Si}{x). Например xl = Sl3(x)-Sn(x). Таким образом, универсальной деформацией (с точностью до гладкой замены координат).Дх) будет х3 F(x\alia2ia3) = xtx2+-Z- + a]xi + a2x2+ajc22. 2.1.12. РОСТОК ФУНКЦИИ КАТАСТРОФЫ Росток функции в точке х0 представляет собой результат двух процессов: использование управляющих параметров для удаления начальных членов разложения функции в ряд Тейлора и использование гладкой замены переменных для удаления крайних членов разложения. В действительности росток лежит между двумя линейными векторами пространства, конструируемыми в алгоритмах вычисления определенности и деформации (возмущений). Алгоритм нахождения ростка функции можно определить следующим образом [10,28]: 1) найти ^-определенность функции, после чего можно работать с полиномом /(х) = //(х); 2) пусть Vk - линейное векторное подпространство, порождаемое всеми одночленами от хх,...,хе (переменные неморсовской функции степени) не выше к, при этом ,. .. (* + /)! dimK*=^7T; 3) пусть VR - линейное векторное подпространство Vk, порождаемое всеми многочленами R,j(x), получаемыми в алгоритме нахождения определенности;
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 129 4) пусть VD - линейное векторное подпространство, порожденное минимальным множеством 7}(х), получаемых в алгоритме деформации. Тогда Vk-(VR®VD) = Vkl(yR®VD) является линейным векторным пространством, порожденным первыми частными производными ростка/ Пример 2.11. Найти канонический (простейший) росток [/]0(х)> связанный с функцией Л*1,х2) = х2х2 + х\/3 + х\/2, (/ = 2). Наша задача: найти определенность данной функции, что позволяет отбросить «хвост» порядка (А+1) всех функций, имеющих такую же Дг-струю, а затем в Дг-струе извлечь информацию об универсальной деформации. Остаток и есть росток данной функции. Прежде всего найдем полиномы /?^(х) и 5^(х), связанные с нахождением ^-определенности и деформации (возмущения). Данные функции приведены в табл. 2.4. Сразу заметим, что в данной таблице помещены полиномы RtJ{\) и для базисных одночленов хьх2, которые не используются для нахождения к- определенности данной функции, но необходимы в дальнейшем для определения размерности пространства VR . Функция Дх) является 4-определенной, 5 членов 5-й степени х[х{, (/ + / = 5, / = 0,5) из 6 непосредственно совпадают с отдельными полиномами Rtj{x) (они заключены в штриховую рамку, например х\ = #2,1зОО), а оставшийся одночлен х\ = Rlb{\)- Rxl{\)- Ru{\) является линейной комбинацией ^;(х). Полиномы для нахождения ростка функций f(x) = х2х2 + х\ /3 + х\ 12. Перейдем к определению пространств VkiVRyD. Пространство Ук = У4 имеет размерность (/ = 2) * kill 4!2! Таблица 2.4 j 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 - xi Х2 хххг 4 *? х\*г х\*\ 4 х]хг *\*\ х\хг А А 1 ^i Х2 *i ххх2 4 Х1хг ххх\ 4 xi - - - - — - х\х2 х\4 4хг 44 х\4 \xfx2 \x\x\ \44 "о"" 1 х\хг х\хг х\4 4Х2 44 х\4 0 1 Л2у(х) = - дг,3 + хх2х2 + ххх2 ^^2 +Х1Х2+ Х{ Х% 44+4^) х\+х\х\+х]х2 х*х2 + х1х\ + х\х\ х]х\ + ххх\ + ххх\ Х\ Х2 ~^" Х2 "^V^2 У г-4-"« \Х\Х2\ '3 2' \Х\4\ ! x{2xl! 1 d • \Х\Х2\ • 5 ; 0 1 S2j(x) = ■ASM 4+4+х2 х,3 + ххх\ + хх х2 Х2ХХ2 + ^2+^2 х\4+х12х1+х12х2 xx2x2+xlxl + xlxl x2xl+x\ + x\ 4Х2 44 xi4 4 0
130 Методы современной ТАУ. Часть IV Для нахождения размерности пространства VRcV4i базисом которого являются полиномы /^(х), представим базис пространства V4 в виде узлов некоторой сетки, где узлы определяют базисные одночлены V4 (произведения x[x'2(i + j < 4, ij= 0,4)) (рис. 2.13). Х2 \ 0^ 4 £$- *г 4 О Ш -& \ *1 v° X] V2 Y3 4 JC| * JC| Л] -Xj Рис. 2.13. Базисные элементы пространства У4 Прежде всего, найдем полиномы (одночлены) /^(х), которые в точности совпадают с некоторыми базисными одночленами У4 . Это одночлены /fy(jc), /= 1,5 (они обведены сплошной тонкой рамкой в табл. 2.4 и отмечены на рис. 2.13 черными кружками). Следующие базисные одночлены подпространства VR получены в виде линейной комбинации полиномов /fy(x), в табл. 2.4 они обведены кружком, а на рис. 2.13 представлены белыми кружками. Имеем х< = Д29(х)-Д2|2(х)-Я214(х). Заметим, что полином Л28(х) = Л2,4(х) + Л2>13(х)+ /?i5(x)' те* является линейной комбинацией других полиномов. Далее 4 = Я25(Х) - ДмЮ - (*29« " Я2,12(Х)Я2.14М); xi=R23(x)-Rl4(x)-Rn(x); 4 = Д22(х) - Л, ,(х) - (Я25(х) - Л14(х) - (Я29(х) - R2,M - R 2tlix))). Других базисных одночленов мы получить больше не можем, но к 9 базисным одночленам мы можем добавить линейно независимый многочлен R2\(x) = xl + xlxj+ Х\Х2. Таким образом, размерность сИтКл = 10. Для определения размерности пространства VD необходимо дополнить базисные одночлены (черные и белые кружки на рис. 2.13) пространства VR независимыми полиномами 5^(х) и получить размерность пространства полиномов ^(х). Это два одночлена х|х2 = 5|0(1), x* = S2l(x)-Sl2(x)-Sw(x). На рис. 2.13 эти базисные элементы показаны треугольниками. Линейное подпространство V4, порождаемое полиномами Sy(x), определяется 11 базисными одночленами (черные и белые кружки и треугольники) и многочленом S20(x) = х\ + х\ + х2. Дополнение к этому пространству в V4 имеет размерность 15 - 12 = 3 и порождается многочленами Tj (x). В качестве базисных векторов этого пространства VD выбираем три одночлена, l,xt, x? (показаны на рис. 2.13 прямоугольниками).
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 131 Тогда пространство VR®VD порождается одночленами, изображенными на рис. 2.13 белыми и черными кружками и квадратами вместе с многочленом R2l(х) = х,3 + х,х\ + х,х2 . Пространство V4 -(VD @Vr) имеет размерность 15 - (10+3) = 2 и порождается двумя линейно независимыми комбинациями из трех одночленов х3, х{х2, х2, которые также линейно независимы от Л21(х) • В качестве базисных векторов удобно взять пару одночленов х2, х,3. Первые производные ростка [/]0(х) порождают двумерное пространство ^-[/]о«~*?,^-[/]о«~*2- <ХС| ОХ2 Следовательно, [/]0W = cucf + Px22,a^0, р*0 и /является 4-определенной. Как только определим знаки а и р, то с помощью обычного преобразования масштабов получим канонический росток вида ±х,4 ± х\ . Матрица Гессе функции.Дх) в точке х0 = 0 имеет вид «1-е г так что коэффициент р, связанный в ростке [/]0(*) с х\, должен быть положительным. Коэффициент a одночлена х\ должен быть отрицательным. Это может быть определено путем решения уравнения J{\) = 0. Линия корней и знаки функций в трех открытых областях, на которые эти линии корней разбивают пространство R2, изображены на рис. 2.14. Если взять <х>0 , т.е. сделать [/]0(х) и соответственно /(х) положительно определённой функцией, то из рис. 2.14 видно, что область G+ = {lUH:/(*)>0} состоит из двух компонент связности и любая деформация, соединяющая две точки из области I и II, например, С и D, должна проходить через границу /(х) = 0. Это обстоятельство не позволяет сдеформировать любой росток ax,4 + Px2,a>0,р>0 непрерывным образом в функцию /(х). Напротив, в области G" = {III :/(х) < 0} любые две точки, например А и В, могут быть продеформированы друг в друга, поэтому эта связная область и росток ax,4 + pX2,a<0,*p>0 можно продеформировать непрерывно в /(х). Таким образом, необходимо взять росток [/]о(х) < 0, т.е. отрицательно определенную функцию, и, следовательно, a < 0 . I /W<o Рис. 2.14. Корни уравнения /(х) = 0: /(x) = xfx2+x23/3 + xf/2 = 0 = x2 hc,2+ifx2+|j -~ Итак, окончательно канонический росток функции
132 Методы современной ТАУ. Часть IV имеет вид 2.1.13 Пример исследования бифуркационного поведения летательного аппарата Рассмотрим поведение симметричного реактивного летательного аппарата, для которого потеря устойчивости соответствует одной элементарной катастрофе [10,29]. Переменные состояния: три компоненты угловой скорости xx=(bxi х2=(йу, х3 = cdz, х4 = а (угол атаки), х5 = р (угол скольжения), xeR5. Управляющие параметры: а е R2. В данном случае мы их обозначим так, как принято в теории управления - через и и назовем управлением. Итак, И1=Д1=5э=-(8э.л+5э.п), где 5ЭЛ, 5ЭП - отклонение соответственно левого и правого элеронов; 1 (2.150) и2=а2=5в=--(5вл+5вп), (2.151) 5BJ1,5ВП - отклонение соответственно левого и правого рулей высоты. Таким образом, имеем х € R5, u(= a) e R2. Уравнения движения летательного аппарата имеют следующий вид: х,=/,(х;и), / = U чеД2, (2.152) стационарное решение которого х/0 = 0, / = U; Uj0 = 0, j = п. . (2.153) Разложим систему уравнений (2.152) в ряд Тейлора в окрестности стационарной точки (х0 = 0, и0 = 0). Имеем ,=y^,y+Z^My+ZZ. л'Ы %диЛ J %^^М XjXk,i = 1,3; (2.154) *.Л& ~l JU У-1&У ху+Е ди, uj, / = 4,5. (2.155) 7=1 ^J В разложении (2.154), (2.155) первая сумма представляет линейные аэродинамические составляющие, вторая сумма - линейные управляющие воздействия, третья сумма (2.154) учитывает инерционные параметры. Стационарные решения системы (2.154), (2.155) находим, полагая *,=0, / = ТЗ"; 5 Я/* I 2 Я/* I 3 3 Я2 /* I >1&Ло ,=.'9«, >1*>^А*|0 Ьо, J J—lb,. j.\ ди, Uj. (2.156) (2.157) Обозначим для удобства
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 133 Щ = ^;/=4,5,у=1,5; дх J\o Щ ;у= 1,2,1=1,5; ди */, 1 _ dxjdxk\ = Bijk- (2.158) (2.159) (2.160) Два уравнения (2.157) линейны по переменным хь...,х5. Используя их, выразим переменные х4, х5 с учётом ((2.158) - (2.160)) в виде линейной комбинации управляющих параметров и остальных переменных jc,,...,jc3 . Подставляя эти выражения в (2.156), получим 3 нелинейных алгебраических уравнения 2 ~ 5 0 = Z^iywy + 1LKXJ + *1,23*2*з> 7=1 у=1 2 5 0 = Z^27W7 + Z А^у + ^2,31^3^1, [ (2Л61) 7=1 7=1 2 5 0 = Z^37W7' +ZAy*>^3,12*1*2. 7=1 7=1 Константы UiJ9F\j получены при подстановке хА и х5 в (2.156) и приведении подобных членов. Инерционные члены не изменяются, т.к. в их сумму не входят переменные JC4, JC5- Решим систему алгебраических нелинейных уравнений (2.161). Выразим из второго и третьего уравнений (2.161) переменные х2,х3 через переменную хх где 2 а(х)' 3 a(x,W)j а(X) = (F23 + ^3^,)(F32 + Я3,21*1)-^22^33 . (2.162) (2.163) &(*.и) = ч£#зу«у+£лХ^ (2.164) 7=1 >1 &(X,U) = -(Z^27W7^ +^2Л)(^23 +*2,31*l) + ^22(Z*V7 +^l^l)- (2-165) 7=1 7=1 Подстановка (2.162) - (2.165) в первое уравнение (2.161) приводит к следующему алгебраическому уравнению: o=Z^7w7a2w+^ia2(^u)+ 7=1 (2.166) +F12a(x,u)e2(x,u)+/;3a(^«)e3(^»)+^a(^»)a(^»)- Это уравнение 5-й степени относительно переменной х = хх. Заметим, что Q\(x) не завит от управляющих параметров (управлений).
134 Методы современной ТАУ. Часть IV Рассмотрим конкретный числовой пример. Пусть (2.166) имеет вид (напомним, здесь обозначено и = а) 5 0 = Zfl*x* =grad0(x;u) = 0;(x;u); (2.167) *5=-21,6; *4=-326,44и,; аъ = 50,Зм2 +358,9; сзг2 = 5412,6^; ^=11752,81/2-1525,9; а0 =-23015г/!. Выражение (2.167) определяет двумерное многообразие (гиперповерхность), погруженное в трехмерное пространство R3 с координатами (х; щ; и2). Определим бифуркационное множество Ув для функции Ф(х; и), т.е. множество меры нуль в пространстве управляющих параметров (u e R2), точки которого параметризуют функцию Ф(х\ и) с вырожденными критическими точками. Для этого нам необходимо найти пересечение 2-х гиперповерхностей Ф;(х;и) = 0, (2.168) <J£(x;u) = 0. (2.169) Используем переменную х для параметрического представления управляющих параметров (управлений) (щ(х),и2(х)) на бифуркационном множестве Ув. Запишем <p;(*;u) = 2>,(u)*'=o, /•=0 /«о v.0-1) - = 0 (2.170) (2.171) в матричном виде. Имеем 1 5jc5 4jc4 3jc3 2jc2 1 0 0 0 50,3 0 -21,6 0 358,9 0 11752,8 -1525,9 0 0 = 0. (2.172) 0 -326,4 0 5412,6 0 -23015 Каждому значению х в (2.172) соответствует пара совместных уравнений для управлений (щ;и2). Решение этих уравнений единственно при условии, что определитель системы не равен нулю. Параметрическое представление кривых складки (цх(х)\и2(х)) показано на рис. 2.15. Эта проекция многообразия катастрофы на плоскость управляющих параметров (управлений) м1=5э;м2=5в формирует бифуркационное множество Ув. Множество Ув 3-х делит плоскость R2 управляющих параметров на открытые непересекающиеся области, в которых функция Ф{х\ и) имеет различное число (1, 3, 5) критических точек, а динамическая система соответственно 1, 3, 5 устойчивых или неустойчивых состояний равновесия.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 135 0.12 0.1 0.08 0.06 0.04 0.02 0 -0 02 -0.04 -0.06 "2 =SB(рад) -1 -0.5 0 0.5 1 м,=5э(рад) Рис. 2.15. Бифуркационное множество Jb многообразия катастрофы реактивного летательного аппарата в плоскости управляющих параметров 63,5B(w,,w2). Цифры указывают на число состояний равновесия (устойчивых и неустойчивых) Рассмотрим случай, когда управление производится только элеронами 5Э, т.е. щ при фиксированном положении руля высоты и2 =5В =0,01 рад «0,6° (сечение А, рис. 2.15). Пусть щ\ы0 = 0, и мы начинаем медленно увеличивать угол 5Э = щ . Сначала переменная х{(=юх) линейно реагирует на.изменение щ (рис. 2.16), но при достижении точки а(~ 6°), т.е. при попадании на бифуркационное множество Ув, скачком переходит на нижний лист (точка 5, рис. 2.16). На этом листе состояние летательного аппарата по координате х = х} = ®х совершенно неуправляемо при отклонении элеронов (-25° <их< 25°). Другими словами, если пилот попытается вернуть летательный аппарат в состояние х = 0, уменьшая щ при и2 = const, он потерпит неудачу. Летательный аппарат не будет реагировать на изменение щ до тех пор, пока не достигнет значения щ «-25° (точка в, рис. 2.16), при котором происходит скачкообразный переход на верхний лист. Последующее увеличение щ вновь сопровождается отсутствием необходимой реакции вплоть до значения щ = +25° (точка д), при котором точка* вновь перескочит на нижний лист (точка е). Средний лист остается недостижимым при и2 = const = 0,6° . Заставить систему вернуться на средний лист (в том числе в состояние х = х{ = 0 ) можно только изменив оба управления щ и и2.
136 Современные методы ТАУ. Часть IV X = Xi -40 -30 -20 -10 10 20 30 40 «1=8, С) Рис. 2.16. Зависимость координаты х, = сох от угла поворота элеронов при постоянном отклонение руля высоты 0,6° (сечение А, рис. 2.15) Если взять другое сечение, и2 = const, например, увеличить и2 до и2 =1,2° (сечение Б, рис. 2.15), то точки скачкообразного перехода с нижнего листа на верхний и наоборот еще более сдвинутся (точка г'« -60°). Таким образом, на основе использования теории катастроф возможно качественное изучение особенностей поведения динамических управляющих систем, в том числе получение бифуркационных множеств и устойчивых компонент многообразия систем. liX = X и -60 -40 -20 20 40 60 Мв) Рис. 2.17. Зависимость координаты х, = шх от угла поворота элеронов при постоянном угле отклонения рулей высоты 1,2° (сечение Б, рис. 2.15)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 1Т7 2.2. ДЕТЕРМИНИРОВАННЫЙ ХАОС 2.2.1. Бифуркации и хаос При рассмотрении функций катастроф мы установили, что фундаментом их изучения являются теория особенностей гладких устойчивых отображений и теория бифуркаций. Изменение качественной картины фазовых траекторий при наличии бифуркаций иногда приводит к возникновению нового типа движений, которое получило, и вполне обоснованно, название «хаос». Совсем недавно было обнаружено, что движение некоторых очень простых динамических систем не всегда можно предсказать на большой интервал времени. Такие явления были названы хаотическими. В чем же различие между случайным и хаотическим движением? При случайном движении мы имеем ситуации, когда неизвестны действующие силы, а известны, например, случайные характеристики некоторых параметров. При хаотическом движении мы рассматриваем задачу как детерминированную, где отсутствуют случайные или непредсказуемые силы или параметры, а характер движения динамической системы в значительной степени зависит от начальных условий. Такая динамика возможна только в нелинейных системах. А. Пуанкаре, стоявший у истоков нелинейной механики, в очерке «Наука и метод» писал: «иногда небольшая разница в первоначальных состояниях вызывает большие различия в окончательном явлении. Небольшая погрешность в первом вызвала бы огромную ошибку в последнем. Предсказание становиться невозможным». В современной литературе термин «хаотический» применяется к таким движениям в детерминированных физических и математических системах, траектории которых обнаруживают сильную зависимость от начальных условий. Системы с хаотической динамикой иногда еще называют системами с нерегулярной динамикой. Подчеркивая детерминированность задачи, хаос иногда называют детерминированным [25]. Следует ли считать хаотические движения исключительным случаем в реальных физических задачах или они встречаются в широком диапазоне изменения параметров (что напрямую, как мы видели ранее, связано с возможностью появления бифуркаций)? При проектировании систем управления необходимо уметь предугадывать их поведение. Выбрав параметры, при которых могут возникнуть хаотические колебания, проектировщик лишается возможности предсказывать поведение системы. До недавнего времени основным инструментом при расчетах системы управления была линейная теория. Но потребности современных технологий приводят к тому, что рабочие значения параметров переместились в область нелинейных режимов, что увеличивает возможность возникновения явлений хаотической динамики. В каких динамических системах могут возникнуть хаотические колебания? Прежде всего в системах, где присутствуют сильные нелинейности [17]: 1) колебания изогнутых упругих структур; 2) механические системы с зазором или мертвой зоной; 3) динамика колесо - рельс; 4) системы с трением скольжения; 5) системы управления с нелинейными обратными связями] 6) лазеры и нелинейные оптические системы. Хаотические звенья обладают новым геометрическим свойством, называемым фрактальной структурой, что нельзя наблюдать в классической нелинейной механике. Фракталы, фрактальные размерности, странные аттракторы будут подробно рассмотрены в данной главе, но начнем ее мы с парадигм хаоса, потому что, как за-
138 Современные методы ТАУ. Часть IV метил Томас Кун (цит. по [17]), «крупные изменения происходят в науке в общем не тогда, когда выдвигаются новые теории, а когда меняются простые модели, с помощью которых ученые формируют и осваивают новую теорию». Парадигма (греч. paradigma - пример, образец), как известно, - это концептуальная теория, модель или задача, которая охватывает основные свойства целого класса задач. Известны парадигмы: теории колебаний - модель, состоящая из массы и пружины; нелинейной динамики - движение маятника или задача 3-х тел. Парадигмами хаоса являются странный аттрактор Эдварда Лоренца и логистическое уравнение, к изучению которых мы и приступаем. 2.2.2. Парадигмы хаоса: странный аттрактор Лоренца и логистическое уравнение 2.2.2.1. Аттрактор Лоренца В 1963 г. специалист по физике атмосферы Э.Н. Лоренц из Массачусетского технологического института предложил простую модель тепловой конвекции в атмосфере, которая, как затем выяснилось, стала хорошей моделью для изучения турбулентности. Представим себе слой жидкости, находящийся под действием сил тяготения, который подогревается снизу. Пусть То - температура в верхней части слоя жидкости, Тх - соответственно нижней (рис. 2.18). 2 ,У g 11 Тепловой поток Рис. 2.18. Модель тепловой конвекции Лоренца ttt Когда эта разность становиться достаточно большой, возникают циркулярные, подобные вихрям, движения жидкости; жидкость, подогреваемая снизу становится легче и всплывает, а более тяжелая опускается под действием гравитации (рис. 2.18). В общем случае тепловые процессы и конвективные течения жидкости описываются уравнением теплопроводности и уравнением Навье - Стокса, которые являются уравнениями в частных производных. Э. Лоренц сделал ряд допущений и получил 3-х мерную модель тепловой конвекции в обыкновенных дифференциальных уравнениях: xl=c(x2-xl)9 (2.173). x2=pxl-x2-xlx3, (2.174) *з=*1*2"Р*з> (2.175)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 139 где хх - безразмерная переменная, пропорциональная амплитуде скорости, с которой жидкость циркулирует в жидком кольце; *2,х3 ~ безразмерные переменные, которые отражают распределение температуры по каналу. В уравнениях (2.173) - (2.175) присутствуют 3 параметра: а, р - связаны с числами Прандтля и Рэлея соответственно, а р описывает геометрию системы: а = 10, р = 8/3, р>1 - набор значений, которые предпочитают специалисты в данной области. В дальнейшем при исследовании два параметра р, р считались постоянными, а изучалось влияние р на динамику описываемых конвективных процессов (р > 0). Рассмотрим состояние равновесия для уравнений Лоренца (2.173) - (2.175). Имеем 0 = а(*2-х,), (2.176) 0 = рхх-х2-хххЪ9 (2.177) О = х1лг2-рлг3. (2.178) Уравнения (2.176) - (2.178) имеют 3 решения, т.е. существует три положения равновесия: 4° = (0;0;0), (2.179) 42) = (>/P(p-1Wp(/-1);p-1) (2-18°) х® = (-7р(р-1); -VP(P-I); Р -1) (2.181) Первая неподвижная точка х{/ соответствует состоянию теплопроводности без движения жидкости (происходит диффузионная форма передачи тепла, без конвекции). Линеаризируя уравнения (2.173) - (2.175) в точке х|,', получим: f-a с 0Л р -1 0 . (2.182) ,0 0 -р, дО)_ Ао - Sft дх, .о Матрица Ау имеет собственные значения: Чг =-^-±^(ст+1)2+4(р-1)^^з =-Р- (2-183) Таким образом, при принятых параметрах: а = 10,р = 8/3 и 0 <р < 1, состояние Х51' устойчиво. При а = 1 начинается конвекция Бенара, т.к. Хх = 0 и именно в этот момент «принимают эстафету» равновесные точки Х5 \ X5' (которые соответствуют движущимся валам). Линеаризация (2.173) - (2.175) в этих точках дает: А(2)_ Ао - дЛ dXj х(2) Х0 д(3)_ Ао - df, dXj х(3) -с 1 -а 1 -л/Р(р"О о -1 VP(p-0 -1 -л/Р(р-0 0 л/Р(р-0 0 -VP(p-i) -Р (2.184) (2.185)
140 Современные методы ТАУ. Часть IV Характеристические уравнения для матриц Ау и Ау совпадают и имеют вид <р(\) = \3+(а + $ + 1)Х2+$(а + р)\ + 2$а(р-1)=0. (2.186) При р = 1Д] =0Д2 =-р = -8/ЗД3 =-(а + 1) = -11, т.е. «конвективная» равновесная точка находится на границе устойчивости. Рассмотрим движение корней характеристического уравнения (2.186) при изменении параметра р(а = 10, р = 8/3, р>1). Траектории движения корней А>,(р), / = 1,2,3 на комплексной плоскости изображены на рис. 2.19. При 1 < р < рв = 1,3456 все корни левые и вещественные; при р = рв =1,3456 два корня сливаются в один двойной Хх (рв) = Х2 (рв) = -1,2894 (точка А, рис. 2.19) - устойчивый узел переходит в устойчивый фокус; дальнейшее увеличение р(р>рв) приводит к появлению пары комплексно-сопряженных корней, которые движутся к мнимой оси. При р = рс = 24,7368 (критическое значение р) имеется пара чисто мнимых корней: возникают структурно и динамические неустойчивые периодические орбиты - циклы. При р > рс имеет место неустойчивый фокус и появление устойчивых периодических движений - предельных циклов, т.е. имеет место бифуркация Хопфа. Ниже о ней будет подробно изложено. плХ +/' j Mp>pJ / ММ +1 = А,2(1,3456) = -1,29) \'-7 МрЛ Д10 Мр>Рс) Рис. 2.19. Траектории движения корней матриц линеаризации А^, А(о3) в равновесных точках \^\ х^ при изменении параметра р Критическое значение параметра р = рс можно определить по формуле: а + 6 + 3 Рс=с с-Ь-1 = 24,7368 (для а = 10, р = 8/3). (2.187)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 141 На рис. 2.20 и рис. 2.21 показаны траектории модели Лоренца для р = 10 и р = 23 , т.е. р < рс . Аттрактором (притягивающим множеством) в этих двух случаях является некоторая точка, определяемая выражениями (2.179) - (2.181), причем устойчивыми являются точки х^ и ц\ ху - неустойчивое седло. 30 Рис. 2.20. Фазовая траектория модели Лоренца (а = 10; р = 10; р = 8/3), устойчивый фокус 50 40 30 20 -10 Ю Рис. 2.21. Фазовая траектория модели Лоренца (а = 10; р = 23 < рс =24,7368; р = 8/3), устойчивый фокус При р > рс два положения равновесия Х5 ' и ху становятся неустойчивыми фокусами, и сложная хаотическая траектория блуждает между 3-мя неустойчивыми равновесными точками (рис. 2.22), наступает хаос (нерегулярная динамика). Первая особенность нового качественного движения системы заключается в том, что каждая из точек равновесия не является притягивающей, однако траектория не уходит далеко от 3-х точек равновесия и занимает ограниченную область, которая в
142 Современные методы ТАУ. Часть IV отличие от случаев р < рс уже не является точкой; аттрактором является множество точек, внутри которых содержатся 3 точки равновесия. Рис. 2.22. Точки равновесия и фазовые траектории в модели Лоренца при р > рс 40 30 -10 20 10 -20 0 Рис. 2.23. Странный аттрактор Лоренца (р = 25 > рс = 24,7368; р = 8/3) Вторая особенность: внутри аттрактора Лоренца (рис. 2.23) невозможно точно предугадать поведение траектории на длительный интервал (траектория очень чувствительна к начальным условиям), движения ее блуждающие. Такие аттракторы получили название странных аттракторов. Третья особенность: аттрактор, т.е. множество, к которому притягиваются траектории в модели Лоренца, не является ни двумерной поверхностью, ни спаянным двумерным многообразием. По существу он представляет собой топологический объект патологической природы. Он имеет дробную хаусдорфову {фрактальную) размерность: df = 2,06. Подробнее о фракталах и фрактальных множествах см. §2.3. Заметим, что все обнаруженные в настоящее время странные аттракторы имеют дробную хаусдорфову размерность, т.е. являются фрактальными множествами. Об-
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 143 щую картину качественных изменений, свойств аттрактора Лоренца можно проследить на следующей диаграмме [9, 10], (рис. 2.24). Бифуркация Хопфе: Рс « метастабильный хаос Изолированные глобальные аттракторы узлы-фокусы Р^ =1,35 Бифуркация А+3 и 24,74 13,93 Аттрактор Лоренца (фрактальное множество) Бесконечно много периодически замкнутых траекторий и бесконечно много неустойчивых турбулентных замкнутых траекторий фокус седло фокус узел седло узел i 1 \ \ I f 3 точки равновесия 1 точка J ^— равновесия t (Узел) Рис. 2.24. Качественные изменения свойств аттрактора Лоренца при варьировании параметра р 2.2.2.2. Логистическое уравнение Второй парадигмой хаоса (хаотического поведения) является так называемое логистическое уравнение, или уравнение роста популяций xn+l=axn-bx2n, (2.188) где ахп - рост или рождение популяции за и-й период, Ъх\ - ограничения роста, связанные с ограниченностью энергетических и пищевых ресурсов, хп+] - число популяций к началу (л + 1)-го периода. Перепишем (2.188) в безразмерном виде, вводя , Ь а' , _ замену переменных х4 =— хп\ хп=—хп . Тогда а Ъ <+1=<+1К) = ^^-^К)2=у^0-<) = К0-^)Д = у. (2Л89) Запишем (2.189) в исходных обозначениях хп+{=1хп{\-хп). (2.190) Это и есть логистическое уравнение, где X является параметром. При этом, для того чтобы относительное значение численности популяций (например, насекомых) находилось между 0 и 1, следует ограничить X е [0,4].
144 Современные методы ТАУ. Часть IV Для того, чтобы оценить влияние параметра X на численность популяций, рассмотрим рост численности за два цикла. Имеем хп+1=1хп{\-хп) = /{х„), (2.191) *п+2=^п+{{\-хп+1) = f{xn+]) = f(f{xn)) = /2{хп). (2-192) Если хп,хп+1>хп+2,— принадлежит некоторому множеству М <zRx, то данная функция / отображает множество М в себя, т.е. /:М->М. (2.193) В связи с этим введем некоторые определения. Отображения (2.191) и (2.192) можно рассматривать как итеративный процесс воздействия функции / на начальную точку х0. Ясно, что для произвольного п имеем rw=/or'U)=/(r'U))- Поскольку каждая точка х0 е М функции / как-то перемещается по множеству М, то функция (2.191) задает дискретную динамику системы. Если для некоторой точки х0 е М определены все итерации fn (*0), то множество {fn(x0) neN - множество натуральных чисел} называется орбитой точки х0 под действием функции f (мы имеем еще одну наглядную интерпретацию действия группы на многообразии). Определение 2.26. Точка хе называется неподвижной точкой функции (а в общем случае отображения) /, если fn (хе) = хе, \/neN . Определение 2.27. Неподвижная точка хе функции / называется притягивающей, если p(/"(*6.*«))<p(r"'U.*.)). (2-194) где р(х,у) - расстояние между точками х и уеМ ; в частности, (2.194) может иметь вид \/"Ы-хе\<\/"-1(х0)п-хе\. (2.195) В этом случае отображение / \М -» М называют сжимающим. Для того, чтобы точка хе была притягивающей, а отображение (функция) / сжимающим, достаточно, чтобы функция / в окрестности точки хе (включая саму точку) удовлетворяла условию Липшица [13] |/Ы-/(*.)ИЬ-*.| (2-196) с константой к<\\ хих2 принадлежат окрестности точки хе. В частности, условие сжатия выполнено, если функция в окрестности точки хе Шх^ \ имеет производную f'(x), причем |/'(ф*<1. (2.197) Естественно, условие (2.197)должно быть выполнено и в точке хе, т.е. |/'(*е)|<1. (2.198)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 145 На рис. 2.25 и рис. 2.26 изображен ход последовательных приближений в случае О< f'(x) < 1 и в случае -1 < /'(*) <0 (М - \а,Ь\). Это так называемые диаграммы Ламерея. 1 Хе /2 *1 =/(*b) Х0 Ь X *2=/(*,)=7ым Рис. 2.25. Притягивающая точка хе при 0 < /'(*) < 1 > х е М , f:M->M9 M = UXf ь . м< ГЫ /м A*hy 7 *,*l=f{*o)j> Х Рис. 2.26. Притягивающая точка при -1 < /'(*) <0, хеМ , j:M -> М 9 М = УХе Если в окрестности Ux , включая саму точку хе, имеем |/'(*)| > 1, то такую точку назовем отталкивающей точкой. Определение 2.28. Точка хр называется периодической точкой функции / периода А:, если /* (хр ) = хр при f'{xp)*xp для /< к . Орбита периодической точки состоит из к точек и называется циклом периода к. Определение 2.29. Точка хр является периодической точкой функции f периода к, если она является неподвижной точкой функции / периода к, но не является неподвижной точкой итераций с меньшим номером. 11 Зак. 416
146 Современные методы ТАУ. Часть IV Теперь вернемся к логистическому уравнению (2.190) и рассмотрим как изменяется его динамика при гладком изменении параметра X. Прежде всего найдем неподвижные точки отображения fx (мы используем индекс X для того, чтобы подчеркнуть зависимость / от параметра X). Имеем хе=1хе(\-хе),Х>0. (2.199) Неподвижные точки: 4')=0, 42)= —• • (2-200) А, Оценим тип неподвижных точек: Л(0) = Х; (2.201) A'(ir)=2~x- (2-202) Приравняв их к ±1, получаем, что неподвижные точки теряют гиперболичность при X = 1 и X = 3. Потеря гиперболичности приводит к качественному изменению динамики, т.е. при X = 1 и X = 3 имеют место бифуркации. Построим диаграммы Ламерея при изменении 0 < X < 3. 1. 0< X < 1 (рис. 2.27). Две неподвижные точки. Для X = 0,5, ху =0, х[' = -\. Диаграмма Ламерея показывает, что ху = 0 - притягивающая точка, ху = -1 - отталкивающая. Рис. 2.27. Диаграмма Ламерея логистического уравнения для X = 0,5 2. Х^0' = 1 (первая бифуркация). Смена типа неподвижных точек. Неподвижная точка хе = 0 - ни притягивающая, ни отталкивающая, а является бифуркационным седлом. 3. 1 < X < 3. Теперь неподвижная точка л^1' = 0 является отталкивающей, а точка ху = становится притягивающей. На рис. 2.29 показана диаграмма Ла- X мерея для X = 2 .
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 147 Рис. 2.28. Бифуркационное седло (А.'0' = 1), две неподвижные точки слились в одну ху = х) -О *'о 1 х Рис. 2.29. Диаграмма Ламерея для X = 2. Точка х® = О становится отталкивающей, х»-^1- притягивающей На первый взгляд при 0 < А, < 1 и 1<^<3 отображение fx:M -+М принципиально не изменилось, разве что поменялись местами притягивающая и отталкивающая точки. Но в этом и состоит основное различие. На участке 0 < X < 1 притягивающей является точка jc^ = 0, поэтому при большом количестве генераций f\ (Jce1))=Jc^) =^' те* ПРИ 0<^<1> относительного роста числа популяций не наблюдается. Совершенно другая картина наблюдается при 1 < X < 3. В этом случае 11*
148 Современные методы ТАУ. Часть IV притягивающей точкой будет х^ = >0, поэтому f"(x^)=x^ и наблюдается рост популяций. Эту зависимость можно наблюдать на бифуркационной диаграмме (рис. 2.30). х h 0,5 х -► 0 1 2 3 X Рис. 2.30. Бифуркационная диаграмма логистического уравнения для периода 0 < X < 3 Еще одной особенностью является то, что на этом интервале сначала х^, а затем х^Р являются периодическими точками периода 1 (Т = \). При Х = 3 |Л'(*в)| = 1 и наступает вторая бифуркация. 4) Х^ = 3 (вторая бифуркация) - бифуркация удвоения периода: притягивающая неподвижная точка х^Р = (период Т = 1) превращается в отталкивающую, а ря- X дом с ней появляется цикл вдвое большего периода (Г = 2), fx{xe) = xe (рис. 2.31). При Х>3 все точки интервала (0,1) притягиваются к этому циклу (рис. 2.32). На интервале (0,1) отображение /х2 (х) = /х (/х (х)) имеет 3 неподвижные точки, причем 2 из них притягивающие х^ и х^ , и одна х^ - отталкивающая. |Л(*).Л2М 1 X Рис. 231. Неподвижные точки д£!) = 0, д£2) =-; периоды Г = 1, Г = 2. X = 3 - бифуркация удвоения периода
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 149 Увеличение Х(Х > 3) происходит до некоторого Х(2), при котором происходит третья бифуркация: бифуркация удвоения периода 2 (Т = 4). Эта бифуркация имеет место при (Л2)'(*) = 1, что соответствует Х(2) = 3,45. > \Л(*Ш*) Рис. 2.32. Неподвижные точки циклов 1,2 (Т = 1;2) х^1\ х™ - отталкивающие (цикла 2, Т = 2), *е3)>44) - притягивающие (цикла 2) для Я. = 3,2, хе[0,1] При X > Х^ для отображения f£ (*) вблизи каждой из точек х£3) и х£4) появится еще две неподвижные точки, т.е. возникает цикл периода 4 (Т = 4), причем устойчивый. Дальнейшее увеличение \>\^ =3,45 приводит к появлению бесконечной последовательности (Х^"\ « = 3,4,5) значений параметра X: при Х = Х^ происходит потеря устойчивости цикла периода 2п~1 и возникает устойчивый цикл периода 2п . Этот процесс удвоения периода происходит до тех пор, пока X не достигнет значения ^=3,56994. Вблизи этого значения последовательные значения параметров, при которых происходит удвоение периода, подчиняются закону __ —- _> 5 = 4,66920 (число Фейгенбаума). При Х>Х<О могут возникнуть хаотические колебания (рис. 2.33). Отображение, соответствующее X > Х^, имеет инвариантное множество канторовского типа F (подробнее о канторовском множестве см. в разделе «фракталы»), окруженного бесконечным числом неустойчивых циклов периода 2". При этом все точки интервала [0,1], кроме точек этих циклов и их прообразов, притягиваются к множеству F, которое является фрактальным и его дробная (фрактальная) разность равна df « 0,518. Для X = 4 уравнение (2.190) может быть решено путем замены переменных, что позволит увидеть чрезвычайную зависимость решения от начальных условий. Покажем это [2]. Итак, сделаем следующую замену 1-COS27C0W (2.203) х„ =- (2.204)
150 i 0.9 о.а 0.7 o.e 0 S 0.* 0 0 02 0 1 0 X Бифуркация удвоения \v периода N4 ^^^^ Г = 1 2.S /,\ Современные методы ТАУ. Часть IV V т ДЦ Хаос /МЛ T = 2 '.ЯП Э S Рис. 2.33. Бифуркационная диаграмма логистического уравнения, X е [2,4] При такой замене уравнения (2.190) преобразуется следующим образом (X = 4 ): I(l-cos2rten+1) = 4^(l-cos2uen)^l-i-(l-cos27ren)jl = i(l-cos47ten). (2.205) т.е. Одним из решений уравнения (2.205) является е„+1=2е„, е =2Леп. (2.206) (2.207) Можно непосредственно убедиться в том, что это решение соответствует хаосу в системе. Действительно, поскольку хп связано с 0„ функцией cos27T0n, добавление целого числа к 0„ (или замена знака) приводит к тому же самому значению хп . Поэтому, если записать 0„ в обычной десятичной системе, например, положив вп =11,2693..., то можно просто отбросить 11. Еще лучше использовать двоичную систему для 0О , положив, например, ео=- + - + — + —+ ... = 0,101101.... (2.208) 0 2 8 16 64 При этом умножение на два (переход от п -»(п +1)) означает просто сдвиг запятых в «десятых» вправо на 1 знак, так что 0, =0,01101... ,02 =0,1101...,03 =0,101...,04 =0,01.... Таким образом, значения 0„ , порождаемые любыми начальными 0О , зависят от п -го и следующего разрядов 0О . Это позволяет дать одно из возможных определений хаотического поведения (о чем мы уже выше говорили): динамическая переменная хп при больших п принимает значения, которые чрезвычайно сильно зависят от точного начального значения х0. В рассматриваемом случае предложим, что имеется два начальных значения х0 и х'о, которые различаются на малое число 6 и порождают две последовательности популяций хп и х'п , начинающиеся соответственно с х0 и х'о. Тогда после п шагов разница между ними увеличивается до значения 2" г.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 151 2.2.2.3. Производная Шварца и бифуркация удвоения периода Бесконечная последовательность бифуркаций удвоения периода, как это имело место для логистического уравнения, соответствует не всем унимодальным (одномо- дальным) функциям, т.е. непрерывно дифференцируемым отображениям единичного интервала [0,1] (в частности всем, имеющим один максимум при х = — и монотонным при 0<д:< —, — <л:<1). Кроме свойств унимодальности, необходимо, чтобы производная Шварца функции / (обозначается Sf) [4] была отрицательна на всем интервале [0,1]. Это справедливо для логистического уравнения, т.к. для него fm(x) = 0. Отметим, что из условия Sf < 0 следует Sf" < 0 длявсех итераций /. 2.2.3. Бифуркация Хопфа и хаос. Критерий Рюэля - Такенса Бифуркация Хопфа является одним из возможных путей зарождения хаоса в системе, поэтому йайсно изучить ее подробнее. Рассмотрим линейную систему 2-го порядка: х1=7ах-ш29 (2.209) Л д£ = гох, + Хха , . (2.210) где X является параметром. Собей^ённые значения матрицы А: ^ ' (X -CDN * А-[» * - два комплексных корня Slf2 =X±j®. При X = 0 (два чисто мнимых корня) фазовые траектории системы (2.209), (2.210)-это круговые орбиты (центры) (рис. 2.34). В этом случае система (2.209)," &Щ 10) является как статически, так и динамически неустойчивой системой, поэтому значение параметра X = 0 определяет множество (точку) бифуркаций. \ 1 v( Рис. 2.34. Фазовые траектории для чисто мнимых корней матрицы А (X = 0)
152 Современные методы ТАУ. Часть IV Рассмотрим, как влияют возмущения (деформации) на центры. Для этого удобно перейти от декартовой к полярной системе координат: *!=rcos0, (2.211) *2=rsin0. (2.212) Тогда (2.209), (2.210) примут вид: г = Хг, (2.213) ё = ш. (2.214) На бифуркационном множестве JB = {X = 0} происходит изменение динамической устойчивости, что сопровождается появлением качественно новых решений. Рассмотрим возмущение (деформацией) вырожденной (для Х = 0) системы (2.213), (2.214). Для этого запишем: г = fr (г, 0) = Хг + члены более высокой степени, • (2.215) 0 = /е (г, 0) = ю + члены более высокой степени. (2.216) На бифуркационном множестве JB первые члены, разлагаемые /е(г,0) в ряд Тейлора, отличны от нуля (со Ф 0); поэтому можно ожидать, что члены более высокой степени несущественны и ими можно пренебречь [9]. В первом приближении можно ограничиться только возмущениями, инвариантными относительно вращения (деформации радиальные), т.е. fr(r,Q) = fr(r). (2.217) Радиальная функция fr(r) может включать только члены с нечетными степенями г, поскольку из инвариантности относительно вращения следует, что замена хх -» -хх, х2 -» -х2 дает it -» -хх, х2 -> -х2. Эта симметрия нарушается, если fr (г) содержит члены с четными степенями г. Таким образом, достаточно общая деформация (возмущение) динамической системы (2.213), (2.214) имеет вид r = \r + Ar3 + Br5+..<, (2.218) 0 = ш. (2.219) Ограничившись первыми двумя членами разложения (2.218), т.е., считая г*0 при Х = 0, ==> АфО, и вводя замену переменных г ->|А\ 2 г, получим следующий канонический вид деформированной системы (в старых обозначениях): r = Xr±r\ (2.220) 0 = со. (2.221) Рассмотрим стационарные значения (неподвижные точки) для данной динамической системы. Пусть r = Xr-r\ (2.222) Очевидно, что ге = 0 всегда является стационарным значением. Это есть точка притяжения (устойчивая) при \<0 и отталкивающая (неустойчивая) точка при X > 0. При X > 0 имеется устойчивый предельный цикл с радиусом r = yjx. (2.223) Решение (2.221) тривиально 0(/) = 0о+со/, (2.224)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 153 именно поэтому радиальное решение уравнений (2.220), (2.222) ответственно за появление качественно новых решений. Итак, имеем следующую картину качественных изменений в начале координат: • X < 0 (Sl2 = Х± ую) - устойчивый фокус. • X = 0 - фокус теряет устойчивость и становится неустойчивым. • X > 0. - неустойчивый фокус переходит в устойчивый предельный цикл радиуса г = \Х . Такой бифуркационный переход называется суперкритической бифуркацией Хопфа. Фазовый портрет такой бифуркации показан на рис. 2.35. устойчивый х = о Х<0 устойчивый фокус предельный цикл неустойчивый фокус Рис. 2.35. Суперкритическая бифуркация Хопфа в точке ге = 0 Для динамической системы r = Xr + r3 (2.225) точка ге = 0 всегда является равновесной. Она устойчива при 1<0 и неустойчива при X > 0. При X < 0 имеется неустойчивый предельный цикл с радиусом г = урХ. (2.226) Если X подходит к нулю снизу, отталкивающее множество (неустойчивый предельный цикл) «наползает» на устойчивый фокус в начале координат и, наконец, полностью вытесняет его при X = 0. Это явление называется субкритической бифуркацией Хопфа, Фазовый портрет этой бифуркации показан на рис. 2.36. Х<0 устойчивый предельный4^ цикл неустойчивый фокус Рис. 236. Субкритическая бифуркация Хопфа в точке ге = 0 10 3ак.416
154 Современные методы ТАУ. Часть IV Другими словами суперкритическая (субкритическая) бифуркация Хопфа определяет наличие периодических решений (предельных циклов) при X < Хо, где Хо - точка бифуркации (здесь Хо = 0). В 1971 г. Рюэль и Такенс предложили путь перехода к хаосу в динамических системах на основе бифуркаций Хопфа. Изучая поведение динамических систем при бифуркациях Хопфа, они пришли к выводу, что даже после двух бифуркаций Хопфа регулярное движение может стать сильно неустойчивым и переходит в хаотическое движение на странном аттракторе [30]. При этом подразумевается, что хаотическое движение становится возможным только после двух бифуркаций Хопфа, когда траектория выходит в дополнительное измерение, т.к. двухпериодическое движение соответствует траектории на торе, на котором появление хаоса запрещается теоремой Пуанкаре - Бендиксона [25]. Однако после двух бифуркаций Хопфа появление странного аттрактора не только возможно и неизбежно (критерий Рюэля - Такенса). Переход к хаосу по модели Рюэля - Такенса - Ньюхауса имеет следующий вид (рис. 2.37). Л А Ас dim Aq = 0 странный аттрактор с большой размерностью "Ч J dim Al = 1 (1-я бифуркация Хопфа; предельный цикл) dimA2=2 (2-я бифуркация Хопфа; движение на торе) dim Ar > 2 Рис. 2.37. Переход к хаосу через 2 бифуркации Хопфа по модели Рюэля - Такенса - Ньюхауса 2.2.4. Качественные и количественные признаки хаоса Прежде всего необходимо еще раз напомнить, что хаотические колебания могут возникнуть в системе, содержащей нелинейный элемент. В линейной системе хаотические колебания отсутствуют. Какие же качественные признаки могут сигнализировать о возможности появления хаотических компонент? Мы их уже рассмотрели выше, теперь только суммируем полученные результаты: 1) высокая чувствительность к изменению начальных условий; 2) растущая сложность регулярных движений по мере изменения некоторых параметров; 3) фрактальные свойства движения в фазовом пространстве, которые указывают на присутствие странного аттрактора (странный аттрактор Лоренца); 4) наличие в непрерывной системе бифуркаций Хопфа; 5) наличие в дискретной системе бифуркаций удвоения периода (логистическое уравнение). Количественные признаки хаоса определяются ее показателями: 1) положительный показатель Ляпунова; 2) фрактальная размерность аттрактора. Рассмотрим подробнее каждый из показателей.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 155 2.2.4.1. Показатель Ляпунова Хаос в детерминированных системах подразумевает высокую чувствительность к изменению начальных условий. Это означает, что две траектории, близкие друг к другу в фазовом пространстве в некоторый начальный момент, экспоненциально расходятся за малое в среднем время. Если р0 - мера начального расстояния между двумя исходными точками, то, спустя малое время /, расстояние между траекториями, выходящими из этих точек, становится равным р(О = Ро^- (2-227) Для дискретных систем соответственно имеем Pn=Po^. (2.228) Величина а называется показателем Ляпунова. Критерий хаоса в терминах показателя Ляпунова: сс>0 - хаотичное движение, сс<0 - регулярное движение-J Рассмотрим процедуру экспериментального определения показателя Ляпунова. Вычисление показателя Ляпунова а: 1) начинается с выбора опорной траектории, точки на соседней траектории и из- Р(') (2.229) мерения величины L-^-L (рис. 2.38); Ро 2) интегрируются уравнения движения вдоль соседней траектории и определяется ро(0; 3) когда расстояние p(t) становится слишком большим и рост его отклоняется от экспоненциального поведения, находим новую соседнюю траекторию и определяем новое начальное расстояние р0 (/) и т.д.; 4) показатель Ляпунова находится осреднением: сс = - 1 ■2>^ (2.230) 'to-'ом Po('*-i)' где N - число точек на опорной траектории, равное числу соседних траекторий, взятых для получения экспоненциального показателя Ляпунова а. опорная траектория Рис. 2.38. Геометрические построения, характеризующие определение показателя Ляпунова для непрерывных систем 10*
156 Методы современной ТАУ. Часть IV Для дискретных систем *„+1 =/(*„) (2.231) - показатель Ляпунова характеризует среднюю потерю информации за одну итерацию [4]. Рассмотрим разность между итерированными отображениями fn (х0) и fn (*0 + е), где 8 - малая величина. Имеем: Ро = е> df рН/(*о+*)-/Ы|=?- dx •£, *0 рп=\Г(хо+е)-Г(хо)\ = ге"а^\ Тогда а(х0) = lim lim — In «->оое->0« fn(xo+z)-fn{xo) ГЫ = lim —In л-»оо п 4ГМ dx* (2.232) Выражение (2.232) определяет показатель Ляпунова для дискретных систем при итерированных отображениях. Рассмотрим пример: известное нам логистическое уравнение (2.190) и найдем показатель Ляпунова для X = 4 . В этом случае, используя замену переменных (2.204), мы получим соотношение между хп -» вп и х0 -» 0О (формула (2.207)) е„=2"е0. Используя (2.232), получим a(eo)=limilnf^iMl = in2>O, /7->сол ^ dQ0 ) это значит, что для X = 4 имеет место хаос, в чем мы еще раз убедились. 2.3. ФРАКТАЛЫ 2.3.1. Понятие о фракталах Знакомство с фракталами начнем с экскурса в историю. В 1890 г. итальянский математик и логик Джузеппе Пеано построил кривую (кривую Пеано), областью определения которой является отрезок (dim = l), а областью значений - квадрат (dim = 2). Было показано, каким образом одна точка, двигаясь непрерывно по квадрату, может (за бесконечное время) пройти, по крайней мере, один раз через каждую точку квадрата и его границы. Кривая Пеано, ее потом окрестили «монстром», является непрерывной кривой, но нигде (ни в одной точке) не дифференцируема. В 1904 г. шведский математик Хельга фон Кох, используя итерированные отображения, получила фигуру, названную позднее «снежинкой Кох», особенностью которой является бесконечная протяженность границы при ограниченных размерах самой снежинки. Были получены и другие монстры. В 1919 г. немецкий тополог Феликс Хаусдорф решил проблему размерности извивающихся кривых, приписав им дробную размерность. Систематическое изучение объектов такой необычной группы было начато французским математиком Бенуа Мандельбротом. Термин «фрактал» (английское «fractal»)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 157 был введен Б. Мандельбротом в 1975 году. Он был получен от двух латинских глаголов: frangere - ломать и fractus - дробный. Дадим теперь два определения фрактала. Определение 2.30 [22]. Фракталом называется множество, размерность Хаус- дорфа - Безиковича (ниже будет показано вычисление этой размерности), dHB которого строго больше его топологической размерности dT (dHB > dT) . Кривая Пеано, имея топологическую размерность dT = 1 (одномерная кривая), имеет фрактальную размерность 1 < df < 2 . Определение 2.31 [22]. Фракталом называется структура, состоящая из частей, которые в каком-то смысле подобны целому (именно самоподобные объекты стали основным инструментом Б. Мандельброта для исследования фракталов). Определение 2.30 является строгим и наиболее точно отражает суть фракталов, а именно их дробную размерность. Однако, при всей правильности и точности, оно слишком ограничено, т.к. исключает многие фракталы в различных технических и физических задачах. Определение 2.31 содержит еще один отличительный признак: фрактал выглядит одинаково, в каком бы масштабе его не наблюдать. Ниже мы подробно познакомимся с самоподобными объектами. Несмотря на данные выше определения, по признанию даже самого Б. Мандельброта, строгого и полного определения фракталов пока не существует [22], тем не менее мь! будем придерживаться следующего определения. Определение 2.32 [23]. Фракталами называются масштабно-инвариантные множества, обладающие дробной размерностью Хаусдорфа - Безиковича. Это определение объединяет отличительные признаки фракталов, данные определениями 2.30 и 2.31. 2.3.2. Размерность Хаусдорфа - Безиковича Фракталы сложно рассматривать как множество точек, вложенных в пространство. Когда речь идет об обычных геометрических объектах: линия, поверхность, шар, то их топологические размерности dT известны и являются целыми числами. Рассмотрим, как вводится мера некоторого множества точек G, вложенного в пространство при определении размерности Хаусдорфа - Безиковича (dHB). Простой способ измерить длину кривых, площадь поверхности или объем тела состоит в том, чтобы разделить пространство на небольшие кубы с ребрами г (рис. 22). Р' Р Q Рис. 2.39. Измерение «величины» различных множеств точек с помощью кубов с ребрами г
158 Методы современной ТАУ. Часть IV Пусть для некоторой кривой (3 (рис. 2.39) длиной Lq получено N(r) количество прямолинейных отрезков длиной г, аппроксимирующих данную кривую. Тогда ^(')т->А/ = Аи 0.233) Г->0, где г - длина прямолинейного отрезка. В пределе г -» О мера L становится равной длине кривой Lq и не зависит от г. Множеству точек кривой (3 можно поставить в соответствие и площадь. Если N(r) - число квадратов, г2 - площадь каждого из них, то площадь кривой р определяется как A = N(r)r2->Lorl9 (2.234) г->0. Аналогично, объем V кривой (3 может быть найден как V = N(r)r2=L0-r\ (2.235) г->0. Разумеется, что для обычных кривых р площадь А и объем V обращаются в нули при мОи единственной представляющей интерес мерой является длина кривой Р . Теперь перейдем к поверхности р (см. рис. 2.39), для которой в качестве меры множества точек возьмем площадь Л = ЛГ(г)г2->4/ = 4>. (2236) г->0. Можно ли для поверхности р в качестве меры взять объем? Формально это выглядит следующим образом: У = М(гУ^А0-г\ (2237) г->0, при г -> 0 этот объем для обычной (!) поверхности также равен нулю. Поставим другой вопрос: можно ли поверхности р поставить в соответствие какую-нибудь длину? Формально мы можем принять за такую длину величину L = N(r)-r^>A0-r\ (223g) г-»0, которая расходится при г -> 0. Этот результат имеет смысл, т.к. поверхность невозможно покрыть конечным числом прямолинейных отрезков. Вывод: единственной мерой множества точек, образующих поверхность в трехмерном пространстве является площадь, однако «монстры», подобные кривой Пеано, «снежинке Кох» и другие, требуют обобщить меру величины множества точек. До сих пор, определяя меру величины множества точек G в пространстве, мы выбирали некоторую пробную функцию h(r) [17,22] (элементарную меру) h(r) = y(d)rd, (2.239) где y(d)- геометрический коэффициент, зависящий от пробной функции: у (d) = 1 - для прямолинейных отрезков, кубов, квадратов;
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы Ij59^ y(d) = для круга; y{d) = --- для сферы; 6 d - размерность меры. После выбора пробной функции h(r) множество G покрывается N{r) пробными функциями (элементарными мерами) и определяется мера этого множества N(r) Л/„=$>(г). (2.240) /=i Отсюда можно сделать вывод: при г -> 0 мера Md равна нулю или бесконечности в зависимости от выбора d - размерности меры. Определение 2.33 [22]. Размерность Хаусдорфа - Безиковича dHB данного множества точек G есть критическая размерность, при которой мера Md изменяет свое значение с нуля на бесконечность Ясно, что когда d = dHB, мера Md должна быть конечной, она и определяет размерность Хаусдорфа - Безиковича dHB . Приняв y(d) = 1, т.е. покрыв множество точек прямолинейными объектами (отрезок, квадрат, куб) и приравняв (2.241) некоторой конечной величине, .например 1, мы получим: N(r)rd»B =\, (2.242) откуда размерность Хаусдорфа - Безиковича определим как \n(N(r)), ч dHB =— ,\[=dfi если dHB -дробное число]. (2.243) Если dHB является дробной, то размерность Хаусдорфа - Безиковича будем обозначать df и называть фрактальной размерностью Хаусдорфа - Безиковича. Теперь перейдем к построению и изучению самоподобных фракталов. 2.3.3. Принцип самоподобия. Самоподобные фракталы Рассмотрим несколько примеров на построение множеств с использованием формулы (2.243). Возьмем отрезок прямой единичной длины (это можно сделать для любого отрезка, приняв длину этого отрезка за единицу, т.к. размерность длины в данном случае не играет никакой роли). Разделим отрезок на Nx (г) равных частей, где г- длина каждой части. Каждую часть можно считать копией исходного отрезка, уменьшенной в 1/г раз. Очевидно, что Nx(r)-r = l. Назовем исходный отрезок сегментом 0-й итерации (0-го поколения [22]). Ясно, что если мы используем формулу (2.243), то получаем 1и(АГ,(г)) ЫК,(г)
160 . Методы современной ТАУ. Часть IV т.е. исходный отрезок без дополнительных преобразований имеет размерность Хаус- дорфа - Безиковича, совпадающую с размерностью топологической. Поступим теперь по-другому: от исходного отрезка АВ (сегмента 0-й итерации) (рис. 2.40, а) перейдем, например, к образующей 1-й итерации самоподобного фрактала CD, где число сегментов равно 7, а длина каждого отрезка по-прежнему равна г = 1/3, (рис. 2.40, б). 1 А ( | | ^| В сегмент 0-й итерации 8=1/3 1/3 1/3 *,(г) = 3 1/3 (А) 1/3 С\ ~± 1/3 1/3 (В) образующая 1-й 1/3 D итерации 1/3 ЛГ(г) = 7 сегмент 1 -й итерации б Рис. 2.40. Построение образующей самоподобного фрактала с г = 1/3, N(r) = l Если теперь использовать формулу (2.243), то получим Таким образом, величина </у=1,81 (фрактальная размерность самоподобного фрактала с образующей CD) показывает, что кривая CD в 1,81 раза «более извилистая» на отрезке АВ, чем сам отрезок АВ. Можно провести и обратную процедуру, выкидывая, например, часть отрезков длины г из сегмента АВ. В этом случае размерность образующей будет меньше размерности сегмента АВ, т.е. df e (0,1). Построение самого фрактального множества (самоподобного фрактала) производят последовательным использованием сегмента /-й итерации для образующей (/ + 1) итерации. При / -> оо получим предельное (фрактальное) множество. Аналогичный алгоритм используется и для двумерных объектов, например, квадратов. Возьмем квадрат единичной площади (квадрат 0-й итерации) и, разделив каждую сторону на Nx (г) равных частей длиной г, получим N2 (r) квадратов, подобных исходному, но имеющих сторону в 1/г раз меньше исходной (рис. 2.41, а). Сформируем образующую 1-й итерации самоподобного фрактала, выкидывая из исходного квадрата N3 (r) e (l, #2 (г)) квадратов (рис. 2.41, б). На рис. 2.41, б r = i,^(r) = 4,^2(r) = 16,^3(r) = 10. Если теперь определить число копий исходного квадрата в образующей 1-й итерации, то оно равно N(r) = 6 = N2(r)-N3(r).
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 161 1/4 1/4 1/4 1/4 Рис. 2.41, я. Квадрат 0-й итерации, N2 (r) = 16 Рис. 2.41, б. Образующая самоподобного фрактала N(r) = 6 1-й итерации Найдем фрактальную размерность получаемого множества ' 1пГП In4 J'39 Совершенно аналогичную процедуру можно производить над геометрическими объектами размерности п > 2. Из проведенного анализа следует, что для того, чтобы найти размерность самоподобного фрактала, необходимо определить число элементарных мер (пробных функций) N(r) образующей 1-й итерации (число подобъектов), вычислить коэффициент подобия г и использовать формулу (2.243). Рассмотрим построение некоторых классических фрактальных множеств. 2.3.4. Классические фракталы [14] Примерами классических фракталов, построенных задолго до появления данного понятия, являются снежинка Кох, ковер Серпинского, губка Менгера, пыль Кантора и множество других. Снежинка Кох представляет собой замкнутую кривую, составленную из трех одинаковых фракталов, каждый из которых строится на стороне равностороннего треугольника. Процедуру построения рассмотрим на примере одной из сторон треугольника. Она выполняется для каждой из сторон. Пусть Ко - исходный отрезок (одна сторона треугольника). Разделим его на 3 части и уберем среднюю часть. Вместо средней части добавим два новых отрезка той же длины так, чтобы в центре отрезка образовался новый (маленький) равносторонний треугольник, но без основания. В результате получим новое множество Кх (см. рис. 2.42). Данную процедуру можно выполнять многократно над каждым из отрезков, получая все новые и новые множества К2,К3 и т.д. В результате на и-м шаге итерационного процесса получим снежинку Кох (рис. 2.43). Поскольку N = 49з. г = -, то размерность фрактала £/,= — «1,2618. f 1пЗ Особенностью данного фрактала является бесконечная длина предельной кривой, 4 описывающей его границу. Действительно, длина кривой Кх - 1Х = —, длина кривой
162 Методы современной ТАУ. Часть IV 42 4" К2 -12 = —> на и-м шаге итерационного процесса длина кривой /„ = —. При п -> оо 4" длина предельной кривой для одной стороны фрактала / = lim > оо . л->оо 3" ^j\a_ ^aJ 1л, Рис. 2.42. Построение снежинки Кох: a —Kq\ б —К\\ в —Кг\ г —Ку Рис. 2.43. Снежинка Кох Алгоритмы построения таких фракталов, как ковер Серпинского, пыль Кантора и других, во многом сходны с алгоритмом построения снежинки Кох. Принцип построения ковра состоит в разбиении некоторой замкнутой области (исходного множества) на непересекающиеся подобласти (пересекающие подмножества), обязательно содержащие внутреннюю подобласть, и последующем удалении именно внутренней подобласти. Процедура итеративно повторяется с каждым из оставшихся подмножеств. Наиболее иллюстративно это видно на примере ковра, построенного на базе прямоугольного треугольника (рис. 2.44), хотя ковер можно строить, взяв за основу квадрат или другую плоскую фигуру. Пусть исходным множеством SQ является равносторонний треугольник вместе с областью, которую он замыкает. Разобьем его на четыре меньших треугольника и удалим внутренний треугольник без замыкающих его сторон. Получим множество «Sj. Выполним аналогичную операцию над оставшимися треугольниками. В результате будет иметь место множество S2. Продолжая итерационный процесс, на п -м шаге получим множество Sn (см. рис. 2.45). Предельное множество и образует ковер Серпинского. ▲ЛА Рис. 2.44. Ковер Серпинского Рис. 2.45. Построение ковра Серпинского
«/, =^«1,585. Глава 2. Теория катастроф. Детерминированный хаос. Фракталы \63_ Так как коэффициент подобия г = —, а количество элементов, участвующих в итерационном процессе N = 3, то размерность фрактала (ковра), построенного на основе треугольника, 1пЗ 1п2 Так же как и снежинка, данный ковер имеет свою особенность, а именно то, что предельное множество S имеет площадь нулевой меры. Действительно, на первом шаге удаляется 1/4 площади треугольника, на втором шаге 3 треугольника площадью l/42 от исходного и т.д. Поскольку то имеет место меры нуль. К множествам нулевой меры относится и пыль Кантора (фрактальная пыль). Принцип построения этого множества состоит в следующем. На первом шаге отрезок единичной длины [0,1] разбивается на три части и удаляется средний, открытый ин- теграл -,— . На последующих шагах вновь удаляются центральные части оставшихся отрезков, не включая их концы (рис. 2.46). Предельным множеством является пыль Кантора. Рис. 2.46. Построение пыли Кантора Так как N = 2, а коэффициент подобия г = -, то размерность фрактала d ,= — «0,6309. f In3 Подсчитаем длину выбрасываемых интервалов. На первом шаге выбрасывается интервал длиной 1/3. На втором шаге выбрасываются два интервала длиной 1/32 от длины исходного единичного отрезка. На и-м шаге выбрасываются 2п~{ интервалов, каждый длиной —. Таким образом, общая длина выбрасываемых интервалов для предельного множества
164 Методы современной ТАУ. Часть IV Как видим, пыль Кантора относится к множествам нулевой меры Лебега. Множества типа «пыль Кантора» могут быть построены и на основе плоских фигур, путем выбрасывания отдельных частей. В отличие от снежинки Кох или ковра Серпинского фрактальная пыль является разрывным множеством. Множества Кантора, являющиеся самоподобными фракталами, могут иметь различную размерность, в зависимости от того, на какое количество частей разбивается отрезок (фигура) и какое количество частей выбрасывается при переходе от одного множества к другому. Если Канторова пыль образуется путем деления отрезка на N частей, то при выбрасывании одной части размерность фрактала составит in(N-l) '"■' \n{N) ' при выбрасывании N -1 частей (одна пылинка) соответственно d ~ 1П0) А \n(N)' При N -» оо, dfN i -> 1, d^ -> 0. Таким образом, различные фракталы, относящиеся к множествам Кантора, построенных на основе отрезка, могут иметь размерность rfy, принадлежащую интервалу (0,1). Если при построении пыли Кантора за основу взять плоские фигуры, то размерность фракталов может меняться в более широких пределах. Отметим, что различные множества Кантора обладают тремя основными свойствами: они компактны, совершенны и вполне разрывны. 2.3.5. Фрактальная размерность аттракторов. Применение теории фракталов в некоторых задачах управления Существуют три альтернативных подхода к определению фрактальной размерности аттракторов [17]: 1) поточечная размерность; 2) корреляционная размерность; 3) информационная размерность. Мы рассмотрим две из них, поточечную и корреляционную, причем последняя будет использована нами для нахождения фрактальных характеристик динамики объектов управления. Поточечная (фрактальная) размерность. Рассмотрим какую-нибудь траекторию в фазовом пространстве на протяжении длительного времени (рис. 2.47). Проведем выборку точек на траектории (достаточно большое число Л^) произвольным образом. Опишем вокруг какой-нибудь точки х0 на траектории сферу диаметра 8 (или куб с ребром 5) и подсчитаем число выборочных точек N(b), попавших внутрь сферы. Вероятность того, что выборочная точка окажется внутри сферы, определяется выражением Р(5) = ^й, (2.244) где #0 - общее число точек на траектории. Размерность траектории в точке х^' (где х^' - вектор в фазовом пространстве), полученная путем измерения доли времени, проведенного траекторией внутри малой сферы, имеет вид
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 165 *i *3 dfp- \с < ■ с. С In Р\ У0) 11ГП — 5->0 In 8 Траектория в фазовом пространстве ж • • <• • • :; у - . 1 1 \ / .' X Вь / » 1 у бор< г энные точки (2.245) Рис. 2.47. Геометрические построения для нахождения поточечной (фрактальной) размерности Несмотря на то, что формула (2.245) отличается от общей формулы (2.243) по определению фрактальной размерности, тем не менее выражение (2.245) можно привести к (2.243). Покажем это. Вернемся к рис. 2.47. Пусть длина всей кривой L равна 1 (уже говорилось ранее, что это всегда можно допустить). Пусть г - расстояние между отдельными точками. Тогда N[r)r (где N(r) - число точек, попавших в сферу) определяет длину кривой L(b) в сфере диаметра 5, a Nor = 1. Имеем /Vо -Г Рассмотрим отрезок 8 (диаметр сферы). Если вновь принять длину этого отрезка за 1, т.е. 6 = 1, то число отрезков, покрывающих длину 6 = 1, определится как 1/г, в то же время число отрезков, покрывающих 1(8), равно Тогда N(r)-r-- = N(r). , \nN{r) dfp = \\m s-t "До. (П 1пЫ и мы получим исходную формулу (2.243). Как мы видим, здесь вновь использовался основной принцип - принцип самоподобия фракталов. Для многих аттракторов это определение не зависит от х^, но для других аттракторов dfp зависит от х^, поэтому лучше воспользоваться усредненной поточечной размерностью.
166 Методы современной ТАУ. Часть IV Выберем случайным образом множество точек М <N0 ив каждой точке вычислим dfp nr' V Усредненная поточечная размерность определяется как ъ-ЬЫ*)- ми Корреляционная (фрактальная) размерность [17]. Эта размерность широко используется для определения меры упорядоченности движений и является нижней оценкой хаусдорфовой размерности странного аттрактора. На первом этапе определяется корреляционный интеграл С (5) по формуле c(s)->™^|l'h|»w-»(1} оме где \[z] - функция Хевисайда; Ц...Ц - какая-либо норма. Фактически двойная сумма в (2.246) определяет число пар х''',х^', расстояние х^'-х'7' между которыми не превышает 5. Предполагается, что х*1' - вектор, описывающий положение изображающее точки х^' = х(/,) в фазовом пространстве в момент времени, где tt =t0 +iT, i = 1,2,...,TV, T- некоторый заданный промежуток времени. При малых 5 корреляционный интеграл С(5)~8/с, поэтому корреляционную размерность dfc можно определить по наклону зависимости In С (5) от In 8 или rf =IimlL£i*i. (2.247) fC 5н>0 In 5 В случае изучения скалярной динамической системы или одной координаты вектора состояния х, размерность странного аттрактора можно определить с помощью процедуры Паккарда - Такенса [17]. Пусть х, - реализация одной из координат фазового пространства систем, х,=х(/,). Введем в рассмотрение новое фазовое пространство (пространство вложения размерности р\ точки которого определяются векторами уу^ ={*/,*/+i,-.,*/+/7-i}> сконструированными из последних значений величин x(j = \,2,...9п = N-р + \). При изменении / получим в этом пространстве траекторию, воспроизводящую некоторое множество, корреляционная размерность которого dyy может быть вычислена через корреляционный интеграл CW(6)= Km\±±lk-W-№fl (2-248) *->0°" J=\k=\ V " П/ по наклону зависимости In Ор' (5) от In 5 или J 8->0 In 8 Изменяя размерность р векторов у, проанализируем зависимость dyy от р и назовем ее кривой Паккарда - Такенса. Оказывается, при малых р размерность dy с ростом р увеличивается. Однако если регистрируемый сигнал есть проявление
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 167 детерминированного хаоса, то при некотором р = р0 величина djp перестает расти (!). Достигнутое при этом значение df*' принимается за размерность djc странного аттрактора исходной системы. Если же рост dyy продолжается без насыщения, то это свидетельствует о том, что наблюдаемый сигнал шумовой (!). Таким образом, обычный случайный процесс можно рассматривать как движение системы на аттракторе бесконечной размерности. Конечная размерность аттрактора означает, что данный сигнал можно воссоздать с помощью динамической системы. При решении задач управления важно отличать детерминированный хаос от обычных шумов и помех. Дело в том, что наличие внутреннего порядка в детерминированном хаосе позволяет в принципе управлять им, в то же время как шумовой хаос неуправляем [23]. Покажем [17], что минимальное число динамических переменных, необходимое для описания наблюдаемого хаотического движения оценивается как Г^с1 + 1, где [z] - целая часть z. Эта оценка может быть использована, в частности, для решения одной из самых сложных задач, возникающих при идентификации модели рассматриваемой системы, - задачи определения ее сложности. Рассмотрим примеры, связанные с применением процедуры Паккарда - Такенса для: 1) идентификации размерности математической модели и 2) диагностики объекта управления. Пример 2.12 [23]. Обработка записей пульсаций давления, вызванных работой штангового глубинного насоса (данные с тензодатчиков с глубины 390 м). На рис. 2.48 представлены графики пульсации давления глубинного насоса для различных жидкостей. yu/ivwi я- 1^=> Рис. 2.48. Пульсация давления в скважине: Р - давление, ц - вязкость, Рст - статическое давление', а - ц * 1,0 ц, Па-с (вязкость пластовой воды), б — \х* 50\х , Пас (дегазированнаянефть)', в - ц«500ц, Пас (водоэмульсионнаясмесь)
168 Методы современной ТАУ. Часть IV Как видно из рис. 2.48, при большой вязкости начинаются периодические колебания с периодом, равным продолжительности одного цикла качания насоса. С уменьшением вязкости ц движения усложняются и, можно предположить, устанавливаются хаотические колебания при малых ц (рис 2.48, а) Проверим эту гипотезу процедурой Паккарда - Такенса На рис. 2 49 построена зависимость корреляционной размерности dyy от размерности р вектора у. 15 20 Рис. 2.49. Построение кривой Паккарда - Такенса для выявления хаоса и определения фрактальной размерности (ц «1,0ц Па с) Из рис. 2.49 видно, что при р «12 наступает насыщение dyy . Следовательно, в данном случае действительно наблюдается детерминированный хаос, причем [^1 = 3 , поэтому минимальное число динамических переменных, необходимых для описания наблюдаемых колебаний, равно 4. Пример 2.13 (диагностика объекта управления) [23] При бурении скважины одной из важнейших технических задач является оценка степени износа долота с целью его своевременной замены. Косвенная оценка состояния бурильного инструмента по изменению механической скорости проходки не всегда надежна, поскольку изменение скорости проходки может быть связано с изменением свойств породы, а не с износом долота. Для диагностики состояния долота предложена оценка значения корреляционной размерности пульсаций давления промывочной жидкости. На рис. 2.50 представлены графики рассчитанных корреляционных размерностей для изношенного и неизношенного инструментов. 4<'> 1 5 9 13 17 Рис. 2.50. Кривые Паккарда - Такенса, характеризующие неизношенное (1) и изношенное (2) долото
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 169^ Видно, что неизношенное долото характеризуется конечной фрактальной размерностью dfC « 4,5 , в то время как фрактальная размерность изношенного инструмента не ограничивается конечной величиной и определяет случайный процесс, а не детерминированный хаос. 2.3.6. L-системы. Тертл-графика Для рассмотренных выше классических фракталов характерен единый принцип построения - добавляются либо выбрасываются отдельные линии или области. Процесс повторяется многократно (итерационно). Этот процесс лег в основу L -систем, позволяющих создавать отдельную, достаточную большую группу самоподобных фракталов (предложены в 1968 г. А. Линденмайером). С помощью L -систем, использующих подсистему графического вывода под названием тертл-графика (ТГ) (от английского turtle - черепаха), обычно строят связанные и несвязанные фрактальные множества - снежинки, ковры, кривые (Госиера, Гильберта, Пеано и др.), а также фрактальные деревья, растения, русла рек и т.д. Сущность тертл-графики состоит в том, что изображающая точка (черепашка) движется по экрану монитора прямолинейно, дискретными шагами, оставляя или не оставляя свой след. После каждого перемещения она может повернуться на некоторый угол в ту или иную сторону, или продолжить движение вновь по прямой. Так образуется непрерывная или разрывная дискретная линия на экране. Изображающая точка может вернуться на несколько шагов назад, не прерывая свой след, и начать движение в новом направлении. В этом случае происходит ветвление траектории движения. Изображающая точка движется по командам, задаваемых кодовыми словами. В каждой точке экрана положение изображающей точки задается тремя параметрами: х,у,а (х,у - координаты точки; а - направление движения). Кодовое слово состоит из указаний перемещения на один шаг с оставлением или неоставлением следа, увеличением или уменьшением направления движения на некоторый угол 0, открытием ветви, закрытием ветви. L -систему образуют алфавит, инициатор (слово инициализации, аксиома) и набор порождающих правил, определяющих преобразование аксиомы для организации итерационного процесса. Алфавит состоит из набора отдельных символов. Каждый символ представляет собой микрокоманду предписывающую определенное действие выполняемое изображающей точкой. Например: F - переместиться вперед на один шаг, прорисовывая след; Ъ - переместиться вперед на один шаг, не прорисовывая след; [ - открыть ветвь; ] - закрыть ветвь; + -увеличить угол а на величину 0; - - уменьшить угол а на величину 0. Из элементов алфавита можно создавать слова инициализации (аксиомы). Например L -система, позволяющая нарисовать на экране равносторонний треугольник, следующая: -!• аксиома F + +F + +F. Изображающая точка имеет первоначальное направление движения под углом —. Согласно команде F выполняется движение на один шаг. По командам + и + осу-
170 Методы современной ТАУ. Часть IV ществляется поворот на угол 2 —. Следующая команда F предписывает движение еще на один шаг. Команды + и + поворачивают изображающую точку вновь в положительном направлении на угол 2—. Окончательная команда F замыкает треугольник. Порождающее правило предназначено для замены микрокоманды в аксиоме группой микрокоманд. Например, если в приведенной выше аксиоме команду F заменить порождающим правилом newf = F-F + +F-F, то изображающая точка при движении по экрану нарисует снежинку Кох. Порождающее правило - это разновидность рекурсивной процедуры. Глубина рекурсии показывает, какое количество итераций по замене микрокоманд группой микрокоманд необходимо выполнить. С помощью микрокоманды ветвления осуществляется построение деревьев и растений. Порождающие правила позволяют выполнять ветвления многократно не только от линии основного направления движения изображающей точки, но и от построенных ранее ветвей. На рис. 2.51 и рис. 2.52 изображены фракталы, построенные с помощью микрокоманды ветвления. Выше рассматривалась лишь алгоритмическая сторона построения фракталов - множеств дробной размерности. Для понимания того, как из множеств образовываются фракталы, какие преобразования над ними выполняются, как организуется итерационный процесс, будет ли последовательность множеств сходящейся или нет, остановимся на отдельных математических аспектах теории фракталов. Рис. 2.51. Куст после 4-х итераций Рис. 2.52. Цветок после 3-х итераций 2.3.7. Аффинные преобразования Выполняемые над линиями или плоскими фигурами преобразования при построении фракталов относятся к аффинным преобразованиям (АП). Аффинное преобразование состоит из линейного преобразования пространства R" в пространство Rm и преобразования сдвига. В матричной форме это задается формулой Г(х) = Ах + В, Х€Д\ где А - прямоугольная матрица вещественных чисел размера тхп, В - вектор из т элементов. Наиболее иллюстративны действия, выполняемые АП в пространстве R2. Линейная составляющая аффинного преобразования осуществляет деформацию (сжатие
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 171 или растяжение) плоской фигуры. Причем площадь фигуры уменьшается или увеличивается в det(^) раз. Если, например, плоская фигура - многоугольник, то каждая из его сторон, являющаяся отрезком с координатами [(*n,.yii),(*2i,,)bi)], преобразуется в новую сторону, т.е. отрезок с координатами [(^п^п)»!^»^)]» причем левая сторона оригинала отражается в левую сторону изображения, правая - в правую, внутренняя область - во внутреннюю область. Операция сдвига, не меняя формы фигуры, осуществляет лишь ее перемещение в плоскости. При преобразовании, выполняемом в плоскости, т.е. в пространстве R2, АП имеет вид /г- *1 Х|Т]=Га11 а'2][ •*2_|J |_a2l а22_||_ * Hi Коэффициенты aiJ9iij = \i2;bi: / = 1,2 называются аффинными коэффициентами и однозначно определяются при отображении трех несовпадающих точек (хп,уп), (Х2\>У2\)> (*3i>Уз\) в три другие точки (хХ2,у12), (*22>;И22)> (^32^32) из следую- щей системы уравнений *21 .*31 *21 .*31 Уг\ Уз\ У и Уг\ Уг\ 1 1 1 Г 1 1 «11 ап Л. ~аг\ ап Л. = = хп х22 /32. ~Уп Уп У гг. Преобразования, выполняемые для ковра Серпинского на любом из шагов для одной из треугольных областей (координаты вершин треугольника (0,0), (1,0), —,— |), можно задать с помощью трех аффинных преобразований (рис. 2.53) 1 2 0 "1 2 0 1 2 0 0 1 2. 0 1 2. 0 1 2. [::№]• (2.250) И- о 4 й L 4 J Одной из разновидностей аффинных преобразований является изометрия T(x) = Qx + B.
172 Методы современной ТАУ. Часть IV Матрица Q, определяющая линейное преобразование, ортонормирована, т.е. QTQ = QQT=i, где I - единичная матрица п х п. Рис. 2.53. Аффинные преобразования для ковра Серпинского Столбцы матрицы Q образуют ортонормированный базис. Действительно, результат перемножения строки матрицы QT и столбца матрицы Q можно рассматривать как скалярное произведение двух векторов q, и q] (q, - /-й столбец матрицы Q) (q,q() = Z^=^={0)/^, Здесь 5/у - символ Кронекера. Для изометрии характерна неизменность метрики до и после преобразования И*)-Пу)1Их-у«2>х.уе*й- В пространстве R2 вращение плоской фигуры, ее отражение и сдвиг являются изометриями. Обобщением изометрии является преобразование подобия. Преобразование S:Rn -» R" задается выражением S(x) = rQx + B, где Q - ортонормированная функция, г - коэффициент подобия, вещественное число, г>0. Для преобразования подобия справедливо 1И(х)-5(у)|2=Н|х-у||2,х,уе/г". Изменяя коэффициент подобия г в ходе итерационного процесса, можно получать разнообразные фракталы. 2.3.8. Метрика Хаусдорфа При построении фракталов в ходе итерационного процесса осуществляется переход от одного подмножества к другому. На каждом шаге выполняются аффинные (или другие) преобразования. В ходе этого процесса формируется некоторая последовательность множеств. Последовательность может быть как сходящейся, так и расходящейся. Известно, что последовательность {х„ }™=1 из X сходится к точке хеХ в метрике р, определенной для этого пространства, если Нтр(х„,х) = 0.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 173 Для определения сходимости последовательности множеств к фракталу используется метрика Хаусдорфа Н(А9В), т.е. мера для измерения расстояния между двумя множествами А и В . Метрика Хаусдорфа задается на множестве К всех непустых компактных подмножеств пространства Rn следующим образом: H(AiB) = m2Oi{d(AiB)id(BiA)}i А,ВеК. Здесь d(X9 Y)- расстояние между двумя компактными множествами X и Y. Расстояние d(X, Y), в свою очередь, определяется так: d(X,Y) = max{d(x,Y):xeX), где d(x9 Y) = min||x - у|2 : у е Y - расстояние между точкой х е X и множеством Y. Понятия d(x,Y) и d(X,Y) иллюстрируются на рис. 2.54 ирис. 2.55. d{x9Y) х Рис. 2.54. К пояснению понятия d(x,Y) X Y Рис. 2.55. К пояснению понятия d(X,\) Метрику Хаусдорфа можно определить, используя понятие дилатации (расширения). Дилатацией множества X из пространства R" радиуса г (обозначается X + г) является векторная сумма X + Вт (0), где Вт (0) - замкнутый шар радиуса г с центром в начале координат, т.е. X + r = U{Br(x):xeX}9 где U - знак единения множеств. Метрика Хаусдорфа между двумя непустыми компактными множествами А и В через дилатацию определяется зависимостью Н(А,В) = тт{е>О:Ас^В + г, £<=Л + г}, где с - знак вложения множеств. Графическая иллюстрация данного понятия приведена на рис. 2.56. Введенная метрика Хаусдорфа позволяет определить сходимость последовательности компактных множеств {^л}^ к компактному множеству А . Для того, чтобы lim An= A Я->00 в метрике Хаусдорфа, необходимо и достаточно, чтобы для любого 6 можно было выбрать такое N, что из п > N следует Ап<^А + г,АсАп+г.
174 Методы современной ТАУ. Часть IV *А Дилатация В (В + гв) Дилатация А Рис. 2.56. Нахождение метрики Хаусдорфа между множествами А и В: Н(А,В) = пшх{гАугв: АаВ + гв> ВсА + гА} = гв , sB=d(A,B)3 sA=d(B,A) Множества Ап являются аппроксимирующими множествами для множества А . 2.3.9. Система итерированных функций Как отмечалось ранее, прсщедура построения фракталов представляет собой итерационный процесс - переход от одного множества к другому. На каждом шаге выполняются преобразования над множеством, полученном на предыдущем шаге. Данный алгоритм можно представить в виде следующей схемы: Ео - исходное компактное множество, £,=7J(£:W), / = 1.2 (2.251) Здесь Ti (£м) - преобразования, выполняемые на / -м шаге над множеством £м . Например, для ковра Серпинского преобразование 7)(£м) будет объединением трех аффинных преобразований, определенных формулами (2.250): 7-(£i_I) = 7i(£;w) U Т2(£,.,) U Т3{ЕМ). На каждом шаге итерационного процесса выполняются однотипные преобразования. В общем же случае на каждом шаге могут выполняться различные преобразования, определяемые следующим образом T(E)=UTj(E). (2.252) Преобразования вида (2.252) называются преобразованиями Хатчинсона. Преобразования Хатчинсона Т позволяют строить разнообразные фракталы за счет выбора различных элементарных преобразований 7) (Е).
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 175 Необходимо отметить, что если преобразования 7J(£/_1) заранее определены, то получаемый результат совершенно не зависит от выбора исходного компактного множества Ео . Кроме того, не любые преобразования Т порождают фракталы. Пусть имеется совокупность 7), / = 1,/и действующих на Rn и образующих одно преобразование Т вида (2.252), тогда система итерированных функций (СИФ) будет являться совокупностью данных отображений вместе с итерационной схемой (2.251). Итерационная схема (2.251) может порождать предельное множество Е : Е = lim En (2.253) вследствие сходимости в метрике Хаусдорфа, но может и не порождать. Если предел существует, то предельное множество является аттрактором системы итерированных функций. Достаточно часто аттрактор является фракталом. Для того, чтобы предел (2.253) существовал, необходимо и достаточно, чтобы отображения 7} :/ = 1,/и были сжимающими отображениями с коэффициентом сжатия Sj < 1 (смотри также логистическое уравнение в §2.2). В этом случае преобразование Хатчинсона Т также будет сжимающим, с коэффициентом сжатия определяемым из условия S = max(Su...9Sm)9 и аттрактор будет являться неподвижной точкой отображения Т в полном пространстве К с метрикой Хаусдорфа. Под точкой здесь понимается компактное множество. Действительно, для любого компактного множества А выполняется условие с е А + 6 тогда и только тогда, когда существует такой элемент а е А , что d(c, а) < г . Следовательно, если А а В + г и В с А + г , то для каждого отображения 7} справедливо Ti(A)cTi(B) + SiE и соответственно Ti(B)czTj(A) + SiE. Поскольку преобразование Хатчинсона есть объединение сжимающих отображений 7}, то Т(А) с T(B) + S-z и Г(Я)<=Г(Л) + 5-е. Пусть Б = #(Л,Я),тогда H(T(A)j(B))<S-r или H(T(A)9T(B)) = S'H(A,B). Таким образом, преобразование Т является сжимающим и предел (2.253) существует. Алгоритмы, реализующие СИФ, позволяют строить самые разнообразные фракталы в зависимости от того, из каких и какого количества сжимающих отображений сформировано преобразование Хатчинсона. Если, например, преобразование Хатчинсона получено с использованием двух аффинных преобразований Т2(х) = х + 0,4 -0,3733] 0,6 0,6 " -0,8 -0,1867 0,1371 0,8 0,3533 0,0 х + т.е. Г(х) = Г,(х)иГ2(х), то можно построить фрактал под названием «лист» (рис. 2.57). Если использовать четыре аффинных преобразований вида Г0,2550 0 1 Г0,3726] ri(X)"L 0 0,2550 х + к 6714J'
176 Методы современной ТАУ. Часть IV Г2(х) = h («) = Г4(х) = 0,2550 0 0 0,2550 0,2550 О О 0,2550 х + х + 0,1146 0,2232 0,6306 0,2232 0,3700 -0,6420] ГО, 6356 -0,6420] ГО, 63561 0,3700 J[-0,06l} -0,6420 то будет иметь место фрактал под названием «кристалл» (рис. 2.58). Аффинные преобразования для ковра Серпинского определены выше в §2.3.7. Рис. 2.57. Фрактал «лист» Рис. 2.58. Фрактал «кристалл» Задача построения предельного множества Е - аттрактора из исходного компактного множества Ео в результате итерационного процесса с заданным преобразованием T(Ej) является прямой. Особенностью задачи является то, что вид аттрактора определяется только коэффициентами аффинного преобразования (если такое используется) и не зависит от выбора исходного множества Ео. В то же время можно поставить обратную задачу, а именно, определить совокупность сжимающих отображений, для которых заданное множество является аттрактором. Обратная задача значительно сложнее прямой, однако имеет огромное прикладное значение, в частности, в области сжатия изображений [17]. Необходимость сжатия изображений обусловлена различными факторами. Основными являются - разгрузка каналов связи и соответственно снижение себестоимости передачи данных; использование существующих каналов, изначально не предназначенных для передачи изображений; экономия памяти компьютеров за счет архивации изображений и т.д. Сущность подхода к сжатию изображений состоит в том, что исходное изображение разбивается на отдельные компоненты, каждое из которых считается аттрактором некоторой системы итерированных функций. Для каждой СИФ определяются типы преобразований, например, аффинных. Поскольку одно аффинное преобразование задается только шестью аффинными коэффициентами, то полное исходное изображение можно закодировать относительно небольшим количеством коэффициентов. В этом случае архивации или передаче по каналу связи подлежат лишь коэффициенты аффинного преобразования. При восстановлении изображения решается прямая задача.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 177^ 2.3.10. Случайные фракталы Все объекты, с которыми сталкивается человек, можно разделить на искусственные и естественные. Все искусственные объекты имеют, как правило, четкие формы, в то время как формы естественных объектов в большинстве своем являются неправильными. Поэтому такие образования, как горные хребты, береговые линии или облака подобием, в смысле неизменностью, при линейном увеличении или уменьшении не обладают. При изменении масштаба рассмотрения объектов случайным образом меняются их отдельные элементы. Принцип самоподобия в приведенных случаях необходимо рассматривать со статистических позиций, т.е. понятие «подобный» необходимо толковать как «похожий». Отдельную группу, предназначенную для моделирования природных объектов, образуют случайные фракталы. Наиболее наглядным случайным фракталом является рандомизированная снежинка Кох. Для ее получения достаточно на каждом шаге итерационного процесса обращать вовнутрь или наружу вершину нового строящегося треугольника (рис. 2.59). Фрактальная размерность построенной таким образом кривой остается прежней. Предельная кривая рандомизированной снежинки Кох может служить прекрасной моделью, например, контура облака или острова. Аналогичный подход может быть реализован при построении фракталов с помощью L -систем, когда случайным образом реализуется, например, операция ветвления. Построенные таким образом деревья, растения или снежинки будут иметь более естественный вид. В приведенных примерах рандомизации подвергаются лишь отдельные параметры итерационного процесса, в то время как сам алгоритм (система итерированных функций) построения фракталов остается неизменным - детерминированным. П Рис. 2.59. Рандомизированная кривая Кох Очевидно, что итерационный процесс также может быть случайным. Для того, чтобы в результате этого процесса осуществлялось построение именно фракталов, необходимо выполнение принципа самоподобия (статистического самоподобия). Свойством статистического самоподобия обладает винеровский процесс (броуновское движение), имеющий нормальное распределение. Случайный процесс Х(/) будет винеровским с нормальным распределением на заданном интервале изменения аргумента t е[я,б], если удовлетворяет следующим требованиям: 1) Х(0) = 0 и функция Х(/) почти всегда непрерывна. 2) Приращение случайного процесса X(t) для двух значений аргумента (моментов времени) 13 Зак 416
178 Методы современной ТАУ. Часть IV ДХ(Д*) = Х(/2)-Х(*,), h>tb At = t2-tx является случайной величиной, имеющей нормальный дифференциальный закон распределения с нулевым математическим ожиданием /Идх =0 и дисперсией ЯДХ(д,)=а2Дг,т.е. /дх(Ах)= , ехр - Ыс2М { 2c2At) Поскольку дисперсия приращений зависит только от разности аргументов А/ = t2 - t{, а не от самих значений tx и t2, то приращения являются стационарными. Приращения винеровского процесса для независимых моментов времени являются независимыми случайными величинами в том смысле, что если а < Ц < t{ < t2 < t2 <... < tk < t'k < b, то м{ах(а/1)ах(а/2)...ах(а^)} = м{ах(аг1)}-л/{ах(а/2)}...л/{ах(а/а)}, где ty=t\-tt :i = \J. To есть винеровский процесс является марковским, если значение процесса в текущий момент времени зависит только от значений в предыдущий момент времени и величины приращения. Приращения винеровского процесса обладают свойствами статического самоподобия. Для них справедливо АХ (At) = 4-АХ (гAt), (2.254) или X(t + At)-X(t) = -j=[X(t + rAt)-X(t)] для любого г > 0. Здесь символ = означает, что две случайные величины имеют одинаковые дифференциальные законы распределения. Действительно, приращения винеровского процесса являются нормальными случайными величинами. Интегральный закон распределения для левой части соотношения (2.254) имеет вид ^ < s2 V ^^Ьтгтт/Ч- 2а2At Г' Для правой части ^х(Д*) = -7=== J Н-^У*- (2*255) Выполнив замену переменных s = y[ru в (2.255), видим, что дисперсии одинаковые. Таким образом, величина Vr является коэффициентом статического самоподобия. Определим фрактальную разность винеровского процесса. Без потери общности полагаем, что интервал изменения значений аргумента [0,1]. Разделим этот интервал на п равных подинтервалов одинаковой длины At = — и таким же образом разделим п
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы Г79^ |ДХ| вертикальную ось на подинтервалы длины At. Выражение J L служит в качестве At оценки числа квадратов размера А/, необходимых для покрытия части графика y = X(t), расположенной над одним подинтервалом. Так как математическое ожидание величины |АХ| пропорционально Va/ , то число квадратов, необходимых на одном подинтервале, пропорционально Va/ . Всего имеется — таких подинтерва- At _з лов, поэтому общее число квадратов пропорционально At 2 , т.е. _3 N(At)*At 2. Таким образом, фрактальная размерность винеровского процесса г \nN(At) df =- lim -—- = 1,5 . J Д/-*0 In At Как было показано выше, фракталы, построенные на основе детерминированных алгоритмов, имеют различную размерность. Поэтому вполне естественным является вопрос: можно ли построить случайные фракталы, имеющие размерность отличную от df = 1,5? И ответ на этот вопрос является положительным. Обобщением классического винеровского процесса (КВП) является фрактальный винеровский процесс (ФВП). КВП обладает свойством марковости, т.е. это процесс без памяти, для него условная вероятность того, что Х(/2) достигает определенного значения при задании Х(^) (^ <t2), зависит только от tx и t2i а не от поведения Х(/) при t <tx. ФВП, в отличие от КВП, относится к числу случайных процессов с памятью. Приращения ФВП для различных интервалов изменения аргументов являются зависимыми. Наиболее удобно фрактальный винеровский процесс определить при помощи параметра Я, 0 < Я < 1. При Н = 1/2 ФВП совпадает с КВП. Гаусовский процесс Х(/) является фрактальным винеровским процессом с параметром Я, 0<Я<1, если он удовлетворяет следующим требованиям: 1) Х(0) = 0 и почти все реализации Х(/) непрерывны. 2) Приращения процесса Х(/) АХ(А/) = Х(/2)-Х(/1), At = t2-tb t2>tx являются случайной величиной, имеющей нормальное распределение /дх (Дг) = __1__ехрЦ[—^-Л . (2.256) Как видно из (2.256), математическое ожидание нулевое, дисперсия - ^дх = °21*2 ~'i| • Так как дисперсия приращений зависит только от разности аргументов, а не от их значений, то данный случайный процесс является стационарным. То, что случайный процесс не является марковским, означает зависимость двух его приращений. Действительно, т.к. Х(0) = 0, то 13*
180 Методы современной ТАУ. Часть IV (Х(г)-Х(0))(Х(/ + А/)-Х(0)- =1{(х(/+д0-х(о))2-(х(0-х(о))2-(х(,+д0-х(0)2}. Учитывая, что /)дх = a2\t2 -t\\ , имеем л/{(х(/)-х(о))(х(,+д0-х(0)}=^2[(^а02Я-/2я-дг2Я]. Как видно, полученное выражение равно нулю только при Н = — (классический винеровский процесс), оно отрицательно при Н < — и положительно при Н > —. Фрактальный винеровский процесс так же, как и классический винеровский процесс, обладает принципом статистического самоподобия с коэффициентом самоподобия rli, т.е. ЛХ(Л/) = -^-ЛХ(гЛ/), дляг>0. 1Сь I i Т | <_Я* I I ^ = -.Нп>. ,.,..ч -2-Я. (2.257) Размерность фрактального винеровского процесса вычисляется аналогично вычислению фрактальной размерности классического винеровского процесса. Поскольку то Д/->0 lg(A/) Как видно из (2.257), изменяя параметр Н, можно менять фрактальную размерность. Визуально можно отметить следующие изменения в реализациях фрактального винеровского процесса для различных значений Н (рис. 2.60). Увеличение Н приводит не только к уменьшению df , но и к уменьшению дисперсии процесса, т.е. он становится менее «изрезанным», более гладким. Больших отклонений от математического ожидания нет. Таким образом, изменяя Н, можно менять вид случайного фрактала при постоянном значении параметра а. Рассмотренные выше теоретические положения определяют сущность случайных фракталов. Одномерные классические и фрактальные винеровские процессы может быть и не имеют самостоятельного значения при моделировании природных образований, однако являются основой для построения двумерных процессов, с помощью которых можно моделировать естественные ландшафты - горные хребты, лесную поверхность, волнение моря и т.д. Двумерный фрактальный винеровский процесс (поверхность) определяется следующим образом. Это функция двух аргументов Х(*,.у), обладающая следующими свойствами: 1) Х(0,0) = 0 и почти все реализации процесса непрерывны; 2) Приращения процесса Х(х,у) АХ = Х(х + Ах,у + Ау)-Х{х,у), где Ах = х [t2) - х (/]), Ay = у (t2) - у (t\) - являются случайной величиной, имеющей нормальный интегральный закон распределения
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 181 /-дх(Дх) = ,Р(ДХ<Я) = Л2ла2(дх2+Ду2)2Я о S = Jexp U2 ■) i ■) ->\2Н 2ст2(Дх2+Ду2) du. (2.258) #=0,8; £>=1,2 Я=0,6;£>=1,4 Я=0,4;£>=1,6 Я= 0,2; Я =1,8 Рис. 2.60. Реализации фрактального винеровского процесса Как видно из (2.258) математическое ожидание нулевое, дисперсия Л5Я = G2(yJAx2+Ay2Y . Фрактальная размерность двумерного винеровского процесса df=3-H. Это аналогично вычислению фрактальной размерности для классического одномерного винеровского процесса. На рис. 2.61 - рис. 2.63 приведены примеры части фрактальной поверхности (функция max{X,0}), соответствующие двумерным винеровским процессам с различными значениями параметра Н . Изменяя значение Н , можно моделировать самые разнообразные типы земной поверхности - от равнин до горных хребтов. Рис. 2.61. Двумерный фрактальный винеровский процесс: #=0,5
182 Методы современной ТАУ. Часть IV Рис. 2.62. Двумерный фрактальный винеровский процесс: # = 0,2 Рис. 2.63. Двумерный фрактальный винеровский процесс: # = 0,8 Моделировать одномерные и двумерные фрактальные винеровские процессы целесообразно, используя преобразование Фурье и основываясь на том, что спектраль- 1 У-2Я+1 ная плотность ФВП аппроксимируется степенной функцией ^ил , т.е. (2.259) являясь функцией убывающей при увеличении частоты / . Справедливость зависимости (2.259) можно показать, основываясь на следующих положениях. Известно, что спектральную плотность стационарного случайного процесса X(t), определенного на полубесконечном интервале [0,оо), можно определить не только через его корреляционную функцию, но и как предельный переход от спектральной плотности мощности процесса Хт (/), определенного на конечном интервале [О, Г], а именно (2.260) Sx{f)=YxmJx(fj), где
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы Ш. Sx(f,T) = ^\x(jfjf (2.261) - спектральная плотность мощности функции хт (/), т X(jf,T) = jXT(t)e~2nifdt- преобразование Фурье «усеченного» фрактального о винеровского процесса, хг(0={х(')'°^г' w [ 0, / > Т. Учитывая, что ФВП удовлетворяет принципу статического самоподобия, т.е. X(t)^±X(ri) для любого г>0, найдем связь между спектральными плотностями для x(t) и Введем обозначение *(,).[><">. «*<* г. [ 0, / > Т. Преобразовывая данную функцию по Фурье, имеем Y{jfj) = lYT(t)e-Wdt = ^lxT(x)i2nJ^dt. (2.262) о г о Интеграл в правой части соотношения (2.262) есть Х\ j—,rT , т.е. I г ) f(jf>T)~x[jl,rTy Соответственно спектральная плотность мощности для YT (/) будет определяться зависимостью м/.г)--4д4 iH rw+l rT Используя предельный переход (2.260), получаем Поскольку x(t)n y(t) статистически самоподобны, то спектральные плотности Sx (/) и SY (/) совпадают, следовательно Если формально плотность г = f , то 5Л/)=4тгМ1). г2Н+\ Справедливость зависимости (2.259) показана.
184 Методы современной ТАУ. Часть IV Основная идея моделирования ФВП состоит в произвольном задании спектральной плотности Sx (/), сохраняющей требуемые свойства, определенные зависимостью (2.259), и последующем применении обратного преобразования Фурье. Моделирование осуществляется на конечном интервале изменения аргумента функции X[t), т.е. рассматривается функция Хт (/). Поскольку используются средства вычислительной техники, то в итоге формируется числовая последовательность Хт [пТ0], являющаяся дискретной аппроксимацией Хт (/): Хт[пТ0] = Хт(()1пТо,п = 0^1, т где То = шаг дискретизации процесса, N N - число дискретных отсчетов. Практическая реализация выполняется следующим образом. Синтезируется дискретное преобразование Фурье для числовой последовательности Хт [пТ0] в виде Хп=-^,п = 0^Г\. (2.263) Здесь*, =-^(7/, Г). уо Зависимость (2.263) определяется в данной форме в силу справедливости соотношений (2.259) и (2.263). Поскольку для каждого значения п Хп является произвольным комплексным числом, то коэффициент К можно задать в форме K=ve2nJU, где v - значение нормально распределенной случайной величины с нулевым математическим ожиданием и единичной дисперсией, и - значение равномерно распределенной случайной величины на отрезке [0,1]. К синтезированному комплексному вектору Хп применяется обратное дискретное преобразование Фурье. Результатом является искомая числовая последовательность *Г[«ГО]. При построении случайных фрактальных поверхностей двумерных ФВП используются те же процедуры, что и в одномерном случае. В отличие от одномерного случая вместо вектора хп вначале синтезируется двумерная матрица Хпк : и, к = 0,7V-1, удовлетворяющая условию I Р чЯ+1 а затем применяется двумерное обратное преобразование Фурье. 2.3.11. Множества Жюлиа В §2.3.9 при рассмотрении системы интегрированных функций не конкретизировались типы преобразований 7)(£м) (2.251) (указывалось лишь, что они должны быть сжимающими) и вид исходного компактного множества Ео. В приведенных там же примерах использовались только аффинные преобразования. Однако, в общем случае, выполняемые преобразования могут быть нелинейными, а исходным компактом - точка на плоскости. Для удобства записи математических операций
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы \&5_ над точками плоскости последние часто рассматриваются как комплексные числа вида z-a + jb. Поэтому исходное комплексное множество, над которым выпол- няются операции при построении фракталов, может быть некоторым комплексным числом z, и все выполняемые преобразования можно осуществить над комплексными числами. Нелинейную функцию, используемую в итерационном процессе, также можно выбрать произвольно, однако наиболее часто при рассмотрении множеств Жюлиа ограничиваются полиномами одного комплексного переменного вида д*)=2>,*', <2-264> /=0 где п > 2, ах; : / = 0, и - комплексные числа. Для каждого zoeC (С - множество комплексных чисел) соотношение z*+i=/0O> л = 0,1,2,... определяет некоторую последовательность точек, которые определенным образом заполняют комплексную плоскость. Под множеством Жюлиа функции /(z), обозначаемое как J(f), будем понимать границу множества точек z, стремящихся к бесконечности при бесконечном интегрировании функции f(z): J(/) = a{z :/">-► *>,*->«>}. Здесь для обозначения итерационного процесса используется запись рп> = /(...(/(/(z)))), символ д - означает границу. Множество названо в честь французского математика Гастона Жюлиа, который одновременно с Пьером Фату исследовал поведение функции комплексного переменного при ее бесконечном итерировании. Простейшим полиномом степени два является функция /(z) = z2 . Для нее можно построить простейшее множество Жюлиа. Так как /^(z) = z^ n\ то /'^(z)->oo при п -» оо только тогда, когда |z| > 1. То есть единичная окружность \z: \z\ = l} является границей множества Жюлиа, хотя фракталом и не является. Наибольший интерес при построении множеств Жюлиа среди полиномов второй степени представляет квадратичная функция fc{z) = z2+c9 (2.265) где с е С - константа. Функция (2.265) не является частным случаем полиномов второй степени. Замена переменных в (2.265) вида I— а\ 2у]а2 сводит ее к полиному общего вида f(x) = a2x2 +а{х + а0. 12 3ак 416
186 Методы современной ТАУ. Часть IV Изменяя константу с можно построить на экране компьютера удивительной красоты заполняющие множества Жюлиа. Заполняющее множество Жюлиа состоит из точек, орбиты (траектории движения) которых, получающиеся в ходе итерационно- сти процесса zn+x =/(zn), ограничены. Границей орбит является само множество Жюлиа. На рис. 2.64 - 2.66 приведены примеры заполняющих множеств Жюлиа для различных значений с. Из рисунков видно, что заполняющие множества Жюлиа являются фракталами и значения констант с влияет на их вид. Изменяя с, можно получить их невероятное разнообразие. Множества Жюлиа будут иметь место только в том случае, если при итерировании функции (2.265) |г„|<2для и-»оо. Если при некотором щ z,J>2, то lim zn = оо, т.е. траектория изменения z , строящаяся в ходе итерационного процесса, стремится в бесконечность и z не принадлежит множеству Жюлиа. Рис. 2.64. Заполняющее множество Жюлиа для z2- 0,20+0,75/ Рис. 2.65. Заполняющее множество Жюлиа для z2- 0,1244+0,7560/ Действительно, условие |zWo I > 2 будет выполняться либо при выборе достаточно большого значения константы с, либо при выборе z0 далеко от нуля. Положим |с| = 2 - 25, где 5 - малая (бесконечно малая) величина, т.е. |с| < 2 . Рассмотрим модуль функции fc (z):
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 187 |/c(z)|=|z2+c|>h2-H=h[n-}^]. Рис. 2.66. Заполняющее множество Жюлиа для z2- 0,1194+0,6289/ На интервале [2,оо) для вещественной функции <р(х) = х-— имеем ф(х)>ф(2), х поэтому Так как |с| = 2 -26, то |/с (z)| > (l + 5)|zj. Таким образом, для «-й итерации имеем |/J">(z)|>(l + 6)>|. Данное выражение стремится к <х> для всех z0, для которых |zo| > 0. Таким образом, граничным значением для z , порождающих множества Жюлиа, являются |z| < 2. Заполняющие множества Жюлиа при их отображении на экране компьютера могут иметь не только черно-белую окраску, но и цветную. Один из подходов в выборе цвета для его индикации состоит в подсчете числа итераций, необходимых для выполнения условия |zw|>z?/7. ггр- некоторое фиксированное граничное значение переменной z в заполняющем множестве Жюлиа. Если число итераций находится в интервале [«i,«2] > то эта область окрашивается в один цвет, если в другом интервале, то цвет другой. Аналогично могут окрашиваться области за пределами множества Жюлиа. В ходе итерационного процесса формируется некоторая траектория 0r (z) изменения z в виде последовательности точек. Если при некотором п - zn = z0, то z0 является периодической точкой. Наименьшее натуральное число п, обладающее указанным свойством, является периодом траектории. А сама траектория (напоминаем) является периодической траекторией, или циклом. Для того, чтобы охарактеризовать устойчивость периодической точки z0 и соответственно определить устойчивость траектории в окрестностях периодической точки, находится производная от итерируемой функции в этой точке: 12*
188 Методы современной ТАУ. Часть IV =ц/<"><4.,„- собственное значение точки z0 . В зависимости от значения X периодическая точка называется: • сверхпритягивающей, если X = О , • притягивающей, если |^| < 1, • нейтральной, если |^| = 1, • отталкивающей, если |^| > 1. Если z0 - некоторая притягивающая или сверхпритягивающая неподвижная точка, то бассейн (область) ее притяжения определяется следующим образом: ^(zo) = JzgC:/W(z)^zOj когдал-><х>}. (2.266) A(z0) состоит из тех точек z, чьи траектории сходятся к точке z0. Если у = |zo,/(zo),...,/'w~1'(zo)> - притягивающий цикл периода п, то каждая из неподвижных точек /'^(zo):/ = O,h-1 функции y'(z) имеет свой бассейн притяжения, а Л (у) - представляет собой просто объединение этих бассейнов. На рис. 2.67, рис. 2.68 приведены примеры множеств Жюлиа, ограничивающих один и три бассейна притягивающих неподвижных точек. Бесконечно удаленная точка оо также может быть классифицирована. Определение типа бесконечно удаленной точки осуществляется заменой z на —. Поведение z функции /(z) в окрестностях этой точки эквивалентно поведению функции F{z)-——— в окрестностях точки ноль. Если точка 0 - притягивающая периодическая точка для F(z), то бесконечно удаленная точка оо также будет притягивающей и т.д.; для функции fc(z) = z2 +с - бесконечно удаленная точка оо является сверхпритягивающей. Рис. 2.67. Бассейн притягивающей неподвижной точки Рис. 2.68. Бассейн притягивающего цикла периода 3 Теперь можно дать следующие, более расширенные, определения множеству Жюлиа.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 189^ 1) Если у - притягивающий цикл функции /(z),to J(f) = dA(y). Или J(f) - граница области притяжения всех притягивающих неподвижных точек f(z), включая оо. 2) Каждая отталкивающая периодическая точка принадлежит J(/),h J(f) является замыканием множеством всех отталкивающих периодических точек /(z). Или, пусть Р - множество всех отталкивающих периодических точек функции /(z), тогда множество Р плотно в J(f), т.е. каждая точка из J(f) является некоторой последовательностью точек из Р. О фрактальной размерности множеств Жюлиа почти ничего не известно. Однако если используется отображение вида /(z) = z2+c, то для |?|«1 можно оценить фрактальную размерность множества Жюлиа по формуле м2 df = 1 + ——— + члены более высоких порядков. f 41og2 F Как видно из формулы, множества Жюлиа имеют дробную размерность большую единицы. Дополнением к множеству Жюлиа J(f) в С является множество Фату (обозначается F(f)) F(f) = C\J(f). Таким образом, если у - притягивающий цикл периода п, а Л(у)- объединение бассейнов притягивающего цикла, то ^(Y)c=F(/). 2.3.12. Множества Мандельброта Множества Жюлиа принадлежат к числу наиболее прекрасных фракталов. Большинство из них самоподобны. Вид множества Жюлиа зависит от выбора константы с. Меняя с, можно получить невероятное разнообразие множеств. Их граница постоянно меняет свою форму и при некоторых значениях с «взрывается», превращаясь в пыль. Несмотря на большее разнообразие, существует всего два типа множеств Жюлиа. Множество Жюлиа может быть либо связным, либо множеством вполне несвязанным. Множество значений константы с, для которых множество Жюлиа является связанным, есть множество Мандельброта М. Для значений с £ М множество Жюлиа несвязно. Для различных типов итерируемых функций множество Мандельброта может иметь различный вид, но в основе каждого из них лежат «маленькие копии» множества Мандельброта для функции fc(z) = z2 +с. Это связано с тем, что многочлен высокой степени в отдельных, малых областях изменения аргумента подобен источнику второй степени (сравните с функцией Морса). Множество Мандельброта для функции fc (z) = z1 + с определяется следующим образом: М = jceC:/cW(O)-~O, когдал->оо\.
190 Методы современной ТАУ. Часть IV В определении множества Мандельброта используются нулевая точка комплексной плоскости. Это связано со следующими обстоятельствами. Любой притягивающий или рационально нейтральный цикл содержит в своей области притяжения хотя бы одну критическую (периодическую) точку. Но функция /с (z) имеет только две критические точки: 0 и оо . Обе точки не зависят от с. Точка оо является сверхпритя- гивающей неподвижной точкой, поэтому интерес представляет только точка z = 0. Выбирая отдельные значения с, например, с -1, получим траекторию (орбиту) последовательности точек: 0; 1; 2; 5; 26; 677..., т.е. ОеЛ(оо). Для таких значений с другого аттрактора, кроме оо, не может быть. С другой стороны, существуют такие с, например, с = 0, при которых второй аттрактор существует. В данном случае точка z = 0 притягивает все z, для которых |z| < 1. Ранее было показано, что граничным значением для z , порождающих множества Жюлиа для функции fc(z) = z2 +с, являются те, которые удовлетворяют условию |z|<2. Поэтому проверять орбиты fc(z) на ограниченность при z = 0необходимо только для констант |с| < 2 . В частности, точка с = -2 принадлежит множеству Мандельброта. Не останавливаясь на теоремах Жюлиа и Фату, доказывающих связность J(f) при се М, рассмотрим, какой вид имеет множество Мандельброта. При рассмотрении множества Мандельброта первое, что бросается в глаза - это область, ограниченная большой кардиоидной (рис. 2.69), с острием в точке 0,25 и закругленной вершиной в точке - 0,75. Для значений с, лежащих в этой области, множества Жюлиа имеют притягивающую неподвижную точку. J 1 0.5 -0.5 -1 .1 * i 2 V 5 - —; \ f 3' ig—~— 4 V— 5 к—5 "-2 -1.5 -1 -0.5 0 0.5 1 Рис. 2.69. Множество Мандельброта для г2 + с Действительно, если z - неподвижная точка периода 1, то fc(z) = z2+c = z. Точка будет притягивающей, если W = -г/сМИ- <к
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы \9\_ Так как то имеем N<i- Таким образом, граничные точки притягивающего цикла лежат на окружности радиуса —. Это точки z = — е7ф, где 0 < ср < 2п . Из условия неподвижности точки z (2.266) следует уравнение для кривой, ограничивающей область притягивающих неподвижных точек: 2 4 При изменении ср в интервале [0,2я] с описывает кардиоиду. Если z является притягивающей точкой периода 2, то она будет неподвижной для функции /J ' (z), т.е. (z2 + с) +c = z . Данное уравнение можно записать следующим образом: (z2 +c\+c-z = (z2+c- z\[z2 + z +1 + c\ = 0 . Решения уравнения z2+£-z = 0 - это рассмотренные выше неподвижные точки для z . Пусть z, и z2 - решения уравнения z2+z + l-c = 0. (2.267) Так как они точки периода 2 для /с (z), то имеем Jz2+c = z2, Откуда следует, что 4/c(2)(^) = 4z,(Z2+c)=4Z|z2) az v 7 а также |/c(2)(^) = 4z,z2. Произведения zxz2 двух решений уравнения (2.267) равно свободному члену этого уравнения, откуда получаем zxz2=l + c. Точки z периода 2 будут притягивающими, если ^'Ч1' откуда |4(1 + с)|<1.
192 Методы современной ТАУ. Часть IV Таким образом, область значений с, для которых существуют периодические притягивающие точки периода 2 в множестве Жюлиа, лежат в круге радиуса 0,25 с центром в точке-1. Используя компьютер, можно алгоритмическим путем (аналитически затруднительно) определить области для периодических притягивающих точек с другими периодами. Все эти области называются обрамлением множества Мандельброта. Каждая бифуркация - изменение периода притягивающей точки - порождает новые области. Они касательны к кардиоиде, а по форме похожи на круг. К каждой из них, в свою очередь, прикреплено бесконечное число еще меньших, также имеющих форму круга областей и т.д. Но и это еще не все. Если мы, выйдя из большой кардиоиды и двигаясь налево, попадем в круг, затем налево - в следующую область и продолжим движение дальше, то при этом будем все время приближаться к так называемой точке Мирберга - Фейгенбаума, которая имеет координату -1,401... . Отрезок от этой точки до - 2 также принадлежит множеству Мандельброта. И на нем есть маленькая, напоминающая кардиоиду, область с заостренной вершиной в точке -1,75 (ее центр находится в точке - 1,754877666...). К этой маленькой кардиоиде прикрепляется точно так же семейство круглых областей, как и к большой. На рис. 2.69 эта область отмечена стрелкой. Оказывается, что число таких «кардиоидных» бесконечно велико. Кроме того, они встречаются не только на действительной оси. Отдельного рассмотрения требуют вопросы, связанные с хаосом и множествами Жюлиа, т.к. квадратичная функция fc(z) = z2 +c проявляет хаотическое поведение на своем множестве Жюлиа; проблема Кэли - нахождения корней комплексных полиномов методами Ньютона; внешние углы и деревья Хаббарда и многое другое, связанное с фрактальной геометрией. Мы предлагаем заинтересованному читателю самостоятельно ознакомиться с данными проблемами.
Глава 3. Построение оптимальных робастных регуляторов 193^ ГЛАВА 3. ПОСТРОЕНИЕ ОПТИМАЛЬНЫХ РОБАСТНЫХ РЕГУЛЯТОРОВ ПРИ ДЕЙСТВИИ ВНЕШНИХ ВОЗМУЩЕНИЙ Теория автоматического управления развивается как в направлении более полного и глубокого анализа функционирования и эффективности автоматических систем и устройств при учете реальных режимов работы и действующих возмущений, так и в направлении разработки методов синтеза оптимальных систем управления. Эти общие направления теории систем управления получили особое развитие с появлением быстродействующих электронных вычислительных машин, позволяющих реализовать сложные вычислительные алгоритмы анализа и синтеза систем управления. Развитие теории автоматического управления с конца 50-х годов в значительной мере связаны с работами Р. Калмана и Р. Бьюси [36] по оптимальной линейной фильтрации, а также A.M. Летова [11] и Р. Калмана [7] по синтезу линейных динамических систем, оптимальных по квадратическому критерию качества. Данные работы сформировали теоретические основы для широкого применения теории в различных областях науки и техники и позволили решить принципиально новые теоретические и прикладные задачи. В то же время практика применения теории оптимальных систем при решении конкретных технических задач показала, что оптимальные системы, синтезированные по квадратическому критерию качества, являются чувствительными к параметрам модели реального объекта и характеристикам входных воздействий, т.е. являются негрубыми, и иногда теряют не только оптимальность, но и работоспособность в тех случаях, когда априорная информация об объекте и внешней среде известна не точно, а лишь с некоторой достоверностью, задаваемой интервалами принадлежности (классами неопределенности). Это привело к тому, что в начале 80-х годов стали возникать постановки оптимальных задач управления, которые смогли бы избежать указанных выше недостатков. Современный период развития теории управления характеризуется постановкой и решением задач, учитывающих неточность наших знаний об объектах управления и действующих на них внешних возмущений. Задачи синтеза регулятора и оценивания состояния с учетом неопределенности в модели объекта и характеристиках входных воздействий являются одними из центральных в современной теории управления. Их важность обусловлена прежде всего тем, что практически в любой инженерной задаче конструирования системы управления присутствует неопределенность (или ошибка) в модели объекта (математическая модель объекта, полученная на основе теории или в результате идентификации, отличается от реальной технической системы) и в знании класса входных возмущений. Основная и принципиально новая идея по синтезу робастного управления состояла в том, чтобы единственным регулятором обеспечить устойчивость замкнутой системы не только для номинального (без учета ошибок модели) объекта, но и для любого объекта, принадлежащего множеству «возмущенных» объектов, определяемых классом неопределенности. Началом построения более строгой классической теории робастного управления, распространенной на многомерные системы, послужила статья Зеймса [62], в кото-
194 Методы современной ТАУ. Часть IV рой был предложен новый критерий оптимальности на основе Н°° -нормы многомерной передаточной функции замкнутой системы. Использование Н°° -нормы в качестве критерия оптимальности при синтезе многомерных систем основано на том факте, что Н°° -норма может служить мерой усиления системы. Н°° -норма передаточной функции есть энергия выхода системы при подаче на вход сигнала с единичной энергией. Если выходом является ошибка, а входом возмущение, то минимизируя Н°° -норму передаточной функции, мы минимизируем энергию ошибки для наихудшего случая входного возмущения. В скалярном случае норма такой функции конечна и равна максимальному значению амплитудно-частотной характеристики. Таким же важным первоисточником для сегодняшнего уровня понимания проблемы является статья Дойла и Стейна [26], которая положила начало проблеме грубого, или робастного, управления для модели, заданной в условиях неопределенности. Появившиеся в начале 80-х годов новые постановки задач синтеза систем управления, сводящиеся к задаче Н°° -оптимизации [26, 62] и учитывающие неопределенности в системе, информация о которых минимальна, получили свои первые решения к середине 80-х годов на базе сразу нескольких подходов [29,40, 61]. Однако эти работы имели скорее теоретическое значение, поскольку процедуры синтеза регуляторов были достаточно трудоемкими и громоздкими. Порой процедуры синтеза приводили к курьезным результатам. Так, для системы второго порядка оптимальный Н°° -регулятор имел десятый порядок [14]. Многие работы, опубликованные после 1984 г., развивали так называемый «подход 1984», предложенный Дж. Дойлом [24], в котором на основе теории ганкелевской аппроксимации Гловера [30] дана процедура в пространстве состояний решения проблемы Н°° -оптимизации для случая конечномерных линейных систем. В 1989 г. на основе ряда ключевых результатов в фундаментальной работе [25] была сформулирована новая концепция подхода к решению задачи Н °° -оптимизации, получившая название «2-Риккати подхода». Суть подхода заключалась в том, что оптимальная задача заменялась субоптимальной. Метод «2-Риккати подход» сочетает в себе классическую теорию автоматического управления и метод пространства состояний, а именно: постановка задачи производится в частотной области, а ее решение осуществляется с использованием метода пространства состояний. Кроме того, данный подход позволяет разработчикам в процессе проектирования задавать требуемые характеристики качества и робастной устойчивости замкнутой системы. В рамках этого подхода процедура синтеза Н°° -субоптимального управления была похожа на процедуру синтеза Н2 -оптимального управления. Применяя этот подход, удалось сформулировать принцип разделения в Н°° -теории управления, аналогичный хорошо известному принципу разделения в LQG-теории. Было показано, что при определенных условиях Я2-теория управления является предельным случаем Н°° -теории. Была существенно упрощена процедура нахождения субоптимальных регуляторов [31]. Выявлено, что степень регулятора для объекта порядка п не превосходит п [42]. В рамках «2-Риккати подхода» искомый оптимальный регулятор в форме наблюдателя определяется на основе решения двух многомерных уравнений Лурье - Рик- кати для фильтрации (восстановление состояния) и оптимального управления
Глава 3. Построение оптимальных робастных регуляторов 195^ в смысле минимума Н°° -нормы замкнутой системы. Регуляторы, синтезированные с использованием этого критерия оптимальности, обеспечивают устойчивость замкнутой системы и минимальную чувствительность к возмущениям. В настоящее время процедуры синтеза Н°° -регуляторов в рамках «2-Рикатти подхода» приняты в качестве стандарта. После создания Н °° -теории для стационарных непрерывных систем эта теория была распространена и на другие классы систем. Так, в работе [34] описано решение задачи Н°° -оптимизации для линейных дискретных систем, а в статье [54] сформулирована и решена задача Н °° -оптимизации для нестационарных систем. Однако практическое применение нестационарной теории затруднено отсутствием эффективных алгоритмов решения нестационарных уравнений Риккати. Явные успехи линейной Н°° -теории управления привлекли внимание специалистов по нелинейной теории управления. В рамках нелинейной теории появились постановки задач, аналогичные задачам в линейной теории. Получены и числовые алгоритмы их решений [22, 58]. Однако, как показали результаты практического применения нелинейной Н°° -теории [27], она представляет собой пока теоретический интерес. Н°° -теория рассмотрена также и с игровой точки зрения [23,41]. Изложению различных подходов по синтезу систем управления для систем с различными видами представления неопределенности (параметрическими, непараметрическими, структурированными и неструктурированными) посвящены сборники статей [28, 55, 56]. Существуют опубликованные обзоры [1, 8, 10, 12] и монографии [15] по Н°° -теории и в отечественной литературе. Появление новых просто алгоритмизируемых процедур нахождения регуляторов вызвало большой интерес к этой проблематике в среде инженеров - разработчиков систем управления. Были созданы пакеты прикладных программ для разработчиков робастных систем управления. Наиболее популярным пакетом программ считается Robust Control Toolbox для пакета Matlab [16]. В этом введении авторы не ставят своей целью осветить достаточно полно приложения Н°° -теории. По этому поводу есть большое количество литературы за рубежом, есть и работы на русском языке. Нам бы хотелось обратить внимание специалистов на некоторые работы в традиционной области приложения теории управления - управлении движущимися объектами, а более конкретно - летательными аппаратами, где применение новой теории продвинулось достаточно далеко. Еще в начале 90-х годов появился ряд работ (см. [33, 52]), посвященных применению Н°° -теории в задачах управления движением. Одной из такого рода задач является задача построения управления, минимизирующего действие внешнего возмущения на систему. Одним из таких внешних возмущений является микропорыв ветра - внезапный порыв ветра большой интенсивности. Особенно опасен микропорыв ветра при взлете и посадке самолета, полете на низких высотах. Предложенные в [27, 37] алгоритмы показали принципиальную возможность применить Н°° -методы для уменьшения влияния микропорыва ветра на траекторию полета. В первом параграфе этой главы мы изложим результаты, полученные авторами по разработке методики решения задачи построения робастного регулятора при посадке самолета в условиях микропорыва ветра. Результаты применения Н °° -регуляторов в задаче посадки самолета в условиях микропорыва ветра показали, что эти регуляторы наряду с рядом неоспоримых досто-
196 Методы современной ТАУ. Часть IV инств имеют и недостатки. Основной особенностью Н °° -регуляторов является тот факт, что в процессе функционирования робастной системы используется только априорная информация о возможных внешних возмущениях. Это приводит к тому, что ро- бастные системы управления отличаются некоторым консерватизмом. Это объясняется тем, что робастные системы должны оставаться работоспособными (сохранять робаст- ную устойчивость и заданный уровень качества) при максимально допустимых возмущениях, не «имея информации» о том, когда это возмущение произойдет, т.е. регулятор «всегда готов» к наихудшему случаю. Это общая характерная особенность всех минимаксных регуляторов, к которым относятся и Н°° -регуляторы. Учитывая вышесказанное, в работах [3, 5] была предложена новая концепция построения регуляторов в условиях неопределенных внешних возмущений. Эта концепция представлена во втором параграфе этой главы. Здесь изложен стохастический подход к Н°° -оптимизации систем автоматического управления и основанный на использовании как критерия качества стохастической нормы системы. Такая норма количественно характеризует чувствительность выхода системы к случайным входным возмущениям, вероятностное распределение которых известно не точно. Конкретизация этого подхода, получаемая комбинированием понятия стохастической нормы системы и средней анизотропии сигнала [3], приводит к специальному варианту стохастической нормы - анизотропийной норме. Средняя анизотропия представляет собой характеристику пространственно- временной окрашенности стационарного гауссовского сигнала, которая тесно связана, с одной стороны, с теоретико-информационным подходом к количественному описанию хаоса с помощью колмогоровской е -энтропии вероятностных распределений [6, 19], а с другой - с принципом изотропности конечномерного евклидова пространства [3]. Анизотропийная норма системы характеризует ее чувствительность к входным гауссовским шумам, средняя анизотропия которых ограничена сверху неким неотрицательным параметром а. Во втором параграфе этой главы излагаются методы анизотропийного анализа и синтеза систем. Приводятся и обсуждаются результаты по решению конкретной задачи построения регулятора для управления самолетом в условиях действия на систему внешних возмущений. В работе приводятся сравнения применения анизотропийных регуляторов, построенных для разных уровней средней анизотропии входного сигнала, с применением Н2 ILQG- и Н°° -регуляторов для этой задачи. Показано, что при применении анизотропийных регуляторов, построенных при соответствующем уровне средней анизотропии входного сигнала, существенно меньшим по величине управлением достигается практически одинаковое качество переходных процессов по управляемым переменным по сравнению с Н°° -субоптимальным регулятором. 3.1. ПОСТРОЕНИЕ РОБАСТНЫХ РЕГУЛЯТОРОВ С ПОМОЩЬЮ Я00-ТЕОРИИ В первой главе изложена методика синтеза Н°° -субоптимальных регуляторов для линейных непрерывных систем управления. Решение задачи построения робастного регулятора на основе Н°° -теории управления в этой главе изложено на примере решения важной прикладной задачи построения робастного регулятора для управления самолетом при посадке в условиях действия локальных возмущений состояния атмосферы, так называемых микропорывов ветра.
Глава 3. Построение оптимальных робастных регуляторов 197^ Такая методика изложения выбрана не случайно. Авторы решили отказаться от формального изложения Н°° -теории управления по ряду причин. Формальное изложение этой теории можно найти в ряде монографий, в том числе и на русском языке. Изложение Н°° -теории управления в рамках данной главы перегрузило бы материал рядом специфических для этой теории терминов (стандартный объект, внутренняя устойчивость, нормализованная взаимно простая факторизация и т.д.). Краткое формальное изложение основ Н°° -теории управления можно найти в [9]. Авторы преследовали цель продемонстрировать методы этой теории на конкретной важной для приложения задаче. В этом параграфе строго изложен метод решения Н°°- субоптимальной задачи на основе «2-Риккати подхода». Этот метод и применен к решению сформулированной выше задачи. Неожиданно возникающие возмущения состояния атмосферы чрезвычайно опасны при посадке самолета. Так, они привели к известным катастрофам [45]: • в Международном аэропорту Нового Орлеана 9 июля 1982 г. при посадке разбился самолет Boing B-727 авиакомпании Pan American; • в Международном аэропорту Далласа, также при посадке, 2 августа 1985 г. потерпел катастрофу самолет Lockheed L-1011 компании Delta Airlines. Ввиду большой актуальности проблемы, построением автоматизированных систем управления полетом, способных предотвращать такого рода катастрофы, занимались разработчики в разных странах мира. Были предложены различные алгоритмы управления, основанные на различных физических принципах и математических концепциях, построенные для различных моделей локального состояния атмосферы, которые так или иначе решали эту задачу [33, 46 - 49, 52]. В данном параграфе авторы исследовали применение Н°° -теории управления для решения задачи построения регулятора, минимизирующего влияние действия микропорыва ветра на выходные параметры системы (воздушную скорость и высоту самолета). Проанализировав имеющуюся в распоряжении авторов литературу, авторы выбрали для исследований математическую модель микропорыва ветра в форме вихревого кольца, описание которой изложено в этом параграфе. На базе изложенной в параграфе методики построен робастный Я'"-субоптимальный алгоритм управления для самолета ТУ-154. Построен также Н2 ILQG- оптимальный алгоритм управления для того же самолета. Приведены сравнения поведения замкнутых различными регуляторами систем управления. Эти сравнения показывают, что, значительно превосходя применение Я2-оптимальных регуляторов по обеспечению минимальности отклонения воздушной скорости и высоты (основные характеристики безопасности самолета при посадке) от номинальных значений, применение Н°° -субоптимальных регуляторов требует для этой цели использование больших возможностей управления. В работах [38, 39] рассмотрены более общие постановки задачи построения робастных регуляторов для посадки самолета в условиях действия неконтролируемых возмущений, в которых вводятся так называемые весовые функции. Эти функции позволяют задать требования в частотной области к характеристикам замкнутой системы по качеству переходных процессов и робастной устойчивости. Введение весовых функций уменьшает потребность в энергетике управления. Однако мы считаем, что детальное рассмотрение этих вопросов перегрузит материал главы техническими деталями.
198 Методы современной ТАУ. Часть IV 3.1.1. Задачи робастного управления самолетом Математическая модель продольного движения самолета Кинематические и динамические переменные для уравнений движения центра масс самолета представлены на рис. 3.1. Ось самолета О Рис. 3.1. Система координат и переменных самолета На рис. 3.1: D - сила лобового сопротивления; jc, у - оси системы координат; L - подъемная сила; О - центр масс самолета; V - воздушная скорость самолета; Ve - скорость самолета относительно земли; wx - горизонтальная составляющая скорости ветра; wy - вертикальная составляющая скорости ветра; а - угол атаки; 8 - угол наклона траектории в воздушной системе координат. Динамические уравнения движения самолета в вертикальной плоскости с учетом ветровых возмущений в проекциях на оси воздушной системы координат задаются следующей системой нелинейных дифференциальных уравнений [2] mV =rcosa-D-mgsin0-m(wJccos0 + wysin0); mVe = Tsma + L-mgcosQ + m(wxsinQ-wycosQ)\ Jz(bz=Mz; f} = coz, где т - масса самолета, Jz - момент инерции самолета относительно поперечной оси z, Т - сила тяги двигателей, Mz - момент сил относительно оси z, f> = 0В + a - угол тангажа, сог - угловая скорость относительно оси z. Управляющими переменными являются сила тяги Т и угол атаки а, которые зависят соответственно от отклонения сектора газа и руля высоты. Эти уравнения справедливы в предположении, что направление силы тяги совпадает с осью самолета, масса самолета постоянна, Земля плоская, ветер стационарный. Вращением Земли также пренебрегаем. Дифференциальное уравнение для высоты центра масс h записывается в виде A = Vsine + W^. (3.2) Уравнение в приращениях, описывающее динамику двигателя, приведено ниже At = ±(-AT + KmASt). (3.3) Здесь 8, - отклонение сектора газа от заданного значения. Формирование отклонения руля высоты де с учетом контура короткопериодиче- ского движения осуществляется в следующем виде:
Глава 3. Построение оптимальных робастных регуляторов 199 8с=КШ:Дсог+/^Д£+КсуДОсу, где Кш , К$ и Ксу - числовые коэффициенты, ДФсу - управление, формируемое робастным регулятором. В результате линеаризации нелинейной модели самолета система нелинейных дифференциальных уравнений (3.1) с учетом (3.2), (3.3) и предыдущего уравнения сводится к линейной системе обыкновенных дифференциальных уравнений в приращениях, которая в матричной форме имеет вид Х = АХ + В1п\¥ + В2„и, (3.4) где X = (AV, Д0, Awz,AbyAh,AT)T - вектор состояния, W = (wy, wx, wy ) - вектор ветровых возмущений, U = (Д$су»Д8,) - вектор управления. Уравнение для измеряемого выхода у в пространстве состояний в присутствии шумов измерений пу записывается в виде Y = CyX + IyNy, - где Су - матрица измеряемых выходов, а 1У - единичная матрица соответствующей размерности. Таким образом, математическая модель продольного движения самолета с учетом внешних ветровых возмущений в пространстве состояний описывается следующей системой уравнений: fX=AX + BlnW + B2wU, {п 2 (3.5) [Y = CyX + IyNy. Постановка задач управления Рассмотрим задачу управления полетом самолета в вертикальной плоскости при посадке в условиях неопределенных ветровых возмущений W. Ветровое возмущение приводит к отклонению воздушной скорости V и высоты полета h от заданных значений, определяемых траекторией снижения (глиссадой). Задача системы управления (регулятора) состоит в том, чтобы поддерживать постоянную воздушную скорость V и заданную высоту h. Данная задача является классической задачей слежения в теории автоматического управления. Для линейной модели продольного движения самолета с учетом внешних ветровых возмущений в пространстве состояний (3.5) вектор управляемых выходов Ъ\ может быть записан в виде Zl=C,iX, (3.6) где матрица Сг =Р ° ° ° ° °1. (3.7) 21 [о о о о 1 oj Рассмотрим вектор контролируемых выходов Z, определенный следующим образом: Объединяя (3.5), (3.6), (3.7) и (3.8), получаем систему уравнений, описывающую управляемую систему:
200 Методы современной ТАУ. Часть IV X = AX + BlnW + B2nU; Z,=C^X; Z2=IHU; Y = CyX + I,N,. Блок-схема системы (3.9) представлена на рис. 3.2. (3.9) G - w W 1 +А+ z К пл. Рис. 3.2. Блок-схема системы (3.9) Рассмотрим расширенный вектор входных возмущений _ rw 4n. (3.10) (3.11) Учитывая (3.10), систему (3.9) можно переписать в виде X = AX + B1W + B2nU; Z,=C2X; Z2=IMU; Y^X + D^W, где В! = В{п 0Пу , D^ =10* Iyl. Здесь 0"v и 0ш - нулевые матрицы соответствующих размерностей, 1М - единичная матрица. Ниже сформулируем задачи управления самолетом при наличии внешних возмущений, решаемые в этой главе. В общем их все можно сформулировать как построение для системы (3.9) (или (3.11)) линейного управления U, которое минимизирует влияние возмущения W на выход системы Z . При проектировании регулятора необходимо обеспечить компромисс между минимально возможными отклонениями управляемых выходов (воздушной скорости V и высоты К) от номинальных значений и ограничениями по мощности управляющих агрегатов (двигателей и рулей высоты). С этой целью в критерий оптимальности вводят величину, характеризующую управление. В зависимости от предположений о внешнем возмущении Who критерии качества получаем разные оптимальные задачи теории управления. Предполагая, что W является гауссовским белым шумом, и выбирая в качестве критерия оптимальности функционал < J(K) = \imE\\zTZdt (3.12)
Глава 3. Построение оптимальных робастных регуляторов 201 где Е - символ математического ожидания, получаем LQG-задачу - построение для системы (3.9) линейного управления в виде обратной связи U(s) = K(s)Y(s), (3.13) минимизирующего критерий (3.12). Предполагая, что W является квадратично интегрируемой функцией, и выбирая в качестве критерия оптимальности Н2 -норму передаточной функции 7^ от входа W к выходу Z , получаем формулировку задачи построения Н2 -оптимального регулятора: для системы управления, математическая модель которой описывается системой (3.11), требуется найти закон управления в виде линейной обратной связи (3.13), минимизирующий вышеописанный критерий, т.е. ll^wzIL ->min. (3.14) Напомним, что Н2 -норма передаточной функции F{s), аналитичной в правой полуплоскости Re 51 > 0, определяется следующим образом l|F|l2=(^Jtr(FO'0))(FO'C0))*)rfCU|' где tr(») - след матрицы. Предполагая, что W является квадратично интегрируемой функцией, и выбирая в качестве критерия оптимальности Н°° -норму передаточной функции 7^ , получаем задачу построения Н°° -оптимального регулятора: для системы управления, математическая модель которой описывается системой (3.11), требуется найти закон управления в виде линейной обратной связи (3.13), минимизирующий вышеописанный критерий, т.е. NzL-*™11- (ЗЛ5) Напомним, что #°°-норма передаточной функции F(s) определяется следующим образом |F||eo=supa(F(7Co)), cog[0,oo), (О где а() обозначает максимальное сингулярное значение матрицы. Минимизируя Н°° -норму передаточной функции 7^, мы минимизируем энергию сигнала ошибки сближения. H2/LQG -оптимальная задача является классической в теории автоматического управления и применение хорошо разработанных численных процедур для ее решения (см., например, Matlab Control Toolbox) могут без каких-либо модификаций быть использованы для построения управления летательными аппаратами в условиях неопределенных внешних возмущений. 3.1.2. ПОСТРОЕНИЕ Н°° -СУБОПТИМАЛЬНОГО РЕГУЛЯТОРА ДЛЯ УПРАВЛЕНИЯ САМОЛЕТОМ В УСЛОВИЯХ ВНЕШНИХ ВОЗМУЩЕНИЙ Напомним, что линейная математическая модель летательного аппарата описывается следующей системой линейных уравнений:
202 Методы современной ТАУ. Часть IV X = AX + B,W + B2||U; (3.16) Zi=CZ|X; Z2=IMU; Y = CyX + D^W, где X = (AV\ A0, Acoz, Afl, ДА, АГ) - вектор состояния, - / т\т W = (wy, wx, wy, ny J - вектор возмущений, / т т\^ Z = (zl, z2 J - вектор контролируемых выходов, U = (АФсу, Д8,) - вектор управления. Динамическая неопределенность удовлетворяет следующим соотношениям |^(-)|2<С„<оо. (3.17) Задача построения Н°° -оптимального регулятора. Для линейной модели (3.16) с учетом (3.8) в классе линейных управлений U{s) = K(s)Y(s) (3.18) найти управление U*, которое минимизирует Jt^L : flTwzIL^"11"' С-19) где Т^^ ~ матрица передаточных функций от вектора возмущений W к управляемому выходу Z в замкнутой системе. В реальных задачах оптимальная задача, сформулированная выше, заменяется субоптимальной задачей. Задача построения Н°° -субоптимального регулятора. Для линейной модели (3.16) с учетом (3.8) в классе линейных управлений U(s) = K(s)Y(s) (3.20) найти управление U*, которое гарантирует оценку: HTwzL<Y, (3.21) где Тф2 - матрица передаточных функций от вектора возмущений W к контролируемому выходу Z в замкнутой системе. Для решения сформулированной выше субоптимальной задачи воспользуемся хорошо известным методом, называемым Two Riccati Approach (2-Риккати подходом) [56]. Построение н°° -субоптимальных регуляторов с помощью «2-риккати подхода» Пусть некий объект управления описывается линейной системой уравнений: i = AX+BtW + B2U, ^Z = C1X + DllW+Dl2U, (3.22) Y = C2X + D21W + D22U. Здесь X - вектор состояния, Y - вектор измерений, Z - вектор контролируемых выходов, U - вектор управления, W - внешний вход системы.
Глава 3. Построение оптимальных робастных регуляторов 203 Пусть удовлетворяются следующие предположения: 1) (A,Bi, Ci) является стабилизируемой и детектируемой; 2) (А, В2, С2) является стабилизируемой и детектируемой; 3) D[2[d D12] = [0 1]; 4) М- Справедлива теорема: Теорема 3.1 [25]. Регулятор для системы (3.22), который гарантирует выполнение неравенства IWL<y. существует тогда и только тогда, когда 1) ЗХ^ >0 - решение обобщенного алгебраического уравнения Риккати управления (по-английски Generalized Control Algebraic Equation - GCARE) ATXeo + X^ A - Хм (В2В£ - Y^BX )xoo +-С7С! = 0 ; 2) BY^ > 0 - решение обобщенного алгебраического уравнения Риккати фильтрации (по-английски Generalized Filtering Algebraic Equation - GFARE) AY.. + Y^AT - Y^(cJC2 -Y^CfoJY.. +ВХВТ = 0; 3) Спектральный радиус p (X^Y^) < у. При этом регулятор получается в форме наблюдателя [XC=ACXC+BCY; где (3.23) [U = CCXC, Ас = А - В2В^Х^ - (I - у"2 Y^X^ )"1 Y^Cl + Y^B^, Be=(l-r2YJL.JlY.Cl, (3.24) Cc=-BjX^. Для построения субоптимального регулятора применяется итерационная процедура по y • На каждом шаге решается субоптимальная задача, т.е. определяется регулятор К( (s), для которого ITws|L<Y' где i - номер шага. Затем величина у уменьшается, субоптимальная задача решается до тех пор, пока существуют неотрицательно определенные решения алгебраических уравнений Риккати GCARE, GFARE и выполняется условие на ограничение спектрального радиуса. Полученное в результате итерационной процедуры минимальное значение у , близкое к Ymin c заданной степенью точности, а также решения Х^, и Y^ используются для синтеза робастного Н°° -субоптимального регулятора в соответствии с формулами в формулировке теоремы 3.1.
204 Методы современной ТАУ. Часть IV «2-РИККАТИ ПОДХОД» ПРИ ПОСТРОЕНИИ Я "-РЕГУЛЯТОРА ДЛЯ ПОСАДКИ САМОЛЕТА Для использования описанного выше «2-Риккати подхода» в задаче построения Н°° -субоптимального управления самолетом в условиях неопределенных входных возмущений надо проверить выполнение предполагаемых в этом алгоритме условий 1-4, изложенных выше. Напомним, что мы решаем следующую задачу построения Н°° -субоптимального управления самолетом в условиях неопределенных входных возмущений: для линейной модели (3.25) X = AX + BlflW + B2llUf z2=iMu, с учетом z,=c,x, V (3.25) Y = CyX + IyNy ■й z.z' И в классе линейных управлений U(s) = K(s)Y(s) (3.26) найти управление U*, которое гарантирует оценку ||Twz|L<Y. (3-27) где Туу£ - матрица передаточных функций от вектора возмущений W к контролируемому выходу Z в замкнутой системе. Перед использованием описанного выше «2-Риккати подхода» в этой задаче надо проверить выполнение предполагаемых в этом алгоритме условий 1 - 4, изложенных выше. Если ввести обозначения Х^Х, Y^Y, W = W, Z = Z, В1=[В1л 0], В2=В2л, D,2=^°j,D21=[O I,], D22=0, где 0 - нулевые матрицы соответствующих размерностей, то система (3.25) принимает вид (3.22). Для этой системы (с матрицами Bb B2, Cb C2, Dn, Dl2, D21, D22, представленными выше) предположения 1 - 4 выполняются, и мы можем воспользоваться описанным выше алгоритмом построения субоптимального Н°° -регулятора.
Глава 3. Построение оптимальных робастных регуляторов 205 3.1.3. Моделирование При моделировании предложенных выше алгоритмов управления в условиях ветровых возмущений использовались пространственные модели ветра, описанные ниже. Модели микропорывов ветра Локальное возмущение состояния атмосферы, получившее название микропорыва ветра, обусловлено перемещением направляемых вниз к земле локальных областей воздушных масс. Типовой микропорыв ветра формируется потоком холодного воздуха диаметром от нескольких сотен метров до 1 км. Продолжительность этого явления составляет в среднем 5-10 мин. В зоне микропорыва возникают значительные градиенты ветра, которые создают неблагоприятные условия для пилотирования самолета при прохождении данной области. Для исследования и отработки автоматических или ручных систем управления разработаны математические модели микропорыва ветра различной сложности. Математическая модель микропорыва ветра в форме вихревого кольца. Достаточно полные и наиболее приемлемые с практической точки зрения модели основаны на теории газовой струи, соударяющейся с плоской поверхностью, и модели микропорыва ветра в форме вихревого кольца.'ЙиШ'Ьпйсывается математическая модель микропорыва ветра в форме вихревого кольца. Генерируемые профили ветра данной модели позволяют имитировать атмосферные условия, соответствующие некоторым реальным ситуациям, имевшим место, в частности, в аэропортах Далласа t (1985) и Нью-Орлеана (1982) [63]. Согласно этой модели [35] область микропорыва ветра формируется течением вокруг вихревого кольца, расположенного над плоской поверхностью. Геометрические соотношения показаны на рис. 3.3. R R Рис. 3.3. Область микропорыва ветра Все характеристики потока в этой модели выражаются через функцию тока трехмерного невращающегося течения несжимаемой жидкости, индуцируемого вихревым кольцом, которая описывается выражением V-~('i+r2)[F(X)-E(X)])
206 Методы современной ТАУ. Часть IV где Г - циркуляция, R - радиус вихревой нити кольца, F(X)y E(X) - полные эллиптические интегралы первого и второго рода, г{, г2 - наибольшее и наименьшее расстояния от текущей точки (jc,z,/i) до вихревой нити кольца, Rc - эффективный радиус ядра вихревого кольца и безразмерная переменная х = h - П г2+гх ' Поле скоростей, индуцированное кольцевой вихревой нитью, определяется пятью параметрами: положением центра кольца (X, Z, Н), циркуляцией Г и радиусом R . Параметры X, Z, Н оказывают влияние на относительное положение, а не на форму распределения скоростей, Г дает линейный эффект, a R служит коэффициентом масштаба. Окончательные формулы для скоростей ветра в точках пространства с координатами (x,h) имеют вид: 1,182рГ 271 R [К hA ((х-Х)2+/гр2-н/?2)1/21Г2Р 'И R (( \>/2 x-xf+hl+R2)'^*» wy = 1,576рГ 2п R [I(*-x)2+/v2 + *2] R ^(x-xf+hl+R* I3'4 \rV ip *2 r3/4 Г2р где xx=x-X-R, hp=h-H, rlp=^2+/ip2, r2p=X2+/ip, x2=x-X+R, hm=h + H, rlm=xf+hl, r2m=xl+h2m, ro = min(rlp,r2p), p = l-£ Rc. Приведенные формулы для составляющих скорости ветра описывают течение от единичного вихря с центром в начале цилиндрической системы координат. В работе [63] приведены данные идентификации параметров данной модели на основании измеренных профилей ветра в ситуациях, приведших к катастрофам самолетов В-727 и L-1011. Параметры вихревой модели в ситуации на посадке L-1011 в городе Даллас в 1985 г. приведены в табл. 3.1.
Глава 3. Построение оптимальных робастных регуляторов 207 Таблица 3.1 Параметры вихревой модели при посадке в Далласе (1985 г.) Параметр Г Лс Я R Единица измерения м2/с м м м Значение параметра 41319 122 689 1090 В данной работе моделируется микропорыв ветра с более интенсивным воздействием. Параметры этого микропорыва приведены в табл. 3.3. Таблица 3.2 Параметры вихревой модели, используемой при моделировании Параметр Г Н R Единица измерения м2/с м м м Значение параметра 45000 35 700 350 Графики вертикальной wy и горизонтальной составляющих wx профиля ветра относительно центра вихря в зоне микропорыва ветра на высоте полета в 400 м с параметрами из табл. 3.2 приведены на рис. 3.4. w^ м/с -15 -2000 -1500 -1000 -500 0 500 1000 1500 2000 м -2000 -1500 -1000 -500 0 500 1000 1500 2000 м Рис. 3.4. Графики вертикальной и горизонтальной составляющих профиля порыва ветра
208 Методы современной ТАУ. Часть IV Результаты моделирования В данном разделе рассматривается движение самолета ТУ-154 по конкретной траектории глиссады. Эта траектория в координатах высоты и дальности представляет собой прямую линию с заданным углом наклона траектории 0ГЛ (0ГЛ = -2,7 град.). Задача системы управления состоит в том, чтобы при движении по глиссаде обеспечить постоянную воздушную скорость Vo =71,375 м/с и заданную высоту при действии ветровых возмущений, модель которых описана в предыдущем параграфе. Постоянная времени двигателя Гдв=2,5с; Кдъ =2600 н/град. Коэффициенты равны: J^=3,5; ^=4; Ксу=-4. В результате линеаризации нелинейной системы (3.1) в точке траектории с параметрами xx=V =71,375 м/с, х2 =0гл =~2,7 град., jc3=coz=0, х4=Ъ = 0, х5 = = h = 400 м , х6 = Т = 52540 н получена линейная модель системы управления, соответствующая (3.9), где матрицы А, В1л, B2w, Cy, CZi имеют соответственно значения А = -0,0608 0,2187 0,0053 0 -0,0471 0 -0,0841 -0,6218 0,5221 0 1,2437 0 = " 0 0 0 0 [ 0 1 0,1082 -1,5902 1,0000 0 0 -0,0869 0 0,0904 0,7234 0 0,0036 -1,5549 0 0 0 0 0 0 0 0 0 0 -0,4000 -0,9989 0,0471 " -0,0378 -0,8019 0 0 1,0000 0 0 В2п = 0 0 0,0309 -0,2951 0 0 0 0 0 0 0 0,0904" 0,0036 0 0 0 0,4000 > > (3.28) (3.29) (3.30) су-с'- о oooi (3.31) '1 О О О О 01 о|" Заметим, что матрица А - неустойчива, т.к. имеет нулевое собственное значение. Результаты моделирования показали, что линейная модель (3.9) с приведенными выше матрицами достаточно точно аппроксимирует нелинейную модель на указанном участке траектории движения самолета [13]. В результате применения описанных выше обозначений
Глава 3. Построение оптимальных робастных регуляторов 209 А = -0,0608 0,2187 0,0053 0 -0,0471 0 та _ 1>1 — -0,0841 0 -0,6218 0,1082 0,5221 0 1,2437 0 0 0 0 0 1,0000 0 В2 = г* _ ч - -0,0869 0,7234 [ -1,5902 -1,5549 1,0000 0 0 -0,9989 -0,0378 0 0 0 0 0 0,0309 -0,2951 0 0 0 10 0 0 0 0 0 0 0 0 0 0 0 0 0 0,0471 -0,8019 0 0 0 0 0,0904' 0,0036 0 0 0 0,4000 0 0 0" 0 1 0 0 0 0 0 0 0 > » 0 0 0 0 0 0 0 0 0 0 0 0 0" 0 0 0 0 0 0,0904 0,0036 0 0 0 -0,4000 _П о о о о о 2 ~ [о о о о 1 о Dn = 0 0 0 0 0' 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Dl2 = 0 0 1 0 0 0 0 1 Го о о 1 21 ~ [о о о о ■Чоо] (3.32) (3.33) (3.34) (3.35) (3.36) (3.37) (3.38) (3.39) (3.40) Для этого объекта в соответствии с описанной выше методикой был произведен синтез Н°° -субоптимального регулятора, матрицы которого приведены ниже 15 3ак 416
210 Методы современной ТАУ. Часть IV Ан-_ -0,3498 -ОД 024 -0,0334 0,0404 -0,7181 -2,2293 -0,0689 -0,9242 -0,3408 -0,4558 0,4802 -2,3347 ц//~ 1 **соп ~ -0,0235 0,2913 -0,8686 0,4953 0,9114 -2,3827 "-0,2756 -0,1492 -0,0391 0,1436 -2,8988 -6,5173 -0,0250 0,4481 -0,7297 -0,9065 -0,1059 -0,6504 -0,0575" -0,3807 -0,1686 -0,0220 0,4744 -3,2306 0,4237 -0,2129 -0,5402 1,1539 -1,6559 -0,4498 2,0368 " 0,1758 0,9028 -3,5805 -0,6974 -5,0569 (3.41) (3.42) ^соп 0,1173 -0,2464 0,0941 -0,0370 -0,7299 2,6561] 0,3470 -0,0749 0,0087 -0,0376 1,5576 4,9417J' 0 01 0"" = "con о о (3.43) (3.44) **con ~ (3.45) Для системы (3.9) с матрицами (3.32) - (3.40) была также решена задача синтеза Н2 -оптимального регулятора. Ниже приведены результаты сравнения переходных процессов в системах, замкнутых соответственно Н°° -субоптимальным и Н2 - оптимальным регуляторами "-0,5084 -0,0584 -0,0119 0,0501 -0,0230 -0,3246" -0,1472 -0,9213 0,0559 -0,5122 -0,0682 -0,2893 0,3629 -0,0259 -0,6884 -0,4144 -0,1085 1,2738 0,0746 0,5507 0,3879 -1,0033 -1,5115 -1,0050 0,4565 0,0995 -0,0420 0,4579 -1,0174 -1,5880 0,5085 1,2466 -0,6444 -1,1550 -0,7127 -1,5600 0,4315 0,0837 " 0,1211 0,3740 -0,7011 -0,1076 0,1741 -0,1267 -0,8906 -0,0119 -0,3547 1,5271 ,2309 0,2515 0,2475 0,0232 Вп _ con ~ (3.46) 'con ^_0, 0,1023 1,5883] 2888 0,1882 0,3410 -0,0437 0,3406 0,1329j' **соп о о о о (3.47) (3.48) 3.1.4. Обсуждение результатов моделирования Приведем результаты сравнения качества переходных процессов замкнутых систем с Н°° -субоптимальным и Н2 /LQG -оптимальным регуляторами по управляв-
Глава 3. Построение оптимальных робастных регуляторов 211 мым выходам (отклонения высоты h и воздушной скорости V) и управлениям. При моделировании на вход каждой замкнутой системы подавался одинаковый сигнал, моделирующий ветровое возмущение W, действующее на самолет при его движении в зоне микропорыва ветра. При моделировании полагали, что N^ = 0 . В графических материалах, иллюстрирующих сравнительные характеристики указанных регуляторов, Я °° -субоптимальный регулятор обозначается Ны, а Я2 ILQG -оптимальный регулятор - H2ILQG . V, м/с ill -10 Рис. 3.5. Графики отклонения скорости V при использовании Н°° - и Н2 -регуляторов На рис. 3.5 приведены графики отклонений воздушной скорости V от номинального значения для двух регуляторов. Диапазон изменения скорости при использовании в контуре обратной связи Я °° -регулятора на 60 процентов меньше, чем при использовании Я2-регулятора. Максимальное отклонение скорости при использовании Я2 ILQG -регулятора составляет около 22 м/с, а при использовании Я°°- субоптимального регулятора - около 13 м/с, т.е. уменьшение отклонения примерно в 1,7 раза. Таким образом, по отклонениям воздушной скорости Я°°-субоптимальный регулятор обеспечивает значительно лучшее качество переходных процессов, чем Я2 / LQG -регулятор. На рис. 3.6 приведены графики отклонений h от номинального значения для двух регуляторов. По отклонениям высоты Я°°-субоптимальный регулятор также обеспечивает лучшее качество переходных процессов, чем Я21LQG -регулятор, а именно: максимальное отклонение высоты для Я2 / LQG -регулятора составляет около 50 м, а для Я°°-субоптимального регулятора - около 30 м, т.е. меньше примерно в 1,7 раза. Эта характеристика является чрезвычайно важной, т.к. резкая потеря самолетом высоты в условии действия микропорыва ветра и является основной причиной катастроф при посадке самолета. 15*
212 Методы современной ТАУ. Часть IV Я,м 10' -10 -20 -30 -40 -50 10 20 30 40 50 60 U с Рис. 3,6. Графики отклонения высоты h при использовании Я°°- и Н2 -регуляторов Следовательно, по управляемым выходам Н°° -регулятор обеспечивает значительно лучшее подавление внешнего ветрового возмущения. TetaCY, град 25 20 15 10 -5 10 20 30 40 50 60 U с Рис. 3.7. Графики управления Ь^, при использовании #~-и Я2-регуляторов
Глава 3. Построение оптимальных робастных регуляторов 213 Проанализируем управление, формируемое Н°°~ и Н21LQG -регуляторами. На рис. 3.7 приведено управление ©су (обозначение на рисунке TetaCY). H°° -регулятор обеспечивает незначительное уменьшение (примерно на 5°) сигнала управления дсу . DLsgt град 60 50 30 20 10 -10 -20 10 20 30 40 50 60 /, С Рис. 3.8. Графики управления 5, при использовании Н°° - и Н2 -регуляторов Значительно меньшие отклонения выходных координат скорости и высоты при использовании Н°° -регулятора определяются значительно более интенсивной работой двигателя (см. рис. 3.8). На графике управление 8, обозначается DLsg. Таким образом, как это видно из графиков, Н°° -субоптимальный регулятор обеспечивает наименьшие отклонения по воздушной скорости и высоте, но это определяется большими энергетическими затратами по управлению (интенсивная работа двигателя). Приведенные количественные характеристики по управляемым выходам и управлению иллюстрируют возможности Н2 -регулятора. В работах [38, 39] рассмотрены более общие постановки задачи построения робастных регуляторов для посадки самолета в условиях действия неконтролируемых возмущений, в которых вводятся так называемые весовые функции, которые позволяют задать требования в частотной области к характеристикам замкнутой системы по качеству переходных процессов и робастной устойчивости. 3.2. ПОСТРОЕНИЕ АНИЗОТРОПИЙНЫХ РЕГУЛЯТОРОВ В этом параграфе кратко излагаются концепция и математические основы стохастической теории Н°° -оптимизации конечномерных, линейных, стационарных систем автоматического управления с дискретным временем. Как известно, Я2- и Н°°-теории оптимизации линейных стационарных систем автоматического управления (см., например, [25, 29, 34]) основаны на использовании
214 Методы современной ТАУ. Часть IV Я2- и Я°°-норм (в соответствующих пространствах Харди матричных передаточных функций) как критериев качества, которые обусловлены различными гипотезами относительно природы поступающих на вход системы возмущений. Первая из них (называемая также стохастической теорией фильтрации-управления Винера - Хопфа - Калмана) предполагает, что входное возмущение является случайным белым шумом, тогда как вторая (Н °° -теория управления) считает входное возмущение детерминированным квадратично суммируемым сигналом. Как следствие, использование Я2 -оптимального регулятора в контуре обратной связи приводит к плохому функционированию замкнутой системы автоматического управления в случае, если на вход такой системы поступает сильно окрашенный случайный шум. В то же время Н°° -оптимальный регулятор проявляет консервативность (излишнюю перестраховочность), если входное возмущение является все же белым или слабо окрашенным шумом. Все эти положения полностью подтверждаются результатами моделирования предыдущего параграфа. Стохастический подход к Н°° -оптимизации систем автоматического управления, предложенный в [5, 57] и основанный на использовании как критерия качества стохастической нормы системы, представляет собой альтернативу упомянутым выше классическим подходам. Конкретизация этого подхода, получаемая комбинированием понятия стохастической нормы системы и средней анизотропии сигнала [3], приводит к специальному варианту стохастической нормы - анизотропийной норме. В этом параграфе излагается анизотропийный анализ систем (вычисление анизотропийной нормы) и анизотропийный систез систем (задача построения регулятора, при котором минимальна анизотропийная норма замкнутой системы при действии на ее вход окрашенного сигнала с уровнем анизотропии а). Решение задачи анализа сводится, в силу результатов работ [59, 60], к решению системы алгебраических матричных уравнений Риккати и Ляпунова, а также уравнения специального вида. Решение основной задачи синтеза также сводится к решению трех перекрестно связанных алгебраических матричных уравнений Риккати, уравнения Ляпунова, а также уравнения специального вида. Эти уравнения решаются с помощью метода гомотопии [43], заключающегося в сведении этих уравнений к системам нелинейных неавтономных дифференциальных уравнений по параметру. В этом параграфе решается задача синтеза анизотропийных регуляторов для системы управления самолетом в условии действия локальных ветровых возмущений. Показано, что применение анизотропийного регулятора дает значительный выигрыш по энергетике управления, обеспечивая тем не менее хорошие показатели переходных процессов. Этот факт показывает целесообразность применения построенных регуляторов в системах с неполной информацией о входных возмущениях. 3.2.1. Анизотропийный анализ систем Средняя анизотропия гауссовского сигнала Определение и основные свойства средней анизотропии. Пусть V = (v^ )_oo<jt<+eo - дискретный m-мерный гауссовский белый шум с нулевым математическим ожиданием и единичной ковариационной матрицей: £V*=O, £(V*VJ)=IW, -oo<*<+oo. Рассмотрим m-мерную стационарную гауссовскую последовательность
Глава 3. Построение оптимальных робастных регуляторов 215 получаемую из белого шума V посредством формирующего фильтра G с импульсной переходной характеристикой gk e Rmxm4 k>0 (рис. 3.9): W Рис. Э.9. Получение m-мерной стационарной гауссовской последовательности W Такой фильтр отождествляется со своей передаточной функцией G(z)sSfo**. (3.49) жтхт которая предполагается лежащей в пространстве Харди Н% . Последнее означает, что функция (3.49) аналитична в открытом единичном круге {ze С: |z| < 1} на комплексной плоскости и имеет конечную Н2 -норму г- V/2 (1 ? Y'2 \G\\i = S^ftrf) = ^jTr(G(0))(G(0))*)^0) , где через 6(co)s lim G(re/(0), coe[-7t;7t] г-И-0 обозначено угловое граничное значение функции (3.49). Средняя анизотропия [44] последовательности W = G® V определяется как величина 1 п A(G) и -— J Indet -^-6(ш)(6(а)))Ф -71 112 d(Oy (3.50) принимающая неотрицательное значение, как только формирующий фильтр Ge H™*"1 имеет максимальный ранг, т.е. rankG(co) = m, cog [-я; я], и полагаемая равной +«>, если фильтр G - немаксимального ранга. Заметим, что A(G) = 0 в том и только в том случае, если формирующий фильтр G является с точностью до ненулевого постоянного множителя системой полного пропускания, т.е. если последовательность W - гауссовский белый шум со скалярной ковариационной матрицей. Свойства функционала средней анизотропии (3.50) можно найти в работах [7, 11, 26, 36, 40, 62], где содержатся также указания на его связи, с одной стороны, с теоретико-информационным подходом к количественному описанию хаоса, основанным на колмогоровской е-энтропии вероятностных распределений [6, 19], а с другой - с принципом изотропности конечномерного евклидова пространства. Формулы для средней анизотропии в пространстве состояний. Пусть фильтр Ge H™*"1, формирующий из белого шума V гауссовскую последовательность W = G ® V , имеет n-мерное внутреннее состояние X, связанное с входом V и выходом W фильтра уравнениями
216 Методы современной ТАУ. Часть IV ^ ,, ><£<+о wk =Cxk+Dvk где А, В, С и D - постоянные матрицы соответствующих размеров, причем матрица А асимптотически устойчива (т.е. для ее спектрального радиуса выполнено строгое неравенство р(А) < 1), а матрица D невырожденна. Иными словами, формирующий фильтр G имеет реализацию Чс I] в пространстве состояний. Рассмотрим связанное с фильтром (3.51) уравнение Рикка- ти относительно матрицы R e RnXn R = ARAT + ВВТ - LTLT, (3.52) Te=CRCt+DDt, (3.53) Le=(ARCt+BDt)T-1. (3.54) Решение R уравнения (3.52) - (3.54) называется допустимым, если эта матрица симметрична, неотрицательно определена, а матрица А - LG асимптотически устойчива. Известно [21, 32], что при сделанных предположениях об асимптотической устойчивости матрицы А и невырожденности матрицы D, уравнение Риккати (3.52) - (3.54) имеет единственное допустимое решение. Теорема 3.2 [49]. Пусть формирующий фильтр Ge H™*"1 имеет реализацию в пространстве состояний (3.51) с асимптотически устойчивой матрицей А и невырожденной матрицей D. Тогда средняя анизотропия (3.50) последовательности W = G ® V вычисляется по формуле 1, , Y тТ \ A(G) = —In det 2 [tr(CPCT+DDT)| где Т - матрица, связанная посредством (3.53) с допустимым решением R уравнения Риккати (3.52) - (3.54); Р - граммиан управляемости фильтра G, являющийся решением уравнения Ляпунова Р = АРАТ+ВВТ. (3.55) По поводу численного решения уравнений Риккати типа (3.52) - (3.54) заметим, что существует эффективный алгоритм Шура, сводящий такое решение к отысканию обобщенных собственных векторов, специальным образом строящихся по параметрам уравнения пучков симплектических матриц, тесно связанный с так называемым QZ-разложением пары матриц [44]. Что касается уравнений Ляпунова вида (3.55), то наиболее экономичным представляется алгоритм решения, основанный на теореме Шура об унитарной триангу- ляризации матриц [20]. Альтернативный метод (менее эффективный в смысле «экономии размерности», но дающий явное выражение для решения уравнения Ляпунова), основан на идее развертывания матрицы в вектор-столбец и описывается ниже. Пример вычисления средней анизотропии. Ниже приведен пример вычисления средней анизотропии для дискретной системы G, заданной (А, В, С, D) - представлением:
Глава 3. Построение оптимальных робастных регуляторов 217 G~ 0,4501 -0,2689 0,1068 0,3936 -0,4421 -0,0140 0,3913 0,2621 -0,1471 0,3132 -0,0435 -0,4815 0,3214 -0,4901 -0,3611 0,2382 -0,3237 -0,0943 -0,2972 -0,3013 0,4355 0,4169 -0,0897 0,1038 -0,2278 с трехмерным внутренним состоянием и спектральным радиусом матрицы А р(А) = 0,4962, вычисление средней анизотропии, соответствующей двумерной гауссовской последовательности, дает A(G) = 0,6389. АНИЗОТРОПИЙНАЯ НОРМА ЛИНЕЙНОЙ СИСТЕМЫ Определение и основные свойства анизотропийной нормы. Пусть F - физически реализуемая линейная стационарная система, функционирующая в дискретном времени и имеющая m-мерный вход W и р-мерный выход Z = F<8> W . Предположим, что ее передаточная функция лежит в пространстве Харди Н^т , т.е. аналитична в открытом единичном круге на комплексной плоскости и имеет конечную Н°° -норму ||F||eo=supa(F(z)) = ess sup a(F(co)), |z|<l -71<(l)<71 где a(-) обозначает максимальное сингулярное значение матрицы. Введем множество Ga={GeH?xm:A(G)<a] (3.56) формирующих фильтров, генерирующих гауссовские последовательности, средняя анизотропия (3.50) которых ограничена сверху заданным неотрицательным параметром а. Соответственно я-анизотропийная норма системы F определяется как 1fILssup ■<ieGa (3.57) и характеризует чувствительность системы в среднем к случайным входным возмущениям с уровнем средней анизотропии а. Использование анизотропийной нормы системы F является важным в ситуации, иллюстрированной на рис. 3.10, где о входном сигнале W известно только, что он сгенерирован из гауссовского белого шума с помощью неизвестного фильтра GeG,,. GeG, Рис. 3.10. Система F с выходом Z и входным возмущением W, генерированным неизвестным фильтром GeGa из гауссовского белого шума V с единичной ковариационной матрицей Для фиксированной системы Fe Hj*™ ее я-анизотропийная норма (3.57) представляет собой неубывающую непрерывную функцию параметра а > 0, причем выполнены следующие соотношения -^|F||2=||F|0<elimJ|F|o=lF|L, (3.58) 14 3ак 416
218 Методы современной ТАУ. Часть ГУ в силу которых стандартные Н - и Н °° -нормы системы являются двумя предельными случаями анизотропийной нормы. Как показывают соотношения (3.58), вычисление я-анизотропийной нормы ||F||a представляет интерес лишь для положительных значений параметра а и систем Fe H^71, удовлетворяющих строгому неравенству £и,*ц. (3.59) Последнее нарушается лишь в том случае, если система F является внутренней с точностью до ненулевого постоянного множителя (т.е. если существует число а Ф О такое, что (F(o)))*F(co) = a2lm для почти всех сое [-я;я]). Если система F не является нулевой, то при соотношении р<т между размерностями ее выхода и входа условие (3.59) выполняется автоматически. Формулы для анизотропийной нормы в пространстве состояний. Пусть система Fe Н^*™ имеет л-мерное внутреннее состояние X, связанное с m-мерным входом W и р-мерным выходом Z = F® W системы уравнениями: где А, В, С, D - постоянные матрицы соответствующих размеров, причем матрица А асимптотически устойчива. Таким образом, система F имеет реализацию (Ml) > < к < +оо, (3.60) F~ С D в пространстве состояний. Схематически система (3.60) изображена на рис. 3.11. А X F -HgH I —+®+ г w D Рис. 3.11. Схематическое представление системы F: W, X и Z - входу внутреннее состояние и выход соответственно', г - оператор сдвига Рассмотрим следующее уравнение Риккати относительно матрицы Re Rnxn: R = ATRA + <7CTC-LTE~lL, (3.62) L^(Im-^DTD-BTRB)-1, (3.63) L = L(BTRA + ^DTC). (3.64) Решение R уравнения Риккати (3.62) - (3.64) называется допустимым, если эта матрица симметрична, матрица L положительно определена, а матрица A+BL асимптотически устойчива.
Глава 3. Построение оптимальных робастных регуляторов 219 Заметим, что при любом qe [OjlFflJ2] уравнение (3.62) - (3.64) имеет единственное допустимое решение, причем последнее является неотрицательно определенной матрицей. Следующая теорема дает представление в пространстве состояний как для наихудшего формирующего фильтра, так и для анизотропийной нормы системы. Теорема 3.3 [59]. Пусть заданы асимптотически устойчивая система (3.61), удовлетворяющая строгому неравенству (3.59), и уровень средней анизотропии входа а > 0. Тогда найдется единственная пара (<?,R) параметра qe |0;||F||~2j и допустимого решения R уравнения Риккати (3.62) - (3.64) (с сопутствующими матрицами Е и L), такая, что --lndetl mL = *. 2 [Tr(LPL1+L)y где Р - граммиан управляемости формирующего фильтра G~ A + BL bL 1/2" ?1/2 (3.65) (3.66) L Г удовлетворяющий уравнению Ляпунова P = (A + BL)P(A + BL)T+B2BT. (3.67) При этом фильтр (3.66) является наихудшим формирующим фильтром, и а-анизотропийная норма (3.57) системы F дается выражением т " "а L tr(LPLT+L) \1/2 (3.68) Представление в пространстве состояний наихудшего входного генерирующего фильтра (3.66) для системы (3.61) схематически представлено на рис. 3.12. X В D Vs W Рис. Э.12. Представление в пространстве состояний наихудшего входного генерирующего фильтра G для системы F 14*
220 Методы современной ТАУ. Часть ГУ Вычисление анизотропийной нормы методом гомотопии Сведение к системе дифференциальных уравнений. Предполагая асимптотически устойчивую систему (3.61) фиксированной, введем для каждого значения параметра qe 0;||F||~ J следующее непустое множество: R(q) = {Re RnXn : R = RT, матрица E положительно определена, матрица A+BL асимптотически устойчива}. Тем самым посредством соотношений (3.63) и (3.64) на множестве П ее {(4,R): qe [0;||F||:2), Re R(q)} (3.69) определены матричнозначные отображения Е:П-^/?тХт, Ь:П->ЯтХ\ бесконечно дифференцируемые по своим аргументам ^hR. Последним свойством (как композиция гладких отображений) обладает и связанная уравнением Ляпунова (3.67) с £ и L матрица Р, которую тоже можно рассматривать как матрично-значное отображение Р: П -> Rnxn . Далее, под R: 0;||F||~ )-^Rnxn понимается матрично-значное отображение, сопоставляющее каждому значению параметра q из указанного полуинтервала допустимое решение R(q) уравнения Риккати (3.62) - (3.64). Введем функции A, W:[0;|F|;2)^* (первая из которых принимает неотрицательные значения, а вторая - значения из полуинтервала [/n~l/2 ||F||2 ^IfH^) ), определив их посредством левой и правой частей соотношений (3.65) и (3.68) соответственно: 1, ■/ mZ \ A(<7) = --Mn det 2 [tr(LPLT+L)| 4l/2 I М уу, \ N(qy ,.w.- - q{ tr(LPLT+2:)JJ Теорема 3.3 приводит к следующему выражению для я-анизотропийной нормы системы F в терминах функций А и N: \\¥\\a=N(A-\a)). (3.70) Иными словами, параметрически заданная кривая, построенная на плоскости путем откладывания по оси абсцисс значений функции А, а по оси ординат - функции N (при пробегании параметра q из полуинтервала O;||F||~ 1), представляет собой график зависимости а-анизотропийной нормы фиксированной системы F от уровня средней анизотропии входа а > 0 . Построение такой кривой сводится в конечном итоге к решению уравнения Риккати (3.62) - (3.64) при различных значениях параметра q. Гладкая зависимость правой части рассматриваемого уравнения от параметра q и использование результатов [53] приводит к следующим двум наблюдениям: во- первых, при малом приращении этого параметра слабо возмущается и решение R(q) уравнения, поэтому можно вычислить поправку, описывающую возмущенное решение с точностью до омалого относительно такого приращения, не решая «заново» модифицированное уравнение; во-вторых, при q = 0 уравнение Риккати (3.62) - (3.64)
Глава 3. Построение оптимальных робастных регуляторов 221 имеет простое явное решение R(0) = 0. Сказанное представляет собой неформальное описание метода гомотопии [43], строгая реализация которого в рассматриваемом случае основана на следующей лемме. Лемма 3.1. Для заданной асимптотически устойчивой системы (3.61) допустимое решение уравнения Риккати (3.62) - (3.64) и соответствующие матрицы (3.63), (3.64) и (3.67) аналитичны по qe\ 0;||F||~ ) и удовлетворяют дифференциальным уравнениям R = (A + BL)TR(A + BL) + (C + DL)T(C + DL), (3.71) Р = (А + BL)P( A + BL)T + BLP( А + BL)T + +(А + BL)PLTBT +В!ВТ, (3.72) L = L(BTR(A + BL) + DT(C + DL)), (3.73) ± = L(DTD + BTRB)L. • (3.74) Поскольку функция А строго возрастает и выпукла, вычисление я-анизотро- пийной нормы по формуле (3.70) может осуществляться с помощью ньютоновских итераций, сходимость которых обеспечивается строгой монотонностью и выпуклостью функции Л. Именно, рекуррентная последовательность ft+i=i 2 ,*^0 (3.75) Мяк) с начальным условием q0 = 0 сходится к пределу lim qk = A~l(a). Эта сходимость монотонна в том смысле, что при A((1-2^)||F||:2)>« последовательность qk убывает. При этом в качестве практического условия окончания описанных итераций можно использовать выполнение неравенства (A(qk)-a)mJl N(f^ 1<е, (3.76) { A(qk)N(qk)J обеспечивающего вычисление я-анизотропийной нормы системы с относительной погрешностью е. Производные функций А и N, участвующие в (3.75) и (3.76), рассчитываются по формулам A(9) = -ifi2i+tr(tL-1) 2 \ W 2 [q 1-T где Ф * = -2?-, (3.78) Ф2 Ф = 1г(ЬРЬт + 2:)) (3.79)
222 Методы современной ТАУ. Часть ГУ (3.80) O = tr(LPLT+2LPLT+£), которые дополняются уравнениями (3.71) - (3.74). Пример вычисления анизотропийной нормы. Пусть задана дискретная система, (А, В, С, D) -представление которой имеет вид: А В" С D F~ 0,4501 -0,2689 0,1068 -0,3012 -0,4847 -0,0140 0,3913 0,2621 0,2468 -0,0549 -0,0435 -0,4815 0,3214 0,4318 -0,0340 -0,0553 0,1154 0,2919 -0,0814 0,3462 0,4218 0,2382 -0,3237 0,0252 -0,2974 -0,0943 0,4355 0,4169 0,1721 0,3381 -0,0897 0,3936 -0,4421 -0,4804 0,1813 с трехмерным внутренним состоянием и спектральным радиусом матрицы А р(А) = 0,4962. Вычисление ее Я2-и Н°° -норм дает ||F||2 =0,9454, |FL= 1,0591. Результаты вычисления анизотропийной нормы системы при некоторых значениях уровня анизотропии сведены в табл. 3.3. Таблица 3.3 Соответствие между уровнем средней анизотропии входного сигнала и анизотропийной нормой системы а 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 И. 0,4730 0,5064 0,5204 0,5313 0,5404 0,5483 0,5555 0,5622 0,5689 0,5745 а 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 И. 0,5800 0,6254 0,6597 0,6886- 0,7137 0,7362 0,7564 0,7748 0,7917 0,8074 а 2 3 4 5 6 7 8 9 10 11 WL 0,9161 0,9751 1,0091 1,0291 1,0410 1,0482 1,0525 1,0551 1,0567 1,0576 3.2.2. АНИЗОТРОПИЙНЫЙ СИНТЕЗ СИСТЕМ Задача оптимального управления по критерию минимума анизотропийной нормы Постановка задачи. Рассмотрим физически реализуемую линейную стационарную систему F (не предполагаемую устойчивой, т.е. ее передаточная функция не обязательно аналитична в единичном круге на комплексной плоскости), которая имеет два входа: тх -мерное возмущение W и т2 -мерное управление U; два выхода: рх -мерный управляемый сигнал Z и р2 -мерное наблюдение Y. Перечисленные сигналы представляют собой двусторонние последовательности векторов указанных размерностей. В соответствии с этим система F имеет блочную структуру
Глава 3. Построение оптимальных робастных регуляторов 223 F = (3.81) F12 [F21 F22_ Если управляющий сигнал U формируется по наблюдению Y регулятором К, являющимся физически реализуемой линейной стационарной (не обязательно устойчивой) системой, т.е. U = К (8) Y, то передаточная функция от W к Z получающейся замкнутой системы представляет собой нижнее дробно-линейное преобразование пары (F,K): L(F,K) = Fn+Fl2K(Ip2-F22K)-lF21. (3.82) Предположим теперь, что входное возмущение W является случайным сигналом, априорная информация о вероятностном распределении которого исчерпывается следующим: W - т{ -мерная стационарная гауссовская последовательность, средняя анизотропия которой ограничена сверху известным неотрицательным параметром а. Точнее, последнее означает, что W генерируется из тх -мерного гауссовского белого шума V с нулевым математическим ожиданием и единичной ковариационной матрицей Evk = 0, E(v* vj) = lml -оо <к < +оо, посредством неизвестного формирующего фильтра G, лежащего в семействе Ga = {Ge #2WlXmi : A(G)<a], (3.83) где 1 A(G) = -— fin det Att J Ag(co)(G(co))* \d(o llGll2 (3.84) - функционал средней анизотропии. Учитывая прикладной аспект проблемы, следует ограничиться рассмотрением лишь строго неупреждающих регуляторов К, для которых управление ик зависит в каждый момент времени к только от предшествующих наблюдений UjJ < к. Регулятор К называется допустимым, если он является строго неупреждающим и внутренне стабилизирует [29] замкнутую систему (3.82). Множество всевозможных допустимых регуляторов для заданной системы F обозначается далее через К. Сформулируем стохастическую проблему Н °° -оптимизации, основанную на понятии анизотропии сигналов [17, 18, 60] для заданных системы (3.81) и уровня а > 0 средней анизотропии (3.84) входного возмущения W найти допустимый регулятор К, минимизирующий a-анизотропийную норму замкнутой системы (3.82): ||UF,K)G|2 ||L(F,K)||a=sup «G||2 •:Ge&J->inf, KeK. (3.85) Сформулированная выше задача проиллюстрирована на рис. 3.13. Z 1— Y I(F,1 А К) К — и W GeGa Рис. 3.13. Структурная схема системы
224 Методы современной ТАУ. Часть ГУ Сформулированная проблема (как и всякая минимаксная задача) представляет собой антагонистическую игру двух игроков, в качестве первого из которых выступаем мы (множеством наших стратегий в этой игре является множество К внутренне стабилизирующих регуляторов), а в качестве второго - природа (множеством ее стратегий является семейство (3.83) формирующих фильтров с ограниченной известным параметром а средней анизотропией). Заметим, что в случае нулевого уровня а = О средней анизотропии, задача (3.85) совпадает со стандартной проблемой Я2-оптимизации, решение которой составляет основу стохастической теории фильтрации-управления Винера - Хопфа - Калмана. Уравнения для оптимального регулятора в пространстве состояний. Пусть разомкнутая система F имеет л-мерное внутреннее состояние X, связанное с тх -мерным возмущением W, т2-мерным управлением U, р^мерным управляемым сигналом Z и р2-мерным наблюдением Y уравнениями: **+l = Axk+B\wk +B2"* 1 Ч =с\хк +Dii^ +Di2w* k -оо</:<+оо> (3.86) yk=C2xk+D2lwk J где А, С,, By и D,y - постоянные матрицы соответствующих размеров. Иными словами, система F, а также ее подсистемы F,y в (3.81) имеют следующие реализации в пространстве состояний: В, В, F~ Dn Dl2 D21 0 (3.87) А В f«-[c d;}1*"*2 (з-88) (без ограничения общности полагается D22 = 0). Ниже для системы (3.87) приводятся уравнения для решения сформулированной в предыдущем разделе стохастической проблемы (3.85) Н°° -оптимизации по критерию минимума анизотропийной нормы. При этом используются следующие стандартные предположения: • (А1) подсистема F22 в (3.88) стабилизируема и детектируема (чтобы обеспечить непустоту множества К допустимых регуляторов); • (А2) размерность управляемого сигнала Z меньше размерности входного возмущения W: рх < тх (чтобы замкнутая система L(F,K) не была внутренней с точностью до ненулевого постоянного множителя); • (A3) матрица D2l в (3.87) имеет полный строчный ранг: rankD2{= p2 ^тх (во избежание вырожденности в уравнении Риккати для оценивающего регулятора); • (А4) матрица D12 в (3.87) имеет полный столбцовый ранг: rankDl2 =m2 < р{ (во избежание вырожденности в уравнении Риккати для оптимального регулятора). Пусть К - допустимый регулятор, имеющий «-мерное внутреннее состояние Н, связанное с сигналами наблюдения Y и управления U уравнениями: Иы=Мк+Вук\_ <х<к<^ (389) uk=Chk j
Глава 3. Построение оптимальных робастных регуляторов 225 где А, В и С - постоянные матрицы соответствующих размеров и, следовательно, К имеет реализацию ГА в] к~ с о (3.90) в пространстве состояний. Тогда реализация замкнутой системы (3.82) в пространстве состояний имеет вид А В2С В, «F.KHg * I- BC2 A BD21 В Dl2C Dn (3.91) причем матрица А асимптотически устойчива. Учитывая (3.91), рассмотрим уравнение Риккати R = ATRA + 9CTC + LTE"!L; (3.92) Es(IJlll-9D?lD11-BTRBrI; (3.93) L = [Li L2] = E(BTRA + (?DnC), (3.94) где q - скалярный параметр, принимающий значения из полуоткрытого интервала [0;||L(F,K)|~2), а матрица L разбита на блоки Ь1?Ь2 е Ящхп . Решение R = RTe R2nx2n уравнения (3.92) - (3.94) называется допустимым, если матрица L положительно определена, а матрица А + BL асимптотически устойчива. Каков бы ни был допустимый регулятор (3.90), уравнение (3.92) - (3.94) имеет для любого qe [O;||L(F,AT)|~") единственное допустимое решение, причем это решение является неотрицательно определенной матрицей. Теорема 3.4 [18, 60]. Пусть система (3.97) удовлетворяет предположениям А1 и Л2. Тогда, каковы бы ни были допустимый регулятор (3.90) и уровень а > 0 средней анизотропии входа, существует единственная пара (<?, R) параметра qe [0;||L(F,K)||~ ) и допустимого решения R уравнения Риккати (3.92) - (3.94), такая, что 11 , [ WiS —In det ~ 2 tr(LPLT+L) = я, r,2nx2n где Ре R п - граммиан управляемости формирующего фильтра G~ A + BL A + BiL, B,L9+B9C J1M 1^2 B^+D^L!) A + BD21L2 B^ BD21L 1/2 1/2 M/2 (3.95) (3.96) удовлетворяющий уравнению Ляпунова P = (A + BL)P(A + BL)T + BLBT . (3.97) Этот фильтр является наихудшим формирующим фильтром, и я-анизотропийная норма замкнутой системы (3.91) вычисляется по формуле: ( ( ^V/2 ■^-ч-Ш-ййЫ ■ <398)
226 Методы современной ТАУ. Часть IV Рассмотрим уравнение Риккати S = (А + В^ )S( А + В^ )т + В^В? - Л0Лт; (3.99) 0 = (С2+ Dj^OSCCa + D21L1)T + D^ED^; (3.100) Л = ((А + B^^SCCa + D2lL{)T + B{EDlx)»'\ (3.101) где матрицы £ и L определены в теореме 3.4. Решение S = ST e Rnxn уравнения (3.99) - (3.101) называется допустимым, если матрица S неотрицательно определена, а матрица A + BjL^ -Л(С2 + D21L4) асимптотически устойчива. Заметим, что уравнения (3.99) - (3.101) имеют не более одного допустимого решения. Наконец, рассмотрим уравнение Риккати T = ATTAT + CTC-NTIIN; (3.102) n = BTTB + D^2D12; (3.103) Ns[N, N2]s-n"!(BTTA + D72c), (3.104) где матрица N разбита на блоки N{ , N2е /Г2*", а матрицы Ае R2nx2\ Be я2лХ/и2, CeRPlX2n имеют вид А В] С *J = A BiM 0 A + BxM + BtC В2 о (3.105) где, в свою очередь, через M = L!+L2 (3.106) обозначена сумма блоков матрицы (3.94). Решение Т = Тт б R2nx2n уравнения (3.102) - (3.104) называется допустимым, если матрица Т неотрицательно определена, а матрица A + BN асимптотически устойчива. Заметим, что уравнения (3.102) - (3.104) имеют не более одного допустимого решения. Теорема 3.5 [18, 60]. Пусть система (3.87) удовлетворяет предположениям А1- А4, и пусть матрицы реализации допустимого регулятора (3.90) подчиняются соотношениям А = В2С + [.,-А][сА! £][у. (3..07, В = Л, (3.108) C = N!+N2, (3.109) где матрицы Nt, N2 связаны с допустимым решением уравнения Риккати (3.102) - (3.104). Тогда этот регулятор является решением задачи (3.85). Теоремы 3.4 и 3.5 дают полный набор нелинейных уравнений для отыскания матриц реализации в пространстве состояний оптимального регулятора (3.90) в задаче стохастической Н°° -оптимизации (3.85) по критерию минимума анизотропийной нормы для n-мерной системы (3.87). Этот набор состоит из следующих перекрестно связанных уравнений: три алгебраических матричных уравнения Риккати (два (2пх2п)-уравнений Риккати (3.92) - (3.94) и (3.102) - (3.104) и (пхп)-уравнение
Глава 3. Построение оптимальных робастных регуляторов 227 Риккати (3.99) - (3.101), уравнение Ляпунова (3.97), уравнение специального вида (3.95), уравнения (3.107) - (3.109), а также обозначения (3.91), (3.106) и (3.105). Удовлетворение этой системе соотношений является достаточным условием для оптимальности n-мерного регулятора (3.90). Вычисление оптимального регулятора методом гомотопии Векторизация матриц. Введем оператор векторизации со\: RpXq -^ Rpq, сопоставляющий матрице Х = (х л) вектор г V JK /I uj < р, 1 < к < q col(X) = * | II I mod(/-l,p)+l, — +1 L Р 1 +1 A <l<>pq образованный последовательно выписанными столбцами матрицы X, где mod (я, bj - остаток от деления а на Ь, a |_-J - нижняя целая часть числа. Очевидно, что отображение col является линейной бисекцией пространств Rpxq и Rpq. Лемма 3.2. а) Для любых матриц ае RrXp , ре Rpxq nyeRsxq ' col(apyT) = (y®a) col(p), где (8) - кронекерово произведение матриц [20]. б) Для любой матрицы X е RpXq col(xT) = y^col(X), где 8 pmod(y-i, q)+\ 11 l+i, к (3.110) 4p,q puiuu^y-i, ^j+| |i-i, к A <j<pq, I <k<pq и 8д - символ Кронекера. Заметим, что матрица (3.110) ортогональна для любых р, q, причем ур q=yT , откуда, в частности, вытекает симметричность и идемпотентность матрицы урр . Лемма 3.3. Векторизованное решение Хе RpXp уравнения Ляпунова X = AXAT+Y + YT, где A, Ye RpXp - заданные матрицы, причем А асимптотически устойчива, имеет вид col(X) = (lp2-A®A)"'(l;)2+Y;(,p)col(Y). r)Y Далее, под производной —- гладкого матрично-значного отображения Y: ЭХ RPX(*-^Rrxs понимается (rs)x(pq) матрица Якоби ±—^ соответствующего Эсо1(Х) векторизованнного отображения. Более того, для упорядоченного набора матрично- значных отображений У^..., Yb, зависящих от матриц Х^.^.Хд, полагается
228 Методы современной ТАУ. Часть IV a(Y,,...,Yt) э(х„...,ха) эх, ant эх, 3Y, «Г эх„ л1 Я'*« и Y: Заметим, что для любых гладких отображений X R"" -» Rqxr, зависящих от матрицы Z, справедливо Дифференцирование решений уравнений Риккати. Рассмотрим уравнение Риккати относительно матрицы Se Rnxn S = ASAT +BBT -Л0Лт ; (3.111) 0 = CTSC + DDT; (3.112) Л = (ASCT + BDT)0"1, (3.113) где Ae Rnxn, Be Rpxm , Ce Rpxn , De RpXm - заданные матрицы, называя его решение допустимым, если матрица F = A-AC (3.114) асимптотически устойчива. Такое решение единственно и гладким образом зависит от матриц А, В , С , D в окрестности тех их значений, где оно существует [53]. Лемма 3.4. Производные допустимого решения уравнения Риккати (3.111) - (3.113) и сопутствующих ему матриц имеют вид x[[FS|B-AD]®Iw|-[FS|B-AD](8)A], 30 -(СвС): Э8 (3.115) 3(A,B,C,D) v 'a(A,B,C,D) x[°^»(«-)|(V+TM)([CS|D]eip)], э(та)=(0"1ш»)((с@А)э(та)х x[[CS|D]<8.In|yn,p([AS|D]®Ip)]- 90 "1 (3.116) (3.117) -(1„®Л) Э(А,В,СВ)Г Нулевая анизотропия: Я -оптимальный регулятор. Далее предполагается, что разомкнутая система F с реализацией (3.87) в пространстве состояний удовлетворяет условиям А1 - А4 и фиксирована. При нулевой средней анизотропии а = 0-, набор уравнений для оптимального регулятора сводится к двум независимым (ихи)- уравнениям Риккати S = ASAT+B,B1T-A0AT, (3.118)
Глава 3. Построение оптимальных робастных регуляторов 229 e = C2SCT2+D2lDT2l, A = (ASC2T + B1D21)0"1 T = ATTA + ClTC1-NTnN, n = B^TB2+Dj2D12, N^ir^BjTA + DUC,), (3.119) (3.120) (3.121) (3.122) (3.123) что приводит к известным выражениям для матриц реализации Я -оптимального регулятора в пространстве состояний: A = A + B2N-AC2, В = Л, C = N (3.124) (при этом матрицы А-ВС2 и А + В2С асимптотически устойчивы). Этот регулятор обозначается далее через Ко, а его матрицы (3.124) через Ао, Во и Со соответственно. Метод гомотопии с ньютоновскими итерациями. Сопоставим всякому регулятору К вида (3.90) результат векторизации его матриц реализации в пространстве состояний Q = col (A) col (Ё) col (с) еЯг, где r = n(n + p2+m2), и обозначим Y(fi)-|L(F,K)C. Уравнения для оптимального регулятора зависят от параметра q и могут быть записаны в виде Q = F(«7, Q), (3.125) Л(<7, q) = *. (3.126) На решении (q, Qj системы (3.125) - (3.126) вычисляется некоторая функция N(<7, Qj, дающая минимальную а-анизотропийную норму min^^ L(F, Kj замкнутой системы (с оптимальным регулятором). Гладкая ветвь Q: Го, qA->Rr решений уравнения (3.125), где h£|L(F, K)L -2 удовлетворяет дифференциальному уравнению dq где (3.127)
230 Методы современной ТАУ. Часть ГУ -1 ( д¥ с начальным условием Q(0), получаемым векторизацией матриц Н2 -оптимального регулятора (3.124). Поэтому численная реализация метода гомотопии для решения системы уравнений (3.125) - (3.126) сводится к построению последовательности (ft» Qk)> к-® с начальным условием (0,Q(0)), подчиняющейся следующему рекуррентному правилу. Пусть уже построен к~й элемент последовательности (ft» Qk ) • ПРИ фиксированном qk производится серия ньютоновских итераций e*.w-fi*.i+GM*.i)(FM*.i)-fi*.i)-ls^'*" с начальным условием б*,о=б* и условием окончания \Qk,ik -Qktik-i\/\Qktik задаваемые малое число, после чего следующий элемент вычисляется как ft+i = ft + Aft» Qm = Qkt k + Аб* » где е - где Aft = g-A(ft.Qib,/J dA dA ^ dF / Л \ v9F, В качестве практического условия остановки при вычислении последовательности [ак, Qk) можно использовать неравенство mzx§A(qk,Qklk)-a\/a,A\Qk\/\Qk\)<t. 9(F,A) Лежащие в основе алгоритма выражения для матрицы производных —± ^ по- ^U»Q) лучаются применением лемм 3.3 и 3.4 и здесь не приводятся в силу их чрезвычайной громоздкости. Пример синтеза оптимального регулятора. Рассмотрим систему управления траекторным движением самолета ТУ-154, описанную в разделе «Результаты моделирования» предыдущей главы. Матрицы дискретной модели этой системы при шаге дискретизации, равном 0,01 с, имеют вид 0,9994 -0,0008 0,0000 -0,0009 0 0,0009" 0,0022 0,9938 0,0011 0,0072 0 0,0000 0,0001 0,0052 0,9842 -0,0154 0 0,0000 , (3.128) 0,0000 0,0000 0,0099 0,9999 0 0,0000 -0,0005 0,0124 0,0000 0,0000 1,0000 0,0000 0 0 0 0 0 0,9960
Глава 3. Построение оптимальных робастных регуляторов 231 0 0 0 0 -0,0100 0,0005' -0,0004 -0,0080 0,0000 0,0000 0,0000 0,0000 0,0100 0,0000 0,0000 0 В2„ = 0 С ■ о.оооо о.оооо' -0,0012 0,0000 0,0117 0,0000 0,0001 0,0000 0,0000 0,0000 0 0,0040 Матрицы стандартного объекта для дискретной 0,01 с имеют вид А — Ast ~ ' 0,9994 0,0022 0,0001 0,0000 -0,0005 0 -0,0008 0,9938 0,0052 0,0000 0,0124 0 0 0 0 0 0,0100 0 • 0,0000 -0,0009 0,0011 0,0072 0,9842 -0,0154 0,0099 0,9999 0,0000 0,0000 0 0 -0,0100 0,0005 1 • » модели 0 0 0 0 1,000С 0 -0,0004 -0,0080 0 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0 0 " 0,0000 0,0000" -0,0012 0,0000 0,0117 0,0000 0,0001 0,0000 0,0000 0,0000 0 0,0040^ 10 0 0 0 0' 0 0 0 0 10 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0" 0 0 0 0 0 при шаге 0,0009" 0,0000 0,0000 0,0000 > 0,0000 0,9960 > (3.129) (3.130) дискретизации (3.131) (3.132) (3.133) (3.134) СЯ2 ~ 1 0 0 0 0 01 0 0 0 0 1 oj' (3.135)
232 Методы современной ТАУ. Часть IV D*n = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 (3.136) D*12 = 0 0 1 0 0" 0 0 1 (3.137) D«2i = D«22 = (3.138) (3.139) a=0,05 _ con 0,9880 0,0015 -0,0170 -0,0004 -0,0025 -0,0148 0,0000 0,9973 -0,0229 -0,0001 0,0130 -0,0033 0,0002 0,0023 0,9741 0,0099 0,0002 -0,0007 -0,0006 0,0091 -0,0312 0,9998 0,0003 -0,0007 -0,0020 -0,0035 -0,0149 -0,0014 0,9842 -0,0025 0,0017 0,0004 -0,0026 0,0000 0,0001 0,9926 0 0 0 10 0 0 0 0 1 M. L° °J В результате применения описанной выше процедуры построения анизотропий- ного регулятора для многомерного входного сигнала, средний уровень анизотропии которого не превышает 0,05, получен анизотропийный регулятор (А, В, C,D), который представлен ниже (3.140) 0,0149 0,0026" 0,0030 0,0053 0,0004 0,0006 0,0004 0,0013 0,0027 0,0162 0 0 "-1,4210 -2,3935 -0,8618 -1,3472 -1,2199 -0,22471 -3,7006 -0,8298 -0,1630 -0,1853 -0,6201 -0,844lJ' D.=0.05 Г0 01 соп [0 О}' 3.2.3. Сравнение систем управления с различными регуляторами В данном разделе на основе результатов моделирования проводится сравнение характеристик переходных процессов замкнутых систем и управлений, синтезированных описанными ниже тремя типами регуляторов, при воздействии на замкнутую систему четырех различных видов входных сигналов, которые характеризуются различным уровнем пространственно-временной окрашенности (цветности). При моделировании рассматривались следующие типы регуляторов: H2/LQG- регулятор, два анизотропийных регулятора и Н °° -регулятор, которые были синтези- В я=0,05 _ (3.141) Са=0,05 _ (3.142) (3.143)
Глава 3. Построение оптимальных робастных регуляторов 233 рованы для дискретной системы управления, матрицы стандартного объекта которой представлены в (3.131) - (3.139). Анизотропийные регуляторы были синтезированы для двух различных уровней цветности входного сигнала, который определяется средним уровнем анизотропии входного сигнала, равных а = 0,05 (см. предыдущий параграф) и а = 0,5. Матрицы (А, В, С, О)-представлений соответствующих регуляторов приведены ниже: l Д=0,5 _ -*а =0,5 _ 0,9816 -0,0005 -0,0224 -0,0009 -0,0057 -0,0232 -1,8508 -5,8054 0,0005 0,9975 -0,0240 -0,0001 0,0130 -0,0051 вя=0,5 _ "con — -2,4923 -1,2797 0,0003 0,0024 0,9738 0,0099 0,0002 -0,0010 '0,0234 0,0058 0,0008 0,0008 0,0062 0 -0,8810 -0,2443 -0,000! 0,0092 -0,031^ 0,9998 0,0003 -0,001 0,0062' 0,0065 0,0008 0,0015 0,0177 0 -1,369? -0,2761 ) -0,0052 -0,0046 \ -0,0159 -0,0016 0,9827 1 -0,0039 » » -1,2944 1 -0,9674 0,0022 0,0006 -0,0038 0,0000 0,0002 0,9907 -0,3255" -1,3399 D' ,а=0,5 -Г° °1. [о oj Матрицы а"~ - Н -регулятора: " 0,9818 -0,0013 -0,0294 -0,0124 -0,0131 -0,0107 сн- р>9057 соп [0,8359 -0,0024 0,9909 -0,0085 -0,0039 -0,0054 0,0001 и"~ - "con ~~ 0,4677 -0,9483 ] 0,0063 0,0020 0,9824 -0,0079 0,0050 -0,0046 "-0,0004 -0,0022 0,0002 -0,0002 -0,0058 -0,0360 0,0362 -0,0038 »соп 0 -0,0053 -0,0014 0,0130 0,9937 -0,0053 0,0062 0,0112" 0,0032 -0,0022 0,0031 0,0198 -0,0192 0,1127 -0,0069 °i. 0 0,0055 0,0105 0,0363 0,0116 0,9838 -0,0044 -3,1338 2,0728 -0,0702 0,0767 -0,1515 -0,0338 0,0165 0,8742 13,6706" 25,3549_ (3.144) (3.145) (3.146) (3.147) (3.148) (3.149) (3.150) (3.151)
234 Методы современной ТАУ. Час?> IV Матрицы г"2- H2/LQG- ' 0,9901 0,0021 -0,0079 -0,0001 -0,0006 -0,0030 '-0,6669 -0,7478 регулятора: -0,0008 0,9963 -0,0186 -0,0001 0,0124 -0,0007 R"2 - Ucon - 2,0266 ■ -0,1772 - В 0,0000 0,0020 0,9753 0,0099 0,0000 -0,0002 '0,0093 0,0009 0,0002 0,0000 0,0001 0 -0,7570 -0,0396 >»2=[° СОП л -0,000$ 0,0087 -0,0294 0,9999 0,0001 -0,0002 0,0001" 0,0037 0,0004 0,0010 0,0138 0 -1,1921 -0,0446 °л ) -0,0001 -0,0025 [ -0,0120 -0,0011 0,9862 > -0,0005 > -0,9890 0,1246 0,0009 " 0,0001 -0,0007 0,0000 0,0000 0,9954 -0,0624] -0,1565J (3.152) (3.153) (3.154) (3.155) м/с -10- -15 Рис. 3.14. Реализация белого шума, подаваемого иа вход регуляторов Для сравнения свойств регуляторов на многомерный вход каждой из четырех замкнутых систем с соответствующими регуляторами подавались тестовые входные сигналы, моделирующие ветровое возмущение, следующих видов: • на входы подавался идентичный гауссовский белый шум, который представлен на рис. 3.14 (сигнал с нулевой средней анизотропией);
Глава 3. Построение оптимальных робастных регуляторов 235 • окрашенный сигнал, полученный в результате прохождения белого шума через формирующий фильтр, на выходе которого формируется сигнал с уровнем средней анизотропии равным 0,05; • более окрашенный сигнал, полученный в результате прохождения белого шума через формирующий фильтр, на выходе которого формируется сигнал с уровнем средней анизотропии равным 0,5; • на входы подавался одинаковый детерминированный сигнал в виде единичного ступенчатого сигнала (сигнал с бесконечной средней анизотропией). Формирующие фильтры с уровнями средней анизотропии равными соответственно а = 0,05 и а = 0,5 были получены при синтезе соответствующих анизотропийных регуляторов. Два многомерных окрашенных сигнала были получены из одной и той же последовательности, моделирующей гауссовский белый шум. В результате моделирования были получены реакции замкнутых систем по управляемым переменным (отклонения воздушной скорости и высоты) и управления (управление Ьсу и отклонение ручки сектора газа), формируемые соответствующими регуляторами, на различные виды внешнего ветрового возмущения. Полученные результаты моделирования представлены на графиках и сведены в таблицы следующим образом: • На рис. 3.15 - 3.18 и табл. 3.4 - 3.7 приведены результаты моделирования для случая входного возмущения в виде белого шума. • На рис. 3.19 - 3.22 и табл. 3.8 - 3.11 приведены результаты моделирования для случая, когда на вход подавался входной сигнал, сгенерированный формирующим фильтром со средним уровнем анизотропии, равном 0,05. • На рис. 3.23 - 3.26 и табл. 3.12-3.15 приведены результаты моделирования для случая, когда на вход подавался входной сигнал, сгенерированный формирующим фильтром со средним уровнем анизотропии, равном 0,5. • На рис. 3.27 - 3.30 и табл. 3.16 - 3.19 приведены результаты моделирования для случая, когда на вход подавался детерминированный единичный ступенчатый сигнал. На рисунках и в таблицах приняты следующие обозначения: Н2/LQG -регулятор - Н2; анизотропийный регулятор, синтезированый при уровне средней анизотропии входного сигнала, равного 0,05 - Anisotropy a = 0,05; анизотропийный регулятор, синтезированый при уровне средней анизотропии входного сигнала, равного 0,5 - Anisotropy а = 0,5; Я°°-субоптимальный регулятор - Яш/; Ьсу - TetaCY ; сектор газа - DLsg. Внешнее возмущение - белый шум Проанализируем поведение замкнутых систем при моделировании ветрового возмущения гауссовским белым шумом. Графики переходных процессов (рис. 3.15) и диапазоны изменения отклонений воздушной скорости и высоты (табл. 3.4 и 3.5) для всех регуляторов практически не отличаются друг от друга. Но Н °° -субоптимальный регулятор незначительно, но все же обеспечивает наилучшее качество подавления ветрового возмущения по управляемым переменным.
236 Методы современной ТАУ. Часть IV V,m/c О 5 10 15 20 25 30 35 40 Г, С Я,м к -2- Рис. 3.15. Совместные графики отклонения воздушной скорости V и высоты Н при воздействии на вход замкнутых систем с соответствующими регуляторами белого шума Совершенно другая картина наблюдается по виду и величинам синтезируемых регуляторами управлений (рис. 3.16 - 3.18 и табл. 3.6, 3.7). Наихудшими показателями по величинам и производным по управлениям обладает Н°° -субоптимальный регулятор, а наилучшими - Н2 -регулятор. Так, по управлению f>cy диапазон изменения для Н2 -регулятора примерно в 6,3 раза меньше, чем для Н °° -субоптимального регулятора. Таблица 3.4 Отклонение от номинального значения воздушной скорости V при действии белого шума на систему, замкнутую различными регуляторами Вход - белый шум Тип регулятора Н2 Анизотропийный а = 0,05 Анизотропийный а = 0,5 V ■ 'mm -2,7446 -2,1839 -2,0807 -2,0921 у т max 2,1409 1,5279 1,4036 1,3675 V -V r max mm 4,9055 3,7118 3,4843 3,4596 Анизотропийные регуляторы занимают промежуточное положение между Н - и Н °° -субоптимальными регуляторами. Причем при увеличении уровня анизотропии увеличивается амплитуда управлений и ухудшается их «гладкость».
Глава 3. Построение оптимальных робастных регуляторов 237 Таблица 3.5 Отклонение от номинального значения высоты Н при действии белого шума на систему, замкнутую различными регуляторами Вход - белый шум Тип регулятора н2 Анизотропийный а = 0,05 Анизотропийный а = 0,5 Н°° -5,2361 - 5,4079 -4,7440 -4,3424 #max 3,1526 2,7074 2,7195 2,6048 #max ~ #min 8,3888 8,1153 7,4636 6,9472 Гораздо более существенное различие наблюдается по отклонению сектора газа (обозначение DLsg). Диапазон изменения отклонения сектора газа для Н2 - регулятора примерно в 26 раз меньше, чем для Н°° -регулятора. Это объясняется тем, что Н °° -регулятор в силу своей динамичности (перестраховочности) не обладает сглаживающим свойством как Н2 -регулятор и воспринимает белый шум как детерминированный сигнал и пытается его парировать. Отношение диапазонов изменения управления Фсу и отклонения сектора газа для анизотропийного регулятора при уровне а =0,05 и Я2-регулятора составляют соответственно 1,7 и 5,3. Аналогичные соотношения для анизотропийного регулятора при уровне а =0,5 равны 2,1 и 9,3. Таким образом, при входном воздействии в виде белого шума Н2 -регулятор является наилучшим. В то же время при заданных уровнях средней анизотропии входного сигнала анизотропийные регуляторы парируют белый шум с гораздо меньшими энергетическими затратами по управлению по сравнению с Н °° -субоптимальным регулятором. Таблица 3.6 Отклонение от номинального значения управления TetaCY при действии помехи на систему, замкнутую различными регуляторами Тип регулятора Н2 Анизотропийный а = 0,05 Анизотропийный а = 0,5 Н°° Вход-белый шум TetaCYmn -3,8987 - 6,4245 - 8,7093 -25,8491 TetaCY^ 4,8061 8,7425 10,0284 29,1145 TetaCY^ -TetaCYmin 8,4049 15,1670 18,7376 54,9636 Таблица 3.7 Отклонение от номинального значения сектора DLsg газа при действии помехи на систему, замкнутую различными регуляторами Вход - белый шум Тип регулятора Н2 Анизотропийный а = 0,05 Анизотропийный а = 0,5 Я°° OLsgmn -1,7300 -8,4345 -16,0535 -46,3739 2,0312 11,3490 19,0867 52,0337 3,7612 19,7835 35,1403 98,4076
238 Методы современной ТАУ. Часть IV TetaCY, град -30 град -501 Рис. 3.16. Совместные графики управления Ь^, и сектора газа при воздействии на вход замкнутых систем с соответствующими регуляторами белого шума TetaCY, град А Н1 *&*»фЬ TetaCY, град ю 10 15 20 25 Анизотропийный а = 0,05 ю TetaCY, ° град 10 зо 35 40 г, с 10 10 15 20 25 Анизотропийный а = 0,5 зо 35 40 ty С TetaCY, град ( i 50 0 SO ) 5 i ! 10 15 20 H~ 25 J i 30 35 1 40 f, С 10 15 20 25 30 35 40 U с Рис. 3.17. Раздельные графики управления Ь^ при воздействии на вход замкнутых систем с соответствующими регуляторами белого шума
Глава 3. Построение оптимальных робастных регуляторов 239 DLsg, * град 0 DLsg, град i 20 0 20 DLsg, град i 20 0 DLsg, град i 50 0 50 Э 5 10 i э • 5 10 5 10 я2 15 20 Анизотропийный с %^ 15 20 Анизотропийный 15 20 г 25 г = 0,05 25 а = 0,5 25 30 3 0 30 35 35 35 ## 40 ',с 4 ^, с 40 " Г, С iftflf ► 10 15 20 25 30 35 40 t, С Рис. 3.18. Раздельные графики сектора газа при воздействии на вход замкнутых систем с соответствующими регуляторами белого шума Внешнее возмущение - цветной шум. Рассмотрим более реальные внешние возмущения в виде цветного белого шума с двумя разными «уровнями цветности», которые моделируются двумя формирующими фильтрами, описанным выше. Анализ рис. 3.19 и 3.23 показывает, что сравнительное поведение замкнутых систем по отклонениям воздушной скорости и высоты примерно одинаково и отличается только масштабом. Величины отклонений (см. табл. 3.8, 3.9 и 3.12, 3.13) для Н °° -субоптимального регулятора и двух анизотропийных регуляторов отличаются незначительно. При этом с ростом уровня средней анизотропии максимальные амплитуды отклонений и диапазоны изменений уменьшаются и приближаются по реакции к замкнутой системе с Н°° -регулятором. Так, в случае входного сигнала с уровнем анизотропии а = 0,05 диапазон изменения воздушной скорости для анизотропийного регулятора (а = 0,05) только в 1,2 раза больше, чем для Н°°-регулятора. Для высоты это соотношение равно 1,3. В случае цветного сигнала с уровнем анизотропии а = 0,5 данные соотношения незначительно больше и составляют 1,25 и 1,35 соответственно. Тогда как для Н2 -регулятора по сравнению с Н°° -регулятором в случае входного сигнала с уровнем анизотропии а =0,05 отношение диапазонов изменения по скорости составляют 1,8 , а по высоте 1,95. Аналогичные соотношения в случае входного сигнала с уровнем анизотропии а - 0,5 равны соответственно 2 и 2,6. Характер синтезируемых управлений при двух различных цветных возмущениях также аналогичен (при а =0,05 см. рис. 3.12 - 3.14, а при а = 0,5 см. рис. 3.24 - 3.26) и также отличается только масштабом (при а = 0,05 см. табл. 3.8, 3.9, а при
240 Методы современной ТАУ. Часть IV а = 0,5 см. табл. 3.12, 3.13). Самое слабое по величине и самое гладкое управление формируется Я2-регулятором. В противоположность ему Н°° -субоптимальный регулятор формирует самое сильное по амплитуде управление с большой величиной производной по управлению, что является существенным недостатком. Анизотро- пийные регуляторы как по амплитуде, так и по «гладкости» управлений занимают промежуточное значение, что видно из табл. 3.10, 3.11, 3.14, 3.15. Таким образом, одним из основных достоинств синтезированных в данной работе анизотропийных регуляторов является то, что существенно меньшим по величине управлением достигаются практически одинаковые (лишь незначительное ухудшение) переходные процессы для отклонений воздушной скорости и высоты, по сравнению с Н°° -субоптимальным регулятором. V, м/с* Я,м ^ 10 Рис. 3.19. Совместные графики отклонения воздушной скорости V и высоты Н при воздействии на вход замкнутых систем с соответствующими регуляторами сигнала со средним уровнем анизотропии а = 0,05 Таблица 3.8 Отклонение от номинального значения воздушной скорости V при действии цветной помехи на систему, замкнутую различными регуляторами Вход - сигнал с уровнем анизотропии 0,5 Тип регулятора я2 Анизотропийный а = 0,05 Анизотропийный а = 0,5 V ■ r mm -3,1483 - 1,9381 - 1,6930 -1,6076 Vmax 3,0725 2,1209 1,8612 1,7383 у max Y mm 6,2208 4,0591 3,5541 3,3458
Глава 3. Построение оптимальных робастных регуляторов 241 Таблица 3.9 Отклонение от номинального значения высоты Н при действии помехи на систему, замкнутую различными регуляторами Вход - сигнал с уровнем анизотропии 0,05 Тип регулятора я2 Анизотропийный а = 0,05 Анизотропийный а = 0,5 Я~ # nun -2,3017 -2,0763 - 1,9275 - 1,5534 #max 2,6180 1,1909 1,0600 0,9733 #max ~ #min 4,9196 3,2672 2,9875 2,5267 DLsg, град 10 15 20 25 30 35 i 15 10 5 0 -5 10 : il'l "тРг" PfvF h i i I , j 1—^ 40 t, С Рис. 3.20. Совместные графики управления f^, и отклонения ручки сектора газа при воздействии на вход замкнутых систем с соответствующими регуляторами сигнала со средним уровнем анизотропии а = 0,05 Таблица 3.10 Отклонение от номинального значения управления TetaCY при действии помехи на систему, замкнутую различными регуляторами Вход - сигнал с уровнем анизотропии 0,05 Тип регулятора Н2 Анизотропийный а = 0,05 Анизотропийный а = 0,5 Н°° TetaCYwn -2,5906 -2,6848 -3,0811 -5,9990 TetaCYmax 1,9499 2,5365 3,0039 6,2844 TetaCY^ - TetaCY^ 4,5405 5,2214 6,0850 12,2833 17 3ак. 416
242 Методы современной ТАУ. Часть ГУ TetaCYji град -5 TetaCY, град Н2 -5 TetaCY, град , 10 15 20 25 Анизотропийный а = 0,05 30 35 40 t, С -5 TetaCY, град10 10 15 20 25 Анизотропийный а = 0,5 30 35 40 Г, С 10 15 •10 20 25 30 35 40 f, С 10 15 20 25 30 35 40 U с Рис. 3.21. Раздельные графики управления Ь^, при воздействии иа вход замкнутых систем с соответствующими регуляторами сигнала со средним уровнем анизотропии а = 0,05 DLsg, град s Н2 DLsg, о град 1С DLsg, 10 15 20 Анизотропийный а- 25 :0,05 30 35 40 U с град *b*w\fc^J^^ 10 15 20 25 30 35 40 U С Рис. 3.22. Раздельные графики управления DLsg при воздействии на вход замкнутых систем с соответствующими регуляторами сигнала со средним уровнем анизотропии а = 0,05
Глава 3. Построение оптимальных робастных регуляторов 243 Таблица 3.11 Отклонение от номинального значения управления DLsg при действии помехи на систему, замкнутую различными регуляторами Вход - сигнал с уровнем анизотропии 0,05 Тип регулятора нг Анизотропийный а = 0,05 Анизотропийный а = 0,5 Н°° DLsgmn -2,1901 -5,9787 -8,1486 - 13,7717 DLsgM 1,8319 5,6191 7,8866 13,6505 DLsgma* - DLsgmn 4,0220 11,5978 16,0352 27,4222 V.m/c Я,м Рис. 3.23. Совместные графики отклонения воздушной скорости V и высоты Н при воздействии на вход замкнутых систем с соответствующими регуляторами сигнала со средним уровнем анизотропии а = 0,5 Таблица 3.12 Отклонение от номинального значения воздушной скорости при действии цветной помехи на систему, замкнутую различными регуляторами Вход - сигнал с уровнем анизотропии 0,5 Тип регулятора Н2 Анизотропийный а = 0,05 Анизотропийный а = 0,5 -8,1184 -4,8519 -4,1898 -3,8827 Vmax 8,6577 5,7701 4,9786 4,6070 V -V у max у min 16,7761 10,6219 9,1683 8,4896 17*
244 Методы современной ТАУ. Часть IV Таблица 3.13 Отклонение от номинального значения высоты при действии помехи на систему, замкнутую различными регуляторами Вход - сигнал с уровнем анизотропии 0,5 Тип регулятора Н2 Анизотропийный а = 0,05 Анизотропийный а = 0,5 «*min -4,5573 -3,3589 -3,1698 -2,5141 #max 6,0100 2,1177 1,7270 1,5566 Нтах ~" Нпап 10,5673 5,4766 4,8969 4,0707 TetaCY, j град ю -30 Рис. 3.24. Совместные графики управления й^ и отклонения сектора газа при воздействии на вход замкнутых систем с соответствующими регуляторами сигнала со средним уровнем анизотропии а = 0,5 Таблица 3.14 Отклонение от номинального значения управления TetaCY при действии помехи на систему, замкнутую различными регуляторами Вход - сигнал с уровнем анизотропии 0,5 Тип регулятора Я2 Анизотропийный а = 0,05 Анизотропийный а = 0,5 Н°° TetaCYmia - 5,8544 -5,3089 -5,4796 -8,5715 TetaCY^ 4,5034 4,4107 4,8613 7,8705 TetaCYmn - TetaCYmin 10,3578 9,7196 10,3410 16,4420
Глава 3. Построение оптимальных робастных регуляторов 245 TetaCY, град ю TetaCY% ° град -ю TetaCY, град TetaCY, град -к ю 10 15 20 25 30 Анизотропийный а =0,05 15 20 25 Анизотропийный а - 0,5 30 35 35 40 Л с 40 Л с oa^w^vHv^ 10 15 20 25 30 35 40 U с Рис. 3.25. Раздельные графики управления Ь^ при воздействии на вход замкнутых систем с соответствующими регуляторами сигнала со средним уровнем анизотропии а = 0,5 DLsg, град ю DLsg? о град 20 -20 DLsg, град 20 -20 DLsg, град ю 15 20 25 Анизотропийный а = 0,05 зо ю 15 20 25 Анизотропийный а = 0,5 30 10 15 20 25 30 35 35 35 40 t, С 4°f, С 0 J [ 50 5 10 1 1 15 1 20 /Г 25 1 30 i 35 1 ► 40 t, С Рис. 3.26. Раздельные графики управления DLsg при воздействии на вход замкнутых систем с соответствующими регуляторами сигнала со средним уровнем анизотропии а = 0,5
246 Методы современной ТАУ. Часть ГУ Таблица 3.15 Отклонение от номинального значения управления DLsg при действии помехи на систему, замкнутую различными регуляторами Вход - сигнал с уровнем анизотропии 0,5 Тип регулятора я2 Анизотропийный а = 0,05 Анизотропийный а - 0,5 DLsgmn -5,9413 - 14,5751 - 17,2360 - 24,0006 DLsgjw 4,7944 11,9413 15,0450 21,3063 DLsg^ - DLsgmn 10,7357 26,5163 32,2810 45,3070 Таблица3.16 Отклонение от номинального значения воздушной V скорости при действии детерминированной помехи на систему, замкнутую различными регуляторами Вход - детерминированный сигнал Тип регулятора я2 Анизотропийный а =0,05 Анизотропийный а = 0,5 у . ПИП - 10,5557 -4,7143 -3,9916 -3,8048 Vmax 0 0 0 0 F max т mm 10,5557 4,7143 3,9916 3,8048 Внешнее возмущение - детерминированный входной сигнал Рассмотрим другой, крайний, с точки зрения средней анизотропии входного сигнала, случай, когда входное воздействие является детерминированным сигналом. Как отмечалось выше, он задается единичным ступенчатым сигналом. Как видно из графиков переходных процессов (см. рис. 3.21) и установившихся состояний отклонений воздушной скорости и высоты (см. табл. 3.16 и 3.17), Я2 -регулятор обеспечивает наихудшую реакцию на детерминированный ступенчатый сигнал. Его установившиеся значения по высоте и скорости примерно в 2 раза больше по сравнению с Я°° -субоптимальным регулятором. Реакция обоих анизотропийных регуляторов по высоте и скорости практически совпадает с Я °°-субоптимальным регулятором. Вид управления и их диапазоны изменения показаны на рис. 3.28 - 3.30 и сведены в табл. 3.18 и 3.19. В установившемся состоянии величины управлений у анизотропийных регуляторов также практически совпадает с Я°° -субоптимальным регулятором. Как видно из графиков, управления отличаются только во время переходного процесса и иллюстрируют различную скорость реакции (динамичность) на входной сигнал. Наименьшей скоростью реакции обладает Я2 -регулятор, а наибольшей - Я°°-субоптимальный регулятор. Скорость реакции у анизотропийных регуляторов увеличивается с ростом уровня средней анизотропии входного сигнала, для которого он был синтезирован. Таким образом, в случае детерминированного возмущения оба анизотропийных регулятора обеспечивают качество переходных процессов по управляемым перемен- ным и управлению, близкое к Н°° -субоптимальному регулятору. Я2 -регулятор достаточно вяло реагирует на детерминированный сигнал, т.к. он воспринимает его белым шумом в силу предположений о входном сигнале в процедуре синтеза.
Глава 3, Построение оптимальных робастных регуляторов 247 V,m/c -12 Я,м [ J к 0 -10 -15 i <гГЛ^ 10 15 20 25 30 35 40 U с Рис. 3.27* Совместные графики отклонения воздушной скорости V и высоты Н при воздействии на вход замкнутых систем с соответствующими регуляторами детерминированного сигнала Таблица 3.17 Отклонение от номинального значения высоты Н при действии детерминированной помехи на систему, замкнутую различными регуляторами Вход - детерминированный сигнал Тип регулятора Н2 Анизотропийный а = 0,05 Анизотропийный а -0,5 И°° -10,1441 -6,3245 -5,6498 -4,9393 #тах 0,5926 0,6070 0,6123 0,6103 #тах ~ #min 10,7367 6,9315 6,2622 5,5496 Таблица 3.18 Отклонение от номинального значения управления TetaCY при действии детерминированной помехи на систему, замкнутую различными регуляторами Вход- детерминированный сигнал Тип регулятора Н2 Анизотропийный а = 0,05 Анизотропийный л = 0,5 TetaCYam -1,3533 -2,1398 -2,6321 -4,7789 TetaCY^ 6,3396 3,8159 3,4150 3,1027 TetaCYmM - TetaCY^ 7,6930 5,9556 J6.4070 7,8816
248 Методы современной ТАУ. Часть IV TetaCY, град ю DLsg, град ю 15 20 25 30 35 40 U с ! j —'^—■ - ► 10 15 20 25 30 35 40 U с Рис. 3.28. Совместные графики управлений Oq, и сектора газа при воздействии на вход замкнутых систем с соответствующими регуляторами детерминированного сигнала TetaCY, град 10 0 10 TetaCY,* град i 0 _5 TetaCY, град ^ 0 TetaCY, C град 5^ 0 -5 i i 5 10 ) 5 10 i ) 5 10 i 1 н2 i i 15 20 Анизотропийный 15 20 Анизотропийный 15 20 1 2 д = 0, 1 5 30 05 25 30 а = 0,5 25 30 35 35 35 — 40 U с —► 10 15 20 25 30 40 U с Рис. 3.29. Раздельные графики управления Ф^, при воздействии на вход замкнутых систем с соответствующими регуляторами детерминированного сигнала
Глава 3. Построение оптимальных робастных регуляторов 249 DLsg, i град 10 0 DLsg™ град i 10 0 -10 DLsg, град i 10 0 -10 DLsg, град i 10 0 -10 i ' Э ! i 3 i V / 5 10 г* • 5 10 5 10 н2 _ ' 15 20 Анизотропийный 15 20 Анизотропийный 15 20 2 д = С 5 30 ,05 25 30 а = 0,5 25 30 1 35 35 35 40 г. с 4 о ty (Г 40 Л с ► 10 15 20 25 30 35 40 Г, С Рис. 3.30. Раздельные графики управления DLsg при воздействии на вход замкнутых систем с соответствующими регуляторами детерминированного сигнала Таблица 3.19 Отклонение от номинального значения управления DLsg при действии детерминированной помехи на систему, замкнутую различными регуляторами Вход - детерминированный сигнал Тип регулятора н2 Анизотропийный а = 0,05 Анизотропийный а = 0,5 DLsgmn -0,3700 -2,4761 -4,5492 - 8,4532 6,3304 8,6888 9,0034 9,0225 DLsgw - DLsgnin 6,7005 11,1649 13,5526 17,4757 Обобщая результаты сравнительного моделирования, можно констатировать, что Н2 -регулятор удовлетворительно работает только при входном воздействии в виде белого шума, а Н°° -субоптимальный регулятор - при детерминированном сигнале. Анизотропийный регулятор может быть синтезирован для произвольного уровня цветности входного сигнала и обеспечивать высокий уровень подавления внешнего возмущения (близкий к Н°° -субоптимальному регулятору) при существенно меньшей величине управления. 16 Зак. 416
250 Методы современной ТАУ. Часть IV ГЛАВА 4. АДАПТИВНЫЕ СИСТЕМЫ Теория адаптивных систем возникла в связи с необходимостью решения широкого класса прикладных задач, для которых неприемлемы традиционные методы, требующие знания адекватной математической модели объекта. Качество традиционных (неадаптивных) методов управления тем выше, чем больше априорной информации о самом объекте и условиях его функционирования. На практике достаточно трудно обеспечить точное математическое описание объекта управления. Так, например, при разработке автоматических систем управления технологическими процессами в химической, металлургической промышленности создание адекватной математической модели представляет обычно сложную самостоятельную задачу. Более того, характеристики объекта в процессе функционирования могут существенно изменяться. Динамические характеристики летательных аппаратов сильно зависят от режима полета, технологических разбросов, состояния атмосферы. В этих условиях традиционные методы часто оказываются неприменимыми либо дают плохие результаты. В связи с этим уже на начальном этапе развития теории автоматического управления представлялся весьма эффективным путь построения управляющих систем, не требующих полной априорной информации об объекте и условиях его функционирования. Эффект приспособления к условиям функционирования в адаптивных системах обеспечивается за счет накопления и обработки информации о поведении объекта в процессе его функционирования. Это позволяет существенно снизить влияние неопределенности на качество управления, компенсируя недостаток априорной информации на этапе проектирования систем. 4.1. ОПРЕДЕЛЕНИЕ И КЛАССИФИКАЦИЯ АДАПТИВНЫХ СИСТЕМ Управляющая система, автоматически определяющая нужный закон управления посредством анализа поведения объекта при текущем управлении, называется адаптивной. Многочисленные обзоры по теории адаптивных систем имеют разнообразные варианты классификации. Мы будем придерживаться классификации, приведенной А.А. Вороновым и В.Ю. Рутковским в обзоре [6]. Адаптивные системы можно разделить на два больших класса: самоорганизующиеся и самонастраивающиеся. В самоорганизующихся системах в процессе функционирования происходит формирование алгоритма управления (его структуры и параметров), позволяющего оптимизировать систему с точки зрения поставленной цели управления (ЦУ). Такого рода задача возникает, например, в условиях изменения структуры и параметров объекта управления в зависимости от режима функционирования, когда априорной информации недостаточно для определения текущего режима. При широком классе возможных структур объекта трудно надеяться на выбор единственной структуры алгоритма управления, способной обеспечить замкнутой системе достижение ЦУ во всех режимах функционирования. Таким образом, речь идет о синтезе при свободной структуре регулятора. Очевидная сложность постановки задачи не позволяет надеяться на простые алгоритмы ее решения, а следовательно, и на широкое внедрение в настоящее время таких систем в практику.
Глава 4. Адаптивные системы 251 Задача существенно упрощается, если структура объекта управления известна и неизменна, а поведение зависит от ряда неизвестных параметров. Эта задача решается в классе самонастраивающихся систем (СНС), в которых структура регулятора задана (заранее выбрана) и требуется определить лишь алгоритм настройки его коэффициентов (алгоритм адаптации). СНС делятся на два подкласса: поисковые и беспоисковые. В поисковых СНС минимум (или максимум) меры качества (производительность установки, расход топлива и т.д.) ищется с помощью специально организованных поисковых сигналов. Простейшими поисковыми системами являются большинство экстремальных систем, в которых недостаток априорной информации восполняется за счет текущей информации, получаемой в виде реакции объекта на искусственно вводимые поисковые (пробные, тестовые) воздействия. В беспоисковых СНС в явном или неявном виде имеется модель с желаемыми динамическими характеристиками. Задача алгоритма адаптации состоит в настройке коэффициентов регулятора таким образом, чтобы свести рассогласование между объектом управления и моделью к нулю. Такое управление называют прямым адаптивным управлением (direct adaptive control), а системы - адаптивными системами с эталонной моделью (model reference adaptive systems). В случае непрямого адаптивного управления (indirect adaptive control) сначала проводят идентификацию объекта, а затем определяют соответствующие коэффициенты регулятора. Такие регуляторы называются самонастраивающимися (self-turning regulators). При прямом адаптивном управлении контуры адаптации работают по замкнутому циклу. Это позволяет парировать изменения параметров объекта и регулятора. Однако, каждый контур самонастройки повышает порядок системы как минимум на единицу, и при этом существенно влияет на общую динамику замкнутой системы. В случае непрямого адаптивного управления контуры самонастройки работают по разомкнутому циклу и, следовательно, не влияют на динамику системы. Однако все ошибки идентификации, уходы параметров объекта и регулятора существенно влияют на точность управления. В беспоисковых самонастраивающихся системах эталонная модель может быть реализована в виде реального динамического звена {явная модель) или присутствовать в виде некоторого эталонного управления, связывающего регулируемые переменные и их производные {неявная модель). В неявной модели коэффициенты эталонного уравнения являются параметрами алгоритма адаптации. 4.2. ПОСТАНОВКА ЗАДАЧИ СИНТЕЗА АДАПТИВНОЙ СИСТЕМЫ УПРАВЛЕНИЯ. ГИПОТЕЗА О КВАЗИСТАЦИОНАРНОСТИ Ограничимся рассмотрением задачи синтеза для непрерывных динамических объектов [35]. Пусть на объект управления (ОУ) влияют измеряемые возмущения (задающие воздействия) Y = Y(/), неизмеряемые возмущения N = N(/) и управляющие воздействия U = U{t). Наблюдениям доступны выходные переменный объекта Х = ХВ(/). Поведение объекта зависит от ряда неизвестных параметров, совокупность которых обозначаем через £. Задано множество S возможных значений £, определяющих класс допустимых объектов и возмущений. Задана цель управления, определяющая желаемое поведение ОУ. Требуется синтезировать алгоритм управления, использующий измеряемые или вычисляемые на основе измерений величины, не зависящие от £ е S, и обеспечивающий для каждого £ е Е достижение заданной ЦУ. Вектор неизвестных параметров £ обычно состоит из коэффициентов уравнений, составляющих математическое описание объекта, а также из коэффициентов, опре- 16*
252 Методы современной ТАУ. Часть IV деляющих изменение внешних воздействий (состояния среды). Кроме того, вектор £ может содержать абстрактные параметры, описывающие неизмеряемые возмущения, обусловленные неточностью описания ОУ. Вектор £, как правило, считается квазистационарным: постоянным или меняющимся медленно (медленнее динамических процессов в объекте и изменений внешних воздействий). В дальнейшем будем говорить, что процесс {вектор) Z рассматриваемой системы квазистационарен, если он меняется существенно медленнее остальных динамических процессов, протекающих в системе. Описанная выше задача является задачей управления в условиях неопределенности, связанной с £ е S. Задача может решаться поэтапно: вначале идентификация вектора £ , а затем определение алгоритма управления, обеспечивающего требуемое качество функционирования одним из традиционных методов. Однако такая стратегия синтеза требует дополнительного времени на изучение объекта и неприменима в нестационарных условиях. N,(0 Y(0 ОУ Обобщенный настраиваемый объект (ОНО) 1ВД Блок датчиков r^MiA^l ±$ L Регулятор 0(0 Алгоритм адаптации Алгоритм адаптивного управления Рис. 4.1. Структурная схема адаптивной системы управления Более совершенной стратегией управления является адаптивная стратегия, состоящая в одновременном изучении объекта и управлении им. Алгоритм адаптивного управления имеет двухуровневую структуру (рис. 4.1). Алгоритм 1-го уровня (алгоритм регулирования или алгоритм основного уровня) зависит от вектора параметров 0 (вектора параметров регулятора), при каждом ^ е S он должен обеспечивать достижение ЦУ при соответствующем выборе 0 = 0(£). Алгоритм 2-го уровня изменяет (настраивает) вектор 0 таким образом, чтобы обеспечить достижение ЦУ при неизвестном £ е S. Совокупность алгоритмов регулирования и адаптации называется алгоритмом адаптивного управления, а динамическая система, состоящая из объекта и устройства, реализующего алгоритм адаптивного управления, - адаптивной системой управления (АдСУ). Формализуем задачу синтеза. Пусть непрерывная динамическая система, так называемый «обобщенный объект», описывается уравнениями состояния
Глава 4. Адаптивные системы 253 X(O = F(X,Y,U,N,,$,O, (4.1) XB(O = G(X,Y,U,N2,$,O, (4.2) где FQ,GQ - известные вектор-функции; Nj, N2 - возмущения на ОУ и помехи измерений; XeRn,V eRm9Y eRr9XueRl - векторы состояния, управления, внешних входов и выходов ОУ соответственно. В уравнения (4.1), (4.2) помимо самого объекта управления могут входить математические модели исполнительных, измерительных устройств, эталонная модель и т.п. В простейшем случае цель управления задается в виде целевого неравенства д<А при t>U,A>0, (4.3) где q(t) = q(X(t), U(0) - целевая функция. В задачах слежения в качестве целевой функции выбирается функция невязки между действительной и желаемой траекторией движения объекта q = q(E(t\t), Е(/) = Х(/)-Хм(/). Желаемое поведение системы может быть задано, например, с помощью эталонной модели XM(0 = /rM(XM,Y,0, (4.4) где Хм е Rn - вектор состояния эталонной модели, Y e Rm - вектор задающих воздействий. В частном случае при Хм(/) = 0 (задача стабилизации) получается целевая функция текущего состояния объекта q = q(X(t), t). Задача синтеза состоит в нахождении алгоритма управления из заданного класса двухуровневых алгоритмов вида и(0 = i/,(X(/),u(0,e(0, Y(0), (4.5) 0(0 = 0, (Х(/),и(0,в(0, Y(0), . (4.6) обеспечивающих достижение ЦУ (4.3) в системе (4.1), (4.2), (4.5), (4.6) для каждого £>еЕ . Здесь £/,(•)> ©*(•) некоторые операторы. Если АдСУ функционирует в стохастической среде, то цель (4.3) заменяется «усредненной» целью Mq < А при t > U. (4.7) Система (4.1), (4.2), (4.5), (4.6) называется адаптивной в классе 3 по отношению к цели управления, заданной одним из неравенств (4.3), (4.7), если для любого £ е 3 и при любых начальных условиях Х(0), U(0), 0(0) выполняется соответствующее неравенство (4.3) или (4.7). Так как адаптивные системы управления отличаются от традиционных (неадаптивных) систем управления н&чичием контура адаптации, то для формулировки задачи синтеза алгоритма адаптации удобно использовать понятие «обобщенного настраиваемого объекта» (ОНО). Обобщенный настраиваемый объект включает в себя всю неизменяемую часть системы («обобщенный объект» и регулятор основного контура). В качестве входов ОНО могут выступать как настраиваемые параметры регулятора (4.5) 0(/) (см. рис. 4.1), так и входы обобщенного объекта U(f) (0(f) = U(/)), если основной контур управления отсутствует. При этом формально описание системы в форме (4.1), (4.2) или в форме (4.1) - (4.3) представляет собой систему алгебраических и дифференциальных уравнений. В первом случае задача состоит в синтезе алгоритма адаптивного управления (4.5), (4.6), а во втором случае - алгоритма адаптации (4.6).
254 Методы современной ТАУ. Часть IV В рамках приведенных выше схем можно рассматривать также нестационарные задачи, в которых вектор неизвестных параметров £ меняется во времени (£ = £(/)). При этом вектор «идеальных», с точки зрения ЦУ, параметров регулятора 0* также зависит от времени. Он должен для достижения цели «отслеживать» дрейф неизвестных параметров, приспосабливаясь к изменяющимся условиям. Ясно, что такое поведение системы возможно лишь при медленном изменении £ по сравнению с изменением состояния объекта X, когда в измерениях накапливается достаточно информации о дрейфе. При этом быстрые процессы управляются первым уровнем системы - регулятором, а медленные изменения отслеживаются вторым уровнем - адаптором. Двухуровневая система управления находится в соответствии с разделением движений объекта на быстрые {координатные) и медленные (параметрические). Предположения о медленном изменении неизвестных параметров (гипотеза квазистационарности) практически означает, что параметры объекта считаются постоянными, «замороженными». Если же скорость изменения £ сравнима со скоростью процессов в объекте и изменением внешних воздействий, то целесообразно задаваться законом дрейфа £ , а параметры закона считать новыми параметрами. Тем самым задача сводится к квазистационарной. 4.3. МЕТОДЫ СИНТЕЗА АЛГОРИТМОВ АДАПТАЦИИ Условно методы синтеза адаптивных систем можно разделить на эвристические и теоретические. В эвристических методах отсутствует строгое обоснование устойчивости адаптивной системы и, как следствие, условия применимости рассматриваемых методов. Этот подход был характерен для раннего этапа развития адаптивных систем. Теоретические (строго обоснованные) методы можно разделить на два класса: точные и приближенные. В соответствии с двухуровневой схемой адаптивной системы задача разбивается на два этапа: синтез основного контура и контура адаптации. Среди точных методов синтеза основного контура наибольшее распространение получили следующие методы: 1) метод инвариантности [11, 24], реализующий идею выбора «идеального» управления из равенства правых частей эталонной модели и модели объекта управления; 2) метод модального управления, в котором «идеальное» управление выбирается исходя из желаемых показателей качества переходного процесса; 3) оптимальный синтез, в котором решается задача оптимизации по управляющему воздействию некоторого асимптотического (при t -> оо) показателя качества. В основе приближенных подходов лежат методы декомпозиции, основанные на упрощении модели и синтезе по упрощенной модели. Для упрощения и декомпозиции используются методы теории возмущений [20, 41], методы скалярных и векторных функций Ляпунова [6, 19], линеаризация, понижение порядка, отбрасывание возмущений. Популярным является подход, основанный на выделении быстрых и медленных движений системы, при этом синтез осуществляется по модели, описывающей медленные движения. К таким методам относятся: 1) метод усреднения, начало которого было положено работами Н.М. Крылова, Н.Н. Боголюбова [16] и Б. Ван дер Поля [4]; 2) метод сингулярных возмущений. Фундаментальные результаты в этой области принадлежат Н.Н. Красовскому [12], Л.С. Понтрягину [25], А.Н. Тихонову [30] и их ученикам. Основными методами синтеза алгоритмов адаптации являются: I) градиентные методы. Алгоритм изменения настраиваемых параметров строится в направлении антиградиента целевой функции от ошибки рассогласова-
Глава 4. Адаптивные системы 255 ния. Алгоритмы требуют вычисления функции чувствительности, которая зависит от параметров объекта, что противоречит постановке задачи адаптивного управления. Это преодолевается приближенным вычислением функции чувствительности с использованием эталонной модели [24]; 2) методы, основанные на применении функций Ляпунова. Большое число алгоритмов этой группы можно получить в рамках схемы скоростного градиента [2, 33, 35, 41]. В методе используется тот факт, что градиент целевой функции близок по направлению с градиентом ее приращения по времени. Алгоритм адаптации строится в антиградиентном направлении от скорости изменения целевой функции. Метод обеспечивает существование функции Ляпунова в виде суммы целевой функции и квадрата невязки между настраиваемыми и идеальными параметрами; 3) методы, основанные на теории гиперустойчивости. Синтез контура адаптации осуществляется из условия гиперустойчивости системы с адаптивным регулятором. Сравнение методов группы 2 и 3 приведены в работе [45]; 4) методы, основанные на организации скользящих режимов. При возникновении скользящего режима система приобретает свойства инвариантности по отношению к параметрическим возмущениям и помехам. К этой группе примыкают системы с сигнальной адаптацией, полученные на основе схемы скоростного градиента; 5) методы, основанные на введении «бесконечно большого» коэффициента усиления [13, 18]. В методе используется бесконечно большой коэффициент усиления, за счет которого передаточная функция системы становится эквивалентной передаточной функции эталонной модели. Главные недостатки метода: возможная потеря устойчивости при большом коэффициенте усиления, слабая помехозащищенность. Системы, построенные на основе методов четвертой и пятой группы, часто называют системами с адаптивными свойствами, поскольку в них отсутствует контур настройки параметров. 4.4. ПОИСКОВЫЕ АДАПТИВНЫЕ СИСТЕМЫ В поисковых адаптивных системах (ПАС) выбор направления настройки параметров, обеспечивающих экстремальное значение меры качества, осуществляется на основе организации специальных поисковых сигналов. 4.4.1. Системы экстремального регулирования Простейшими ПАС являются большинство экстремальных систем. В системах экстремального регулирования инерционностью объекта часто пренебрегают, а задача состоит в «отслеживании» дрейфа экстремума статической характеристики объекта. Типовая блок-схема экстремальной системы регулирования представлена на рис. 4.2. На входы объекта подаются поисковые воздействия, и оценивается реакция на них объекта, проявляющаяся в изменении целевой функции q(t). Определяются те воздействия, которые приближают целевую функцию к экстремуму. Экстремальные системы классифицируются по способу поиска экстремума: системы с регулярным поиском и случайным поиском. К регулярным методам относятся хорошо известные методы полного перебора, Гаусса - Зейделя, градиентного поиска и их модификации. В случайных методах направление поиска ищется случайным образом. Подробнее представление об экстремальных системах можно получить из учебных пособий [1, 5] и справочников [27, 28].
256 Методы современной ТАУ. Часть IV U(t) Органы управления J N ОУ х.(/) Устройство формирования целевой функции Устройство организации поиска Я(!) Y Рис. 4.2. Структурная схема экстремального регулирования 4.4.2. Поисковые алгоритмы непрямого адаптивного управления с настраиваемой моделью Непрямое адаптивное управление предполагает решение задачи в два этапа. На первом этапе осуществляется идентификация объекта. На втором этапе - выбор коэффициентов регулятора. В поисковых системах идентификации измеряются входные и выходные сигналы объекта, но, в отличие от беспоисковых систем, ведется активный поиск, сопровождающийся испытаниями адаптивной модели по параметрическим каналам. При этом расширяются границы работоспособности систем идентификации с адаптивной моделью. При неполной структурной адекватности модели и объекта, при воздействии на объект случайных возмущений, при сильном отличии в начальных значениях параметров настраиваемой модели от параметров объекта возможно существование множества экстремумов целевой функции по настраиваемым параметрам. В этих условиях беспоисковые алгоритмы идентификации часто оказываются неработоспособными. В основе поисковых систем могут использоваться простейшие методы поиска экстремума, начиная от простого перебора параметров и кончая градиентными методами, а также их комбинации. Общая структурная схема поисковой идентификации представлена на рис. 4.3. Задачей алгоритма поисковой настройки является изменение параметров модели 0М таким образом, чтобы минимизировать целевую функцию невязки q(E). Рассмотрим подробнее непрерывный градиентный алгоритм идентификации с синхронным детектированием [28]. Пусть объект и модель описываются уравнениями состояния X = F(X>Y,e>/,N1), XB=G(X,Y,0 + N2, (4.8) XM=FM(XM,Y,0M,O, XBM=GM(XM,Y,0, (4.9) где X e Д\ XM e #", XB e /?', Хвм е #', 0 e Rm, 0M efjef - векторы состояний, выходов, параметров и входов объекта и модели соответственно; Nl9 N2 - векторы возмущений и помех измерения. Целью идентификации является минимизация целевой функции q(E) невязки ' Е = ХВ-ХВМ. (4.10)
Глава 4. Адаптивные системы 257 —Ли —N-Ji—, + г* X = F(X,Y,©,/,N,) X G(X,Y,/,N2) Объект управления Алгоритм поисковой настройки 4- КгЗг ,<7(Е) Вычисление целевой функции т 0. XM=FM(XM,Y,0M,') Gm(Xm,y,o *в.м I | Настраиваемая модель Рис. 4.3. Структурная схема системы поисковой идентификации Предполагается, что #(Е) - выпуклая, положительно определенная функция, а настраиваемая модель - наблюдаемая, так что известны текущие значения Хм, Хм, €>м. Настройку параметров модели будем осуществлять в направлении антиградиента целевой функции eM=-rVQug(E)9 (4.11) где Г = Гт>0 - тхт матрица коэффициентов усиления, V0 ff(E) = - V ^м ) градиент целевой функции по параметрам модели. Для осуществления градиентного метода необходимо определить а?(Е)= дд(Е) dGM dXM 50М 5Е 'дХм'дем ' Основная трудность в вычислении правой части уравнения (4.12) состоит в нахожде- нии ——. Добавим к вектору параметров 0М малую высокочастотную центрированную составляющую 50М (0. При этом уравнение модели в вариациях будет иметь вид (4.12) дК 5F. м 5ХМ м Э0М м (4.13) Пусть поисковый сигнал 80М является быстроменяющейся вектор-функцией по сравнению с собственными движениями модели и движением, порожденным внешним воздействием Y(/) (т.е. процесс Х(0 считается квазистационарным). Тогда вариацией 5Хм(0 можно пренебречь ввиду ее малости по отношению к 80М, так что будет справедливо приближенное равенство
258 Методы современной ТАУ. Часть IV или в операторной форме 5ХМ«|^50М (4.14) 8Х«*-рШ;т»> (4Л5) где p-dldt - символ дифференцирования по времени. Из соотношения (4.15) при квазистационарном режиме получаем д&и* Рд&м' причем для достаточно высокочастотного поискового сигнала 80М приближенное равенство можно заменить строгим. С учетом (4.16) уравнение (4.12) принимает вид д&м дЕдхм(рдему Для вычисления (1//?)(9FM/50M) применим процедуру синхронного детектирования. Умножим выражение (4.15) справа на 80^ и усредним полученное уравнение по некоторому скользящему интервалу времени 1 dFM где 5ХМ(50М)Т = ^-80м(50м)\ (4.18) 5ХМ(50М)Т=Д } 8Хм(т)(80м(т))Т</т. t-T Учитывая квазистационарность настройки модели, получаем 5ХМ(50М)Т=~^-50М(5ОМ)Т. (4.19) Пусть поисковые сигналы выбираются из условия невырожденности матрицы 80М(80М)Т. Тогда алгоритм настройки параметров (4.11) с учетом (4.17), (4.19) принимает вид 0М = г{80м(50м)Тр60M(5XH)T^^J . (4.20) Структурная схема системы идентификации представлена на рис. 4.4. Заметим, что термин синхронное детектирование связан с изменением вариации 8ХМ(/) синхронно изменению вариации 80М (поисковых сигналов) согласно равенству (4.15) при достаточно высокочастотном сигнале 80М, а также с возможностью детектирования (выделения) градиента на основе измеряемых величин путем их усреднения (сравните (4.11) и (4.20)). Условия применимости алгоритма: 1) целевая функция q(E) - положительно определенная и выпуклая по Е; 2) отличие структуры модели объекта, а также начальное рассогласование векторов 0 и 0М обеспечивают единственное значение экстремума целевой функции;
Глава 4. Адаптивные системы 259 3) поисковые сигналы 8@м - малы и центрированы, удовлетворяют условию квазистационарности процесса Хм(0 и невырожденности матрицы 80М(50М) . j> X Л X = F(X,Y,e,/,N,) 0м + 50. XM = FM(XM,Y,0H,O GM(XM,Y,0 Рис. 4.4. Структурная схема поисковой системы с градиентным алгоритмом Замечания: 1) В случае многоэкстремальности целевой функции целесообразно использовать градиентный метод в сочетании с другими методами поиска, например, со случайным поиском района главного экстремума. 2) Условие невырожденности матрицы 8@М(80М) , в частности, выполняется для ортогональных функций, обладающих свойством 5©H(50M)T=diag80M(50M)T. К таким функциям, например, относятся периодические сигналы с различными частотными компонентами, функции Уолша и т.п. 3) Вычислительные затраты при реализации алгоритма могут быть сокращены за счет вычисления матрицы 80М(80М) заранее на стадии проектирования, а также при аналитическом раскрытии матрицы столбца — 4) Процедура усреднения типа скользящего среднего может быть заменена усреднением в любом линейном фильтре низких частот, а с учетом наличия в алгоритме блока интегрирования Tip может быть и вовсе опущена. Пример 4.1. Пусть объект управления описывается передаточной функцией вида
260 Методы современной ТАУ. Часть IV где к - коэффициент усиления, а - неизвестный параметр. Провести идентификацию параметра а методом синхронного детектирования, считая, что на объект действует задающее воздействие у = sin(/),& = 2 , а выход измеряется с аддитивной помехой г| в виде центрированного случайного стационарного процесса с нормальным распределением. Выберем настраиваемую модель в виде звена первого,порядка где 6 = 6(/) - настраиваемый параметр. Пусть на вход модели поступает измеряемое задающее воздействие у с аддитивной помехой г| в виде центрированного случайного стационарного процесса с нормальным распределением. Целью управления будем считать синтез алгоритма настройки параметра 6 , обеспечивающего минимизацию целевой функции q = e2, где е = х-хм - рассогласование между выходами объекта и настраиваемой модели. Выберем в качестве поискового сигнала высокочастотный, по сравнению с задающим воздействием, сигнал вида 60 = 0,lsin(200/). Тогда в соответствии с (4.20) алгоритм идентификации будет иметь вид 582 где б92 = 200 - заранее вычисленное значение для заданного поискового сигнала. Структурная схема системы идентификации приведена на рис. 4.5, а. Результаты моделирования при разных значениях дисперсии помехи Эц - 0; 0,1; 0,3 приведены на рис. 4.5, б - г соответственно. х = -Зх + 2у бб&х Генератор поисковых сигналов 56 х = -Qx + 1у 0(')f e. 02040608 1 12141618 2 22242628 3 г02Ь'40 60в 112141618 22 22 42 62 8332 Рис. 4.5. Структурная схема и результаты моделирования
Глава 4. Адаптивные системы У 1 12- 1- 08 Об 04 1 ill 11 I .и JulUJkii Jr PL . iNF1 ]Ши IjJJ'1 Ж\ 0 2-||И \Щ1 W Л J02040608 1 12141618 2 22242628 З"1' -0 2: i 8(0 - 36 34 32 3 28 26 24 22 2 18 16 1 4 12 1 08 * 06 L 04 261 \ /^\ \ / ^\. I 1 1 1 / / 1 I I I 1 1 у t Ь20'40б6в 1 121 41618 2 222*42628 3 32 ^ 0 20 40 60 8 1 12141618 2 22242628 3 32 Рис. 4.5. Структурная схема и результаты моделирования (окончание) В заключение следует отметить, что, несмотря на очевидные преимущества поисковых алгоритмов, их реализация намного сложнее, чем беспоисковых алгоритмов адаптивного управления, т.к., по крайней мере, требует наличия генератора поисковых сигналов. 4.5. БЕСПОИСКОВЫЕ АДАПТИВНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ Выше подчеркивалось, что динамика контура самонастройки (адаптации) существенно влияет на общую динамику СНС. Поэтому синтез неразрывно связан с обеспечением устойчивости замкнутого объекта с контуром адаптации. 4.5.1. Синтез адаптивной системы методом функций Ляпунова Метод функций Ляпунова является одним из основных методов исследования устойчивости и качества движения нелинейных систем, описываемых обыкновенными дифференциальными уравнениями. Метод нашел глубокое и эффективное приложение к проблеме синтеза адаптивных систем управления. Поясним идею применения метода функций Ляпунова на примере синтеза алгоритма адаптивного управления для линейного стационарного объекта управления [46]. Постановка задачи. Пусть объект управления (ОУ) описывается уравнением состояния:
262 Методы современной ТАУ. Часть IV X = AX(f) + BU(f), (4.21) где XeR" - вектор состояний ОУ; UeRm - вектор управления; А,В- пхп и п х т постоянные матрицы параметров ОУ. Предполагается доступность измерению всего вектора состояния ОУ, так что Х. = Х(/). Рассмотрим задачу обеспечения ОУ желаемой динамики, которую зададим с помощью эталонной модели Хм=АмХм(0 + Вм*(0> (4.22) где Хм е Rn -вектор состояния эталонной модели, Y(/) e Rm -задающее воздействие. Выбор эталонной модели зависит от требований, предъявляемых к замкнутой системе (времени переходного процесса, перерегулирования, астатизма и т.д.). При этом, естественно, она должно быть устойчивой, т.е. матрица Ам - гурвицева. Будем считать, что вектор параметров £ ОУ, состоящий из коэффициентов матриц А, В, заранее не определен. Известно лишь, что % е S. Множество S можно задать, например, с помощью максимальных и минимальных значений, которые могут принимать параметры ОУ в зависимости от условий изготовления и функционирования. Формализуем цель управления (ЦУ), потребовав, чтобы ШпЕ(0 = 0, (4.23) /-»оо где Е(/) = Х(/)-Хм(/) -ошибка системы (4.21) и (4.22). Таким образом, в соответствии с ранее рассмотренной классификацией ставится задача построения СНС с явной эталонной моделью. Решим задачу на основе прямого адаптивного подхода. В соответствии с двухуровневой структурой СНС будем решать задачу в два этапа: построение основного контура и синтез контура адаптации. Синтез основного контура. Задача решается в предположении, что параметры ОУ известны. Для получения структуры «идеального» регулятора запишем уравнение в отклонениях E(0 = AME(0+(A-AH)X(/) + BU(/)-BMY(/). (4.24) Потребуем выполнение условия разрешимости уравнения (A-AM)X(/) + BU(f)-BMY(/) = O (4.25) относительно U, e Rm при любых X е Rn, Y e Rm . При этом уравнение (4.24) будет иметь вид Ё = А„Е(0, решение которого асимптотически устойчиво в силу гурвицевости матрицы Ам, и, следовательно, в идеальных условиях ЦУ (4.23) достигается. Идеальное управление, удовлетворяющее соотношению (4.25), описывается уравнением U.(0 = K?X(/) + K.YY(0, которое можно записать в форме U+(0 = K+YK+xX(0 + K+YY(0, (4.26) где К^,кУ,К^,кУ - матрицы идеальных коэффициентов регулятора, удовлетворяющие уравнениям:
Глава 4. Адаптивные системы 263 ВК,Х=АМ-А, BK+Y=BM, ВМК* = Ам — А, ВК+ = Вм . (4.27а) (4.276) Условия (4.27) часто называют условиями согласованности модели и ОУ, и они определяют возможность решения поставленной задачи в условиях точного знания параметров ОУ. Заметим, что в соответствии с (4.27) матрицы идеальных коэффициентов регулятора зависят от конкретных параметров ОУ £ е Е. Поэтому в ситуации неопределенности параметров ОУ целесообразно настраивать матрицы коэффициентов регулятора для достижения в системе ЦУ (4.23). Выберем структуру основного контура в соответствии с (4.26) в виде u(0 = ky(0kx(/)x(0+ky(/)y(0, (4.28) где Kx(f),KY(/) - матрицы настраиваемых коэффициентов регулятора. Подставляя (4.28) в уравнение (4.24), получаем описание обобщенного настраиваемого объекта (ОНО), состоящего из ОУ (4.21), модели (4.22) и регулятора основного контура (4.28), в форме e(0 = ame(/)+bm(kx(/)-k<x)x(0+bm[(k.v)"'ky(0-i]x x(kx(/)X(/) + Y(/))=AhE(/)+ (4.29) +BII[o(/)x(0+'r(0Kv(0(v(0+Kx(0x(0)]. где 1-тхт единичная матрица, Ф(/), Ч*(0 - матрицы отклонений коэффициентов регулятора от «идеальных» значений ф(0 = кх(г)-к?, ч»(/) = (кГ)"'-(ку (/))"'. (4.зо) Структура ОНО показана на рис. 4.6. *м=Амхм+Вмг 5) N кг(0 U х - Ах + Ви кх(0 X Ч| Рис. 4.6. Структурная схема обобщенного настраиваемого объекта Синтез контура адаптации. Для синтеза алгоритмов настройки матриц Кх (/) и KY (/) запишем уравнение ОНО (4.29) в виде Ё(/) = АмЕ(/) + Вмв(/)2:(/)> (4.31) где 0(/) = (Ф(/):|Р(/)) - расширенная матрица отклонений настраиваемых коэффициентов от их «идеальных» значений,
264 Методы современной ТАУ. Часть IV е(')ш[к*(о[у(О+к»(г)х(о1) - р х 1 вектор сенсоров (вектор, элементы которого являются измеримыми или вычислимыми на основе измерений функциями), р = п+т. Рассмотрим в качестве претендента на роль функции Ляпунова квадратичную скалярную функцию вида F = O,5ETHE + O,5tr(0Tr~l0), Н = НТ, Г = ГТ. (4.32) Здесь trD означает сумму элементов главной диагонали матрицы D (след матрицы). Определим производную функции (4.32), используя уравнение ОНО (4.31) V = ЕТНЁ + tr ((-^Г1©) = ЕТНАМЕ + ЕтНВм0£ + tr (в7!4"1©) = = ЕТНАМЕ + trNB7HE2:T + Г"1©)1 ©1 Нетрудно заметить, что если алгоритм адаптации выбрать в виде 0 = -ГВ7НЕ2Т (/), Г = Гт > 0, (4.33) то функция V обладает свойствами V>0 и F<0, т.е. является функцией Ляпунова. Последнее утверждение следует из гурвицевости матрицы Ам, для которой в силу леммы Ляпунова существует Н = Нт > 0 , удовлетворяющее матричному уравнению A7H + HAM=-Q, Q = QT>0, и,следовательно, F = -0,5ETQE. (4.34) Таким образом, система (4.31), (4.33) устойчива и в силу (4.34) ЦУ E(f) -> 0 при t -» оо достигается. Так как V (4.34) не содержит в явном виде настраиваемых параметров, то из приведенных рассуждений следует лишь ограниченность матрицы 0 . Условия идентифицируемости. Усилим задачу, потребовав, чтобы адаптивная система (4.31), (4.33) была асимптотически устойчивой, т.е. выполнялось НтЕ(/) = 0, ^°° /ч (4.35) lim 0(0 = 0. Последнее условие эквивалентно требованию Кх(/)->К?, К¥(/)->кУ при *->оо, что означает наделение алгоритма (4.33) идентифицирующими свойствами. Предположим, что компоненты вектора Е(/) - ограниченные функции времени. Тогда из устойчивости системы (4.31), (4.33) и Е(/) = 0 при t -> оо следует lim 0(0 = lim (-ГВМЕ2Т )= 0 и, следовательно, 0да = lim 0(0 - постоянная матрица. Рассмотрим траектории, вдоль которых V = 0 или Е = 0 . Из (4.31) получаем
Глава 4. Адаптивные системы 265 Ви0„Щ = О. (4.36) Пусть Вм - матрица полного ранга, тогда из (4.36) следует тождество е„Щ = о. (4.37) Обозначим 0, - вектор-столбец матрицы 0да и а, - элемент вектора £ . Это позволяет переписать (4.37) в виде Z®,a,(0 = 0. (4.38) Предположим, что £(/) - периодический вектор (£(/) = £(/ + Г)), элементы которого являются сигналами с различающимися частотными компонентами. Это означает, что а, (/) - линейно независимые функции времени. При этом уравнение (4.38) имеет только тривиальное решение 0,=О, / = 1,2,...,/?, так что 000=0. Таким образом, в предположении периодичности вектора £(/) из Е = 0 следует 0 = 0. Проведенный анализ устойчивости позволяет сформулировать следующую теорему. Теорема 4.1. Пусть пхп матрица Ам является устойчивой, пхт матрица Вм - полного ранга, Г = Гт>0 - тхт матрица, Н = НТ - пхп матрица, удовлетворяющая уравнению Ляпунова А^Н + НАМ = -Q, Q = QT > 0, (4.39) и Е(/)-рх1 вектор ограниченных функций. Тогда система [п + тр) дифференциальных уравнений (4.31), (4.33) Ё = АмЕ + ВмО(02(0> 0 = -ГВ^НЕ(/)2(/)Т устойчива и Е(/)-»0 при /-»оо. Более того, если р компонент вектора £(/) - сигналы с взаимно различными частотными компонентами, то система (4.31), (4.33) асимптотически устойчива в целом. Таким образом, теорема 4.1 сводит задачу синтеза адаптивной системы управления к конструированию структуры основного контура, обеспечивающего приведение описания ОНО к виду (4.31) и использованию для настройки неизвестных параметров регулятора (или самого ОУ) алгоритма (4.33). При этом в вектор сенсоров £(/) должны входить лишь измеряемые или вычисляемые на основе измерений ограниченные функции времени, а матрицы Ам, Г, Н удовлетворять условиям теоремы. Для реализации алгоритма адаптации следует записать уравнение (4.33) в терминах матриц настраиваемых коэффициентов KX(/),KY(/). Для этого достаточно представить Г в виде О где Г, = ГJ > 0 - квадратные матрицы соответствующих размеров. При этом система (4.33) записывается в виде
266 Методы современной ТАУ. Часть IV Ф = -Г,В^НЕ(0Хт(0, Ф = -Г2В£НЕ (/) (Y+К ХХ )Т (к v )T. Используя равенства (4.30), с учетом К? = 0, К^ = 0 получаем Кх(/) = -Г,вЗ;НЕХт(/), ky (t)=-к¥г2в^не (y+кхх)т (ky )t ky. Структурная схема адаптивной системы ((4.31), (4.33)) с учетом структуры ОНО (4.40) (рис. 4.6) приведена на рис. 4.7. Y *2_ ОНО ky(0 Кх(0 К = -Г.В/.НЕХ Е? 3^ .=-=.Y__V /.ttlV\T_—i KY = -KYr2B^HE(Y+Kxx) (KY) К Рис. 4.7. Структурная схема адаптивного управления линейным ОНО Пример 4.2. Пусть объект управления описывается моделью вида Х = АХ + Ви, . , ГО П ЛЛ где X е R , и € R ; А = , В = ; а0, at, Р - неизвестные параметры. Требуется синтезировать алгоритм адаптивного управления, обеспечивающий достижение близости траекторий замкнутой системы и эталонной модели, т.е. ЦУ: X - Хм -* 0 при / -> оо. Зададим структуру эталонной модели в виде уравнения состояния ХМ = АМХМ + ВМ^, где Хм е R2, у е R1; Ам в , Вм = ; aQ , ах, b - параметры эталонной модели. \а0 ах) \Ь) Параметры эталонной модели выберем исходя из желаемого расположения полюсов замкнутой системы A,J=-1, Л.2 =-2 так, что s2-als-aQ=[s-\\Ms-'k2) - характеристическое уравнение эталонной модели. Получаем я, = -3 , а0 = -2 . Значение b выберем равным 2. При этом статическая ошибка эталонной модели будет равна нулю. Этап 1. Синтез алгоритма основного контура управления. Проверим условия согласованности модели объекта управления и эталонной модели (4.276) в£'=вм, ВМК* =Ац~*А. Очевидно, что условия выполнены при любых параметрах объекта и эталонной модели (р * 0, h*Q). Идеальное управление выберем в форме (4.26) и.(() = кУ[кЩ)+у(1)], где k? щ 6/Р» *i* = (ао ~ ао )/Ь, к\ = («1 - Щ )/b - «идеальные» параметры регулятора (к? = [к\ к\)), Заменяя «идеальные» параметры регулятора настраиваемыми, получаем алгоритм основного контура управления в виде
Глава 4. Адаптивные системы 267 «(О = *ЧО[(М'М')+Ы'М'))+>(')]- Этап 2. Синтез алгоритма адаптации. Алгоритм настройки параметров регулятора выберем в виде (4.40) при Г, = у,1, у, > 0, у2 > 0 к*=-У1(о б)н(*'~*ык *2)> \x2~X2mJ F = -y2(P)3(0 *)н(* "*"](,-+*,*.+*Л). . \Х2 Х2гл) где Н = Нт > 0 - 2x2 матрица, являющаяся решением уравнения Ляпунова для эталонной модели: HAM+Aj,H = -G, где G = GT > 0 . (4 0\ Выбирая G = , получаем Н -- 4з ' 1 1 г) Таким образом, алгоритм адаптации имеет вид *i=-Y|8(')*i('). *2s-Y|8(0*2(0. ^—Yi8WH0 + *ix(0*iW + *2X W*2W)^W. 8(0 = 2е,(0 + 4е2(0А где et =Jf,(/)~Jf/.M , Y2=Y2*(^) >0 " коэффициент усиления, введенный для упрощения реализации алгоритма (при этом антиградиентное направление настройки ку не меняется, а изменяется лишь ее скорость). 01 2 4 6 8 10 12 14t16 18 20Й 24 26 28 30 Л V ib f 2t) 3d к/ * t 40 * 10 kv Рис. 4.8. Результаты моделирования (пример 4.2)
268 Методы современной ТАУ. Часть IV Результаты моделирования системы адаптивного управления при ао = -1, а, =1, р = 1, у, =5, у2 = 10 , нулевых начальных условиях для эталонной модели и объекта и начальных условиях алгоритма адаптации к\0' = 0, к\°' =0, ... , Р(0) = 1 ... приведены на рис. 4.8. Соответствующие значения идеальных коэффициентов регулятора основного контура равны к/ - 2, к\ - -0,5 , к*2 = -2 . В качестве заданного входного воздействия был выбран меандровый сигнал у - 0,5(l+sign(sin((rc /)/б))), обеспечивающий алгоритму адаптации дополнительные идентификационные свойства. 4.5.2. Схема скоростного градиента Многообразие структур объектов и целей управления, возможность широкого выбора структуры основного контура даже при использовании квадратичных форм функции Ляпунова порождает целый спектр алгоритмов адаптации. Для каждого из этих алгоритмов, подобно теореме 4.1, должны быть сформулированы условия применимости, обеспечивающие достижение поставленной ЦУ и устойчивости системы адаптивного управления. Обоснование работоспособности алгоритмов, как было показано в предыдущем параграфе, - задача не простая, а изобилие теоретических выкладок затрудняет их использование в инженерной практике. Представляется разумным иметь методы или схемы синтеза, позволяющие для конкретной ЦУ с учетом специфики ОУ осуществлять выбор алгоритмов адаптации из некоторого семейства (класса) алгоритмов и путем проверки выполнения заранее оговоренных условий доказывать их работоспособность. К таким методам относится схема скоростного градиента, в основе которой лежит идея настройки параметров в направлении, противоположном скорости изменения целевого функционала вдоль траектории ОНО. Эта идея принадлежит А.А. Красовскому [14, 15], который для задачи идентификации с адаптивной моделью установил общий вид алгоритма адаптации, оптимального по критерию обобщенной работы. Оптимальный алгоритм описывается функциональным рядом и в чистом виде не реализуем. Однако в первом приближении он совпадает с хорошо известными беспоисковыми градиентными алгоритмами. Если взять второе приближение и предположить высокочастотность входного сигнала и квазистационарность процесса настройки, то получается семейство алгоритмов скоростного градиента. Обоснование алгоритмов скоростного градиента, их модификации, способы огрубления, обеспечивающие сохранение работоспособности при аддитивных и мультипликативных шумах, а также дискретизации алгоритмов управления для нестационарных ОУ, наличия фазовых ограничений, сингулярных возмущений рассматривались в работах А.Л. Фрадкова [2, 7, 33, 35, 37, 39,40,41]. Алгоритмы скоростного градиента и условия их применимости Вернемся к постановке задачи, описанной в §4.2. В предположении измеряемости компонент вектора состояния (ХВ(/) = Х(/)), отсутствии внешних возмущений (Nj, N2 =0) и с учетом структуры основного контура (4.5), обобщенный настраиваемый объект (ОНО) описывается дифференциальным уравнением вида X = F(X,0($),;), (4.41) где Xе R" - вектор состояния ОНО, 0е/?т° - вектор входов (вектор настраиваемых коэффициентов регулятора). Будем предполагать, что вектор-функция F(-) непрерывна по X, 0, t и непрерывно дифференцируема по 0 , а ЦУ задается целевым неравенством (4.3) q < А при t>U, А>0, где q -локальный q = q(X{t),t) или интегральный
Глава 4. Адаптивные системы 269 q = \q(X(s)>&{s),s)ds О целевой функционал (#(•) - скалярная функция). Алгоритмом скоростного градиента (АСГ) называется правило изменения вектора 0 , задаваемое уравнением адаптера вида -* У; ;; = -rV0co X, 0, t), (4.42) at где Г = Гт > 0 - mQxmQ матрица коэффициентов усиления, o(X,0,O = ^ + Vx<7TF(X,0,O ot - для локального функционала и а>(Х,в,/) = ?(Х,в,/) - для интегрального функционала представляет собой полную производную функционала по времени в силу траектории системы (4.41), v|/(X, 0,/) - некоторая вектор-функция, удовлетворяющая условию псевдоградиентности V|/(X,0,/)T.V0co(X,0,/)>O. (4.43) Это условие эквивалентно требованию, чтобы угол ф между векторами v|/() и со(-) лежал в пределах от — до — (см. рис. 4.9). V0co(X,0,/) Рис. 4.9. Геометрическая интерпретация условия псевдоградиентности Условие (4.43) выполняется, например, если V|/(X, 0, /) = Г,У0со(Х, 0, /), (4.44а) или V (X, 0, /) = r2sign (V0co (X, 0, /)), (4.446) где Г, =Г^ >0 (/ = 1,2) - твхтд матрицы, причем Г2 -диагональная, sign(V0co(-)) - вектор, состоящий из знаков компонент вектора Veco(). Условия применимости АСГ (4.42) для локального и интегрального целевого функционала даются соответственно теоремами 4.2,4.3 [2]. Теорема 4.2. Пусть целевой функционал локальный и выполнены условия: 1) Условие разрешимости. Для любого PeRm0 существует единственное решение 0 = Ф(Х,Р,/) уравнения 0 + v|/(X,P,/) = P. 2) Условие локальной ограниченности. Функции F(X, 0, t), Vxq(X,t), vj/(X, 0, /), V0co(X, 0, /) локально ограничены равномерно по t, т.е. для любого Р>0 существует c(fi) такое,что
270 Методы современной ТАУ. Часть IV |f(x, ©, oHlvx<Kx> ОНИ*, ®, ОНК0^®, Oil £ *(р) в любой области {(X, 0, /): ||х|| + ||е| < р, / > 0}. 3) Условие роста. Функция q(X,t) - неотрицательная, равномерно непрерывная в любой области {(X, t): ||х|| < р, f > 0} и удовлетворяет соотношению inf q(X, t) -> +оо при ||Л1| -> оо . (4.45) 4) Условие выпуклости. Функция о)(Х, 0, t) - выпуклая по 0 е Rm, т.е. для любых 0,0, X, t выполнено неравенство со(х, 0, /)-со(Х, 0, t) >(0-0)Т У0ю(Х, 0, t). (4.46) 5). Условие достижимости. Существует вектор 0*€Лтв и функция р(^)>0 при q > 0, такие, что для любых X, t о)(Х,0„/)<-р(<7). (4.47) Тогда все траектории системы (4.41), (4.42) с начальными условиями го множества По = {(Хо, ©о): (lMe -Г+Г)(0о -0.) = О} ограничены и #(Х(/), /)-> 0 при t -> оо , т.е. достигается цель управления (4.3) при любом Д>0. Теорема 4.3. Пусть целевой функционал - интегральный и выполнены условия разрешимости, ограниченности функций F(X, 0, t), V0co(X, 0, t), Ф(Х, Р, t\ роста и выпуклости теоремы 4.2. Пусть, кроме того, существует вектор 0* е Rm* , такой, что ю(Х,0*,/)^О (4.48) (условие достижимости для интегрального целевого функционала). Тогда при любых Х(0), 0(0) в системе (4.41), (4.42) достигается цель управления (4.3) при A = ^(Xo,O) + O,5||0o-0.-v|/(Xo,0o,O)|2r+. В теоремах приняты обозначения: I n ||Х|| = J^xf - евклидова норма вектора X е R" ; |Х||А = VXT АХ - норма, порождаемая матрицей А ; А+ - матрица псевдообратная кА1; 0О = 0(0) - начальные условия. Доказательство теорем 4.2, 4.3 проводится с использованием функций Ляпунова вида F(X, 0, 0 = <7(Х,О+О,5||0-0,|р • (4.49) 1 Вещественная матрица А+ размера тхп называется псевдообратной или обобщенно обратной для матрицы А размера их/я, если выполняются условия АА+А = А, A+=UAT = ATV, где U,V - некоторые матрицы.
Глава 4. Адаптивные системы 271 В частности, это означает, что алгоритм адаптации, при