Текст
                    САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Г. А. Леонов
ВВЕДЕНИЕ В ТЕОРИЮ
УПРАВЛЕНИЯ
Издательство С.-Петербургского университета
2004


УДК 62-50 ББК 22.2 Л47 Рецензенты: д-р физ.-мат. наук, проф. А.Х.Гелиг (Санкт-Петербургский государственный университет), канд. физ.-мат. наук, проф. А. В. Морозов (Санкт-Петербургский военно-транспортный университет ЖДВ РФ) Печатается по постановлению Редакционно-издательского совета математико-механического факультета С.-Петербургского государственного университета Леонов Г. А. Л47 Введение в теорию управления. —СПб.: Изд-во С.-Петерб. ун-та, 2004. —218 с. ISBN 5-288-03467-2 Книга предназначена для первоначального изучения теории управления. В ней излагаются основные понятия и методы классической теории управления. В книге показано, как проблемы анализа и синтеза конкретных систем управления являлись мотивацией к созданию математического аппарата, с помощью которого решались эти проблемы. Книга предназначена для студентов и аспирантов университетов, изучающих теорию управления. Для преподавателей, разрабатывающих новые курсы по теории управления. Библиогр. 464 назв. Ил. 107. ISBN 5-288-03467-2 © Г. А. Леонов, 2004
ВВЕДЕНИЕ Какую книгу выбрать в качестве учебного пособия по курсу "Теория управления"? В настоящее время имеется много прекрасных книг по теории и практике управления (см. библиографию): от абстрактных, аксиоматических описаний [124] до наставлений по корабельной автоматике для офицеров Военно- морского флота [28] и справочников по элементной базе систем автоматики [296-299]. Лектору остается лишь "самая малость": отобрать нужный материал и "втиснуть"его в ограниченный объем курса. Однако потом оказывается, что этот материал нужно существенно переработать, чтобы он был усвоен студентами. В результате такой работы и появилась эта книга. При этом автор руководствовался следующими общими принципами. 1). Любая содержательная теория возникает в результате успешного решения ряда конкретных задач. Поэтому очень важно продемонстрировать такие задачи, методы их решения и дальнейшие обобщения этих методов, которые и составляют основу теории. В теории управления такими задачами были: исследование регулятора Уатта; создание авторулевых, автопилотов и систем ориентации космических аппаратов; задачи управления электрическими машинами и электронными генераторами; проблемы управления численностью популяций. Этот перечень можно продолжить, добавляя много интересных и важных задач, которые решаются сегодня и ждут своего решения в будующем. 2). В любой содержательной прикладной теории имеется следующая последовательность действий. Вывод математической модели с обсуждением принятой идеализации, разработка и применение математических методов (аналитических и численных; точных и приближенных; компьютерного моделирования), обсуждение и применение полученных результатов для реальной системы. 3
Такая последовательность должна постоянно демонстрироваться при обучении. Особенно по математичиским специальностям, где основное содержание курсов традиционно строится по схеме "определение - теорема - доказательство". 3). Необходимо учитывать уровень подготовки студентов. В связи с тем, что год от года выше он не становится, желательно пользоваться только наиболее важными и стандартными фактами из курсов алгебры, математического анализа, дифференциальных уравнений, механики и физики. Теорию оптимального синтеза, где необходимо знание фукционального анализа и случайных процессов, желательно выделить в отдельный курс, читаемый на более старших курсах. Современный студент может быстро освоить большой объем учебного материала в двух случаях: если он уверен, что ему это будет полезно в дальнейшем и если это ему просто интересно. В первом случае важно демонстрировать универсальность вводимых понятий и инструментов: свертки, преобразований Лапласа и Фурье, передаточных функций и частотных характеристик. Во втором - очень важен отбор материала из различных предметных областей теории управления. Используя изложенные принципы, по инициативе В.А.Якубовича, я начал читать с 1999 года курс "Теория управления "для студентов второго курса (четвертого семестра) математико-ме- ханического факультета Санкт-Петербургского государственного университета, обучающихся по специальности "Прикладная математика и информатика". Различные варианты моего курса были опубликованы в учебных пособиях [164, 422]. Поскольку книга [164] стала библиографической редкостью, здесь представлен ее новый, переработанный и дополненный вариант. Здесь дан расширенный список книг по различным направлениям теории управления, использование которых позволяет ввести в преподавание как классические так и новые понятия, 4
идеи, методы и результаты. Поэтому предлагаемая вниманию книга может быть полезной для разработки новых курсов по теории управления и смежным специальностям. Однако прежде всего она предназначена для студентов и аспирантов, впервые знакомящихся с очень увлекательной областью науки - теорией управления. Содержательные советы рецензентов книги - А.Х. Гелига и А.В. Морозова - существенно улучшили содержание многих разделов книги. Я благодарен Л.П. Виноградовой, Ю.К. Зотову и С.Н.Пакши- ну за подготовку рукописи к печати. leonov@math.spbu.ru Петербург май 2004 г.
Глава 1 РЕГУЛЯТОР УАТТА И МАТЕМАТИЧЕСКАЯ ТЕОРИЯ УСТОЙЧИВОСТИ ДВИЖЕНИЯ § 1.1. Регулятор Уатта и его модификации Первым технически важным управляющим устройством был регулятор Уатта. Он был изобретен английским механиком Джеймсом Уаттом и предназначен для обеспечения постоянной угловой скорости вращения вала некоторой машины (классической паровой машины, паровой или гидравлической турбины, дизельной установки т.д.). Принципиальная схема такого регулятора приведена на рис. 1.1. Рабочее вещество (пар, вода, дизельное топливо) поступает по трубопроводу, снабженному заслонкой. Это рабочее вещество, поступая в машину, создает вращающий момент F для вала У, на котором расположен регулятор Уатта. Например, в случае паровой турбины струя пара воздействует на турбинные лопатки, насаженные на вал У, и создает тем самым силовой момент F. Если обозначить через ω(ί) угловую скорость вращения вала У, то можно записать уравнение, связывающее силовой момент F и угловую скорость ω(ί) следующим образом: 6
Здесь J — момент инерции вращающегося твердого тела V (в случае турбогенератора это вал и жестко связанный с ним ротор электрического генератора). Мы пренебрегаем здесь массами, сосредоточенными в регуляторе Уатта, — они очень малы Центробежный регулятор Рабочее вещество Трубопровод Рис. 1.1 по отношению к J. Заметим, что уравнение (1.1) хорошо известно в теоретической механике, а определение моментов инерции является одной из прикладных задач интегрального исчисления [331]. Силовой момент G состоит из полезной нагрузки и момента сопротивления. Например, на электростанциях момент G формирует мощность электрической сети. Регулятор Уатта служит для поддержания заданной угловой скорости ω{ί) = ωο. Например, для турбогенератора это очень важное условие: частота переменного тока в сети совпадает с частотой с^о- Регулятор Уатта представляет собой часть вала У, на верхнем конце которого шарнирно закреплены два одинаковых стержня 1\ и /2 с одинаковыми грузами на концах. Эти стержни соединены дополнительными шарнирами так, что отклоняться 7
от вертикального положения они могут на один и тот же угол φ, находясь в одной и той же вертикальной плоскости, проходящей через вал V. Когда стержни 1\ и 1^ отклоняются от своего вертикального положения на угол <р, они при помощи шарниров приводят в движение муфту М, надетую на стержень V. Работа регулятора осуществляется следующим образом. Если значение ω{ί) превышает и>о, то центробежная сила и, следовательно, угол φ{ί) велики настолько, что муфта находится достаточно высоко, чтобы позволить заслонке опуститься в трубопровод и отсечь излишнюю часть поступающего рабочего вещества. Уменьшение объема рабочего вещества, поступающего в машину, приводит к уменьшению ω(ί). И наоборот, если ω(ί) уменьшается, то центробежная сила и, следовательно, угол ψ{ί) также уменьшаются, муфта опускается и заслонка, поднимаясь, открывает доступ к машине большему объему рабочего вещества. Такой способ регулирования носит название отрицательной обратной связи. Если значение регулируемой величины превышает заданное, то регулятор действует так, чтобы уменьшить эту величину, и, наоборот, если значение этой величины меньше заданного, регулятор воздействует так, что эта величина возрастает. φ Машина Регулятор Уотта ω Рис. 1.2 Часто удобно использовать блок-схему, которая изображена на рис. 1.2. Прямоугольники на этой схеме можно интерпре- 8
тировать как некоторые операторы, которые отображают элементы одного функционального пространства в другое. Здесь оператор "машина" отображает элементы {φ} в {о;}, а оператор "регулятор Уатта" — элементы {ω} в {φ}. Поэтому естественно назвать функции φ(ί) входами блока "машина", а функции ω{ί) — выходами этого блока. Для блока "регулятор Уатта" входом является ω(ί), а выходом φ(ί). Уже из уравнения (1.1) вытекает, что не всегда по входу однозначно определяется выход. Нужно еще зафиксировать некоторые "начальные условия", или "начальные состояния", которые здесь определяются как ω(0). Во второй половине XIX века было установлено, что регуляторы Уатта не всегда достигают поставленной цели — отслеживают величину ω{ί). Техника и технология достигли новых рубежей, и появились новые виды паровых машин, для которых регуляторы Уатта оказались неработоспособными. Исследование проблемы работы регулятора Уатта выдающимися учеными — И. А. Вышнеградским, Дж. Максвеллом, А. Стодолой — привело к выводам, неожиданным для инженеров и нетривиальным для математиков и механиков. Эти работы заложили фундамент классической теории управления. Для того чтобы изложить здесь основные идеи этих работ рассмотрим вместо классического регулятора Уатта некоторую его модификацию. Предварительно рассмотрим систему регулирования вала турбины, которая часто применяется в настоящее время в турбостроении. Принципиальная схема такой системы изображена на рис. 1.3. Здесь вместо шарниров используется стержень, на который насажены грузики массой га. Удерживаемые пружинами грузики могут скользить вдоль этого стержня. Они соединены друг с другом мембраной, которая, прогибаясь и изменяя тем самым размеры расположенного над ней выпускного окна, увеличивает или уменьшает (в зависимости от того, как движутся 9
грузики вдоль стержня) расход масла, вытекающего из этого отверстия. Специальное масло, которое заполняет полость устройства, расположенного над мембраной и называемого сервомеханизмом, выполняет две функции: производит постоянную смазку всех движущихся частей системы и осуществляет движение цилиндра, жестко связанного с заслонкой. За счет постоянного напорного давления ρ осуществляется приток масла, которое можно рассматривать как несжимаемую жидкость. Если угловая скорость u(t) вала уменьшается, то центробежная сила, действующая на грузики, уменьшается, и пружины подтягивают грузики ближе к центру вращения вала. Мембрана в этом случае больше изгибается, и размеры выпускного Напорное давление L ъ <^ Ρ Ρ Ρ q о о ' Рабочее вещество Трубопровод Рис. 1.3 окна становятся меньше. Следовательно, меньше жидкости вы- 10
текает из этого окна и больший ее объем, оставаясь в полости сервомеханизма, заставляет цилиндр двигаться вверх, приподнимая заслонку и открывая доступ большему количеству рабочего вещества. Если же угловая скорость ω(ί) увеличивается, то, проводя аналогичные рассуждения, легко, показать, что заслонка, двигаясь вниз, отсекает излишнее количество рабочего вещества. Такие регуляторы устанавливались на турбины начиная с 1952 года, на Ленинградском Металлическом заводе [373]. Описанный выше контур управления вращением вала турбины сконструирован по принципу отрицательной обратной связи. Реагируя на положительное приращение угловой скорости Αω(ί) = ω{ί) — cjo, система управления стремится уменьшить величину ω за счет отсечения излишнего количества рабочего вещества, подводимого к турбине. При отрицательной величине Au(t) управляющее воздействие должно привести к увеличению количества рабочего вещества и, следовательно, к увеличению регулируемой величины ω. Рассматривая описанный выше контур управления, можно разбить его компоненты на следующие составляющие: смещающиеся грузики на пружинах можно рассматривать как датчики (измерители) угловой скорости ω(t) (тахометры). Конструкция мембраны, выпускного окна и определенные свойства жидкости (например, ее вязкость) формируют определенный алгоритм (закон) управления. Сам сервомеханизм можно рассматривать как исполнительное устройство, усиливающее полученный сигнал управления. (Часто для существенного усиления управляющего сигнала используют каскады сервомеханизмов.) Разбиение контуров управления на датчики, исполнительные устройства и устройства, обрабатывающие сигналы датчиков и формирущие алгоритмы (законы) управления, характерно для современных учебников и руководств по теории управления. Перейдем теперь к изучению устройства управления, кото- 11
рое выполняет функции, аналогичные функциям регуляторов, изображенных на рис. 1.1 и 1.3, и математическое описание которого с методической точки зрения проще, чем описание рассмотренных выше регуляторов. Итак, рассмотрим регулятор, приведенный на рис. 1.4. Функционирование системы, изображенной на рис. 1.4, отличается от классического регулятора Уатта лишь тем, что на массы га, скользящие вдоль стержня и соединенные с валом V пружинами, действует центробежная сила /. Эта сила в момент времени t отклоняет массы на величину x(t) от ненапряженного состояния пружины. Таким образом, здесь выходом модифицированного регулятора Уатта является величина х(£), которая подается на устройство, передвигающее заслонку на расстояние и в зависимости от величины х. Технические подробности, касающиеся этого устройства, для нас сейчас неважны. Существенным для нас является лишь наличие некоторой функциональной зависимости и(х). Муфта Τ Трубопровод Рис. 1.4 Из курса механики можно вспомнить, что величины x(t) и / связаны следующими соотношениями: f = pm(x + r)u2, (1.2) 12
mx + αχ + ηχ — /. (1.3) Здесь α, /3,7>r ~~ некоторые положительные числа. Величина —jx соответствует упругой восстанавливающей силе пружины (закон Гука), величина —ах соответствует силе трения. Здесь мы принимаем, что справедлив закон вязкого трения: сила трения пропорциональна скорости x(t) и число —а является коэффициентом пропорциональности. Другими видами трения, кроме вязкого, мы здесь пренебрегаем. Числу г соответствует длина пружины в ненапряженном состоянии. Принимая величину G постоянной и величину F функционально зависящей от и: F — F(u), получаем из уравнений (1.1)—(1.3) следующую систему, описывающую процесс регулирования величины ω{ί)\ Ju = F(u(x)) - G, mx + αχ + ηχ = βτπ{χ + τ)ω2. Естественно, что для нормального функционирования рассматриваемой системы необходимо, чтобы уравнения (1.4) имели следующее решение: u(t)=u0, x(t) = x0. (1.5) Здесь ωο — требуемая частота вращения вала, хо — некоторое число, для которого выполнены равенства ПФо)) = G, а ( ! ч 2 (L6) 7x0 = рт{х0 + Н^о- Очевидно, что равенства (1.6) необходимы и достаточны для того, чтобы соотношения (1.5) определяли решение системы (1.4). Как правило, получения этих соотношений добиваются за счет специальной конструкции регулятора: из физических соображений ясно, что первое уравнение (1.6) имеет некоторый корень хо> а второе уравнение (1.6) можно удовлетворить, 13
например, при уже зафиксированном хо за счет выбора жесткости пружины. Центральной научно-технической проблемой здесь стала устойчивость тривиального решения (1.5). И решение этой проблемы оказалось весьма нетривиальным и совершенно неожиданным для инженерной практики. Проведем вначале линеаризацию системы (1.4) в окрестности решений (1.5), учитывая, что выполнены равенства (1.6), и предполагая достаточную гладкость функции F(u(x)). Обозначая Ax(t) = x(t) — xq и Au(t) = ω{ί) — ω$ получаем линейную систему J {Δω)9 = FQ(Ax), τη(Δχ)" + α(Δι)* + ~fAx = βτηω%Δχ + 2βτηωΰ(χ0 + г) Δω. (1.7) Здесь Fq = F'(u(xo))v!(χ$). Таким образом, в (1.7) отброшены члены более высокого порядка малости и функции заменены своими линейными приближениями. Обычно полученные таким образом линеаризации типа (1.7) называют уравнениями первого приближения. Изучим вначале уравнения первого приближения (1.7), а уже затем займемся вопросом о взаимоотношениях этих уравнений и исходных уравнений (1.4). Система (1.7) эквивалентна уравнению третьего порядка (Δα;)- + - (Δω)" + Ύ " ^ (Δω)' - Μ Αω = 0, (1.8) m τη Jm где /о = 2βτηως)(χο + г). Характеристический полином такого уравнения имеет вид Q(p) = ρ3 + - ρ2 +1—^—-ρ - -γ^· ΐ·9 τη τη Jm Из элементарной теории интегрирования уравнений (1.8) следует, что для того чтобы любое решение Αω{ί) оставалось малым при малых начальных условиях Δω(0), (Δω(0))β, (Αω(0))** 14
и стремилось к нулю при t —> +00, необходимо и достаточно выполнения следующего условия: все нули полинома Q(p) имеют отрицательные вещественные части. В этом случае говорят, что решение линейной системы асимптотически устойчиво. Часто полином Q(p), имеющий все нули с отрицательными вещественными частями, называют устойчивым. § 1.2. Критерий Эрмита—Михайлова Можно ли, не находя нули полинома Q(p), судить о его устойчивости? Этот вопрос был поставлен перед математиками в 60-х годах XIX века. И одной из основных мотиваций была проблема исследования регулятора Уатта. Если для полинома второй степени Q(p) = ρ2 + ар + β вопрос решается очень просто: для этого необходимо и достаточно положительности а и /3, то для полинома третьей степени вида (1.9) это уже гораздо сложнее. В настоящее время имеется много различных критериев устойчивости полиномов: критерии Гурвица, Рауса, Льенара. Описание их содержится, например, в замечательной книге [81]. Мы приведем здесь один из наиболее простых и популярных в инженерной практике критериев — критерий Эрмита—Михайлова. Рассмотрим полином степени η с вещественными коэффициентами /Ы=Рп + ап-1Рп-1 + ... + а0. Вначале приведем один простой факт, который иногда называют теоремой Стодолы. Предложение 1.1. Для того чтобы полином f(p) имел все нули с отрицательными вещественными частями, необходимо, чтобы все коэффициенты а{ были положительны. 15
Доказательство. Обозначим через olj вещественные нули f(p) и через β^ — комплексные нули f(p). Поскольку а* вещественные, величины β^ являются также нулями f(p). Таким образом, полином f(p) может быть представлен в виде произведения: т = П(р - а^ П(р - &)(р - fa = = П(р -а^ Π (ρ2 - 2(Re pup+m2). 3 к Ясно, что если для всех j и к выполнены условия otj<0 и Re/3fc<0, то произведения П(Р " аД Π (Ρ2'" 2(Re/?fc)p+ |/?fc|2) являются полиномами с положительными коэффициентами. Следовательно, и полином f(p) является полиномом с положительными коэффициентами. Обозначим теперь через т число нулей f(p) с положительными вещественными частями. В дальнейшем будем рассматривать значения полинома f(p) на мнимой оси: /(га;), ω G R1. Кривая на комплексной плоскости, которая состоит из множества точек {р = f(iu)\u £ Μ1} называется годографом полинома /(р). Иногда этот годограф называют годографом Михайлова, или амплитудно-фазовой характеристикой полинома Введем в рассмотрение функцию φ(ω) = Arg f(iu). Здесь Arg z — некоторая непрерывная ветвь многозначной функции комплексного аргумента ζ: arg2 + 2for, (1.10) 16
где к — целые числа и &rgz — главное значение аргумента: —π < a,rgz < π. Будем для определенности, например, считать, что φ(0) = 0. При переходе годографа через луч на комплексной плоскости {Im ζ = 0, Re z < 0} в некоторой точке ω = uq берем ту ветвь функции (1.10), которая обеспечивает непрерывность такого перехода, т. е. непрерывность функции φ(ω) в точке uq. Обозначим через Δφ(ω)\_ приращение функции φ(ω), когда аргумент ω пробегает вещественную прямую R1 от — оо до +оо. Предложение 1.2. Пусть f(iu)^0 Vω £ R1. Тогда справедлива формула Эрмита—Михайлова А^И|^ = тг(п-2т). Доказательство. Обозначим через щ нули полинома с отрицательными и через /?& — нули полинома с положительными вещественными частями. По сделанному предположению полином f(p) не имеет нулей на мнимой оси. Записав полином f(p) в виде произведения f(P) = U(p-aj) №-&) 3 к и применив известные теоремы об аргументе произведения комплексных чисел, получим следующее равенство: М")12 = Х>Агб(^ - аз)\ +ЕМгб(^ - &) +оо +оо (1.11) Вычислим теперь величины AArg(m, - α,)|!~ AArg(m; - ft)|!~- Для этого рассмотрим на комплексной плоскости (рис. 1.5) числа aj, ιω, ιω — olj и соответствующие им векторы. 17
Im z , Ιηι 7. V ι У κ\ ι -Re α, Re ζ "Re4 XI Re/ "»-Al/ / Рис. 1.5 Рис. 1.6 Вектор числа га; — ау при увеличении а; от — оо до +оо монотонно вверх скользит своим концом по прямой Re ζ = — Reay, поворачиваясь против часовой стрелки так, как это показано на рис. 1.5. Отсюда следует, что AArg(iu-aj)\*™ = тг. Рассмотрим теперь на комплексной плоскости (рис. 1.6) числа /?£, ίω, ΐω — Рк и соответствующие им векторы. Вектор числа τω — β к при увеличении ω от — оо до +оо монотонно вверх скользит своим концом по прямой Re2 = —Re/?^, поворачиваясь по часовой стрелке так, как это показано на рис. 1.6. Следовательно, ДАг8(го;-&)|+~ = -7г. Отсюда и из разложения (1.11) следует, что Δφ{ω)\ +оо (η — πι)π — ηιπ = π(η — 2га). Предложение доказано. Из предложения 1.2 сразу вытекает 18
Критерий Эрмита—Михайлова. Пусть /(га;) ^ О Vo; E R1. Тогда для устойчивости полинома f(p) необходимо и достаточно, чтобы Δφ(ω)\+_~ = ηπ, (1.12) Часто для упрощения проверки формулы (1.12) полезно следующее замечание. В силу вещественности коэффициентов для полинома f(p) справедливы очевидные равенства Re /(—га;) = Re/(га;), Im/(—га;) = —1ш/(га;). Отсюда следует, что годограф f(p) симметричен относительно вещественной оси (рис. 1.7). \«»-> Ιηι ζ лад ю=<* Re ζ л-ад Рис. 1.7 Поэтому вместо равенства (1.12) можно записать следующее условие: Δγ>Η|ο = ηπ Заметим, что, доказав предложение 1.2, мы доказали также, что для устойчивых полиномов функция φ(ω) монотонно 19
возрастает. Поэтому годограф f(p) при ω>0, выходя из точки ω = О на положительной полуоси {Re2>0, 1т,г:=0}, при возрастании ω последовательно пересекает полуоси {Re z = О, Imz > 0}, {Imz = 0, Re2: < 0},... , проходя через η квадрантов. И обратно, если f(iu) φ 0 Μ ω £ Rn и годограф f(p) при ω > 0, выходя из точки на полуоси {Reζ > 0, Imz = 0}, при возрастании ω последовательно по одному разу пересекает полуоси {Reζ = Ο,Ιπι,ζ > 0}, {Rez < 0, Imz = 0}, ..., асимптотически стремясь к n-й полуоси, то f(p) является (в силу формулы (1.12)) устойчивым полиномом. Рассмотрим теперь полином третьей степени /(ρ)=ρ3 + αρ2+/?ρ + 7. (1.13) В силу предложения 1.1 для устойчивости f(p) необходимо, чтобы выполнялись условия а > 0, β > 0, η > 0. Здесь ί{ιω) = (7 — оси2) + (/? - ω2)ωί. Поэтому при ω > 0 точки пересечения годографа /(р) с полуосями {Reζ > 0, Imz = 0}, {Re2 = 0, I1X12: > 0}, {Re2 < 0, Im2: = 0} соответствуют точкам ωχ = 0, ω2 = л/тЛ*> ^з = \/Α При этом /(0) = 7, /(ω2) = (0 ~ a) yl *> ϊ(ω^ = Ί-αβ· Отсюда, учитыва51 вышесказанное, получаем, что для устойчивых полиномов необходимо и достаточно, чтобы /?-^>0, 7-<*/?<0. (1.14) а Кроме того, ^М-0 (1.15) при ω —> +оо. Поэтому при выполнении (1.14), (1.15) годограф f(p) при ω > 0, выходя из точки на полуоси {Reζ > 0, Imz = 20
0}, при возрастании ω последовательно по одному разу пересекает полуоси {Re ζ = 0, Imz > 0}, {Re z < 0, Imz = 0}, асимптотически стремясь к третьей полуоси {Reζ = 0, Imz < 0}. И обратно, такое поведение годографа возможно только при выполнении (1.14). Таким образом, для устойчивости полинома (1.13) необходимо и достаточно, чтобы выполнялись неравенства α>0, /?>0, 7>0, αβ>η. (1.16) Эти неравенства иногда называют условиями Вышнеградско- го. Итак, теперь есть возможность, используя критерий устойчивости (1.16), исследовать линеаризованную систему (1.7) или эквивалентное ей уравнение (1.8). Однако исходная система является нелинейной. Поэтому необходимо развить нелинейную локальную теорию, которая разрешила бы нашу задачу. Такая теория — теория устойчивости движения — была развита в конце девятнадцатого века в трудах А. М. Ляпунова, Η. Ε. Жуковского, А. Пуанкаре. Перейдем сейчас к изложению необходимых для нас результатов. § 1.3. Теорема об устойчивости по первому приближению Рассмотрим вначале одну вспомогательную задачу о разрешимости матричного уравнения A*H + HA = G, (1.17) которое часто называют уравнением Ляпунова, где А и G — заданные η χ η-матрицы, Η — искомая η χ η-матрица. Будем рассматривать здесь вещественный случай, предполагая, что Η и G — симметричные матрицы. 21
Лемма 1.1. Пусть все собственные значения матрицы А имеют отрицательные вещественные части и G < 0. Тогда уравнение (1.17) имеет единственное решение +оо Н = - [ eA4GeAtdt. (1.18) о Напомним, что неравенство G < 0 означает, что соответствующая квадратичная форма z*Gz является отрицательно определенной. Заметим также, что из (1.18) сразу следует, что Η > 0. В самом деле^ из невырожденности матрицы ем при любом t вытекает, что -(eAt)*GeAt>0 Vt>0. Отсюда следует, что для любого χ £ Шп -x*(eAt)*GeAtx>0 Vt > 0. Но тогда +оо о Доказательство леммы 1.1. Из предположения о собственных значениях матрицы А следует существование конечного интеграла (1.18). Очевидно, что имеет место равенство - (eA4GeAt) = A*(eA4GeAt) + (eA4GeAt)A. Интегрируя это тождество от 0 до +оо и учитывая, что lim eA4GeAt = 0, t—*+oo получаем равенство (1.17) с i/, удовлетворяющей соотношению (1.18). 22
Покажем единственность решения уравнения (1.17). Предполагая противное, т. е. считая, что Н\ и Η<ι — два решения уравнения (1.17), получаем, что Η — Н\ — Η<ι удовлетворяет уравнению Л*# + #Л = 0. (1.19) Рассмотрим вектор-функцию x(t) = eAtx0, где хо — некоторый вектор. Из (1.19) имеем j x(t)*Hx(t) = x(t)*(A*H + HA)x(t) = 0. Отсюда следует, что x(t)*Hx(t) ξξ х%Нх0. Однако x(t) —> 0 при t —> +оо в силу условия на собственные значения А. Таким образом, XqHxo = 0 Vxo £ Rn· Отсюда следует, что симметричная матрица Η является нулевой. Лемма доказана. Рассмотрим теперь дифференциальное уравнение ^ = /(t,x), teR1, xeRn, (1.20) at где f(t,x) — непрерывная вектор-функция: R1 x Rn —> Rn. Будем предполагать, что все рассматриваемые далее решения χ(ί,ίθ)^ο) с начальными данными х(£о>£о>яо) — ^о определены на интервале (to, +oo). Определение 1.1. Будем говорить, что решение χ(£, to, xо) системы (1.20) устойчиво по Ляпунову, если для любого числа ε > 0 существует число δ (ε) > 0 такое, что для всех уо, 23
удовлетворяющих неравенству |хо — уо\ < δ(ε), выполняется соотношение |x(t,to,xo)-x(t,*o,yo)| <e Vt>t0. (1.21) Определение 1.2. Если решение χ(ί,ίο,^ο) устойчиво по Ляпунову и существует число δο такое, что для всех уо, удовлетворяющих неравенству \xq — уо\ < δο, выполнено соотношение lim |x(t,to,xo) - x(t,t0,yo)\ = О, то говорят, что решение χ(ί,ίο>^ο) асимптотически устойчиво. Заметим, что в определениях 1.1 и 1.2 величины δ (ε) и δο, вообще говоря, зависят также от to: δο = ^ο(^ο)? <Ηε) = 5(ε,to)· Если возможен выбор δο и 5(ε) не зависящими от to, то говорят, что решение x(t,to,xo) равномерно устойчиво по Ляпунову и равномерно асимптотически устойчиво. Неустойчивость по Ляпунову — это логическое отрицание устойчивости по Ляпунову. Приведем пример устойчивых и неустойчивых решений. Рассмотрим уравнение маятника θ + αθ + j sin θ = 0. (1.22) Здесь 6{t) — угол отклонения маятника от вертикали, т — точечная масса, / — длина маятника (рис. 1.8), а — коэффициент трения. Уравнение (1.22) может быть записано в виде (1.20): θ = η, 9 . а (1-23) η = — αη — -γ sin у. 24
Двухмерное фазовое пространство, заполненное траекториями системы (1.23), которое в инженерной практике часто называют фазовым портретом, схематично изображено на рис. 1.9 в случае а = 0 и на рис. 1.10 — в случае а > 0. Рис. 1.8 Рис. 1.9 В случае а = 0 легко видеть, что система (1.23) имеет первый интеграл 25
V{θ, η) = η2 - -γ cos θ = C, (1.24) где С — произвольное число. В самом деле, для любого решения θ(ί),η(ί) системы (1.23) выполняется тождество jtV№^{t)) = 2η(ί) (-| sin0(i)) + Y (sm9(t))V(t) = 0. Таким образом, траектории в фазовом пространстве системы (1.23) целиком расположены на линиях уровня {θ,η\ν(θ,η) = 0}. Используя этот факт, легко показать замкнутость траекторий в окрестности стационарного решения θ{ϊ) = 0. Отсюда следует, что это решение устойчиво по Ляпунову, но не асимптотически. Используя первый интеграл (1.24), также легко показать, что к стационарному решению θ(ί) = 7Γ,η(ΐ) = 0 стремятся при t —> —оо две траектории, которые при t —> +оо, в свою очередь, стремятся к состояниям равновесия θ(ί) = —π, η(ϊ) = 0 и θ(ί) = 3π, η{ί) = 0. Такие траектории часто называют гетеро- клиническими. Наличие гетероклинической траектории доказывает неустойчивость по Ляпунову решения θ(ί) = π, η{ί) = 0. Первое, устойчивое по Ляпунову, стационарное решение соответствует нижнему положению равновесия маятника. В окрестности этого состояния равновесия замкнутые траектории соответствуют периодическим колебаниям маятника. Второе, неустойчивое по Ляпунову, стационарное решение соответствует верхнему положению состояния равновесия. Это состояние теоретически существует, но мы его не можем наблюдать из-за его неустойчивости. Этот факт является общим и для многих других физических, технических, биологических, экономических систем: неустойчивые по Ляпунову состояния являются нереализуемыми. 26
Ограничимся здесь пока интуитивным "механическим"доказательством асимптотической устойчивости нижнего положения равновесия θ{ί) = 0, η{ί) = 0 при а > 0. Если а > 0, то имеются силы трения, которые обеспечивают затухание колебаний около нижнего положения равновесия. Таким образом, решения в окрестности стационарной точки θ{ί) = 0, η(ί) = 0 стремятся к нулю при t —> +оо. Это и означает, что рассматриваемое стационарное решение асимптотически устойчиво (рис. 1.10). Рис. 1.10 А. М. Ляпуновым был предложен метод исследования устойчивости решений с помощью специальных функций, которые называют функциями Ляпунова. Ограничимся здесь рассмотрением случая, когда исследуемое решение x(t,to?^o) является нулевым: x(t,to?^o) =■ 0. Общий случай сводится к нему заменой χ = y + x(t,to,xo)· В данном случае приходим к уравнению %=9(t,v), (1-25) где g(t,y) = f(t,y + x(t,to,x0))-f(t,x(t,t0,xo)). 27
Таким образом, уравнение (1.25) имеет такую же структуру, как и (1.20), и при этом g(t,0) = 0. Заметим, однако, что такая подстановка на практике не всегда эффективна, поскольку мы должны знать вид решения x(t,to,^o)· Введем в рассмотрение дифференцируемую в некоторой окрестности точки χ = 0 функцию V(x) (V : Rn —> R1), для которой V(0) = 0. В дальнейшем будем, как правило, использовать следующее обозначение: V(x) := (gradV(x))*/(i,x) = Σ^Λβ*)· г Часто V(x) называют производной функции V(x) в силу системы (1.20). Здесь Xi — г-я компонента вектора χ и fa — г-я компонента вектор-функции /. Ясно, что если вместо χ подставить решение х(£, to, xо), то по правилу дифференцирования сложной функции будем иметь тождество — V(x(t,t0,x0)) = (gc8dV(x(t,t0,xo)))* f(t,x(t,t0,xo)). Теорема 1.1 (об асимптотической устойчивости). Пусть существуют дифференцируемая функция V(x) и непрерывная функция W(x), для которых в некоторой окрестности точки χ = 0 выполнены следующие условия: 1) V(x) > 0 при χ φ 0, V(0) = 0. 2) V(x) < W(x) < 0 при χ φ 0. Тогда нулевое решение системы (1.20) асимптотически устойчиво. Доказательство. Рассмотрим сферу {х\ |х| = ε}, которая целиком вместе с шаром {х\ |х| < ε} находится в рассматриваемой окрестности. Введем число а = inf V(x). (1.26) {х\ \χ\=ε} Поскольку сфера замкнута, из условия 1) вытекает, что а > 0. 28
Выберем теперь число δ таким, чтобы sup V(x) < а. (1.27) {*l М<*} Существование такого δ следует из равенства V(0) = 0и непрерывности функции V(x). Докажем, что при начальном условии хо, для которого |xq| < δ, выполнено неравенство |x(t,£o,xo)| < ε Vt > to, τ·β. имеет место устойчивость по Ляпунову. Предполагая противное и используя непрерывность решения x(£,to,xo), устанавливаем существование числа τ > to, для которого |х(т, £о,хо)| — ε и |х(Мо,хо)| < ε V t <Е [to,τ]. В этом случае, используя условие 2), имеем V(x(r,to,xo)) < V(xo). (1.28) С другой стороны, используя (1.26) и (1.27), находим V(x(r,to,xo)) >a>V(x0). (1.29) Поскольку (1.28) и (1.29) противоречат друг другу, получаем неравенство |х(£,£о,хо)| < ε ^£ > £ο· Докажем теперь асимптотическую устойчивость. Для этого зафиксируем некоторое число εο, для которого шар {х| |х| < εο} полностью располагается в рассматриваемой окрестности точки χ = 0. По εο выберем δο так, чтобы |x(t,to,xo)| < £o Vt > t0, Vx0 е {х| |х| < δ0}. Из условия 2) в этом случае следует, что для любого хо из шара {х| |х| < δο} существует предел lim y(x(t,t0,xo)) = β (1.30) t—>+oo nV(x(t,t0,xo)) >β Vi>i0- 29
Покажем, что β — 0. Предположив противное, т.е. β > 0, получим, что и решение x(t,to,xo) отделено от нуля, т.е. существует число 7 такое, что |х(Мо,хо)|>7 Vt>t0. (1.31) Напомним, что кроме неравенства (1.31) выполнено и условие |x(t,t0,x0)| <ε0 Vt>t0. (1.32) Из соотношений (1.31), (1.32), непрерывности функции W{x) и неравенства W(x) < 0 \/χ £ {х\ η < \х\ < е^} следует существование отрицательного числа ае, для которого VK(x(t,t0,x0)) < зе- Отсюда и из условия 2) получаем t У (x(t, t0, xo)) < V(x0) + Ι W(x(r, t0, x0)) dr < ίο < V(xo) + ae(t — to) —> —oo. t—>+oo Последнее противоречит неравенству V(x(t, to,xo)) > /3 > 0. Таким образом, β = 0. Отсюда, из соотношения (1.30) и непрерывности V(x) заключаем, что lim |x(t,t0,xo)| = 0. t—>+оо Теорема доказана. Теорема 1.2 (о неустойчивости). Пусть существуют дифференцируемая функция V(x) и непрерывная функция W(x) для которых в некоторой окрестности точки χ = 0 выполнены следующие условия: 1) V(0) = 0 и для некоторой последовательности х^ —> 0 при к —> оо выполнены неравенства V{xk) < 0, 30
2) V(x) < W(x) < 0 при χ φ 0. Тогда пулевое решепие системы (1.20) неустойчиво по Ляпунову. Доказательство. Предположим противное, т. е. по числу ε > 0 найдется число δ (ε), для которого \x(t,to,x0)\ < ε Vt>t0 и при всех хо^{^| |#|<5(ε)}. В этом случае в силу условия 1) теоремы можно выбрать хо так, чтобы V(xo) < 0. Тогда из условия 2) следует, что V(x(t,t0,x0)) <V(x0) <0, и, значит, существует некоторое число η > 0, для которого \x(t,t0,x0)\ > 7 V t > t0. Из непрерывности W(x) следует, что найдется отрицательное число ае, для которого W(x) < ае У χ е {х\ ^у < \х\ < ε}. Поэтому W(x(t,t0,xo)) < зе Vt > t0. Отсюда и из условия 2) теоремы следует, что t V(x(t, t0, xo)) < V(x0) + / W(x(t, t0, xo)) dr < to < V(xo) + ae(t - t0) —> —oo. t—>+oo Последнее противоречит предположению устойчивости по Ляпунову. Теорема доказана. Рассмотрим теперь систему (1.20), представленную в следующей форме: — = Ax + g(t,x). (1.33) 31
Здесь А — постоянная η χ η-матрица, g(t,x) — непрерывная вектор-функция: К χ Rn —> R. Будем предполагать, что в некоторой окрестности точки χ = 0 выполнено неравенство \9(t,x)\ < ае|ж| Vt G R1, Vx G Rn. (1.34) Здесь ае — некоторое число. Предполагая, что матрица А не имеет чисто мнимых собственных значений, постараемся построить функции V(x) и W(x), удовлетворяющие либо теореме 1.1, либо теореме 1.2. Рассмотрим вначале случай, когда все собственные значения А имеют отрицательные вещественные части. Тогда для G = —/ по лемме 1.1 найдется матрица Η > 0, для которой Л*Я + ЯЛ--7. (1.35) Рассмотрим далее квадратичную форму V(x) = x*iix, которая является положительно определенной: V(x) = х*Нх > О V χ φ 0. Следовательно, для V(x) выполнено условие 1) теоремы об асимптотической устойчивости. Равенство (1.35) можно переписать в виде 2х*НАх = — \х\2. Поэтому, учитывая (1.33) и (1.34), получаем V(x) = 2х*Н{Ах + g(t,χ)) < -\х\2 + 2|х*Я| |х|ае. Таким образом, если ае удовлетворяет неравенству 8е<(4|Я|)-1, (1.36) то выполнено и условие 2) теоремы об асимптотической устойчивости с W(x) = —|х|2/2. Итак, можно сформулировать следующий результат. Следствие 1.1. Если А — устойчивая матрица, т. е. все ее собственные значения имеют отрицательные вещественные 32
части и выполнено условие (1.36), то нулевое решение системы (1.33) асимптотически устойчиво. Рассмотрим теперь случай, когда матрица А не имеет чисто мнимых собственных значений и ее га собственных значений имеют положительные вещественные части. Не умаляя общности, можно считать, что матрица А имеет следующий блочный вид: % О Л " ' О -А2 где Αχ — устойчивая (п—га) χ (η—т)-матрица, А2 — устойчивая т χ т-матрица. Применяя вновь лемму 1.1, получаем существование положительных симметричных матриц Н\ и Н2 размерности (п — га) χ (п — га) и га χ га соответственно, для которых выполнены равенства А\Н\ + Н\А\ = -/, , . АЪН2 + Н2А2 = -1. [ ' Рассматривая функцию V(x) = х\Н\х\ — х\Н2х2, где χι е к" , х2 е имеем выполнение условия 1) теоремы о неустойчивости. Кроме того, используя (1.37), получаем V{x) = -\х\2 + 2x\Higi{t,x) - 2x\H2g2{t,x), (1.38) где gi(t,x) и g2(t,x) таковы, что 'gi(t,xY 0(*,s) ι ,. ч \92(t,x) Здесь pi(t,x) : Μ1 χ Rn -> Rn~m, <?2(*,x) *· K^K^ ^m. Из (1.38) следует, что V < -\х\2 + 2\HlXl\ \gi(t,x)\ + 2\Н2х2\ \g2(t,x)\ < -\х\2+ +2(|#1х1| + |Я2х2|) \g(t,x)\ < -\х\2 + 2(\Н1х1\ + \Н2х2\) ае|х|. 33
Отсюда следует, что при ае<(4(|Я1| + |Я2|))-1 (1.39) будет выполнено условие 2) теоремы о неустойчивости с функцией W(x) = -|x|2/2. Таким образом, можно сформулировать следующий результат. Следствие 1.2. Если матрица А не имеет собственных значений на мнимой оси и неустойчива, т. е. среди ее собственных значений имеются собственные значения с положительными вещественными частями, то при выполнении неравенства (1.39) нулевое решение неустойчиво по Ляпунову. Для автономной системы dx dt = /(я), χ е ДО) = 0 (1.40) с непрерывно дифференцируемой вектор-функцией f(x) следствия 1.1 и 1.2 можно переформулировать в терминах матрицы Якоби: df(x) дх = 0: (ЁА dxi dfn \дх! А дх dfi\ дхп dfn дхп / т=П взятой в точке χ В частности, имеет место следующий результат. Теорема 1.3 (об устойчивости по первому приближению). Пусть матрица А не имеет чисто мнимых собственных значений. 34
Если А устойчива, то пулевое решение системы (1.40) асимптотически устойчиво. Если А неустойчива, то нулевое решение системы (1.40) неустойчиво по Ляпунову. В качестве примера рассмотрим уравнение маятника (1.23). В точке θ = 0, η = 0 матрица Якоби имеет вид Ч| '.) Ее характеристический полином записывается как 2 9 ρ + ар+ -. Ясно, что при а > 0 матрица А устойчива, т. е. оба ее собственных значения имеют отрицательные вещественные части. Следовательно, рассматриваемое состояние равновесия асимптотически устойчиво. Рассмотрим теперь состояние равновесия θ = π, τ/ = 0. Для того чтобы применить теорему, выполним замену θ = θ + π, 77 = 77, получив систему η = —αη — - sin(# + тг), матрица Якоби которой в точке θ = 0, η = 0 имеет вид Ее характеристический полином записывается как 2 , 9 ρ + ар- -. Ясно, что при а > 0 одно собственное значение матрицы А положительно, а другое — отрицательно. Используя теорему 1.3, 35
получаем неустойчивость по Ляпунову для рассматриваемого решения. Вернемся теперь к рассмотрению регулятора Уатта. Согласно развитой нами теории характеристический полином матрицы Якоби системы (1.4) имеет вид (1.9). Используя теорему об устойчивости по первому приближению и условия устойчивости полинома третьего порядка (1.16), окончательно получаем, что стационарное решение (1.5) асимптотически устойчиво, если выполнены неравенства Fq < О, а(7 - βπιωΙ)3 > -F0/0m, (1.41) и неустойчиво по Ляпунову, если а(7 - Pmcj20)J < -Fofom. (1.42) Этот вывод, впервые сделанный И.А.Вышнеградским в 1876 году на основе нестрогих рассуждений о линеаризации (теоремы об устойчивости по первому приближению появились позже — в 1892 году), произвел большое впечатление на современников. Нетривиальность этих условий заключалась в том, что из инженерной интуиции и практики совершенно не следовало, что коэффициент трения является определяющим в обеспечении устойчивой работы регулятора. В тех случаях, когда трение недостаточно и выполняется (1.42), возникает эффект, который можно сравнить с нереализуемостью верхнего положения равновесия маятника. Желаемый режим работы регулятора становится нереализуемым из-за своей неустойчивости. Для того чтобы сделать этот вывод доступным для инженеров, И.А.Вышнеградский сформулировал свой знаменитый "тезис": Трение есть существенная принадлежность чувствительного и правильно работающего регулятора, короче: "без трения нет регулятора ". Нарушения в работе регуляторов в середине XIX века объяснялись тем, что в связи с возрастанием мощности машин ста- 36
ли применять более тяжелые заслонки и для их управления потребовались более значительные массы шаров га. Совершенствование обработки поверхностей приводило к уменьшению коэффициента трения а. Увеличение рабочей скорости машин сделало необходимым уменьшение моментов инерции J вала и связанных с ним деталей. Заметим, что в современных турбогенераторах момент инерции J является настолько большой величиной, что неравенства (1.41) всегда выполнимы. Таким образом, нами получены условия, при которых обеспечивается рабочий режим системы машина—регулятор Уатта. Часто такие режимы называют стационарными режимами, режимами слежения, режимами удержания. Однако при включении системы к такому режиму каждый раз необходимо перейти из совсем другого состояния системы. Режимы подобного перехода называются переходными режимами. § 1.4. Переходные режимы для регулятора Уатта Изучим переходной режим для регулятора Уатта. При этом будем использовать основные идеи метода построения функций Ляпунова. Будем также предполагать, что функция F(u(x)) является линейной: F(u(x)) -G = F0Ax = F0(x - x0) (см. соотношения (1.4)—(1.7)). Такое предположение является естественным, если жесткость пружины 7 достаточно большая и диапазон изменения x(t) в переходном процессе достаточно мал. По этой же причине примем следующее приближенное выражение для /: / = βτητω1 + βτηω\χ. Итак, при сделанных предположениях имеем уравнения Ju = F0Ax, га(Ах)·· + α(Δχ)* + 7ο(Δ^) = βτητω1 — 70^0 2 _ (1-43) 37
и начальные условия ω(0) = О, Δχ(0) = -хо, (Δχ(0))* = 0, которые соответствуют включению системы в момент времени t = 0. Здесь 7о = 7 ~~ βτηω%. Введем обозначения у=—Δχ, 2=—(Δζ), α=—, ft=—, J J mm </>(<*>) = mj (βπιτω2 - 7ox0). Уравнения (1.43) в этих обозначениях можно записать следующим образом: ώ = у, y = z, (1.44) i = — az — by — φ(ω). Для изучения этой системы введем в рассмотрение функцию by2 (z + ay)2 f byz V{uj, y,z)=a φ(χ) dx + tp{u)y + — + Эта функция обладает свойствами, аналогичными свойствам функций V(x) в теоремах Ляпунова об асимптотической устойчивости и неустойчивости. Поэтому функцию V(u,y,z) будем также называть функцией Ляпунова. Легко видеть, что для любого решения u)(t),y{t),z{t) системы (1.44) выполнено соотношение V(u(t), y(t), z(t)) = (φ'(ω(ή) - ab)y(t)2. (1.45) Лемма 1.2. Пусть выполнено неравенство 777,70 > о? (1-46) и на промежутке [Ο,ωι], где ω\ определяется из равенства ωι φ(χ) dx = 0, /■ 38
выполнено условие ab> φ'{ω). (1.47) Тогда для решения системы (1.44) с начальными данными ω(0) = 0, у(0) = —j^- xo, z(0) = О справедливо включение cj(t)G[0,wi] Vt>0. (1.48) Доказательство. Ясно, что при t = 0 включение (1.48) выполнено. Из непрерывной дифференцируемости ω{ί) следует, что для того чтобы включение (1.48) не выполнялось, необходимо существование числа τ > О, для которого справедливо одно из соотношений: 1Мт) = 0, ώ(τ)<0, cj(t)G[0,cJi] Vie [0, τ]; 2)cj(t)=cji, ώ(τ)>0, ω(ί) G [Ο,υι] Vte[0,r]. Заметим, что в каждом из этих случаев в силу (1.47) имеем неравенство V(u(t)1y(t)1z(t)) < 0 Vt G [0, г]. Отсюда и из соотношений следует, что ν(ω(τ),ν(τ),ζ(τ))<0. (1.49) В случае 1), учитывая, что ώ(ί) = у(£), имеем <р(м(т))у(т) > О, и, следовательно, ν(ω(τ), у(т),г(т)) > 0. Последнее противоречит соотношению (1.49). В случае 2) имеем <^(ω(τ)) у{т) > 0, поскольку ω ι > ωο. Поэтому также ν(ω(τ), у(т), ζ(τ)) > 0, что противоречит неравенству (1.49). Полученные противоречия и доказывают лемму 1.2. Лемма 1.3. Пусть для непрерывно дифференцируемой на промежутке [0, +оо) функции u(t) выполнены следующие условия: 39
1) для некоторого числа С |ώ(ί)| <С Vt >0; 2) u(t) > 0 Vt >0; /·+οο 3) / u(t)dt <+oo. Л) Тогда lim u(t) = 0. ί—>+оо Доказательство. Рассмотрим соотношение u(t)2 = u(0)2 + 2 ( u{t)u{t) dr (1.50) о и проведем оценку t t +оо \и(т)й(т)\ат< I \й{т)\и{т)ат <С J и(т)ат. 0 0 О Из этой оценки и условия 3) леммы следует сходимость интеграла +оо / и{т)й{т)ат. о Но тогда из (1.50) следует существование предела lim u(t) = v. t—>+оо Из условий 2) и 3) вытекает, что ν = 0. Лемма доказана. Лемма 1.4. Пусть для непрерывной на промежутке [0, +оо) функции u{t) выполнены условия: 1) для некоторого числа С \u{t)\ <C Vt >0; 40
2) lim u(t) = 0. t—>+oo Тогда lim ύ(£) = 0. t-^+oo ч У Доказательство. Предположим противное, т. е. существование последовательности £& —> +оо, для которой |ύ(ί*)|>ε. Из условия 1) следует, что тогда |ύ(ί)| > (1.51) на промежутках [ί&, £& + ^]. Из условия 2) леммы следует, что можно взять t\ таким, что К*)1 < 16С V* > ίι. (1.52) Отсюда и из (1.51) вытекает, что и (tk + 2CJ > 3^_ 16С Последнее противоречит неравенству (1.52), что и доказывает лемму 1.4. Теорема 1.4 (о переходном режиме). Пусть для параметров регулятора выполнены следующие условия: 7П70 > OL , ot-loJ > ->/3 F0f0m. (1.53) (1.54) Тогда для решения уравнения (1.43) с начальными условиями ω(0) = 0, Δχ(0) = —χο, (Δχ(0))* = 0 выполнены соотношения ω(ί) € 0, 37о £о βτητ = [0, у/Зшо], (1.55) 41
lim cj(t)=cj0, Um Δχ(ί) = 0, lim (Δχ(ί))* = 0. (1.56) t—>+oo t—>+oo i—>+oo Напомним, что здесь /о = 2/?mo;o(^o + г). Доказательство. Включение (1.55) следует сразу из леммы 1.1. В самом деле, ω\ здесь легко вычисляется из уравнения 1 ч - βπιτωΐ - 7ο^ο^ι = 0, и условие (1.47) принимает вид —?г > -βτητωχ. τηΔ mJ Это неравенство можно записать в виде cryoJ > -\/3 F0m(f0 - 20тиохо). Ясно, что это неравенство следует из условия (1.54). Таким образом, здесь выполнены все условия леммы 1.1, и, следовательно, справедливо включение (1.55). Для доказательства (1.56) заметим, что из (1.45) и включения (1.55) вытекает неравенство V(u>(t),y(t),z(t))<-ey(t)2 Vi>0, (1.57) где ε — достаточно малое положительное число. Отсюда и из (1.55) следует ограниченность функции V(u(t),y(t),z(t)) на [0,+оо). Но тогда из (1.57) получим существование некоторого числа С, для которого t Jy(r)2dT < -ε (V(u>(0),y(0),z(0)) - V(u(t),y(t),z(t))) < С о Vt >0. 42
Ясно также, что из ограниченности V(u(t),y(t), z(t)) и включения (1.55) следует, что на [0,+оо) ограничены и функции y(t) и z{t). Но тогда ограничена функция ^y(t)2 = 2y(t)z(t). Таким образом, здесь выполнены все условия леммы 1.2, и, следовательно, lim y(t) = 0. (1.58) Заметим также, что m = -*z(t)-by{t)-ip{u>{t)), и, как показано выше, z(t),y(t),u(t) ограничены на [0,+оо). Отсюда и из (1.58) по лемме 1.3 получим, что для z(t) = y(t) справедливо равенство lim z(t) = 0 £->+оо Из (1.57)—(1.59) и вида функции V заключаем, что существуют пределы lim V(uu(t),y(t),z(t)), lim / φ(χ)άχ. £—>+οο t—>+oo J 0 Учитывая вид функции φ(ω), отсюда делаем вывод, что lim ω{ί) = ωο. £—>+оо Теорема доказана. Сравним теперь наши нелокальные условия (1.53), (1.54) перехода при включении системы машина—регулятор Уатта от первоначального неподвижного состояния ω = 0, χ = 0,х = О к стационарному рабочему состоянию ω = ωο,χ = χο,χ = О с локальными условиями удержания этого рабочего состояния (1.41). (1.59) 43
Условия (1.41) и (1.54) схожи по форме, и условие (1.54) требует несколько большего (но не очень значительно): в правой части неравенства появился сомножитель >/3. Условие (1.53) — это дополнительное условие на жесткость пружины: она должна превышать трение так, как это рекомендовано неравенством (1.53). В отличие от условий (1.41), нарушение которых приводит к физической нереализуемости рабочего режима (сравни с условием неустойчивости (1.42)), условия (1.53) и (1.54) являются лишь достаточными условиями, при которых переходный режим приведет систему машина—регулятор в сколь угодно малую (при достаточно большом времени) окрестность рабочего режима. Поэтому здесь возможны дальнейшие уточнения и ослабление этих условий с помощью как аналитического аппарата (например, можно пытаться построить другие функции Ляпунова, которые улучшат оценки), так и численного интегрирования интересующего нас решения. Однако следует учитывать, что в инженерной практике часто невозможно точно указать все параметры, и необходимо также помнить, что построение математической модели всегда возможно при некоторой идеализации. Поэтому часто оказывается вполне достаточно информации, которую получают с помощью достаточных условий (1.53), (1.54). Заметим, что нелокальный анализ переходного процесса был проведен здесь в предположении, что / = βπι(τω2 +Uqx). Проведение аналогичного анализа для точной формулы, описывающей центробежную силу f = βπιω2(τ + χ), является нерешенной в настоящее время задачей. Заметим также, что некоторое упрощение нелинейной математической модели перед ее строгим математическим анализом является типичным для современной теории управления. Из условия (1.55) следует, что для рассматриваемой здесь 44
упрощенной математической модели (1.43) выполнено условие \βτηω(ί)2(τ+χ(ί))-βπι(τω(ί)2+ωΙχ(ί))\ < 2βπιω%\χ(ί)\ Vt > 0. Схематически переходный процесс изображен на рис. 1.11. ДО) о / / V Рис. 1.11 В энергоустановках часто для того, чтобы не было потери устойчивости, применяют различные системы и способы запуска. В некоторых случаях вначале запускают машину без нагрузки, а потом ее нагружают. В одних случаях нагруже- ние производят резко, а в других — плавно. Последнее можно математически идеализировать следующим образом. При малом изменении параметров дифференциальных уравнений так же мало смещаются устойчивые равновесные состояния. При малом скачкообразном изменении нагрузки старое равновесное состояние, в малую окрестность которого притянулась траектория, которая соответствует переходному процессу, можно трактовать как новые начальные данные для траектории уравнения после нагрузки. Поскольку это начальное условие находится вблизи нового устойчивого состояния равновесия (точнее — в области его притяжения), то рассматриваемая траектория притягивается в наперед заданную малую окрестность устойчивого состояния равновесия. Далее набрасываем ьу ( * Wo \ ω° ) ω 45
нагрузку еще раз и повторяем предыдущее рассуждение. Такой способ управления переходным процессом называется управлением уставками. Этот способ использовался весьма широко при управлении роботами-манипуляторами для того, чтобы не было срыва с программных движений в области неустойчивости. При управлении социально-экономическими процессами на переходных режимах также могут проявляться неустойчивости и срыв с заранее заявленных и спланированных программных движений. Так же, как и в регуляторе Уатта, их нельзя объяснить "статически" и на уровне "здравого смысла". Их причины нетривиальны и являются следствием эволюции той или другой системы.
ГЛАВА 2 ЛИНЕЙНЫЕ ЭЛЕКТРИЧЕСКИЕ ЦЕПИ, ПЕРЕДАТОЧНЫЕ ФУНКЦИИ И ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ ЛИНЕЙНЫХ БЛОКОВ § 2.1. Описание линейных блоков В предыдущей главе мы рассматривали нелинейную математическую модель, и существенной частью исследования была процедура линеаризации. Здесь мы покажем, что широко распространенные электрические цепи, содержащие сопротивления, конденсаторы и индуктивности, описываются линейными дифференциальными уравнениями. Рассмотрим сначала простейшую электрическую цепь — RC- цепь, которая часто используется в радиотехнике как низкочастотный фильтр (рис. 2.1). Здесь R — сопротивление резистора, С — емкость конденсатора, u\(t) и U2(t) — электрические напряжения. Выведем соотношения между величинами u\(t) и U2(t). Для этого воспользуемся законом Ома Ri(t) = ui(t)-u2(t). (2.1) Здесь i(t) — сила тока, проходящего от левой клеммы через резистор и емкость. Напомним, что ОД-^, (2.2) 47
где q(t) ~ количество электричества. Это количество электричества мы можем рассмотреть на обкладках конденсатора с емкостью С. Поскольку напряжение между обкладками равно U2(£), из свойства емкости имеем q(t) = Cu2(t). Подставляя (2.3) в (2.2) и (2.2) в (2.1), получаем КС —— +U2 = U\. at (2.3) (2.4) Рассмотрим еще одну электрическую схему — RLC-цеиь (рис. 2.2). R Φ Ф-Ш-\1 0 Рис. 2.1 Рис. 2.2 В этом случае к падению напряжения u\(t) — U2(t) добавляется электродвижущая сила самоиндукции e(t), для которой хорошо известно следующее соотношение: т = -l di(t) dt Поэтому вместо соотношения (2.1) здесь имеем Ul(t) - u2(t) + e(t) = Ri(t), или, учитывая (2.5), получаем Ul{t)-u2(t)-L^ = Ri(t). (2.5) (2.6) (2.7) 48
В рассматриваемом случае также выполнены соотношения (2.2) и (2.3). Поэтому, подставляя (2.3) в (2.2) и (2.2) в (2.7), окончательно находим Таким образом, уравнения (2.4) и (2.8) связывают и\ и г^ соответственно для RC- и RCL-цеией. Величины u\{t) и г^(£) удобно трактовать как вход и выход блока, математическое описание которого здесь сводится к уравнениям (2.4) или (2.8) (рис. 2.3). M1 . L иг Рис. 2.3. Заметим, что в двух рассмотренных нами случаях формально можно поменять местами вход и выход. Если ранее мы подавали напряжение на вход u\{t) и наблюдали за выходом — напряжением U2(t), то возможно также подавать напряжение U2(t) и наблюдать за выходом u\(t). Однако U2(t) в качестве выхода блока L формируется как решение уравнений (2.4) с начальными данными ^(0) или как (2.8) с начальными данными U2(0), ^2(0), а выход u\(t) формируется однозначно по формулам (2.4) и (2.8). Следует отметить, что в инженерной практике редко используются случаи, когда линейный блок является суммой операторов дифференцирования — в этом случае высокочастотная паразитная помеха Αύηωί (Л — мало и ω очень велико), на- кладываясь на вход U2'. v>2(t) + Asina;t, в результате дает для 49
ДС-цепи выход u\{t) = RCii2(t) + U2(t) + RCAoj cos ωί + Αω sin ut. Так как величина RCAu уже не является малой, полезный сигнал U2(t) пройдет через блок L с большими искажениями. В дальнейшем мы убедимся в том, что в случае, когда входом является iii(t), происходит обратный эффект, и высокочастотные помехи вида Asm cut подавляются. Поскольку уравнения (2.1)—-(2.3) и (2.5), (2.6) сохраняются и для других электрических схем, в которые входят проводники, резисторы, конденсаторы и индуктивности, такие цепи описываются линейными дифференциальными уравнениями с постоянными коэффициентами. При этом часто центральным является следующий вопрос: как изменяется сигнал u\(t) при прохождении через линейную цепь L, т. е. как связаны между собой вход u\(t) и выход U2(t) линейного блока L? При этом электрическая схема может быть очень сложной, с большим числом линейных элементов — резисторов, конденсаторов и ин- дуктивностей. Именно при ответе на этот вопрос в рамках теории линейных цепей на рубеже XIX и XX веков впервые сформировались такие фундаментальные для теории управления понятия, как вход, выход, передаточная функция и частотная характеристика. Заметим, что уравнения (2.4) и (2.8) допускают следующее естественное обобщение: Здесь Л/"(^) и Л1(^) — дифференциальные операторы Μ (j\ и := Nnu{n) + Λίη-ιη(η-1) + . · · + Μύ + M0u, Μ ί^λ и := Мт^т) + Mm-iu{m-l) + ... + Μιΰ + М0Щ 50
где М{ и Mi — некоторые числа. Высказанное ранее замечание о помехоустойчивости блоков (2.4) и (2.8) делает естественным введение следующего ограничения: т < п. Не умаляя общности, можно считать, что λίη = 1. Введем также новые обозначения для входа и выхода: σ — и2, ξ = щ. Еще раз обсудим, как сигнал £(£) перерабатывается линейным блоком L (рис. 2.4), если этот блок задан уравнением »[£)"»(£)<■ (2.10) «О ίσ(ί) Рис. 2.4. Сначала оператор М(-^) действует на функцию ξ(ί): d /(*) = M\jt\ *(')· Далее σ(ί) определяется как решение неоднородного линейного уравнения (2-Й) Ясно, что a(t) определяется неоднозначно по функции £(£). Необходимо, кроме того, задать начальные условия / *(о) \ σ(0) хо = \σ("-1)(0)χχχ/ 51
Вектор хо будем называть начальным состоянием блока L. Таким образом, блок L — это описанный выше оператор, который действует на прямом произведении множеств {№} х Ы - Mi)}. (2.12) Множество входов {£(£)} — это некоторое множество функций, на котором можно определить оператор L. В нашем случае — это функции, имеющие в каждой точке t £ [0, +оо) непрерывную га-ю производную. Тогда функция f(t) = Μ(^)ξ(ί) будет определена и непрерывна в каждой точке t G [0, +оо). Из непрерывности f(t) следует существование решения a(t) уравнения (2.11), которое определено при всех t > 0 и имеет непрерывную n-ю производную. Множество начальных состояний — это некоторое подмножество евклидова пространства. Рассмотрим другое описание блока L, которое позволяет задавать оператор L лишь на множестве непрерывных функций {£(£)}. Используя прежние обозначения, находим оператор L следующим образом: *Ί|)* = *> σ = Μ(ί)ΐ> *о Wn_1)(o)/ (2.13) Здесь вначале определяется функция т?(£) как решение уравнения с начальными данными xq, a затем к этой функции применяется оператор М(^): σ{ί) = Μ(^)τ?(ί). Ясно, что если блок L задан уравнениями (2.13) и функция £(£) имеет га-ю непрерывную производную, то можно перейти 52
к описанию блока уравнениями (2.10). В самом дрле, имеем Покажем теперь, что описание (2.13) является частным случаем уравнений dx л ι/- (2.14) х0 = х(0), σ = с*х, где А — постоянная η χ η-матрица, b и с — постоянные матрицы соответственно размерности η χ πι и η χ /. Операция * означает в вещественном случае транспонирование, а в комплексном случае — эрмитово сопряжение. Введем следующие обозначения: (χι 7/ = χι, τ) = х2, · · · , 7?(η-1) = Хп, ^ = \Хпу Тогда уравнения (2.13) запишем в следующем виде: χι = х2, Хп—1 — Хп? Хп = -Λ/n-iXn-i - ... - Λ/Όχι + f(t), Поэтому здесь А = I ° 0 0 1 0 0 0 1 0 0 0 1 о о о о о о \ \-λίο -Яп-1/ о W 53
/МЛ О V о у х0 '*ι(0)Ν ^п(О). \η{η-1)(0)/ Напомним, что решение уравнения (2.14) может быть записано в следующей интегральной форме (формула Коши): ί x(t) = eAtx0 + Ι' βΑ^-τ^ξ{τ)άτ. Поэтому σ(ί) = c*eAtx0 + ί c*eA^-T^( о τ) dr. (2.15) Рассматривая описание блока L в виде (2.15), естественно приходим к следующему его обобщению: t σ{ί) = α{ί) + j η&τ)ξ{τ)άτ. (2.16) о Здесь a(t) — непрерывная /-мерная вектор-функция из некоторого функционального множества {а(£)}, которое называют множеством собственных выходов (собственных процессов, собственных колебаний) блока. В теории интегральных операторов матрицу-функцию 7(^5т) размерности / χ га называют ядром интегрального оператора t I Ί(ί,τ)ξ(τ)άτ. К описанию вида (2.16) приводится также описание блоков (2.14), когда матрицы А и b зависят от t. В дальнейшем будем рассматривать только случай разностного ядра 54
7(t)T) = 7(t-r). Обычно в теории управления такое ядро j(t) называется импульсной переходной функцией блока. Часто преобразование t J-y(t-T)t(T)dT о называют преобразованием свертки. Итак, среди рассмотренных выше описаний блока L наиболее общим описанием является описание (2.16). В случае когда имеется описание (2.14), получаем a(t) = c*eAtx0, 7(*, r) = c*eA{t-Th. Остановимся теперь на вопросе о том, в каком смысле понимается линейность всех упомянутых выше описаний блока L. Для описания (2.10), (2.13) и (2.14) можно было говорить о линейности блока, поскольку все входящие в описание уравнения линейны. Однако более естественно ввести другое определение линейности, под которое подпадает и описание (2.16). Определение 2.1. Блок L назовем линейным, если любой линейной комбинации любых входов £ι(£) и £г(£) μι£ι(ί)+μ2&(*) соответствует линейная комбинация выходов минус μ\θί\(ί)-\- μ2θί2(ή: μι(σι(ί) - αι(ί)) + μ2Μ*) - a2(t)). Здесь t ai(t) = ai(t)+ jl{t,T)ti{T)dT. о 55
Поскольку описания (2.10), (2.13) и (2.14) блока L могут быть сведены к форме (2.16), а описание (2.16) очевидно линейно, то в силу приведенного здесь определения описания (2.10), (2.13) и (2.14) также линейны. § 2.2. Передаточные функции и частотные характеристики линейных блоков Для линейных блоков, задаваемых уравнениями (2.10) или (2.13), определим передаточную функцию следующим образом. Определение 2.2. Передаточной функцией W(p) линейного блока называется дробно-рациональная функция заданная на комплексной плоскости С. Определение 2.3. Передаточной функцией линейного блока, задаваемого уравнениями (2.14), называется I x п-матрица W(p) = c*(A-pI)-\ (2.18) элементами которой являются дробно-рациональные функции, заданные на комплексной плоскости С. Ясно, что передаточная функция (2.17) определена всюду за исключением точек С, которые являются нулями полинома λί(ρ). Эти особые точки являются полюсами дробно-рациональной функции W(p). Аналогичное суждение имеет место и для W(p), заданной в виде (2.18). Из правила обращения матриц получаем, что элементами матрицы (А — pi)'1 являются выражения <*ij{p) г= Ι,.,.,η, J = Ι,.,.,η, ol\p) 56
где α (ρ) — характеристический полином матрицы А: а(р) = det(p/ — Л), a OL%j{p) — некоторые полиномы, степень которых не превосходит η — 1. Поэтому в рассматриваемом случае элементами W(p) являются дробно-рациональные функции РФ) а(р) 1, ,', J = 1, , га. Полюсами этих функций являются нули полинома а(р). Другими словами, полюсы W(p) здесь совпадают с собственными значениями матрицы А. Для корректности определений 2.2 и 2.3 необходимо показать, что если уравнения (2.10) и (2.13) переписать в виде (2.14), то передаточные функции из определений 2.2 и 2.3 совпадут друг с другом. Для доказательства этого факта вспомним, что в данном случае матрицы Л, b и с имеют вид \ А = ( ° 0 0 0 ^-Л/о · 6 = 1 0 0 1 0 0 0 0 /о\ 0 V ) ? 0 .. 0 .. 1 0 с = . 0 (Мо\ Мт 0 0 0 0 1 -Mr (2.19) V 0 / Для таких матриц А, Ь, с имеет место следующая формула: M0 + Mip + ... + MmPm с*{А-Р1)-1Ь = - det(p/ - A) (2.20) 57
В самом деле, из вида вектора Ь следует, что для вычисления выражения (А — pl)~lb необходима вычислить лишь последний столбец матрицы (А — pl)~l. Из правила обращения матриц вытекает, что этот столбец составлен из алгебраических дополнений последней строки матрицы (ν о о \Λ/Ό о -1 О о о \ О ρ -1 Νη-2{Νη-\+ρ)) поделенных на det(p/ — A). Легко видеть, что искомые алгебраические дополнения равны -р, рп . Поэтому (А-р1)~1Ь= - det(pl - A) I 1 \ Ρ \рп~Х) Отсюда сразу следует формула (2.20). Поскольку легко видеть, что det(p/ - А) = рп + λίη-ιρη-1 + ... + Λ/Ό, окончательно получим равенство М{р) с*{А-р1)-1Ь Щр) (2.21) для матриц, заданных в форме (2.19). Отметим здесь очень важное свойство передаточной матрицы системы (2.14). Теорема 1.1. Передаточная матрица W(p) инвариантна относительно неособых линейных замен χ = Sy (det S φ 0). 58
Доказательство. Выполним линейную неособую замену в системе (2.14) вида χ = Sy. В результате такой замены получим новую систему ^ = S-1ASy + S-1b£i /οοολ dt s (2.22) σ = c*Sy. Составим передаточную матрицу этой системы: Wi{p) = c*S(S-lAS-pI)-lS-lb. Поскольку (S-lAS-pI)~l = (S-lAS-pS~lS)-1 = = (S~l(A - ρηΞ)-1 = S~l(A - pI)~lS, получим, что c*S(S~lAS - pI)-lS~lb = c*(A- pl)~lb. Таким образом, передаточные матрицы W(p) системы (2.14) и W\{p) системы (2.22) совпадают. Из формулы (2.21) и инвариантности передаточных функций относительно линейных замен следует корректность определений 2.2 и 2.3. Рассмотрим теперь линейный блок вида (2.16) с разностным ядром 7(£,Т) =7(t-T). Для определения передаточной функции такого блока необходимо ввести преобразование Лапласа. Для этого рассмотрим множество вещественных непрерывных на [0, +оо) функций {/(£)}, удовлетворяющих следующим неравенствам: |/(*)|<реж* Vt>0. (2.23) Здесь число ρ может быть свое для каждой функции из множества {/(£)}, а число ае — одно и то же для всего множества 59
Определение 2.4. Преобразованием Лапласа называется оператор, заданный на множестве {/(£)} и отображающий каждый элемент этого множества в множество комплекс- позначных функций {д(р)}, заданных на мноэюестве {р\ ре С, Rep>ae} (2.24) по следующему правилу: +оо 9(р)= j е-*№&. (2.25) О Из неравенства (2.23) очевидным образом следует сходимость интеграла (2.25). Естественным образом это определение распространяется на вектор-функции f(t). В этом случае под абсолютной величиной | · | в левой части неравенства (2.23) следует понимать евклидову норму | · |. В этом случае д(р) также являются вектор- функциями, размерность которых совпадает с размерностями вектор-функции f(t). Сформулируем здесь два важных свойства оператора Лапласа, обозначив этот оператор через L: {/(£)} —> {д(р)}· Предложение 2.1. Если функция f(t) из мноэюества {/(£)} имеет непрерывную производную в каждой точке t, то для f(t) таксисе может быть определен оператор Лапласа по формуле +оо £(/(*))= J e-ptf(t)dt, О L(/(t))=pL(/(t))-/(0). (2.26) Доказательство этого утверждения состоит из следующей цепочки равенств: 60
+00 1+оэ +0° /М-оо /* e-^f(t)dt=e-^f(t)\ +р у e-^/(t)di=-/(0)+pL(/(i)). о ° о Таким образом, можно распространить оператор Лапласа с множества {f(t)} на множество {/(£)} U {/(£)}· Однако следует помнить, что интеграл +оо J e-#№dt о не всегда будет сходиться абсолютно. Предложение 2.2. Для функций f\(t) и /г(£) из множества {f(t)} справедлива формула t L{Ih{t"r) /2(r) dr)=L(/i(i)) L(/2(i))· (2·27) о Доказательство этого утверждения состоит из следующей цепочки равенств: t +00 t L(//l(t"T)/2(r)dT) = / e~PtJfl{t~ О 0 0 -r)/2(r) dr dt = / fe-Vfiit - r) /2(r) dt dr = Ω H-oo +00 = J /2(r) У β-*№-τ)άίάτ = 0 τ H-oo +00 = / β-ρτ/2(τ) У e-^h{ti)dhdr = о о H-oo +00 = У e-pT/2(r)dr У e-^h{h)dh = L(f2(t))L(h(t)). 61
Здесь t\ = t — τ, и область Ω имеет вид, изображенный на рис. 2.5, где Ω — сектор, расположенный в первом квадранте, границами которого являются ось абсцисс и биссектриса прямого угла г — t. Рис. 2.5 Заметим, что все несобственные интегралы в этих равенствах абсолютно сходятся в силу неравенства (2.23). Легко видеть, что предложения 2.1 и 2.2 справедливы и для множества матриц-функций или вектор-функций {/(£)}- В этом случае в формуле (2.27) следует предположить, что fi(t) — к χ га- матрица-функция и f2(t) — πι χ /-матрица-функция. Применим теперь развитый здесь аппарат к анализу уравнений (2.13) и (2.14). При этом заметим, что если рассматривать вход £(£), удовлетворяющий неравенству le(t)| < Pieffili Vi>0, то легко видеть, что и для вектор-функции х(£), и для функции т?(£) можно указать числа ае2, р2 такие, что выполнены неравенства x(t)\ < p<ie^\ \rf\t)\ < P2e*2t Vi > 0. (2.28) Здесь г = 0,1, ,η 62
В самом деле, для этого достаточно доказать лишь первое неравенство, а оно следует из оценок \x(t)\ < \етх(0)\ + ι />-г)г>е(т) dr <0ем\х(О)\+ τ τ + /"|еЛ('~т)1 \b\ \ξ(τ)\άτ < Pext\x(0)\+P\b\Plext ί e^'^dr. о о Здесь числа β и λ таковы, что \βΜ\<βεΧί Vt>0. Очевидно также, что из оценок (2.28) следует существование рз, для которого |сг(*)| <p3e^2t Vt>0. (2.29) Конечно, оценки (2.28), (2.29) могут быть получены и другими способами, улучшены и т.д. Для нас сейчас важно, что имеются оценки такого вида. В этом случае, выбирая эе = max(aei,ae2) и полагая начальные условия нулевыми: х(0) = 0 или т/г)(0) = 0, г — 0,1,... , п— 1, получаем в силу предложения 2.1 следующие соотношения: 1) для уравнений (2.13) L(a(t)) = L^M^(t)^ JV(p)L(i,(i)) = L(e(i)), \ L(a(t)) = M(p)L(V(t)), f L(a(t)) = -W(p)mt)); (2.30) 63
(2.31) 2) для уравнений (2.14) L(x(t)) = L(Ax(t) + %(t)), \ L(a(t)) = L(c*x(t)), J PL(x(t)) = AL(x(t)) + bL(!;(t)), L(a(t)) = c*L(x(t)), L(x{t)) = -{A-plTlbLm), \ L(a(t)) = c*L(x(t)), J L{a{t)) = -c*{A-pI)-lbL{i{t)), L{a(t)) = -W{p)LW))· Таким образом, нами установлена очень простая связь между преобразованиями Лапласа входа и выхода линейного блока. Если рассмотреть теперь описание линейного блока (2.16) с разностным ядром η(ί,г) — 7(^ ~~ г): t σ(ί) = α(ί) + ^7(ί-τ)ξ(τ)ιίτ, (2.32) о предположить, что начальное состояние блока таково, что a(t) ξ 0, и воспользоваться предложением 2.2, то получим равенство, аналогичное равенствам (2.30) и (2.31): L(a(i)) = L(7(i))L(£(i)). (2-33) Поэтому естественным представляется следующее определение. Определение 2.5. Передаточной функцией {матрицей-функцией) W(p) линейного блока, описываемого уравнениями (2:32), называется преобразование Лапласа "){t), взятое с обратным знаком: W(p) = -L(7(0). (2-34) 64
Корректность определения следует из того факта, что для уравнений (2.14) η(ί) = c*eAtb, и поэтому +оо L(7(i)) = L(c*eAtb) = ί e-ptc*eAtbdt c*(A-pI)-le(A-vI4 о ι+00 = -c*(A-piylb. lo Здесь мы воспользовались соотношением lim е(А-Р^ = 0, t—>+00 которое следует из предположения, что Rep > ае > maxReXj(A). Здесь \j(A) — собственные значения матрицы з А. Заметим, что передаточная функция W(p), определенная соотношением (2.34) для интегральных операторов (2.32), не всегда является дробно-рациональной, как это имеет место в случае операторов (2.13) и (2.14). Перейдем теперь к определению частотной характеристики линейного блока. Для этого предположим, что ае < 0, и, следовательно, передаточная функция (матрица-функция) определена также и на мнимой оси. Определение 2.6. Функция W(iu) называется частотной характеристикой линейного блока. Наряду с преобразованием Лапласа важную роль во многих разделах прикладной математики играет преобразование Фурье. Часто в теории управления преобразование Фурье определяется так, чтобы оно совпадало с преобразованием Лапласа на мнимой оси: ρ = ιω, т. е. +оо F(f(t))= J e-^f(t)dt. (2.35) 65
Такое определение содержится, например, в книге [172]. В классическом анализе (см. [331]) преобразование Фурье для функций /(£), заданных на (—оо, +оо), определяется как +оо F(№) = -j= j e^mdt. (2.36) — ОО Сравнивая (2.35) и (2.36), можно в (2.35) доопределить f(t) = О на (—оо,0), и тогда образы (F(f))(iu) и (Τ(/))(ιω) одной и той же функции f(t) оказываются связанными соотношением (F(f))(iu) = χ/2π (:F(/))(-io,). (2.37) Такое различие в определениях является, как правило, несущественным, и использование того или другого определения обосновывается только удобством изложения. Здесь будет удобнее использовать определение (2.35). Из формул (2.30), (2.31), (2.33) сразу следует, что при нулевых начальных состояниях блока F(a(t)) = -W(iu)F^(t)). (2.38) Рис. 2.6 66
Определение 2.7. Годографом частотной характеристики W(iu) называется множество всех ее значений на комплексной плоскости С. На рис. 2.6 приведен пример годографа W{iu). Стрелками указано направление, по которому движется значение W{iu) при возрастании ω. Рассмотрим теперь случай, когда вход ξ(ί) является чисто гармоническим. Ограничимся здесь описаниями блоков (2.13) и (2.14) с т = / = 1. Нам удобно также записать £(£) в следующем виде: £(£) = егиЬ. Будем искать решения η(ί) и x(t) в виде т?(£) = V(iu)elut, x(t) — U(iu)elut, где V(iu) — скалярная и U(iu) — векторная величины. Подставляя эти выражения в уравнения (2.13) и (2.14), получаем (А - ίωΐ) υ(ίω)βίωί + beiujt = 0. Эти соотношения будут выполнены, если V(iu) = -^ , и(гш) = -(А - ги1)~1Ь. (2.39) λί(ιω) ч Таким образом, существуют чисто гармонические решения η(ί) и х(£), и выход σ(ί) в силу (2.39) имеет вид σ(ή = 4t7^V е^, σ(ί) = -с*(А - Ш^Ье™. ΛΙ (ιω) Введя частотную характеристику W(iu), окончательно получим a(t) = -W(iu)eiuJt. (2.40) Таким образом, при £(£) = elujt существуют начальные состояния блоков, при которых выход σ(£) определяется по формуле (2.40). Ограничимся рассмотрением случая устойчивых блоков, т. е. будем рассматривать блок (2.13), когда λί(ρ) — устойчивый полином, и блок (2.14), когда А — устойчивая матрица (т.е. все 67
ее собственные значения имеют отрицательные вещественные части). В данном случае для двух решений x\(t) и X2(t) с разными начальными условиями xi(0) и х2(0) имеем (xi(t)-x2(t))#-^(xi(t)-x2(t)). Из свойств матрицы А сразу получаем, что lim (xi(t) -x2(t)) =0. Отсюда следует, что и для соответствующих выходов σ\(ί) и σ2(£) также имеет место равенство lim (σι(ί)-σ2(ί)) =0. (2.41) Так как уравнения (2.13) являются частным случаем описания (2.14), получаем, что (2.41) справедливо и для описания блока (2.13). Из (2.40) и (2.41) следует, что для устойчивых блоков при ξ(ί) = eiujt и любых начальных условиях lim (σ(ί) + W(iu)eiujt) = 0. (2.42) Из формулы (2.42) следует, что для устойчивых блоков частотную характеристику можно определять экспериментально. Для этого нужно на вход блока подать гармонический сигнал £(£) = elujt. После этого подождать некоторое время, пока на выходе не установится некоторый гармонический сигнал а(*) = ЛНе^+а^. Здесь Α(ίω) — вещественная положительная величина, Α(ίω) является амплитудой сигнала, α(ίω) — сдвигом его по фазе. Ясно, что А(ги) = |W(iu;)|, α(ΐω) = π + argVK(iu;). 68
По этим формулам однозначно определяется комплексное число W(iu). Прогоняя ω от —оо до +оо, получаем годограф W(iu). (На самом деле, из-за очевидного свойства lim W(iu) = 0 ω->+οο необходимо проводить эту прогонку только на конечном промежутке изменения ω). Таким образом, для получения указанным путем частотной характеристики не нужна информация о коэффициентах полиномов Μ (ρ) и λί(ρ) или о матрице А и векторах бис. Поскольку многие результаты в теории управления формулируются в терминах частотных характеристик, то для них не требуется описание блоков дифференциальными или интегральными уравнениями, а нужна кривая на комплексной плоскости, которая является годографом частотной характеристики. Часто оказывается, что частотная характеристика позволяет однозначно определить такие уравнения. Пусть, например, априори известно, что полиномы М(р) и λί(ρ) в описании (2.13) не имеют общих множителей. Тогда по W(iu) однозначно определяется W(p) (принцип аналитического продолжения), а по дробно-рациональной функции W(p) однозначно (с точностью до общих множителей) определяются полиномы ЛЛ(р) и ЛГ(р).
Глава 3 УПРАВЛЯЕМОСТЬ, НАБЛЮДАЕМОСТЬ, СТАБИЛИЗИРУЕМОСТЬ § 3.1. Управляемость В этой главе будет продолжено изучение линейных систем. Будут приведены понятия и результаты, ставшие в настоящее время неотъемлемой частью современных учебников по теории управления. Эти концепции будут продемонстрированы на линейных блоках, описание которых было рассмотрено в главе 2: Τΐ=Αχ + Κ> (3.1) σ = с*х. Здесь А — постоянная η χ η-матрица, b — постоянная η χ m-матрица, с — постоянная η χ /-матрица, £(£) — m-мерная вектор-функция, которую мы трактуем как вход блока. Таким образом, выход блока σ(ί) — /-мерная вектор-функция. Определение 3.1. Будем говорить, что система (3.1) вполне управляема, если для любого числа Τ > 0 и любой пары векторов хо Ε Κη, х\ Ε Rn существует вектор-функция £(£) такая, что для решения x(t) системы (3.1) с этой вектор- функцией £(£) и начальными данными х(0) = хо выполнено равенство х(Т) = х\. 70
Итак, система (3.1) вполне управляема, если ее вектор состояния x(t) можно перевести за любое конечное время Τ из произвольного начального состояния xq в конечное состояние х\ за счет подаваемого на вход управления £(£). Теорема 3.1. Следующие условия эквивалентны друг дру гу и каждое из них является необходимым и достаточным условием для полной управляемости системы (3.1): 1) ранг η χ пт-матрицы (6, АЬ,..., An~lb) равен п: тпЦЪ,АЬ,...,Ап-1Ь) = щ (3.2) 1') из равенств z*Akb = 0 Vfc = 0,... , η - 1, где ζ е Rn, следует, что ζ = 0; 2) линейная оболочка L, натянутая на η-векторы, составляющие матрицу емЬ при t G R1, совпадает с W1: L{eAtb | t е (-оо, +оо)} - Rn; (3.3) 2') для любых чисел τ\ < τ<ι L{eAtb\ 1е(тът2)}=Шп; (3.4) 3) для любых чисел т\ < τ<ι следующая матрица является симметричной и положительно определенной: К= fe-Atbb*e-A4dt>0. (3.5) Перед тем как доказывать эту теорему, напомним, что линейной оболочкой L{ai,..., α/c}, натянутой на векторы αϊ,..., α^, называется множество всевозможных линейных комбинаций к этих векторов { ^ Oijdj\ ay GR1}. 71
Векторы αϊ,..., α& матрицы eAtb зависят от t: αι(£),..., a/c(t). Поэтому соотношению (3.3) можно дать следующую геометрическую интерпретацию. Каждому из векторов a,j(t) соответствует кривая в Rn. Соотношение (3.3) эквивалентно тому факту, что все эти кривые нельзя целиком расположить на некотором линейном подпространстве, размерность которого меньше п. Напомним здесь также, что симметричная матрица К называется положительно определенной: К > 0, если соответствующая квадратичная форма ζ* Κ ζ является положительно определенной: ζ* Κ ζ > О Vz E Rn, ζ φ 0. Доказательство теоремы 3.1. Заметим сначала, что свойство 1') является простой переформулировкой свойства 1). Ясно, что из свойства 2') вытекает свойство 2). Предположим теперь, что свойство 2') не выполнено. Это означает, что существует вектор ζ G Μη, ζ φ 0, для которого z*eAtb = 0 Vt E (ть^)· Поскольку вектор-функция z*eAtb является аналитической, в силу принципа аналитического продолжения имеем тождество z*eAtb = 0 Vt G Μ1. Последнее означает, что не выполнено свойство 2). Итак, эквивалентность свойств 2) и 2') доказана. Докажем теперь, что из свойства полной управляемости вытекает соотношение (3.3). Пусть (3.3) не имеет места. Тогда существует ненулевой вектор ζ eRn такой, что z*eAtb = 0 Vt e R1. Напомним, что решение x(t) системы (3.1) можно записать в форме Коши: t x(t) = eAt (х(0) + ί е-АтЪ£(т) dr\ . (3.6) о Зафиксируем некоторое число Τ > 0 и положим в определении полной управляемости х(Т) — х\ — 0. В этом случае соотно- 72
шение (3.6) можно переписать в следующем виде: τ хо + Iе-АтЪ£(т)ат = 0. (3.7) о Умножим обе части этого равенства на вектор г*: τ ζ*χ0 + ί г*е-АтЪ£(т) dr = 0. (3.8) о Поскольку z*eAtb = 0 Vt £ R1, из равенства (3.8) следует, что г*хо — 0· Последнее равенство не может быть выполнено, так как хо — произвольный вектор из Шп. Таким образом, если не выполнено (3.3), то система (3.1) не является вполне управляемой. Следовательно, из полной управляемости вытекает равенство (3.3). Докажем теперь, что из свойства 2) следует свойство 1). Предположим, что свойство 1) не выполнено. Тогда не выполнено и свойство 1/), и, следовательно, существует ненулевой вектор ζ G Mn, для которого z*Akb = 0 Vfc = 0,... , η — 1. Покажем, что и z*Anb = 0. Для этого привлечем тождество Кэли Ап + δη-χΑ"-1 + ... + ίιΑ + δ01 = 0, (3.9) где 6j — коэффициенты характеристического полинома матрицы А. Из (3.9) следует, что z*Anb = -6n-iz*An-lb - ... - δ0ζ% = 0. (3.10) Умножая обе части равенства (3.9) на матрицу Л, используя (3.10), получаем z*An+lb = Sn-iz*Anb - ... - S0z*Ab = 0. 73
Продолжая аналогичную процедуру, далее покажем, что z*Akb = 0 для любого натурального к. Отсюда сразу следует, что ^ к\ ^ к\ к=0 к=0 Таким образом, свойство 2) также не выполнено. Итак, доказано, что из свойства 2) следует свойство 1). Докажем теперь, что из свойства 1) следует свойство 3). Пусть свойство 3) не выполнено, т. е. существует ненулевой вектор ζ G Mn, для которого ζ*Κζ= ί z*e-Atbb*e-A4zdt = 0. Последнее равенство можно переписать следующим образом: Т2 [\z*e-Atb\2dt = 0. Отсюда следует, что z*e~Atb = 0 Vt £ (τι,Τ2). Но тогда, как уже отмечалось в самом начале доказательства, z*eAtb = 0 для всех ί G К1. Продифференцировав выражение z*eAtb к раз, получим отсюда тождества z*AkeAtb = 0 Vt £ R1, к = 0,1,... Полагая здесь t = 0, получаем равенства 2*6=0, zM6=0, ... ,z*An~lb — 0. Последнее означает, что свойство 1) не выполнено. Таким образом, из свойства 1) следует свойство 3). Докажем, что из свойства 3) следует полная управляемость. Для этого выберем управление ξ(ί) в виде ξ(ί) = Ь*е~А'%, где вектор £о будет определен позже. 74
Из формулы Коши вытекает, что „„^,,./.-,.,.,.4 О Последнее равенство можно переписать следующим образом: е~АТхх - хо = Κξ0. (3.11) Поскольку согласно (3.5) det К φ О, уравнение (3.11) всегда разрешимо и при ξο = Κ-\ε-ΑΤχι-χ0), получаем требуемое уравнение £(£), которое переводит за время Τ решение x(t) из состояния х(0) = хо в состояние х(Т) = х\. Таким образом, мы получили следующую цепочку соотношений: Полная управляемость => 2) => 1) => 3) =Ф- =Ф· полная управляемость. Теорема доказана. Приведем еще несколько важных свойств полной управляемости. Теорема 3.2. Следующие условия эквивалентны друг другу и каждое из них является необходимым и достаточным условием для полной управляемости системы (3.1): 4) линейная оболочка L, натянутая на комплекснозначные η-векторы, составляющие матрицу (pi — А) Ь при ρ £ С, ρ φ Aj(A), совпадает с n-мерным унитарным пространством Сп: L{(pI-A)-lb\peC, ρφλ^(Α)} =Сп. (3.12) Здесь Xj(A) — собственные значения матрицы А. 75
А') для любого множества Ω С С, имеющего предельную точку, отличную от Xj(A), выполнено равенство L{(pl - A)~lb I p e Ω} - Cn; (3.13) 5) не существует неособой η χ η-матрицы S такой, чтобы матрицы S~lAS и S~lb имели следующую структуру: 6) rank(go, · · · ?9η-ι) — n, где qj — коэффициенты полинома qn-lPn-1 + ... + q0={ det(pl - A)) (pi - А)~\ 7) не существует вектора ζ φ О, для которого выполнены равенства Α* ζ — λζ, z*b = О, где λ — некоторое число. Доказательство. Сначала докажем эквивалентность свойств 4) и 4'). Для этого достаточно показать, что из свойства 4) следует свойство 4'). Предполагая противное, получаем существование ненулевого вектора ζ £ Сп, для которого ζ*(ρΙ-Α)~^ = 0 Vpeft. Из аналитичности z*(pl — A)~lb на Ω в силу принципа аналитического продолжения имеем тождество z*{pI-A)~lb = Q Vp^Xj(A). Последнее означает, что свойство 4) не выполнено. Таким образом, из свойства 4) следует свойство 4'). Докажем теперь эквивалентность свойств 1') и 4). Для этого предположим, что не выполнено свойство 4') с Ω = {ρ\ ί-4 < l}. В этом случае существует ненулевой вектор ζ £ Сп такой, что z*(pI-A)-1b = 0 Vpett. (3.14) 76
Поскольку при |р| > \А\ справедливо разложение ±ζ*(ΐ-±)~\=±ζ*(ΐ+± + ^ + ..)^ (3.15) Ρ V Ρ J Ρ \ Ρ Ρ2 J из (3.14) и (3.15) получаем равенство *, z*Ab z*A2b w ,n ч z*b + + —5— + ... = 0 Vp G Ω. (3.16) ρ рг Это равенство можно рассматривать как разложение нуля в ряд Лорана с коэффициентами z*Akb. Поскольку такое разложение единственно, отсюда получаем, что z*Akb = О, Vk = 0,1,... Таким образом, если не выполнено свойство 4), то не выполнено и свойство 4') с введенным выше Ω, а отсюда не выполнено свойство 1'). Если же не выполнено свойство 1'), то, как было показано с помощью тождества Кэли в доказательстве теоремы 3.1, равенства z*Akb = 0 выполнены не только для к — 0,..., п — 1, но и для всех натуральных к. Отсюда следует соотношение (3.16). Но тогда, используя разложение (3.15), находим, что z*(pl -А)~1Ъ = Ъ V реП. Таким образом, если не выполнено свойство 1'), то не выполнено и свойство 4'). Эквивалентность свойств V) и 4) доказана. Докажем теперь эквивалентность свойств 1) и 5). Пусть свойство 5) не выполнено. В этом случае, введя обозначения 6 = 5_16, A = S~lAS, получаем равенства Akb = s-iAss-iAs...s-iAss-ib = s-iAkb. 77
Поэтому (6, Д ..., An~l b) = 5"1 (6, ЛЬ,..., Лп-Ч). (3.17) Из предположений относительно матриц А и Ь сразу следует, что матрица (6, ЛЬ,..., Ап~1 Ь) имеет следующую структуру: Поэтому rank(6, Д..., Αη~ι Ь) < п. Из равенства (3.17) и невырожденности матрицы S вытекает, что rank(b, Д ..., Ап~1 Ь) = rank(6, АЪ,..., Ап~1Ъ). Следовательно, rank(fr, АЪ,..., Лп-16) < п, и, таким образом, не выполнено свойство 1). Пусть теперь не выполнено свойство 1) и rank(6, Л6,..., Ап~1Ъ) = г < п. В этом случае найдется неособая матрица 5 такая, что S~\b,Ab,...,An-lb)={^j, (3.18) где Q — некоторая г χ пга-матрица, а 0 — нулевая матрица размерности (п — г) χ пт. Покажем, что в этом случае матрицы *~гч*-{% £). *-*-'»-β) ■ где S — неособая матрица, удовлетворяющая равенству (3.18), А21 — (п —г) χ г-, Ь2~ (п — г)х m-матрицы, таковы, что А21 = О И Ь<1 = 0. 78
Отметим, что здесь выполнено равенство (3.17). Отсюда и из (3.18) получаем, что (6,Д...Д"-16)=(^. (3.19) Следовательно, Ь2 — 0, и поэтому Отсюда и из (3.19) получаем, что ^421 ^ι=0. Используя это равенство, находим A4 = A(Ab)=(AA*l\). v ' \A2iAnbi) Отсюда и из (3.19) получаем, что А2\А\\Ь\ = 0. В этом случае Сравнивая это выражение с (3.19), получаем Α2\Α\^\ = 0. Продолжая эту процедуру, далее получаем равенства A2iA\lbl^Q Vfc = 0,l,...,n-2. (3.20) Поскольку Ац — г χ r-матрица из тождества Кэли, получаем, что А™^1 является линейной комбинацией матриц А™^ ,..., Ац,1. Отсюда и из (3.20) следует, что А21А^~1Ь1=0. (3.21) Поскольку выше доказано, что Q = (6bi41161)...)^f161) и rankQ = г, из равенств (3.20) и (3.21) следует, что матрица А21 аннулирует все векторы ζ G Rr: A2iz = 0 VzeRr. 79
Отсюда следует, что А21 — 0. Таким образом, нами доказано, что если не выполнено свойство 1), то не выполнено и свойство 5). Эквивалентность свойств 1) и 5) доказана. Эквивалентность свойств 4) и 6) почти очевидна. Если не выполнено свойство 6), то существует ненулевой вектор ζ £ Сп такой, что z*qj = 0 Vj = 0,...,n-1. (3.22) Но тогда ζ*(ρΙ-Α)~4 = 0 Vp^Xj(A). (3.23) Это означает, что не выполнено свойство 4). Если же не выполнено свойство 4), то существует ненулевой вектор ζ £ С7\ для которого имеет место равенство (3.23). Но тогда z*qn-lPn-1 + ... + z*q0 = 0 Vp G С. Отсюда следует равенство (3.22) и невыполнение свойства 6). Докажем эквивалентность свойств 1) и 7). Если существует ненулевой вектор 2£СП, для которого z*b = 0 и A*z = \z, то z*Akb = \kz*b = 0 Vifc = l,... Отсюда следует невыполнение свойства 1'). Пусть не выполнено свойство 1). Обозначим через L линейную оболочку, натянутую на вектор-столбцы матрицы (Ъ,АЪ,...,Ап-1Ъ). Из тождества Кэли следует, что AL = L, а из невыполнения свойства 1) вытекает, что dimL < п. Обозначим через ΐΛ линейное подпространство, ортогональное к L. Ясно, что dimL-1- > 0, 4*ΐΑ = L1- и z*b = 0 Vζ е lA Воспользуемся теперь тем фактом, что в инвариантном линейном подпространстве существует хотя бы один собственный вектор ζ: Α*ζ = \ζ, ζ e L1^. 80
Отсюда и из равенства z*b = О V ζ G ΖΑ следует невыполнение свойства 7). Теорема доказана полностью. § 3.2. Наблюдаемость Перейдем теперь к понятию полной наблюдаемости. Определение 3.2. Система (3.1) называется полностью наблюдаемой, если для любого числа Τ > 0 из соотношений ξ(ί) = 0, σ(ί) = 0 Vie [О,Τ] следует, что x(t) = 0 Vt G [0,Τ]. Поясним это определение. Ясно, что при £(£) = 0 на [О, Т] и начальном условии х(0) = О имеем x(t) = 0 Vt G [О,Τ] и, следовательно, σ(£) = c*x(t) = 0 Vt G [0,Τ]. Однако может оказаться так, что нулевое решение x{t) является не единственным, для которого выход σ(£) оказывается нулевым. Для таких систем по выходу σ{ί) невозможно однозначно определить состояние x(t). Они называются ненаблюдаемыми. Иногда для определения полной наблюдаемости используют следующее эквивалентное данному в определении 3.2 свойство. Теорема 3.3. Для полной наблюдаемости системы (3.1) необходимо и достаточно, чтобы для любого Τ > 0 из равенств 6 (*) = &(*), σι(ί) = σ2(ί) Vie [О, Τ] вытекало тождество x1(t) = x2(t) VtG [О,Τ]. Здесь x\{t) — решение системы (3.1) с вектор-функцией ξι(£) такое, что &\(t) = c*x\(t). Аналогично X2(t) — решение системы (3.1) с вектор-функцией £2(0 такое, что ^(t) = c*X2(t). 81
Доказательство. Для доказательства достаточно показать, что из полной наблюдаемости следует сформулированное в теореме свойство. Для этого вычтем из системы — = j4xi + bfi, σι = с χι систему dx2 ал*. * — = Ах2 + Ь&, а2 = с х2. В результате имеем d(xi - х2) Α(Χι-Χ2) + Κξ1-ξ2), dt (σι -σ2) = c*(xi -x2). В силу полной наблюдаемости этой системы получим, что из равенств 6(*)-&(*) = (>, σι(ί)-σ2(ί) = 0 Vie [Ο,Τ] вытекает соотношение xi(t)-x2(t) = 0 Vie [Ο,Τ]. Но тогда ясно, что из &(*) = &(*), σι(ί) = σ2(ί) Vie [Ο,Τ] следует X!(t) = x2(t) VtG [Ο,Τ]. Теорема доказана. Как уже было замечено, свойство полной наблюдаемости можно сформулировать таким образом: из равенств £(£) = О, a(t) — 0 Vt G [Ο,Τ] следует равенство х(0) = 0. Вспоминая, что a(t) = c*eAt [х(0)+ ie-Arb^(r)dr 82
отсюда при a(t) = 0 и ξ = 0 получаем выполнение равенства с*ежх(0) ξ 0. (3.24) Таким образом, система (3.1) полностью наблюдаема тогда и только тогда, когда из равенства (3.24) следует, что х(0) = 0. Переписав (3.24) в виде х(0)* еАЧс = 0 и сравнив его со свойством 2) полной управляемости в теореме 3.1, сразу получим следующую теорему. Теорема 3.4. Для полной наблюдаемости системы (3.1) необходимо и достаточно, чтобы L{eA4c | t е (-оо, +оо)} - Rn. (3.25) С помощью этого результата легко переформулировать свойства 1)—7) полной управляемости в теоремах 3.1 и 3.2 в свойства полной наблюдаемости. Заметим также, что из этих результатов следует, что свойство полной управляемости можно сформулировать только в терминах матриц А и Ь, а свойство полной наблюдаемости — в терминах Лис, абстрагируясь от системы (3.1). Поэтому можно ввести в рассмотрение полностью управляемые пары матриц (Д 6), подразумевая при этом выполнение свойства 1) (или какого-либо другого эквивалентного свойства 2)—7)). Введем в рассмотрение также полностью наблюдаемые пары матриц (Л, с), подразумевая при этом выполнение соотношения (3.25) (или какого-либо другого эквивалентного ему свойства). В этом случае из теоремы 3.4 вытекает следующий результат. Теорема 3.5 (двойственности Калмана). Для полной наблюдаемости пары (Л, с) необходимо и достаточно полной управляемости пары (Л*, с). 83
Рассмотрим систему (3.1) в том случае, когда т = 1, т. е. Ь — вектор. Важным является следующий признак полной управляемости и полной наблюдаемости, сформулированный в терминах передаточной функции. Теорема 3.6. Для полной управляемости и полной наблюдаемости системы (3.1) необходимо и достаточно, чтобы полиномы det(p/ — А) и W(p) det(pl — А) не имели общих нулей. Доказательство. Пусть полиномы det(pl — А) и W(p)x χ det(p/ — А) имеют общий нуль ρ = р0. Тогда для полинома q(p) = det(pl - A)(pl - A)~lb справедливо равенство Aq(po) =poq(po)· Если пара (Л, b) не полностью управляема, то в одну сторону теорема доказана. Теперь предположим, что полная управляемость существует. Тогда из свойства 6) полной управляемости коэффициенты qj полинома q(p) — линейно независимые векторы, и поэтому q(po) φ 0. Кроме того, c*q(p0) = άβί(ρ0Ι-Α)ο*(ΡοΙ-Α)-^=-άβϊ(ρ0Ι-Α) W(p0) = 0. Итак, получен ненулевой вектор q(po) со следующими свойствами: А я(Ро) = Ро <?(Ро), с* q(p0) = 0. Используя теорему двойственности Калмана и свойство 7) полной управляемости, получаем, что пара (А, с) не полностью наблюдаема. Докажем теперь, что если система (3.1) не полностью управляема, то соответствующий общий нуль ρ = ро существует. 84
Пусть пара (Л, Ь) не полностью управляема. Тогда в силу свойства 5) полной управляемости существует неособая матрица S такая, что A=S~'AS=^ £). i-*-»-(*). При этом Для W{g) в силу ее инвариантности относительно замены Л, 6, с на Л, 6, с имеем W(p) = с*{А-Р1)-Ч = с* ((Лп "J0"'61) = с\(Ап-р1Г%. Отсюда следует, что при вычислениях знаменатель det(p/ — А) передаточной функции W(p) сократился с числителем, поскольку знаменатель det(pI—An) имеет степень, меньшую, чем п. Таким образом, полиномы det(p/ — А) и det(p/ — A) W(p) имеют общий нуль. Случай, когда пара (Л, с) не является полностью наблюдаемой, рассматривается аналогично. Обсудим теперь вид системы (3.1), если она не полностью управляема и в силу свойства 5) полной управляемости существует матрица 5, для которой Выполним в этом случае линейную замену x = Sy, У=(^)> (3-27) где размерность вектора у\ равна размерности столбцов матрицы Ь\. В этом случае y = S~1ASy + S-1bt, σ = c*Sy, 85
и с учетом (3.26) и (3.27) У1 = Anyi + А12у2 + 6ιξ, У2 = А22У2- Таким образом, в не полностью управляемой системе может быть выделена подсистема Ш = 422 2/2, в которой отсутствует управляющее воздействие. § 3.3. Стабилизируемость Рассмотрим теперь вопрос о том, можно ли стабилизировать систему (3.1), т. е. сделать ее устойчивой за счет выбора управления £, которое формируется как линейная комбинация координат вектора состояния х: ξ = 5*х. Здесь s — постоянная η χ га-матрица. Для этого докажем следующее вспомогательное утверждение. Пусть заданы квадратные η χ η-матрица Лигах га-матрица D, η χ га-матрица Вигах η-матрица С. Лемма 3.1 (лемма Шура.) Если det А φ 0, то det (Л ^\ = det A det(D - С А'1 В). (3.28) Если det D φ 0, то det (Л ВЛ = det D aet(A - BD~lC). (3.29) 86
Доказательство. Пусть Q — —А 1В. Тогда А В\ (In Q\ = (A 0 \ С DJ \0 1т) \С D-CA~1b)' Отсюда сразу следует (3.28). Доказательство равенства (3.29) проводится аналогичным образом. Следствие 3.1. Если К и Μ — η χ т-матрицы, то det(/n + KM*) = det(/m + Μ* Κ). (3.30) Доказательство. Используя (3.28), получаем det (J^ f) = det In det(/m + M*K). Из (3.29) находим det (^ f\ = detlmdet(ln + KM*). Из двух последних равенств следует (3.30). В случае если ξ = s*x, -£ = (A + bs*)x, σ = с* х и характеристический полином матрицы A+bs* принимает вид det(pI-A-bs*) = det(pI-A) det(Im + s*(A-pI)-1b). (3.31) Здесь использовано соотношение (3.30). Следующая теорема утверждает, что в случае т = 1 для полностью управляемой системы стабилизация подбором 5 возможна всегда. Более того, за счет выбора s можно сделать каким угодно характеристический полином матрицы А + bs*. 87
Итак, введем в рассмотрение многочлен степени п: Ф(р) =РП + Фп-\Рп~1 + ... + ψο. Теорема 3.7. Пусть т = 1 и пара (А,Ь) полностью управляема. Тогда для любого полинома ф(р) существует вектор 5GRn такой, что det(pl - А - bs*) = ф(р). (3.32) Доказательство. Напомним обозначение q(p) = (det(pl_-A)) (pI-A)-\ q(p) = qn-iPn * + · · · + qo· Из (3.31) следует, что det(p/ - А - 6s*) = det(p/ -A)- s*q(p). Поэтому для доказательства теоремы достаточно показать разрешимость системы Фз =δ3 -s*qj, j = 0,...,n- 1. (3.33) Здесь Sj — коэффициенты полинома det(p/ — А): det(p/ - А) = рп + δη-ΐΡη-1 + ... + ίο- Так как пара (Л, 6) полностью управляема по свойству 6) управляемости, векторы qj линейно независимы и, следовательно, искомый вектор s определяется так: s = /riV1 V?n-l/ / δ0-φο \δη-ι -Ψη-ι, Теорема доказана.
Часто в задачах управления столь широкий выбор формирования управления ξ невозможен. Гораздо чаще в нашем распоряжении имеется информация только о выходе, и формирование управления ξ происходит так: ξ = μσ (рис. 3.1). Здесь μ — некоторая πι χ /-матрица. Таким образом, матрица s имеет специальный вид Будем предполагать, что характеристический полином δ(ρ) матрицы А не имеет нулей на мнимой оси. Число его нулей справа от мнимой оси обозначим через кр. Число кр будем называть степенью неустойчивости разомкнутой системы. С точки зрения теории управления случай, когда μ = 0, удобно трактовать как размыкание обратной связи (см. рис. 3.1). ξ L ξ=μσ \ 1 σ Рис. 3.1 Число нулей справа от мнимой оси полинома det (pi -А- bμc*) будем обозначать через /сз и называть степенью неустойчивости замкнутой системы. 89
Применив формулу Эрмита—Михайлова (см. главу 1) к обеим частям равенства (3.31), которое перепишем в виде det(p/ - А - bμc*) = δ(ρ) det (lm + μ W(p)), получим π(η — 2&з) = π(η - 2fcp) + 2πΑ;0. Здесь AArg det(7m + μ\ν(ίω)) |ί~ ϋ 2π Заметим, что для применения формулы Эрмита—Михайлова требуется, чтобы det(iul - Л- Ъμc*) ^0 У ω <Ε R1. Это соотношение здесь выполнено, если det (Im + μ W(icu)) ^ 0, cueR1. (3.34) Итак, окончательно получаем следующий результат. Теорема 3.8. Пусть δ(ίω) ^0 Vo; e R1 (3.35) и выполнено неравенство (3.34). Тогда имеет место формула Найквиста кз = кр — ко. (3.36) Из этой формулы следует Критерий Найквиста. Для устойчивости системы (3.1) в предположениях (3.34), (3.35) необходимо и достаточно, чтобы кр = ко. Популярность критерия Найквиста обусловлена его геометрической интерпретацией в случае т = / = 1. 90
μΛ+ψ{ιω) Рис. 3.2 Напомним, что часто вместо описания блока в виде дифференциальных или интегральных операторов задается годограф частотной характеристики на комплексной плоскости (рис. 3.2). В случае т = / = 1 число ко может быть записано следующим образом: ко = Δ Argfa^ + Wiiu))]* оо 2π Отсюда и из рис. 3.2 видно, что ко — это число обходов против часовой стрелки вектора, начало которого находится в точке —μ-1, а конец расположен на годографе W(i(j), когда мы проходим весь путь по годографу при изменении ω от — оо до +оо. В случае, изображенном на рис. 3.2, ко — 1. Поскольку кр находится с помощью формулы Эрмита—Михайлова, критерий Найквиста является эффективным критерием стабилизации линейных систем. В заключение этой главы заметим, что определения управляемости и наблюдаемости можно ввести и для более общих систем, чем (3.1). В нелинейных обобщениях этих понятий вместо математической техники, оперирующей линейными подпространствами, весьма естественным образом вводятся гладкие многообразия. Такой подход изложен в книгах [408, 437]. 91
Критерий Найквиста является частью линейной теории, которая содержится во многих учебниках по теории управления. Укажем здесь, например, книги [4, 227, 348, 391, 392, 436, 444, 461].
Глава 4 ЭЛЕКТРОННЫЕ ГЕНЕРАТОРЫ КОЛЕБАНИЙ § 4.1. Управление колебательным контуром. Автогенераторы Если рассмотреть RLC — цепь с нулевым сопротивлением R = 0 и нулевым входом u\(t) = 0 (рис. 2.2), то на выходе будут гармонические колебания 142 (*) = A) sm(ut + φο)- Здесь величины Ло и с/?о, называемые амплитудой и начальной фазой соответственно, зависят от начальных состояний блока г/2(0) и ^2(0)· Число ω (так называемая круговая или циклическая частота) определяется по формуле 1 Эти факты следуют из элементарного анализа решений линейного уравнения второго порядка (2.8). Такие LC — цепи часто называют колебательными контурами. Они служат основой для создания генераторов радиотехнических колебаний с заданной частотой ω. Однако для радиотехники оказалось необходимым генерировать гармонические колебания с заданной амплитудой Aq. 93
Заметим, что линейная цепь в виде колебательного контура не может выполнить эту задачу. В этом случае Ао зависит от начальных данных и не устанавливается после переходного процесса как некоторое заданное число. Первые системы управления генераторами были изобретены Мейсснером в 1913 году [341]. В дальнейшем генераторы с такими автоматическими системами управления стали называть автогенераторами. Рассмотрим одну из таких систем управления LC —- цепью, выполненную из триода, катушки индуктивности Μ и источника питания е.(рис. 4.1) «2(0 Рис. 4.1 Здесь Μ — коэффициент взаимной индукции, е — напряжение, создаваемое источником питания, га — анодный ток. Он возникает вследствие того, что катод подогревается небольшой батареей и испускает электроны. Эти электроны достигают анода через управляющую сетку и создают анодный ток Работа триода описывается вольт-амперной характеристикой f(u): 94
Здесь и = Vg + DVa, где D — постоянная из интервала (0,1), зависящая от конструкции и материала триода, Vg — напряжение между сеткой и катодом, Va — напряжение между анодом и катодом. Характеристика f{u) является нелинейной функцией, график которой изображен на рис. 4.2. Ui и2 Рис. 4.2 Горизонтальные участки графика соответствуют эффекту запирания триода (и < щ < 0) и эффекту насыщения (и > г^)· Рабочей зоной триода является окрестность точки ео, которая является точкой перегиба: /"(ео) = 0. Поэтому обычно принимают, что в рабочей зоне триода выполнено соотношение f(u) = а(и - е0) - Ь(и - е0)3. Здесь а и Ь — некоторые положительные числа. В силу закона Кирхгофа ^а — 2-L ~~ ^сч (4.1) (4.2) где il и гс — токи в цепях катушки индуктивности и конденсатора соответственно. Из закона катушки индуктивности имеем следующие соотношения между напряжениями Vgi Va и током %l Vg = M(iL)\ (4.3) 95
-L(iLy = Va-e = u2. (4.4) Из закона конденсатора имеем гс = Сй2 = -LC(iL)··. (4.5) Из соотношений (4.2) и (4.5) получим равенство LC(iL)" + iL = ia. Отсюда и из (4.1) вытекает следующее дифференциальное уравнение LC(iL)" + iL = a(u - е0) - Ь{и - е0)3, (4.6) Tppu = Vg + DVa. Обычно выбирают параметры системы управления так, чтобы De = ео- Тогда из (4.3), (4.4) и (4.6) получим уравнение LC(iL)" - а(М - DL)(iL)9 + Ъ(М - DL)3((iL)9)3 + iL = 0. Сделав замену времени t = (LC)1'2t, преобразуем это уравнение к следующему виду (iLr-a(iL)9 + P((iL)*)3 + iL = 0, где a(M-DL) n b(M-DL)3 y/LC {y/LCf Параметры системы управления выбирают так, чтобы а — ε, β = ρε. Здесь ε — малое число, ρ — некоторый параметр, который определяется требуемой амплитудой выхода U2(t). Таким образом, автогенератор описывается дифференциальным уравнением χ - ε(1 - рх2)х + х = 0, (4.7) где χ = %l. Неуправляемый генератор описывется этим уравнением при ε = 0. 96
(4.8) Рассмотрим теперь систему второго порядка х = у у = е(1- ру2)у - х, эквивалентную уравнению (4.7), и функцию У = у2 + х2. Рассмотрим далее решение х(£), y(t) системы (4.8) с начальными данными х(0) = ХО) у(0) = 0 на промежутке времени [0,2π]. В силу теоремы о непрерывной зависимости решений от параметра и учитывая малость этого параметра получим, что x(t) = xo cos t + g\ (£, ε) y(t) = -xosmt + g2(t,e). Здесь 5j(i, ε) —> 0 при ε —> 0 на промежутке времени [0, 2π]. Для функции V(x(t),y(t)) имеем V(x(t),y(t)) = 2s(l-py(t)2)y(t)2. Отсюда следует соотношение V(x(2ir),y{2ir))-V(z0,0) = = 2ε 2π 2тг xl / (sini)2 dt - px% / (sini)4 dt + g(e) (4.9) VO 0 Здесь g{e) — некоторая функция такая, что д(е) —> 0 при ε —> 0. Из соотношения (4.9) следует, что при pxl < у + д{е) выполнено неравенство ν(χ(2π),ν(2π))>ν(χ0,0) (4.10) (4.11) 97
и при рх20>и + д{е) (4.12) имеет место неравенство V(x(2n),y(2n))<V(x0,0) (4.13) Здесь 2π / 2π у= (sintfdt I /(sint)4 , dt 0 \0 #(ε) — некоторая функция такая, что lim α(ε) = 0. Из соотношений (4.10)—(4.13) следует, что траектории системы (4.8) с начальными данными х(0) = Хо? у(0) = 0 при выполнении (4.10) "раскручиваются"при увеличении времени £, приближаясь при t —> +оо к некоторой малой окресности множества (рис. 4.3) Ω {*+,-$ Траектория х(£), y(t) с начальными данными х(0) = хо? у(0) =0 при выполнении (4.12) "закручивается"при увеличении времени £, приближаясь при t —> +оо к малой окрестности множества Ω (рис. 4.4) Таким образом, после переходного процесса в автогенераторе устанавливаются близкие к гармоническим колебания с амплитудой \Jvjр. Поскольку ρ — параметр, который можно варьировать, подбирая исходные параметры системы управления, мы можем синтезировать автогенератор, генерирующий колебания U2(t), близкие к гармоническим с заданной частотой ω и амплитудой Aq: Aosm(ut + φο). 98
\((С - Ш- , У J)i) ' \\v' /f",'■'- \Ui. У Рис. 4.3 Рис. 4.4 Теория автогенераторов и их математических моделей интенсивно развивалась в 20-50-х годах двадцатого века [17, 18]. Из нее выросла более общая теория колебаний [18]. В частности, один из классических результатов этой теории состоит в том, что система (4.8) имеет единственную периодическую траекторию, к которой приближаются при t —► +оо все другие ее траектории. Эту систему часто называют системой Рэлея. В настоящее время вместо триода используют полупроводниковые элементы с нелинейными вольтамперными характеристиками [161]. Для таких автогенераторов основные принципы синтеза аналогичны описанному здесь классическому методу управления. § 4.2. Тактовые генераторы Развитие компьютерной техники привело к созданию других генераторов колебаний — так называемых тактовых генераторов. Эти колебания отличаются от гармонических и имеют вид, изображенный на рисунке 4.5. Рассмотрим здесь простейшую схему тактового генератора [317] (рис. 4.6) Она состоит из вентильной схемы "И — НЕми линии задержки u(t — г). Здесь г — время задержки. 99
Простейшая линия задержки — врезка в проводник куска другого проводящего материала с отличным от исходного проводника временем прохождения электрического сигнала. i и Рис. 4.5 и((-г) u(t) Рис. 4.6 Вентильные схемы "И — НЕ "являются базовыми логическими элементами и могут изготавливаться в виде отдельных интегральных микросхем. Обычно нулевому напряжению ставится в соответствие 0, а напряжению и = щ > 0 - значение 1. В этом случае соотношения входов и выхода блока "И -НЕ"описываются таблицей 100
t«l 1 0 1 0 щ 1 1 0 0 и 0 0 0 1 Если U2(t) = 1, то u(t) ξ 0 и, следовательно, на выходе не происходит генерации колебаний. Пусть теперь в момент времени to происходит включение генератора. Это означает, что 142 (*) = 1 ПРИ * < *0» U2(t) = 0 при t > to, u(t) = 0 при t < to, u\(t) = 0 при t < to- Ясно, что u(t) = 1, Vt G [to,to + r), u\(t) = u(t — r) = 0, Vie [to,to + r), ui(t) = u(t-r) = 1, Vie [to + r,t0 + 2r). Отсюда следует, что u(t) = 0, VtG [to + r,t0 + 2r), Ul(t) = u(t - r) - 0, Vt G [t0 + 2r, t0 + 3r). Продолжая эти рассуждения, получим соотношения u(t) = 1, Vt G [t0 + 2/ст, t0 + (2k + l)r), u(t) - 0, Ше [t0 + (2fc + l)r, t0 + 2(fc + l)r). Здесь /с = 0,1, — 101
Поскольку единице на выходе соответствует напряжение Щ > 0? рассматриваемый здесь тактовый генератор на выходе и имеет последовательность тактоваых импульсов u(t) = — (sign(sin(a;t + φ0)) + 1) (рис. 4.5). Здесь ω = π/τ, ψο = — uto). Таким образом, и для автогенератора после переходного процесса и для тактового генератора, после включения, имеется одно начальное условие (начальное состояние блока) — величина Доследующий уровень управления генераторами — это управление частотой. Это означает, что, также как и амплитуда в автогенераторе, после некоторого переходного процесса частота ω = ω {t) должна быть близкой к некоторому требуемому значению ω^\ lim ω(ί) = ωη. £->+οο Такие системы управления будут рассмотрены в следующей главе.
Глава 5 ДВУХМЕРНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ. ФАЗОВЫЕ ПОРТРЕТЫ В том случае, когда размерность фазового пространства (пространство состояний) равна двум, используя различные вспомогательные средства, можно наглядно представить себе разбиение фазовой плоскости на траектории дифференциальных уравнений, которые соответствуют тем или иным режимам работы системы управления. Это позволяет качественно (а иногда и количественно) описать как рабочие режимы системы, так и ее переходные процессы. § 5.1. Авторулевой и система управления ориентацией космического аппарата Начнем наше рассмотрение с систем угловой ориентации. Классическим примером такой системы является двухпозици- онный авторулевой. Составим уравнение вращения судна вокруг вертикальной оси, проходящей через его центр тяжести, пренебрегая боковым сносом судна при разворотах и считая, что судно движется с постоянной скоростью [18]: 103
Здесь θ{ί) — отклонение судна от заданного курса, / — момент инерции судна относительно его вертикальной оси, величина αθ{ί) соответствует моменту сил вязкого трения и а — коэффициент вязкого трения, М(ф) — момент сил, создаваемый рулем, φ — угол поворота пера руля (рис. 5.1). Заданный курс I ι / л ЧУ А // / Курс в момент t Рис. 5.1 Следует отметить, что в том случае, когда судно неуправляемо (ф = 0 и, следовательно, Μ = 0), нетрудно определить траектории соответствующей двухмерной системы 6/ = х, χ = —уХ (5.2) на фазовой плоскости {х,#}. Легко видеть, что на решениях х(£), 6{t) системы (5.2) выполнено тождество (χ(ί) +у 0(f)) " = *(*) +у *(*)==(). Поэтому для любого решения (5.2) имеем x(t) + j9(t) ξξ const. 104
Отсюда следует, что каждая прямая х+-Θ=7 целиком состоит из трех траекторий: состояния равновесия х=0 θ — jl/a и стремящихся к этому равновесию двух траекторий (рис. 5.2). Таким образом, ось абсцисс полностью состоит из состояний равновесия. Рис. 5.2 Каждому движению судна с начальными условиями 0(0) - 0О, х(0) - 0(0) - хо соответствует траектория с этими же начальными данными. Поэтому вращение неуправляемого судна со временем затухает и при t —> +оо 0(t)-*0o + -zo- а Целью управления в рассматриваемом случае является обеспечение таких условий, чтобы lim θ(ί) = 0 £->+оо 105
для некоторой заданной области начальных условий или чтобы ton 0(t) = 2Λπ для почти всех траекторий. При этом число к зависит от начальных условий: к = к(0о,хо). Для этой цели рассмотрим двухпозиционный авторулевой, при котором руль может занимать два положения: φ = фо и φ = —фо, создавая в каждом из них моменты сил, равные по величине, но противоположные по направлению. В настоящее время имеются различные датчики (гирокомпасы), которые измеряют величины 0(t) и 0(t) и подают сигнал a(t) = 0{t) + b0(t) на рулевую машинку, которая в нашей идеализации мгновенно перекладывает руль в зависимости от величины σ(£). Здесь Ъ — положительное число. Будем считать, что φ(σ) = -фо при σ G (0, π), φ(σ)-φο при σΕ(-π,Ο), ψ(σ + 2π) = φ(σ) VaGR1. Если же σ = 0 или σ = π, то рулевая машинка выключена, и руль может принимать любое положение между —фо и фо: ф€ [-Ψο,Ψο]. Из изложенного выше следует, что график 27г-периодической функции Μ(σ)=Μ(φ(σ)) имеет вид, представленный на рис. 5.3. -я М\ я 2п σ Рис. 5.3 106
Подробное описание технической реализации такого двухпо- зиционного авторулевого имеется в книге [18]. Заметим также, что аналогичная задача возникает при конструировании автопилотов, однако автопилоту приходится отрабатывать не один, как в авторулевом, а три угла. Подобная проблема возникает также в системах ориентации космических аппаратов. Часто такие более сложные управляемые движения можно рассматривать как совокупность независимых плоских вращений. (В этом случае управление каждым углом производится по независимым контурам управления.) Особенность управления ориентацией космического аппарата отличается от предыдущего рассмотрения тем, что в космическом пространстве отсутствуют силы вязкого сопротивления (а = 0) и вместо руля с рулевой машинкой в качестве исполнительного органа могут быть использованы реактивные двигатели. С целью экономии топлива здесь вводятся так называемые зоны нечувствительности, величины которых приемлемы для задач ориентации. В этом случае график 27г-периодической функции Μ(σ) имеет вид графика, приведенного на рис. 5.4. -π > Μ -А А π 2х+А 2лА σ Рис. 5.4 Здесь интервал (—Δ,Δ) — зона нечувствительности, где реактивный двигатель не работает. Итак, и авторулевой, и система угловой ориентации косми- 107
ческого аппарата могут быть описаны уравнениями Ιθ + αθ = Μ (σ), σ = 0 + 60, (5.3) где числа α, Δ, b таковы, что α > 0 и Δ > 0, b > 0. График Μ{σ) изображен на рис. 5.4. Выполнив замену η = 0, приведем систему (5.3) к системе вида 77 = -ατ? + /(σ), σ = /?τ/ + 6/(σ), lD'4j где α = α/7, /(σ) = Μ(σ)/7, /3 = 1 —α6. Будем полагать далее, что β > 0. Сделаем одно замечание, касающееся доопределения решения системы (5.4) на прямых разрыва η £ R1, σ = Δ + 2π£;, σ = —Δ + 2π£;, σ = (2fc — 1)π. В том случае, когда решение σ(ί), η{ί) расположено в момент времени t на некоторой из этих прямых: σ(ϊ) — σ*, то возможны два принципиально отличных друг от друга случая: 1) lPV(t)+bf(a*-0)\ [pV(t) + bf(a* +0)]>0; (5.5) 2) [/?r?(i) +bf(a* - 0)] [/Mi) + bf(a* + 0)] < 0. (5.6) В первом случае естественно считать, что траектория системы (5.4) "проскакивает"в момент времени t из полупространства {σ < σ*} в полупространство {σ > σ*} (или, наоборот) (рис. 5.5). Таким образом, здесь доопределяем решение системы (5.4) на линии разрыва как предельные точки траекторий Г ι и Г2 соответственно при t — 0 и t + 0. Во втором случае векторы скоростей S\ и #2 траекторий Γι и Г2 соответственно при t — 0 и t + 0 направлены так, как это показано на рис. 5.6. Ясно, что в данном случае траектория Γχ не продолжима по непрерывности в полупространство {σ > σ*}, а Г2 — в полупространство {σ < σ*}. В этом случае представляется 108
./ /Ν ?♦ Рис. 5.5 Рис. 5.6 естественным, что продолженная траектория является одновременно продолжением траекторий Γχ и Г2 (здесь не существует единственности решения задачи Коши!). Она скользит вдоль линии разрыва σ=σ* до тех пор, пока не нарушится неравенство (5.6), а ее вектор скорости S^ определяется из рис. 5.7, т. е. конец вектора S% есть точка пересечения отрезка, соединяющего концы векторов S\ и S2, и прямой σ = σ*. *t 2 4/ σ* Рис. 5.7 Следовательно, определенное таким образом векторное поле (поле направлений) однозначно определяет траектории, расположенные на поверхностях разрыва правых частей дифференциальных уравнений. Такие решения называются скользящими режимами. Этот способ доопределения решений был предложен А.Ф.Филипповым и широко используется в настояще время в теории управления. 109
О теории дифференциальных уравнений и дифференциальных включений с разрывными правыми частями можно прочитать в книгах [84, 328]. Заметим, что в рассматриваемом случае на скользящем режиме сг(£) = 0. Кроме того, ясно, что для любого решения т?(£), σ{ί) число входов в скользящий режим и выходов из него не более чем счетно: t = t^, к = 1, 2,... Отметим также, что поскольку на скользящем режиме σ(£)=0, из второго уравнения системы (5.4) следует, что на линии разрыва {т? £ R1, σ = σ*} вместо какого-либо значения /(σ*) следует записать f(t) = -^V(t). (5.7) Отсюда и из первого уравнения (5.4) имеем очень простые уравнения скользящего режима σ(ί)=σ*, ή = -ία+^\η. (5.8) Отметим еще раз, что нелинейность / доопределяется на скользящем режиме формулой (5.7), которая зависит, конечно, от начальных данных. Такое доопределение является по существу следствием правила построения векторного поля на линии разрыва (см. рис. 5.7). Здесь важно, что для всех скользящих режимов выполнено (5.6). Отсюда и из (5.7) следует, что значения f(t) всегда принадлежат отрезку [/(σ* — 0), /(σ* + 0)], если/(а*-0) < /(σ* + 0), и отрезку [/(σ*+0), /(σ* -0)], если /(σ*-0)>/(σ* + 0). Из сказанного следует, что в уравнениях (5.4) не требуется определять значения функции /(σ) на разрывах. Эти значения доопределяются исходя из понятия решения по А. Ф. Филиппову для каждого решения, часть которого находится на скользящем режиме. Поскольку для множества всевозможных решений соответствующее множество значений ψ(ί) заполняет весь 110
промежуток [/(σ* - 0), Да* + 0)] или [/(σ* + 0), /(σ* - 0)], то иногда значению функции / на разрыве приписывают весь такой промежуток, оговаривая при этом, что для каждого решения / определяется по формуле (5.7). Определим теперь функцию σ V(V,a)=V2+qJ f(a)da, (5.9) о где q — число, которое мы здесь выберем следующим образом: 2(1 +об) <? = - (1 - abf Рассмотрим производную функции V в силу системы (5.4), т. е. выражение ±V{V(t),a(t)) =2V(t){-aV(t) + f(a(t)))+ ({UQ) +qf(<r(t)){0V(t) + bf(a(t))), при тех значениях £, где σ(ί) φ σ*. Здесь σ* — точки разрыва функции /(σ). Поскольку на скользящем режиме σ(ϊ) — σ*, σ(ί) σ* J f(a)da = J f(a)da о о и функция / доопределяется по формуле (5.7), в этом случае ±V(V(t),a(t)) = -2(a+^V(t)>. (5.11) 111
Из соотношения (5.10) получаем |v(77(t),a(t)) = -2 — 2Ь /(σ(ί))2· (1 - α&)2 (5.12) Построенная нами функция V со свойствами (5.11) и (5.12) является функцией ляпуновского типа (см главу 1). Она неотрицательна при всех т/ и σ, и ее производная в силу системы (5.4) всюду, за исключением точек tk перехода решения через линию разрыва или входа в скользящий режим и выхода из этого режима, является неположительной и удовлетворяет неравенствам (5.11) и (5.12). С ее помощью мы докажем стремление любого решения системы (5.4) к некоторому состоянию равновесия. Однако для доказательства этого факта нам еще потребуется выяснить некоторые аспекты расположения траекторий на фазовой плоскости. Прежде всего докажем одно очень простое свойство системы (5.4). Предложение 5.1. Если η(ί), σ{ί) — решение системы (5.4), то и η(ί), σ(ί) + 2кп — также решение системы (5.4). Доказательство этого факта состоит в подстановке решения т?(£), a(t)+2kn в систему (5.4) и использовании 27г-периодичнос- ти функции /(σ). Из предложения 5.1 следует, что если мы произведем сдвиг по оси абсцисс на 2пк полосы {η G R1, σ G [—π,π]}, то части траекторий, расположенных в этой полосе, после сдвига совпадут с соответствующими частями траекторий, расположенных в полосе {η G R1, σ G [(2fc - 1)π, (2fc + 1)π]}. Мы будем использовать этот факт для качественного описания поведения траекторий на фазовой плоскости. 112
Рассмотрим теперь случай авторулевого и скользящие режимы на фазовой плоскости (рис. 5.8). ? Ί-2'π к Рис. 5.8 Рис. 5.9 Эти режимы описываются уравнениями (5.8), а из соотношений (5.7) и \f(t)\ < |/(σ* — 0)| следует, что на скользящем режиме Ш\ < d, Wed = b\f(a*-0)M. Исходя из анализа векторного поля (поля направлений), легко качественно описать поведение траекторий в малых окрестностях скользящих режимов (рис. 5.9). Отсюда видно, что только две траектории могут войти в скользящий режим, находящийся на линии разрыва {r/GlR1, σ=π}. Каждая точка отрезка {σ=7Γ,7?£[—d,d]} является точкой разветвления решений. Из нее выходят ровно три траектории: одна — в правую полуплоскость, другая — в левую, третья остается в скользящем режиме. Другими словами, скользящий режим состоит из трех траекторий: из состояния равновесия а = π, η = 0 и двух траекторий, которые стремятся к нему при t —► +оо. Каждая точка на этих трех траекториях является точкой разветвления. 113 Д^ У ~~" ~~*^ "Э--^ у у _ - if" / г I [_ π ■у, V
Отрезок скользящего режима {т? £ [—d,d], σ = 0} является локально устойчивым: в некоторой ε-окрестности данного отрезка все траектории за конечное время попадают на этот отре- зок^и в дальнейшем там остаются, стремясь далее при t —> +00 к нулю. Заметим, что попадание в состояние равновесия за конечное время — это свойство, присущее только дифференциальным уравнениям с негладкими правыми частями. Для систем с гладкими правыми частями этот факт невозможен. Здесь же две траектории попадают в нулевое состояние равновесия за конечное время. Предположим теперь, что рассматриваемая траектория не стремится к состоянию равновесия. В этом случае из предыдущих рассуждений ясно, что за исключением счетного числа точек tk пересечения прямых разрыва {tjGR1, σ = σ*} на этой траектории выполняется соотношение \ί(Φ))\>ι, где / — положительное число (см. рис. 5.3). Отсюда и из неравенства (5.12) следует, что lim ν(η(ί),σ(ί)) = -оо. t—>+оо х ' Последнее противоречит ограниченности снизу функции ν(η,σ). Полученное противоречие доказывает, что любое решение системы (5.4) стремится при t —> +00 к некоторому состоянию равновесия. Используя этот факт и предыдущие рассуждения, получаем следующее качественное разбиение фазовой плоскости на траектории системы (5.4) (рис. 5.10). Такое качественное изображение фазового пространства, заполненного траекториями, в теории управления называется фазовым портретом системы. Рассмотрим теперь аналогичным образом систему ориентации космического аппарата. 114
Рис. 5.10 Здесь основное отличие от авторулевого на предлагаемом пути исследования заключается в наличии зоны нечувствительности и отсутствии трения (а = 0). Учет этого фактора приводит к следующим изменениям в рис. 5.8 и 5.9 (рис. 5.11 и 5.12). Из расположения траекторий на рис. 5.12 ясно, что не стремящаяся к состоянию равновесия при t —> +оо траектория, как и в случае авторулевого, всюду, за исключением счетного числа точек £*. пересечения с линиями разрыва, удовлетворяет неравенству (5.12). Отсюда следует, что V(V(t),a(t))<V(V(0),a(0)). Поэтому существует число Г, зависящее от начальных данных 7/(0), сг(0), такое, что выполнена оценка |τ?(ί)|<Γ Vt>0. (5.13) Ясно, что для рассматриваемой траектории существует бесконечная последовательность tj —> +оо такая, что % — момент 115
входа траектории τ/(ί), a(t) в множество Ω = (J {η e Μ1, σ G [-Δ + 2тг&, Δ + 2тг&]} к и ^2г-1 ~ момент выхода рассматриваемой траектории из множества Ω. /" /" (< ^ -^ 7 "" *" * * ^/ ; J к π а л Рис. 5.11 Рис. 5.12 Из уравнения (5.4) следует, что выполнено одно из неравенств ^ d hi - hi-ι > у j hi - hi-1 > 2(π - Δ) T + bL Здесь L = max |/(σ)|. σ В самом деле, либо oitii) = ст(^2г—ι)? либо Κί2<)-σ(*2ί-ι)| = 2(π-Δ). Легко видеть, что в первом из этих случаев \v(t2i) - v(t2i-i)\ > d (см. рис. 5.12). (5.14) (5.15) (5.16) (5.17) 116
Отсюда, из того факта, что вне Ωϋ{σ = (2к — 1)π} выполнено равенство |/(σ)| = L, и из первого уравнения системы (5.4) (напомним, что здесь а = 0) получаем равенство \v(t2i) - v(t2i-i)\ = L(t2i - *2t-i). Отсюда и из (5.17) следует оценка (5.14). Во втором случае из оценки (5.13) и второго уравнения системы (5.4) (напомним, что здесь β = 1) имеем неравенство \a(t)\<T + bL Vt€(t2i-i,t2i)- Отсюда и из равенства (5.16) сразу получаем оценку (5.15). Из оценок (5.14), (5.15) и (5.12) вытекает, что выполнено одно из неравенств V(v(t2i),a(t2i)) < V(V(t2i-i),a(t2i-i))-2bLd, ν(η(ίη)Μ*2ί)) < V(V(t2i-1),a(t2i_1))-2bL2 2ρπ+"^} ■ Отсюда следует, что lim ν(η(ί2ί),σ(ί2ί)) = -оо. г—>+оо Последнее противоречит ограниченности снизу функции ν(η,σ). Полученное противоречие доказывает, что любая траектория системы (5.4) стремится при t —> +оо к некоторому состоянию равновесия. (Заметим, что более универсальная схема применения функций Ляпунова к анализу устойчивости разрывных систем изложена в книге [84]. Однако она требует развитой теории дифференциальных включений.) Из стремления при t —> +оо к состоянию равновесия любого решения рассматриваемой системы и предыдущего анализа окрестностей скользящих режимов получаем следующее качественное разбиение фазовой плоскости на траектории (рис. 5.13). 117
Заметим, что состояния равновесия системы (5.4) η = О, σ = 2-кк для авторулевого соответствуют одному и тому же заданному курсу. К этому курсу при t —* +00 асимптотически стремятся все другие режимы работы системы управления судном, за исключением особых режимов, стремящихся к неустойчивому состоянию равновесия η = О, σ = пк. Однако в силу своей неустойчивости этот режим физически нереализуем. Он вместе со стремящимися к нему особыми переходными процессами как бы незамечаем в реальной работе рассматриваемой системы управления. Аналогичные замечания можно сделать и для системы управления ориентацией космического аппарата. Систематическое изложение теории систем управления ориентацией космических аппаратов содержится в книге Рис. 5.13 Заметим, что выход из строя системы ориентации космического аппарата может привести к его вращению. Как видно из фазового портрета (рис. 5.13), можно сделать вывод, что включение системы управления ориентацией может погасить эти вращения и сориентировать аппарат в нужном направлении. Так было с космической станцией "Мир"в 1987 году. Выход из строя системы управления ориентацией привел к сложному вращательному движению станции. Потребовалось некоторое 118
вре^я для ремонта системы ориентации. После ее включения система управления ориентацией погасила вращение объекта. В заключение отметим, что часто система управления угловой ориентацией должна отработать не стационарное направление, а весьма сложное маневрирование, которое обычно называют программным движением. Рассмотрим, например, стрельбу торпедой по движущемуся кораблю. Торпеда пускается не в цель, а в кильватерный Рис. 5.14 след, остающийся в воде от работы винтов. Этот след может быть обнаружен приборами, находящимися на торпеде, при его пересечении торпедой. После этого система управления должна отработать программное движение разворота торпеды и ее вторичное вхождение в кильватерный след (рис. 5.14). После пересечения кильватерного следа производится еще один разворот и т. д., пока торпеда не достигнет цели. § 5.2. Управление синхронной электрической машиной и системы фазовой автоподстройки частоты 1. Синхронная машина. Синхронная электрическая машина широко применяется как генератор, вырабатывающий 119
электроэнергию. Часто синхронные машины используются как электродвигатели. Например, в качестве привода прокатных станов. Рассмотрим здесь синхронный электродвигатель, основными элементами которого являются неподвижный статор и вращающийся ротор (рис. 5.15). Статор / С ( J ,ч *-7 I Ротор \ N Рис. 5.15 Рис. 5.16 Здесь на роторе показаны пазы, в которые укладывается обмотка ротора — так называемая обмотка возбуждения. Эта обмотка посредством щеток связана с источником постоянного тока. На статоре также имеются обмотки, по которым проходит переменный электрический ток, создающий переменное магнитное поле. Эти обмотки устроены так, что при прохождении через них переменного тока вектор напряженности магнитного поля является постоянным по величине и вращается с постоянной угловой скоростью (рис. 5.16). Такое вращающееся магнитное поле впервые было получено в 1888 году Г. Феррарисом и Н. Теслой [115]. Ясно, что частота вращения вектора напряженности совпадает с частотой переменного тока, проходящего через обмотки статора. При некоторой идеализации каждый виток обмотки возбуждения можно рассматривать как рамку с постоянным током, помещенную в магнитное поле (рис. 5.17). Будем рассматривать движение рамки во вращающейся си- 120
стеме координат, жестко связанной с вектором напряженности магнитного поля. В этой системе координат имеем рамку с постоянным током г, помещенную в постоянное магнитное поле, на которую действует сила F (рис. 5.18). Рис. 5.17 Рис. 5.18 Хорошо известно [341], что на проводник длины /ι, помещенный в магнитноре поле с напряженностью В действует сила F = βίΙ\Β, направленная перпендикулярно вектору напряженности и проводнику. Здесь β - коэффициент пропорциональности. Отсюда следует, что для угла θ{ί) между плоскостью рамки и плоскостью, перпендикулярной вектору напряженности, имеет место следующее соотношение ΙΘ = -PinhhBsme- M. (5.18) Здесь / - момент инерции ротора, 1<ι - расстояние между параллельными участками рамки, η - число витков обмотки, Μ - момент сил сопротивления, который преодолевается синхронным двигателем при выполнении полезной работы. Часто величину Μ называют нагрузкой электродвигателя. 121
Сделав замену θ —> —#, запишем уравнение (5.18) в следующем виде: e + bsin0 = 7· (5.19) Здесь Ь = βίηΙιΙϊΒ/Ί, η — Μ/Ι. Напомним, что при 7 = 0 это уравнение уже рассматривалось нами — это уравнение колебаний маятника. Уравнение (5.19) эквивалентно системе ё. = \ ■ а (5.20) η = — о sin 6/ + 7, которая имеет первый интеграл ν(η,θ) = \η2 -ЬсоБв-ув. Δι Поскольку V(V(t), 0(t)) = η(ί)ή(ί) + (Ьзтв- Ί)θ(ί) = = 77(t)[-6sin(9 + 7 + bsin(9-7] = 0, траектории системы (5.20) целиком расположены на линиях уровня функции ν(η,θ) = С (рис. 5.19). Здесь рассматривается наиболее содержательный случай, когда b > 7· При b < 7 нагрузка на синхронную машину является настолько большой, что невозможно обеспечить синхронные рабочие режимы машины. Посмотрим теперь, каким движениям ротора соответствует та или иная траектория. Замкнутым траекториям соответствует движение ротора, которое можно разбить на две составляющие. Это — вращение с постоянной угловой скоростью, равной угловой скорости вращения вектора напряженности магнитного поля, плюс периодические качания ротора относительно этого равномерного вращения. Незамкнутые траектории соответствуют асинхронным движениям ротора — его угловая скорость с некоторого момента 122
времени становится меньше, чем угловая скорость вращения магнитного поля. Такие режимы работы являются запрещенными для синхронной машины. Рис. 5.19 Из рис. 5.19 видно, что эти два разных типа траекторий разделяют (сепарируют) особые траектории, которые называют также двоякоасимптотическими, или гомоклиническими. При t —> +00 и t —> — 00 эти траектории стремятся к одной и той же стационарной точке седлового типа. Иногда, подчеркивая их разделяющую роль, такие траектории называют также сепаратрисами. Цель управления синхронной машиной — обеспечение синхронного режима работы, т. е. вращения ротора с угловой скоростью, совпадающей со скоростью вращения магнитного поля. Для этого необходимо было создать такие управляющие устройства, которые бы подавляли (демпфировали) упомянутые выше качания ротора относительно вращающегося магнитного поля и расширяли области, заполненные ограниченными решениями, по сравнению с областями, представленными на рис. 5.19. Первые такие устройства были изобретены в начале XX века. Они были весьма просты по конструкции и представляли собой 123
две дополнительные короткозамкнутые обмотки, специальным образом расположенные на роторе. Движение ротора относительно магнитного поля индуцировало токи в этих обмотках, которые, в свою очередь, создавали силы, действующие на ротор и демпфирующие его качания. Изобретение таких управляющих устройств, гениальное по простоте и технологичности, можно сравнить с изобретением регулятора Уатта. Для того, чтобы описать простейшую модель демпфирования колебаний ротора относительно вращающегося магнитного поля, рассмотрим две перпендикулярно расположенные друг к другу на роторе рамки (рис. 5.20). Рис. 5.20 Одна из них замкнута, к другой подводится (обычно через щетки электродвигателя) постоянное напряжение е. Как и ранее будем считать, что эта система находится во вращающемся магнитном поле с напряженностью В. В рассматриваемом случае токи ii(t) и i2(t) в рамках определяются с учетом закона электромагнитной индукции и закона Ома: flii(t) = e + SB(sin0(t))0(t), (5.21) Ri2(t) = SB(cos0(t))0(t). 124
Здесь R - сопротивление в каждой из рамок, которое здесь будем предполагать одинаковым, S = 1\12 _ площадь каждой из рамок. Величина θ(ί) имеет такой же смысл, как и ранее. Ясно, что вместо уравнения (5.18) здесь имеем соотношение ΙΘ = -pSB(ii (t) sin θ + i2(t) cos θ) - Μ. (5.22) Подставляя (5.21) в уравнение (5.22), окончательно получим IB = -β^-θ - Щ^ sin θ - Μ. (5.23) К К Введя переобозначение θ —> —0, это уравнение можно записать в виде 0 + a0 + bsin0 = 7. (5.24) Здесь PS2B2 t pSBe M В дальнейшем, не умаляя общности, будем считать, что 6=1. К уравнению такого вида можно привести уравнение (5.24), используя замену времени г = ty/1/b. Проблема исследования работы синхронной машины с демпфирующим силовым моментом явилась мотивацией глобального качественного исследования уравнения (5.24) выдающимся итальянским математиком Франческо Трикоми в 1933 году. Приведем здесь основные результаты, полученные Ф.Трикоми, перейдя от уравнения (5.24) к эквивалентной системе θ = * тл (5·25) где φ(θ) = sin0 — 7. Теорема 5.1. Любое ограниченное при t > 0 решение системы (5.25) стремится при t —> +00 к некоторому состоянию равновесия. 125
Доказательство. Рассмотрим функцию θ ν(η,θ) = ±η2 + Ιφ(θ)(1θ. (5.26) о На решениях т/(£), θ{ί) системы (5.25) имеем соотношение V(»7(t),0(t)) = -aT,(f)2. (5.27) Отсюда следует, что функция ν(η(ί),θ(ί)) монотонно убывает по t. В силу ограниченности т/(£), θ(ί) при t > 0 имеем ограниченность при t > 0 функции У (т/(£), #(£)). Отсюда вытекает существование конечного предела lim VMt),0(t)) = ae. (5.28) t—>+оо Проинтегрировав обе части равенства (5.27) от 0 до £, получим соотношение t ajV(r)2dT = Vfa(O),0(O)) - V(V(t),m)· о Отсюда следует, что +оо / v(t)2dt < оо. (5.29) о Кроме того, [η(ή2]' = 2η(ί)ή(ί) = -2α7?(ί)2 - 2η(ΐ)φ(θ(ί)). Из ограниченности решения η(ί), 6(t) следует, что существует число С, для которого |fo(t)2]'| <C Vi>0. (5.30) 126
Из соотношений (5.29) и (5.30) по лемме 1.2 из главы 1 следует, что lim η(ί) = 0. (5.31) £—>+оо Отсюда, из равенства (5.28) и выражения для функций V(г/, Θ) и φ(θ) следует, что существует число /?, удовлетворяющее равенству lim (cos0(t) + 70(t)) = β. t—>+oo Но тогда для некоторого числа #о имеем равенство lim θ(ί) = θ0. £->+оо (5.32) Легко видеть, что точка η = 0, θ = 0q является состоянием равновесия системы (5.25). Из соотношений (5.31) и (5.32) вытекает утверждение теоремы. Рис. 5.21 Из теоремы 5.1 следует, что при 1 < 7? т-е- ПРИ отсутствии состояний равновесия, все решения системы (5.25) являются неограниченными (рис. 5.21). Поэтому рассмотрим далее случай, когда 1 > 7· 127
Заметим, что поскольку для функции (5.26) выполнено неравенство (5.27), линии уровня функции ν(η,θ) при η φ 0 являются бесконтактными кривыми для траекторий системы (5.25). Другими словами, эти траектории "прошивают"линии уровня извне вовнутрь (рис. 5.22, сравни с рис. 5.19). Обозначим через #о нуль функции </?(#), для которого #о £ [0,2π], φ'(θο) > 0, и через θ\ — нуль функции φ(θ), для которого 01 е [0,2π], φ'{θ{) < 0. Рис. 5.22 Рис. 5.23 Рис. 5.24 128
Обозначим через η(ί), θ{ί) решение системы (5.25), для которого lim η(ί) = 0, t—>+оо lim θ(ί) = θλ и η{ί) < 0 при достаточно больших t. Пусть r/(t), θ{ί) — решения системы (5.25), для которого lim ту(*) = О, lim 0(t) = θι t—>+oo и rj(t) > 0 при достаточно больших t (рис. 5.23). Из бесконтактности линии уровня функции ν(η,θ), проходящей через точку η = 0, θ = θι, следует, что траектория г/(£), θ{ί) при всех t £ R1 находится ниже кривой {V(r/, Θ) = V(0,0ι), η < 0} (рис. 5.24). Поскольку из соотношений V(т/, 0) = У(0, θ\) и 0 —> +оо следует, что т/ —> — оо, в этом случае можно сформулировать следующий результат. Лемма 5.1. Имеют место равенства lim η{ί) = —оо, ί—> —оо lim 0(ί) ί—►—оо +οο. (5.33) Легко видеть, что для траектории т/(£), θ{ί) имеются три возможности: 7(0,0(0 Рис. 5.25 129
1) существует число г, для которого η{τ) = О, Θ (τ) £ {θ\ — 2тг,0о), ^(ί) >0 Vie (r,+oo); (рис. 5.25); 2) для всех t η(£) > 0, lim 77M = 0, lim 0(i) = 0χ - 2π ί-+—oo ί—>-oo (рис. 5.26); 7(ОЖО Рис. 5.26 3) для всех £ т/(£) > 0, lim θ{ί) = —оо (рис. 5.27). £—► —оо ч(ОМ) Рис. 5.27 Ф.Трикоми показал, что в случае 3) имеет место соотношение lim η(ί) = +оо. t—>—00 (5.34) 130
Это весьма тонкий факт, который здесь мы не будем доказывать. Доказательство его содержится, например, в книге [30]. Сравнительно недавно в работах ученых школы А. А. Андронова были указаны классы двухмерных систем вида (5.21) из § 5.1, для которых в случае 3) соотношение (5.34) не имеет места [94]. Из теоремы 5.1 и свойств сепаратрис rj(t), θ{ί) и rj(t), θ(ί) седловой особой точки η = 0, θ = θ ι можно сделать вывод о том, что при 1 > 7 возможны три типа разбиения фазового пространства на траектории: Рис. 5.28 _ 1) Сепаратрисы rj(t), θ(ί) и rj(t), θ(ί) являются границами области притяжения локально устойчивого состояния равновесия η = 0, θ — #о (рис. 5.28). При сдвиге по θ на величину 2кп эти области становятся областями притяжения стационарных решений η = 0, θ = #о + 2/с7г. Траектории, расположенные вне этих областей, стремятся при t —> +оо к бесконечности. 2) Сепаратриса rj(t), θ(ί) является гетероклинической, т.е. lim ^(t)= lim ^(t) = 0, lim 0(t) = 0i - 2π, lim θ{ί) = θχ. t—>—oo t—►H-oo t—►—oo t—►H-oo В этом случае области притяжения устойчивых состояний 131
равновесия также ограничены сепаратрисами, однако в полуплоскости {η < 0} уже нет неустойчивых "коридоров" (рис. 5.29). Рис. 5.29 3) Все фазовое пространство разбито на области притяжения устойчивых состояний равновесия. Границами этих областей являются сепаратрисы седловых состояний равновесия (рис. 5.30). Рис. 5.30 132
Таким образом, определение областей притяжения устойчивых состояний равновесия и весь глобальный анализ системы (5.25) сводится к вычислению или оценке только одной траектории — сепаратрисы η(ί),θ(ί). (В случае 1) важно уметь вычислять или оценивать также сепаратрису rj(t), θ(ί).) Ф.Трикоми и его последователями были получены различные аналитические оценки этих сепаратрис. Случай 2) соответствует в пространстве параметров {а, 7} смене одной качественной картины расположения траекторий другой (т. е. смены структуры 1) структурой 2), или наоборот). Такое качественное изменение называют бифуркацией, а параметры а и 7, соответствующие случаю 2), называются бифуркационными. Ясно, что оценки сепаратрис здесь приводят к оценкам бифуркационных параметров. Численные методы к определению сепаратрис, и, следовательно, бифуркационных параметров, были применены в 60- е-70-е годы [366]. Приближенное вычисление сепаратрис обычно разбивается на две части. В некоторой достаточно малой окрестности сед- ловой особой точки сепаратриса приближается к линейной функции с коэффициентом -Wt-'<*■>■ Вне этой окрестности используется какой-либо численный метод аппроксимации решений обыкновенных дифференциальных уравнений (чаще всего — метод Рунге—Кутта) [203]. Применение таких вычислительных схем привело к приближенному вычислению бифуркационной кривой в пространстве параметров а~2 и 7, изображенной на рис. 5.31. Точкам на этой кривой соответствует расположение траекторий в фазовом пространстве, изображенное на рис. 5.29. Точкам, расположенным ниже этой кривой, — структура, изображенная на рис. 5.30. Точкам, расположенным выше этой кри- 133
вой и нижне прямой {7 = 1}, соответствует рис. 5.28. Точкам, расположенным выше прямой {7 = 1}, соответствует рис. 5.21. Заметим, что из предыдущих рассмотрений вытекает также следующий факт. ι 0,8 а-2 Рис. 5.31 Лемма 5.2. Любое решение η(ί), 6(t) с начальными данными из области θ {\η2 + 1ψ(θ)άθ<0 стремится при t —> +00 к состоянию равновесия η = О, Θ — #ο· Воспользуемся этим результатом, чтобы рассмотреть задачу о предельной нагрузке синхронной машины. Задача о предельной нагрузке. Рассмотрим синхронный электродвигатель, приводящий во вращение валки прокатного стана (рис. 5.32). Пока раскаленная металлическая заготовка движется только по нижним валкам, можно считать, что нагрузка синхронной 134
машины равна нулю и машина работает в синхронном режиме, т. е. θ(ί) = О, θ{ί) ξ 0. В момент времени t = г заготовка входит в ту часть прокатного стана, где происходит процесс раскатывания. За счет вращения верхних и нижних валков в противоположном направлении заготовка движется вперед, уменьшаясь по толщине. Ясно, что в момент времени t — τ происходит наброс нагрузки. | ь —Ί ооооооооо) (υ υ υ υ υ υ οοοοοοοοο) Рис. 5.32 Таким образом, при t < τ рассматриваемый процесс описывается уравнением (9* + a(9 + sin(9-0 (5.35) и соответствует решению 6{t) = 0, θ{ί) = 0. При t > τ этот процесс описывается уравнением 0 + a0 + sin0 = 7 (5.36) и соответствует решению с начальными данными #(т)=0, 0(т)=О. Ясно, что такое решение уравнения (5.36) уже не является состоянием равновесия, и наша задача заключается в том, чтобы после наброса нагрузки синхронная машина не выпала из синхронизма. Другими словами, необходимо, чтобы решение уравнения (5.36) с начальными данными θ (τ) = 0, θ (τ) = 0 оказалось в области притяжения нового устойчивого состояния равновесия θ(ί) = #о> θ(ί) = 0. При решении это задачи можно использовать лемму 5.2, которую здесь можно переформулировать следующим образом. 135
Теорема 5.2. Допустимым набросом нагрузки η является такая величина η, которая удовлетворяет неравенству и / 01 (sin6>-7)d6><0. (5.37) Из теоремы 5.2 следует, что предельный наброс нагрузки 7 = Г можно определить из равенства площадей подграфиков функции sin# - Г (рис. 5.33). σ У=Г Т\ о вЛ sin 6» Рис. 5.33 В инженерной практике такой метод определения предельного наброса нагрузки называют методом площадей. Посмотрим теперь, какие преимущества имеет алгоритм медленного нагружения синхронной машины. Предположим, что мы имеем га шагов нагружения. На к-м шаге в момент г*; > Tfc_i нагрузка мгновенно возрастает с величины 7fc-i Д° величины 7fc· Разность τ*. — τ&_ι мы считаем достаточно большой — такой, чтобы решение с начальными данными в(т^), θ(τ^) (предыдущее состояние равновесия) попало в достаточно малую окрестность нового состояния равновесия. В этом случае, применяя на каждом шаге лемму 5.2, получаем, что для попадания в область притяжения нового устойчивого состояния 136
равновесия, необходимо, чтобы площадь верхней заштрихованной области на рис. 5.34 была больше нижней заштрихованной области. Ясно, что при выборе jk-i и 1к достаточно близкими друг к другу, всегда можно удовлетворить этому условию. ^ ι \ sin0 Рис. 5.34 Итак, медленно двигаясь "уставкамиП> синхронную машину можно нагрузить до любой величины η < 1. Заметим, что запуск синхронных генераторов и постановка их под нагрузку является сложным динамическим процессом, длящимся иногда несколько десятков минут. Заметим также, что в настоящее время имеется много различных систем управления синхронных машин, использующих обмотку возбуждения. Сигналы датчиков величин θ{ί) и θ(ί) преобразуются в дополнительное напряжение, которое подается на обмотку возбуждения. Это напряжение создает управляемый силовой момент, действующий на ротор и улучшающий динамические свойства синхронной машины. Упомянем здесь книгу Μ. Μ. Ботвинника, в которой рассматривается такое управление [55]. М.М.Ботвинник широко известен также как многократный чемпион мира по шахматам. Исследование более сложных математических моделей электрических машин можно найти в книгах [39, 54, 55, 56, 61, 67, 69, 70, 75, 84, 87, 90, 115, 136, 137, 139, 270-273, 371, 381]. 137
Системы автоматической подстройки частоты. В четвертой главе были рассмотрены системы, управляющие амплитудой электронного генератора. Здесь мы опишем основные принципы управления частотой электронных генераторов. Для этого познакомимся с процессом передачи телевизионного изображения. Рассмотрим здесь принципиальную схему передачи черно-белого телевизионного сигнала. На телевизионной станции на фотоматрице имеется изображение некоторого предмета. По строкам фотоматрицы последовательно пробегает электронный луч, который, замыкая электрическую цепь в момент времени £, создает напряжение u(t), которое зависит от яркости в той ячейке фотоматрицы, где в момент времени t оказался электронный луч (рис. 5.35). МО Рис. 5.35 Сканирование луча по экрану выполняется на интервале времени [ti, £2]· Далее происходит высокочастотная модуляция сигнала u(t), и через эфир он поступает в телевизионный приемник. В приемнике данный сигнал демодулируется и подается на формирователь электронного луча в электронно-лучевой трубке телевизора. Чем больше величина u(t), тем интенсивнее электронный луч и, следовательно, тем больше яркость в соответствующей точке экрана, куда попадает этот луч. Такой луч, проходя через отклоняющие пластины и последовательно пробегая по строкам экрана, создает на нем изображение. Ясно, что для того чтобы не было искажений при передаче 138
изображения, генераторы, развертывающие электронные лучи на телевизионной станции и в телевизоре, должны работать синхронно. Другими словами, должны совпадать частоты обоих генераторов. Это является целью управления специальных систем синхронизации — систем автоматической подстройки частоты. Эти системы работают следующим образом. Информация о частоте иэ генератора на телевизионной станции, который называют эталонным, передается на каждый телевизор синхроимпульсами, которые являются частью телевизионного сигнала (рис. 5.36). Информация о яркости Тг Ί Рис. 5.36 После прохождения электронного луча по фотоматрице следует некоторая временная задержка, во время которой передаются синхроимпульсы — информация о частоте иэ. Далее снова идет развертка луча и передается информация о яркости, а затем вновь передаются синхроимпульсы, и т. д. В телевизионном приемнике сигнал сепарируется, и информация об и>э поступает на блок синхронизации, который устроен следующим образом (рис. 5.37). При разомкнутой обратной связи, когда на подстраиваемый генератор нет воздействия управляющего устройства (У У), подстраиваемый генератор (ПГ) работает с некоторой постоянной частотой и>пр- Будем считать частоту иэ эталонного генератора также постоянной величиной. 139
Целью управления здесь является устранение частотной расстройки Г = иэ — иПр. После включения системы управления, изображенной на рис. 5.37, в момент времени t = 0 величина ΓΑνΜΑ Д Фильтр ω{ΐ) ПГ УУ Рис. 5.37 ωγι уже не является постоянной: ωη = ωπ(£). Цель работы системы управления состоит в осуществлении захвата по частоте: Wn(t) —* ^э при t —* +00. Функции с 0э(*) = 0э(О)+о**, θη(ί) = θη(0)+ [ωη(τ)άτ (5. 38) называются фазами эталонного и подстраиваемого генераторов. Числа 0э(О) и θ π(0) являются значениями этих фаз в момент времени t = 0. Значения θ 3(t) и θ n(t) поступают на вход блока Д который называется фазовым детектором. Существует много различных электронных схем, являющихся фазовыми детекторами. Они описаны в книгах [176, 366]. Для нас в данном случае важен лишь тот факт, что выходом блока Д во всех этих схемах является величина σχ = F(0 э - 0 п). (5.39) 140
Здесь функция F(x) является 27г-периодической. Типичными функциями F(x) являются sin x и функции, графики которых изображены на рис. 5.38 и 5.39. Рис. 5.38 Ft . Рис. 5.39 Величина σ\ (t) поступает на вход фильтра, который служит для подавления возникших в процессе передачи информации об и>э помех. В главе 2 рассмотрены RC- и JRLC-цепи, которые часто применяются в качестве фильтров. В общем случае фильтр представляет собой линейный блок с входом σι, выходом G2 и передаточной функцией К(р). Характеристика блока управления подстраиваемым генератором УУ обычно принимается линейной. Изменение частоты подстраиваемого генератора при действии сигнала блока управления У У происходит следующим образом: "п(*) = "пр + σ3(ί), σ3(ί) = 5σ2(ί), (5.40) 141
где S — некоторое число. Действие большинства управляющих устройств У У основано на изменении реактивности, вносимой ими в контур подстраиваемого генератора. Схемы таких устройств приведены в упомянутых выше книгах [176, 366]. Учитывая, что для ДС-цепи величины σ\ и σ<ι связаны уравнением RC^+a2 = a! (5.41) at и используя соотношения (5.38)—(5.40), получим следующие уравнения, описывающие работу системы автоподстройки генераторов: *?£+·> = *·<« э-*п), (542) {β э - θ и)9 = иэ - ωΠρ - 5σ2. Учитывая, что иэ — и>пр = Г, и подставляя выражение для σ2(£), полученное из второго уравнения системы (5.42), в первое, имеем где θ = θ э — # π· В случае синусоидальной характеристики фазового детектора F(0) = sin# из уравнения (5.43) получаем уже изученное нами уравнение синхронной машины (5.24) 0 + a0 + 6sin0 = 7, гдеа=1/(ЯС), b = S/(RC), j = T/(RC). Решению задачи управления, соответствующей установлению синхронного режима работы генераторов, соответствует фазовый портрет, изображенный на рис. 5.30. Развитие математического аппарата для изучения систем автоподстройки с более сложными фильтрами и характеристиками детекторов изложено в книге [168]. В последнее десятилетие системы фазовой автоподстройки стали широко применяться для управления тактовыми генераторами цифровых сигнальных процессоров [167, 294, 295, 393, 420]. 142
В завершение этого параграфа заметим, что все рассмотренные в § 5.1 и 5.2 системы управления кроме двухмерного евклидова фазового пространства обладают еще и другим фазовым пространством — цилиндрическим. Введем это пространство. Из предложения 5.1 следует инвариантность свойств рассматриваемых систем относительно сдвига χ + d, где т. е. если x(t) — решение рассматриваемой системы, то и x{t)+d также является ее решением. Введем в рассмотрение дискретную группу Г= {x = kd\ keZ}. Здесь Ζ — множество целых чисел. Рассмотрим фактор-группу Е2/Г, элементами которой являются классы вычетов [х] £ Е2/Г. Они определяются следующим образом: [х] = {χ + и | и е Г}. Введем так называемую плоскую метрику Р{[х],[у})= inf \ζ-ϋ\. ze[x] *€[V) Здесь, как и ранее, | · | — евклидова норма в R2. Из предложения 5.1 следует, что [x(t)] является решением, а метрическое пространство Е2/Г — фазовым пространством. Оно разбивается на непересекающиеся траектории [х(£)], t GR1. Легко установить следующий диффеоморфизм между Е2/Г и поверхностью цилиндра R1 χ С Здесь С — окружность единичного радиуса. Рассмотрим множество Ω = {χ\ η G R1, σ G (0,2π]}, в котором находится ровно по одному представителю каждого класса [χ] Ε Μ2/Γ. Накроем поверхность цилиндра 143
Рис. 5.40 множеством Ω, обмотав Ω вокруг этой поверхности (рис. 5.40). Очевидно, что построенное таким образом отображение является диффеоморфизмом. Следовательно, поверхность цилиндра также разбивается на непересекающиеся траектории. Такое фазовое пространство называется цилиндрическим. Рис. 5.41 Рис. 5.42 Иногда такое пространство рассматривать удобнее, чем R2. Это связано в основном с тем, что исчезает та многозначность, которая соответствует координате σ: всем значениям σ + 2кп соответствует только одно состояние реальной системы. Кроме того, здесь имеются два типа замкнутых траекторий, которые соответствуют периодическим режимам работы систем 144
управления. Замкнутые траектории первого типа могут быть гомотопно стянуты в точку (рис. 5.41). Эта замкнутость сохраняется при переходе к R2. Замкнутые траектории второго типа, охватывающие цилиндр, не могут быть гомотопно стянуты в точку. Такая замкнутость исчезает при переходе кМ2 (рис. 5.42). § 5.3. Математическая теория популяций Биологическая популяция, находящаяся в благоприятных условиях среды обитания (изобилие пищи, отсутствие хищников и большая площадь обитания), размножается пропорционально своей численности. Считая число особей достаточно большим, можно перейти к идеализации, которая принимает число особей n(t) за гладкую функцию с аргументом t. В этом случае упомянутый закон размножения можно записать в следующей форме: Έ = λη· (5·44) Здесь постоянное положительное число λ — коэффициент рождаемости для рассматриваемой популяции. К уравнению (5.44) аналогичным образом приходят при анализе экономического роста с постоянным показателем прироста λ на больших временных интервалах. Ваш банковский вклад с годовым процентом прироста λ на большом временном интервале также возрастет, подчиняясь уравнению (5.44). Решение этого уравнения запишем в виде n(t) = extn(0). (5.45) В идеальных условиях рост популяции подчиняется экспоненциальному закону (5.45). В экспериментальных условиях это прослеживалось при быстром размножении бактерий. 145
Однако в экосистемах наблюдается постоянная конкуренция популяций за обладание пространством и пищей, имеются хищники, уничтожающие свои жертвы, вмешательство человека подавляет численность некоторых популяций. Таким образом, в экосистемах существуют многочисленные обратные связи, а попытки человека управлять экосистемой (например, путем отстрела хищников) могут приводить к различным, в том числе и нежелательным последствиям. Изучение математических моделей взаимодействия популяций началось в 20-х годах XX века, и в 1931 году была опубликована знаменитая книга Вито Вольтерра [76]. В 1976 году вышел перевод этой книги на русский язык с обстоятельным приложением, которое называется "Вито Вольтерра и современная математическая экология". Здесь мы рассмотрим уравнения Лотки—Вольтерра, описывающие взаимодействие двух видов — хищника и жертвы. Эта математическая модель, различные ее обобщения и другие интересные популяционные модели содержатся в упомянутой выше книге. Жертвы (например, зайцы) при отсутствии хищников (например, волков) размножаются согласно математической модели (5.44). Хищники при отсутствии жертв, т. е. пищи, быстро вымирают. Это соответствует отрицательному коэффициенту прироста λ. В случае сосуществования двух этих видов происходят встречи хищников и жертв. Ясно, что число таких встреч пропорционально численности хищников и жертв ani(t)ri2(t). Эти встречи влияют отрицательно на увеличение популяции жертв (с коэффициентом —β\) и положительно на увеличение популяции хищников (с коэффициентом /?2). Все сказанное выше позволяет написать следующие дифференциальные уравнения численности популяций n\(t) жертв и 146
(5.46) П2 (£) ХИЩНИКОВ! ή\ = λιτίι — βιαηιΠ2, ™2 = -А2П2 + β2θίΠιΠ2. Здесь величины п\ и П2 могут принимать только неотрицательные значения. При этом система (5.46) имеет следующие решения: ni(t) = 0, n2(t) = e"A2in2(0), n2(t) = 0, ni(t) = eAl'n2(0), ni(t) Ξη2(ί) = 0. Таким образом, фазовым пространством системы (5.46) является первый квадрант плоскости {щ > 0, п2 > 0} (рис. 5.43) Рис. 5.43 Покажем, что система (5.46) имеет при щ > 0, п2 > 0 первый интеграл У(п1,п2) = λ21ηηι - α/?2η! + λ 11ηη2 - α/?ιη2. В самом ββηβ^ V(ni(t),ri2(t)) = λ2 αβ2ή\ + λι α/?ιή2 = ηι η2 = λ2(λι - α/?ιη2) - α/?2(λιηι - α/?ιηιη2)+ +λι(-λ2 + αβ2η1) - α/?ι(-λ2η2 + α/?2ηιη2) = 0. 147
Отсюда следует, что и функция W{nl,n2) = ev^^=g{nl)h{n2), где д(щ) = η^ε-αβ2η\ h(n2) = η*1 β'αβίη2, также является первым интегралом системы (5.46). Легко видеть, что функции д и h имеют максимумы соответственно в точках αβ2 Οίβι Графики этих функций изображены на рис. 5.44. Рис. 5.44 Таким образом, функция W(ni, n2) обладает следующим свой ством: W(nun2)<w(^ \\ \αβ2 αβι) Отсюда следует, что линии уровня функции W(ni, n2) являются замкнутыми кривыми, окружающими точку (5.47). Таким образом, траектории системы (5.46) расположены на замкнутых линиях уровня и точка (5.47) является состоянием равновесия (рис. 5.45). 148
Рис. 5.45 Из фазового портрета на рис. 5.45 видно, что численности ni(t) и ri2(t) жертвы и хищника являются периодическими функциями. Такой колебательный характер изменения численности популяций наблюдается в различных экосистемах, и уравнения Лотки—Вольтерра адекватно качественно описывают взаимодействие популяций хищник—жертва. Лишь в одном случае мы имеем устойчивый (по Ляпунову) стационарный характер взаимодействия популяций. Численности n\(t) и ri2(t) остаются постоянными в точке (5.47). Перепишем систему (5.46) в виде (In Πι)* = λι - β\ΟίΠ2, (lnn2)# = -λ2 +/?2cmi и проинтегрируем левые и правые части этих равенств от 0 до Т, где Τ — период рассматриваемого решения ni(t), ri2(t). В результате получим τ Ι/„2(ί)<β=Α, (5.48) о 149
τ fJMt)dt=u о Напомним, что величину τ ^Jx(t)dt о называют средним значением Т-периодической функции x{t). Таким образом, нами доказана следующая теорема. Теорема 5.3. Средние функций n\(t) uri2(t) не зависят от начальных условий ηι(0), п2(0) и совпадают со стационарными значениями (5.47). Рассмотрим теперь тот случай, когда производится управление численностью популяций путем истребления особей каждого вида, которое будем считать здесь пропорциональным численности популяций. В этом случае уравнения взаимодействия популяций запишутся так: Μ = (λι - 7ι)πι - βιαηιη2, c^ (5.5U) ™2 = ~(λ2 + 72)^2 + β2^ΠιΠ2. Здесь 7ι и 72 — коэффициенты интенсивности истребления. Рассмотрим сначала случай λι < 7ι (а это означает, что истребление жертв идет интенсивнее их размножения при отсутствии хищников). Здесь обе популяции обречены на вымирание. В самом деле, рассмотрим функцию V(ni,ri2) = /?2™ι + Αη2· Для решений n\(t) и ri2(t) уравнений (5.50) получим V(n1(t),n2(t)) = (λ2 - 7i)/Wt) " (λ2 + 72)/3in2(t) < <-eV(ni(t),n2(t)), (5.51) где ε = min(7i - λι,λ2 + 72)· (5.49) 150
Переписав неравенство (5.51) в виде {V(n1(t),n2(t))e£ty <0 Vt>0 (5.52) и проинтегрировав обе части соотношения (5.52) от 0 до £, получим оценку V[nl[t),n2{t)) < e~ei^(ni(0),n2(0)). (5.53) Очевидно, что из оценки (5.53) следует lim щ(*) = 0, lim η2(ί) = 0. Последнее означает полное истребление жертв и вымирание хищников. Рассмотрим теперь наиболее интересный случай, для которого λι > 7ι· В этом случае вместо формул (5.48) и (5.49) имеем соотношения ϊ/"*>*-^ τ О Последние соотношения можно переформулировать в виде следующего утверждения. Теорема 5.4 (закон изменения средних). Если два вида истребляются равномерно и пропорционально числу особей, то среднее число жертв возрастает, а среднее число хищников убывает. Нетривиальным фактом здесь является то, что, производя отстрел зайцев и не охотясь на волков, мы не влияем на среднюю численность зайцев. А средняя численность волков при этом уменьшится.
Глава 6 ДИСКРЕТНЫЕ СИСТЕМЫ § 6.1. Мотивации 1. Математическая мотивация. Генератор канторов- ского множества. В предыдущей главе мы рассматривали разнообразие траекторий в двухмерных фазовых пространствах: траектории могли стремиться к состояниям равновесия или к бесконечности, быть замкнутыми кривыми, соответствующими периодическим решениям, приобретать свойство замкнутости в двухмерном цилиндрическом фазовом пространстве. В одномерном фазовом пространстве у траекторий дифференциального уравнения — = /(х), x€R\ (6.1) с непрерывной правой частью гораздо меньше возможностей. Из того факта, что траектории уравнения (6.1) либо заполняют целые интервалы в!1, либо являются стационарными точками, совпадающими с нулями функции /(х), можно сделать вывод о том, что любое решение уравнения (6.1) стремится при t —> +оо либо к стационарной точке, либо к бесконечности (рис. 6.1). 152
Рис. 6.1 Совершенно другая ситуация возникает для одномерной дискретной системы хк = Дх/с-ι). (6.2) Эта система представляет собой рекуррентную формулу для определения последовательности хк, к = 0,1,2,.... Разумеется, для однозначного определения последовательности хк нужно кроме правой части / задать еще и начальные условия xq. Здесь мы видим полную аналогию с решением задачи Коши, которая формулируется для дифференциальных уравнений. Пусть функция f{x) в системе (6.2) задана следующим образом (рис. 6.2): № = Зх при χ < 1/2, 3(1 - х) при χ > 1/2. (6.3) Рис. 6.2 Легко видеть, что уравнение (6.2) имеет ровно два стационарных решения: хк ξ 0, хк = 3/4. 153
Лемма 6.1. Для любого .то £ [0,1] решение Xk к —> оо. -оо npw Доказательство. При х0 < 0 из вида функции (6.3) следует, что Xk < 0 для всех к = О,1,... и Xk = З'хо· При xq > 1 получим χι < 0, следовательно, (6.4) (6.5) Из соотношений (6.4) и (6.5) следует утверждение леммы 6.1. Посмотрим теперь, что происходит с отображением / отрезка [0,1]. Каждый из двух отрезков [0,1/3] и [2/3,1] отображается на отрезок [0,1], а интервал (1/3,2/3) выбрасывается за отрезок [0,1], отображаясь на интервал (1,3/2). Все решения Xk уравнения (6.2) с такими начальными условиями в силу леммы 6.1 стремятся к бесконечности при к —> +оо. Ясно, что при отображении /(/(·)) каждый из отрезков [0,1/9] [2/9,3/9], [6/9,7/9], [8/9,1] отображается на отрезок [0,1], а решения Xk с начальными данными из интервалов (1/9,2/9), (1/3,2/3), (7/9,8/9) выскакивают из отрезка [0,1] и стремятся в силу леммы 6.1 к бесконечности при к —> +оо. Легко видеть, что на iV-м шаге при отображении ЯД·.· /(■)■■■) 4 ν " N на отрезке [0,1] останутся те решения хдг, начальные данные которых находятся на промежутках "3N-1 °·^ 3ΛΡ з^ _б_ 1_ зли ψ 3Ν 1 Этот процесс выбрасывания середин оставшихся отрезков обычно сопровождают следующим рисунком (рис. G.3): 154
ι—ι ι—ι ι—ι ι—ι ι—ι ι—ι ι—ι ι—ι Рис. 6.3 Ту часть отрезка [0,1], которая остается после бесконечного числа процедур с выбрасыванием середин оставшихся отрезков, называют канторовским множеством. Это очень "рваноеммножество. В любой окрестности любой его точки мы обнаружим дырку — интервальчик, не принадлежащий этому множеству. А можно ли его измерить? В математике обычно пытаются проводить измерения с помощью мер. Посмотрим, что даст измерение с помощью меры Лебега. С точки зрения этой меры нужно просто измерить длины оставшихся отрезков на N-й итерации, затем сложить их и устремить N к бесконечности. Проделаем это: yi3=2N ^ -> 0. 3=0 Таким образом, лебегова мера канторовского множества равна нулю. Но, может быть, существуют и другие способы измерения? Ведь если измерять длины кривых квадратными метрами, то возникает аналогичная ситуация. Все кривые будут иметь нуль квадратных метров, а все поверхности — нуль кубических метров. И наоборот, если измерять объем куба в квадратных метрах, то получим бесконечность. При введении лебеговой меры в евклидовом пространстве мы всегда фиксируем размерность пространства, где вводится эта мера: 1,2,3,... , п. 155
В 1916 году Φ. Хаусдорф ввел другое определение меры (точнее, внешней меры), которая также связана с некоторым числом (не обязательно целым) d. Это число называют хаусдорфо- вой размерностью множества. Введенная Ф. Хаусдорфом мера зависит от этого числа d и обычно принимает конечное значение на рассматриваемом множестве. Данное конечное значение отлично от нуля и бесконечности. Не вводя здесь точных и полных определений и формулировок, попытаемся измерить канторовское множество с точки зрения меры Хаусдорфа: будем проводить измерения не в линейных метрах (м), не в квадратных метрах (м2), не в кубических метрах (м3), а в величинах ма, где d — некоторое число. Тогда для каждого из оставшихся после N итераций отрезка имеем следующее измерение: В самом деле, если бы мы измеряли этот отрезок в квадратных метрах, то с точки зрения внешнего измерения (внешней меры), накрывая отрезок квадратом со стороной 1/3^ (рис. 6.4), получаем следующую "внешнюю"величину (l/3^)2. Обобщая это выражение для произвольного d, получаем величину (l/3N)d. 7/5N 1/3" Рис. 6.4 156
Суммируя все оставшиеся отрезки, имеем Ясно, что эта величина не стремится к нулю или к бесконечности только в одном случае: , In 2 Таким образом, хаусдорфова размерность канторовского множества равна In 2/In 3, а его хаусдорфова мера равна единице. Именно наличие таких множеств, как канторовское, стимулировало развитие современной теории меры и метрической размерности множеств. Заметим, что в том случае, когда начальная точка xq находится в канторовском множестве X, соответствующее решение х^ принадлежит К при всех значениях к. Множество X, обладающее таким свойством, называют инвариантным (или положительно инвариантным). В современной теории динамических систем инвариантные множества нецелой хаусдорфовой размерности называют странными. В настоящее время интенсивно изучаются непрерывные и дискретные системы, обладающие такими инвариантными множествами. Как мы видели, в дискретных системах эти множества встречаются в самых простых одномерных моделях. В непрерывном случае такие множества были обнаружены с помощью компьютерных экспериментов для фазовых пространств, размерность которых больше двух. Об этом можно прочитать в книге [304]. Рассмотренный выше генератор канторовского множества К все точки из Ш1 \ К устремлял к бесконечности. Рассмотрим теперь дискретную систему (6.2) с фазовым пространством [—1,3/2] и непрерывной функцией /(х), удовлетво- 157
ряющей следующим условиям: f ( \ — ί Зх при χ е [О,1/2], 1[Х)~ \ 3(1 -х) при хе [1/2,1], -1 < /(х) < 0 при хе [1,3/2], αχ < /(χ) < 0 при χ G [—1,0], где α — число из интервала (0,1). Л емма 6.2. Для любого хо £ [—1,0] U [1,3/2] решение хк стремится к пулю при к —> +оо. Доказательство. Пусть хо £ [1 ·> 3/2]. Тогда очевидно, что х\ G [—1,0]. Множество же [—1,0] положительно инвариантно, т.е. при хо Ε [—1,0] имеем х^ G [—1,0] VI, 2,... При этом к — 1 /-ν х/с > α χι —> 0 при к —> +оо. Отсюда следует утверждение леммы 6.2. Используя лемму 6.2 и рассуждения при построении канто- ровского множества, получаем, что кроме инвариантности К относительно отображения / здесь мы имеем еще и свойство глобального притягивания: любое решение х^ в фазовом пространстве [—1,3/2] стремится при к —> +оо к множеству К: p(xfc, К) = inf \z - хк\ -> 0 (6.6) при к —> +оо. Инвариантные ограниченные множества, обладающие свойством притягивания (6.6), называют аттракторами. Аттракторы нецелой хаусдорфовой размерности называют странными. В некоторых исследованиях странными называют аттракторы, обладающие свойством внутренней неустойчивости: при малых шевелениях начальных условий xq Ε К разность между соответствующими этим начальным данным решениями не будет малой при достаточно больших значениях к. 158
Нетрудно показать, что в рассмотренном здесь генераторе канторовского множества имеет место такая чувствительность по отношению к начальным условиям из К. Отметим, что численные методы решения дифференциальных уравнений, основанные на идее дискретизации, также приводят к дискретным уравнениям (6.2) с n-мерным фазовым пространством Шп. 2. Экономические и технические мотивации. Перейдем теперь от канторовского множества к анализу работы производственного склада. Пусть на складе имеется η различных комплектующих, из которых собирается готовое изделие. Сводка наличия комплектующих составляется в конце каждого дня — это дискретные времена t = 0,1, 2,... , к. Компоненты вектора хк — это число соответствующего вида комплектующих, находившихся на складе в конце предыдущего дня, компоненты вектора ик характеризуют число каждой из комплектующих, поступивших на склад в счет внешних поставок в течение дня. Будем рассматривать здесь ситуацию, когда для производства готовых изделий в течение дня со склада поставляется Vxk комплектующих. Здесь V — диагональная матрица с диагональными элементами, равными нормам затрат комплектующих на одно изделие. Из приведенного здесь описания следует, что производственная цепочка склад — сборочный цех может быть описана следующими дискретными уравнениями: хк+1= хк-Т>хк + ик, ак = с*хк. (6.7) Здесь величина ак соответствует числу собранных за день готовых изделий. Компоненты вектора с совпадают с диагональными элементами матрицы V. Как и в главе 2, мы можем трактовать уравнение (6.7) как линейный дискретный блок с входом ик и выходом ак. Введение в теорию таких систем будет изложено в следующем параграфе. 159
Применение компьютеров в системах управления приводит к тому, что либо часть системы, либо система в целом может быть описана дискретными уравнениями. Приведем здесь поучительный и наглядный пример применения микро-ЭВМ в системе управления стиральной машиной, взятый из книги [195]. Блок-схема такой системы изображена на рис. 6.5. Ввод Температура воды Уровень воды АЦП АЦП Время | ЛЦП ЦП+ ОЗУ Модуль ввода - вывода 'Горячая" стирка ПЗУ Переключатель программ Стирка цветного белья ПЗУ Стирка белого белья ПЗУ Вывод Нагревательный элемент Клапан подачи воды Насос слива Двигатель Рис. 6.5 Система управляет тремя величинами: температурой воды в баке, ее уровнем и временем стирки. С помощью переключателя программ подключается к работе одна из программ, которая выдает три параметра: уровень воды, ее температуру, время стирки. С помощью датчиков уровня воды, температуры и таймера, измеряющего время работы электродвигателя, на вход поступает текущая информация в виде непрерывных электрических сигналов об уровне, температуре и времени. Аналого- цифровые преобразователи АЦП являются дискретизаторами сигналов, которые, воспринимаясь теперь как числовая информация, могут обрабатываться центральным процессором ЦП. 160
Сигналы, выдаваемые Д77, управляют нагревательными элементами, клапанами подачи воды, насосом слива и мотором для стирки. Эти сигналы зависят от того, какая программа стирки подключена из постоянного запоминающего устройства ПЗУ. Блок-схема одной из программ приведена на рис. 6.6. start) —-Ч Замер уровня воды Замеренный уровень Открыть клапан подачи воды Установленный уровень Да >- Закрыть клапан подачи воды Проверить температуру воды Включить нагревательный элемент ЗГ>40°С Да нагревательный элемент Включить двигатель ZL Замеренное время Замерить время Заданное время 3МБ>3ДВ' \Да Выключить двигатель Рис. 6.6 Ясно, что описанная выше система изменяет свои состояния 161
в дискретные моменты времени. Исключением являются сигналы на входе до обработки их аналого-цифровым преобразователем. Часто в системах управления присутствуют и цифро-аналоговые преобразователи, которые преобразуют дискретные сигналы в непрерывные. Системы, одна часть которых описывается дискретными уравнениями, а другая — непрерывными, называются гибридными. § 6.2. Линейные дискретные системы Здесь будет изложен дискретный аналог линейной теории, которая была построена для непрерывных систем в главах 2 и 3. Рассмотрим сначала линейную дискретную однородную систему с постоянной матрицей хк = Ахк-ъ А; = 0,1,... (6.8) Здесь А — постоянная η χ η-матрица, χ — элемент n-мерного векторного пространства. Очевидно, что решение системы (6.8) имеет вид хк = Акх0. (6.9) Так же, как и в теории дифференциальных уравнений, будем называть хо начальными данными. Часто бывает полезным ввести матрицу В, подобную матрице А: А = S^BS. В этом случае формула (6.9) принимает вид хк = S^BSS^BSS^B.^BS хо = S~lBkSxo. (6.10) к 162
Напомним, что в том случае, когда матрица В является жор- дановой матрицей, т. е. Μ в = о\ \0 JmJ где Jj — блоки Жордана, матрица Вк имеет очень простой вид: (3\ 0 \ вк=\ \о зкт) где для диагональной матрицы Jj имеем Ji=l ··. I. (6.П) Если блок Жордана имеет вид * = \о ТО / к кХ^ k(k-l)\*- 1 Л3 1! 2! \о 1 (6.12) fc...(fc-f+2)AJT'+1\ λ* 7 Здесь Aj — собственные значения матрицы А. В дальнейшем будем считать, что χ является элементом евклидова, или унитарного, векторного пространства с нормой 163
Из приведенных выше рассуждений вытекает следующий результат. Теорема 6.1. Для того чтобы все решения системы (6.8) стремились к нулю при к —> +оо, необходимо и достаточно, чтобы для всех собственных значений Xj матрицы А выполнялось неравенство М<1. (6.13) Для того чтобы все решения системы (6.8) были ограниченными, необходимо и достаточно выполнения неравенства \Xj\ < 1 для собственных значений матрицы А, соответствующих блокам Жордана вида (6.11), и неравенства \Xj\ < 1 для собственных значений, соответствующих блокам Жордана вида (6.12). Определение 6.1. Будем говорить, что нулевое решение системы (6.8) устойчиво по Ляпунову, если для любого δ > О существует число ε > 0 такое, что из неравенства \хо\ < δ следует соотношение \х^\ < ε Vfc = 0,1,... Определение 6.2. Будем говорить, что нулевое решение системы (6.8) асимптотически устойчиво, если оно устойчиво по Ляпунову и все решения стремятся к нулю при к —> +оо. Заметим, что здесь в силу линейности свойство стремления к нулю решений с начальными данными из некоторой малой окрестности нуля и свойство стремления к нулю всех решений при к —> +оо эквивалентны. Таким образом, условие (6.13) является необходимым и достаточным условием асимптотической устойчивости нулевого решения системы (6.8). Напомним, что для системы дифференциальных уравнений dx — = Ах dt 164
необходимым и достаточным условием асимптотической устойчивости является неравенство Re Xj < 0 для всех собственных значений λ^ матрицы А. Покажем теперь, что переход от формулы (6.9) к формуле (6.10) часто полезен при решении системы (6.8). В качестве примера приведем, по-видимому, первую из рассмотренных математиками дискретную систему вида (6.8). Леонардо Пизанский (Фибоначчи) в начале XIII века рассмотрел дискретное уравнение Λ = Λ-ι + Λ-2, к > 1, /о = /ι = 1- (6.14) Это уравнение генерирует так называемые числа Фибоначчи Д. Найдем явные выражения для Д, используя описанный выше подход. Введем обозначение *-(&)· —G0-G)- Тогда уравнение (6.14) запишется в виде системы (6.8) с матрицей Легко видеть, что жордановой формой матрицы А является матрица В={Ро й)' где 1 + Vb 1 — л/5 ρι = __, „2 = —2—■ Для определения матрицы S запишем равенство BS = SA, (6.15) 165
которое является следствием соотношения А = S 1BS. Не умаляя общности, запишем матрицу S в виде 1 S12" .521 £22> S = Из равенства (6.15) получим S\2 =Pl, PlSi2 = 1 + 5i2, ^2^21 = S22, ^2^22 = 522 + 521- Эти равенства выполнены при Si2 = pi, S21 = 1, 522 = Ρ2· Таким образом, Ί рГ 1 Р2, Используя правила нахождения обратной матрицы, получаем S = 1 V2 -Pi Из формулы (6.10) имеем Р2 -1 -Pi 1 1 fp2 -V5 V-i -рЛ Λ>ί 0 \ (рг + 1\ ι; V о р§; \р2 +1) ι /-к рЛ Μ ολ (Р2Л -^ъ\1 -ι) [о pV{pV~ 1 /-Ρ2ρί+2+Ρ!Ρ^2\ Ι /ΡΪ+1-Ρ$+1\ Μ ρ?+2-Ρ2+2 ; ^U+2-P2+2; Отсюда сразу следует формула для чисел Фибоначчи Д /fc = 7f М+,-(чТ 166
Внимательный читатель легко увидит здесь полную аналогию с интегрированием линейных дифференциальных уравнений путем приведения системы к жордановой форме с последующим возвращением в исходное фазовое пространство. Для линейной неоднородной дискретной системы хк = Axk_i + fk-i (6.16) справедливо следующее представление решений: к-1 хк = Акх0 + ^Ак-з-1Ъ. (6.17) j=o Доказательство этого представления проводится подстановкой правой части выражения (6.17) в левую и правую части уравнения (6.16). Заметим, что в отличие от теории дифференциальных уравнений ответы на вопросы о существовании, единственности и продолжимости решений дискретных систем хк = F(xk-i,k- 1), к = 0,1,... являются очевидными и положительными. Рассмотрим теперь систему xk+i = Ахк + Ь£к) ак = с*хк) (6.18) где А — постоянная η χ η-матрица, b и с — постоянные η χ га- и η χ /-матрицы соответственно. Как и в главах 2 и 3, будем рассматривать £fc как вход линейного блока, ак — как выход и хк — как вектор состояния блока в дискретные моменты времени к = 0,1,... Определение 6.3. Будем говорить, что система (6.18) вполне управляема, если для любой пары векторов у Ε W1, ζ Ε Rn существуют натуральное число Ν < η и векторная последовательность £/с такие, что для решения хк системы (6.18) с 167
этой последовательностью ξ^ и начальными данными Хо = у выполнено равенство χ ν = ζ. В отличие от непрерывного случая здесь не гарантируется возможность достижения конечного целевого состояния ζ за любое время Т. Требуется некоторое число тактов TV, чтобы привести систему в требуемое состояние ζ. Теорема 6.2. Система (6.18) вполне управляема тогда и только тогда, когда пара (Л, Ь) вполне управляема. Доказательство. Напомним, что полная управляемость пары (Д Ь) эквивалентна соотношению mnk(b,Ab,...,An-1b)=n. (6.19) Примем Ν = η и воспользуемся формулой (6.17): п-1 хп = Апх0 + Σ Ап~1ЧЬ^. (6.20) Перепишем это соотношение следующим образом: Кп-г + А1£п-2 + · · · + Αη~4ξ0 = ζ - Апу. (6.21) Равенство (6.21) можно записать также в виде (6, АЪ,..., Ап-гЬ) I : 1=2- Лпу. (6.22) Разрешимость этого линейного уравнения относительной неизвестной матрицы Wo следует из равенства (6.19). 168
Таким образом, если пара (А,Ь) полностью управляема, то из (6.22) находим последовательность управляющих входов £о? · · · ... ,ξη-ь которые переводят вектор состояния χ из состояния xq — у в состояние хп = ζ. Пусть пара (Л, Ь) не является полностью управляемой. Тогда согласно теореме 3.2 из главы 3 существует неособая матрица S такая, что Проведем в уравнениях (6.18) замену хк — Syk: ум = S~lASyk + S"1^, ak = c*Syk. (6.23) Переписав уравнения для ук в виде где У к = получим, что управлением ξ^ невозможно переводить вектор (2) ~ ~ (2) (2) уКк ' из произвольной начальной точки yy=z\J в произволь- (2) (2) ную конечную точку yKN = z\ . Таким образом, если пара (Л, Ь) не полностью управляема, то и система (6.18) не полностью управляема. Так же, как и в непрерывном случае, будем говорить, что система (6.18) полностью наблюдаема, если по последовательности ак можно однозначно определить последовательность хк. Здесь соотношения между ак и хо определяются следующим образом: σο = с*х0, σι = с*Ах0 + с*Ь£о, ап = сМ^^о + J: с*Ап-х-Щу 169
Из этих уравнений можно однозначно определить начальное состояние блока тогда и только тогда, когда rank / с* \ \c*An-xJ = п. Таким образом, нами доказан следующий результат. Теорема 6.3. Для полной наблюдаемости системы (6.18) необходимо и достаточно, чтобы пара (Л, с) была вполне наблюдаемой. Для дискретных систем имеются также аналоги теорем о линейной стабилизации. Приведем один из них. Пусть ξΐς = 5*х/с. Тогда из уравнений (6.18) получим Xfc+i = (A + bs*)xk. Напомним, что в предположении, что т = 1 (т. е. Ь — п- вектор) и (Л, 6) полностью управляема, получен следующий результат. Теорема 6.4. Для любого полинома Ф(Р) =РП + Фп-1Рп~1 + . · · + Фо существует вектор sGK71 такой, что det(pl - А - 65*) = ψ(ρ). Эта теорема вместе с теоремой об устойчивости линейной однородной дискретной системы решает вопрос о стабилизации с помощью линейной обратной связи вида ξ = s*x. Для дискретных систем часто используется Z-преобразова- ние, являющееся некоторым аналогом преобразования Лапласа для непрерывных систем. 170
Рассмотрим последовательность Д, возрастающую при к —> +оо не быстрее, чем где d — некоторое число. Определим Z-преобразование последовательности Д в функцию комплексной переменной ζ следующим образом: оо Z{(fk)} = F(z) = J2^kfk- /с=0 Здесь ζ принадлежит внешности круга {z\ \z\ > d}. Заметим, что часто в различных разделах математики используются производящие функции последовательностей оо G(z) = ^2zkfk. Ясно, что G(z) = F^"1). к=0 Очевидно также, что Д может быть векторной последовательностью некоторой размерности. Применим Z-преобразование к обеим частям уравнений (6.18) в предположении х0 = 0: оо оо оо ]Г z~kxk+1 = ΑΣ z~kxk + ЬΣ z~k&, fc=0 к=0 к=0 оо оо к=0 к=0 Эти уравнения можно переписать следующим образом: оо оо Σ г~как = -с*{А - ζΙ)-4Σ*~%· (б·24) к=0 к=0 Так же, как и в непрерывном случае, дробно-рациональную матричную функцию W(z) = с*(А — zl)~lb будем называть передаточной функцией системы (6.18). Передаточная функция связывает Z-преобразования входа и выхода линейного дискретного блока так же, как в непрерывном случае такая же функция W(z) связывала преобразования Лапласа входа и выхода. 171
Для λί - периодической последовательности Д часто вводят дискретное преобразование Фурье [203] и—η \ / к=0 Легко видеть, что, если х^ и £*. - λί - периодические последовательности, то "^-^ / 2nkj\ ( ( 2nj\\ "У".1 / 2nkj\ y£akexpli \ =_и/(ехр(-г— JJ.JJ^expii-^-j к=0 V J Ч Ч 7 7 к=0 Ч 7 Эта формула следует из соотношения V-1, (.2жк]\ ( .2πΛ 2^ Λ+1 ехР у~77~) = ехр V-гИ) j' Различные аспекты развития теории дискретных динамических систем и их применения изложены в книгах [59, 71, 74, 83, 101, 119, 140, 152, 156, 167, 168, 169, 221, 227, 406, 410, 418].
Глава 7 ПРОБЛЕМА АИЗЕРМАНА. МЕТОД ПОПОВА В 1949 году известный специалист по теории управления М. А. Айзерман в журнале "Успехи математических наукм[3] сформулировал проблему, которая стимулировала разработку новых математических методов исследования нелинейных дифференциальных уравнений. В настоящее время эти методы вышли далеко за рамки математической теории управления и применяются для решения многих прикладных задач. Рассмотрим систему f = Ai + M*), (7.1) σ = с*х, где Л — постоянная η χ η-матрица, b и с — постоянные п-мерные векторы, φ(σ) — непрерывная функция. Наряду с системой (7.1) рассмотрим линейные системы dy М=ЛУ + Ь^ (7.2) σ = с*х и предположим, что при а < μ < β (7.3) системы (7.2) являются устойчивыми, т. е. все их решения стремятся к нулю при t —> +оо. Будет ли нулевое решение системы (7.1) устойчиво в целом, если выполнено условие 173
a < φ{σ)/σ < β (7.4) для всех σ/0? Мы будем говорить здесь, что нулевое решение системы (7.1) устойчиво в целом (или система (7.1) устойчива в целом), если это нулевое решение устойчиво по Ляпунову и любое решение системы (7.1) стремится к нулю при t —> +оо. М. А. Айзерман высказал предположение, что поставленный выше вопрос всегда имеет положительное решение [3]. В работах Н. Н. Красовского, В. А. Плисса, Е. Нолдуса и Г. А. Леонова [239, 240, 423, 424] были приведены классы нелинейных систем, где гипотеза М. А. Айзермана была неверна, т.е. было выполнено неравенство (7.4), все линейные системы (7.2) с μ, удовлетворяющими (7.3), были устойчивы, а система (7.1) обладала решениями, не стремящимися к нулю при t —> +оо. Здесь будет продемонстрирован метод получения критериев устойчивости в целом, который был предложен в 1958 году В.М.Поповым [244]. Исследования В.М.Попова были во многом стимулированы проблемой Айзермана. Рассмотрим систему (7.1), дополнительно предполагая, что А — устойчивая матрица, т. е. все ее собственные значения имеют отрицательные вещественные части. Слегка изменим условие (7.4). Будем здесь предполагать, что выполнено неравенство 0<φ(σ)/σ<1τ Va ф 0, (7.5) где к — некоторое число. Так же, как и в главе 2, введем передаточную функцию линейной части системы (7.1) W(p) = c*(A-pI)-1b, ре С. Теорема Попова. Пусть существует число θ такое, 174
что для всех вещественных ω выполнены неравенства - + Re [(1 + θιω)\ν(ίω)] > О, (7.6) lim ω—++οο \ + Re [(1 + 9iu)W(iu)] >0. Тогда система (7.1) устойчива в целом. Перед тем как доказывать теорему, напомним определение преобразования Фурье и некоторые его свойства. В главе 2 мы приводили два разных определения преобразования Фурье +оо +оо f{f(t)) = --L J е™№ dt, F(f(t)) = j е-™№ dt для абсолютно интегрируемой и кусочно-непрерывной на интервале (—сю, +оо) (а для F — на (0, +оо)) функции f(t). Для преобразования Фурье хорошо известна формула обращения +оо +оо fit) = ^ |( J е^-')/(т) άή άω, (7.7) -оо —оо которая доказана в [331]. Здесь внешний интеграл понимается в смысле главного значения, т. е. как предел м lim / (.. λάω. М-++оо J -Μ Из формулы (7.7) следует, что для абсолютно интегрируемого произведения f(t)g(t), абсолютно интегрируемых и кусочно- 175
непрерывных функций f(t) и g(t) справедливы равенства +оо +оо +00 +00 J f(t)g(t)dt = J ^ ( j ( J β^^!{τ)άτ^άω^ dt = — OO —OO —OO —OO =/(ж/е^(')л)(^/е<"т/(г)"гЬ — oo —00 —00 Таким образом, выполнено равенство + 00 + 00 J f(t)g(t) dt= J F(f(t)) ГЩ) ώω. (7.8) — OO —OO Равенство (7.8) является очень важным свойством преобразования Фурье. Оно означает, что преобразование Фурье является унитарным оператором в пространстве суммируемых с квадратом функций L2(—сю, +оо). Другими словами, если для множества суммируемых с квадратом функций / и д ввести скалярное произведение + 00 (/,<?) = Jf(t)g(t)dt, то оператор Τ действует на этом множестве функций, сохраняя скалярное произведение. Из формулы (7.8) сразу следует, что для преобразования Фурье F справедливо равенство + 00 + 00 J f(t)g(t) dt = ±- J F(№)FUfi) du. (7.9) 0 -oo Напомним также, что в главе 2 доказаны следующие формулы (предложения 2.1 и 2.2): F{f(t))=iuF(f(t))-f(0), (7.10) 176
t F^jf(t-T)g(r)dT^=F(f(t)) F(g(t)). (7.11) 0 Теперь мы можем приступить к доказательству теоремы Попова. Заметим, что если выполнены неравенства (7.6), то существует число ε > 0, для которого τ-ε + Κβ[(1 + θίω)νν(ΐω)]>0 У ω е R1. (7.12) Κι Заметим также, что заменой φ(σ) = ка — ψ(σ) и рассмотрением вместо (7.1) системы х = (А + Ьс*к)х- Ьф(а), а = с*х (7.13) можно свести условие (7.6) к формально более ограничительному условию (7.6) с θ > 0. В самом деле^ в результате такой замены система (7.13) будет иметь передаточную функцию uw>- ~W(P) 1 + kW(p) ' а ψ(σ) будет удовлетворять вновь условию (7.5): 0<ф(а)/а<к \/σ^0. Неравенство (7.6) для системы (7.13) примет вид ^+Re[(l+eiu)U(iu)] = (1+к\У(ги)-квги\У(ги)-к2вги\\У(ги)\2)_ 6 k\l+kW(iu)\2 ^ + Re((l-eiu)W(iu)) = |1 + kW(iu)\2 >0' Таким образом, если неравенство (7.6) выполнено для θ < 0, то можно с помощью указанной выше замены прийти к системе 177
вида (7.1) с нелинейностью, удовлетворяющей условию (7.5), и с выполненным неравенством (7.6), где θ > 0. Ясно также, что для любого решения x(t) системы (7.1) с начальными данными х(0) = хо справедливо соотношение t a(t)=a(t) + J\(ί-τ)φ(σ(τ))άτ, где *„Ath a(t) = c*eMx0, 7(t) = c*eA% a(t) = c*x(t). Лемма 7.1. Если выполнено неравенство (7.12), то для любого числа Τ > 0 справедливо соотношение J ^(α(ί)) (σ(ί) - \φ(σ(ί)ή +εψ{σ{ί))4 о τ +θφ(σ(ί))σ(ΐ) \dt < φ(σ(ί)) (α(ί) + θά(ί))άί. (7.14) Доказательство. Введем в рассмотрение функции φτ(ί) = φ(σ(ί)) при te[0,T], 0 при t > Τ, aT(t) = a(t) + / 7(t - τ)φτ{τ) dr, где Т — некоторое положительное число. Иногда функцию φτ{ϊ) называют срезкой функции φ[σ{ί)). Очевидно, что выполнены равенства 178
/ о ■/ φ{σ{€)) ( a(t) - £ φ(σ(ί)) ) +εφ(σ(ί))2 + θφ{σ{ΐ))σ{ί) dt= ο +00 φτ{ί) ( στ(ί) - ^φτ(ί) ) +εφτ{ίγ+θφτ{ΐ)στ{ί) dt= = / ψτ{ί)\ Ι η{ί-τ)φτ{τ)άτ + (ε- - ) ψτ(ί) + ο ο t t +00 +eji f Ί^-τ)φτ{τ)άτ\\άί+ ί φΤ(ί)(α(ί)+θά(ί)) dt. Используя соотношения (7.9)—(7.11), получаем (7.15) / ψτ(ί) I lit- τ)φτ(τ) dr+ Ι ε - - J φΤ(ί) + о о t +ejt(f~f(t-T^T(T)dT о +oo - i I F^<(» dt F(y(t))F(<pT(t))+(e--)F(<pT(t))+ +0iu>F(y{t)) F(<pr(t)) άω +oo -(l + 6iu)W(iu) + + |Ε-ΐ \F(VT(t))\2dw. Ясно, что при выполнении неравенства (7.12) величина 179
+oo t / ψτ(ί)\ / η{ί-τ)φτ{τ)άτ + (ε- - ) φτ^) + +ejAI 7(* - τ)φτ{τ)άτ ο dt является отрицательной. Отсюда и из соотношений (7.15) следует неравенство (7.14). Лемма 7.2. Если выполнено неравенство (7.12) с θ > О, то существует число q, для которого +оо j ψ{σ(ΐ))2άΙ < q\x0\2. (7.16) Доказательство. Из условий (7.5) и θ > 0 по лемме 7.1 следует, что Τ σ{Τ) Τ ■ Ι φ{σ{ί))2(ϋ < -θ j φ(σ) da + ί φ(σ(ί)) (a(t) + θά(ί)) dt. 0 σ(0) О Используя очевидное неравенство uv < - и2 + —- v2 Vu, Vv ~ 2 2ε и тот факт, что σ da > О \/σ 180
(последнее следует из условия (7.5)), получаем оценку Τ σ(0) I J φ(σ{ί))2άί < θ Ι φ(σ)άσ+ о о τ + γ f(c*eAtx0 + ec*AeAtx0)2dt < о τ < ^|с|2|х0|2 + γ f(c*eAtx0 + ec*AeAtx0)2dt. о Отсюда и из устойчивости матрицы А вытекает утверждение леммы 7.2. Рассмотрим теперь линейную систему x = Ax + f(t), хЕГ, (7.17) где А — постоянная устойчивая матрица, f(t) — непрерывная вектор-функция. Лемма 7.3. Если для некоторого числа а +оо J \f(t)\2dt<a, (7.18) О то существует такое число β, что выполнено неравенство \χ(ί)\2<β(\χ(0)\2 + α). (7.19) Кроме того, выполнены следующие соотношения: +оо ί \x(t)\2dt < +oo, Hm χ(ΐ) = 0. (7.20) 181
Доказательство. Напомним (см. главу 1), что существует положительно определенная матрица Я, для которой Л*Я + НА = -I. Поэтому для функции W(t) = x(t)*Hx(t) справедлива оценка W{x{t)Y = -|χ(ί)|2 + 2x*Hf(t) < -|χ(ί)|2+ + |2Я| \x(t)\ |/(t)| < -i |z(i)|2 + 4|tf |2|/(i)|2· l · J Отсюда следует, что x(t)*Hx(t) < х(0)*Ях(0) + 4а|Я|2. (7.22) Из этого неравенства и положительной определенности матрицы Я следует существование числа /?, для которого выполнено (7.19). Вновь рассматривая неравенство (7.21) и интегрируя обе его части от 0 до t, получаем соотношение t W(x(t)) - W(x(0)) + λ- ί \χ(τ)\2άτ < 4а|Я|2 . ο Отсюда следует, что +οο \x{t)\2dt < oo. (7.23) / О Рассмотрим теперь интеграл с / x(r)*x(r)dr = \\x(t)\2 -\Ш\2. (7.24) 182
Имеем очевидные соотношения t t /Mr)-±(r)|*</Wr)P* + /|i(r)|»*- О 0 0 t t = ί \x(r)\2dr + Ι \Αχ(τ) + f(r)\2dr < о о t t < j \x(r)\2dr + J (\A\ \x(r)\ + \f(r)\)2dr < 0 0 t t < (1 + 2\A\2) j\x(r)\2dr + 2 J\f(r)\2dr. 0 0 Отсюда и из соотношений (7.18) и (7.23) следует, что интеграл t О сходится абсолютно. Значит, существует предел t lim / χ(τ)*χ(τ) dr. t-^+ooJ 0 Но тогда в силу (7.24) получим существование предела lim \x(t)\. Отсюда и из (7.23) вытекает, что lim \x(t)\ =0. t—>+оо Лемма доказана. 183
Из лемм 7.2 и 7.3 сразу следует, что система (7.1) устойчива в целом. Отметим, что в случае θ < 0 следует воспользоваться указанной выше заменой и свести рассмотрение к случаю θ > 0. Геометрическая интерпретация теоремы Попова. Рассмотрим годограф модифицированной частотной характеристики Χ{ω) = Re W(iu), Υ (ω) = ω Im W(iu) (рис. 7.1). Рис. 7.1 Если через точку X — — 1/fc, Y = 0 можно провести прямую X — ΘΥ — —1/к так, чтобы весь годограф {Χ(ω),Υ(ω)} был расположен справа от этой прямой, то будет выполнено условие (7.6) теоремы Попова. Интересно сравнить этот результат с критерием Найквиста, являющимся необходимым и достаточным условием устойчивости линейных систем. Для устойчивости линейных систем (7.1) с φ(σ) = μσ при μ G (0, к) и при устойчивой матрице А необходимо и достаточно, чтобы годограф {Χ(ω),Υ{ω)} не пересекал "запрещенный луч"{Χ, Υ \ Χ Ε (—оо, -1/&), Υ — 0}. Частотное условие Попова является более жестким. "Запрещенной зоной "является полуплоскость слева от прямой X — 184
ΘΥ = — 1/fc, где 0 — варьируемый параметр. Однако для двухмерных систем можно показать, что если максимальный сектор устойчивости, выделенный по критерию Найквиста, имеет вид [О, /со), то для любого к < ко существует варьируемый параметр #, для которого выполнено частотное неравенство (7.6). Устойчивые в целом системы (7.1) с нелинейностями, удовлетворяющими условию (7.5), часто называют абсолютно устойчивыми. О теории абсолютной устойчивости и различных применениях метода Попова можно прочитать в книгах [6, 83-85, 168, 191, 204, 227].
Глава 8 ЛИНЕЙНО-КВАДРАТИЧНАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Рассмотрим линейную систему dx — = Ax + bu(t), (8.1) at где А — постоянная η χ η-матрица, b — постоянная η χ га- матрица, u(t) — непрерывная га-метрная вектор-функция. Введем в рассмотрение функционал +оо +оо J(x(-),0) = I x(t)*Qx(t)dt+ I u{tyRu(t)dt, о о заданный на множестве непрерывных вектор-функций x{t) и u(t). Здесь Q и R - симметричные матрицы, такие, что Q > О, R > 0. Очевидно, что каждой паре х(·), и(·) здесь ставится в соответствие либо число, либо +оо: J : (*(·),«(·))-[0,+оо]. Линейно-квадратичная задача оптимального управления формулируется следующим образом. При какой стабилизирующей линейной обратной связи и — Кх функционал J(x(-),Kx(·)) принимает минимальное значение ? 186
Для решения этой задачи введем в рассмотрение следующее алгебраическое уравнение Риккати-Лурье [226] НА + Л*Я - HbR~lb*H + Q = 0 (8.2) относительно симметричной положительно определенной матрицы Н. Заметим, что при b = 0 уравнение (8.2) превращается в уравнение Ляпунова (см. главу 1). Теорема 8.1. Если существует матрица Η = Η* > 0, удовлетворяющая уравнению (8.2) и неравенству HbR~lb*H + Q > 0, то при любых начальных условиях х(0) = хо оптимальная стабилизация обеспечивается обратной связью и = Кх, K = -R~lb*H. (8.3) При этом минимальное значение функционала J равно XqHx0. Доказательство. Рассмотрим функцию V(t) = = x(t)*Hx(t), где x(t) — решение системы (8.1). Ясно, что выполнены условия V(t) - V{0) = f V(τ) dr = f (χ(τ)*[Α*Η + ΗΑ]χ(τ) + {gA) +2х(т)*НЬи(т) ) dr. Заметим, что из соотношения К = —R~lb*H следует равенство НЬК = —K*RK. Поэтому из (8.2) и (8.4) имеем тождество V(t)-V(0) = J ( - x(t)*Qx(t)+ о +x{t)*K*RKx(t) + 2x(t)*K*Ru(t) ) dr. Для любой стабилизирующей обратной связи имеем равенство lira x(t) = 0. ί—+оо 187
Поэтому +оо х*#£0 - / (x(t)*Qx(t) + u(t)*Ru(t)) dr- 0 -hoo - J (u(t)-Kx(t))*R(u(t)-Kx(t)) dr. 0 Таким образом -hoo J = f (u(t) - Kx(t))* R (u(t) - Kx[r)) dr + x*0Hx0. 0 Отсюда сразу следует, что минимальное значение J достигается при u{t) = Kx(t). Покажем, что такая обратная связь является стабилизирующей. Для этого воспользуемся равенствами (8.2) и (8.3). В этом случае V(x(t)) = x(t)*(HA + A*H)x(t) + 2x(t)*HbKx(t) = - -x(t)*Qx(t) + x{ty{HbR-lb*H - 2HbR-lb*H)x{t) = = -x(t)*[Q ~ HbK]x(t) = -x(t)*[Q + K*RK]x(t). Из неравенств Η > 0 и Q+K*RK > 0 следует асимптотическая устойчивость системы х = (А + ЬК)х. Следовательно, обратная связь u(t) = Kx(t) является стабилизирующей. Теорема доказана. Пример. [227] Рассмотрим здесь плоские вращения космического аппарата, рассмотренные в §4.1. Только вместо 188
нелинейной обратной связи Μ(σ) рассмотрим линейную обратную связь. В этом случае уравнения движения примут вид ΙΘ = агв + а2в, где αϊ и «2 - некоторые числа. Перепишщем это уравнение в следующей форме в = к1в + к2в, где kj = Oij/I. Таким образом, здесь и = к\в + к2д. Функционал +оо J= f (θ(ί)2 + pu(t)2) dt, где р — положительное число, характеризует энергетический показатель качества процесса стабилизации. Запишем нашу линейно-квадратичную задачу оптимизации в матричной форме (8.1): Уравнение Риккати-Лурье (8.2) здесь имеет вид 0 0\ fhn hn\ An h12\ (0 1 1 θ) \hn h22) + \hl2 h22) \0 0 _1 An h12\ (0\ /n ^ An h12\ (1 θ\ /θ Ο ρ V^i2 W V1/ l J V^i2 h22) "*" VO oj VO 0. Здесь Я = '/*11 /112' ч^12 h22/ Проведя элементарные действия по перемножению матриц, получим равенство 0 0 V /Ό hn\ ! ( hi2 h12h22\ , /Ί 0^ _ /Ό 0Ν + Ι„ , Ι—( , Г ,2 1 + Λ-ll Λ-12/ V0 ^ΙΖ/ Ρ 4^12^22 ^22 7 V0 °/ \° °. 189
или f -& + 1 hn-^\ Д) О Отсюда и из условия Η > 0 получим равенства Ли = Р1/2, h22 = ψρ*\ hn = ^pV\ Из формулы (8.3) вытекает следующее выражение для К: К = (kuk2) = --p(h12,h22) = (-p-V* - ψρ-Α . Таким образом, здесь линейно-квадратичная задача оптимизации решена в аналитической форме. В общем n-мерном случае здесь приходится решать систему п(п + 1)/2 квадратных уравнений, что является весьма сложной вычислительной задачей. В том случае, когда (Д Ь) полностью управляема, R > 0 и Q > 0, известно, что такая система имеет решение [54]. Рассмотренная здесь линейно-квадратичная задача оптимального управления является простейшей и типичной задачей оптимального управления. В общем случае рассматриваются более общие уравнения, чем (8.1). Например ήτ — = f(x,u,t), (8.5) где и = u(t) — вектор управляющих воздействий. Функционал J может быть также более общего вида. Часто рассматриваются специальные классы функционалов. Например, в задаче оптимального быстродействия фиксируются начальное условие χ (to) = хои конечное условие х(Т) = х\ (Т > to). Требуется минимизировать функционал J(x(-),u(·)) = Τ — to на множестве управлений {м(·)}, удовлетворяющих условию \u(t)\ <M. 190
В настоящее время хорошо развита теория оптимального управления. Она отражена в книгах [10, 20, 22, 25, 35, 38, 52, 53, 57, 63, 79, 80, 112, 121, 128, 129, 144, 150, 154, 182, 183, 227, 243,322, 359, 360]. Выдающимися достижениями в этом направлении были создание принципа максимума Понтрягина [243] и метода динамического программирования Беллмана [35].
УКАЗАТЕЛЬ ЛИТЕРАТУРЫ 1. Абдуллаев Н.Д., Петров Ю.П. Теория и методы проектирования оптимальных регуляторов. Л.: Энергоатомиздат, 1985. 2. Авен О.И., Коган Д. А. Управление вычислительным процессом в ЭВМ. М.: Энергия, 1978. 3. Айзерман М. А. Об одной проблеме, касающейся устойчивости в большом динамических систем // Успехи математических наук. 1949. Т. 4. Вып. 4. С. 187-188. 4. Айзерман М.А. Теория автоматического регулирования. М.: Наука, 1966. 5. Айзерман М.А. Теория автоматического регулирования двигателей. Уравнения движения и устойчивость. М.: ГИТТЛ, 1952. 6. Айзерман М.А., Гантмахер Ф.Р. Абсолютная устойчивость регулируемых систем. М.: Изд-во АН СССР, 1963. 7. Акейкин Д.И., Костина Е.Н., Кузнецова Н.Н. Датчики контроля и регулирования. М.: Машиностроение, 1965. 8. Аксиально-поршневой регулируемый гидропривод / Под ред. В.Н. Прокофьева. М.: Машиностроение, 1969. 9. Александров А.Г. Синтез регуляторов многомерных систем. М.: Машиностроение, 1986. 10. Александров А.Г. Оптимальные и адаптивные системы. М.: Высшая школа, 1989. 11. Алексеев К.Б., Бебенин Г.Г. Управление космическим летательным аппаратом. М.: Машиностроение, 1969. 12. Алексенко А.Г. Основы микросхемотехники. М.: Юнимедиа- стайл, 2002. 13. Аналитические самонастраивающиеся системы автоматического управлени / Под ред. В.В. Солодовникова. М.: Машиностроение, 1965. 14. Андреев Ю.Н. Управление конечномерными линейными объектами. М.: Наука, 1976. 15. Андриевский Б.Р., Фрадков А.Л. Избранные главы теории автоматического управления с примерами на языке MATLAB. СПб.: Наука, 1999. 192
16. Андриевский Б.Р., Фрадков А. Л. Элементы математического моделирования в программных средах MATLAB и Scilab. СПб.: Наука, 2001. 17. Андронов А. А. Собрание сочинений. М.: Изд-во АН СССР, 1956. 18. Андронов Α. Α., Витт Α. Α., Хайкин С Э. Теория колебаний. М.: Физматгиз, 1959. 19. Андронов Α.Α., Вознесенский И.Н. О работах Д.К. Максвелла, И.А. Вышнеградского и А. Стодолы в области теории регулирования. М.: Изд-во АН СССР, 1949. 20. Антомонов Ю.Г. Синтез оптимальных систем. Киев: Наукова думка, 1972. 21. Антонов В.Н., Терехов В.Α., Тюкин И.Ю. Адаптивное управление в технических системах. СПб.: Изд-во С.-Петербургского университета, 2001. 22. Аоки М. Оптимизация стохастических систем. М.: Наука, 1971. 23. Асарин Е.А., Козякин B.C., Красносельский М.А., Кузнецов U.А. Анализ устойчивости рассинхронизованных дискретных систем. М.: Наука, 1992. 24. Астапов Ю.М., Медведев B.C. Статистическая теория систем автоматического регулирования. М.: Наука, 1982. 25. Атанс М., Фалб П. Оптимальное управление. М.: Машиностроение, 1968. 26. Афанасьев В.Н., Колмановский В.В., Носов В.Р. Математическая теория конструирования систем управления. М.: Высшая школа, 1989. 27. Бакаев Ю.Н. Некоторые проблемы нелинейной теории фазовых систем // Труды Военно-воздушной инженерной академии им. Н.Е. Жуковского, 1959. Т. 600. 70 с. 28. Баленко Ю. К., Бухтеев П. И., Кротов Α. Α., и др. Справочник по корабельной автоматике. М.: Воениздат, 1974. 29. Барбашин Е.А., Красовский Н.Н. Об устойчивости движения в целом // ДАН СССР, 1952. Т. 86. N 3. с.453-459. 30. Барбашин Е.А., Табуева В. А. Динамические системы с цилиндрическим фазовым пространством. М.: Наука, 1969. 31. Баркин А.И. Оценки качества нелинейных систем регулирования. М.: Наука, 1982. 32. Барковский В.В., Захаров В.Н., Шаталов А.С. Методы синтеза систем управления. М.: Машиностроение, 1970. 193
33. Беки Дж., Карплюс У. Теория и применение гибридных вычислительных систем. М.: Мир, 1970. 34. Беллмап Р. Введение в теорию матриц. М.: Наука, 1909. 35. Беллмап Р. Динамическое программирование. М.: Ил, 1960. 36. Беллмап Р. Процессы регулирования с адаптацией. М.: Наука, 1964. 37. Беллмап Р.. Гликсберг И., Гросс О. Некоторые вопросы математической теории процессов управления. М.: ИЛ, 1962. 38. Беллмап Р., Калаба Р. Динамическое программирование и современная теория управления. М.: Наука, 1969. 39. Белов М.П., Новиков В.Α., Рассудов Л.Н. Автоматизация технологических комплексов средствами компьютеризированных электроприводов. СПб.: СПбГЭТУ, 2000. 40. Белова Д. Α., Кузип Р.Е. Применение ЭВМ для анализа и синтеза автоматических систем управление. М.: Энергия, 1979. 41. Беляев Н.М., Велик Н.П., Уваров Е.И. Реактивные системы управления космичеких летательных аппаратов. М.: Машиностроение, 1979. 42. Бепдат Дж., Пирсол А. Измерение и анализ случайных процессов. М.: Мир, 1977. 43. Бесекерский В.А. Цифровые автоматические системы. М.: Наука, 1976. 44. Бесекерский В.Α., Израпцев В.В. Системы автоматического управления с микроЭВМ. М.: Наука, 1987, 45. Бесекерский В.Α., Небылов А.В. Робастные системы автоматического регулирования. М.: Наука, 1983. 46. Бесекерский В.Α., Попов Е.П. Теория систем автоматического регулирования. М.: Наука, 1966. 47. Блехмап И. И. Вибрационная механика. М.: Физматгиз, 1994. 48. Блох З.Ш. Динамика линейных систем автоматического регулирования машин. М.: Гостехиздат, 1952. 49. Бобпев М.П., Кривицкий Б.Х., Ярлыков М.С. Комплексные системы радиоавтоматики. М.: Сов. радио, 1968. 50. Бойчук Л.М. Синтез координирующих систем автоматического управления. М.: Энергоатомиздат, 1991. 51. Бокс Дж., Джепкипс Г. Анализ временных рядов. Прогноз и управление. М.: Мир, 1974. 52. Болтяпский В.Г. Математические методы оптимального управления. М.: Наука, 1969. 194
53. Болтянский В. Г. Оптимальное управление дискретными системами. М.: Наука, 1973. 54. Бор-Раменский А.Б., Воронецкий Б.Б., Святославский В.А. Быстродействующий электропривод. М.: Энергия, 1969. 55. Ботвинник М.М. Регулирование возбуждения и статическая устойчивость синхронной машины. М.-Л.: Госэнергоиздат, 1950. 56. Ботвинник М. М., Шакарян Ю. Г. Управляемая машина переменного тока. М.: Наука, 1969. 57. Брайсон Α., Χο Ю-ши. Прикладная теория оптимального управления. М.: Мир, 1972. 58. Браммер К., Зиффлинг Г. Фильтр Калмана - Бьюси: Детерминированное наблюдение и стохастическая фильтрация. М.: Наука, 1982. 59. Бромберг П.В. Устойчивость и колебания импульсных систем регулирования. М.: Оборонгиз, 1953. 60. Буков В.Н. Адаптивные прогнозирующие системы управления полетом. М.: Наука, 1987. 61. Булгаков А. А. Частотное управление асинхронными электродвигателями. М.: Наука, 1966. 62. Буль Б.К., Буль О.В., Азонов В.Α., Шоффа В.Н. Электромеханические аппараты автоматики. М.: Высшая школа, 1988. 63. Бутковский А.Г. Теория оптимального управления системами с распределенными параметрами. М.: Наука, 1965. 64. Бутковский А.Г. Методы управления системами с распределенными параметрами. М.: Наука, 1975. 65. Бутковский А.Г., Самойленко Ю.И. Управление квантомеха- ническими процессами. М.: Наука, 1984. 66. Вавилов А.А. Частотные методы расчета нелинейных систем. Л.: Энергия. 67. Вайман М.Я. Устойчивость нелинейных механических и электромеханических систем. М.: Машиностроение, 1981. 68. Вакин С.Α., Щустов Л.Н. Основы радиопротиводействия и радиотехнической разведки. М.: Сов. радио, 1968. 69. Веников В. А. Переходные электромеханические процессы в электрических системах. М.: Высшая школа, 1978. 70. Вершинин П. П., Хашпер Л. Я. Применение синхронных электроприводов в металлургии. М.: Металлургия, 1974. 71. Видаль П.Н. Нелинейные импульсные системы. М.: Энергия, 1974. 195
72. Винер Н. Кибернетика. 2-е изд. Μ.: Сов. радио, 1968. 73. Витерби Э.Д. Принципы когерентной связи. М.: Сов. радио, 1970. 74. Волгин Л.Н. Оптимальное дискретное управление динамическими системами. М.: Наука, 1986. 75. Вольдек А.И. Электрические машины. Л.: Энергия, 1974. 76. Вольтерра В. Математическая теория борьбы за существование. М.: Наука, 1976. 77. Воронов А. А. Основы теории автоматического управления: Особые линейные и нелинейные системы. М.: Энергия, 1981. 78. Воронов А.А. Устойчивость, управляемость, наблюдаемость. М.: Наука, 1979. 79. Габасов Р., Кириллова Ф. Качественная теория оптимальных процессов. М.: Наука, 1971. 80. Габасов Р., Кириллова Ф.М. Особые оптимальные управления. М.: Наука, 1973. 81. Гантмахер Ф. Р. Теория матриц. М.: Наука, 1967. 82. Гарднер М.Ф., Берне Дж.Л. Переходные процессы в линейных системах. М.: Гостехиздат, 1951. 83. Гелиг А.Х. Динамика импульсных систем и нейронных сетей. Л.: Изд-во ЛГУ, 1982. 84. Гелиг А. X., Леонов Г Α., Якубович В. А. Устойчивость нелинейных систем с неединственным состоянием равновесия. М.: Наука. 1978. 85. Гелиг А.Х., Чурилов А.Н. Колебания и устойчивость нелинейных импульсных систем. СПб: Изд-во С.-Петербургского ун-та, 1993? 86. Геращенко Е.И., Геращенко СМ. Метод разделения движений и оптимизация нелинейных систем. М.: Наука, 1975. 87. Глебов И. Α., Логинов С. И. Система возбуждения и регулирования синхронных двигателей. Л.: Энергия, 1972. 88. Глушко В. П. Развитие ракетостроения и космонавтики в СССР. 2-е изд., доп. М.: Машиностроение, 1981. 89. Гёльднер Г., Кубик С. Нелинейные системы управления: М.: Мир, 1987. 90. Горев А.А. Переходные процессы синхронной машины. Л.: Наука, 1985. 91. Горовиц О.М. Синтез систем с обратной связью. М.: Сов. радио, 1970. 196
92. Гродипз Ф. Теория регулирования и биологические системы. М.: Мир, 1966. 93. Грумондз В. Т. Некоторые задачи анализа и выбора динамических характеристик нелинейных систем. М.: Изд-во МАИ, 1992. 94. Губарь Н. А. Исследования одной кусочно-линейной динамической системы третьего порядка// Прикл. мат. и мех. 1961, Т. 25, Ν-0- 6. С. 1011-1023. 95. Гумен В.Ф., Калининская Т.В. Следящий шаговый электропривод. Л.: Энергия, 1980. 96. Гурман В. И. Принцип расширения в задачах у правления. М.: Наука, 1985. 97. Гусев В. Г Методы исследования точности цифровых автоматических систем. М.: Наука, 1973. 98. Давенроггп В., Рут В. Введение в теорию случайных сигналов и шумов. М.: ИЛ, I960. 99. Джури Э. Импульсные системы автоматического регулирования. М.: Физматгиз, 1963. 100. Демидович Б. 77. Лекции по математической теории устойчивости. М.: Наука, 1967. 101. Деревицкий Д.П., Фрадков А.Л. Прикладная теория дискретных адаптивных систем управления. М.: Наука, 1981. 102. Деруссо П., Рой Р., Клоуз Ч. Пространство состояний в теории управления. М.: Наука, 1970. 103. Джури Э. Инноры и устойчивость динамических систем. М.: Наука, 1979. 104. Завалищин СТ., Сесекин А.Н. Импульсные процессы: Модели и приложения. М.: Наука, 1991. 105. Заде Л., Дезоер Ч. Теория линейных систем. Метод пространства состояний. М.: Наука, 1970. 106. Заславский Б.Г Динамика численности управляемых популяций // АиТ. 1982. N 2. С. 71-80. 107. Заславский Б. Г Стабилизируемость и управляемость процесса воспроизводства // АиТ. 1984. N 5. С. 71-78. 108. Заславский Б.Г, Полуэктов Р.А. Управление экологическими системами. М.: Наука, 1988. 109. Зиминн Ε. Η., Чувашов И. И. Автоматизированный электропривод и электрооборудование промышленных механизмов. Ч. П. М.: Стройиздат, 1977. 197
110. Зубов В. И. Математические методы исследования систем автоматического регулирования. Л.: Машиностроение, 1974. 111. Зубов В.И. Лекции по теории управления. М.: Наука, 1975. 112. Зубов В.И. Теория оптимального управления. М.: Судостроение, 1966. 113. Емельянов СВ. Системы автоматического управления с переменной структурой. М.: Наука, 1970. 114. Емельянов И.Я., Ефанов А.И., Константинов Л.В. Научно- технические основы управления ядерными реакторами. М.: Энерго- атомиздат, 1981. 115. Иванов - Смоленский А. В. Электрические машины. М.: Энергия, 1980. 116. Иванов В.Α., Фалбин Н.В. Теория оптимальных систем автоматического управления. М.: Наука, 1981. 117. Иващенко Н.Н. Автоматическое регулирование. Теория и элементы систем. 4-ое изд. М.: Машиностроение, 1978. 118. Ивей К.А. Системы автоматического регулирования на несущей переменного тока. М.: Машиностроение, 1968. 119. Изерман Р. Цифровые системы управления. М.: Мир, 1984. 120. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974. 121. Казакевич В.В., Родов А.Б. Системы автоматической оптимизации. М.: Энергия, 1977. 122. Казаков И,Е. Статистические методы проектирования систем управления. М.: Машиностроение, 1969. 123. Казаков И.Е., Доступов Б.Г. Статистическая динамика нелинейных автоматических систем. М.: Физматгиз, 1962. 124. Калман Р. Фалб П., Арбиб М. Очерки по математической теории систем. М.: Мир, 1971. 125. Капланов М.Р., Левин В.А. Автоматическая подстройка частоты. М.: Госэнергоиздат, 1962. 126. Каргу Л.И. Системы угловой стабилизации космических аппаратов. М.: Машиностроение, 1973. 127. Кацман М.М., Юферов Ф.М. Электрические машины автоматических систем. М.: Высшая школа, 1979. 128. Квакернаак X., Сиван Р. Линейные оптимальные системы управления. М.: Мир, 1977. 129. Клюев А.С, Колесников А.А. Оптимизация автоматических систем управления по быстродействию. М.: Энергоиздат, 1982. 198
130. Ключев В. И. Ограничение динамических нагрузок электропривода. М.: Энергия, 1971. 131. Коган Б. Я. Электронные моделирующие усторойства и их применение для исследования систем автоматического регулирования. М.: Физматгиз, 1963. 132. Коган Б.П., Сташин В.В. Микропроцессоры в цифровых системах. М.: Энергия, 1979. 133. Козлов Ю.М., Юсупов P.M. Беспоисковые самонастраивающиеся системы. М.: Наука, 1969. 134. Колмановский В.Б., Носов В.Р. Устойчивость и периодические режимы регулируемых систем с последействием. М.: Наука, 1981. 135. Копылов И. П. Электромеханические преобразователи энергии. М.: Энергия, 1973. 136. Копылов И.П. Математическое моделирование электрических машин. М.: Высшая школа, 2001. 137. Костенко М.П., Пиотровский Л.М. Электрические машины. М.: Энергия, 1964. 138. Костюк В. И. Беспоисковые градиентные самонастраивающиеся системы. Киев: Техника, 1969. 139. Кацман М.М., Юферов Ф.М. Электрические машины автоматических систем. М.: Высшая школа, 1979. 140. Косякин Α.Α., Шамриков Б.М. Колебания в цифровых автоматических системах. М.: Наука, 1983. 141. Красовский А.А. Аналитическое конструирование контуров управления летательными аппаратами. М.: Машиностроение, 1963. 142. Красовский А.А. Динамика непрерывных самонастраивающихся систем. М.: Физматгиз, 1963. 143. Красовский А.А. Статистическая теория переходных процессов в системах управления. М.: Наука, 1968. 144. Красовский А.А. Системы автоматического управления полетом и их аналитическое конструирование. М.: Наука, 1973. 145. Красовский А.А. Избранные труды: Самые ранние - самые новые. М. Наука, 2003. 146. Красовский Α.Α., Белоглазое И.Н., Чигин Г.И. Теория кореля- ционно-экстремальных навигационных систем. М.: Наука, 1979. 147. Красовский Α.Α., Буков В.Н., Шендрик B.C. Универсальные алгоритмы оптимального управления непрерывными процессами. М.: Наука, 1977. 199
148. Красовский А. А, Поспелов Г.С. Основы автоматики и технической кибернетики. М.-Л.: Госэнергоиздат, 1962. 149. Красовский Н.Н. Игровые задачи о встече движений. М.: Наука, 1970. 150. Красовский Н.Н. Теория управления движением. М.: Наука, 1978. 151. Кривицкий Б.Х. Автоматические системы радиотехнических устройств. М.: Госэнергоиздат, 1962. 152. Кузин Л. Т. Расчет и проектирование дискретных систем управления. М.: Машгиз, 1962. 153. Кузовков Н. Т. Модальное управление и наблюдающие устройства. М.: Машиностроение, 1976. 154. Куликовский Р. Оптимальные и адаптивные процессы в системах автоматического регулирования. М.: Наука, 1967. 155. Кульба В.В., Микрип Е.А. , Павлов Б.В. Проктирование информационно-управляющих систем долговременных орбитальных станций. М.: Наука, 2002. 156. Куо Б. Теория и проектирование цифровых систем управления. М.: Машиностроение, 1986. 157. Кунцевич В.М. Системы экстремального управления. Киев: Техника, 1961. 158. Кунцевич В.М., Чеховой Ю.Н. Нелинейные системы управления с частотно-широтной импульсной модуляцией. Киев: Техника, 1970. 159. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. 160. Кухтенко В. И. Динамика самонастраивающихся систем со стабилизацией частотных характеристик. М.: Машиностроение, 1970. 161. Кучумов А. И. Электроника и схемотехника. М.: Гелиос. АРВ, 2002. 162. Ла-Салль Ж., Лефшец С. Исследование устойчивости прямым методом Ляпунова. М.: Мир, 1964. 163. Ленк, Джон Д. Справочник по проектированию электронных схем. Киев: Техника, 1979. 164. Леонов Г.А. Математические проблемы теории управления. Мотивация к анализу. СПб.: Изд-во С.-Петерб.ун-та, 1999. 165. Леонов Г. А. Глобальная устойчивость двумерных систем управления угловой ориентацией // Прикладная математика и механика. 2000. Т. 64. N 5. С. 890-896. 200
166. Леонов Г.А. Странные аттракторы и классическая теория устойчивости движения. СПб.: Изд-во С.Петербургского ун-та, 2004. 167. Леонов Г.Α., Селеджи СМ. Системы фазовой синхронизации в аналоговой и цифровой схемотехнике. С.-Петербург: "Невский Диалект", 2002. 168. Леонов Г.Α., Смирнова В.Б. Математические проблемы теории фазовой синхронизации. С.-Петербург: Наука, 2000. 169. Леонов Г.Α., Шумафов М.М. Проблемы стабилизации линейных управляемых систем. СПб.: Издательство С.-Петербургского университета, 2002. 170. Лернер А.Я. Принципы построения быстродействующих следящих систем и регуляторов. М.-Л.: Госэнергоиздат, 1961. 171. Летов A.M. Устойчивость нелинейных регулируемых систем. М.: Физматгиз, 1962. 172. Лефшец С. Устойчивость нелинейных систем автоматического управления. М.: Мир, 1967. 173. Ли Т.Г., Адаме Г.Э., Гейнз У.М. Управление процессами с помощью вычислительных машин. Моделирование и оптимизация. М.: Советское радио, 1972. 174. Ли Э.Б., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972. 175. Либерзон Л.М., Родов А.Б. Системы экстремального регулирования. М.: Энергия, 1965. 176. Линдсей В. С. Системы синхронизации в связи и управлении. М.: Сов. радио, 1978. 177. Лурье А.И. Некоторые нелинейные задачи теории автоматического регулирования. М.: Гостехиздат, 1951. 178. Лэнинг Дэю.Х., Бэттин Р.Г. Случайные процессы в задачах автоматического управления. М.: ИЛ, 1958. 179. Лютер Р.А. Расчет синхронных машин. Л.: Энергия, 1979. 180. Макаров И.М., Менский Б.М. Линейные автоматические системы (Элементы теории, методы расчета и справочный материал). М.: Машиностроение, 1982. 181. Максимов М.В., Горгонов Г.И. Радиоуправление ракетами. М.: Сов. радио, 1964. 182. Матвеев А. С, Якубович В.А. Абстрактная теория оптимального управления. СПБ.: Изд-во С.-Петербургского ун-та, 1994. 183. Матвеев А.С, Якубович В.А. Оптимальные системы управления. Обыкновенные дифференциальные уравнения. СПб: Изд-во 201
С.-Петербургского университета, 2003. 184. Матросов В.М., Анапольский Л.Ю., Васильев С.Н. Метод сравнения в математической теории систем. Новосибирск: Наука. СО, 1980. 185. Машинное проектирование систем автоматического управления/Под ред. В.А. Букатова. Л.: Судостроение, 1978. 186. Медич Дж. Статистичекие оптимальные линейные оценки и управление. М.: Энергия, 1973. 187. Мееров М.В. Синтез структур систем автоматического регулирования высокой точности. М.: Физматгиз, 1959. 188. С. Д., Мейер А.А. Современная теория автоматического управления и ее применение. М.: Машиностроение, 1972. 189. Меркин Д. Р. Введение в теорию устойчивости. М.: Наука, 1976. 190. Месарович М.Д., Мако Д.. Такахара У. Теория многоуровневых иерархических систем. М.: Мир, 1973. 191. Методы исследования нелинейных систем автоматического управления / Под ред. Р.А. Нелепина. М.: Наука, 1975. 192. Методы синтеза нелинейных систем автоматического управления / Под ред. СМ. Федорова. М.: Машиностроение, 1970. 193. Методы чувствительности в автоматическом управлении/Под ред. Е.Н. Розенвассера и P.M. Юсупова. М.: Энергия, 1971. 194. Микродвигатели для систем автоматики: справочник / Под ред. Э.А. Лодочникова, Ф.М. Юферова. М.: Энергия, 1969. 195. Микро-ЭВМ J Под ред. А. Дирксена. М.: Энергоиздат, 1982. 196. Милсум Дж. Анализ биологических систем управления. М.: Мир, 1968. 197. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. СПб.: Наука, 2000. 198. Михеев Ю. Е., Сосонкин В. Н. Системы автоматического управления станками. М.: Машиностроение, 1978. 199. Михелькевич В. Н. Автоматическое управление шлифованием. М.: Машиностроение, 1975. 200. Моисеев Н.Н. Численные методы в теории оптимальных систем. М.: Наука, 1971. 201. Моисеев Н.Н. Элементы теории оптимальных систем. М.: Наука, 1975. 202
202. Муттер В. Μ. Аналого-цифровые автоматические системы: Проектирование и расчет. Л.: Машиностроение, 1981. 203. Мысовских И. П. Лекции по методам вычислений. СПб.: Изд- во С.-Петербургского ун-та, 1998. 204. Наумов Б.Н. Теория нелинейных автоматических систем. Частотные методы. М.: Наука, 1972. 205. Николаев Ю.А. и др. Динамика цифровых следящих систем. ΑΙ.: Энергия, 1970. 206. Нелинейная теория управления и ее приложения / Под ред. В.М.Матросова. М.: Физматгиз, 2002. 207. Нелинейные корректирующие устройства в системах автоматического управления / Под ред. Ю.И. Топчеева. М.: Машиностроение, 1971. 208. Нелинейные нестационарные системы / Под ред. Ю.И. Топчеева. М.: Машиностроение, 1986. 209. Овсянников Д.А. Математические методы управления пучками. Л.: Изд-во ЛГУ, 1980. 210. Обрезков В,Д„ Разевиг В.Д. Методы анализа срыва слежения. М.: Сов. радио, 1972. 211. Ольденбург Р., Сармюрус Г. Динамика автоматичиского регулирования. М.-Л.: Госзнергоиздат, 1949. 212. Основы автоматического регулирования. Т. 1. Теория / Под ред. В.В. Солодовникова. М.: Машгиз, 1954. 213. Основы автоматического регулирования/Под ред. В.В. Солодовникова. М.: Машгиз, 1954. 214. Основы автоматического управления / Под ред. B.C. Пугачева. М.: Наука, 1968. 215. Основы автоматизированного электропривода / М.Г. Чили- кин, М. М. Соколов, В. М. Терехов, А. В. Шинянский. М.: Энергия, 1974. 216. Основы проектирования следящих систем / Под ред. Н.А. Лакоты. М.: Машиностроение, 1978. 217. Основы теории оптимального управления / Под ред. В.Ф. Кротова. М.: Высшая школа. 1990. 218. Основы управления технологическими процессами / Под ред. Н.С. Райбмана. М.: Наука, 1978. 219. Оптимальное управление в линейных системах / А.А. Милютин, А.Е. Илютович, Н.П. Осмоловский, СВ. Чуканов. М.: Наука, 1993. 203
220. Острем К. Введение в стохастическую теорию управления. М.: Мир, 1972. 221. Острем К., Виттенмарк Б. Системы управления с ЭВМ. М.: Мир, 1987. 222. Павлов Б.В., Соловьев И. Г. Системы прямого адаптивного управления. М.: Наука, 1989. 223. Панасюк А.И., Панасюк В.И. Асимптотическая оптимизация нелинейных систем управления. Минск: Изд-во БГУ, 1977. 224. Пелегреи М. Статистический расчет следящих систем. М.: ИЛ, 1957. 225. Первачев СВ., Валуев Α.Α., Чиликин В.М. Статистическая динамика радиотехнических следящих систем. М.: Сов. радио, 1973. 226. Первозванский А.А. Случайные процессы в нелинейных автоматических системах. М.: Физматгиз, 1962. 227. Первозванский Л. Л. Курс теории автоматического управления. М.: Наука, 1986. 228. Перельмутер В.М., Сидоренко В.А. Системы управления ти- ристорными электроприводами постоянного тока. М.: Энергоатом- издат, 1988. 229. Петелин Д. 77. Автоматическое управление синхронными электроприводами. М.: Энергия, 1968. 230. Петров Б.Н., Рутковский В.Ю., Земляков С Д. Адаптивное координатно-параметрическое управление нестационарными объектами. М.: Наука, 1980. 231. Петров Б.Н., Рутковский В.Ю., Крутова И.Н., Земляков СД. Принципы построения и проектирования самонастраивающихся систем управления. М.: Машиностроение, 1972. 232. Петров В.В., Гордеев А.А. Нелинейные сервомеханизмы. М.: Машиностроение, 1979. 233. Петров Ю.П. Оптимальное управление электроприводом. М.- Л.: Госэнергоиздат, 1961. 234. Петров Ю.П. Вариационные методы теории оптимального управления. Л.: Энергия, 1977. 235. Петров Ю.П. Оптимальное управление электроприводом с учетом ограничений на нагрев. М.-Л.: Энергия, 1971. 236. Петросян Л.Α., Захаров В.В. Математические модели в экологии. СПб.: Изд-во С.-Петербургского ун-та, 1997. 237. Пестряков В.Б. Фазовые радиотехнические системы. М.: Сов. радио, 1968. 204
238. Питерсон И. Л. Статистический анализ и оптимизация систем автоматическогог управления. М.: Сов. радио, 1964. 239. Плисе В. А. Некоторые проблемы теории устойчивости движения в целом. Л.: Изд-во ЛГУ, 1958. 240. Плисе В. А. Нелокальные проблемы теории колебаний. М.: Наука, 1964. 241. Поляк Б. Т. Введение в оптимизацию. М.: Наука, 1983. 242. Понтрягин Л. С. Обыкновенные дифференциальные уравнения. М.: Наука, 1965. 243. Понтрягин Л.С, Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е. Ф. Математическая теория оптимальных систем. М.: Наука, 1969. 244. Попов В.М. Гиперустойчивость автоматических систем. М.: Наука, 1970. 245. Попов Е.П. Автоматическое регулирование и управление. М.: Наука, 1966. 246. Попов Е.П. Теория линейных систем автоматического регулирования и управления. М.: Наука, 1978. 247. Попов Е.П. Теория нелинейных систем автоматического регулирования и управления. М.: Наука, 1979. 248. Попов Е.П. Динамика систем автоматического регулирования. М.: Гостехиздат, 1954. 249. Попов Е.П., Пальтов И.П. Приближенные методы исследования нелинейных автоматических систем. М.: Физматгиз, I960. 250. Постников М. М. Устойчивые многочлены. М.: Наука, 1981. 251. Пугачев B.C. Теория случайных функций и ее применение к задачам автоматического управления. М.: Физматгиз, I960. 252. Пугачев B.C. Основы автоматического управления. М.: Наука, 1974. 253. Прангишвили И.В., Валенкин С.Я., Медведев И.Л. Параллельные вычислительные системы с общим управлением. М. Энер- гоатомиздат, 1983. 254. Преобразование частоты на тиристорах для управления высокоскоростными двигателями / А. С. Сандлер, Г. К. Аввакумова, А. В. Кудрявцев, А. А. Никольский. М.: Энергия, 1977. 255. Приспосабливающиеся автоматические системы / Под ред. Э. Мышкина и Л. Брауна. М.: ИЛ, 1963. 256. Пупков К.А. Статистический расчет нелинейных систем автоматического управления. М.: Машиностроение, 1965. 205
257. Пупков К.Α., Капалип В.И., Ющенко А. С. Функциональные ряды и теория нелинейных систем. М.: Наука, 1976. 258. Пупков Ю.С, Киселев О.Н., Петров Н.П., Шмульян Б.А. Идентификация и оптимизация нелинейных стохастических систем. М.: Энергия, 1976. 259. Радиоуправление реактивными снарядами и космическими аппаратами / Под ред. Л.С. Гуткина. М.: Сов. радио, 1968. 260. Райбман Н.С., Чадеев В.М. Построение моделей процесса производства. М.: Энергия, 1975. 261. Растригин Л.А. Системы экстремального управления. М.: Наука, 1974. 262. Ратмиров В. А. Основы программного управления станками. М.: Машиностроение, 1978. 263. Рауше.нбах Б. В., Токарь Ε. Η. Управление ориентацией космических аппаратов. М.: Наука, 1974. 264. Резвап В. Абсолютная устойчивость автоматических систем с запаздыванием. М.: Наука, 1983. 265. Розенвассер Е.Н. Периодические нестационарные системы управления. М.: Наука, 1973. 266. Розенвассер Е.Н., Юсупов P.M. Чувствительность систем управления. М.: Наука, 1981. 267. Розенфельд А. С, Яхинсон Б.И. Переходные процессы и обобщенные функции. М.: Наука, 1966. 268. Ройтенберг Я. Н. Автоматическое управление. М.: Наука, 1978. 269. Самонастраивающиеся системы: Справочник/Под ред. П.И. Чинаева. Киев: Наукова думка, 1969. 270. Сандлер А. С. Электропривод и автоматизация металлорежущих станков. М.: Высшая школа, 1972. 271. Сандлер А. С, Гусяцкий Ю. М. Тиристорные инверторы с широтно-импульсной модуляцией. М.: Энергия, 1968. 272. Сандлер А. С, Сарбатов Р. С. Автоматическое частотное управление асинхронными двигателями. М.: Энергия, 1974. 273. Сандлер А. С, Тарасенко Л. М. Динамика каскадных асинхронных электроприводов. М.: Энергия, 1977. 274. Санковский Е.А. Вопросы теории автоматического управления. М.: Высшая школа, 1971. 275. Сейдж Э.П., Мелса Дж. Л. Идентификация систем управления. М.: Наука, 1974. 206
276. Сипайлов Г.Α., Лоос А. В. Математическое моделирование электрических машин. М.: Высшая школа, 1980. 277. Сиротин А. А. Автоматическое управление электроприводами. М.: Энергия, 1969. 278. Системы автоматичекого управления объектами с переменными параметрами: Инженерные методы анализа и синтеза / Б.Н. Петров, Н.И. Соколов, А.В. Липатов и др. М.: Машиностроение, 1986. 279. Системы фазовой синхронизации / Под ред. В.В. Шахгиль- дяна и Л.Н. Белюстиной. М.: Радио и связь, 1982. 280. Системы фазовой автоподстройки частоты с элементами дискретизации / Под ред. В.В. Шахгильдяна. М.: Связь, 1979. 281. Склярич А.Н. Операторные методы в статистической динамике автоматических систем. М.: Наука, 1965. 282. Следящие приводы / Под ред. Б. К. Чемоданова. М.: Энергия, 1976, кн. I, кн. П. 283. Смирнов Е.Я. Стабилизация программных движений. СПб.: Изд-во С.-Петербургского университета, 1997. 284. Современная прикладная теория управления: Оптимизационный полход в теории управления. 41./ Под ред. А. А. Колеснникова. Таганрог: Изд-во ТРТУ, 2000. 285. Современная теория систем управления / Под ред. К.Т. Леон- деса. М.: Наука, 1970. 286. Современные методы проектирования систем автоматического управления / Под ред. Б.Н. Петрова, В.В. Солодовникова, Ю.И. Топчеева. М.: Машиностроение, 1966. 287. Соколов Μ. М. Автоматизированный электропривод общепромышленных механизмов. М.: Энергия, 1976. 288. Соколов Н.И. Аналитический метод синтеза линеаризованных систем автоматического регулирования. М.: Машиностроение, 1966. 289. Солодов А.В., Петров Ф.С Линейные автоматические системы с переменными параметрами. М.: Наука, 1971. 290. Соколов Н.В., Шароватов В.Г. Синтез нелинейных корректирующих устройств. Л.: Энергоатомиздат, 1985. 291. Солодов А.В. Линейные системы автоматического управления с переменными параметрами. М.: Физматгиз, 1969. 292. Солодовников В,В. Статистическая динамика линейных систем автоматического управления. М.: Физматгиз, 1958. 207
293. Солодовников В.В., Шрамко Л.С Расчет и проектирование аналитических самонастраивающихся систем с эталонными моделями. М.: Машиностроение, 1972. 294. Солонина Α., УлаховичД., Яковлев Л. Цифровые процессоры обработки сигналов фирмы Motorola. С.-Петербург: BHV, 2000. 295. Солонина Α., Улахович Д., Яковлев Л. Алгоритмы и процессоры цифровой обработки сигналов. С.-Петербург: BHV, 2001. 296. Справочная книга по технике автоматического регулирования / Под ред. Дж. Дж. Траксела. М.-Л.: Госэнергоиздат, 1962. 297. Справочник по проектированию автоматизированного электропривода и систем управления технологическими процессами / В.Д. Астрахан, Г.З. Богорад, А.А. Брострем и др. М.: Энергоиздат, 1982. 298. Справочник по промышленной робототехнике. В 2-х кн. / Под ред. Ш. Нофа. М.: Машиностроение, 1989. 299. Справочник по радиоэлектронике. Т. 3. / Под ред. А.А. Куликовского. М.: Энергия, 1970. 300. Справочник по теории автоматического управления/ Под. ред. А. А. Красовского. М.: Наука, 1987. 301. Справочное пособие по теории систем автоматического регулирования и управления. / Под ред. Е.А. Санковского. Минск: Вы- шэйшая школа, 1973. 302. Срагович В.Г. Теория адаптивных систем. М.: Наука. 1976. 303. Срагович В.Г. Адаптивное управление. М.: Наука, 1981. 304. Стиранные аттракторы: Сб. статей/ Под ред. Я. Г. Синая, Л. П. Шильникова// Математика. Новое в зарубежной науке. Т. 22. М.: Мир, 1981. 305. Суэмацу Ё. Микрокомпьютерные системы управления. Первое знакомство. М.: Издательский дом "Додэка-XXI", 2002. 306. Теория автоматического управления / Под ред. А. В. Нетушила. М.: Высшая школа, 1968, ч. I; 1972, ч. II. 307. Теория автоматического регулирования / Под ред. В.В. Со- лодовникова. М.: Машиностроение, кн. I, 1967; кн. 2, 1967; кн. 3, ч. I, 1968; кн. 3, ч. II, 1969. 308. Теория систем с переменной структорой / Под ред. СВ. Емельянова. М.: Наука, 1970. 309. Тимофеев А.В. Построение адаптивных систем управления программным движением. Л.: Энергия, 1980. 310. Тимофеев А.В. Управление роботами. Л.: Изд-во ЛГУ, 1986. 208
311. Тиристорный электропривод постоянного тока / Я. Ю. Со- лодухо, Р. Э. Белявский и др. М.: Энергия, 1971. 312. Тиристорные электроприводы с реверсами / Я. Ю. Солодухо и др. М.: Энергия, 1977. 313. Томович Р., Вуковрагпович М. Общая теория чувствительности. М.: Сов. радио, 1972. 314. Ту Ю.Т Цифровые и импульсные системы автоматического управления. М.: Машиностроение, 1964. 315. Ту Ю.Т Современная теория управления. М.: Машиностроение, 1971. 316. Тун А. Я. Системы контроля скорости электропривода. М.: Энергоатомиздат, 1984. 317. Угрюмое Е.П. Цифровая схемотехника. С.-Петербург: BHV, 2000. 318. Уоиэм М. Линейные многомерные системы управления: Геометрический подход. М.: Наука, 1980. 319. Устойчивость адаптивных систем / Андерсон Б., Битмид Р., Джонсон К. и др. М.: Мир, 1989. 320. Утру Ф., Иордан Г. Системы согласованного вращения электродвигателей. М.: Энергия, 1971. 321. Уткин В. И. Скользящие режимы и их применение в системах с переменной структурой. М.: Наука, 1974. 322. Уткин В. И. Оптимизация и управление в системах со скользящими режимами. М.: Наука, 1981. 323. Уткин В.И., Орлов Ю.В. Теория бесконечномерных систем управления на скользящих режимах. М.: Наука, 1990. 324. Файнштейн В.Г., Файнштейн Э.Г. Микропроцессорные системы управления тиристорными электроприводами. М.: Энергоатомиздат, 1986. 325. Федосов Е.А.Ю Инсаров В.В., Селивохин О.С. Системы управления конечным положением в условиях противодействия среды. М.: Наука, 1989. 326. Фелъдбаум А.А. Основы теории автоматических систем. М.: Наука, 1966. 327. Фелъдбаум Α.Α., Бутковский А.Г. Методы теории автоматического управления. М.: Наука, 1971. 328. Филиппов А. Ф. Дифференциальные уравнения с разрывной правой частью. М.: Наука, 1985. 209
329. Филиппов Б. Α., Ильинский Η. Φ. Основы электропривода. Μ.: Изд. МЭИ, 1977. 330. Фихтенголъц Г. М. Основы математического анализа: В 2-х т. М.: Наука, 1964. Т. 2. 331. Фихтенголъц Г. М. Курс дифференциального и интегрального исчисления. Т. 2. М.: Физматлит, 2001. 332. Фомин В.Н. Методы управления линейными дискретными обьектами. Л.: Изд-во Ленингр. ун-та, 1985. 333. Фомин В.Н. Рекуррентное оценивание и адаптивная фильтрация. М.: Наука, 1984. 334. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М.: Наука, 1981. 335. Формальский А. М. Управляемость и устойчивость систем с ограниченными ресурсами. М.: Наука, 1974. 336. Фрадков А.Л. Кибернетическая физика: принципы и примеры. СПб.: Наука, 2003. 337. Фрадков А.Л. Адаптивное управление в сложных системах. М.: Наука, 1990. 338. Фрэзер Дж., Ламберт Дж. Аналоговое моделирование систем радиоуправления и систем космической связи. В кн.: Теория аналоговых и комбинированных вычислительных машин. М.: Наука, 1969. 339. Фурасов В.Д. Устойчивость движения, оценки и стабилизация. М.: Наука, 1977. 340. Халанай Α., Векслер Д. Качественная теория импульсных систем. М.: Мир, 1971. 341. Хендель А. Основные законы физики. М.: Физматгиз, 1959. 342. Холодниок М., Клич Α., Кубичек М., Марек М. Методы анализа нелинейных математических моделей. М.: Мир, 1991. 343. Цейтлин Я.М. Проектирование оптимальных линейных систем. М.: Машиностроение, 1973. 344. Цыпкин Я.З. Теория линейных импульсных систем. М.: Физматгиз, 1963. 345. Цыпкин Я. 3. Теория импульсных систем. М.: Физматгиз, 1958. 346. Цыпкин Я.З. Адаптация и обучение в автоматических системах. М.: Наука, 1968. 347. Цыпкин Я.З. Основы теории обучающихся систем. М.: Наука. 1970. 210
348. Цыпкин Я.З. Основы теории автоматических систем. М.: Наука, 1977. 349. Цыпкин Я.З. Релейные автоматичекие системы. М.: Наука, 1974. 350. Цыпкин Я.З. Основы информационной теории систем. М.: Наука, 1984. 351. Цыпкин Я.З., Попков Ю.С. Теория нелинейных импульсных систем. М.: Наука, 1973. 352. Чаки Ф. Современная теория управления. М.: Мир, 1975. 353. Чанг Ш.Л.С. Синтез оптимальных систем автоматического управлени. М.: Машиностроение, 1964. 354. Чезари Л. Асимптотическое поведение и устойчивость решений обыкновенных дифференциальных уравнений. М.: Мир, 1964. 355. Челпанов И.В. Оптимальная обработка сигналов в навигационных системах. М.: Наука, 1967. 356. Чернецкий В.И., Дидук Г.Α., Потапенко А.А. Математические методы и алгоритмы исследования автоматических систем. М.: Энергия, 1970. 357. Черноусько Ф.Л. Оценивание фазового состояния динамических систем. Метод эллипсоидов. М.: Наука, 1988. 358. Черноусько Ф. Л., Акуленко Л. Д., Соколов Б.Н. Управление колебаниями. М.: Наука, 1980. 359. Черноуско Ф.Л., Баничук П.В. Вариационные задачи механики и управления. М.: Наука, 1973. 360. Черноусько Ф.Л., Колмановский В.Б. Вычислительные и приближенные методы оптимального управления // Итоги науки и техники. Математический анализ. Т. 14. М.: ВИНИТИ, 1977. С. 101-166. 361. Чиликин М. Г. Общий курс электропривода. 5-е изд. М.: Энергия, 1971. 362. Чиликин М. Г., Ключев В. И., Сандлер А. С. Теория автоматизированного электропривода. М.: Энергия, 1979. 363. Чиликин М. Г., Сандлер А.С. Общий курс электропривода. 6-е изд. М.: Энергоатомиздат, 1981. 364. Чистов В.П., Бондарко В.И., Святославский В.А. Оптимальное управление электроприводами. М.: Энергия, 1968. 365. Шаталов В.Α., Селетков С.Н., Скребушевский Б.С. Применение ЭВМ в системе управления космическим аппаратом. М.: Машиностроение, 1974. 211
366. Шахгильдян В. В., Ляховкин А. А. Системы фазовой автоподстройки частоты. М.: Связь, 1972. 367. Шилейко А.В. Цифровые модели. М.: Энергия, 1964. 368. Шильяк Д.Д. Децентрализованное управление сложными системами. М.: Мир, 1994. 369. Шрейнер Р.Т. Математическое моделирование электроприводов переменного тока с полупроводниковыми преобразователями частоты. Екатеренбург: УрО РАН, 2000. 370. Шубенко В. Α., Браславский И. Я. Тиристорный асинхронный электропривод с фазовым управлением. М.: Энергия, 1972. 371. Шуйский В.П. Расчет электрических машин. М.: Энергия, 1968. 372. Шустер Г. Детерминированный хаос. М.: Мир, 1988. 373. Щегляев А. В., Смильницкий С. Г. Регулирование паровых турбин. М.;Л.: Госэнергоиздат, 1962. 374. Эйкхофф П. Основы идентификации систем управления. М.: Мир, 1975. 375. Электротехнический справочник. М.-Л.: Энергоатомиздат, 1952. 376. Электротехнический справочник, т. 2. М.: Энергоатомиздат, 1986. 377. Энциклопедия кибернетики. Т.2 / Под ред. В.М. Глушкова. Киев: Укр. сов. энциклопедия, 1975. 378. Ядыкин И.Б., Шумский В.М., Овсепян Ф.А. Адаптивное управление непрерывными технологическими процессами. М.: Энергоатомиздат, 1985. 379. Янг А. Лекции по вариационному исчислению и теории оптимального управления. М.: Мир, 1974. 380. Янушевский Р. Т. Теория линейных оптимальных многосвязных систем управления. М.: Наука, 1973. 381. Янко-Триницкий А. А. Новый метод анализа работы синхронных двигателей при резкопеременных нагрузках. М.;Л.: Госэнергоиздат, 1958. 382. Ackermann J. Abtast-Regelung. Berlin. Springer, 1972. 383. Anderson B.D.O., Moore J.B. Linear optimal control. Englewood- Cliffs, Prentice-Hall, 1971. 384. AnkeK., Kaltenecker H., Oetker R. Prozessrechner, Wirkungsweise und Einsatz, Miinchen, R, Oldenbourg, 1971. 212
о 385. Astrom К. J. Automatik control — the hidden technology// Adv. Control Highlights of ECC'99. Berlin: Springer, 1999. 386. Baccotti A. Local Stabilization of Nonlinear Control System. World Scientific. 1992. 387. Bhatia N.P., Szego G.P. Dynamical Systems: Stability Theory and Applications. Berlin. Springer-Verlag, 1967 (Lecture Notes in Math.; Vol. 35). 388. Borner H. Phasenkopplungssysteme in der Nachrichten. Mess- und Regelungstechnik. Berlin: Verlag Technik, 1976. 389. Campbell D.P. Process dynamics. New York, J. Willey, 1958. 390. Cone A. Prozessrechensysteme der Verfahren Industrie. Munchen, Carl Hanser, 1969. 391. D'Azzo J. J., Houpis С Η. Linear control systems. Analysis and design. N.Y.: Mc Graw-Hill, 1995. 392. Uriels M. Linear control systems engineering. N.Y.: Mc Graw- Hill Ins, 1996. 393. DSP 56000. Digal Signal Processor. Family Manual, 1992. Motorola Inc. (DSP 56 К FAMUM/AD). 394. Egardt B. Stability of adaptive controllers. Lecture Notes in Control and Information Sciences. Berlin. Springer, 1979. 395. Eveleigh V. W. Adaptive control and optimization technique. New York. NcGraw Hill, 1967. 396. Follinger 0. Lineare Abtastsysteme. Munchen, R. Oldenbourg, 1974. 397. Fradkov A.L., Pogromsky A. Yu. Introduction to control of oscillations and chaos. Singapore: World Scientific, 1998. 398. Frank P.M. Empfindlichkeitsanalyse dynamischer Systeme. Munchen, R. Oldenbourg, 1976. 399. Freeman H. Discrete-time systems. New York, J. Willey, 1965. 400. Gardner F.M. Phase-Lock Techniques. New York: John Wiley, 1966. 401. Gelig A.Kh., Churilov A.N. Stability and Oscillation of Nonlinear Pulse - Modulated Systems. London. Bickhousen, 1998. 402. Gibson J. Nonlinear automatic control. New York. NcGraw Hill, 1962. 403. Gilles E.D. Systeme mit verteilten Parametern. Munchen, R. Oldenbourg, 1973. 404. Golten J., Verwer A. Control system. Design and simulation. N.Y.: Mc Graw-Hill Ins, 1991. 213
405. Gould L.A. Chemical process and control / Massachusets. Addison- Wesley, 1969. 406. Isermann R. Digitale Regelsysteme. Berlin. Springer, 1977. 407. Isermann R. Processidentifikation. Berlin. Springer, 1974. 408. Isidori A. Nonlinear control systems. Berlin: Springer, 1995. 409. Jazwinski A.H. Stochastic processes and filtering theory. New York. Academic Press, 1970. 410. Jury E.I. Sampled-data control systems. New York, John Wiley, 1958.* 411. Jury E.I. Theory and application of the ^-transform method. New York, J. Willey, 1964. 412. Horowitz I.M. Synthesis of feedback systems. New York. Academic Press, 1963. 413. Harrison T.J., Ed., Handbook of industrial control computers. New York. Wiley-Interscience, 1972. 414. Kapitaniak T. Controlling Chaos. N.Y.: Academic Press, 1996. 415. Khalil H.K. Nonlinear Systems. Prentice-Hall, 1966. 416. Kucera V. Discrete linear control. Praque. Academia, 1979. 417. Rung S.Y. VLSI Array Processors. Prentice Hall N.Y., 1988. 418. Kuo B.C. Discrete-data control systems. Englewood-Cliffs, N. J., Prentice Hall, 1970. 419. Kushner H.J. Introduction to stochastic control. New York, Holt, Rinehart and Winston, 1971. 420. Lapsley P., Bier J., Shoharn Α., Lee E.A. DSP Processor Fundamentals Archecture and Features. New York: IEE Press, 1997. 421. Leonhard W. Dickrete Regelsysteme. Mannheim. Bibliographis- ches Institute, 1972. 422. Leonov G.A. Mathematical Problems of Control Theory. An Introduction. Singapore: World Scientific, 2001. 423. Leonov G.A., Burkin I.M., Shepelyavyi A.I. Frequency methods in oscillation theory. Dordrecht: Kluwer Academic Publishers, 1996. 424. Leonov G.A., Ponomarenko D. V., Smimova V.B. Frequency- domain methods for nonlinear analysis. Theory and applications. Singa- pure: World Scientific, 1996. 425. Leonov G.A., Reitmann V., Smirnova V.B. Non-Local Methods for Pendulum-Like Feedback Systems. Stuttgart-Leipzig: Teubner Ver- lag, 1992. 426. LindorffD.P. Theory of sampled-data control systems. New York, J. Willey, 1965. 214
427. Lindsey W.C., Chie CM. A Survey of Digal Phase Locked Loops // Proceedings of the IEEE. 1981. Vol. 69. N 4. 428. Ljung L., Soderstrom T. Theorie and practice of recursive identification. Cambridge: MIT Press, 1983. 429. Mac Farlane A.G.J. Dynamical system models. London. G.G. Harrap, 1970. 430. Mendel J.M., Fu K.S. Adaptive, learning and pattern recognition systems.^New York. Academic Press, 1970. 431. Mesarovic M.D. The control of multivariable systems. New York, J. Willey, I960. 432. Miller W.E., Ed., Digital computer applications to process control. New York, Plenum Press, 1965. 433. Mishkin E., Braun L. Adaptive control system. New York. Nc- Graw Hill, 1961. 434. Nash G. Phase Locked Loop, Design Fundamentals. Motorola Inc. Phoenix AZ, 1994. 435. Nahi N.E. Estimarion theory and applications. New York, J. . Willey, 1969. 436. Nelson R. С Flight stability and automatic control. N.Y.: Mc Graw-Hill Ins, 1998. 437. Nijmeijer H., Van der Schaft A. J. Nonlinear dynamical control systems. Berlin: Springer, 1996. 438. Oldenbourg R.C., Sartourius H. Dynamik selsttatiger Regelun- gen. Munchen, R. Oldenbourg, 1944, 1951. 439. Perkins W.R., Cruz J.B. Engineering of dynamic systems. New York, J. Willey, 1969. 440. Porter В., Crossley T.R. Modal control. London. Taylor and Francis, 1972. 441. Profos P. Die Regelung von Dampfanlagen. Berlin. Springer, 1962. 442. Ragazzini J.R., Franklin G.F. Sampled-data control systems. New York, McGraw Hill, 1958. 443. RealTime Digital Signal Processing Applications with Motorola's DSP 56000 Family. Prentice Hall. Englwood Cliffs. N I, 1990. 444. Rohrs C.E., Melsa J.L., Schultz D.G. Linear control systems. N.Y.: McGraw-Hill, 1993. 445. Rugh W.J. Linear System Theory. Information and System Sciences. Prentice Hall, 1993. 215
446. Savas E.S. Compute control of industrial procces. London, Nc- Graw Hill, 1965. 447. Schitt H., Dittrich F. Statistische Methoden der Regelungstech- nik. Mannheim. Bibliographisches Institute, 1972. Nr. 526. 448. Schwarz H. Mehrfach-Regelungen, 1. Band. Berlin. Springer, 1967. 449. Schwarz H. Mehrfach-Regelungen, 2. Band. Berlin. Springer, 1967. 450. Simpson R.I. Digal Signal Processing Using The Motorola DSP Family. Prentice Hall, Englwood Cliffs, N.Y., 1994. 451. Smith C.L. Digital computer process control, Scranten, Intext Educ. Publich., 1972. 452. Smith O.J.M. Sampled-data control systems. New York, McGraw Hill, 1958. 453. Smith S. W. The Scientist and Engineers Guide to Digal Signal Processing. California Technical Publishing. San Diego, 1999. 454. Strejc V. Synthese von Regelungssystemen mit Prozessrechnern. Berlin. Akademie-Verlag, 1967. 455. Syrbe M., Messen, Steuern. Regeln mit Prozessrechnern, Fran- furt, Akad. Verlagsgesellschaft, 1972. 456. Takahacshi Y., Rabins M., Auslander D. Control and dynamic systems. Reading. Addison-Westley, 1969. 457. Thoma M. Theorie linearer Regelungssysteme. Braunschweig. Vieweg, 1973. 458. Tschauner J. Einfuhrung in die Theorie der Abtastsysteme, Miinchen, R. Oldenbourg, I960. 459. Tustin A. Automatic and manual control. London. Butterworth, 1952. 460. Zypkin J.S. Differenzengleichungen der Impus- und Regeltechnik. Berlin, Veb-Verlag Technik, 1956. 461. Vaccaro R. J. Digital control. N.Y.: Mc Graw-Hill Ins, 1995. 462. Vidyasagar M. Nonlinear Systems Analysis. N.Y.: Prentice-Hall, 1993. 463. Weber W. Adaptive Regelungssysteme. Band I und II. Miinchen, R. Oldenbourg, 1971. 464. Yakubovich V.A., Leonov G.A., Gelig A.Kh. Stability of Stationary Sets in Control Systems with Discontinuous Nonlinearities. Singapore. World Scientific, 2004.
ОГЛАВЛЕНИЕ Ввведение 3 Глава 1. Регулятор Уатта и математическая теория устойчивости движения 6 §1. Регулятор Уатта и его модификации 6 §2. Критерий Эрмита—Михайлова 15 §3. Теорема об устойчивости по первому приближению 21 §4. Переходные режимы для регулятора Уатта 37 Глава 2. Линейные электрические цепи передаточные функции и частотные характеристики линейных блоков 47 §1. Описание линейных блоков 47 §2. Передаточные функции и частотные характеристики линейных блоков 56 Глава 3. Управляемость, наблюдаемость, стабилизируемость 70 § 1. Управляемость 70 §2. Наблюдаемость 81 §3. Стабилизируемость 86 Глава 4. Электронные генераторы колебаний 93 §1. Управление колебательным контуром. Автогенераторы .... 93 §2. Тактовые генераторы 99 Глава 5. Двумерные системы управления. Фазовые портреты 103 §1. Авторулевой и система управления ориентацией космического аппарата 103 §2. Управление синхронной электрической машиной и системы фазовой автоподстройки частоты 119 §3. Математическая теория популяций 145 Глава 6. Дискретные системы 152 §1. Мотивации 152 §2 Линейные дискретные системы 162 Глава 7. Проблема Айзермана. Метод Попова 173 Глава 8. Линейно—квадратичная задача оптимального управления 186 Указатель литературы 192
Учебное издание Геннадий Алексеевич Леонов Введение в теорию управления Печатается без издательского редактирования Лицензия ИД №05679 от 24.08.2001 Подписано в печать 07.07.2004. Формат 60x84 Vie- Бумага офсетная. Печать офсетная. Усл. печ. л. 12,79. Заказ № 141 Издательство СПбГУ 199034, С.-Петербург, Университетская наб., 7/9 Тел. (812) 328-77-63; факс (812) 328-44-22 E-mail: books@dk2478.spb.edu www.unipress.ru Типография Издательства СПбГУ. 199061, С.-Петербург, Средний пр., 41